Язык поисковых систем: поиск в элементах и объектах
Кто ищет, то всегда найдет... ээээ для Интернета это устаревшая формулировка... Правильно будет — кто умеет искать, тот всегда найдет.
С чего все началось? А началось все с публикации статьи «Язык поисковых систем», которая пришлась по душе многим читателям и, на форумах, я получил за это лестные отзывы. Затем я решил продолжить публикации на тему правильного составления поисковых запросов во время поиска документов в поисковых системах. Так была опубликована статья «Поиск с учетом расстояния». Получилось два составляющих звена логической цепочки публикаций о языке поисковых машин. Итак, встречайте третье, и не последнее, звено этой цепочки.
Народ у нас грамотный и долго жевать не стоит по поводу того, чем наполняются поисковые системы. Но, все же, нужно об этом пару слов написать. Опубликованная в Интернете информация в основном размещена на веб-страницах. А веб-страницы состоят из электронных документов, которые представляют собой не только тексты, но и другие элементы: таблицы, гиперссылки, заголовки, графика, видео, фото, подкасты и др. Бывают случаи, когда возникает необходимость поиска интересующих вас данных среди многообразия этих элементов, а также их атрибутов. Например, вам нужно найти какой-то документ с каким-то адресом или же статью, заголовок которой вам известен. Именно для такого поиска существует структура языковых запросов, которые предусмотрены для набора поисковых команд для поиска в элементах и объектах. В данном случае речь пойдет о поисковой системе «Яндекс».
Итак, приступим. Рассмотрим команды и их назначение для поиска веб-страниц. Команда
$title (сюда вставляете искомое слово или выражение)
предназначена для совершения поиска веб-страниц по заданному заголовку. А вот и пример:
$title (венера)
Но здесь есть один нюанс, о котором я сейчас постараюсь внятно рассказать. Дело в том, что под «заголовком» следует понимать не заглавие статьи, размещенной на веб-странице, а заголовок самого документа. Теперь внимание! Где можно увидеть заголовок документа? При открытии веб-страницы в любом браузере есть панель заголовков, иными словами я это называю вкладки, и на вкладке есть текст, вот это и есть заголовок документа. А еще при наведении на вкладку курсора мышки во всплывающем окне может отображаться полный заголовок, так как на вкладке не всегда он умещается. Но, не всегда нужно понимать под заголовком весь текст. Например, Венера — планета солнечной системы, в этом предложении заголовок слово «венера» — остальное шлак.
Команда
$anchor (сюда вставляете искомое слово или выражение)
дает возможность выполнять поиск в якорях гиперссылок. Но следует заметить, что в этой команде в качестве выражения используется не сам адрес сайта, на который ссылается документ, а значение самого якоря. Итак, поисковый запрос
$anchor (деловой блог)
дает команду поисковой системе на поиск документов в html-коде, где есть гиперссылка <a href="http://delovoiblog.com">Деловой блог</a>. Такого вида конструкция будет показана в окне браузера, которая представляет собой гиперссылку словосочетания «Деловой блог». Если по ней щелкнуть мышкой, то будет осуществлен переход на страницу http://delovoiblog.com.
Если ваша цель поиск ссылок на сам адрес сайта, то и в этом случае можно оформить команду для поисковой машины таким образом:
#link=”сюда написать искомое”
Поясню более подробно и с примером. Если в окне поискового запроса вы введете #link=” delovoiblog.com”, то поисковая машина выдаст список веб-страниц, которые будут ссылаться на http://delovoiblog.com и это не будет зависеть от оформления самой гиперссылки.
Многие в курсе, что html-код большинства веб-страниц содержит специальные мета-определения (мета-теги). При помощи их разработчики сайта указывают краткое описание проекта, а также набор ключевых слов, которые характеризуют содержание сайта. Такие директивы специально включают в код сайта для того, чтобы роботам поисковых машин облегчить индексирование веб-страниц. На данный момент не всегда разработчики применяют данный вид манипуляции с описанием сайта и применением ключевых слов, так как есть уже более прогрессивные методы облегчения участия роботов поисковых систем в индексации проекта. Но как бы там ни было, старые проекты продолжают работать и это не нужно упускать из виду. Не все еще оптимизированы под новые требования.
Итак, мета-определитель типа
<META NAME=”description”CONTENT=”краткое описание содержимого сайта”>
указывает поисковой машине на содержимое документа в виде небольшого анонса.
Мета-определитель
<META NAME=”keywords”CONTENT=”список ключевых слов”>
указывает поисковой машине на список ключевых слов, по которым ссылка на сайт или страницу сайта включается в отчет результата выдачи поиска.
Язык поисковых запросов «Яндекса» имеет две специальные команды, которые дают возможность выполнять поиск в аналогичных конструкциях. Например, команда
#abstract=(сюда вставляете искомое слово или словосочетание)
указывает поисковой машине искать в поле CONTENT определитель description.
Команда
#keywords=(сюда вставляете искомое слово или словосочетание)
Указывает поисковой машине искать в поле CONTENT определитель keywords. Чтобы было более понятно, приведу примеры этих команд:
#abstract=(деловой блог)
#keywords=(блог)
Когда вы будете применять данные команды, то необходимо иметь ввиду одно обстоятельство: содержимое мета-определителей description и keywords полностью зависит от того, кто занимается разработкой сайта и не всегда может соответствовать его настоящему содержанию.
Команда
#image=”поисковый запрос”
используется при поиске в именах картинок. В этой команде допустимо использовать маску (*), которая обозначает любую последовательность символов. Давайте этот случай рассмотрим более конкретно. Вам необходимо найти документы, которые содержат все возможные производные от слова «blog». Чтобы указать поисковой машине на то, что окончания этого слова могут быть разными и используют маску, например,
blog*
В этом случае в результаты выдачи поисковой машины попадут слова «blog», «blogger», «blogging» и в таком же духе далее. Надеюсь понятно да? Но я на этом не остановлюсь и еще раз приведу конкретный пример для наглядности. Команда
#image=”blog*”
дает возможность найти все картинки, имена которых содержат данное слово и его словоформы, например, blog.jpg, blogger.gif, blogging.png.
Когда вы просматриваете в Интернете сайты, то не раз, наверное, видели при наведении курсора мышки на картинку, появляется всплывающая подсказка, которая может указывать на название, либо описание картинки. А теперь давайте рассмотрим другой случай, когда браузер по каким-либо причинам не загрузил картинку. В этом случае вместо картинки отображается текст. Это может быть название или описание картинки. Оба этих текста одно и то же описание. Обычно их принято называть альтернативными текстами и, чтобы в этих текстах можно было что-то найти, применяется специальная команда поисковых запросов. Например, если вы введете в окне поискового запроса команду
#hint=(блог)
то в результатах выдачи поисковой машины вы получите ссылки на картинки, в альтернативном тексте которых имеет счастье быть слово «блог». Для тех, кто знаком с языком HTML, всему происходящему можно дать пояснение. Дело в том, что эта команда позволяет вести поиск в тегах типа
<IMG SRC=”здесь ссылка на картинку” ALT=”альтернативный текст”>
Команда #image является оператором параметра SRC, а команда #hint — параметра ALT.
Если вам известен адрес сайта и вы горите желанием осуществить в нем поиск, то и для этого случае существует команда. Например, по поисковому запросу
блог предпринимателя #url=”delovoiblog.com”
в результатах выдачи поисковой машины вы получите ссылки на все страницы сайта, которые содержат словосочетание «блог предпринимателя».
Вы еще не устали от моей нудной писанины? Дело в том, что я уже изрядно задолбался. По сему хочу пожалеть вас и себя любимого и приступить к завершающему этапу моих «нравоучений».
Если вы, после прочитанного, еще горите желанием что-то искать, тогда ноу проблем. Итак, если вы все еще хотите найти электронный документ строго определенного типа, то и для этого случая существует команда. Капец, ну да ладно, выдам вам секрет. Команда
#mime=”поисковый запрос”
В качестве поискового запроса можно использовать два типа обозначения электронных документов, с которыми, к счастью, умеет работать наш любимый «Яндекс» (только не веб-страницы) — .pdf и .rtf. И еще раз пример. По поисковому запросу
audi 6 #mime=”pdf”
наш красавчег «Яндекс» сделает огромную попытку найти все документы в формате .pdf, которые будут содержать словосочетание «audi 6». Применение этой команды для вас может быть очень удобным, когда возникает необходимость поиска разного рода электронной документации с указанными файловыми форматами. Это могут быть руководства пользователей программ и устройств, различные инструкции, рефераты и другие не менее полезные документы.
Пока все. Но это еще не значит, что я перестану ваши кишки наматывать на свой локоть. То ли еще будет. Ожидайте следующую статью, в которой я поведаю о поиске с ранжированием. Так что тяжело в учении, легко в бою.
- Форвардні контракти на ринку електроенергії ЄС: як працювати з вигодою та без ризиків Ростислав Никітенко 11:55
- Особливості здійснення Держгеокадастром контролю за використанням та охороною земель Євген Морозов 09:56
- Розірвання шлюбу за кордоном: особливості та процедури для українців Світлана Приймак вчора о 16:28
- Зелені сертифікати для експорту електроенергії: можливості для українських трейдерів Ростислав Никітенко вчора о 11:10
- Еволюція судової практики: від традицій до цифрових інновацій Дмитро Шаповал вчора о 10:22
- Надіслання адвокатом відзиву на касаційну скаргу на електронну пошту Суду Євген Морозов вчора о 09:28
- Згода на обробку персональних даних – правочин? Судова практика Анастасія Полтавцева 12.11.2024 16:59
- Адвокатський запит в ТЦК та відстрочка від призову: очікування й реальність Світлана Приймак 12.11.2024 16:55
- Як створити "блакитний океан" для бренду: стратегія виходу за межі конкуренції Наталія Тонкаль 12.11.2024 11:32
- Переваги та ризики співпраці з європейськими постачальниками відновлювальної енергії Ростислав Никітенко 12.11.2024 11:02
- Перезавантаження трейдерського ринку: ключові тренди Дмитро Казанін 12.11.2024 10:48
- "Безліміт" на кредитні ліміти: як вилізти з боргової ями Ірина Селезньова 12.11.2024 09:55
- ОП ВС КГС: зменшення розміру неустойки (пені) нарахованої за порушення зобов`язання Євген Морозов 12.11.2024 08:49
- Гра в імітацію Євген Магда 12.11.2024 05:31
- Правова боротьба за спадок: позов проти банку про стягнення коштів у російських рублях Павло Васильєв 11.11.2024 20:24
-
У Нідерландах успішно випробували найпотужніший наземний кран у світі – фото
Бізнес 10402
-
Співвласник АТБ почне відкривати торговельні центри у невеликих містах
Бізнес 9855
-
Кінець уряду Шольца. Хто стане новим канцлером і який ультиматум має для Путіна
6433
-
Нафта може впасти до $40 у 2025 році, якщо ОПЕК скасує добровільне скорочення видобутку
Бізнес 3678
-
ЄС інвестує 32 млн євро у реконструкцію 375 км залізниці у Молдові
Бізнес 3450