Авторські блоги та коментарі до них відображають виключно точку зору їхніх авторів. Редакція ЛІГА.net може не поділяти думку авторів блогів.
29.04.2013 20:40

Язык поисковых систем: поиск в элементах и объектах

Приватний підприємець

Кто ищет, то всегда найдет... ээээ для Интернета это устаревшая формулировка... Правильно будет — кто умеет искать, тот всегда найдет.

Поиск в элементах и объектахС чего все началось? А началось все с публикации статьи «Язык поисковых систем», которая пришлась по душе многим читателям и, на форумах, я получил за это лестные отзывы. Затем я решил продолжить публикации на тему правильного составления поисковых запросов во время поиска документов в поисковых системах. Так была опубликована статья «Поиск с учетом расстояния». Получилось два составляющих звена логической цепочки публикаций о языке поисковых машин. Итак, встречайте третье, и не последнее, звено этой цепочки.

Народ у нас грамотный и долго жевать не стоит по поводу того, чем наполняются поисковые системы. Но, все же, нужно об этом пару слов написать. Опубликованная в Интернете информация в основном размещена на веб-страницах. А веб-страницы состоят из электронных документов, которые представляют собой не только тексты, но и другие элементы: таблицы, гиперссылки, заголовки, графика, видео, фото, подкасты и др. Бывают случаи, когда возникает необходимость поиска интересующих вас данных среди многообразия этих элементов, а также их атрибутов. Например, вам нужно найти какой-то документ с каким-то адресом или же статью, заголовок которой вам известен. Именно для такого поиска существует структура языковых запросов, которые предусмотрены для набора поисковых команд для поиска в элементах и объектах. В данном случае речь пойдет о поисковой системе «Яндекс».

Итак, приступим. Рассмотрим команды и их назначение для поиска веб-страниц. Команда

$title (сюда вставляете искомое слово или выражение)

предназначена для совершения поиска веб-страниц по заданному заголовку. А вот и пример:

$title (венера)

Но здесь есть один нюанс, о котором я сейчас постараюсь внятно рассказать. Дело в том, что под «заголовком» следует понимать не заглавие статьи, размещенной на веб-странице, а заголовок самого документа. Теперь внимание! Где можно увидеть заголовок документа? При открытии веб-страницы в любом браузере есть панель заголовков, иными словами я это называю вкладки, и на вкладке есть текст, вот это и есть заголовок документа. А еще при наведении на вкладку курсора мышки во всплывающем окне может отображаться полный заголовок, так как на вкладке не всегда он умещается. Но, не всегда нужно понимать под заголовком весь текст. Например, Венера — планета солнечной системы, в этом предложении заголовок слово «венера» — остальное шлак.

Команда

$anchor (сюда вставляете искомое слово или выражение)

дает возможность выполнять поиск в якорях гиперссылок. Но следует заметить, что в этой команде в качестве выражения используется не сам адрес сайта, на который ссылается документ, а значение самого якоря. Итак, поисковый запрос

$anchor (деловой блог)

дает команду поисковой системе на поиск документов в html-коде, где есть гиперссылка <a href="http://delovoiblog.com">Деловой блог</a>. Такого вида конструкция будет показана в окне браузера, которая представляет собой гиперссылку словосочетания «Деловой блог». Если по ней щелкнуть мышкой, то будет осуществлен переход на страницу http://delovoiblog.com.

Если ваша цель поиск ссылок на сам адрес сайта, то и в этом случае можно оформить команду для поисковой машины таким образом:

#link=”сюда написать искомое”

Поясню более подробно и с примером. Если в окне поискового запроса вы введете #link=” delovoiblog.com”, то поисковая машина выдаст список веб-страниц, которые будут ссылаться на http://delovoiblog.com и это не будет зависеть от оформления самой гиперссылки.

Многие в курсе, что html-код большинства веб-страниц содержит специальные мета-определения (мета-теги). При помощи их разработчики сайта указывают краткое описание проекта, а также набор ключевых слов, которые характеризуют содержание сайта. Такие директивы специально включают в код сайта для того, чтобы роботам поисковых машин облегчить индексирование веб-страниц. На данный момент не всегда разработчики применяют данный вид манипуляции с описанием сайта и применением ключевых слов, так как есть уже более прогрессивные методы облегчения участия роботов поисковых систем в индексации проекта. Но как бы там ни было, старые проекты продолжают работать и это не нужно упускать из виду. Не все еще оптимизированы под новые требования.

Итак, мета-определитель типа

<META NAME=”description”CONTENT=”краткое описание содержимого сайта”>

указывает поисковой машине на содержимое документа в виде небольшого анонса.

Мета-определитель

<META NAME=”keywords”CONTENT=”список ключевых слов”>

указывает поисковой машине на список ключевых слов, по которым ссылка на сайт или страницу сайта включается в отчет результата выдачи поиска.

Язык поисковых запросов «Яндекса» имеет две специальные команды, которые дают возможность выполнять поиск в аналогичных конструкциях. Например, команда

#abstract=(сюда вставляете искомое слово или словосочетание)

указывает поисковой машине искать в поле CONTENT определитель description.

Команда

#keywords=(сюда вставляете искомое слово или словосочетание)

Указывает поисковой машине искать в поле CONTENT определитель keywords. Чтобы было более понятно, приведу примеры этих команд:

#abstract=(деловой блог)

#keywords=(блог)

Когда вы будете применять данные команды, то необходимо иметь ввиду одно обстоятельство: содержимое мета-определителей description и keywords полностью зависит от того, кто занимается разработкой сайта и не всегда может соответствовать его настоящему содержанию.

Команда

#image=”поисковый запрос”

используется при поиске в именах картинок. В этой команде допустимо использовать маску (*), которая обозначает любую последовательность символов. Давайте этот случай рассмотрим более конкретно. Вам необходимо найти документы, которые содержат все возможные производные от слова «blog». Чтобы указать поисковой машине на то, что окончания этого слова могут быть разными и используют маску, например,

blog*

В этом случае в результаты выдачи поисковой машины попадут слова «blog», «blogger», «blogging» и в таком же духе далее. Надеюсь понятно да? Но я на этом не остановлюсь и еще раз приведу конкретный пример для наглядности. Команда

#image=”blog*”

дает возможность найти все картинки, имена которых содержат данное слово и его словоформы, например, blog.jpg, blogger.gif, blogging.png.

Когда вы просматриваете в Интернете сайты, то не раз, наверное, видели при наведении курсора мышки на картинку, появляется всплывающая подсказка, которая может указывать на название, либо описание картинки. А теперь давайте рассмотрим другой случай, когда браузер по каким-либо причинам не загрузил картинку. В этом случае вместо картинки отображается текст. Это может быть название или описание картинки. Оба этих текста одно и то же описание. Обычно их принято называть альтернативными текстами и, чтобы в этих текстах можно было что-то найти, применяется специальная команда поисковых запросов. Например, если вы введете в окне поискового запроса команду

#hint=(блог)

то в результатах выдачи поисковой машины вы получите ссылки на картинки, в альтернативном тексте которых имеет счастье быть слово «блог». Для тех, кто знаком с языком HTML, всему происходящему можно дать пояснение. Дело в том, что эта команда позволяет вести поиск в тегах типа

<IMG SRC=”здесь ссылка на картинку” ALT=”альтернативный текст”>

Команда #image является оператором параметра SRC, а команда #hint — параметра ALT.

Если вам известен адрес сайта и вы горите желанием осуществить в нем поиск, то и для этого случае существует команда. Например, по поисковому запросу

блог предпринимателя #url=”delovoiblog.com”

в результатах выдачи поисковой машины вы получите ссылки на все страницы сайта, которые содержат словосочетание «блог предпринимателя».

Вы еще не устали от моей нудной писанины? Дело в том, что я уже изрядно задолбался. По сему хочу пожалеть вас и себя любимого и приступить к завершающему этапу моих «нравоучений».

Если вы, после прочитанного, еще горите желанием что-то искать, тогда ноу проблем. Итак, если вы все еще хотите найти электронный документ строго определенного типа, то и для этого случая существует команда. Капец, ну да ладно, выдам вам секрет. Команда

#mime=”поисковый запрос”

В качестве поискового запроса можно использовать два типа обозначения электронных документов, с которыми, к счастью, умеет работать наш любимый «Яндекс» (только не веб-страницы) — .pdf и .rtf. И еще раз пример. По поисковому запросу

audi 6 #mime=”pdf”

наш красавчег «Яндекс» сделает огромную попытку найти все документы в формате .pdf, которые будут содержать словосочетание «audi 6». Применение этой команды для вас может быть очень удобным, когда возникает необходимость поиска разного рода электронной документации с указанными файловыми форматами. Это могут быть руководства пользователей программ и устройств, различные инструкции, рефераты и другие не менее полезные документы.

Пока все. Но это еще не значит, что я перестану ваши кишки наматывать на свой локоть. То ли еще будет. Ожидайте следующую статью, в которой я поведаю о поиске с ранжированием. Так что тяжело в учении, легко в бою.

Відправити:
Якщо Ви помітили орфографічну помилку, виділіть її мишею і натисніть Ctrl+Enter.
Останні записи