Язык поисковых систем: поиск в элементах и объектах
Кто ищет, то всегда найдет... ээээ для Интернета это устаревшая формулировка... Правильно будет — кто умеет искать, тот всегда найдет.
С чего все началось? А началось все с публикации статьи «Язык поисковых систем», которая пришлась по душе многим читателям и, на форумах, я получил за это лестные отзывы. Затем я решил продолжить публикации на тему правильного составления поисковых запросов во время поиска документов в поисковых системах. Так была опубликована статья «Поиск с учетом расстояния». Получилось два составляющих звена логической цепочки публикаций о языке поисковых машин. Итак, встречайте третье, и не последнее, звено этой цепочки.
Народ у нас грамотный и долго жевать не стоит по поводу того, чем наполняются поисковые системы. Но, все же, нужно об этом пару слов написать. Опубликованная в Интернете информация в основном размещена на веб-страницах. А веб-страницы состоят из электронных документов, которые представляют собой не только тексты, но и другие элементы: таблицы, гиперссылки, заголовки, графика, видео, фото, подкасты и др. Бывают случаи, когда возникает необходимость поиска интересующих вас данных среди многообразия этих элементов, а также их атрибутов. Например, вам нужно найти какой-то документ с каким-то адресом или же статью, заголовок которой вам известен. Именно для такого поиска существует структура языковых запросов, которые предусмотрены для набора поисковых команд для поиска в элементах и объектах. В данном случае речь пойдет о поисковой системе «Яндекс».
Итак, приступим. Рассмотрим команды и их назначение для поиска веб-страниц. Команда
$title (сюда вставляете искомое слово или выражение)
предназначена для совершения поиска веб-страниц по заданному заголовку. А вот и пример:
$title (венера)
Но здесь есть один нюанс, о котором я сейчас постараюсь внятно рассказать. Дело в том, что под «заголовком» следует понимать не заглавие статьи, размещенной на веб-странице, а заголовок самого документа. Теперь внимание! Где можно увидеть заголовок документа? При открытии веб-страницы в любом браузере есть панель заголовков, иными словами я это называю вкладки, и на вкладке есть текст, вот это и есть заголовок документа. А еще при наведении на вкладку курсора мышки во всплывающем окне может отображаться полный заголовок, так как на вкладке не всегда он умещается. Но, не всегда нужно понимать под заголовком весь текст. Например, Венера — планета солнечной системы, в этом предложении заголовок слово «венера» — остальное шлак.
Команда
$anchor (сюда вставляете искомое слово или выражение)
дает возможность выполнять поиск в якорях гиперссылок. Но следует заметить, что в этой команде в качестве выражения используется не сам адрес сайта, на который ссылается документ, а значение самого якоря. Итак, поисковый запрос
$anchor (деловой блог)
дает команду поисковой системе на поиск документов в html-коде, где есть гиперссылка <a href="http://delovoiblog.com">Деловой блог</a>. Такого вида конструкция будет показана в окне браузера, которая представляет собой гиперссылку словосочетания «Деловой блог». Если по ней щелкнуть мышкой, то будет осуществлен переход на страницу http://delovoiblog.com.
Если ваша цель поиск ссылок на сам адрес сайта, то и в этом случае можно оформить команду для поисковой машины таким образом:
#link=”сюда написать искомое”
Поясню более подробно и с примером. Если в окне поискового запроса вы введете #link=” delovoiblog.com”, то поисковая машина выдаст список веб-страниц, которые будут ссылаться на http://delovoiblog.com и это не будет зависеть от оформления самой гиперссылки.
Многие в курсе, что html-код большинства веб-страниц содержит специальные мета-определения (мета-теги). При помощи их разработчики сайта указывают краткое описание проекта, а также набор ключевых слов, которые характеризуют содержание сайта. Такие директивы специально включают в код сайта для того, чтобы роботам поисковых машин облегчить индексирование веб-страниц. На данный момент не всегда разработчики применяют данный вид манипуляции с описанием сайта и применением ключевых слов, так как есть уже более прогрессивные методы облегчения участия роботов поисковых систем в индексации проекта. Но как бы там ни было, старые проекты продолжают работать и это не нужно упускать из виду. Не все еще оптимизированы под новые требования.
Итак, мета-определитель типа
<META NAME=”description”CONTENT=”краткое описание содержимого сайта”>
указывает поисковой машине на содержимое документа в виде небольшого анонса.
Мета-определитель
<META NAME=”keywords”CONTENT=”список ключевых слов”>
указывает поисковой машине на список ключевых слов, по которым ссылка на сайт или страницу сайта включается в отчет результата выдачи поиска.
Язык поисковых запросов «Яндекса» имеет две специальные команды, которые дают возможность выполнять поиск в аналогичных конструкциях. Например, команда
#abstract=(сюда вставляете искомое слово или словосочетание)
указывает поисковой машине искать в поле CONTENT определитель description.
Команда
#keywords=(сюда вставляете искомое слово или словосочетание)
Указывает поисковой машине искать в поле CONTENT определитель keywords. Чтобы было более понятно, приведу примеры этих команд:
#abstract=(деловой блог)
#keywords=(блог)
Когда вы будете применять данные команды, то необходимо иметь ввиду одно обстоятельство: содержимое мета-определителей description и keywords полностью зависит от того, кто занимается разработкой сайта и не всегда может соответствовать его настоящему содержанию.
Команда
#image=”поисковый запрос”
используется при поиске в именах картинок. В этой команде допустимо использовать маску (*), которая обозначает любую последовательность символов. Давайте этот случай рассмотрим более конкретно. Вам необходимо найти документы, которые содержат все возможные производные от слова «blog». Чтобы указать поисковой машине на то, что окончания этого слова могут быть разными и используют маску, например,
blog*
В этом случае в результаты выдачи поисковой машины попадут слова «blog», «blogger», «blogging» и в таком же духе далее. Надеюсь понятно да? Но я на этом не остановлюсь и еще раз приведу конкретный пример для наглядности. Команда
#image=”blog*”
дает возможность найти все картинки, имена которых содержат данное слово и его словоформы, например, blog.jpg, blogger.gif, blogging.png.
Когда вы просматриваете в Интернете сайты, то не раз, наверное, видели при наведении курсора мышки на картинку, появляется всплывающая подсказка, которая может указывать на название, либо описание картинки. А теперь давайте рассмотрим другой случай, когда браузер по каким-либо причинам не загрузил картинку. В этом случае вместо картинки отображается текст. Это может быть название или описание картинки. Оба этих текста одно и то же описание. Обычно их принято называть альтернативными текстами и, чтобы в этих текстах можно было что-то найти, применяется специальная команда поисковых запросов. Например, если вы введете в окне поискового запроса команду
#hint=(блог)
то в результатах выдачи поисковой машины вы получите ссылки на картинки, в альтернативном тексте которых имеет счастье быть слово «блог». Для тех, кто знаком с языком HTML, всему происходящему можно дать пояснение. Дело в том, что эта команда позволяет вести поиск в тегах типа
<IMG SRC=”здесь ссылка на картинку” ALT=”альтернативный текст”>
Команда #image является оператором параметра SRC, а команда #hint — параметра ALT.
Если вам известен адрес сайта и вы горите желанием осуществить в нем поиск, то и для этого случае существует команда. Например, по поисковому запросу
блог предпринимателя #url=”delovoiblog.com”
в результатах выдачи поисковой машины вы получите ссылки на все страницы сайта, которые содержат словосочетание «блог предпринимателя».
Вы еще не устали от моей нудной писанины? Дело в том, что я уже изрядно задолбался. По сему хочу пожалеть вас и себя любимого и приступить к завершающему этапу моих «нравоучений».
Если вы, после прочитанного, еще горите желанием что-то искать, тогда ноу проблем. Итак, если вы все еще хотите найти электронный документ строго определенного типа, то и для этого случая существует команда. Капец, ну да ладно, выдам вам секрет. Команда
#mime=”поисковый запрос”
В качестве поискового запроса можно использовать два типа обозначения электронных документов, с которыми, к счастью, умеет работать наш любимый «Яндекс» (только не веб-страницы) — .pdf и .rtf. И еще раз пример. По поисковому запросу
audi 6 #mime=”pdf”
наш красавчег «Яндекс» сделает огромную попытку найти все документы в формате .pdf, которые будут содержать словосочетание «audi 6». Применение этой команды для вас может быть очень удобным, когда возникает необходимость поиска разного рода электронной документации с указанными файловыми форматами. Это могут быть руководства пользователей программ и устройств, различные инструкции, рефераты и другие не менее полезные документы.
Пока все. Но это еще не значит, что я перестану ваши кишки наматывать на свой локоть. То ли еще будет. Ожидайте следующую статью, в которой я поведаю о поиске с ранжированием. Так что тяжело в учении, легко в бою.
- Експорт української продукції в Азербайджан зріс на 15,1% за 10 місяців 2024 року Юрій Гусєв 14:30
- Підстави для виселення при зверненні стягнення на предмет іпотеки Євген Морозов 14:16
- Історичний кіт у мішку: чому піврічні торги деревиною обурили деревообробників Юрій Дюг 07:32
- Доплата за фактичні квадратні метри об`єкту інвестування Євген Морозов вчора о 14:52
- "Компостер подій" Кремля: будьте пильними Євген Магда вчора о 11:28
- З 1 грудня зміняться правила бронювання: з'явилася Постанова Кабміну Віталій Соловей 23.11.2024 20:23
- Бюджет-2025 прийнятий, але це не точно Любов Шпак 23.11.2024 18:55
- Час затягувати паски Андрій Павловський 23.11.2024 17:27
- Строк нарахування 3% річних від суми позики Євген Морозов 23.11.2024 13:52
- Судовий захист при звернені стягнення на предмет іпотеки, якщо таке майно не відчужено Євген Морозов 22.11.2024 13:02
- Система обліку немайнової шкоди: коли держава намагається залікувати невидимі рани війни Світлана Приймак 22.11.2024 11:36
- Чому енергетичні та газові гіганти обирають Нідерланди чи Швейцарію для бізнесу Ростислав Никітенко 22.11.2024 08:47
- 1000+ днів війни: чи достатньо покарати агрессора правовими засобами?! Дмитро Зенкін 21.11.2024 21:35
- Горизонтальний моніторинг як сучасний метод податкового контролю Юлія Мороз 21.11.2024 13:36
- Ієрархія протилежних правових висновків суду касаційної інстанції Євген Морозов 21.11.2024 12:39
-
24 листопада в Україні відключатимуть світло – деталі
Бізнес 8498
-
Банки в ОАЕ, Туреччині та Таїланді не обслуговують видані Газпромбанком картки UnionPay
Фінанси 8466
-
Чоловіки, які прийшли на підприємство і були заброньовані після 18 травня, втратять бронь
виправлено Бізнес 7350
-
В Україні фальсифіковані до 25% молочних продуктів: голова Спілки молочних підприємств
Бізнес 6607
-
Найвища гора Західної Європи та найефектніша гора Франції: неперевершений Монблан — фото
Життя 3669