Каталог изданий Простой поиск Расширенный поиск Советы по поиску Поддерживаемые браузеры Поиск в транслитерации Конфиденциальность Соглашение об использовании Условия доступа

Советы по поиску

1. Морфологический анализ

При поиске автоматически производится морфологический анализ каждого слова из поискового запроса, что позволяет находить не только искомое слово, но и все словоформы данного слова (во всех падежах, в единственном и множественном числах).

Пример: архивный (будут найдены также слова:архивных,архивном, и т.д.)


2. Логические запросы

Логические запросы формулируются с использованием операторов AND (И), OR (ИЛИ), NOT (НЕ).

Оператор AND (русский аналогИ) используется для связывания двух или нескольких слов, наличие каждого из которых в поисковом документе обязательно.

Пример: олимпиада И сочи (будут отобраны документы, содержащие оба слова).

Оператор OR (русский аналогИЛИ) используется для связывания двух или нескольких слов, наличия только одного из которых достаточно.

Пример: партия ИЛИ фракция (будут выбраны документы, содержащие либо словопартия, либо словофракция, либо оба слова одновременно).

Оператор NOT (русский аналогНЕ) употребляется перед словами, наличие которых в документе необходимо исключить.

Пример: олимпиада НЕ 1980 (будут найдены документы, содержащие слово олимпиада и не содержащие слово1980). Оператор НЕ исключает слово, следующее за ним, и требует присутствие в запросе обязательных слов. Т.е. сами по себе в отдельности запросыне москва, не архив - некорректны.


3. Фразовые запросы (или поиск на точное совпадение)

Запрос, заключенный с двух сторон в двойные кавычки ("), выполняется как поиск на точное совпадение фразы. Это означает, что будут найдены документы, в которых встречаются все слова из искомой фразы следующие в указанном порядке. Логические операторы внутри фразы будут интерпретироваться как обыкновенные слова.

Примеры: "совет федерации","парламентская ассамблея совета европы". Допускается комбинирование фразовых запросов с логическими запросами.

Пример: "совет федерации" AND "пленарное заседание".

Внутри фразового запроса, т.е. внутри заключенной в кавычки словарной конструкции, не действуют никакие другие виды поисковых запросов. По той же причине все слова, внутри заключенной в кавычки фразы, являющиеся операторами языка запросов, функциональных свойств не несут и воспринимаются как обыкновенные слова русского, английского, украинского или других языков.


4. Поиск по шаблону, маске или wildcards: (?,*)

Символ * (знак умножения) используется как символ замены любого количества букв в конце слова или в середине слова.

Пример: город* (будут выбраны статьи, содержащие слова:городской,городская, города и т.д.) Таким образом, одним поисковым запросом можно охватить гораздо большую группу искомых слов, чем позволяет морфологический анализ в отдельности.

Символ ? (знак вопроса) используется как символ замены любой буквы в слове, кроме самой первой буквы.

Пример: К?нк?ст?доры. Запрос позволит найти все документы со словомконкистадоры, если в правильном написании слова имеется сомнение.

Операторы шаблона выручат в поиске документов, содержащих неопределенную дату:битва и калка и 12??.


5. Неточные запросы и запросы на близость (с заданным расстоянием между словами)

Оператор~n, где n - расстояние между словами, позволяет составить запрос с ограничением на расстояние между словами. Расстояние определяется количеством слов между заданными словами или заданными поисковыми выражениями.

Пример 1: "русская литература"~1. Запрос позволит найти документы, в которых хотя бы один раз встречаются слово русская и слово литература не далее чем через одно любое другое слово. Таким образом, запрос даст возможность найти, к примеру, фразурусская классическая литература, но фразы, вроде русская монография по литературе будут проигнорированы, т.к. расстояние между словом русская и литературе в данном случае равно двум.

Пример 2: "парламентская ассамблея совета европы"~2. Запрос позволит найти документы, в которых хотя бы один раз встречается каждое слово, не далее чем через два любых других слова.

Пример 3: ("нелегальные мигранты"~2 "незаконные мигранты"~2 "нелегальные приезжие"~2 "незаконные приезжие"~2) AND (политика закон)) . С помощью данного запросы мы хотим найти документы, в которых идет речь о законе о нелегальных мигрантах. Т.к. документы по данной тематике могут использовать синонимы, то здесь добавляется оператор ИЛИ, который говорит что "нелегальный" и "незаконный" - это одно и тоже. Это же относится и к "мигрант" = "приезжий", "политика" = "закон". Оператор * говорит о том, что, напр., "нелегальн" это есть "нелегальнЫЙ", "нелегальнЫE", "нелегальнЫХ" и т.д., любое окончание.

Соответствует логическому выражению: (((нелегальн* ИЛИ незаконн*)(мигра* ИЛИ приезжи*))~2 (полити* ИЛИ закон*))~4.

Пример 4: "нелегальные мигранты"~2 "незаконные мигранты"~2 "нелегальные приезжие"~2 "незаконные приезжие"~2 . Найти документы с учетом морфологии, в которых есть фразы "нелегальный мигрант" или "нелегальные мигранты" или "нелегальные приезжие" или "незаконные приезжие".

Соответствует логическому выражению: “(нелегальн* ИЛИ незаконн*)(мигра* ИЛИ приезжи*)”~2.

Т.к. межнду фразами явно не указан никакой логический оператор (ИЛИ, И), то по умолчанию всегда используется ИЛИ.

Пример 5: ("нелегальные мигранты" "незаконные мигранты" "нелегальные приезжие" "незаконные приезжие" "незаконная миграция") AND (политика закон) .

Соответствует логическому выражению: (“нелегальная миграция” ИЛИ “незаконная миграция” ИЛИ “нелегальный мигрант” ИЛИ “незаконный мигрант” ИЛИ “нелегальные мигранты” ИЛИ “незаконные мигранты”) ~4 (полити* ИЛИ закон*) .

Пример 6: (булгаков) И (адаптаци* ИЛИ экранизаци* ИЛИ инсцениров*)~4.

Запрос в UDB: "булгаков адаптации"~4 OR "булгаков экранизации"~4 OR "булгаков инсценировки"~4.


6. Скобки и комбинирование запросов

Все перечисленные группы запросов можно комбинировать и употреблять совместно в одном запросе. Приоритет оператора близости слов ~n больше приоритета оператора И илиНЕ, и, естественно, выше приоритета оператораИЛИ. Для формирования комплексных запросов рекомендуется использовать круглые скобки, обособляя ими отдельные логические конструкции.

Пример 1: (промышленность НЕ урал*) И (металургическая ИЛИ машиностроительная).

Пример 2: (символизм ИЛИ (конца xix И начала xx)) И (русская литература)


7. Регистр и другие особенности

Система поиска не учитывает регистр слов, участвующих в поисковом запросе. Таким образом, запросы: Москва и москва будут восприниматься одинаково.

В данный момент система различает написание буквыё, поэтому запросы с участием буквы ё лучше формулировать так:

Пример 1: новогодняя (ёлка или елка).

Пример 2: ер?менко. Но ни в коем случае нельзя?лка, так как операторы шаблона не допускаются в начале слова.


Наиболее распространенные ошибки

Большинство ошибок в запросах вызваны некорректным использованием синтаксиса поискового языка запросов. Ниже приведен список наиболее распространенных ошибок при составлении поискового запроса:

Ошибка 1: еременко т.в.

Символ . (точка) никакого функционального значения не несет и допустим только в составе фразы в поиске на точное совпадение. В данном случае инициалы должны следовать без символа . (точка). Рекомендуемые варианты: 1) "еременко т.в." - поиск на точное совпадение всей фразы 2) "еременко т в"~0 - запрос позволяет найти автора, накладывая требование: расположение искомых слов (т.е. фамилии и инициалов) друг за другом в различной комбинации.

Ошибка 2: арнольд И В

В данном запросе необходимо учесть, что прописная буква И воспринимается системой в первую очередь как логический операторИ. Поэтому правильно сформулировать запрос так: арнольд и в

Ошибка 3: мордовия, меркушкин

Символ , (запятая) никакого функционального значения не несет и допустим только в составе фразы в поиске на точное совпадение. В остальных запросах использование этого символа является ошибочным. Допустимые варианты: 1) мордовия AND меркушкин - запрос найдет документы, содержащих оба слова одновременно 2) "мордовия, меркушкин" - запрос найдет документы, содержащие строгую последовательность данных слов

Ошибка 4: марксистско-ленинская философия

Символ - (дефис или минус) является специальным символом, участвующим в запросах на отрицание. Полный аналог оператора NOT (НЕ). Символ ставится слитно перед исключающим словом и требует перед собой наличие пробела. Например:маркс -энгельс. Для того, чтобы система не воспринимала данный символ как специальный, можно воспользоваться несколькими способами: 1) "марксистско-ленинская" AND философия - будут найдены все документы с точной фразой марксистско-ленинская и содержащие слово философия 2) марксистско?ленинская AND философия - запрос вернет те же документы, но релевантность будет подсчитана по другой формуле 3) марксистско?ленинск* AND философия - этот запрос, в отличии от предыдущих вариантов, дополнительно позволит найти фразы марксистско-ленинский, марксистско-ленинской т.д. с учетом различных падежей.

Ошибка 5: региональная политика + фрг

Символ + (плюс) является специальным символом, ставится слитно перед словом, наличие которого в документе обязательно. К примеру, запрос можно составить так:региональная политика +фрг. Все документы обязательно содержат аббревиатуруФРГ, но не обязательно содержат словосочетаниерегиональная политика. Документы, которые дополнительно содержат словосочетаниерегиональная политика, будут больше соответствовать запросу и тем самым иметь большую релевантность.

Ошибка 6: испания 1808 - 1823 годов глазами российских дипломатов

Причина ошибки аналогичная ошибке 4, см. выше. В данном случае символ - (дефис или минус) можно просто опустить, рассматривая числовые данные как отдельные слова. Также надо отметить, что сильно упрощенное использование поисковых операторов (все слова соединены только пробелами) ведет к составлению длинных логических запросов с использованием большого количества операторов ИЛИ. В результате получаются запросы размытой тематики, редко позволяющие найти документы конкретного предмета поиска. Если идет поиск точной фразы, то целесообразно всю фразу обернуть в двойные кавычки, задав тем самым поиск на точное совпадение:"испания 1808 - 1823 годов глазами российских дипломатов".

Product version:   4.43.MM.1453.g6972