Відмінності між версіями «Опис пошукової системи TURTLE»
(→Можливості розширеного пошуку) |
(→Можливості розширеного пошуку) |
||
Рядок 105: | Рядок 105: | ||
==Можливості розширеного пошуку== | ==Можливості розширеного пошуку== | ||
− | + | ||
Расширенная форма позволяет установить логические операции между поисковыми терминами, ограничить область поиска, указать тип расширения поисковых терминов, исключить документы, содержащие определенные частотные термины, уточнить способы сортировки и группировки результатов поиска. | Расширенная форма позволяет установить логические операции между поисковыми терминами, ограничить область поиска, указать тип расширения поисковых терминов, исключить документы, содержащие определенные частотные термины, уточнить способы сортировки и группировки результатов поиска. |
Версія за 12:53, 13 листопада 2008
Зміст
вкажіть повну назву
TURTLE
вкажіть URL головної сторінки
Загальний опис системи, її особливості
Поисковая система Turtle рассматривает любое слово, как поисковый термин. Комплексные слова типа "turtle.ru" или "AGFA-100" рассматриваются системой как один поисковый термин, однако в расширенной форме, вы можете определить использование сублексем, что автоматически приведет к раскрытию подобных терминов на составные части и объединению найденных документов с документами полного поискового термина. Регистр слов не имеет принципиального значения для поисковой системы Turtle, однако, учитывается при выдаче результатов. Так, например, результаты запросов "облако" и "Облако" будут качественно разными. Во втором случае, система постарается показать в начале списка те документы, где термин чаще встречается с заглавной буквы.
По умолчанию, мы не используем морфологические формы слова т.к. обычно находится достаточно много документов по точному совпадению с поисковым термином. В любой момент вы можете включить эту функцию для своих запросов, нажав соответствующую кнопку в поле запроса, или воспользовавшись языком запросов. При этом по умолчанию, будет включена морфология всех языков, известных на сегодня системе Turtle (24 языка).
Система автоматически исключает стоп-слова из запроса. Если вы считаете, что поиск по таким словам следует производить, вам будет предоставлена такая возможность на страницах результатов поиска
Наявність каталогу, посилання на каталог
Особливості мови запитів
Опишіть як в пошуковій системі реалізовані команди мови запитів Язык запросов TSSQL (Turtle Search System Query Language) позволяет конструировать поисковые запросы любой сложности. Вы можете ознакомиться с его полным описанием. Здесь же мы приведем лишь его базовые возможности.
Внимание: Использование языка запросов включается кнопкой в форме расширенного поиска.
1. Группировка терминов и операций над ними осуществляется с помощью символов "(" и ")". C их помощью можно изменять приоритеты операций, так например запрос:
красный | белый & шар
будет исполняться в следующей последовательности: а) находятся документы, в которых содержатся слова "белый" и "шар" б) результат будет объединен с документами, в которых встречается термин "красный".
Если использовать символы группировки:
(красный | белый) & шар то последовательность действий поисковой системы изменится на: а) будут найдены документы, содержащие термины "красный" или "белый" б) среди них будут выбраны документы, содержащие слово "шар".
2. Логические операции над словами
& - пересечение поисковых терминов или нахождение документов, содержащих несколько поисковых слов.
Deep & Purple | - объединение поисковых терминов или нахождение документов, содержащих любой из терминов.
инспекция | проверка ! - исключение терминов или нахождение документов, в которых поисковые термины имеют наименьшее вхождение.
налог ! доход "" - нахождение точного соответствия в документах (текст заключается в кавычки).
"правописание согласных" \n - поиск терминов в пределах фразы, где n - максимальное удаление терминов друг от друга
встреча \3 друзей ^m - изменение относительного веса отдельного термина на величину m (может использоваться число с плавающей точкой).
^4.5 консультация ^0.5 врача
- - расширение поискового термина, использование перед поисковым термином приводит к раскрытию термина до всех морфологических форм, после поискового термина - замена термина на слова с произвольным окончанием от данного корня. Возможно указание кода языка морфологии или официальное название языка морфологии (узнать их можно в полном описании)
- история
- {6}проверка
- {portugues}voltado
{SYNONIMS} - расширение поискового термина с использованием синонимов термина
{Synonims} папа
данный запрос будет автоматически преобразован системой во внутреннее представление вида: папа | отец | батюшка | батя | папаша | тятька...... {TITLE} {HEADER} {MARK} {ESSENCE} {REF} {IMAGE} {VIDEO} {AUDIO}
поиск в частях документа: названии, заголовках, выделенном тексте, в начале документа (первые 512 байт), в ссылках, в картинках, в видео и аудио ссылках соответственно. Обратите внимание, что после служебного слова следует использовать пробел.
Пример:
{AUDIO} alsu {LINK} - нахождение документов, ссылающихся на данный документ. Строка, следующая за служебным, словом рассматривается как URL. Будут найдены документы, которые включены в коллекцию для сканирования.
Пример:
{LINK} http://www.stack.net/ {HREF} - нахождение документов, на которые ссылается данный документ. Будут указаны исходящие ссылки, которые включены в число сканируемых системой Turtle
Пример:
{HREF} http://www.stack.net/
{SRVLINK} - нахождение документов, ссылающихся на любую страницу сервера.
Пример:
{SRVLINK} www.rol.ru Пример:
{SRVHREF} - нахождение документов, на которые ссылается указанный сервер. При использовании языка запросов и отсутствии логического оператора между поисковыми терминами считается, что к ним будет применена операция пересечения "&".
Можливості розширеного пошуку
Расширенная форма позволяет установить логические операции между поисковыми терминами, ограничить область поиска, указать тип расширения поисковых терминов, исключить документы, содержащие определенные частотные термины, уточнить способы сортировки и группировки результатов поиска.