Мова запитів
Команди простого пошуку
1. Пошук групи слів. При роботі з будь-якою пошуковою системою слід з’ясувати, як вона сприймає групу слів у запиті, наприклад, видатні фізики. Україно- та російськомовні пошукові системи сприймають групу слів так, ніби між ними стоїть сполучник І, тобто шукають документи, в яких обидва ці слова зустрічаються одночасно. Так само працює пошукова система Google. Але більшість англомовних пошукових систем сприймають групу слів таким чином, ніби між ними стоїть сполучник АБО і шукають документи, які містять або перше, або друге слово, або обидва слова разом. Кількість слів у групі не обмежується.
2. Пошук словоформ. У зв’язку з тим, що в українській та російській мовах слова змінюються за відмінками, важливою властивістю пошукової системи є пошук словоформ. У більшості випадків пошукові системи дозволяють знаходити різні словоформи, наприклад, попередній запит на пошук видатні фізики рівносильний запиту видатний фізика.
3. Роль великих літер. Загальне правило для більшості пошукових систем полягає в тому, що великі літери на початку слова сприймаються як додаткова умова, що обмежує область пошуку. Наприклад, за запитом Ліга Чемпіонів будуть знайдені лише ті документи, які містять слова Ліга Чемпіонів. Проте пошук за запитом ліга чемпіонів поверне документи, в яких є слова Ліга чемпіонів, ліга Чемпіонів, Ліга Чемпіонів, ліга чемпіонів.
4. Пошук однокореневих слів. Більшість пошукових систем знаходить документи, які містять слова однокореневі з ключовими. Наприклад, пошук за запитом модел поверне документи, в яких є слова модель, моделей, модельний, моделізм, моделює, моделювання.
5. Засоби контекстного пошуку. Якщо ключові слова взяти в лапки, наприклад "To be or not to be", "Слово о полку Ігоревім", то пошукова система повинна знайти документи, в яких дана фраза присутня буквально, тобто саме так, як вона записана. Для пошуку фрази з абсолютно точним збігом пошуковій системі недостатньо індексного файла, і вона звертається до копій раніше збережених у своїй базі Web-сторінок.
6. Шукати у знайденому. Якщо в результаті пошуку було знайдено занадто багато документів і користувач має бажання скоротити такий список, то для цього використовується послуга "Шукати у знайденому", яку надають пошукові системи на пульті управління пошуком. Наприклад, запит електронна бібліотека можна уточнити запитом фантастика.
Команди мови запитів
1. Оператор І. За допомогою цього оператора об’єднують два чи більше слів таким чином, щоб вони всі були в документі, наприклад Ейнштейн І теорія І відносності. Як було зазначено вище, в україно- та російськомовних пошукових системах списки слів і без такого оператора сприймаються так, ніби між ними стоїть оператор І. Але для більшості англомовних пошукових систем оператор І відіграє важливу роль, йому відповідають символи "&" та "+". 2. Оператор АБО. Оператор забезпечує пошук за будь-яким словом з групи, наприклад, університет АБО академія. У більшості пошукових систем оператор АБО записується у запиті як OR. 3. Логічні дужки. Дужки застосовуються, коли необхідно управляти порядком дій логічних операторів, наприклад, пошук за запитом (чемпіонат АБО кубок) І світу поверне документи, в яких є слова чемпіонат світу або кубок світу. 4. Оператор НЕ. Цей оператор використовується, коли з результатів пошуку необхідно виключити деяке ключове слово. Необхідність у цьому виникає, коли треба уникнути двозначності або зменшити кількість посилань, що повертаються. Наприклад, Паскаль НЕ (мова програмування), кінопремія НЕ Оскар. 5. Пошук із зазначенням відстані. Такий вид пошуку дозволяє вказати, на який відстані одне від одного повинні розташовуватися слова в документі. В англомовних пошукових системах використовується оператор NEAR.
Наприклад:
* information NEAR resources - для англомовних систем (чим ближче розташовані ключові слова один до одного, тим вищою є релевантність документа. Якщо відстань між словами більше 50 слів, то релевантність вважається нульовою); * [5, інформаційні ресурси] - для системи <МЕТА> (обидва ключові слова повинні належати одній групі довжиною не більше п’яти слів), * информационные/ 2 ресурсы - для системи Яндекс (відстань між ключовими словами не повинна перевищувати 2 слова).