Ефективність пошуку інформації в інтернеті

Основний обсяг інформації, що міститься в Інтернеті, є текстовим.

Перша група показників ефективності пошуку інформації - семантичні показники.

Одними з найбільш важливих показників ефективності інфор-мационного систем, що містять текстову інформацію, є семантичні показники. Семантичні показники засновані на оцінці релевантності між документами і запитами.

Семантичними показниками є повнота видачі (втрати інформації) і точність видачі (інформаційний шум).

Інший групою показників оцінки ефективності документальний-них інформаційних систем є прагматичні показники. Ці показники можна визначити тільки в процесі експлуатації інформаційної системи.

Прагматичні показники визначають абоненти системи на базі оцінок пертінентності виданих документів.

Незважаючи на постійне підвищення «дружелюбності» і кому-фортності діалогу з Інтернет, тематичний пошук релевантних сторінок в інформаційних ресурсах Павутини чи не простіше традиційного бібліографічного розвідки і вимагає логічності мислення, інтуїції, чіпкою пам'яті, якими завжди відрізнялися професійні бібліографи.

Основними пошуковими засобами в Інтернеті є поис-кові системи і каталоги. Пошукові системи складаються з трьох частин:

♦ програма, яка, переглядаючи відповідно до запиту користувача індексні масиви, відбирає і видає споживча п-лю знайдені документи.

У каталогах є ієрархічні тематичні рубрики. Відне-сеніе серверів до тих чи інших рубриках каталогу здійснюється людиною. Користувач шукає інформацію в каталозі вручну, ис-пользуя рубрики.

У зв'язку з тим що в засобах пошуку в Інтернеті не використовуються інформаційно-пошукові мови, на яких могли б бути описа-ни вихідні документи і запити, повнота пошуку в Інтернеті ... буде значно нижче, ніж в документальних системах, побудованих на базі інформаційно-пошукових мов.

Ефективна від-ність пошуку інформації в Інтернеті поки істотно поступається ефективності пошуку в документальних інформаційно-пошукових системах, і ефективності пошуку в професійних базах, які використовують спеціальні інформаційно-пошукові мови. Зокрема, організація інформації в професійних базах відрізняється від організації інформації в Інтернеті в першу чергу тим, що інформація накопичується і постійно оновлюється в базах даних, яких в даний час понад 13 тис. У кожній базі зібрана спе-ціфічная інформація. Відбір достовірних джерел і накопичення інформації ведуть інформаційні агентства-генератори. Вони ж підтримують ці бази в актуальному стані, тобто оновлюють. Отримання інформації з баз споживачами забезпечують агент-ства-постачальники. Споживачеві надається мову запиту і доку-ментація, що характеризує бази даних, яка включає дотримуюся-щие відомості по кожній базі: назва, що відбиває вид інформації, що зберігається в базі, з якого часу ведеться база, обсяг накопиченої інформації, період оновлення, джерела інформації .

Схожі статті