Пошук у всесвітній павутині

Інтернет - це найбільш демократичний джерело інформації. Кожен може розмістити в Мережі власний ресурс і висловити свою думку. У цьому одночасно сила і слабкість Всесвітньої мережі.

Знаходити інформацію в Інтернеті, ймовірно, було б дуже важко, якби не були створені потужні пошукові інструменти: пошукові машини (пошуковики), каталоги-рейтинги (рубрикатори), тематичні списки посилань. онлайнові енциклопедії та словники.

Для пошуку різного роду інформації найбільш ефективними виявляються різні інструменти.

Каталог має ієрархічну структуру. Тематичні розділи першого рівня визначають максимально широкі теми, такі як "спорт", "відпочинок", "наука", "магазини" і т.д. У кожному такому розділі можуть бути підрозділи. Користувач може уточнювати інформацію, що цікавить його область, подорожуючи по дереву каталогу і поступово звужуючи зону пошуку. Наприклад, при пошуку інформації про ноутбуках ланцюжок пошуку може виглядати так: Інформаційні технології -> Комп'ютери -> Ноутбуки. Дійшовши до потрібного підкаталогу, користувач знаходить в ньому набір посилань.

Зазвичай в каталозі все посилання є профільними, оскільки складанням каталогів займаються не програми, а люди. Очевидно, що якщо ведеться пошук загальної інформації за деякою широкій темі, то доцільно звернутися до каталогу. Якщо ж необхідно знайти конкретний документ, то каталог виявиться малоефективним пошуковим засобом.

Часто каталоги ресурсів одночасно є і рейтингами, тобто каталог пропонує зареєстрованим в ньому сайтам встановити на своїх сторінках лічильник відвідувань. і відображає списки посилань на сайти відповідно до їх популярністю (відвідуваністю). Популярність ресурсу оцінюється по ряду параметрів, в тому числі по так званим хостам (кількість унікальних відвідувачів на добу) і хітам (кількість заходів на сайт на добу).

Очевидно, що від уміння грамотно видавати запит залежить відсоток одержуваних релевантних документів. Частка релевантних документів в списку всіх знайдених пошуковою машиною називається точністю пошуку. Нерелевантні документи називають шумовими. Якщо всі знайдені документи релевантні (шумових немає), то точність пошуку становить 100%. Якщо знайдені всі релевантні документи, то повнота пошуку - 100%.

Таким чином, якість пошуку визначається двома взаємозалежними параметрами: точністю і повнотою пошуку. Збільшення повноти пошуку знижує точність, і навпаки.

Пошукові системи можна порівняти з довідковою службою, агенти якої обходять підприємства, збираючи інформацію в базу даних. При зверненні в службу інформація видається з цієї бази. Дані в базі застарівають, тому агенти їх періодично оновлюють. Іншими словами, довідкова служба має дві функції: 1) створення і постійне оновлення даних в базі і 2) пошук інформації в базі за запитом клієнта.

Аналогічно, пошукова машина складається з двох частин: так званого пошукового робота (або павука), який обходить сервери Мережі і формує базу даних, і механізму пошуку релевантних запиту користувача посилань в базі.

Слід зазначити, що, відпрацьовуючи конкретний запит користувача, пошукова система оперує саме внутрішньою базою даних (а не пускається в подорож по Мережі). Незважаючи на те, що база даних пошукової машини постійно оновлюється, пошукова машина не може проіндексувати всі Web-документи: їх число дуже велике. Проблема недостатності повноти пошуку полягає не тільки в обмеженості внутрішніх ресурсів пошукача, а й в тому, що швидкість робота обмежена, а кількість нових Web-документів постійно зростає.

Найбільш популярними на сьогодні пошуковими системами є Google (www.google.com, www.google.ru) і Яндекс (www.yandex.ru).

Онлайнові енциклопедії та довідники

У ряді випадків буває потрібно знайти не просто документ, що містить ключове слово, а саме тлумачення деякого слова. При пошуку незнайомого терміна за допомогою пошукової машини ви ризикуєте отримати цілий ряд статей, в яких цей термін використовується, і при цьому так і не дізнатися, що ж він все-таки означає. Подібний пошук краще проводити в онлайновій енциклопедії.

Історія Всесвітньої павутини

У 1989 році. працюючи в CERN над внутрішньою мережею організації, Тім Бернерс-Лі запропонував глобальний гіпертекстовий проект, тепер відомий як Всесвітня павутина.

В рамках проекту Бернерс-Лі написав перший в світі веб-сервер і перший в світі гіпертекстовий веб-браузер, що називався «WorldWideWeb».

І все ж теоретичні основи веба були закладені набагато раніше. Ще в 1945 році Ваннівер Буш розробив концепцію «Memex» - допоміжних засобів «розширення людської пам'яті». Memex - це пристрій, в якому людина зберігає всі свої книги і записи (а в ідеалі - і всі свої знання, піддаються формальному опису) і яке видає потрібну інформацію з достатньою швидкістю і гнучкістю. Бушем було також передбачено всеосяжне індексування текстів і мультимедійних ресурсів з можливістю швидкого пошуку необхідної інформації. Наступним значним кроком на шляху до Всесвітньої павутини було створення гіпертексту (термін введений Тедом Нельсоном в 1965 році).

Мал. 75. Логотип Консорціуму Всесвітньої павутини

В даний час комп'ютери приймають досить обмежену участь у формуванні та обробці інформації в мережі Інтернет. Функції комп'ютерів в основному зводяться до зберігання, відображення і пошуку інформації. У той же час створення інформації, її оцінку, класифікацію та актуалізацію - все це як і раніше виконує людина. Як включити комп'ютер в ці процеси? Якщо комп'ютер поки не можна навчити розуміти людську мову, то потрібно використовувати мову, який був би зрозумілий комп'ютеру. Тобто, в ідеальному варіанті вся інформація в Інтернеті повинна розміщуватися на двох мовах: на людській мові для людини і на комп'ютерному мовою для розуміння комп'ютера. Семантична павутина - це концепція мережі, в якій кожен ресурс людською мовою був би забезпечений описом, зрозумілим комп'ютеру.

Програми зможуть самі знаходити потрібні ресурси, обробляти інформацію, класифікувати дані, виявляти логічні зв'язки, робити висновки і приймати рішення на основі цих висновків. При широкому поширенні і грамотному впровадженні семантична павутина може викликати революцію в Інтернеті.

1. Перша світова комп'ютерна мережа носила ім'я:

2. Провайдер Internet це:

  • організація-постачальник послуг Internet;
  • організація, що займається створенням web-сайтів;
  • периферійний пристрій, що служить для зв'язку з іншим комп'ютером.

5. В якій з наведених доменних зон першого рівня може придбати собі доменне ім'я юридична особа, зареєстрована на території РФ?

8. Що таке HTML?

  • Один з протоколів сімейства TCP / IP;
  • Мова гіпертекстової розмітки документа;
  • Мова програмування.

Схожі статті