Пошук в комп'ютерних мережах стає мистецтвом і вимагає цілком певних знань, якими сучасній людині необхідно оволодіти. Я обрала дану тему реферату, тому що вважаю що однією зі складових грамотної роботи в Інтернет є вміння працювати в глобальній мережі. І для того, щоб не потонути в усьому достатку інформації необхідно навчитися не тільки її шукати, але і знаходити.
Перш ніж почати пошук слід чітко сформулювати завдання. До тих пір, поки завдання не буде сформульована про успішність, а тим більше оптимізації пошуку, не може бути й мови. Обсяг інформації в Інтернеті дуже великий, і як ніде тут вірна приказка «Час - гроші». Тому в тут не можна шукати за принципом «Піди туди, не знаю куди. Візьми те, не знаю що ». Інакше результат буде плачевний.
Дати загальний рецепт ефективної стратегії пошуку інформації в Інтернет, мабуть, неможливо. Є лише деякі принципи, що дозволяють витрачати менше часу. Ось деякі з них. Наприклад, вам необхідно дізнатися, де мешкає трилапий лінивець, то навряд чи ви підете в алфавітний каталог бібліотеки. Може бути, ви знайдете потрібну літературу за допомогою систематичного каталогу. З дещо більшою ймовірністю - за допомогою предметного. Але, швидше за все, жоден з бібліотечних каталогів вам не допоможе. Але, зайшовши в інформаційно-бібліографічний відділ великої бібліотеки, черговий бібліограф дістане бібліографічний покажчик по тваринах або якусь схожу книжечку, з якої ви і знайдете відповідь на своє питання. Подібну стратегію можна з успіхом застосовувати і в Інтернет. В ІПС (інформаційно-пошукових мережах) загального призначення можна потонути в тисячах посилань, виданих вам на простий запит. Метою використання універсальної ІПС загального призначення може бути пошук спеціалізованої ІПС, присвяченій тематиці вашого пошуку. Така ІПС може бути розпізнає за такими словами "інформація (information)", "документ (document)" і т.п. Але часто спеціалізована ІПС може ховатися на сервері громадської, професійної або спеціалізованої організації, видавництва.
Третій елемент стратегії: використовуйте кілька ІПС. Якщо ви регулярно займаєтеся пошуком інформації з якоїсь тематики, відмітьте ті ІПС. які для вас найбільш ефективні.
За принципом організації та використання коштів пошуку можна розділити на каталоги (довідники, директорії) і пошукові машини.
В Internet розміщуються вузли та інших каталогів, забезпечених пошуковими системами, подібними пошуковим системам Yahoo!
Нижче перераховані деякі пошукові каталоги:
- Excite (www.excite.com);
- Брама (www.brama.com);
- Everyday (www.everyday.com.ua);
- UP.RU (www.up.ru);
- Elvisti (www.el.visti.net);
- @Rus (www.atrus.ru);
- List.ru (www.list.ru);
- Weblist (www.weblist.ru);
- Сузір'я (www.stars.ru);
- Равлик (www.ulitka.ru);
- Іван Сусанін (www.susanin.ru);
- MavicaNet (www.mavikanet.ru).
Головний недолік пошукових каталогів Web-ресурсів в тому, що їх пошукові системи витягають величезну кількість документів, які не відповідають вводиться запитом. Як правило, документи, які знаходяться в кінці списку, містять мало корисної інформації. Ключові слова можуть бути витлумачені системою пошуку абсолютно в іншому контексті або відповідають кільком тлумаченням.
Під час отримання запиту від користувача машина пошуку розглядає всю індексовану інформацію і видає список документів, відповідних завданню пошуку. Знайдені документи ранжуються в залежності від місця розташування ключових слів (в заголовку, на початку тексту, в перших параграфах) і частоти їх появи в тексті.
Незважаючи на схожий принцип роботи, машини пошуку розрізняються по мовам запиту, зонам пошуку, глибині пошуку всередині документа, методам ранжирування і пріоритетів, тому застосування різних пошукових машин дає різні результати.
В даний час у вітчизняних ресурсах діє досить багато пошукових машин. Є фірмові і навіть індивідуальні сайти, які включають ті чи інші пошукові машини. Пошукові елементи існують практично на всіх Інтернет-газетах і навчальних порталах.
Найбільш поширені з пошукових машин представлені нижче:
- Яndex (www.yandex.ru);
- Апарат (www.aport.ru);
- МЕТА (www.meta-ukraine.com);
- Rambler (www.rambler.ru);
- UANET (www.uanet.com.ua);
- EIVisti (www.el.visti.net);
- SEARCH (www.search.kiev.ua);
- Pathfinder (www.pups.kiev.ua);
- Tela-пошук (www.tela.dux.ru);
- Openweb (www.openweb.ru);
- АУ (www.au.ru).
Втім, є можливість програмно заборонити реєстрацію всього сайту, або окремих елементів його, як усіма, так і певними пошуковими системами. Для подібних цілей служать так звані мета-теги або мета-визначники. Однак це окрема розмова, ким і з якою метою подібне заборона робиться.
Пошуковий запит може складатися з одного або декількох слів, в ньому можуть бути присутніми різні розділові знаки. Складати найпростіші запити можна і не вдаючись в тонкощі мови запитів. Так, якщо ввести в пошуковий рядок кілька слів без розділових знаків і логічних операторів, будуть знайдені документи, що містять всі ці слова, та ще й якщо вони знаходяться на строго обмеженій відстані один від одного. Такий пошук з досить великою ймовірністю закінчиться негативним результатом. І тут про поняття успішності не може бути й мови. Знання і правильне застосування мови запитів пошукової машини допоможе зробити пошук швидким і ефективним.
Що стосується регістра, то в загальному випадку, регістр написання пошукових слів і операторів значення не має, тобто слова "реферат", "Реферат", реферат, "РЕФЕРАТ" і "реферати" - все будуть сприйматися однаково. Це повністю стосується і латиниці. Так, "Yas" і "yES", і навіть "yeS", "yes" і "YES" всі вони для пошуку одноманітні. І лише іноді, з метою підвищення якості пошуку, регістр пошукового запиту приймається до уваги. Якщо в запиті задано слово з великої літери, то будуть знайдені тільки слова в такому написанні, а якщо з маленькою - обидва варіанти. Якщо запит складається з двох, трьох або чотирьох слів, кожне з яких написано з великої літери, то передбачається пошук по імені власним, і електронний блок робить зміна обмеження відстані між словами запиту зі значення за замовчуванням на величину (n-1) * 2, де n - кількість слів запиту. Це дозволяє знаходити групу слів запиту, всередині якої є не більше одного "зайвого" слова або розділового знака, наприклад: "М. Лермонтов", "Баден-Баден", "Шарль де Голь", "Федір Михайлович Достоєвський" і т.п .
Сучасні пошукові машини використовують оператори для пошуку в комп'ютерних мережах. Під оператором тут розуміється інструкція пошуку. З цієї причини запит, що включає кілька слів, може містити оператори. Пошук зазначених операторів в документі не проводиться. Вони служать лише інструкцією пошуковій машині. З цієї причини вони мають свою орфографію і синтаксис. Розглянемо їх докладніше.
Кожен з операторів має своє скорочене позначення, відповідність їх приведено в таблиці.
У мові запитів зазвичай один значок оператора означає його дію в межах абзацу, а два поспіль - в межах всього тексту.
Дужки. При побудові запитів іноді виникає необхідність об'єднання слів запиту в групи, які будуть аргументами деякого оператора. Такі групи полягають в дужки. Як правило, в більшості пошукових машин використовують тільки дужки виду (). Частина запиту, укладена в дужки, сама є запитом, і на неї поширюються всі правила мови побудови запитів. Використання дужок дозволяє будувати вкладені запити і передавати їх операторам в якості аргументів, а також перекривати пріоритети операторів, прийняті за замовчуванням.
Лапки. Для пошуку цитат можна використовувати типові (подвійні) лапки, виду «або». Слова запиту, укладеного в подвійні лапки, шукаються в документах саме в тому вигляді і в тому порядку, як вони були задані в запиті. Це дуже ефективний спосіб пошуку. Його застосування забезпечує успішність понад 60%. Тут важливо враховувати тільки два моменти. По-перше, цитування повинно бути точним, тобто без зміни за відмінками, числами та особам, по-друге, матеріал, який ви шукайте, як мінімум повинен бути в Інтернеті. Якщо при такій формі пошуку буде допущена граматична помилка, пошук дасть негативний результат.
Таким чином, подвійні лапки можна використовувати і просто для пошуку слова в заданій формі (за замовчуванням слова знаходяться у всіх формах). Наприклад, запит: задовольняє документ, що містить текст '. поїзд прибув для здійснення посадки пасажирів. ', І не задовольняють документи: з'. поїзд підійшов до платформи для посадки пасажирів. ', Або' ... поїзд був поданий для проведення посадки пасажирів ... 'і т.п.
Метасимволи або маски. Далеко не кожна пошукова машина може підтримувати пошук рядків з використанням метасимволов ( '*', '?'), Які зазвичай використовуються в значенні "будь-яка подстрока" і "довільний (будь-який) одиночний символ" відповідно. Проте, ці оператори нерідко бувають зарезервовані для подібного використання в майбутньому.
Розглянемо конкретний приклад. Відкриємо в браузері початкову сторінку пошукового сервера Яндекс. В поле пошуку введемо ключові слова, наприклад, «інформатика підручники тести CD-ROM», або «інформатікаучебнікітестиCD-ROM». В результаті проведеного пошуку було знайдено 202 сторінки, що містять даний запит і не менше 81 сайта. У статистиці пошуку можна ознайомитися з кількістю сайтів, що містять кожне з ключових слів: інформатика - 55813, підручники - 189860, тести - 498394, CD - 348167? ROM - 34315.
Тепер поставимо в поле пошуку наступну фразу: «інформатика | підручники | тести | CD-ROM», використовуючи оператор OR. В результаті на цей запит буде знайдено 48518876 сторінок, не менше 22970 сайтів, в каталозі 962 сайта.
Використовуючи оператор NOT, введемо в поле пошуку наступну фразу: «інформатика
підручники тести CD-ROM »/ В результаті буде знайдено 3695907 сторінок і не менше 4056 сайтів, які будуть містити ключове слово« інформатика »з виключенням слів, що стоять в запиті після значка«
Яndex також дозволяє використовувати замість слів цілі логічні вирази, при цьому його необхідно укласти в дужки. Використовуючи наш приклад, введемо в поле пошуку такий вираз: (інформатика підручники) тести CD-ROM. В результаті пошуку буде знайдено 3564 сторінок і не менше 701 сайта, що містять в собі таку групу слів як (інформатика підручники).
Тепер знайдемо фразу, для цього введемо в поле пошуку такий вираз: «мороз і сонце, день чудовий». В результаті цього пошуку буде знайдено 14195 сторінок і не менше 756 сайтів.
При пошуку інформації в Інтернет дуже важливо враховувати морфологія мови запитів. По кожному слову запиту пошук ведеться з урахуванням правил словозміни відповідного мови. Пошукова машина «розуміє» і «розрізняє» слова російської та англійської мов - за замовчуванням. Пошук ведеться, з урахуванням зміни по відміні, дієвідміні, числу і особі, тобто за всіма формами слова; включаючи навіть збігаються за смисловим значенням. Наприклад, при пошуку по слову машина будуть також знайдені документи, що містять слова 'про машину', 'промашіну', 'машиною', і т.п. але і, що особливо важливо, навіть слова 'машини', 'машинам', 'машин' виявляться відповідними запитом. Щоб провести пошук тільки по одній суворо визначеній формі слова, потрібно взяти його в подвійні лапки або скористатися знаком "!".
Також існують деякі слова і символи, які за замовчуванням виключаються із запиту в зв'язку з їх малою інформативністю. Це - самі частотні слова російської та англійської мов, наприклад, прийменники, частки і артиклі. Дуже часто опускаються апострофи і тире. Більшість пошукових машин їх знають і самі звільняють від них сформульований Вами запит. Це пов'язано з тим, що факт присутності цих слів може помітно сповільнити пошук і негативно вплинути на його результат і повноту, а, в кінцевому підсумку, і успішність. У той же час є можливість підкреслити необхідність цих слів в запиті. Для цього, слід взяти запит в подвійні лапки або скориставшись пошуком точної фрази в розширеному пошуку.
Існує також пошук, за допомогою обмеження відстані. Наприклад, якщо запит складено з декількох слів без застосування операторів і конструкцій мови запитів, то машина буде намагатися знайти документи, в яких зустрічаються всі слова запиту. При цьому для кожного запиту завжди вводиться так зване обмеження контексту - позитивне число. За замовчуванням приймається відстань рівне 40 словам. Документ, в якому зустрілися всі слова запиту, буде виданий тільки в тому випадку, якщо відстань між словами запиту буде менше цього числа. У пошукових системах є можливість задавати порядок проходження і відстань між словами. Відстань між словами А і В дорівнює: 1 (В слід відразу за А), 2 (В слід за А через одне слово) і т. Д. Або -1 (В стоїть перед А), -2 ... Знак "/" між словами, за яким стоїть число, означає, що відстань між ними не повинно перевищувати цього числа слів.
Наприклад, нам необхідно знайти документи, в яких будуть міститися слова «інформатика» та «підручники», і відстань між ними не повинно перевищувати 2 слів. Для цього введемо в поле пошуку такий вираз: "інформатика / 2учебнікі". В результаті на наш запит отримаємо 9 сторінок і не менше 5 сайтів
Якщо ж ми трохи змінимо наш запит - інформатика / (+ 1 + 4) підручники - то ми отримаємо документи, в яких дані ключові слова будуть йти один за одним в такому порядку на відстані від 1 до 4 слів.
Дуже часто доводиться також проводити пошук вже в знайденої інформації, тобто можна здійснити пошук за документами, знайденим за попереднім запитом. Для цього в кінці запиту потрібно поставити "$$" або просто зробити позначку у віконці "пошук в знайденому", розташованому на сторінці запиту. Ця функція дуже зручна для послідовного звуження пошуку.
Мова пошукової машини Яndex володіє найбільш повним набором можливостей в російськомовному пошуку, тому, освоївши його, ви без праці зрозумієте в мові запиту будь-якого іншого засобу пошуку.
У висновку хотілося б визначити базовий алгоритм пошуку.
Сучасній людині необхідно вміти проводити пошук в Інтернет, щоб «не потонути» в достатку інформації.
Сайт управляється системою uCoz