Знайти потрібну і актуальну інформацію в Інтернеті часом дуже непросто. Кількість інформаційного сміття в Мережі росте як сніжний ком, і дістатися до даних, які вам дійсно необхідні, використовуючи традиційні Яндекс і Google, іноді просто неможливо. Книга, яку ви тримаєте в руках, дозволить збільшити ефективність вашого пошуку інформації в Інтернеті у багато разів. Тут описані прийоми, пошукові сайти і програми для спеціалізованого пошуку інформації. Розглянуто сучасні різновиди інтернет-пошуку: універсальний пошук, вертикальний пошук, метапоісковая системи, побудову персональних пошукачів, пошук аудіовізуального контенту, пошук по таємного Інтернету. Для всіх розглянутих систем наведені їх характеристика та поради по максимально ефективному використанню.
Книга: Професійний пошук в Інтернеті
Пошук на файловому хостингу Rapidshare
На безлічі інтернет-ресурсів для зберігання файлів використовуються зовнішні сервіси. Як результат, файлообмінники містять велику кількість корисного контенту. Однак вбудовані системи пошуку в архівах таких ресурсів - скоріше рідкісний виняток із правил. Безпосередній пошук файлів вимагає застосування спеціалізованих інструментів.
На універсальних машинах історично першим засобом вилучення посилань на файли з архівів файлообмінників були складні пошукові вирази. В Google за допомогою операторів intitle і inurl можна було знайти чимало таких файлів. Правда, для цього треба було потурбуватися вивченням операторів і розташовувати часом на експерименти. Інструменти автоматизації такого пошуку не змусили себе довго чекати.
Деякі пошуковики для Rapidshare продовжують використовувати такий підхід, реалізований на новому рівні: додавання додаткових операторів і фільтрів відбувається автоматично і прозоро для користувача. Недоліки подібних пошукових систем досить очевидні. По-перше, пошук йде в основному в тексті посилань. Це означає, що формуючи пошуковий запит, доводиться в першу чергу вгадувати ім'я потрібного файлу, в результаті страждає повнота пошуку. Крім того, корисні результати супроводжуються значним інформаційним шумом.
Друге дихання пошукових систем для файлообмінників відкрилося з поширенням технологій персонального пошуку. Дійсно: куди перспективнішою зосередитися на пошуку по сторінках ресурсів, точно містять посилання на «рапідовскіе» файли, ніж викручуватись в складанні складних запитів, які працюють «по площах». Оскільки такі веб-сторінки, як правило, містять описи викладених файлів, їх можна використовувати як додаткове джерело пошукових ознак. Гідність такого підходу - він дійсно працює і не надто складний в реалізації. Від творця пошуковика, за великим рахунком, потрібно тільки зібрати гідний список ресурсів, що публікують файли на Rapidshare або на інших файлообмінниках.
Серед безлічі таких ресурсів згадки заслуговує кілька проектів. Проект Torosso (torosso.com) пропонує пошук серед посилань на файли, що зберігаються на файлообмінниках Rapidshare і Depositfiles. Підтримується і пошук на декількох великих торрент-трекерах. Доступний фільтр типів файлів. Досить цікаві результати видає пошукова система RapidExplorer (www.grabsharefiLe.com). Він підтримує пошук посилань на серверах Rapidshare і Megaupload. Доступні тематичні перемикачі Web, Software, Music і Video. Результати пошуку непогані, завдання обробляються на середньому рівні, без провалів і особливих успіхів: трохи гірше за книгами, трохи краще за мультимедіа-файлів і програм. Ось тільки не варто при такому пошуку включати опцію Software, передбачену в інтерфейсі RapidExplorer - ви не отримаєте нічого крім посилань на вельми підозрілі сайти. Робота з ними - заняття на любителя.
Чимало сучасних пошукових систем, що працюють з торрентами, побудовано на базі «персональної» платформи Google Custom Search Engine. Назвемо кілька прикладів таких пошукових машин.
Ресурс CompleTorrent, за заявою розробників, обробляє добрих чотири сотні трекерів, серед яких є як загальновідомі універсальні ресурси, так і невеликі тематичні проекти. Ахіллесова п'ята подібного підходу - залежність від якості роботи «павуків» Google. Якщо в силу будь-яких причин робот Google не зможе проіндексувати сайт, CompleTorrent просто втратить такий ресурс. Крім того, CompleTorrent пропонує тільки найпростіші засоби складання запиту і не володіє будь-якими корисними доповненнями.
Практично тими ж плюсами і мінусами володіє пошуковик Toorgle. Він являє собою типову CSE-машину Google, просту в створенні і здатну обробляти велику кількість ресурсів. Даний проект працює з двома сотнями сайтів.
Необхідно відзначити, що стандартні інструменти Google CSE не найкращим чином підходять для пошуку торрентів. Наприклад, ні на Toorgle, ні на CompleTorrent не наводиться відомостей про стан того чи іншого торрента, не виявляються «мертві» релізи, що веде до великої кількості непотрібних посилань в результатах пошуку.
Серед пошуковиків для файлообмінників на особливу увагу заслуговує Rapidoogle (rapidoogLe.com). Він є, мабуть, найкращим рішенням у своєму класі, побудованому на базі технології Google Custom Search Engine. В його активі - вельми велика добірка індексованих ресурсів. Серед них є як самостійні сайти, так і форуми, а також блоги. У списку видачі присутні як посилання з досить відомих ресурсів, так і з великої кількості дрібних сайтів. Не можна не відзначити непоганий охоплення азіатських ресурсів, які зазвичай випадають з поля зору не тільки тих, хто, але і багатьох спеціалізованих пошуковиків, але ж там можна відшукати досить рідкісні речі, в тому числі повторно розміщувані файли, посилання на які з тих чи інших причин видалені з «наших» сегментів інтернету. Це позитивно позначається на якості результатів пошуку. Крім того, дана система розсилає запити на деякі інші пошукові системи, індексуючі файлообмінники. Таким чином, Rapidoogle можна розглядати в якості своєрідного метапоісковіка.