У минулій статті - Дублі Joomla - причини виникнення, ми поговорили про те, чому вони виникають і як їх шукати. У цій статті розповім як можна прибрати дублі або запобігти їх появі в пошуковій видачі. Так як кожен випадок індивідуальний, розглянемо найпопулярніші способи, які в 99% випадків відмінно працюють. Можна для себе вибрати щось одне або використовувати в комплексі. Хоча всі ці способи застосовні і до будь-якої іншої CMS системі, але я докладно зупинюся саме на особливостях Джумли.
Всі ці приклади справедливі якщо ви включили стандартний SEF і Перенаправлення URL в глобальних налаштуваннях Joomla.
1. Плагін для Joomla
2. Robots.txt для Joomla
Найчастіше я використовую таку інструкцію (на додаток до того, що йде в файлі за замовчуванням):
Disallow: / *? # Всі посилання, які містять цей знак - не індексуються.
Всього одна строчка позбавляє від великої кількості сміття. Це можуть бути:
- шпальти преси матеріалів, містити в урлах також print = або tmpl = component
- посилання на rss стрічку
- сторінки результатів пошуку по сайту
- також закриє сторінки пагінацію
- можуть бути й інші варіанти, в залежності від використовуваних розширень
Використовувати цей рядок або забороняти кожен тип сторінок окремо - на ваш розсуд, але майте на увазі, що занадто великий Роботс вважається повністю дозволяє. Так само варто простежити, щоб ця строчка не закрила щось важливе, наприклад, карту сайту - в такому випадку можна прописати: Allow: / путь_до_карти
3. Атрибут rel = «canonical» тега
Використання цього атрибута допоможе роботу визначити - які сторінки потрібно включати в індекс, а які ні. Якщо на сайті існують дуже схожі сторінки (нечіткі дублі), що відрізняються лише, наприклад, варіантами сортування - з початку нові або сортувати по зростанню, або показувати по 20-30 і т.д. то ви можете використовувати цей атрибут. У такому випадку потрібно буде вибрати одну канонічну сторінку, яка і ранжируватиметься, на інші додати rel = «canonical» із зазначенням обраної сторінки - такі документи не потраплять у видачу, робот буде знати, що включати в індекс їх не потрібно.
Детальніше, як впровадити rel = «canonical» в Joomla 1.7 / 2.5 дивіться тут.
4. 301 редирект
301 редирект можна використовувати так само і для склеювання дублів. Наприклад, всім відомі дублі головної сторінки сайту на Joomla - це /index.php і алиас пункту меню Головна, припустимо, / home або / homepage
Склеїти їх досить просто, відкриваємо .htaccess і вписуємо
Або можна зробити 301 редирект на php в індексному файлі вашого шаблону
І приведу вже класичний редирект з www на без www
* Example.ru замініть на своє доменне ім'я.
5. Мета тег robots
Ще один спосіб запобігти індексацію дублів в Joomla - використання мета тега:
Щоб закрити сторінки результатів пошуку на сайті з використанням стандартного com_search, можна в index.php шаблону додати умова
Але спочатку необхідно визначити змінну
$ Option = JRequest :: getVar ( 'option', null);
6. Видалення url з панелі
Ще один швидкий спосіб - ручне видалення з панелі вебмастера.
Залишився ще 1 цієї статті не дуже популярний метод щодо усунення дублів Joomla з видачі, але ми його теж розглянемо.
7. Заголовки X-Robots-Tag
Як бачите, способів прибрати дублі контенту Joomla безліч, ви повинні хоча б приблизно розуміти як працює кожен з них, щоб вибрати найбільш підходящий варіант і застосувати до своєї ситуації.