Універсальний парсер для joomla, tod, блоги

Універсальний парсер для joomla, tod, блоги

Сьогодні останній день не тільки цього року, а й місяці. тому, щоб не псувати статистику я все-таки зібрався написати тут невелику статтю.
Думаю, що теоретичні і практичні записи краще чергувати або, по крайней мере, не захоплюватися теорією, так як це не всім цікаво, як показує практика.

Контент сайту - його основна складова, і не завжди можливо його своєчасно оновлювати (цей блог тому приклад), однак не можна розчаровувати своїх читачів \ відвідувачів застарілими даними. Найчастіше для цього використовуються механізми читання і виведення стрічок новин сайтів; деякі проекти навіть надають APi для цього.
Однак мова піде в першу чергу, про ті проекти які не мають ніяких інструментів для експорту.

Спеціально для цього я написав компонент com_auto або TJ-Parser, що дозволяє витягувати будь-яку частину стороннього сайту (використовуючи синтаксис селектор jQuery), а також виключати з витягнутого блоку, з використанням того ж синтаксису.
Все це проводиться на серверній стороні, а щоб не напружувати сторонній сервер, здійснюється кешування витягується сторінки і, при бажанні, і всіх зображень.
Також є невеликі "плюшки" у вигляді можливості відкриття посилань з витягується блоку в модальному вікні joomla (стандартний на motools) в iFrame, а також в можливості додати якірну посилання на відкривається сторінку в фреймі.


Компонент сумісний з Joomla 3.x,
Поки присутній тільки російська локалізація, англійська буде додана трохи пізніше.


Радий повідомити, про нову версію TJ-Parser. Цей компонент дозволяє дуже просто парсити шматочки зі сторонніх сайтів, використовуючи при цьому синтаксис селектор jQuery.
Була проведена велика робота, а саме:

  • виправлені основні недоліки попередньої версії
  • повністю перероблена робота з кешем
  • виправлена ​​робота з конфігураціями компонента

Схожі статті