Нікуди без них не дітися!
Ні вже, панове консерватори! Я постараюся вже якось реалізувати парсинг документів без цього застарілого засобу. Ну не вистачає у мене терпіння на складання шаблонів за допомогою регулярних виразів. А коли терпець уривається, то народжуються інші більш «лайливі» вираження. Так що «граблі» в сторону - ми йдемо за власним Галс!
Щоб не зганьбитися, нам буде потрібно стороння бібліотека - Simple HTML DOM. Завантажити її можна за цим посиланням. Не турбуйтеся, версія хоч і стара, але працює. А головне, що це засіб свіжіше буде, ніж вираження регулярні.
Після розпакування поміщаємо файл simple_html_dom.php в папку зі скриптом, щоб легше було підключати. Всі інші файли в принципі нас не цікавлять, але знадобляться вам в майбутньому. Там є і мануал, і приклади використання бібліотеки.
Фреймворк YII2. Швидка розробка з сучасним PHP фреймворком
Дізнайся тонкощі сучасної веб-розробки за допомогою фреймворка YII2
Реалізуємо!
Нагадаю, що сьогодні ми навчимося, як знайти посилання PHP без «жахливих» регулярних виразів. Тепер нам залишилося підключити скрипт бібліотеки у себе в коді і просканувати зазначену веб-сторінку на наявність гіперпосилань.
Для доказу дієвості цього методу приведу код розмітки «отпарсеной» сторінки.
Відразу обмовлюся, що я не сканував нічий сайт. Для демонстрації прикладу я використав Денвер, а в ньому стоїть програмна заглушка, яка не дозволяє парсити віддалені хости.
Ще приклад!
Ось ще один варіант реалізації, в якому нам також вдасться обійтися без «граблів».
Розмітка сторінки, в якій за допомогою PHP знаходили посилання в тексті.
Мені черговий раз вдалося позбутися від своїх «граблів». А вам?
Фреймворк YII2. Швидка розробка з сучасним PHP фреймворком
Дізнайся тонкощі сучасної веб-розробки за допомогою фреймворка YII2
Найсвіжіші новини IT і веб-розробки на нашому Telegram-каналі