Є старий сайт з купою мотлоху в папках. Потрібно якось обчислити, які картинки використовуються, а які можна видалити. Є якісь робочі рішення? Якщо немає, то хто може зробити?
Мені алгоритм бачиться таким:
1) перевіряємо статті в базі, шукаємо там картинки і складаємо список
2) проходимо по папках з картинками і все картинки не зі списку переміщаємо в окрему папку зі збереженням структури папок.
"Звичайно, я розумна людина, розумніші дуже багатьох, але щастя не в цьому." А.П. Чехов. "Три сестри"
Carpe diem / Memento mori / Ecce Homo
Під столітніми заметами біблійних анекдотів.
- З *** гонець? Гонець з Пензи. Ні - реальний гонець!
Біоробот на 146%
А яка різниця?
"Звичайно, я розумна людина, розумніші дуже багатьох, але щастя не в цьому." А.П. Чехов. "Три сестри"
Carpe diem / Memento mori / Ecce Homo
Під столітніми заметами біблійних анекдотів.
- З *** гонець? Гонець з Пензи. Ні - реальний гонець!
А яка різниця?
Як би передбачається автоматизований прохід по сторінках, без парсинга як-такого. Але погоджуся - думка оч. сира.
Біоробот на 146%
Заковика в тому, що не всі сторінки доступні з меню, та й взагалі звідки-небудь, тобто заховані. Тому такий павук не допоможе. Реально простіше перебирати записи в базі.
"Звичайно, я розумна людина, розумніші дуже багатьох, але щастя не в цьому." А.П. Чехов. "Три сестри"
Carpe diem / Memento mori / Ecce Homo
Під столітніми заметами біблійних анекдотів.