Навіщо ми створили заміну dtSearch +12
- 06.04.17 08:39 •
- sochix •
- # 325786 •
- Хабрахабр •
- 12 •
- 1600
- такий же як Forbes, тільки краще.
Ми пройшли довгий шлях від використання dtSearch до повноцінного власного рішення. У цій статті хочемо поділитися нашим досвідом.
- Вибір стояв між Cross, Copernic, Архіваріус, dtSearch і декількома екзотичними рішеннями
- Порівняння швидкості запитів на великому обсязі даних показало очевидного переможця - dtSearch
- У dtSearch на той момент був найбільш розвинений синтаксис запитів, який дозволяв нам реалізувати всі "тонкощі" пошуку інформації
- У dtSearch є API у вигляді бібліотеки для C #, яку ми використовували для інтеграції движка в нашу систему. Чи не найзручніший варіант, але на той час був найприйнятнішим
Що було далі
Йшли роки, наша система розвивалася, і поступово dtSearch ставав вузьким і проблемним місцем:
Список можна продовжити і далі, але все інше - дрібниці, порівняно з проблем, що вказані вище.
Далі ми розглянули варіант створення модуля повнотекстового пошуку для нашої системи, використовуючи Apache Tika + ElasticSearch або Apache Solr, що в цілому вирішило б нашу проблему. Однак, нас не переставала мучити думка про те, що на ринку як і раніше немає хорошого рішення з швидким пошуком, OCR і зручними інтерфейсами.
Тому, не довго думаючи, ми вирішили створити власне open-source рішення, яке б всім полегшило життя - так народився Ambar.
Ambar - система повнотекстового пошуку по документам
У процесі розробки ми тримали в голові все ті проблеми, які нас переслідували з dtSearch. Тому нашими основними вимогами до системи були: легка, інтуїтивно зрозуміла, при цьому потужна, і масштабована. Орієнтувалися ми відразу на обсяги в десятки і сотні мільйонів файлів, обов'язковою умовою був швидкий пошук, що займає не більше половини секунди незалежно від складності запиту і кількості документів.
Основні моменти про нашу систему, які важливо знати:
> Наш блог. де ми ділимося усіма цікавими фактами і напрацюваннями
Дякую за увагу!