Apache LuceneTM — это высокопроизводительная полнофункциональная библиотека механизма текстового поиска, полностью написанная на Java. Эта технология подходит практически для любого приложения, требующего полнотекстового поиска, особенно кросс-платформенного.
Apache Lucene — это проект с открытым исходным кодом, доступный для бесплатной загрузки. Воспользуйтесь ссылками справа для доступа к Lucene.
Lucene предлагает мощные функции через простой API:
Масштабируемое высокопроизводительное индексирование
более 150 ГБ/час на современном оборудовании
небольшие требования к ОЗУ -- всего 1 МБ кучи
инкрементальное индексирование так же быстро, как пакетное индексирование
размер индекса примерно 20-30% от размера индексируемого текста
Мощные, точные и эффективные алгоритмы поиска
Ранжированный поиск -- лучшие результаты возвращаются первыми
множество мощных типов запросов: фразовые запросы, запросы с подстановочными знаками, запросы близости, запросы диапазона и многое другое
поиск по полям (например, название, автор, содержание)
сортировка по любому полю
поиск по нескольким индексам с объединенными результатами
позволяет одновременное обновление и поиск
гибкая огранка, выделение, объединение и группировка результатов
быстрые, экономичные и устойчивые к опечаткам подсказки
подключаемые модели ранжирования, в том числе Vector Space Model и Okapi BM25
настраиваемый механизм хранения (кодеки)
Кроссплатформенное решение
Доступно как программное обеспечение с открытым исходным кодом по лицензии Apache, которая позволяет использовать Lucene как в коммерческих программах, так и в программах с открытым исходным кодом.
100% чистая Java
Доступны реализации на других языках программирования, совместимые с индексами.