Sphider популярный open-source веб скрипт поисковой системы. Этот скрипт автоматически следует за ссылками, расположенных на сайте, и индексирует их (создает индекс всех найденных строк, имеющихся на страницах). Скрипт написан на PHP и использует MySQL базу данных (требует 4 версии или выше у обеих программ).
Особенности
Индексация
- Выполняет полную текстовую индексацию.
- Может индексировать как статические так и динамические страницы.
- Ищет адреса ссылок в href, frame, area и meta тэгах, также может следовать за линками, данных в javascript как строка через window.location и window.open.
- Поддерживает протокол robots.txt, и nofollow и noindex тэги.
- Следует за переназначением адреса со стороны сервера.
- Позволяет ограничить глубину индексации, (sub)domain или директорию.
- Позволяет индексировать только URL, соответствующие (или не соответствующие) определенным ключевым словам или регулярные выражения.
- Поддерживает индексирование pdf и doc файлов (использующий внешние пакеты для конвертации файла).
- Позволяет возобновлять не законченную индексацию.
- Исключает обычные слова от индексации.
Поиск
- Поддерживает типы поиска AND, OR и фраз.
- Поддержка исключения слов (помещая знак '-' перед словом, любая страница, включающая это слово будет опущена на странице результатов).
- Опция добавить и сгруппировать сайты в категории.
- Возможность ограничить поиск данной категорией и ее подкатегории.
- Возможность поиска только в указанном сайте.
- "Возможно, вы имели в виду" предложить правильный вариант при неправильно напечатанных запросах.
- Показ до двух результатов поиска с одного сайта (аля Google).
- Морфологический поиск для английского языка (поиск "run" находит "running", "runs" и т.д).
Управление
- Удобный веб-интерфейс администрации.
- Поддержка индексации через веб-интерфейс а так же из командной строки.
- Встроенная в веб-интерфейс статистика поиска.
- Простая система шаблона - облегчает работу, над объединением поиска с сайтом.
|
|