Как это работает
Поисковая система Серверный Следопыт является так называемой индексирующей системой. Это означает, что прежде чем производить поиск документов, система производит накопление информации о положении всех слов на всех страницах Web-узла. Эта информация сохраняется внутри специализированной компактной базы данных, обеспечивающей в дальнейшем быстрое обнаружение требуемых документов.
Поисковая система выполнена по клиент-серверной технологии. Это означает, что функции индексирования, поиска и отображения информации распределены между различными компонентами системы. Такой подход позволяет при необходимости эффективно распределить нагрузку между различными компьютерами и, тем самым, повысить производительность системы в целом.
Для обмена между компонентами Серверного Следопыта используется стандартный протокол Internet TCP/IP, а для взаимодействия между поисковыми клиентами и Web-сервером протокол CGI/1.1. Это позволяет Следопыту работать с большинством количеством Web-серверов, работающих на платформе Windows/Intel.
Таким образом, Серверный Следопыт представляет собой мощную поисковую систему, позволяющую значительно упростить работу с информацией на web-узле.
MegaXS CD Searcher представляет собой комплекс программных модулей, предназначенных для индексного поиска по неизменяемым текстовым базам, таким как текстовые базы на CD-ROM.
Система состоит из двух частей: авторского и пользовательского комплектов. С помощью авторского комплекта издатель готовит мастер-диск, при этом авторский комплект не редистрибутируется конечному пользователю.
Пользовательский комплект содержит только модули, необходимые для осуществления поиска по готовой индексной базе. Этот комплект свободно распространяется с издаваемой текстовой базой и не требует сложной установки.
Какие преимущества предоставляет система MegaXS CD Searcher издателю?
Используя MegaXS CD Searcher в качестве программного пакета для подготовки и обеспечения доступа к текстовым базам, издатель может полностью сосредоточиться на содержательной части своего электронного издания: удобный инструментарий быстро обработает необходимый объем информации и останется только записать мастер-диск. В зависимости от размера планируемых тиражей и числа продуктов выбирается оптимальная для заказчика схема лицензионных отчислений, что позволяет издателю не замораживать оборотные средства.
Для работы комплекса не требуется никаких расширений Windows, за исключением Web-браузера, и все взаимодействие между пользователем и поисковым механизмом будет осуществляться с помощью стандартного интерфейса HTML -форм.
Как и все остальные поисковые продукты компании МедиаЛингва, MegaXS CD Searcher предоставляет пользователю возможность естественно-языкового полнотекстового поиска, сортирует найденные документы по смысловой близости к поисковому запросу так, что нужные документы оказываются к верхней части списка, сопровождает каждый документ краткой связной аннотацией и подсвечивает в тексте документа слова поискового запроса.
Основой системы автоматической классификации является система рубрик, представляющая собой базу данных, содержащую информацию о дереве рубрик и их индивидуальных признаках. Пользуясь этой базой, система автоматической классификации сравнивает каждый поступивший документ с семантическими образами рубрик и помещает его в соответствующие разделы. Пользователь имеет возможность не только просматривать дерево рубрик и содержащиеся в рубриках документы, но и выбирать из имеющегося списка наиболее интересные разделы. Эти данные заносятся в персональный профиль базы данных клиентов, и пользователь начинает получать сообщения о поступлении информации строго отвечающей его требованиям. Таким образом, пользователь избавляется от необходимости просматривать весь поток новостей.
Перечислим основные преимущества использования системы автоматической классификации:
Поставщики новостей будут уверены, что их информации не затеряется в потоке аналогичных сообщений и поступит к потребителю вовремя. Это позволит им увеличить число сообщений, не опасаясь, что информационные агентства проигнорируют их новость.
Для информационных агентств использование системы классификации и доставки новостей снизит затраты на обработку информации, позволит увеличить пропускную способность информационного канала и даст возможности предоставления дополнительных сервисов клиентам: например, создание персональных рубрик (не содержащихся в рубрикаторе) для потребителей эксклюзивной информации.
Клиенты системы получают возможность быстро и точно получать необходимую информацию, формировать персональный профиль в соответствии со своими специфическими требованиями и задачами
В процессе работы аннотатор вычисляет критерии значимости и семантической независимости для предложений входного текста на основе специальных вероятностных моделей и словарей, и по входному тексту составляет аннотацию заданного размера из наиболее значимых предложений. На выходе исходные предложения несколько переформулируются для придания аннотации большей связности.