置文本分析,提供基于 Web
的管理界面等。
Paoding
Paoding 中文分词是一个使用 Java 开发的,可结合到 Lucene 应用中的,为互联网、
企业内部网使用的中文搜索引擎分词组件。Paoding 填补了国内中文分词方面开源组件的
空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding 中文分词追
求分词的高效率和用户良好体验。
Carrot2
Carrot2 是一个开源搜索结果分类引擎。它能够自动把搜索结果组织成一些专题分类 。
Carrot2 提供的一个架构能够从各种搜索引擎(YahooAPI、GoogleAPI、MSN Search
API、eTools Meta Search、Alexa Web Search、PubMed、OpenSearch、Lucene
index、SOLR)获取搜索结果。