Indexed Artifacts (20.3M)

Popular Categories

Group: APDPlat

Sort: popular | newest

1. Word8 usages

org.apdplat » wordGPL

word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。
Last Release on Oct 6, 2015

2. Deep QA

org.apdplat » deep-qaGPL

deep-qa是一个Java实现的人机问答系统,能够自动分析问题并给出最佳答案。
Last Release on Sep 26, 2015

3. JSearch

org.apdplat » jsearchGPL

jsearch是一个高性能的全文检索工具包,基于倒排索引,基于java8,类似于lucene,但更轻量级。
Last Release on Nov 25, 2015

4. HTML Extractor

org.apdplat » html-extractorGPL

html-extractor是一个Java实现的基于模板的通用的网页结构化信息精准抽取组件。
Last Release on Apr 15, 2015