word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。
能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。
同时提供了Lucene、Solr、ElasticSearch插件。
| License | GPL 3.0 |
|---|---|
| Tags | word |
| HomePage | https://github.com/ysc/word 🔍 Inspect URL |
| Ranking | #27354 in MvnRepository (See Top Artifacts) |
| Used By | 17 artifacts |