论野生技术&二次元

Sphinx 2.2.11和2.3.2的mmseg分词补丁(基于Coreseek)

English Version

补丁包括了nzinfo在coreseek中贡献的mmseg补丁,以及我提交的日语假名补丁(详见这篇博客)。详细更改见这里

打上补丁之后,可以使用mmseg来做分词器。如果是对大篇幅的文章做索引,推荐使用mmseg处理结巴分词的词库来生成一个比较靠谱的词库。

Sphinx 2.11.1:Github下载 本地下载

Sphinx 2.3.2:Github下载 本地下载

编译

从 这个项目 编译mmseg

编译Sphinx/Coreseek

 

退出移动版