English Version

补丁包括了nzinfo在coreseek中贡献的mmseg补丁,以及我提交的日语假名补丁(详见这篇博客)。详细更改见这里

打上补丁之后,可以使用mmseg来做分词器。如果是对大篇幅的文章做索引,推荐使用mmseg处理结巴分词的词库来生成一个比较靠谱的词库。

Sphinx 2.11.1:Github下载 本地下载

Sphinx 2.3.2:Github下载 本地下载

编译

从 这个项目 编译mmseg

编译Sphinx/Coreseek

 

This patches include work from nzinfo (add mmseg support) and my patch for Hiragana and Katagana support (see this blog post). The changes can be viewed here.

For Sphinx 2.11.1:Github dl.yooooo.us

For Sphinx 2.3.2:Github dl.yooooo.us

Compile

Build mmseg from this repo

Build Sphinx/Coreseek: