搜狗词库转换为txt文件
在solr分词的时候需要一些词库,在搜狗细胞词库可以下载到.scel
的词库.但是需要转成成我所需要的.在网络找到一份python
的处理代码.可以将词库提取出来.稍微修改了一下main
里读取目录文件的部分和输出格式.就得到了我所需要的词库文件.代码如下:
在solr分词的时候需要一些词库,在搜狗细胞词库可以下载到.scel
的词库.但是需要转成成我所需要的.在网络找到一份python
的处理代码.可以将词库提取出来.稍微修改了一下main
里读取目录文件的部分和输出格式.就得到了我所需要的词库文件.代码如下: