准备写句子情感要素抽取,项目暂定了用python写,可NLPIR(ICTCLAS)分词系统并没有提供python接口。
最终从http://ictclas.nlpir.org/newsDetail?DocId=382 这个连接中找到了解决方法,可是这个里面还是存在一些问题,下面我就按我做成功的进行分享吧。

首先,环境是在win7 64位机器。
需要软件包:
1、python 32位安装包。去python官网上下载。
2、NLPIR(ICTCLAS)分词系统。 下载主页连接http://ictclas.nlpir.org/downloads,我下载的是 “ NLPIR汉语分词系统(又名ICTCLAS2013版)下载包(u1115)”,下载后文件名为20131115123549_nlpir_ictclas2013_u20131115_release.zip

第一步,安装python_32,过
第二步,解压NLPIR(ICTCLAS)压缩包,新建文件夹取名NLPIR_PYTHON,并取出NLPIR.dll和Data文件夹,放到新文件夹中。
第三步,在同级目录下创建NLPIR.py文件

这时NLPIR_PYTHON文件结构为:
|-NLPIR.dll
|-DATA-|***
|-NLPIR.py

NLPIR.py代码(修改后)如下:

运行,我这显示结果为:
我/rr 爱/v 我/rr 的/ude1 祖国/n 亲爱/a 的/ude1 祖国/n !/wt

成功后,下面就是看NLPIR(ICTCLAS)分词系统的具体使用啦··

下一步准备先了解分词系统,等熟悉后把其封装到python类中,最后当个模块来使用·

更新 2013.12.17

在运行的时候可能会出现一个后缀为.err 的文件夹,内容是:

[2013-12-17 17:56:40] Cannot open file
[2013-12-17 17:56:40] E:\python_workspace_32\Data\KeyBlackList.pdat

大概原因是找不到黑名单列表的文件,在Data文件夹中创建一个KeyBlackList.pdat的空文件即可