“Nlp tool”版本间的差异
来自cslt Wiki
第1行: | 第1行: | ||
− | + | * Text Analysis Online[http://textanalysisonline.com/] | |
− | + | :*提供了一个在线的测试环境。目前提供NLTK(内含斯坦福NLP),TextBlob, MBSP, Pattern, PyTeaser, LangId和中文分词等多种工具 | |
− | + | * LTP 哈工大开源处理工具[https://github.com/HIT-SCIR/ltp][http://www.ltp-cloud.com/] | |
− | + | :* c/c++编写 | |
− | :* openNLP[http://opennlp.apache.org/] | + | * openNLP[http://opennlp.apache.org/] |
− | + | :* 标记化、句子分割、词性标注、固有实体提取(指在句子中辨认出专有名词,例如:人名)、浅层分析(句字分块)、语法分析及指代 | |
− | + | * FudanNLP[https://code.google.com/p/fudannlp/][https://github.com/xpqiu/fnlp/] | |
− | :* stanford nlp[http://nlp.stanford.edu/software/index.shtml] | + | :* 最近有更新,采用java |
− | :* NLTK[http://www.nltk.org/] | + | * stanford nlp[http://nlp.stanford.edu/software/index.shtml] |
+ | :* 部分功能支持中文,可以自己训练 | ||
+ | * NLTK[http://www.nltk.org/] | ||
+ | :* 可以用作学习,python | ||
+ | * ICTCLAS [http://ictclas.nlpir.org/] | ||
+ | :*中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取 |
2014年12月16日 (二) 06:00的版本
- Text Analysis Online[1]
- 提供了一个在线的测试环境。目前提供NLTK(内含斯坦福NLP),TextBlob, MBSP, Pattern, PyTeaser, LangId和中文分词等多种工具
- c/c++编写
- openNLP[4]
- 标记化、句子分割、词性标注、固有实体提取(指在句子中辨认出专有名词,例如:人名)、浅层分析(句字分块)、语法分析及指代
- 最近有更新,采用java
- stanford nlp[7]
- 部分功能支持中文,可以自己训练
- NLTK[8]
- 可以用作学习,python
- ICTCLAS [9]
- 中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取