自然语言处理

自然语言处理（Natural language processing）是通过一系列技术手段实现人类语言的计算机“理解”，涵盖数学、语言学和计算机人工智能等方向。

自然语言处理有很多资源，有兴趣可以上网搜索，海量的英文资源，希望能静下心来安静的读一读。对使用中文的爱好者来说，推荐我爱自然语言处理。

自然语言处理相关技术结合语义网技术以迭代的方式帮助“Info”建模，在“Ecos”层面理解。

“传统意义上，自然语言处理的研究人员都认为自然语言处理的研究开始于基于规则的方法，后来引入大规模语料库出现了基于统计的潮流，可以说近20年来，统计方法在自然语言处理中占据了统治地位，而且统计方法的性能越来越超出基于规则的方法。
但是，随着研究的深入，又有越来越多的研究人员意识到纯粹的统计方法是有瓶颈的。这个瓶颈的解决必须依靠基于规则的方法或者基于知识库的方法来进行解决。于是又开始出现了越来越多的所谓的统计和规则相结合的策略。不外乎有如下两种结合方式：过滤筛选、融入到统计中。前者是在统计方法的前处理阶段以及后处理阶段将很多不适合的样本进行剔除，从而保证最终结果的准确率。这种策略适当的牺牲了召回率，但是却大幅提高了精确率，总体看来，还是使得F值得到了提高。但是这种策略本质上没有完美而简练的体现规则和统计的深层结合。第二种融合方式就是将所谓的规则知识融入到统计过程中。本质上就是将知识信息转变未统计方法能够覆盖的“属性－值”形式的规范化数据。这种形式的早期引入确实产生了很好的效果，但是不久又出现了新的瓶颈。原因在于这种能被统计覆盖的“属性－值”表示方式使得知识没有被充分得使用。总之，现在再次出现了新的瓶颈。”
摘自自然语言处理百科

infoecos.com

Natural language as ecosystem

Leave a Reply Cancel reply