自然语言处理(NLP)是人工智能(AI)的重要应用领域,是继图像和语音处理技术(感知技术)突破之后的另一个令人期待的关涉认知技术的核心环节。本书以答问的形式,站在人工智能应用的角度,深入浅出地阐述符号规则学派对于自然语言结构深度解析的创新和实践;对计算语言学的历史进行回顾和批判,提出洞穿乔姆斯基层级体系的可行架构和机制;以中文信息处理为主题,揭示多层深度句法解析对于自然语言应用的革命性作用的原理和威力;针对困扰中文信息处理近半个世纪的三大迷思,指出分词并非中文专享的前处理,词性辨识不必先行,递归并非自然语言的本性;通过对这三大问题的解答,揭示多层中文分词与解析的关系,词类识别与句法角色的关系,离合词(如“洗澡”)带来的词典与句法的接口关系等,从而梳理通向中文深度解析之路的痛点及难点,以及这些语言处理技术的创新所展示的深度句法解析在大数据场景中已经显示出来的应用价值,勾画其广阔的应用前景。
|