本书以多语言文本为研究对象,进行基于多语言文本的文本挖掘,涉及任务主要分为三块内容,多语言文本的采集,其中包括了平行语料和可比语料,对多语言语料的评估以及多语言文本的聚类。其中,多语言文本的聚类研究中,针对多语言文本的关键词抽取、平行语料和可比语料的文本聚类进行了相关实验。任务中主要针对中英文语料进行相关挖掘,实验中使用的研究方法具有普适性,可以运用到其他语种的文本挖掘中。 章成志,南京理工大学教授、博士生导师。目前为中国中文信息学会社会媒体处理专业委员会常委、中国科学技术情报学会知识组织专业委员会委员、中国中文信息学会信息检索专业委员会委员、中国索引学会理事,担任The Electronic Library、Journal of Natural Language Engineering、Frontiers in Research Metrics and Analytics、Information Discovery and Delivery、Data Intelligence、《情报工程》、《文献与数据学报》等期刊编委或客座编辑,已出版专著4部、发表论文100余篇,曾获Emerald“高度赞扬论文奖”,主持省部级以上科研项目6项,曾获中国科学技术情报学会“青年情报科学家奖”。曾获江苏省哲学社会科学优秀成果奖2项、江苏省高等学校哲学社会科学研究优秀成果奖1项,指导学生获得江苏省优秀硕士学位论文奖3次。
|