本研究运用了内容分析法、控制实验法、比较研究法、定义法、数理统计法等具体研究方法,从群体认知经验的重要载体——大规模语料入手,采用程序化、可操作化的定量分析及自然语言处理手段,力求使基层词的研究达到精细化、客观化和准确化的水平。在该词库的建设过程中,首先对性质状态类词汇在认知范畴中的层级关系加以研究,在对义类范畴和概念层级进行合理划分的基础上,立足大规模文本语料库和对“保证词频”、“相对词频”概念的区分,通过相对词频定位法成功定位性质状态类准基层词,进而通过人工验证,提取出基层词。在对性质状态类基层词的分级中,也不再拘泥于前人所关注的“保证词频”,而是从基层词的“语用承载量”、“逆文本频率指数”、“单词频-语用承载量指数”三个维度进行研究,以保证分级结果合理兼顾基层词的“常用度”、“通用度”和“自由度”,从而建立起符合汉语学习者认知特点又层级分明的性质状态类基层词词库,以供靠前汉语教学教材编写、课堂教学、成绩测试、工具书编纂等借鉴使用。此外,本研究还对性质状态类基层词汇的特征进行了考察,考察内容主要包括基本词长与结构类型、自信息量与熵、语用搭配、习得顺序、词汇源流。文章很后对研究做了总结,并对性质状态类基层词库在靠前汉语教学中的应用做了展望。
|