《先秦汉语常用词研究》根据词彙统计学的相关原理,借鉴现代汉语词频统计的成功经验,对先秦时期成书年代可靠的9部传世文献和部分具有代表性的出土文献的用词情况进行了全面的整理和统计,得到了先秦时期四个阶段、五部分语料的词彙总表。四个阶段是:西周早期至西周中期、西周中期至春秋末期、春秋末期至战国中期、战国中期至秦代。五部分语料为:(1)西周早中期的231条金文;(2)《诗经》(部分)、《周易》本经、今文《尚书》(部分);(3)《诗经》(部分)、《春秋经》;(4)《论语》、《商君书》、《左氏传》;(5)《孟子》、《庄子》、《吕氏春秋》。每个词彙总表均由序号、词目、频次、频率和覆盖率五部分组成,且按词频高低排列,其中覆盖率和词的使用频次是确定各个时期常用词的重要标准。先秦时期各阶段的常用词数量有多有少,其数量多少与文本量大小有密切关系。从总体上看,各个阶段常用词的数量是大体固定的,常用词爲了保持数量上的这种平衡性,每个阶段每当有新的常用词产生时,就会有旧的常用词被挤掉。常用词发展的这种模式,表现在数量上是滚动式的,表现在内容上是更替式的。
|