本书的编写源于五年前书同文公司向国家语委申请的古籍汉字信息处理攻关研究成果。该成果以ISO/IEC 10646 CJK标准与《康熙字典》字头建立一一对应作为字频统计的基础纲目,以《文渊阁四库全书》和《四部丛刊》全文数码数据作为统计对象(超过八亿古籍汉字语料),最终得出每个汉字的字频排序、出现次数、出现频率,同时也揭示了中文古籍汉字用字量、用字临界点等奥秘,使过去一直模糊不清的技术和应用参数得到明确的验证。 该书的成书发行将为海内外古籍出版业者、中文数字化工程、中文信息处理工作者提供强有力的帮助以及权威性的理论和实用性依据。
|