作品介绍

数字文献资源高维聚合模型研究

作者：牛奉高整理日期：2021-08-20 03:37:37

针对文本挖掘和信息检索中的文本或文献聚类与分类等问题，学术界基于VSM（向量空间模型）主要有两方面的研究，一者是文献表示模型的改进，二者是算法的改进。然而传统的算法对高维稀疏的向量聚类存在不足，一些新的算法也不尽完美，更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关，特别是在信息有限的情况下，聚类算法的优势也不能得到完美发挥，相比之下，信息的挖掘、提取和文献向量表示就尤为重要。在本文有且只有于元数据甚至只有关键词的前提下，文献的表示向量相比一般文本表示就表现得很好稀疏，面对这种情形聚类算法即使是“巧妇”也“难为无米之炊”，因此，本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的新表示方法。基于以上问题和现象，本书以数字文献资源为对象，本着在信息资源聚合中减少对背景知识的依赖，便于推广应用的宗旨，提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型（CLSVSM）。而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM（广义向量空间模型）显著地好。

→ 数字文献资源高维聚合模型研究下载地址 ←

上一本：跨层次组织公正的垂滴效应研究

下一本：企业突破性技术创新管理

作家文集

☆ 豆豆作品集	☆ 林清玄作品集	☆ 江河作品集
☆ 李碧华作品集	☆ 林海音作品集	☆ 马原作品集
☆ 高晓声作品集	☆ 蒋子龙作品集	☆ 刘绍棠作品集
☆ 周立波作品集	☆ 亦舒作品集	☆ 闫红作品集
☆ 祝勇作品集	☆ 周晓枫作品集	☆ 石一枫作品集
☆ 张广天作品集	☆ 蒋蓝作品集	☆ 李亚伟作品集
☆ 王小波作品集	☆ 木心作品集	☆ 鲁迅作品集
☆ 叶圣陶作品集	☆ 张爱玲作品集	☆ 沈从文作品集
☆ 老舍作品集	☆ 巴金作品集	☆ 曹禺作品集
☆ 钱钟书作品集	☆ 汪曾祺作品集	☆ 徐志摩作品集