本书是一本数据科学的入门书籍。每个知识点尽量从实际的应用案例出发,从数据出发,以问题为导向,在解决问题中学习数据挖掘、机器学习等数据科学相关方法。本书将数据读写、数据清洗和预处理作为开端,逐渐深入到和数据科学相关的决策树、支持向量机、神经网络、无监督学习等知识。此外,结合数据科学的实际应用,书中还讲解了推荐算法、文本挖掘和社交网络分析等热门实用技术。本书在写作过程中尽量删去太过抽样的理论,让具有一定高等数学和概率论基础的读者就能看得懂。当然,如果读者对方法原理确实不感兴趣,只是为了用R程序实现某种方法,可以跳过方法只看案例和程序。本书适合作为高校数据科学、机器学习、数据挖掘、大数据分析等相关专业的研究生和高年级本科的教科书,也适合作为相关企业的数据科学家、数据挖掘工程师、数据分析师及数据科学的爱好者等的工具书。方匡南,现为厦门大学经济学院统计系教授、博士生导师,耶鲁大学博士后,厦门大学数据挖掘研究中心副主任,靠前统计学会会士,全国工业统计学会理事、厦门统计学会常务理事。主要研究方向为数据挖掘、机器学习、应用统计。曾先后在国外非常不错期刊发表论文七十多篇,主持了国家自然科学基金等项目二十多项。多年从事大数据及相关领域研究与教学,著有《R数据分析》等多部相关作品。
|