作品介绍

Python网络爬虫从入门到实践

作者：唐松整理日期：2021-11-18 16:47:39

使用Python编写网络爬虫程序获取互联网上的大数据是当前的热门专题。本书内容包括三部分：基础部分、进阶部分和项目实践部分。基础部分（~7章）主要介绍爬虫的三个步骤——获取网页、解析网页和存储数据，通过诸多示例的讲解，让读者从基础内容开始系统性地学习爬虫技术，并在实践中提升Python爬虫水平。进阶部分（第8~13章）包括多线程的并发和并行爬虫、分布式爬虫、更换IP等，帮助读者进一步提升爬虫水平。项目实践部分（4~17章）使用本书介绍的爬虫技术对几个真实的网站进行抓取，让读者能在读完本书后根据自己的需求写出爬虫程序。无论你是否有编程基础，只要对爬虫技术感兴趣，本书就能带领你从入门到实战再到进阶，一步步了解爬虫，很终写出自己的爬虫程序。唐松，2010年获全额奖学金人读香港中文大学商学院，之后获得康奈尔大学信息科学硕士学位。曾与IBM合作大数据A100计划，为多个世界500强公司提供数据挖掘服务，并将网络爬虫的经验应用到这些项目中。2018年以技术大咖入职腾讯公司，现任腾讯数据服务中心数据分析师，分析腾讯的海量数据。曾经在香港中文大学、香港中文大学（深圳）、西南交通大学、东华大学多家高校进行过网络爬虫教学，获得许多教授、博士生、研究生的一致好评。

→ Python网络爬虫从入门到实践下载地址 ←

上一本：计算思维之快乐编程

下一本：英语被动结构习得顺序研究

作家文集

☆ 豆豆作品集	☆ 林清玄作品集	☆ 江河作品集
☆ 李碧华作品集	☆ 林海音作品集	☆ 马原作品集
☆ 高晓声作品集	☆ 蒋子龙作品集	☆ 刘绍棠作品集
☆ 周立波作品集	☆ 亦舒作品集	☆ 闫红作品集
☆ 祝勇作品集	☆ 周晓枫作品集	☆ 石一枫作品集
☆ 张广天作品集	☆ 蒋蓝作品集	☆ 李亚伟作品集
☆ 王小波作品集	☆ 木心作品集	☆ 鲁迅作品集
☆ 叶圣陶作品集	☆ 张爱玲作品集	☆ 沈从文作品集
☆ 老舍作品集	☆ 巴金作品集	☆ 曹禺作品集
☆ 钱钟书作品集	☆ 汪曾祺作品集	☆ 徐志摩作品集