电子书:《用Python写网络爬虫》

[复制链接]
查看402 | 回复1 | 2019-12-31 09:57:58 | 显示全部楼层 |阅读模式

《用Python写网络爬虫》_1

《用Python写网络爬虫》_1

《用Python写网络爬虫》_2

《用Python写网络爬虫》_2

《用Python写网络爬虫》_3

《用Python写网络爬虫》_3


内容简介:

用 Python
写网络爬虫
澳] Richard Lawson著
李斌译
人民邮电出版社

图书在版编目(CIP)数据
用 Python写网络爬虫/(澳大利亚)理查德·劳森
( Richard Lawson)著;李斌译
民邮电出
版社,2016.9(2016.11重印)
SBN978-7-115-431790
1.①用…Ⅱ.①理…②李…Ⅲ.①软件工具一程
设计Ⅳ
中guo版本图书馆CIP数据核字(2016)第177976号
版权声明
Copyright c 2015 Packt Publishing. First published in the English language under the title Web Scraping with Python.
All Rights Reserved
本书由英guo Packt Publishing公司授权人民邮电出版社出版。未经出版者书面许可,对本书的任何部分不
得以任何方式或任何手段复制和传播
版权所有,侵权必究
[澳] Richard lawson

李斌
责任印制焦志炜
◆人民邮电出版社出版发行北京市丰台区成寿寺路11号
邮编100164电子邮件
网址htp:/www.ppress.com.cn
河市海波印务有限公司印刷
◆开本:800×1000116
张:
字数:148千字
2016年9月第1版
印数:7001-11000册
2016年11月河北第4次印刷
著作权合同登记号图字:01-20163962号
定价:4500元
读者服务热线010)81055410印装质量热线010)81055316
反盗版热线010)8105531

内容提要
本书讲解了如何使用 Python来编写网络爬虫程序,内容包括网络爬虫简
介,从页面中抓取数据的三种方法,提取缓存中的数据,使用多个线程和进
程来进行并发抓取,如何抓取动态页面中的内容,与表单进行交互,处理页
面中的验证码问题,以及使用 Scary和 Portia来进行数据抓取,并在最后使
用本书介绍的数据抓取技术对几个真实的网站进行了抓取,旨在帮助读者活
学活用书中介绍的技术
本书适合有一定 Python编程经验,而且对爬虫技术感兴趣的读者阅读

关于作者
Richard Lawson来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕
业后,他创办了一家专注于网络爬虫的公司,为超过50个guo家的业务提供远
程工作。他精通于世界语,可以使用汉语和韩语对话,并且积极投身于开源
软件。他目前在牛津大学攻读研究生学位,并利用业余时间研发自主无人机
我要感谢 Timothy Baldwin教授将我
令人兴奋的领域,以及
本书编写时在巴黎招待我的 Tharavy Douc

关于审稿人
Martin Burch是一名常驻纽约的数据记者,其工作是为华尔街ri报绘制
交互式图表。他在新墨西哥州立大学获得了新闻学和信息系统专业的学士学
位,然后在纽约城市大学新闻学研究院获得了新闻学专业硕士学位
我要感谢我的妻子Lisa鼓励我协助本书的创作,我的叔叔 Michael
耐心解答我的编程问题,以及我的父亲 Richard激发了我对新闻学和写
作的热爱。
william Sankey是一位数据专业人士,也是一位业余开发人员,生活在马
里兰州科利奇帕克市。他于2012年毕业于约翰·霍普金斯大学,获得了公共
政策硕士学位,专业方向为定量分析。他目前在L&M政策研究有限责任公司
担任健康服务研究员,从事与美guo医疗保险和医疗补助服务中心(CMS)相
关的项目。这些项目包括责任医疗机构评估以及精神病院住院患者预付费系
统监测
我要感谢我深爱的妻子Juia和顽皮的小貓Ruby,给予我全部的爱和



回复

使用道具 举报

几乎不开 | 2019-12-31 09:58:02 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则