电子书:《从零开始学Python网络爬虫》

[复制链接]
查看284 | 回复1 | 2019-12-21 16:27:00 | 显示全部楼层 |阅读模式

《从零开始学Python网络爬虫》_2

《从零开始学Python网络爬虫》_2

《从零开始学Python网络爬虫》_3

《从零开始学Python网络爬虫》_3


内容简介:

内容简介
Python是数据分析的首选语言,而网络中的
数据和信息很多,如何从中获取需要的数据和信息
呢?最简单、直接的方法就是用爬虫技术来解决
本书是一本教初学者学习如何爬取网络数据
和信息的入门读物。书中不仅有Pyon的相关内
容,而且还有数据处理和数据挖掘等方面的内容
本书内容非常实用,讲解时穿插了22个爬虫实战
案例,可以大大提高读者的实际动手能力
本书共分12章,核心主题包括 Python零基
出语法入门、爬虫原理和网 页构造、第一个爬虫
程序、正则表达式、Lxm库与×path语法、使用
APl、数据库存储、多_进.程_爬虫、异步加载、表单
交互与模拟登.录、 Selenium模拟浏览器、Scra
爬虫框架。此外,书中通过一些典型爬虫案例,讲
解了有经纬信息的地图图表和词云的制作方法,让
读者体验数据背后的乐趣
本书适合爬虫技术初学者、爱好者及高等院
校的相关学生,也适合数据爬虫工程师作为参考读
物,同时也适合各大 Python数据分析的培训机构
作为教材使用

从开始学
Python网络爬虫
罗攀蒋仟◎编著
Q想模玩出盐

图书在版编目(CⅠP)数据
从零开始学 Python网络爬虫/罗攀,蒋仟编著.一北京:机械工业出版社,2017.9(2018.3重印)
ISBN978-7-111-57999-1
.从…Ⅱ.①罗…②蒋…Ⅲ.软件工具一程序设计Ⅳ.TP311.561
中guo版本图书馆CP数据核字(2017)第224283号
明ror
从零开始学 Python网络爬虫
出版发行:机械工业出版社
西城区百万庄大断22号邮政编码:
任编辑:欧振旭李华君
责任校对:姚志娟
印刷:中guo电影出版社印刷厂
版次:2018年3月第1版第3次印刷
开本:186mmx240mm1/16
印张:17.25
书号:ISBN978-7-111-57999-1
定价:59.00元
凡胸本书,如有缺页,倒页、睨页,由本社发行部调换
各服热线010)8837942688361066
投稿热线010)88379604
版权所有
(010)683262948837964968995259读者信箱:hait@ ebook com
侵权必究
本书法律顾间:北京大成律师事务所韩光东

前言
随着 Internet的飞速发展,互联网中每天都会产生大量的非结构化数据。如何从这些
非结构化数据中提取有效信息,供人们在学习和工作中使用呢?这个问题促使网络爬虫技
术应运而生,由于 Python语言简单易用,而且还提供了优秀易用的第三方库和多样的爬
虫框架,所以使得它成为了网络爬虫技术的主力军。近年来,大数据技术发展迅速,数据
爬取作为数据分析的一环也显得尤为重要。程序员要进入与数据处理、分析和挖掘等相关
的行业,就必须要掌握 Python语言及其网络爬虫的运用,这样才能在就业严峻的市场环
境中有较强的职场竞争力和较好的职业前景
目前,图书市场上仅有的几本 Python网络爬虫类图书,要么是guo外优秀图书,但书
籍翻译隐晦,阅读难度大,而且往往由于网络原因,使得书中的案例不能正常使用,因此
不适合初学者:要么是guo内资料,但质量参差不齐,而且不成系统,同样不适合初学者
整个图书市场上还鲜见一本适合初学者阅读的 Python网络爬虫类图书。本书便是基于这
个原因而编写。本书从 Python语言基础讲起,然后深入浅出地介绍了爬虫原理、各种爬
虫技术及22个爬虫实战案例。本书全部选用guo内网站作为爬虫案例,便于读者理解和实
现,同时也可以大大提高读者对 Python网络爬虫项目的实战能力。
本书特色
1.涵盖 Windows7系统第三方库的安装与配置
本书包含 Python模块源的配置、第三方库的安装和使用,以及 PyCharm的安装和
使用
2.对网络爬虫技术进行了原理性的分析
本书从一开始便对网络连接和爬虫原理做了基本介绍,并对网络爬虫的基本流程做了
详细讲解,便于读者理解本书后面章节中的爬虫项目案例

3.内容全面,应用性强
本书介绍了从单线程到多_进.程_,从同步加载到异步加载,从简单爬虫到框架爬虫等一
系列爬虫技术,具有超强的实用性,读者可以随时查阅和参考
4.项目案例典型,实战性强,有较高的应用价值
本书介绍了22个爬虫项目实战案例。这些案例来源于不同的网站页面,具有很高的
应用价值。而且这些案例分别使用了不同的爬虫技术实现,便于读者融会贯通地理解书中
介绍的技术
本书内容
第1章 Python零基础语法入门
本章介绍了 Python和 Py Charm的安装及 Python最为简单的语法基础,包括简单的流
程控制、数据结构、文件操作和面向对象的编程思想
第2章爬虫原理和网 页构造
本章通过介绍网络连接原理,进而介绍了爬虫的原理,讲解了爬虫的基本流程,另外
还介绍了如何使用 Chrome浏览器认识网 页构造和查询网 页信息
第3章我的第一个爬虫程序
本章主要介绍了安装请求和解析网 页的 Python第三方库、 Requests库和 BeautifulSoup
库的使用方法,最后通过综合案例手把手教会读者编写一个简单的爬虫程序

4章正则表达式
本章主要介绍了正则表达式的常用符号及 Python中re模块的使用方法,在不需要解
库的情况下完成一个简单的爬虫程序
第5章Lxm库与 Xpath语法
本章主要介绍了Lxm库在Mac和 Linux环境中的安装方法、Lxm库的使用方法及
ath语法知识,并且通过案例对正则表达式、 BeautifulSoup和Lxm进行了性能对比
最后通过综合案例巩固 Xpath语言的相关知识
第6章使用AP
本章主要介绍了API的使用和调用方法,对API返回的JSON数据进行解析,最后通
过使用API完成一些有趣的综合案例
第7章数据库存储
本章主要介绍了非关系型数据库 Mongodb和关系型数据库 MySQL的相关知识,并
通过综合案例展示了 Python对两种数据库的存储方法
第8章多_进.程_爬虫
本章主要介绍了多线程及其概念,并通过案例对串行爬虫和多_进.程_爬虫的性能进行了


#############################################


回复

使用道具 举报

你和我时光 | 2019-12-21 16:27:04 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则