《Python爬虫技术：深入理解原理、技术与开发》[28M]百度网盘|亲测有效|pdf下载

产品特色

编辑推荐

JetBrains大中华区市场部经理赵磊作序！超过300个实战案例，10万行源代码（关注作者公众号下载，下载说明见书中第1章首页），22个综合实战项目，海量学习资料，1000套中英文简历模板。全书内容涵盖：
李宁 “私房菜谱”
 Python爬虫基础知识
 Python网络库
 Python解析库
 Python数据存储
 Python异步数据抓取
 Python移动App数据抓取
 Python可见即可爬
 Python Scrapy实战
 Python项目实战
李宁“实战项目”
 抓取小说目录与正文
 抓取豆瓣网图书榜单
 抓取房屋租赁信息
 抓取豆瓣网音乐排行榜
 抓取百度网站图片搜索中的图片
 抓取QQ空间说说
 可视化爬虫抓取和分析网店图书评论

内容简介

　　《Python爬虫技术：深入理解原理、技术与开发》从实战角度系统讲解Python爬虫的核心知识点，并通过大量的真实项目让读者熟练掌握Python爬虫技术。Python爬虫技术：深入理解原理、技术与开发》用20多个实战案例，完美演绎了使用各种技术编写Python爬虫的方式，读者可以任意组合这些技术，完成非常复杂的爬虫应用。《Python爬虫技术：深入理解原理、技术与开发》共20章，分为5篇。第1篇基础知识（第1、2章），主要包括Python运行环境的搭建、HTTP基础、网页基础（HTML、CSS、JavaScript等）、爬虫的基本原理、Session与Cookie。第2篇网络库（第3～6章），主要包括网络库urllib、urllib3、requests和Twisted的核心使用方法，如发送HTTP请求、处理超时、设置HTTP请求头、搭建和使用代理、解析链接、Robots协议等。第3篇解析库（第7～10章），主要包括3个常用解析库（lxml、BeautifulSoup和pyquery）的使用方法，同时介绍多种用于分析HTML代码的技术，如正则表达式、XPath、CSS选择器、方法选择器等。第4篇数据存储（第11、12章），主要包括Python中数据存储的解决方案，如文件存储和数据库存储，其中数据库存储包括多种数据库，如本地数据库SQLite、网络数据库MySQL以及文档数据库MongoDB。第5篇爬虫高级应用（第13～20章），主要包括Python爬虫的一些高级技术，如抓取异步数据、Selenium、Splash、抓取移动App数据、Appium、多线程爬虫、爬虫框架Scrapy，最后给出一个综合的实战案例，综合了Python爬虫、数据存储、PyQt5、多线程、数据可视化、Web等多种技术实现一个可视化爬虫。
　　《Python爬虫技术：深入理解原理、技术与开发》可以作为广大计算机软件技术开发者、互联网技术研究人员学习“爬虫技术”的参考用书。也可以作为高等院校计算机科学与技术、软件工程、人工智能等专业的教学参考用书。

作者简介

李宁：欧瑞科技创始人/CEO，宁哥教育创始人，东北大学计算机专业硕士。曾任国内某大型软件公司项目经理、宁哥教育教学总监、腾讯课堂特约讲师、51CTO学院讲师、CSDN特级讲师。从事软件研究和开发超过15年，一直从事Python、人工智能、区块链、JavaScript、Node.js、Java以及跨平台技术的研究和技术指导工作，对国内外相关领域的技术、理论和实践有很深的理解和研究。

内页插图

精彩书评

　　★《Python爬虫技术——深入理解原理、技术与开发》一书诠释了Python爬虫的核心开发技术。不管是“菜鸟”还是“高手”，都可从本书受益。更难能可贵的是，本书提供了大量的实战案例，通过各种爬虫技术抓取的不同种类的信息和实战，读者可以更好地掌握爬虫应用的编写过程。
　　——金晓颖触控科技有限公司副总裁
　　
　　★李宁是51CTO学院讲师、51CTO学院专家级博主，在IT技术领域有很深的造诣。他授课风趣幽默，讲解条理清晰、通俗易懂，对如何学习编程技术有独到见解。他在51CTO学院已开设了160多门视频课程，学员达170多万人，视频课程广受好评。一个如此受欢迎的老师，他编写的图书也非常值得阅读。更重要的是，本书配套提供了大量的实战项目、源代码、练习题，能方便读者快速实践，所以强烈推荐此书！
　　——曹亚莉51GTO学院教学总监
　　
　　★看到李宁老师的30多本图书和160多门视频课程，我不禁惊叹于他如此强大的能力、精力和毅力。在51CTO学院，李宁老师的听课人数达到170多万。他编写的图书更是紧跟IT技术发展潮流，这本《Python爬虫技术——深入理解原理、技术与开发》也是顺应时代发展的大作。全书内容涵盖了基础知识、高级编程、理论知识与典型应用，是学习Python编程的优秀教材。
　　——韩立刚51CTO学院讲师
　　
　　★《Python爬虫技术——深入理解原理、技术与开发》一书体现了李宁老师一贯的个人教学风格。书中知识全面，案例丰富，是Python初学者难得的入门好书！推荐阅读！
　　——谢星曼（网名阿蜜果）软通动力资深架构师
　　
　　★李宁老师工作勤奋，技术精湛。他录制了大量优秀的IT视频课程，Python视频课程是其中的代表作。Python是目前受欢迎的编程语言，而Python爬虫是Python应用*火的领域。毫无疑问，《Python爬虫技术——深入理解原理、技术与开发》是一本好的Python爬虫实践指南。
　　——朱有鹏朱老师物联网大讲堂创始人
　　
　　★《Python爬虫技术——深入理解原理、技术与开发》是一本经典的Python爬虫高级教程，本书层次鲜明，结构严谨，内容翔实，可以带领读者快速掌握Python爬虫的核心知识，帮助读者编写解决实际问题的代码并开发复杂项目。
　　——江清清嘎嘎软件科技公司总经理

前言/序言

　　Python现在非常火爆。但Python就和英语一样，如果只会Python语言，就相当于只能用英语进行日常会话。然而，真正的英语高手是可以作为专业领域翻译的，如IT、金融、数学等专业领域。Python也是一样，光学习Python语言是不行的，要想找到更好的工作，或得到更高的薪水，需要学会用Python做某一领域的应用。
　　现在Python应用的热门领域比较广，例如人工智能，不过人工智能不光涉及Python语言本身的技术，还涉及数学领域的知识，虽然比较火爆，但绝对不是短时间可以掌握的。然后有一个领域与人工智能的火爆程度相当，但不像人工智能那样难入门，这就是爬虫领域。
　　为什么爬虫领域如此火爆呢？其实爬虫的基本功能就是从网上下载各种类型的数据（如HTML、图像文件等）。但不要小瞧这些下载的数据，因为这些数据将成为很多应用的数据源。例如，著名的Google搜索引擎，每天都会有数以亿计的查询请求，而搜索引擎为这些请求返回的数据，都是来源于强大的爬虫。编写搜索引擎的第一步就是通过爬虫抓取整个互联网的数据，然后将这些数据库保存到本地（以特定的数据格式），接下来就是对这些数据进行分析整理。然后才可以通过搜索引擎进行查询。虽然搜索引擎的实现技术非常多，也非常复杂，但爬虫是1，其他的所有技术都是0，如果没有爬虫搜集数据，再强大的分析程序也毫无用武之地。
　　除了搜索引擎外，人工智能中的重要分支深度学习也需要爬虫抓取的数据来训练模型。例如，要想训练一个识别金字塔的深度学习模型，就需要大量与金字塔相关的图片进行训练。最简单的方式，就是使用百度或谷歌搜索金字塔图片，然后用爬虫抓取这些图片到本地。这是利用了搜索引擎通过关键字分类的特性，并且重新利用了这些分类的图片。
　　通过这些例子可以了解到，学习爬虫是进入其他更高端领域的钥匙，所以学习Python爬虫将成为第一个需要选择的热门领域。
　　尽管爬虫的基本功能是下载文件，但一个复杂的爬虫应用，可不光涉及网络技术。将数据下载后，还需要对数据进行分析，提取需要的信息，以及进行数据可视化，甚至需要一个基于UI的可视化爬虫。所以与爬虫有关的技术还是很多的。
　　由于Pythonp爬虫涉及的技术很多，学习资料过于分散。所以，笔者觉得很有必要编写一本全面介绍Python爬虫实战类的书籍，在书中分享笔者对Python爬虫以及相关技术的理解和经验，帮助同行和感兴趣的朋友快速入门，并利用Python语言编写各种复杂的爬虫应用。笔者希望本书能起到抛砖引玉的作用，使读者对Python爬虫以及相关技术产生浓厚的兴趣，并能成功进入Python爬虫领域。加油！高薪的工作在等着你们！

李宁

查看全部↓