书籍详情
《精通Scrapy网络爬虫》[46M]百度网盘|亲测有效|pdf下载
  • 精通Scrapy网络爬虫

  • 出版社:木垛图书旗舰店
  • 出版时间:2017-10
  • 热度:7363
  • 上架时间:2024-06-30 09:07:09
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

基本信息

  • 商品名称:精通Scrapy网络爬虫
  • 作者:编者:刘硕
  • 定价:59
  • 出版社:清华大学
  • ISBN号:9787302484936

其他参考信息(以实物为准)

  • 出版时间:2017-10-01
  • 印刷时间:2017-10-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:224
  • 字数:325千字

内容提要

。。。

作者简介

。。。

目录

第1章 初识Scrapy
1.1 网络爬虫是什么
1.2 Scrapy简介及安装
1.3 编写**个Scrapy爬虫
1.3.1 项目需求
1.3.2 创建项目
1.3.3 分析页面
1.3.4 实现Spider
1.3.5 运行爬虫
1.4 本章小结
第2章 编写Spider
2.1 Scrapy框架结构及工作原理
2.2 Request和Response对象
2.2.1 Request对象
2.2.2 Response对象
2.3 Spider开发流程
2.3.1 继承scrapy.Spider
2.3.2 为Spider命名
2.3.3 设定起始爬取点
2.3.4 实现页面解析函数
2.4 本章小结
第3章 使用Selector提取数据
3.1 Selector对象
3.1.1 创建对象
3.1.2 选中数据
3.1.3 提取数据
3.2 Response内置Selector
3.3 XPath
3.3.1 基础语法
3.3.2 常用函数
3.4 CSS选择器
3.5 本章小结
第4章 使用Item封装数据
4.1 Item和Field
4.2 拓展Item子类
4.3 Field元数据
4.4 本章小结
第5章 使用Item Pipeline处理数据
5.1 Item Pipeline
5.1.1 实现Item Pipeline
5.1.2 启用Item Pipeline
5.2 *多例子
5.2.1 过滤重复数据
5.2.2 将数据存入
MongoDB
5.3 本章小结
第6章 使用LinkExtractor提取链接
6.1 使用LinkExtractor
6.2 描述提取规则
6.3 本章小结