奥宏书架 奥宏书架
用Python写网络爬虫 第2版
书名 : 用Python写网络爬虫 第2版
作者 : [德]凯瑟琳 雅姆尔(Katharine Jarmul)、[澳]理查德 劳森(R
出版社 : 人民邮电出版社
出版日期 : 2018-08
ISBN : 9787115479679
价格 : 49.00
开本 : 16开
装帧 : 平装-胶订
页数 : 196
纸张 : 胶版纸
内容简介
畅销的Python网络爬虫开发实战图书全新升级版,上一版年销量近40000册。 针对Python 3.6版本编写。 提供示例完整源码和实例网站搭建源码,确保用户能在本地成功复现爬取网站环境,并保障网站的稳定性与可靠性以及代码运行结果的可再现性。 Internet上包含了许多有用的数据,其中大部分是可以免费公开访问的。但是,这些数据不容易使用,它们内嵌在网站的架构和样式中,在提取时也需要多加小心。网络爬取技术作为一种收集和理解网络上海量信息的方式,正变得越来越有用。 本书是使用Python 3.6的新特性来爬取网络数据的入门指南。本书讲解了从静态网站提取数据的方法,以及如何使用数据库和文件缓存技术来节省时间并管理服务器负载,然后介绍了如何使用浏览器、爬虫和并发爬虫开发一个更为复杂的爬虫。 借助于PyQt和Selenium,你可以决定何时以及如何从依