前言

随着计算机技术飞速发展,人们对计算机使用技能的要求越来越高。在编写软件时,大家既希望有超高的效率,又希望这门语言简单易用。这种鱼与熊掌皆得的要求的确很高,Python编程语言恰好符合这么苛刻的要求。

Python的执行效率仅比效率之王C略逊一筹,在简单易用方面Python也名列三甲。可以说,Python在效率和简单之间达到了平衡。另外,Python还是一门胶水语言,可以将其他编程语言的优点融合在一起,达到1+1>2的效果。这也是Python如今使用人数越来越多的原因。

Python语言发展迅速,在各行各业都发挥了独特的作用。在各大企业、学校、机关都运行着Python明星程序。但就个人而言,运用Python最多的还是网络爬虫(这里的爬虫仅涉及从网页提取数据,不涉及深度、广度算法的爬虫搜索)。在网络上经常更新的数据,无须每次都打开网页浏览,使用爬虫程序可以一键获取数据,下载保存后分析。考虑到Python爬虫在网络上的资料虽多,但大多都不成系统,难以提供系统、有效的学习。因此,作者抛砖引玉,编写了这本有关Python网络爬虫的书,以供读者学习参考。

Python简单易学,Python爬虫也不复杂,只需要了解Python的基本操作即可自行编写。本书将介绍几种不同类型的Python爬虫,可以针对不同情况的站点进行数据收集。