“网络抓取”的版本间的差异
来自Wiki.Citydatum
(创建页面,内容为“{{提示|该页面仍需进一步完善,欢迎加入我们}} 网络抓取是指利用软件或爬虫,采集互联网数据。 == 抓取工具 == * [http://www.l…”) |
小 |
||
第2行: | 第2行: | ||
网络抓取是指利用软件或爬虫,采集互联网数据。 | 网络抓取是指利用软件或爬虫,采集互联网数据。 | ||
− | == | + | == 工具抓取 == |
* [http://www.locoy.com/ 火车采集器] | * [http://www.locoy.com/ 火车采集器] | ||
* [http://www.bazhuayu.com/ 八爪鱼采集器] | * [http://www.bazhuayu.com/ 八爪鱼采集器] | ||
− | == | + | == 编写爬虫 == |
* [[Python]] | * [[Python]] | ||
− | * [[R语言]] | + | * [[R语言]]:利用RCurl、XML包,R语言可方便地抓取网络数据。介绍R语言爬虫的中文资料不多,强烈推荐[https://book.douban.com/subject/26755418/ 《基于R语言的自由数据收集》]。 |
2018年2月26日 (一) 19:18的版本
网络抓取是指利用软件或爬虫,采集互联网数据。
工具抓取
编写爬虫
- Python
- R语言:利用RCurl、XML包,R语言可方便地抓取网络数据。介绍R语言爬虫的中文资料不多,强烈推荐《基于R语言的自由数据收集》。