“网络抓取”的版本间的差异
来自Wiki.Citydatum
小 |
小 (→编写爬虫) |
||
第8行: | 第8行: | ||
== 编写爬虫 == | == 编写爬虫 == | ||
* [[Python]] | * [[Python]] | ||
− | * [[R语言]]:利用RCurl、XML包,R语言可方便地抓取网络数据。介绍R语言爬虫的中文资料不多,强烈推荐[https://book.douban.com/subject/26755418/ | + | * [[R语言]]:利用RCurl、XML包,R语言可方便地抓取网络数据。介绍R语言爬虫的中文资料不多,强烈推荐[https://book.douban.com/subject/26755418/ 《基于R语言的自动数据收集》]。 |
2018年2月27日 (二) 03:15的版本
网络抓取是指利用软件或爬虫,采集互联网数据。
工具抓取
编写爬虫
- Python
- R语言:利用RCurl、XML包,R语言可方便地抓取网络数据。介绍R语言爬虫的中文资料不多,强烈推荐《基于R语言的自动数据收集》。