“网络抓取”的版本间的差异

来自Wiki.Citydatum
跳转至: 导航搜索
(创建页面,内容为“{{提示|该页面仍需进一步完善,欢迎加入我们}} 网络抓取是指利用软件或爬虫,采集互联网数据。 == 抓取工具 == * [http://www.l…”)
 
第2行: 第2行:
 
网络抓取是指利用软件或爬虫,采集互联网数据。
 
网络抓取是指利用软件或爬虫,采集互联网数据。
  
== 抓取工具 ==
+
== 工具抓取 ==
 
* [http://www.locoy.com/ 火车采集器]
 
* [http://www.locoy.com/ 火车采集器]
 
* [http://www.bazhuayu.com/ 八爪鱼采集器]
 
* [http://www.bazhuayu.com/ 八爪鱼采集器]
  
== 爬虫 ==
+
== 编写爬虫 ==
 
* [[Python]]
 
* [[Python]]
* [[R语言]]
+
* [[R语言]]:利用RCurl、XML包,R语言可方便地抓取网络数据。介绍R语言爬虫的中文资料不多,强烈推荐[https://book.douban.com/subject/26755418/ 《基于R语言的自由数据收集》]。

2018年2月26日 (一) 20:18的版本

TODO
提示:该页面仍需进一步完善,欢迎加入我们

网络抓取是指利用软件或爬虫,采集互联网数据。

工具抓取

编写爬虫