“网络抓取”的版本间的差异

2018年10月19日 (五) 19:39的最新版本

提示：该页面仍需进一步完善，欢迎加入我们

网络抓取是指利用软件或爬虫，采集互联网数据。

网络抓取有可能受到知识产权侵权的指控，尤其是将抓取内容用于商业目的重新发布的情况下。为避免不必要的纠纷，抓取网络内容时应尽可能将工作透明化，遵循robots.txt声明的非正式规则，随时记录数据来源，并将下载内容的使用局限在研究分析领域。

@@ 第18行： / 第18行： @@
 * [[Python]]：Python3.x标准库urllib（Python2.x标准库urllib，urllib2）提供了网络抓取所需的相关功能。
-== 应用案例 ==
+== 应用 ==
+=== 教程示例 ===
 * 抓取维基百科濒危世界遗产地表格，清理数据，以便分析世界遗产地保护情况；