网络爬虫 跟 采集 有什么不一样 什么区别 概念定义如何区分

如题所述

第1个回答  2012-12-07
当“蜘蛛”程序出现时,现代意义上的搜索引擎才初露端倪。它实际上是一种电脑“机器人”(Computer Robot),电脑“机器人”是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。

采集,是网站自身内容的填充。

可见,区别很明显。前者用于搜索,但是内容还在被搜索网站上;后者,则将内容放自己网站上。