网站内容建设的3种方法之采集

2018-09-27 12:09 更新

在网站内容建设方式上,当前网络上有3种方法,分别是采集、伪原创和原创。关于这3种内容建设方式的讨论是当下最热的话题之一,正方辩友和反方辩友各执一词,吵得不可开交······


生命周期越来越短的采集

所谓采集,就是将“Ctrl+C”、“Ctrl+V”进行程序化、系统化、自动化、智能化,也就是将别人的内容原样搬到自己的网站上。现在常见的网络采集是指批量采集网页内容,直接保存到数据库或发布到自己网站上的一种方法。


采集与转载

采集是指复制别人的原创内容,然后自己发布的行为,被采集的内容发布出来以后,就称为采集或者转载内容。


比如网民看到一篇介绍如何做菜的优秀文章,很实用,为保存这个文章,方便自己在需要的时候使用,所以网民复制这个文章并发布到自己的博客上,这就是采集,也叫转载。被转载且被发布到博客上的这篇做菜的文章,就是转载内容。


提示:需要注意的是,只是博客上的这篇文章是转载内容,而原始的文章依然可以称为原创文章。


搜索引擎与采集的战争

从网络发展的根源上说,保存和传递信息是必须的,这也是支持采集的人的主要论点。但是采集的内容因为缺乏创新,只是一味地复制、粘贴,会造成网络资源的大量浪费,重复内容千篇一律地出现,大家都采集、大家都支持采集的话,会扼杀创新的活力,造成意识形态的退步。


内容采集


关于究竟该不该采集,上升到哲学范畴的辩论让哲学家伤脑筋去。对于我们关注的搜索引擎优化而言,各大主流搜索引擎已经开始越来越不喜欢采集,越来越快速地处理各种采集所产生的问题。


有一定经验的站长都应该记得,2003年左右,采集开始在国内风行,网站建设者对采集的需求造成了无数采集工具的出现和发展。那时候建站非常简单:选定一个主题,配置一个采集工具,挂机采集、发布,等搜索引擎收录以后带来流量,然后挂上广告联盟等着收钱即可。这种方法在今天听起来好像很不靠谱,实际上时至今日都有人这么干,而且依然能获得不错的收益。


采集这种明显利用搜索引擎的特点(或者说设计缺陷)来牟利的方法,当然会受到搜索引擎的大力打击。以前每天采集几千篇文章发布,搜索引擎会以外你是一个大型站点,给予较高的权重,进而快速收录、提升排名、导入流量,让采集者数钱到手抽筋。现在的搜索引擎不但有诸如谷歌沙盒这样的措施,而且还加大了重复内容的判定,一旦判定整站内容大部分是采集而来的,很快会进行处罚,轻则收录后马上删除,重则降权、惩罚。


本着认真建站、长期发展的思路,对中小型网站来说,不建议采用采集的方式进行内容维护,这样的方式已经越来越受到排斥,存在的意义也越来越小。

以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号