欺骗搜索引擎的内容建设方法“伪原创”

由 小师妹 创建, 最后一次修改 2016-09-27

采集没落以后,一些“聪明”的站长又想到一种欺骗搜索引擎的方式:伪原创。伪原创就是把一篇采集(转载)的文章进行再加工,使其让搜索引擎认为是一篇原创文章。它的目的非常简单,就是为了欺骗搜索引擎。


伪原创的常规方法

伪原创一般利用以下几种方法,通过程序对原文进行加工,产生搜索引擎难以辨识的伪原创文章。


①词语替换法:

顾名思义,词语替换就是使用相近的词语代替原文中的词语。

原创文章

②文字排序法:

通过打乱顺序的方法,让内容和原文看起来不一样。


③数字替换法:

将原文中的数字进行替换、修改。


④文中插入链接:

在原文中插入一些链接。


⑤首段自创:

手工编写内容的第一段。


⑥尾部自创:

同首段自创相反,尾部自创就是在文章的尾部自己编写一段。


从上面的几个伪原创的方法可以看出,伪原创就是采用词汇替换、语序重排等方法,破坏搜索引擎按照文字来进行辨别的判断规则,进而欺骗搜索引擎,让搜索引擎误以为这是原创文章,然后达到一些优化的目的,根本没有考虑到用户的阅读体验。


伪原创的弊端

谷歌曾经说过:“如果要将搜索引擎和人相比,搜索引擎的智商大约想当于4岁左右的孩子的智商。”


在此基础上进行搜索与网站、搜索与用户之间的简单比喻=一个4岁的孩子看到了某种事物(网站上的信息),然后将看到的信息告诉需要这些信息的大人。


从技术上说,要欺骗这样的孩子,其实并不难,难的是这个孩子将这些信息告诉给大人时,大人会不会认同,一旦大人不认同这些信息,还能否产生收益?


对伪原创来说,如果把文章的标题修改过,把文章的段落、结构、顺序等修改过,甚至是两篇或多篇内容差不多的文章混合在一起加工过,那么搜索引擎蜘蛛就很难判断这篇文章是否被收录。或许蜘蛛可以判断出有部分内容是相似或重复的,但是它不能因为这些细微的相似,而将这篇经过“深加工”的伪原创文章判断为转载。


搜索引擎蜘蛛的智力确实不高,不能给予它抬高的期望。搜索引擎蜘蛛的思维很程式化,不能明确辨明内容是否一样,是否表达同样的意思,但是这绝不能成为采用伪原创欺骗搜索引擎的原因。


一个很简单的例子是:当用户需要某种信息,通过搜索引擎来到你的网站上,发现网页中的内容完全无法阅读、无法理解时,会产生购买你网站上产品的冲动?会愿意给你付费?将来访者换成站长自己,答案就会显而易见。


或许有的站长会说,我不卖产品,我只需要流量,然后用流量来挂广告,只要有用户点击广告我就可以获得收益,这也是当前用采集、伪原创建站的主要盈利方式。


在以广告创收为基础的网站上,流量的重要性不言而喻,但是流量的来源的前提是搜索引擎没有办法判断你的文章的原创性,在欺骗以后给网站带来流量。从当前的现状来看,搜索引擎已经越来越聪明,而且还在不断进步,目前已经开始针对伪原创进行相关的算法改进,也已经逐步开始尝试对伪原创进行处理,伪原创的方法带来的流量已经越来越少了。


另外,建立网站的最终目的还是给用户看的,不管是靠广告产生收益的网站,还是靠网络营销产生收益的网站,如果用户来到网站上看到的都是语意不明、语句不通、驴唇不对马嘴的内容,怎么可能再产生兴趣点击页面上的广告?购买网站销售的东西?例如:


一个站长针对创业题材建设了两个网站,关键词规划、页面优化之类的都是一样的。在采集站点上,整站采用伪原创的方法建设内容,网站完全依靠谷歌广告联盟来创收。下面是最佳广告位的单日广告收益情况,如下图所示:

广告收益

这个站长投入了大量的时间和服务器资源:用一台单独的计算机长期挂机,不间断地采集、伪原创、发布,同时购买了十多个GB的数据存储空间、数百个GB的月流量。在一个多月以后,这个采集网站开始进入高峰期,流量很大,每天的页面浏览量在2万左右,但是谷歌的收益却非常低,最好的广告位的广告收益大概在0.6~1美元之间。


在另一个原创内容的网站上,站长将时间花在内容创作上,在和伪原创站点一样的关键词策略的情况下,整个网站的所有文章都是站长自己原创的,其他的优化策略完全一样,两个网站都没有做外部链接,页面布局、内部链接、广告布局都是一样的。


一个多月以后,伪原创的站点因为几乎是全自动的,已经有了15万篇各种各样的伪原创文章,而原创站点只有几百篇原创文章,伪原创网站每天的页面浏览量大概在2万左右,原创网站的页面浏览量大概在2500~3000之间,伪原创网站已经耗费了20GB的数据存储空间,原创网站只占用了几十MB的空间······再来看看广告收益情况,如下图所示:

谷歌联盟

原创网站的广告收益情况

从上图可以看出,原创网站的最佳广告位(位置和伪原创网站一样)每天大概有2500多个页面的浏览量,但是广告收益却有3美元,在页面浏览量几乎少于10倍丶情况下,产生了30倍左右的收益差!

上述数据很好地说明了伪原创和原创之间的差异,对搜索引擎优化者而言,杜绝伪原创应该是基本的守则。


提示:谷歌广告联盟的准入条件比较低,所以可以方便快捷地进行部署。百度之类的广告联盟审核条件比较苛刻,新站无法快速通过申请。




以上内容是否对您有帮助:
二维码
建议反馈
二维码