通常来讲,一个网站收录的文章越多,那么这个站点相对来说也越优秀,排名也更好。而收录多的前提不仅仅是网站优化做的足够好,还要求:文章的质量佳。但是问题来了:大量的网站发了原创文章后,自己的文章还没收录了,别人采集过去反而收录了!这该怎么办呢?百度官方目前也没有给出明确的说法,虽然说进行了原创标识测试。
一:网站的历史原创度
如果你的网站99%的信息是采集的,那么搜索引擎就会认为:你的每篇文章采集的,即使发现了一篇文章其他网站没有的,但是也只是会认为:其他站点没有被收录,不会被判定为原创。
反过来讲,如果是一个原创持久的网站,都有一个共同的表现:收录速度飞快,这一点我想没人去否认。在这过程中,即使增加复制一些文章,也都会飞快的秒收,这就与历史原创度有关系。如果你的网站始终可以保持原创,搜索引擎不可能不发现,会不断的加深网站的认可度。
二:文章品牌价值的优化
我举个例子来讲,比如我的博客“红橘子博客”,在文章撰写中,我会多次的将品牌引导进去。目的是什么呢?现在大量的人,转载我们的文章,都会将文章的url链接删除掉。
而真正删除文章中各方面“品牌词”的其实并不多,就如我的“红橘子博客”这是我的品牌,当别人转载我的文章后,搜索引擎同样会对文章的品牌词进行识别,一些循环的词。
甚至来讲:当用户访问到对方采集你的文章后,又通过他的站点导出百度搜索:红橘子博客,之后再进入你的网站,相信百度同样有这样的机制,来判断真正的‘原创作者’不是吗?
通常来讲,文章品牌价值的突出有两点:A,网站品牌或者公司品牌;B,编辑个人的品牌。毕竟:你的网站,只有固定的几个编辑来发文章,而采集你的网站的人,编辑是不固定的,百度也可以很明显的判断,究竟是谁一直在撰写原创。
三:增加复制与采集成本
现在绝大多数做原创的网站来讲,通常是被“复制”而不是被采集的。什么站被采集呢?这里就不多说了。通常:增加对方的复制成本,往往会降低对方的“兴趣”。
而增加对方采集成本的方式有:A,禁止右键代码(百度搜一下),如此不能直接复制,只能源码来复制,会比较繁琐。B,检查IP,禁止可疑IP,尤其是那些只看新文章,复制后即可就走,不做任何交叉查阅的。C,开启部分插件,如discuz有复制出现乱码插入问题。E,增加本地化的图片,对方如果将你的图片不更换地址直接复制过去了,百度可以更好的判断,如果不断做本地化处理,无疑同样是增加对方的复制成本周期。F,举例说明,撰写文章,进行举例说明,将自身的网址信息复制进去,可以是图片形式的,也可以是URL形式的。
四:文章的发布与推送
当别人工作的时候你在工作,当别人休息的时候,你在工作,那么你做的肯定会比其他人多。换个角度来讲:当别人休息了,你去发文章,那么他复制你的文章,就会被推迟发布。
而百度对原创文章通过发布时间上看一看出来,另外:文章发布后,及时的推送于百度,及时文章不收录,只要被抓取过,有抓取记录,那么就是OK的,会被搜索引擎记录。
而根据实际情况来看,A5营销这里观察了不少网站,收录效果还是很不错的,如果网站确实是原创,大约推送的70%都可以完成收录。
搜索引擎对网站的文章发布,会养成一个习惯,建议最好是每天固定的时间点去发布,这样一来:蜘蛛也会更为集中的在这个时间点对网站进行抓取,更利于其他时间段的收录。除非蜘蛛每天24小时常停留在你的网站,那么不做这个限制,红橘子博客在没有重新建设之前,蜘蛛24小时停留(不谈这个了,12年常年被攻击,被迫关闭,那是叫二进制网络营销博客)。
五、正确的投诉与反馈
当一个网站大量的采集你的信息,如果你有足够的证据,证明你的网站才是原创,例如其中的品牌,还有发布时间这些,那么久可以通过站长平台的反馈,来对你的网站进行重新评估,以及对对方的网站进行惩罚!
当然,这个前提是,对方大量的采集或者复制你的网站信息,同时投诉也是有技巧的,我们见过不少站长就写着:“我的网站被XXXX站点采集了,我的才是原创!”你的证据在哪里?百度可没时间去研究去判断,到底是谁在采集谁!