网站被镜像了怎么办?
您的当点位置:易名营销技术->百度排名->百度排名优化->浏览文章
百度排名优化

网站被镜像了怎么办?

来源:网站,镜像,怎么,怎么办 发布:2018年08月29日 预览82

在常见负面SEO帖子里提到过,我这个小博客有几十个域名镜像我。有读者问我,怎么知道本身被镜像了,网站被镜像又改怎么处理。今天写个帖子聊一下。

什么是恶意镜像网站?

镜像网站指的是和你的网站基本一样、并且实时同步的其它网站。就像照镜子一样,所以名为镜像。

有的镜像网站是没有恶意的,很可能是你本身设置的,为了方便用户能从多个域名访问网站,被封了一个,还有其它的域名。比如闻名的草榴社区,彷佛就有许多镜像可以访问。

有的镜像,也就是这里讨论的镜像,是不怀好意的,通常是别人设置的,要么为了负面SEO你的网站,要么为了行使你的内容获得排名,然后把用户转向到敏感、非法内容网站上去。

网上有的文章把采集和镜像混在一路。虽然体现情势差不多,但严酷来说,采集和镜像实现方法、体现情势是有区别的。

采集的网站一样平常是提前抓取别人网站的内容,放入本身数据库,再用程序调用到页面上。被采集网站有新内容时,采集网站并不能实时同步更新手机网站建设,要再采集之后才能出现。一旦被采集,内容已经在对方数据库里了,从技术上是无法阻止采集网站表现这些内容的。这篇帖子说的不是这种。

镜像网站并不事先抓取内容,而是有人访问网站时,实时从被镜像的网站调取内容,做些处理(替代URL、笔墨,加笔墨、加JS等),然后实时表现。被镜像的网站有任何更新,镜像网站是实时同步的。

网站被镜像了怎么办?

网上有卖用于镜像网站的小偷程序的。小偷程序通常也可以用来做采集。为了不给他们做宣传,就不提名字了。从他们的官网摘取几条程序功能,有助于理解后面的内容:

全主动分析,内外链接主动转换、图片地址、css、js,主动分析CSS内的图片

内置壮大替代和过滤功能,标签过滤、站内外过滤、字符串替代、等等

伪原创,近义词替代有利于seo

增长URL路由北京人事考试网,实现全站URL变换,个性化本站URL地址

超级模板增长移动模板、自定义栏目功能

增长主动获取301、302重定向的采集,解决跳WWW,跳https采集

代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施

其实我是挺疑惑,网信办为什么不责令关闭卖小偷程序的网站,这种网站才是真正该关的,而不是另外一些网站。

被镜像有什么伤害

从SEO角度看,权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容基本一样,搜索引擎有可能认为你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。

对有肯定历史、权重的网站,镜像网站庖代原版网站的可能性微乎其微。但从心情角度考虑,被别人镜像,内容被别人偷走,即使没有其它显明后果,也照旧挺烦人的一件事。

另一个烦人的事是,镜像网站一样平常来说并不是要和你提供同样的产品或服务,而是把用户转到赌博、色情等服务上去。有的是通过JS把赌博、色情内容表现给用户,有的直接把用户转向到另外的网站上去。

怎样发现本身网站被镜像了

偶然候细致到被镜像了是由于本身网站排名降落,嫌疑有人负面SEO。偶然候是搜索品牌名称,看到镜像网站。已经知道本身被镜像了好办,直接看下面怎么处理部分。

许多站长则完全不知道本身网站是否被镜像了。有几个我常用的检查方法。

一是百度统计后台:

网站被镜像了怎么办?

受访域名部分列出了使用雷同百度统计代码的域名。其中出现快照、百度/谷歌翻译等是正常的,但出现一些奇新鲜怪的域名就要查看一下了,比如上图里的第5、7、8个,访问一下就知道都是镜像SEO天天一帖,引诱用户赌博的网站,然后站长把SEO天天一帖的统计代码也照抄曩昔了。

看看上面列出的小偷出现功能就知道,其实统计代码很容易替代或删除的。所以在受访域名只能看到一小部分镜像网站。

第二是搜索网站的特性句子。最容易想到的是网站品牌名称、首页题目等,确实可以发现一些镜像网站。但如前所述,品牌名绝大多数是会被替代的,所以我更喜好搜索一些页面上的特性句子,比如本博客最上面的副题目:Zac的SEO博客,坚持12年明星经纪费,优化成为生活。搜索一下就会看到:

网站被镜像了怎么办?


看来我的博客很容易吸引菠菜啊。

一样平常我不搜索帖子里的句子,由于那会返回大量转载、剽窃的页面,不是镜像的。

从上图可以看到,镜像网站主动把title及正文中的品牌词或指定关键词替代了,访问这类网站结果常常是如许的:

网站被镜像了怎么办?

上图镜像网站没有转向,也没有效JS表现大量菠菜内容,而是直接在正文中插入菠菜内容和链接。有的镜像网站用JS在页面上半部分表现大量内容,就像在典型赌博网站看到的一样,拉到下面才能看到镜像的内容。

为了搜得更全,还经常必要多搜索其它地方的特性笔墨。比如搜索页脚的声明中的一句:“明明很久一贴,为什么号称“看到另一些镜像网站:

网站被镜像了怎么办?

为什么搜索句子的一半,不是搜索“明明很久一贴,为什么号称SEO天天一帖“呢?照旧由于品牌词或特性关键词经常是会被替代的辽宁人事考试,比如如许:

网站被镜像了怎么办?

一样平常我是用Google做这种搜索,由于Google什么杂乱无章的都收录。

网站被镜像了怎么办?

首先,一些网上提到的解决办法并没有什么用。

比如有的说页面上的链接用绝对地址有帮助,其实小偷程序都会主动替代网址,用相对地址照旧绝对地址没什么差别。

还有的说页面上加上网站链接、网站名称、版权声明之类的,搜索引擎会识别哪个是正版。但镜像小偷程序连链接带笔墨都可以悉数主动替代,这么做并没有效。

发现镜像网站后的处理原则就是让镜像网站不能在镜像域名上表现你的内容。考虑到镜像网站是要实时访问和调用被镜像的页面的,所以可以考虑几个方法。

比如用JS检测一下正在被打开的页面是不是在本身的域名上,是的话正常表现,不是的话(域名是镜像网站时)强迫转向到本身域名:

if (window.location.hostname !== ‘www.esmo.cn/seozac3564’){

window.top.location.href = ‘https://www.esmo.cn/seozac3564/’;

}

(声明:我对程序不熟,代码只是简单举例,详细怎么写,请问你的程序员。)

不过这种方法只对用户有用,搜索引擎不实行JS,照旧会抓取到镜像内容。也可以用PHP写脚本判断和转向。

偶然候因为种种缘故原由,程序不起作用。另一个直接的方法是屏蔽镜像网站来访问的IP地址。先查一下镜像网站服务器IP:

网站被镜像了怎么办?

把对方主机IP先屏蔽了。不过镜像网站来实时抓取用的IP大部分情况下不是域名主机IP,可能是CDN,可能是伪造IP,也可能是多IP的服务器。要发现必须屏蔽的IP,必要查看网站原始日志。我的一个小窍门是,访问镜像网站上一个很少人会访问的页面,比如翻页第70页,然后立刻查看日志,这个页面被访问的IP就是应该屏蔽的IP:

网站被镜像了怎么办?

屏蔽了这个IP,再访问镜像网站就变成403错误了:

网站被镜像了怎么办?

不知道页脚的友谊链接是镜像网站本身加的?照旧卖程序的人强制加的?

镜像网站经常是会伪造或实时轮换IP地址的,假如屏蔽一个IP网站还能访问,就再访问翻页69页、68页等等,找到更多IP。屏蔽也可以屏蔽IP段。我的经验是,通常镜像网站不会使用超过10个IP地址。

当然也可以写个简单的脚本放本身网站上,比如www.esmo.cn/seozac3564/mirror.php:

<?php

echo $_SERVER[‘REMOTE_ADDR’];

?>

脚本唯一功能就是表现访问的IP,然后本身访问一下小偷镜像网站的脚本网址,也就是www.esmo.cn/bloody-thief3564/mirror.php,页面上就直接表现镜像网站访问你服务器时的IP了。假如镜像网站替代了URL,这个方法就不好用了。无论怎样,日志中是肯定有的。

另外,发现镜像网站,可以向百度、域名注册商、主机服务商投诉,要求关闭网站或删除页面。投诉是否管用就是另一回事了,照旧先做好IP屏蔽和URL检测。

作者: [email protected]天天一贴