专业IT网络知识平台,分享IT百科知识、生活百科知识解答!

易企推科技
易企推科技

减少无效URL的爬行、收录、索引的8种方法分享!

来源:小易整编  作者:小易 发布时间:2019-09-21 07:01
摘要:减少无效URL的爬行、收录、索引的8种方法分享!现如今很多电子商务(B2C)商对客,根据用户对产品条件的需求做出了过滤系统,比如选择产品的时候会出现很多品牌、很多价格、很多尺寸、...

现如今很多电子商务(B2C)“商对客”,根据用户对产品条件的需求做出了过滤系统,比如选择产品的时候会出现很多品牌、很多价格、很多尺寸、很多性能、很多型号、很多参数等。这种情况就会会产生大量无效URL,当然之所以叫着无效的URL,仅仅是从SEO的角度来看,因为这些无效的URL并不能产生SEO的作用,而且还会有负面作用,所以这些无效的URL最好是不收录比较好。为什么这么说呢,其实笔者对这些问题也比较头疼,因为其中的原因有以下几点:

URL

经过过滤系统的很多页面的内容都是重复的或相似度极高的,这样的结果只会导致网站整体质量下降,这样的页面绝大部分都是没有排名能力的,因为搜索引擎会认为这样的页面就是一些垃圾页面。当搜索引擎爬行到的页面大部分都是过滤后的页面,就会浪费蜘蛛的爬行时间,从而造成页面收录的机会降低。

下面就来讲一下如何减少无效URL的爬行和索引:

1、将不想被收录的URL设置为动态的URL,动态参数越多越好,这样就能使蜘蛛不能爬行到甚至建立索引。

2、使用robots禁止搜索引擎收录。

3、我们可以将经过过滤的链接用AJAX的部分加载技术来展示内容,这样一来用户点击后不会访问到一个新的URL,还是在原来URL上。

4、采用JS脚本语言来实现不想被搜索引擎抓取的内容

5、还可以在页面head部分加noindex+follow标签,意思就是这个页面不要索引,但是会跟踪页面上的链接。

6、我们也可以考虑使用隐藏页面(cloaking),也就是用程序检测访问者,是搜索引擎蜘蛛的话返回的页面拿掉这些过滤条件链接,是用户的话才返回正常的有过滤条件的页面。这也是一个比较理想的解决方法,但是有可能被当作作弊,胆大的可以试用。

7、使用canonical标签,问题是百度是否支持未知,canonical标签是对引擎的建议,不是指令,也就是说这个标签搜索引擎可能不遵守,等于没用。

8、目前比较好的方法之一是iframe+robots禁止。我们可以将过滤部分代码放进iframe,等于调用其它文件内容,也即隐藏了内容。但不属于当前页面不等于不存在,搜索引擎也是可以发现iframe中的内容和链接的,还是可能爬行这些URL,所以加robots禁止爬行。iframe方法有一个潜在问题就是可能会被认为作弊。

最后总结:

对于这个严重且现实的问题,笔者也要承认一下我也不清楚。不同网站SEO的重点不同,先看问题再来分析,采用上述方法中的一种或几种应该可以解决主要的问题。而最为麻烦的情况还不是上面提到的这些,而是通过这些问题发现过滤页面后被索引,这才是最有难度的。具体如何解决后面再细细讲解。


本文地址:武汉SEO频道 https://www.hkm168.com/seojishu/1382.html,易企推百科一个免费的知识分享平台,本站部分文章来网络分享,本着互联网分享的精神,如有涉及到您的权益,请联系我们处理,谢谢!


武汉SEO
小编:小易整编
相关文章相关阅读
  • uri和url区别和关联

    uri和url区别和关联

    uri和url区别和关联URI,是uniformresourceidentifier,统一资源标识符,用来唯一的标识一个资源。Web上可用的每种资源如HTML文档、图像、视频片段、程序等都是一个来URI来定位的URI一般由三部组成:①访...

  • url文件如何打开

    url文件如何打开

    打开步骤:1、找到要打开的url文件,并确保计算机上已安装适合处理该文件的程序;2、双击url文件打开它;3、若想使用其他浏览器打开url文件,请右键单击文件,然后从弹出菜单中选择“打开方式”或“打开方式选择器”;4、选择要使用的浏览器或选...

  • URL和URI之间有什么区别

    URL和URI之间有什么区别

    url和uri之间的区别是:1、uri是用于标识互联网上的资源的字符串序列,而uri并不关注资源的位置,而只关注它的标识符;2、url提供了关于资源在互联网上位置的详细信息,而uri是一种更广义的概念,不仅涵盖了url,还包括了用于标识资源...

  • 什么是url

    什么是url

    url是互联网上资源的唯一标识符,通过url可以定位和访问互联网上的资源。在互联网的发展和应用中起着重要的作用,方便了用户访问资源,也为开发者提供了一种标准的方式来定位和引用资源。URL,全称为统一资源定位符(UniformResourc...

  • urllc是什么的缩写

    urllc是什么的缩写

    uRLLC即超高可靠与低时延通信(Ultra-reliableandLowLatencyCommunications,URLLC),是5G的三大应用场景之一,具备高可靠、低时延、极高的可用性等全新特性。      ...

  • url全称是什么

    url全称是什么

    url全称是什么?URL是UniformResourceLocation的缩写,译为“统一资源定位符”。通俗地说,URL是Internet上用来描述信息资源的字符串,主要用在各种WWW客户程序和服务器程序上,特别是著名的Mosaic。采...

  • url是指什么

    url是指什么

    什么是url?URL(UniformResourceLocator)是指统一资源定位符,是用于完整地描述Internet上网页和其他资源的地址的一种标识方法,也被称为"网址"。注意:在Internet上所有资源都有一个独......

  • url是啥意思

    url是啥意思

    url是“uniformresourcelocator”的缩写,中文意为“统一资源定位符”。url是通过互联网来定位和访问特定资源的地址,常见于网页浏览和http请求中。url的主要作用是定位和访问互联网上的资源,这些资源可以是网页、图...

  • 周排行
  • 月排行
  • 年排行