百度自动推送代码优化解决方案

397人参与 |分类: 站长百科|时间: 2018年07月18日

每个站长都知道。做网站想要加快收录的速度,必须要在想被收录的页面添加百度的自动推送代码,此代码让用户每次浏览该页面的时候都会向百度提交一次。省去了站长的人工操作,极大的提升了收录效率。但是这代码中每一行的含义却少有人知道,仅知道此代码可以自动推送,却不知道是如何实现的,假如知道每一行的含义,则可以根据需要进行自行设置,以降低代码的冗余,提升运行效率。

代码如下:

<script>
(function(){
    var bp = document.createElement('script');
    var curProtocol = window.location.protocol.split(':')[0];
    if (curProtocol === 'https') {
        bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';        
    }
    else {
        bp.src = 'http://push.zhanzhang.baidu.com/push.js';
    }
    var s = document.getElementsByTagName("script")[0];
    s.parentNode.insertBefore(bp, s);
})();
</script>

我们来仔细看看这个JS代码,它首先是用if函数判断了当前浏览的网址协议是经过SSL加密过的https或者是其他类型的网址,根据不同的类型分别访问了2个JS文件。之后会将访问的JS文件内容生成脚本插入到当前的url页面中,运行该脚本则会读取对应的一个非常小体积的gif图像,在这个过程中将url地址推送到百度中。

分析了以上代码我们会发现,它在判断的时候会加载2个百度的js资源,这个可以根据用户自己的url地址类型去掉不必要的判断,并且可以将其直接替换为gif地址。另外一点就是当访问的url地址为动态地址,带有非常多的参数的话,是很不利于搜索引擎爬虫的抓取的。我们在之前使用MIP的时候接触了一个非常有用的标签,那就是canonical标签,可以使用该标签对这一点进行优化。

优化后的代码如下:

<script>
    (function(){
        var canonicalURL, curProtocol;
        //Get the <link> tag
        var x=document.getElementsByTagName("link");
        //Find the last canonical URL
        if(x.length > 0){
            for (i=0;i<x.length;i++){
                if(x[i].rel.toLowerCase() == 'canonical' && x[i].href){
                    canonicalURL=x[i].href;
                }
            }
        }
        //Get protocol
        if (!canonicalURL){
            curProtocol = window.location.protocol.split(':')[0];
        }
        else{
            curProtocol = canonicalURL.split(':')[0];
        }
        //Get current URL if the canonical URL does not exist
        if (!canonicalURL) canonicalURL = window.location.href;
        //Assign script content. Replace current URL with the canonical URL
        !function(){var e=/([http|https]:\/\/[a-zA-Z0-9\_\.]+\.baidu\.com)/gi,r=canonicalURL,t=document.referrer;if(!e.test(r)){var n=(String(curProtocol).toLowerCase() === 'https')?"https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif":"//api.share.baidu.com/s.gif";t?(n+="?r="+encodeURIComponent(document.referrer),r&&(n+="&l="+r)):r&&(n+="?l="+r);var i=new Image;i.src=n}}(window);})();
</script>

从这个优化过后的代码中引入了canonical标签,无论用户访问的url地址带有什么样的参数,均会返回canonical标签唯一对应的url地址,大大减少搜索引擎爬虫的负担,并减少搜索引擎爬虫对同一页面的抓爬次数,这对于具有大量动态url的网站来说是非常大的提升。另外从优化后的代码中也可以看到,使用了一个三元运算来对url的协议类型进行判定,判定后的结果会直接访问百度对应的gif地址,从而去除了之前代码访问JS脚本的操作,也在一定程度上对页面的性能进行了优化,提升了页面运行的效率。

在使用优化后的代码需要注意的是:

1、将r=localcanonicalURL的值修改为用户自己的canonical标签所对应的url的值;

2、时常访问gif地址,确保地址正确可以访问,否则代码会失效,需进行手动更新。

来源:陈德馨博客(微信/QQ号:35435164),转载请保留出处和链接!

地址: