当前位置:首页 > SEO优化 > 正文内容

Google爬虫:不仅索引链接,还可以运行js代码

admin15年前 (2010-06-26)SEO优化438
一直以来Google的搜索爬虫就具有阅读JavaScript代码的功能,但是多年以来我们一直都不清楚Google的爬虫是否真正理解了其正在抓取的东西或者说它仅仅只是在易于理解的数据结构中对各种链接进行呆板的检索。本周五,一位Google的发言人向《福布斯》确认Google所作的远远超过对js代码的简单分析。这位发言人表示:“Google能够分析并理解某些JavaScript”。         Google的表述让我们意识到其爬虫所作的工作也许不仅仅只是获得对页面的相关链接,还能够像人一样与各类程序发生互动——发现Bing这类搜索引擎所不能发现的网络世界。而这意味着,Google重新定义了搜索引擎。在Google的搜索结果里面只有很少的js代码,而且Google也将这种js代码的解释功能做了很多保留。比如在Google站点搜索(Google's Site Search)的文档显示其不能够索引带有js代码的内容。一本关于索引的入门教材这样写道:它(Google爬虫)“不能够处理带有富媒体的内容或者是动态网页”。仔细检查服务器日志中的记录我们便可以发现Google现在索引那些并不是直接包含在js代码里面的链接,Google的爬虫只有确定自己能够运行部分代码的时候才能明白整段代码到底是什么意思。         Mark Drummond,一家独立搜索引擎公司Wowd的首席执行官(我们在今年之前的杂志中采访过他)在一封邮件中告诉我们理解js代码“是一个非常深刻、难度极大和一场经典的计算科学难题。”他解释道Google的努力在于它能够发现js代码在网页中是否存在停止运行的情况。他表示“停止运行的问题是无法判定的”,他说迄今为止还没有已知的算法能够在任何程序的任何时间点告诉我们该程序是否陷入了死循环,而且数学上已经证明了这一点。Drummond自己的公司通过人工的方式检索其索引并标明是否有可能简化这个复杂的问题,同时判断一个网络程序是否向另外的程序发起了数据请求。也许,这正是Google现在在做的事情。         另一位同Google接近的搜索引擎人士也认同Drummond关于理解js代码复杂性的看法。他认为用一个程序去分析另一个程序是很困难的事情,执行js代码几乎是现阶段能够做到的极限了。         而Google在六月发布的改进版搜索算法(即Caffeine)似乎开始能够理解部分js代码了。如果这是真的,那么Google的工程师已经教会了其爬虫如何执行部分js代码。这真是一大突破!

扫描二维码推送至手机访问。

版权声明:本文由博赚恋吧资源站发布,如需转载请注明出处。

本文链接:https://432l.com/post/3034.html

标签: SEO优化
分享给朋友:

相关文章

如何使用新浪微博进行博客推广

     新浪微博最近可是很红啊!作为Twitter的copy品(姑且可以这样说吧),说起twitter恐怕没有人不知道吧,由于Twitter的影响力和使用者逐步扩大,通过Twitter来推广自己的博客是一件很容易的事,可是由于人人都知道的原因,Twitter‘、叽歪等类似的微博客系统都集体的歇菜了,想想新浪这么大的背景,“围脖”的...

PR劫持到9后的反思

本文从门户通社区转的帖子,不能判定真假。站长也不敢妄下结论,感兴趣的网友或许可以受点启发,赚点money吧!以前从来没想过自己能拥有个PR高点的网站,哪怕只是PR到5了,这都没想过。      很早以前在网上搜了一下PR劫持,然后看了好多相关的资料,好像大多数都提到了301转向。就算自己想搞个301转向也没办法,据我所知301转向是在linux主机做的,一般...

Z-Blog自定义分类静态首页配置,没事动它后果严重!

可能你已经注意到了,站长最近的文章为blog.fanyongzhuji.com/cat_31/418.html,而不是以前的blog.fanyongzhuji.com/cat_31/418了,为什么呢?站长最近很苦恼,一直没有弄明白Z-Blog分类静态首页的具体用法。据说Z-Blog分类静态首页可以缓解网站服务器的一部分负担,同时生成静态html有利于搜索引擎蜘蛛的抓取。Z-Blog官方也没有比较...

也扯互联网运营网站的两种盈利模式

之前在某论坛看到很多网友都说,做网站有了流量,不怕没有赚钱的机会。但是真的有了流量,就真的盈利机会吗?我看未必。网上流量大的站有很多,但真正能赚到钱的站却不一定很多。真正能赚到钱的网站,必须是有很好的盈利模式。说得更详细直白点,要分清楚谁是用户、谁是你的客户(能收到钱,能收费的对象)?然后想办法让客户付费,而用户有可能就是“流量”,来了你的网站,获取你的资源,但却不一定会付费。盈利模式的一个具体表...

淘客站长:你适合做吗?

初识淘宝已经快两年,阿里妈妈注册也有一年,发现淘客可以赚钱,却是7月末,这时候的淘客推广,可以说人满为患,发贴的,QQ的,博客推广的,更厉害的就是建站了吧!虽然不懂,可也跟着建站大军一路下海。  “路开了,树伐了”一切必须要继续了,才发现自己有多么的忙碌,可想而之,遍地的淘站,虽然各有千秋,可做好站,要在重多淘站中脱影而出,那是多么的不容易啊?  走到今日,突然想明白了,盲...

精华推荐—商业博客营销六道,绝对有启发意义!

博客发展到今日,已经有很多出色的博客。大多数人开始写博客时是以写手身份或出于爱好,并没有把自己当成生意人。随着商业博客的盛行,博客开始进入营销渠道,但商业博客的纯广告性“软文”也给博客营销的发展带来了很大的负面影响。 一、认识之道有些人觉得宣传就是做广告,而依他们目前的看法,做广告类似于撒谎。抱着这种态度,任何自视清高的博客人都不想为了推广自己的博客而去学撒谎。...

评论列表

刘晔
15年前 (2010-06-29)

学习一下了。。。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。