按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
《撬动地球的Google》 第一部分更好的新型交通系统
拉里和谢尔盖总是形影不离。在校园里,大家都称他们“拉里和谢尔盖”,这个词组很顺口。“跟他们分享一间办公室是件很有趣的事。”芒兹纳说,“我们的作息时间都很不正常。我记得某个周六的凌晨三点钟,办公室里还满是人。我记得自己当时想,‘我们真的是群极客’。我们对自己进行的工作都非常投入,而且体会到了工作的乐趣。”
拉里和谢尔盖总是不停地相互取笑。芒兹纳说他们“巨聪明,但不自负”。他们从互相挑战和辩论中得到快乐,而且一旦找到合适的话题,就要同别人辩论个三百回合才罢休。他们总是在讨论计算机、哲学以及一切他们想得到的话题。有一次,他们两个大声地争论是不是可能用利马豆来做成建筑物大小的陈列品。芒兹纳被他们逗得坐在椅子上满屋乱转,高喊:“你们一定是在开玩笑!”在盖茨楼360室的一个角落里,拉里的桌子底下,他们用Legos固件组装了一个机箱。办公室里的同伴们发现,要是不把这两个人撵出去的话,大家就都干不了活。“我学会了带着套头耳机编程。”芒兹纳说。
佩奇最喜欢讨论的一个话题就是设计更好的新型交通系统。他在底特律附近长大,这一经历使他深入地思考,在把人员和物资从一个地方运输到另外一个地方的过程中,怎样才能降低事故率和花费,减少污染和缓解交通压力。“他热衷于谈论理想的自动化交通系统。在这个系统中,汽车在各处自动行驶,如果你需要用车,你就进入其中一辆,然后告诉这辆车你要去哪里。它就像是出租车,不过价格更便宜,而且在行驶过程中相互之间的车距比较近,”安德森回忆道,“佩奇对人员和物资的运输问题非常有热情。他喜欢用各种方式来解决社会问题。”
雷吉夫 · 莫特万尼(Rajeev Motwani),今年30岁,是斯坦福大学的教授,从谢尔盖1993年到斯坦福来的时候开始,他就一直是谢尔盖的指导教师。他看着布林和佩奇结成亲密的学术伙伴,而他对这两个人的喜爱之情也与日俱增。“他们都很聪明,是我见过的人中最聪明的,”莫特万尼这样说,“不过他们的聪明才智各有特色。”谢尔盖更加实际,善于解决问题,同时对工程很有一套。他只需要知道某种做法可行就行了。他还很有数学才能,脑筋转得很快,性格也外向。“他就是个有点莽撞的年轻人,可是,他是这样机智,以至于你根本注意不到这一点。”莫特万尼说。布林缺少什么东西、或者想要什么东西的时候,他就会直接闯进莫特万尼的办公室,从来不敲门。而佩奇是个凡事深思熟虑的人,他希望搞清楚为什么某种做法可行。虽然佩奇雄心勃勃,但是他的行为方式更加内敛。他进莫特万尼的办公室之前都会先敲门。“如果有20个人在一起开会,谢尔盖肯定是那个最引人注目的人。而拉里即使就坐在人群中,你也注意不到他,不过事后他会问,‘嘿,你觉得这个想法如何?’”
谢尔盖的行事风格同一般的斯坦福学生不同。“他的一举一动都非常激进。他是个说话办事直截了当的人。他行为的力度非比寻常。”另一位斯坦福教师丹尼斯 · 阿利森(Dennis Allison)这样说道,“谢尔盖很投入。他可以传达明确的信息,表示他已经注意到你了,他会直接同你讲话,并期待你的回应。同他谈话很令人激动。”
布林同莫特万尼紧密合作,希望找出办法,从大山一样庞大的数据中提取所需信息。他们创立了一个叫做MIDAS的课题小组;这个小组的名字是Mining Data at Stanford(在斯坦福挖掘数据)的字母缩写。而在希腊神话中,迈达斯(Midas)是一位能够点物成金的古希腊国王。布林为MIDAS每周的讨论选择话题并排定发言顺序表。他和莫特万尼还以此为主题,合作撰写了多篇学术论文。
数据挖掘可以被用在零售商业中,以确定顾客通常都会同时购买哪些货品,来帮助零售商更好地组织商品的陈列方式。布林和莫特万尼希望可以把同样的技术用于新出现的、还像一团乱麻似的互联网。在20世纪90年代中期,网络就像未开发的西部,没有一定的游戏规则,荒无人烟,缺乏管理。数百万的人在网络中登录,使用电子邮件来相互联系,但是在那样一堆乱糟糟的网站中间,你几乎完全无法进行严肃的科学研究。人们曾经努力开发出一系列帮助互联网用户从互联网中找到信息的工具,包括WebCrawler、Lycos、Magellan、Infoseek、Excite和HotBot。然而,它们都不能很好地完成这个任务。“当时人们的搜索体验非常糟糕,”莫特万尼说,“你常常会得到一些毫无意义的结果。”莫特万尼曾经测试过一个叫做Inktomi的搜索引擎,这个引擎是在授予莫特万尼学位的加州大学伯克利分校开发的。他输入“Inktomi”,试试看会发生什么。结果,莫特万尼说:“它不在搜索范围,它找不到它自己。”
《撬动地球的Google》 第一部分下载工作很简单
同时,斯坦福的博士学位申请人杨致远和大卫·费罗(David Filo)采取了一种截然不同的搜索方式。他们的工作并不仅仅依赖于技术,他们雇用了一些编辑,按字母顺序为网页目录进行排序,并从中选取网站。他们给自己的公司起名雅虎。尽管他们的办法可以帮助网络用户容易地找到有价值的信息,但信息还不够完整,而且也跟不上网络不断膨胀的步伐。布林和莫特万尼还试用了其他网页目录和搜索引擎,但是,没有哪一个可以完成这个工作。恰恰相反,一个简简单单的搜索指令会带来一长串毫不相干的结果。他们必须花几个小时人工过滤一张张网页,来找出自己想找的信息。布林和莫特万尼确信,开发出新的办法来进行搜索迫在眉睫。
与此同时,佩奇曾经花了一些时间来参加数字图书馆项目。他也开始用一种叫做AltaVista的搜索引擎来搜索网络。它反馈结果的速度要快一些,而且也比其他工具的结果更优化。但是,佩奇意识到一个全新的问题。在提供网站列表的同时,AltaVista的搜索结果还提供一种看起来无关紧要的关于“链接”的信息。链接造就了网络的活力,当计算机用户想要了解更多信息的时候,他们会找到这些突出显示的文字或者短句,点击这些链接,然后访问其指向的另外一张网页。佩奇关注的不是AltaVista提供的主要搜索结果,而是思考如何能够通过分析这些链接来收取被漏掉的果实。
佩奇的指导教师之一,赫克托 · 加西亚…莫利纳(Hector Garcia…Molina)同意他的看法,认为研究链接具有潜在的价值。看起来,AltaVista并没有对这些链接进行任何的处理,而只是把它们按原始的模样显示出来。佩奇希望深入地挖掘这些链接,研究如何更进一步地利用它们。不过,为了检验自己的理论,佩奇需要一个庞大的数据库。佩奇从来不缺乏野心,他经过简单的计算,就告诉其斯坦福大学的指导教师,他要把整个网络下载到自己的台式电脑上,这个想法把老师们吓了一跳。
从表面上来看,佩奇的想法何止是英勇无畏,简直就是可笑。他甚至宣称下载工作很简单,很快就能够完成。加西亚…莫利纳和其他教师都对此深表怀疑。然而,佩奇对此相当认真,而且拿定主意要为自己的研究做好万全准备。他有很好的合作伙伴。在1989年发明了万维网的英国科学家蒂姆·伯纳斯…李(Tim Berners…Lee)曾经提出这样的说法,认为信息饥渴的计算机用户可以点击突出显示的文本,从一个文件跳到另外一个文件。对一位富有远见的计算机专家而言,网络就是链接。
1996年慢慢过去,在此期间,佩奇和布林合作进行下载和分析网络链接的工作。获取数据的过程比佩奇预计的要长,而且他估计他们每放一个网络爬虫程序出去搜集整个网络,计算机科学系就得为此支付2万美元,但是他急于完成这项工作。他想要发现这些自动化的交叉指代的重要性。他的研究目的不但吸引了布林的注意,还吸引了布林的指导教师莫特万尼的注意。因为,这项工作有希望改进网络搜索。布林之所以加入这个项目,一是因为他很希望能够与佩奇一起工作,二是他一向对从大量随机数据中提取信息很感兴趣,而这个项目恰恰与此相关。如果布林想要发挥他数学和编程的优势,还有哪个舞台比互联网更广阔呢?
佩奇建立起了自己的理论模型——可以通过计算指向某个网站的链接的数量来确定这个网站的受欢迎程度。尽管受欢迎程度并不总是同价值相关,不过,他和布林都生长在学术世家,非常重视发表在学术期刊上引用了诸多相关文献的学术研究成果。而对佩奇来讲,在某种意义上,链接就像是文献引用。科学家会引用那些同自己的研究相关的已出版的文献,而这些引用可以帮助学术研究界确定某项研究成果的价值和影响力。“文献引用非常重要,”佩奇说,“事实证明,获得诺贝尔奖的科学家们引用了上万种不同的文献。”他还说,“如果你的成果在相关科学文献中被大量引用,就说明,你的工作非常重要,因为很多人都觉得它值得一提。”
而佩奇得出的结论是,同样的道理也适用于网站。他更进一步取得了概念上的突破:并非所有的链接都具有同样的价值,其中一些比另外一些更重要。佩奇赋予从重要的网站上发出的链接更高的权重。那么,他又如何确定哪些网站更重要呢?很简单,指向哪个网站的链接多,哪个网站就重要。换句话说,如果人气很旺的雅虎主页上有指向某个互联网网站的链接,那么这个网站马上就变得重要一些了。佩奇把自己的姓氏同自己正在处理的这些文件巧妙地结合在一起,为他的链接评级体系起名为“PageRank”(网页序列等级)。
《撬动地球的Google》 第一部分搜索的关键问题
佩奇的另外一位指导老师,斯坦福大学的特里·维诺格拉德(Terry Winograd)教授称,解决网页排序问题的学术出路,最终取决于弄明白通过追踪链接到底可以发现什么。“一开始,拉里的想法是进行随机的网络浏览,就像是在网络中漫无目的地漫步。这套算法(一系列数学方程式)是为普通的网络用户发明的。大部分时候,他们在某个网页上点击一个链接,就会到达网络上的某个目的地。对这个过程的提炼造就了PageRank。”
布林和佩奇相信,把PageRank算法应用于互联网,可以作为他们博士论文的研究方向。1997年初,佩奇打造了一个叫“BackRub”的简单的搜索引擎。这个搜索引擎之所以叫“BackRub”是因为它主要处理反向链接。佩奇一直善于精打细算,他把自己的左手平放在扫描仪上,将自己的手纹转化成了一种黑白的图片,而这就是BackRub网站的标志。布林、佩奇和莫特万尼都为这个正在形成的项目贡献了自己的创意。莫特万尼说,不久,他们就清楚地意识到,这个项目不仅仅是一个继续他们的学术研究的途径。尽管事先并没有想到,不过当这三个人把自己的排序方法应用于互联网的时候,却出其不意地解决了互联网信息搜索的一个关键问题。
“他们从来没有郑重其事地坐下来,然后说,‘让我们来发明下一个伟大的搜索引擎吧。’他们只是想要解决有趣的问题,又碰巧想到了一些不错的创意,”莫特万尼说,“拉里贡献了一些想法,谢尔盖贡献了一些想法,我也贡献了一些想法,我们都参与了项目的创意。渐渐我们发现自己正在建立一个完整的搜索引擎。”维诺格拉德也同意他们的想法是一天天逐渐发展成熟的,“他们一开始并没有想要成立一家公司,不过他们确实想要创造更优越的搜索方式。”
布林、佩奇和莫特万尼一起建立了一个复杂搜索引擎的雏形,供斯坦福大学内部使用。这个搜索引擎以传统的搜索引擎技术为基础,并引入了PageRank算法,因此,用它在互联网中搜索信息,得到的结果在相关性上比以往的引擎要优越得多。其他引擎主要依赖将搜索与句中的词语同网页上的词语进行比对来进行搜索,而PageRank则更进一步,将搜索结果以逻辑形式排序之后再呈现给搜索用户。这是第一次,人们可以迅速地在互联网中进行搜索并迅速地找到有用的结果。
1997年秋天,布林和佩奇决定给BackRub起一个新的