按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
又指示凌小宁手下的那些工程师,在两个月内做出一个可以让比尔.盖茨看得清清楚楚的“演示模型”。
“声学模型”的要点在于识别语音。“语言模型”的要点是识别语意。用李明镜的话来说,“声学模型”是识别“一”,“语言模型”是识别哪一个“一”。
比如说到“中华人民共和国主席江泽民”的时候,人人皆知是这个“江”字,但机器不行。“江”有30个同音字,凭什么让它给你出来个“江”而不是个“姜”
呢,这就要把“江”和“泽民”之间连接的概率定得最高,而“姜”和“泽民”之间连接的概率定得最低。这就是“模型”。人根据“模型”来训练机器,机器根据训练的结果来识别国家主席。这样看来,李开复的这些要求,几乎包括了“声学模型”和“语言模型”两个方面全部最难解的问题。他的雇员们全都知道,在如此短的时间里,只是解决其中一个问题就已经够呛,现在他们却要拿出一大堆好的结果。
但是无论“声学模型”还是“语言模型”,“引擎”
都是其中最基本的部件。它的作用是把声音读出,并且423以文字方式显示出来。你可以把“引擎”想像成汽车的发动机,也可以把它想像成一套推理的逻辑和方法。不同的语言之间存在共同的东西,所以才有可能翻译,语言引擎在本质上并无不同,希格玛大厦才能将黄学东小组现成的英文“引擎”拿过来使用。但要让它识别中文,就必须给它不同的数据模型,这也正是李开复小组、王坚小组和黄昌宁小组要解决的问题。语音识别比之文字识别更加困难的地方,是同样的字在不同人嘴里会发出不同的声音。李开复的目标既然是“不特定语者”,那就要让机器识别所有的声音。其具体的操作程序,既简单又繁杂:在广东、上海和北京3个城市中,选择男女老少各500人。每人均以地方方言和普通话两种方式说话250句,将声音一一录音整理。简单说,就是收买各种各样的中国话,来训练和调试既成的“声学模型”。至于“语言模型”小组的注意力,则全部集中在纠正拼音错误的方面。李明镜又在完成眼前任务的同时,试图解决更加长远的问题。他给自己提出的问题是,“能否让机器在不断使用的过程中适应说话的人。使用得时间越长,也就越好用。”这个概念在以往的拼音输入法当中叫做“自适应”,现在李明镜要将它用在语音识别中。
424到了夏天结束的时候,研究院的“语音识别系统”
居然真的装进了50000个词,就像李开复当初期望的一样。但是,现在还不是得意洋洋地说“那是我‘儿子’”
的时候。他们还必须把研究院的成果变成可以看得见的东西,并且和微软公司那个包括英、日、中文的语音识别大系统连接在一起。这就要依靠软件开发部的智慧和操作来完成。
如果说研究员的作用相当于设计师,那么,技术开发工程师的作用就是提供设计工具以及把设计图纸变成现实。如果一个研究员的“图纸”相当于整部机器上的一个零件,那么开发工程师的作用就是把所有零件衔接在一起。具体到凌小宁领导的软件开发部,主要职责有三:开发研究工具以提高研究员的工作效率;把研究员的新思想变成技术原型;在技术原型的基础上完成技术转移。所以,希格玛大厦里的“开发”,在某种意义上又被叫做“整合”或者“集成”。就这些职责的本身来说,乃是继承了微软公司的既成制度,但凌小宁的软件开发部却在其中创造了一套新的方法:对于技术采取“模块化处理”,最终形成一种井井有条的结构,这同以往技术425开发的混沌一片的结构形态成为对照,所以当比尔.盖茨听说此事之后,不禁大感兴趣。
1999年秋天参与语音识别小组的软件开发工程师名叫孙燕峰,按照他的同学的说法,此人是清华大学有史以来最好的硕士,也是最有钱的学生。这话听来有些夸张,但研究院开发小组的工程师们都说,孙是具有最优秀的整合思想和整合能力的人。所以,凌小宁在这个关键时刻,让他来负责整合语音识别系统。
无论从哪方面看,孙燕峰都是一个天生的工程师。
他11岁开始学电脑的时候,就完全不像别的孩子那样只知道玩游戏。他对编程的耐心超过了成人,白天写的程序没有完成,晚上躺在床上就会睡不着觉。父亲不懂计算机,但却鼓励儿子的兴趣。那时候父母每月的工资加在一起才100多元,可是买一张软盘就要十几元。燕峰不敢买一盒(10张盘),那样父母一个月的工资就没有了,只敢买一张。父亲也不知道这么贵的东西有何用处,却毫不含糊地把钱给他。孙从小到大,父母为他操心无数,但他独对这些情节念念不忘。他说:“有些父母要求自己的孩子做这个做那个,不许做这个不许做那个。他们从426来没有这样对我。”父亲从小喜欢画画,但自从当兵之后,就没干什么正经事情。“支左”啊,“游行”啊,就算有了画画的机会,也是画标语,画毛主席像。父亲也许是因为一辈子都没能痛快地干自己喜欢的事,所以对儿子格外宽容。计算机这东西他虽然不懂,但孩子喜欢得睡不着觉,就该满足儿子。他过去也曾睡不着觉,不也是因为不能做自己想做的事情吗?燕峰从12岁开始获得北京计算机编程比赛的奖项,从此,获奖就成了这个孩子每年必有的科目。凭着一大堆奖状,他免试进了清华大学,又免试读了硕士。人说,中国的孩子必经三大关:高考,考博士,考“托福”。他说他一关都没过,“也混到了今天”。说是“混”,其实一点也不轻松,他在1999年7月来到研究院之后,连续几个星期都在苦思冥想,童年时代那种睡不着觉的感觉,重新出现。
秋天开始的时候,语音识别系统的演示模型进入最后的整合阶段。孙燕峰和邸硕来到雷德蒙微软总部。邸硕负责解决“模型”本身的问题,孙燕峰的责任是把“模型”融入到一个更大的系统里面去。他一边在心里计算,至少有3个星期的时间来解决问题,一边从容地写下他427的第一组代码。
但就在这时候,他接到凌小宁的电子邮件。凌告诉他,国内的国庆节假期比往年延长了好几天,研究院的工作日也相应减少,所以他必须在两周之内完成全部工作回到北京。因为向比尔.盖茨报告的时间已经更加急迫。
9月14日,孙燕峰带着他的已经调式好的1000多行程序源码,回到北京。这时候距离他离开的日子刚好两周。他马不停蹄地来到办公室,用了半天时间就把汉语语音识别的演示模型和雷德蒙的大系统连接起来。他松了一口气,凌小宁也说:“你可以到张宏江小组去支持他们的‘搜索引擎’了。”可是两天之后,凌又来找他,说,“停下你的‘搜索引擎’,从明天开始,全力支持语音组。”
李开复小组和王坚小组已经开始最后冲刺。研究员们每个小时都在改进自己的系统,也要求工程师同步改进相互衔接的环节。这时候,“背水一战”的念头已经不仅是李开复一个人的,所有的人都在说着同一句话:“只有成功,才能争取比尔的信心。”那些初来的学生,现在回想起几个月前的闲散,方知什么叫做“全力以赴”。
4289月的最后两周,希格玛大厦第五层发生的事情似乎证明:如果没有限制,人的智慧和激情是无止境的。研究工作已经不分昼夜。大家原来都说,国庆将要放长假,所以要抢回一些时间。可是到了国庆的“假日”,所有的人还是没有时间放假。比尔.盖茨在太平洋那一边赞扬微软中国研究院的消息,不断传过来,让这一边的中国年轻人更加斗志昂扬。紧张气氛一直持续到赴美飞机起程前的最后一刻。那一天是10月13日,张益肇直到凌晨还呆在电脑前工作,王坚则始终在修改他的“界面”,语音小组的人都在这里:研究员和副研究员、总工程师和工程师。李开复已经在美国,和这边的凌小宁保持着频繁联系。直到天将破晓,终于大功告成。众人离开希格玛大厦,走进永和豆浆店,一边大口嚼着油条喝着豆浆,一边庆祝研究院的第一个技术成果,欢声笑语淹没了所有的疲惫。一个小时之后,王坚和张益肇携带着众人的智慧和心血,直奔机场。一个在嘴上念叨着:“3个月以前一行东西都没有,现在居然做成了。这种事情在中国不可想像。”另一个说:“在美国也不可想像。”希格玛大厦这一边,曙光初照,所有的人都想起了429凌小宁说过的那句微软格言:“那是我儿子!!!”
向比尔.盖茨汇报1999年10月1日在李开复的生命中很值得留下一笔。那一天他出席了天安门广场上的国庆50周年庆典,但李开复仍然没有忘记“向比尔汇报”。他把这一天余下的时间全部用来构思汇报提纲,以后几天,闭门谢客,写出了汇报的第一稿。面见比尔在他来说毕竟少有,所以他将准备工作做得格外仔细,力求万无一失。他甚至改变了自己只用电子邮件的习惯,与雷德蒙微软总部接通电话,请那些曾“向比尔汇报”的同事和朋友,给他几句忠告。经过几轮电话之后,他将各项忠告整理如下:从一个项目说起。
详述工作的创新性。
随时准备回答比尔提出的尖锐问题。
430别想用一些模棱两可的话蒙混过关。
他斟酌再三,决定接受朋友的忠告。不过,他不打算从“项目”说起,而是自行其是,从一组概念说起,从研究院的人说起。他的这组概念产生于9月研究院的一次全体会议。共计6项,若以英文描述,则是6个以“P”开头的单词,所以又被他叫做“6P策略”:People-研究人才;Programs-合作项目;Publications-学术著作;Patents-发明专利;Prototypes-技术原型;Product-技术转移10月的第三个星期,微软中国研究院有一大堆人来到雷德蒙。李开复当众演练一遍,大家都说不错。于是,这些人信心十足地走进了比尔.盖茨的董事厅。
向比尔.盖茨的汇报安排在1999年10月18日上午10时至11时。那个早上,李开复和研究院的6个研究员431--王坚、李劲、周明、高剑峰、沈向洋和张益肇,驱车进入雷德蒙微软总部,看上去有点“憨态”。大家第一次穿上完全一样的衣服,不过不是西服。李开复事先特别关照大家,不要西服笔挺。但大家还是精心选择了一种随意当中最正式的做法:全都穿上研究院“院服”--全黑色纯棉夹克。李开复稍有区别,穿着一件“波罗”
上衣。几个小时以后,大家卸去几个月的紧张和疲劳,一同出去吃饭,庆祝他们第一回合的成功。但现在,6个人想到即将开始的汇报,不免紧张。李开复试图让大家放松情绪,半真半假地说:“万一我有问题,大家都要帮一把啊。”比尔.盖茨的办公室设在8号楼第二层。这是一座星型的两层建筑,白色外装饰和墨绿色的玻璃交相辉映。
从正门进去,顺楼梯拾阶而上,向右拐,走进迷宫一般的走廊,目不斜视地深入进去,再向右转,两侧办公室的高大门窗忽然稀疏,比尔.盖茨的董事厅就到了。以市值5000多亿美元的公司价值来看,这里既不宽敞,也不豪华。四围镶以本色的原木饰板,地面则是浅驼色的地毯。一侧是一扇巨大的木制门,一张咖啡色的会议桌432占了房间的大部分。靠着走廊的一面,两扇门之间全是落地窗户,透过窗户可以看见走廊对面比尔.盖茨的办公室。另外一个显眼“装饰”,就是一个巨大无比的显示屏幕。李开复和他的同事在早上8点钟就站在屏幕前,反覆试验将要演示的内容。临近10时,又有几个人进来,有里克.雷斯特、凌大任和黄学东。大家衣着果然随便,轻声说笑,等待那位“世界首富”的到来。
比尔.盖茨比预定时间迟到5分钟。身着咖啡色衬衣,没有领带,没有寒暄,也没有像往常那样坐在正中的位置。他在会议桌的一角坐下。任何人都懂得,他坐在哪里,哪里就是中心。
李开复开始汇报,一边讲话一边把事先制作的幻灯片投影到屏幕上。比尔.盖茨无数次地插话。“至少每3分钟打断一次。”当时在场的一位研究员说。他的问题有时候极为认真,比如他听说李开复找来不少多媒体的专才,就担心这会引起中国人的不满,询问怎样才不至于让当地学校认为微软在“抢人才”,还说“与各个大学保持良好的关系对我们同等重要”。但有时候,他的问题多少带有调侃味道。李开复提到当年邓小平摸着李劲的头433说“计算机要从娃娃抓起”,还出示邓小平和李劲在一起的照片。然后又说:“那个娃娃如今就在这里。”比尔.盖茨笑道: