在我的机构里,我不容忍官僚作风,不容忍傲慢作风,更不容忍明争暗斗。
我不赞成你,但我支持你从客观的情况看,李开复的这种表现是很自然的。
他的经历如他自己所说,有着“自由、真诚、平等”的共同特征。这一点当他还是一个学生的时候,他的导师233罗杰.瑞迪便给了他多次镂心刻骨的体会。那时候李开复追随他的导师研究计算机语音识别系统。作为导师,罗杰.瑞迪的最杰出的所在,与其说是他的学问,倒不如说是他的眼光和品格。他似乎有一种天助神佑般的感悟力,知道通向未来的道路在哪里。作为科学家,他并非全知全能,即使在他熟悉的领域中,情况也在迅速变化,为他所不能掌握,但他知道怎样去看待一个自己不懂的领域,知道怎样用一些最困难的问题去激励一些年轻人的热情和想像力。如果他的学生李开复向他说出3个研究题目,他能够十分肯定地回答,其中一个问题根本无用,不能做;另外一个虽然有用但价值太小,不值得做;第三个才是精彩的想法,但若实现这想法至少需要10年。
罗杰.瑞迪是美国一个总统特别委员会的成员。他因自己的远见卓识受到政府尊重。但他不喜欢任何社会活动,只一心沉浸在计算机的世界中,中午也不正经吃饭,通常是叫人家送一个比萨饼来,一边吃一边和大家讨论。李开复入学伊始,问他应该做些什么课题。他说:“这样吧,你做一个不特定语者的语音识别系统。”这话234现在已经没有什么新鲜含义,但在80年代初期,这还是一个无解之题。那时候人们所研究的语音识别系统,只能识别一个人的声音,所以也叫做“特定语者”。没有一个人能够想像让机器听懂所有人的话。所以,罗杰.瑞迪的这句话,可以说是开创了语音识别研究的新纪元。
事实上,语音识别的研究在当时正在山穷水尽的窘境中,有人撰文说它即将衰落,美国国防部在收缩投资。罗杰.瑞迪自己也不知道答案在哪里,但他的直觉告诉他,这个问题是有解的。
这次谈话之后不久,罗杰.瑞迪把一个15年至20年的研究计划交给李开复,还告诉他研究经费没有问题。
李开复很快发现,罗杰.瑞迪给予他的支持远不止这些。
那个暑假,李开复对罗杰.瑞迪说,他觉得用人工智能的办法研究语音识别没有前途。李开复的这个想法不仅不合适宜,而且也和罗杰.瑞迪的想法相悖。那时候“人工智能”为所有专家信奉,所以又称“专家系统”,其要旨是用机器来模拟人的语言能力。就像是教给一个婴儿识别“爸爸”、“妈妈”的含义,再让他学会说出口来。
直到17年以后,李开复还记得当年研究的若干情形。整235个过程很像是一个婴儿在学习语言,区别只在于这“婴儿”是一台机器。专家们以20个人的声音反覆训练,结果发现这“婴儿”居然能听懂也能说出话来,就像是一个真的婴儿在讲话。这一成果令全美轰动,人们把它作为一个重大发明,罗杰.瑞迪信心十足地计划着在这条道路上继续走下去,李开复也跟着写了一篇论文,文字优美,结论精致,说语音识别率已经达到95%。但李开复很快就发现,“专家系统”其实没有用。道理很简单,“婴儿能够长大成人,机器却不能成长”。所以当他用另外100人的声音重新检验原来20种声音的实验成果时,立刻发现这机器不灵了。
李开复准备另辟蹊径。他告诉罗杰.瑞迪,他对“专家系统”失去了信心,要使用统计的方法。他坚信,导师的方向正确但方法错了:对于“不特定语者”的研究来说,一个太小的数据库--20个人,所产生的结果,无论多么精彩也没有意义,而大数据库则不能避免统计的方法。罗杰.瑞迪听了这些,并没有信服,但他却被眼前这个年轻人的锐利和激情所感染。他说:“你对人工智能没有兴趣,我不同意你的看法,但我可以支持你用236统计的方法。不过,我提醒你,过去有人用统计方法做过类似的工作,都没有成功。”李开复说:“那是因为他们的语料数据不足。”
罗杰.瑞迪说:“你喜欢大语料,我可以去找国防部,让他们出钱建立一个很大的语料库。”这时候是1984年的春天,罗杰.瑞迪麾下15位专家坚持使用“专家系统”,只有李开复走上了另外一条道路。周围的人从根本上不同意他的方法,自然不能给他帮助。只有一个师兄例外。师兄正在国际商用机器公司做他的论文,他赞赏李开复的想法,还很慷慨地把自己的语音知识倾囊相授。
这样的局面维持了一年,罗杰.瑞迪许诺的大语料库真的建起来了,但李开复一无所获。次年暑假,他给一个“天才班”的孩子们开设计算机课。课程是为一种很流行的棋编制程序,叫做“奥赛罗”。他带着一群孩子,一边玩一边学,还参加了全美的竞赛,所向披靡。州长来参观,很高兴地说:“真是天才。”其实李开复心里明白,这个棋的特点决定了,一个二流棋手编的程序,就可以打败一个一流棋手。
237但他依然发现了自己梦寐以求的东西。暑假快结束的时候,他对罗杰.瑞迪说,他要暂时放下“语音”,继续他的“奥塞罗”。瑞迪问需要多长时间。他说:“一个月就可以打败世界冠军。”瑞迪不能完全明白这年轻人想要干什么,但他没有犹豫就再次支持了他。
李开复心里已有主张。他是想在“奥塞罗”上彻底检验统计的方法。他带着一个名叫萨卓依.玛哈俊的高中学生,设计了很多算法,把原来只有400行的程序增加到20000行。大约花了一个月做系统,又用了两个月把统计方法做进去。困难超过了他的想像,但成功也超过了他的想像:“奥塞罗”的运算快了1000倍。
李开复独自一人享受他的艰辛和成功。这一年,他23岁,已经感觉到思想者的孤独。不过,并不寂寞,他有“奥塞罗”为伴。
那几个月,李开复和萨卓依足不出门,不分昼夜驱动电脑下棋。由于机器运算速度提高了1000倍,棋下得很快,总共下出40000盘完全不同的棋谱,每一谱走60步。这样,他们得到了240万(40000×60)种不同的走法。依据最后结果,将每一步都定义成最终“黑赢”或238者“白赢”,还精确统计出赢的概率。你每下一步棋,电脑就会告诉你:赢的概率是0。5。再下一步,可能就成了0。49。你若犯了一个大错误,它会告诉你,赢的概率是0。000……一旦出现这个概率,你就不用再下了。
现在,两个年轻人要发表论文了,还要带着他们的“奥塞罗”参加世界计算机比赛。但这需要钱。他们忐忑不安地找罗杰.瑞迪。瑞迪说,没有问题。他们发表了一些论文,花了瑞迪3000美元;通过电话参加比赛,又花了瑞迪1000美元。那次比赛的情景,至今想来令人激动。李开复的电脑和一个世界冠军棋手对阵,约定两盘,但第一盘,冠军以8∶56败阵。第二盘,干脆弃权了。冠军说,他根本就没有办法走下去。这样看来,李开复真的制造出一个“无敌棋手”。经此一役,“无敌棋手”再也找不到对手,只好回家歇着去了。然而李开复却不会歇着。他说:“最重要的是让我对统计概念有了信心。对大数据库的概念有了信心。”他在几年以后实现的语音识别技术的重大突破,恰与现在这个“无敌棋手”一脉相承。
这年秋天,李开复终于有了一个同盟者。那是从台239湾来的一个学生,名叫洪小文,比李开复还年轻。就从这时起,两个年轻的中国学生相互鼓励,坚定不移地标新立异,真有“疏枝立寒窗”的感慨。多年以后,洪小文回忆起这段经历,以“良师益友”来描述李开复,又以“共渡难关”来描述当日情景。
说是“难关”,一点不假。专家们全都不赞成两个青年的“胡闹”,罗杰.瑞迪也不能认可,但他与别人不同,他始终告诫自己的学生:“你如果有信心,就坚持做下去。”他为两个学生提供最好的机器,寻找最新的资料。
到了暑假,两个学生要到公司去打工挣钱,罗杰.瑞迪说:“你们到外面打工,不如在这里继续你们的研究。人家给你们多少钱,我也可以给你们。”年轻人回到了语音的领域。李开复每天工作大约17个小时:上午9点起床,到学校完成自己必须做的事情,中午回家,从1点钟工作到凌晨2点。每天如此,一直持续了大约三年半。他和洪小文写了很多论文,还写了至少10万行程序。
1987年5月,年轻人的世界出现曙光。李开复把语音系统的识别率,从原来的40%一下子提到80%。罗240杰.瑞迪惊喜万分,立即决定把这个结果带到国际会议上。李开复大着胆子说:“这是我做的结果,我自己去讲好不好?”瑞迪说:“当然可以,我让秘书给你订机票。”出发的那天,李开复开着他的已有15年车龄的轿车来接导师,走到一半路程,车子冒烟,汽缸爆了。师生二人只好转乘出租车,学生很沮丧,老师嘴上说没有关系,心里却说:“这辈子再也不坐开复的车子了。”
导师依旧满怀激情地把学生介绍给全世界。不消说,李开复的成果在会上引起轰动。他的工作不仅具有技术的价值,而且将全世界语音研究领上一条新的道路。
不过,在1987年初夏的会议上,李开复对这一切还不能满意。“我还有一个重要想法没有实现呢。”他说。
他回到自己那个寂寞的小屋,继续每天17个小时的工作。
真正激动人心的时刻,发生在1987年圣诞节前的那个早晨。李开复起床,照例去看电脑,语音识别率居然达到96%。他不信,以为是计算机搞错了。再做一次,还是96%。他飞快地跑出去告诉洪小文,又飞快地跑回来告诉妻子。直到十几年后,回忆起那个早晨,李开复还是抑制不住地兴奋:“这是我从事研究以来最高兴的一241天。”妻子为他高兴,提议中午到饭