跳至主要内容

学徒(三)


王博士带两人去员工咖啡厅休息。这里舒适宽敞,提供各式饮品和点心。休息时大家闲聊了几句,得知王博士年少时学过点钢琴,还学过一段时间的萨克斯风,不过水平都有限。短暂休息过后,大家回到会议室,开始进一步的深度访问。

沈沛问王博士,机器演奏钢琴有着悠久的历史,自动钢琴在百年前就发明出来了,学徒为什么与众不同?

王博士说,不同的地方在于「智能」。以往的设计,无论采用什么原理,都需要人类的调教。从古早的打孔纸带,到现代的电子程序,原理都是把人类演奏记录下来,再由控制装置操作钢琴。虽然脱离了人类手脚的实际操作,始终还是由人来把控的。而学徒最初的设计目标就是让人工智能理解音乐,学徒对音乐的演绎是完全自主的。输入任意一首乐谱,学徒会自行思考如何处理。学徒的演奏不是一成不变的,每次都会有随机的变化。学徒会根据以往的经验改善自己的表演,日臻完善。

沈沛说道:「这简直是跟人类学琴一样啊!」

王博士继续讲道,通过经验来学习,这种设计方式正是对人类智能的模仿。正如飞机的设计模仿了鸟类和昆虫,人工智能的设计同样参考了目前所知的唯一的高级智能,也即是人类自身。机器模拟人类的学习行为,从数据和经验中总结规律,改善自身,这种手段被称之为机器学习。

机器学习涉及到高深复杂的数学知识,无法向沈沛详细说明。王博士尝试用简明易懂的方式来讲解学徒的设计原理。

首先要为学徒设计一个「大脑」。如果没有大脑提供的分析、记忆能力,任何经验都会左耳入右耳出,无法将经验提炼为知识。在早期的人工智能研究中,「大脑」的设计充满了人造的痕迹,预先加入了许多知识和条件规则。就以钢琴演奏为例,设计者会加入演奏的规则,比如慢板和快板分别对应怎样的弹奏速度。人工智能记下这条规则,遇到慢板和快板时就按照规则处理。但是,设计者能人为提供的知识总是有限的,不能应对所有情况,使得人工智能局限于特定用途;再者,这些预先提供的知识可能是有害的,妨碍了人工智能的自主学习,给人工智能的发展加了一道天花板。

现行设计则是受到人脑的启发。人类的大脑经过了数百万年的进化,是大自然的奇迹。人的大脑天生就是多功能的,能处理变化多样的任务,具有强大的可塑性。人脑有超过一千亿个神经细胞,细胞间可以传递生化信号,构成了一个复杂的网络。人脑工作时,并不是靠单个神经细胞去完成特定的任务,而是利用神经网络集体地、并发地运算。人脑神经细胞间的连接可以增强或是减弱,所以神经网络并非一成不变,而是不断演化。这个演化的过程,正是人类学习的过程。

学徒的大脑参照人脑,由一个个神经元组成网络,被称之为人工神经网络。人脑存在着生物的限制。比方说,人脑消耗的能量来自于食物;受限于人类的消化系统,人脑的功率存在极限。再比如说,人脑过大会增大新生儿出生的危险,导致最近一万年里人类大脑容量缩小。而人工神经网络是数字化的、虚拟的,虽然受到生物学的启发,在设计上采用了更为实际的方法,利用了统计学和信号处理的研究成果。

简单地说,学徒最开始有一颗婴儿般无瑕的大脑,里面蕴含了学习的潜能,却没有加入任何人为的条条框框,一切知识都要靠人工智能自己去摸索。

有了大脑之后,学徒需要演奏钢琴的手脚。学徒是一台机器,可以轻而易举地在技巧上超越人类,比如说给学徒安装上八十八个手指。研究团队认为,如果只是用技巧暴力地超越人类,那就违背开发人工智能的本意了。开发学徒的目标是理解音乐,而不是操作上的噱头。所以学徒最终拥有了与人类类似的双手,只做了一些工程学上的改良;还有三只机械脚对应钢琴的三个踏板。

此外,学徒还需要「眼睛」来读乐谱。一开始研究团队考虑过为学徒安装摄像头来阅读实体的乐谱。后来发觉这样做不但平添了多余的工作量,而且过于形式主义了。学徒能连接存储设备阅读近乎无限量的乐谱,没必要去翻阅真实乐谱。所以学徒并没有物理上的「眼睛」,而是直接阅读数字化乐谱。

最后,学徒需要「耳朵」来听音乐。钢琴的音色很复杂,如果学徒要掌握细腻的技巧,那就需要听清音乐的细节。所以研究团队和专业的音乐公司合作获取专业数字化音乐,在实验室中也安装了顶级的录音设备。
当一切准备完毕后,学徒开始了它的学琴之路。

学徒首先需要培养音乐品味,学会判断音乐的好坏。有了音乐价值上的判断,学徒才有演奏的目标。否则,学徒根本不知道自己弹得好不好,不知道应该向哪个方向努力。一开始研究团队向学徒灌输了许多著名钢琴家的录音。学徒一边阅读乐谱,一边听钢琴家的表演,在乐谱和音乐之间建立关系,学习怎样演绎音乐。可是这样做存在一个重大的难题。如果学徒单一地学习某一位钢琴家,学徒就成了他的复制品;如果学徒学习众多不同钢琴家的演绎,就会面临不同钢琴家之间风格的矛盾。即便学徒能融汇众家之所长,它对音乐的理解也是狭隘的;因为音乐是无限的,而它能学习的录音是有限的。研究团队希望学徒能拥有自己的品味,而不是局限于人工选择出来的那些钢琴家的品味。学徒不应单纯地模仿,要有自发的创造。

讲到这里,王博士问沈沛有没有听说过「监督式学习」和「无监督学习」。沈沛在过去的科技报道中对此略有接触。沈沛说,他觉得监督式学习是用来让人工智能判断一张照片里有没有小狗,而无监督学习是把小猫和小狗的照片分成两类。

王博士说,这样理解可能有些过于简单,但是大体上是没错的。所谓监督式学习,是预先给一些事物打上标签,比如沈沛提到的例子,就是给一些照片标注上「照片里有小狗」和「照片里没小狗」。人工智能用这些有标注的数据来训练,归纳总结其中的规律,所以这些数据被称为「训练数据集」。当训练完毕后,人工智能要处理没有标注的数据,比如任意的一张照片,再回答其中有没有小狗。

就学徒这个项目来说,如果采用监督式学习,那就等同于告知学徒这些钢琴家的演奏是「好」的,另一些业余的、随机的演奏是「坏」的,从而让学徒理解音乐的好坏。但是,正如之前解释过的,这样做会使学徒的品味过于狭隘。毕竟判断音乐好不好、有多好不是像「照片里有没有小狗」这样是非分明的事。

另一种方法是无监督学习。依旧采用沈沛提到的例子,一组照片中混杂了小猫的照片和小狗的照片。在训练时,人工智能并没有被告知「这个是小猫」或「这个是小狗」,甚至于不理解什么是小猫、什么是小狗。但是,当人工智能被要求将照片分成两类时,人工智能可以分析照片的特点,将小猫分成一类,把小狗分成另一类。

放在学徒的项目上来讲,就是给学徒听大量的音乐,然而并不直接告诉学徒那些是好的,哪些是坏的,而是让学徒自行去分类。如果学徒每次都能成功地把好坏分成两类,那么学徒就间接地学到了什么是好音乐。

事实上,这一方案同样遇到严重的技术难题。因为音乐的分类太多样了,难以保证学徒不会把音乐分成「演奏快速」和「演奏缓慢」,或是「音量大」和「音量小」。如果人为地帮助学徒选择,又会给学徒加入偏见。
最终的方案是将两者相结合,构建多层次的复杂价值网络。研究者提供人类所认为的「好」音乐,同时也保留让学徒自行判断分类的余地。这一研究过程是艰涩、痛苦的,研究团队数次更改设计,甚至一度丧失信心。有一个问题就像是挥之不去的阴影,始终徘徊在每位研究者的心中。这个问题就是:音乐的价值判断是绝对的吗?一首音乐是绝对上的优秀,还是只在人类听来比较悦耳而已呢?有部分研究者认为,音乐的判断是主观的,没有客观的评价标准,所以学徒的训练目标是虚无缥缈、完全徒劳的,因此退出了团队。另一部分的研究者则认为音乐的好坏是存在客观区分标准的,比如说好的音乐更有序、更和谐,虽然人类目前无法用精确的方式来描述,但是必然存在一个客观标准,学徒的目标就是朝向这个客观标准努力。

沈沛向王博士提问,那么您认为音乐有没有客观评判标准呢?王博士笑了笑,说:「我是第三类人。我不知道音乐有没有客观评判标准,但是我相信人工智能一定能比机械式演奏做的更好。假设钢琴演奏是一场考卷,终极的目标是满分一百分,现有的技术只有二十分。比起论证能不能实现一百分,我想先努力考得更好。」

事实证明王博士的思路是正确的。这毕竟是一个工程项目,不管存在怎样的理论争议,最终还是要靠实践来检验。

实践的方法自然就是让学徒来弹钢琴。学徒已经有了音乐知识和动作灵活细腻的手脚,接下来就是在钢琴上训练。学徒每弹奏一个音符,都会把姿势、力度、音量、音色等要素牢记在心,建立起动作与声音之间的关系来。直到最后,学徒每做出一个动作,都能提前预测琴声效果;每听到钢琴的声音,学徒就立即知道这声音是怎么演奏出来的。因为钢琴的音色复杂,这段训练同样是艰苦而漫长的。为了避免长期使用同一钢琴造成偏见,导致只认得一台钢琴,学徒在训练中更换过数台钢琴。

一切训练完毕后,学徒正式开始摸索如何演绎音乐。学徒用自己的手脚,向着自己的音乐理想努力。学徒一开始的演奏是生涩的,还出现过数次程序错误,某些复杂音阶总是处理的不好。研究团队尝试改良学徒的人工神经网络,再重新训练学徒。学徒的研发是迭代式的,周而复始地重复上述的研究步骤,每一次迭代都使学徒变得更优秀。直到今年年初,学徒终于出师了。

评论

此博客中的热门博文

读古龙的《英雄无泪》

说起来这本书可以算是古龙最后一本像样子的小说。按照网上资料,《英雄无泪》出版于1979年,同年还有一本不知所云的《午夜兰花》。写《英雄无泪》时古龙刚过不惑之年,他的创意少了,可是笔力、精力都处于成熟期,假以时日未必不能更进一步、再攀高峰。只可惜命运给他来了一下狠的。古龙于1980年负伤入院,之后受健康状况的影响,创作力急剧下降,再也没有写出什么像样子的小说了。 《英雄无泪》篇幅不长,在古龙作品中算是比较中庸的一本,保持了古龙一贯的优点,同时也没能摆脱一贯的缺点。虽然难称佳作,却很能体现古龙的写作风格。 先说优点。古龙的一大特色是描写偏离主流、甚至畸形的人物,与金庸、梁羽生笔下高大上的主角们形成鲜明对比。《英雄无泪》表面上的主角是高渐飞,实际上的核心角色却是卓东来。卓东来先天残疾,不是「完整」的男人,而且母亲难产而死,双胞胎弟弟也胎死腹中,导致卓东来始终摆脱不了自卑与自责。同时他又是一个爱美、有野心、心狠手辣的人,理想与现实的对比造成他内心的矛盾,使他陷入了病态。卓东来耗费一生精力打造司马超群这个高大威武、武功盖世的英雄,司马超群像是他的弟弟、儿子、情人,更是他心中理想的投射。卓东来的人物塑造是循序渐进、层层展开的,一开始是华丽贵公子的形象,之后一步步地揭开黑暗面,使得这个虚构出来病态人物形象立体、令人信服。单凭卓东来这个人物,《英雄无泪》就值得一读。 古龙善于烘托悬疑气氛,情节发展快速流畅,在这一点上《英雄无泪》同样做的不错。《英雄无泪》开头迅速展开激烈的戏剧冲突,两大势力中一派要杀人,一派要保人,同时引出神秘的、使用一口箱子的杀手。随后的情节发展也是环环相扣,基本没有拖沓的地方。结尾谈不上多好,但大体上也把故事说圆了。 再说缺点。《英雄无泪》除了卓东来,其他角色的塑造都比较失败。 朱猛是卓东来的敌人,两人的争斗是故事主线。全书一直试图把朱猛写成一个英雄,动不动就借用旁观者的描述来印证朱猛的英雄气概。但是无论如何大碗喝酒、说话如何嚣张,朱猛的实际行动证明了他不过是一介莽夫,而且为了自己的私欲牺牲手下弟兄,与英雄两字毫不沾边。朱猛的武功和智谋都太弱了,对卓东来构不成真正的威胁,导致故事紧张感不足。 这本书的核心人物是卓东来,而占了最多篇幅的角色却是高渐飞。高渐飞是一个背景不明、性格模糊的人,在故事中像一个过客,莫名其妙地被写成了主角。看完全书后回想一下,高渐飞与整个故

读冰临神下的《死人经》

武侠小说衰落已久,老一辈武侠名家「金古梁温黄」中四位已经作古,硕果仅存的温瑞安也好多年没出过新书了。名噪一时的「大陆新武侠」同样归于平淡,成了明日黄花。在一片萧条的环境下,每当在网上聊起武侠,我总能看到有人提起《死人经》,称赞其为近年来罕有的武侠佳作。我起了好奇心,花大概一周的时间读完了《死人经》的第一卷《杀手少年》,聊聊想法。 这本书开头部分写的一般,主角惨遭灭门报仇雪恨这种故事实在太老套了。而且文字很平淡,人物对话写的尤其不好。写对话很考验作者的笔力,说什么话、怎么说话是塑造人物的重要手段之一。《死人经》里人物讲话差不多都是一个调调,而且偏书面语,给人感觉有点不自然。戏剧性强烈的地方、角色们互撂狠话时还成,日常对话就有些别扭。 很快地,这本书出色的情节就挽回文字上的那些小缺点了。主角被强盗掳走、卖到仇家金鹏堡里当奴隶,这时好戏才正式上演。主角在石堡里命悬一线,时刻处于危机之中,又处心积虑报仇,这段无论情节、风格、手法,明显是借鉴古龙的《白玉老虎》,专门培养杀手的金鹏堡几乎就是唐门的翻版。如同《白玉老虎》一样,《死人经》成功地渲染出压抑紧张的氛围,让读者时刻为着主角的将来提心吊胆。复仇故事讲究先抑后扬,主角前期越惨,后期复仇才越痛快。主角每天扛死尸,受虐待,自身无比弱小,处在石堡最底层,在绝望中拼命挣扎。主角陷害遥奴走火入魔、暗杀认识自己真实身份的杀手,随后被雪娘挟持,被设下三年内走火入魔的死亡期限,这一系列情节环环相扣,悬念迭起,写的特别好。读到这里,很惊讶于作者情节编排的老练,逐日连载的网络小说能维持这样稳定的质量真的很难得。雪娘教主角武功,让他和石堡千金上官如比武,这段明显是化用自《鹿鼎记》。主角落悬崖、奇遇大鹏鸟获得武功秘籍这段勉强算是俗而有力吧,武侠小说的主人公总是难逃落悬崖的命运。之后盗宝这段把之前的种种戏剧冲突一起引爆,处理的干净利落。 主角当上杀手学徒之后,故事陡然一变。虽说主角仍处在危机之中,却由被动转向主动。之前是受命运摆布,想放弃复仇也逃不掉,这时却开始主动出击了。主角从当初只有一腔愤恨的少年彻底转变成了冷静、聪明、阴狠毒辣的杀手。杀手学徒乱战这段写的很好,一群十余岁的少年间的血腥杀戮让人想到了《蝇王》。同时荷女这个角色开始登上前台,从配角变为两大女主角之一。荷女冷静沉着,办事滴水不漏,对主角衷心耿耿,几乎就是主角的女版化身。两人合练死人经

读格雷厄姆·格林的《人性的因素》

  据格林所说,他写《人性的因素》是为了创作一本摆脱暴力俗套的间谍小说,呈现英国秘密情报工作的真实样貌。他笔下的情报人员跟007毫无关系,像普通人一样为了一份薪水朝九晚五。如果这本书早一点写出来,我或许会更尊敬这种尝试。可是《人性的因素》出版于一九七八年,那时007的作者伊恩·弗莱明已经去世十多年了,约翰·勒卡雷的名作、写实派间谍小说的代表《柏林谍影》也出版十多年了,这时再来标榜真实未免有点故作姿态。事实上,这本书读起来非常像是约翰·勒卡雷的小说。格林和勒卡雷都曾在英国秘密情报局「军情六处」工作过,文风也比较相近,写出风格相似的小说倒也不出奇。 格林把自己的小说分成娱乐与严肃两类,后来渐渐不作区分,《人性的因素》就是两者混合。按照我的经验,这种主题太严肃的类型小说往往有点不伦不类,既不够娱乐,也不够严肃。就拿这本书来说吧,如果你期待读到紧张刺激的间谍故事,一定会大失所望。这本书采用了间谍小说中常见的「卧底」题材,故事一开始英国情报局发现情报泄漏,意识到内部有潜藏的双面间谍,之后展开了调查。格林并没有把双面间谍的身份作为悬念,很早便点明了主人公卡瑟尔就是双面间谍,前半本书都在描写卡瑟尔惶惶不可终日的心态。卡瑟尔的同事戴维斯为人冒失,成了卡瑟尔的替罪羊,被情报局毒害。卡瑟尔本打算以此为契机结束间谍工作,这时却意外地收获了重要情报,将情报传递给苏联后他的身份曝光,随即逃到莫斯科,故事就这样结束了。除了结尾卡瑟尔逃亡时的一些小波折,整本书没有什么悬疑可言,情节发展一望即知。尽管我早就做好了心理准备,读起来还是难免有些不耐烦。尤其是前半本过于冗长,让我一度想要弃书。 我能理解作者的写作追求,他就是要让故事平淡化、去浪漫化。可是这样一来小说的情节转折太过草率,反倒伤害了故事的合理性。比方说双面间谍的嫌疑人有很多,不单卡瑟尔和戴维斯,他们的上司、办公室里的秘书们都有嫌疑,总该仔细调查一下吧。虽说戴维斯的行为举止太不稳重、动不动作出把文件带出办公室这种不合规定的事,但并没有确凿的证据。格林懒得写戏剧化的推理情节,让调查人员莫名其妙地认准了戴维斯就是间谍,一点都没怀疑卡瑟尔,英国情报局的智力水准未免太低下了。还有卡瑟尔身份曝光的过程,一般来讲总要有些逻辑推演,可是小说中让一个南非官员简单地依靠直觉就怀疑卡瑟尔有鬼;英国情报局信了这个「直觉」,就派人直接去询问卡瑟尔,一点都不担心会打草