跳至主要内容

告别(六)


我的想法估计听起来荒诞不经,像是天方夜谭:我想要制造出一个和雯雯一样的人工智能。

在嘲笑我之前,请听我做一番解释。我无意也没有能力制造出一个科学怪人来。到底能不能制造出能像人类一样思考的人工智能,这仍旧是一个未解难题。我的想法其实很简单,就是想写出一个计算机程序合成雯雯的样貌和声音。我想再见雯雯一次,哪怕是虚拟的也好。依靠现在的人工智能技术,这个目标完全能够实现。我不能继续沉沦,再这样无所事事。无论想法多荒唐,这至少能让我忙起来。我在网上租用了昂贵的服务器,全身心投入到这个项目中。

我从相对简单的任务着手:合成雯雯的声音。过去一年里雯雯给我发了很多视频、音频,我有足够多的声音素材。想要重现每一个字的读音并不困难,可以说只要截取雯雯的发音就可以了。但是这样的声音必然是机械化的,冰冷生硬,没有人类的感情。当人讲话时,词语和句子间会有间隔,音调会有高低起伏,速度时快时慢,此外还有个人化的发音习惯、口音特点。我用了现成的人工智能朗读引擎,把雯雯的声音素材导入进去,再一点点地调整模型参数。这一步进展的很顺利,很快我就听到与雯雯十分相似的声音了。

接下来是模拟雯雯的外形。我从图像专业公司购买了人体数字模型,这个模型可以做动作、做表情,模拟讲话时的口型,等等。当然这个模型是计算机动画,与雯雯长得一点都不像。我的下一步就是给模型换脸。这一技术非常热门,在网上有数不清的技术资源。我使用了深度学习技术,用雯雯的照片和视频来训练一个人工神经网络,把我电脑中的模型变成雯雯的样子。

原理说起来简单,实际做起来还是要费非常多的功夫。我夜以继日地不断调整模型,以求获得最佳效果。

我采用的都是已有的成熟技术,只不过是把各种内容拼凑起来。如果有足够的资源和时间,任何一个合格的软件工程师都能做出来,实际上一些电影镜头就是这样拍出来的。但是耗费如此多的心力来重塑自己的亲人,恐怕只有我才会这样做吧。大概用了两周,我的模型终于完成了。

我运行程序,雯雯清秀的面容出现在电脑屏幕上,带着浅浅的微笑,望着我。

我对着电脑说「我想你」,然后输入指令,让程序说「我也想你」。

雯雯说:「我也想你。」

那一瞬间,我的泪水决堤了。我放声痛哭,把积攒至今的悲痛一股脑地释放出来。我这份心情,只有失去过自己最爱的人,才能真正体会。

我擦掉泪水,洗了把脸,重新平复心情,继续和雯雯聊天。说是聊天,其实不过是我自言自语罢了。我向雯雯发问,再替她作答,只不过是借用程序发声。尽管如此,我还是忘我地聊到了深夜。

到了第二天,我开始思考一个问题,怎样才能让程序自动地跟我聊天呢?

自然语言处理,也就是让人工智能理解人类的语言,是人工智能领域的一门显学。对于人工智能来说,理解单个词或者单个句子并不十分困难。可是人类的语言是精妙的,经常出现内容省略,每一句话都要在上下文语境中理解。比如说,我先讲了「我母亲下星期过生日」,之后又问「买什么礼物好」,那么人工智能需要明白我的意思是「我母亲过生日,我要给她买什么礼物」。这样的上下文语境可能会有很长的时间跨度,比如前两天说的笑话,甚至于去年一起看过的电影,在对话中我一提起这些话题来,对方就应该明白我的意思,而不需要我长篇大论把整个笑话、整部电影情节复述一遍。人类对话中还会大量使用文化典故,比如形容一个人是「猪八戒」「诸葛亮」,人工智能要准确地理解其中的隐含意义,而不是误以为在谈论小说和历史中的人物。家人、朋友、情侣之间会有更私人的谈话方式,有小圈子里的、只属于彼此的称呼、笑话、隐喻,这些就更没有规律、更加复杂了。而且人类讲话是连贯的,一句接着一句,这就要求人工智能要及时响应,运行速度要快,而不是每次讲话都停顿好久。

与之前一样,我再次借用了已有的成熟技术。我安装好人工智能语言会话模型,再把我和雯雯之间所有的聊天记录全部导入进去。随着训练时长的增加,这个模型的对话能力越来越强,逐渐能够流畅地与我交流。然后我又补充了聊天记录之外的、自己与雯雯相处时两人共同的回忆,只要是我能想起来的,一处细节也不放过。就这样,人工智能生成的会话越来越像雯雯了。

最后一步是为人工智能增添额外的部件:语音识别、人像识别、表情识别等等。这些都是通用的技术,只需要一点点调整就能用了。这样一来人工智能就能通过摄像头看到我,认出我,直接通过语音与我对话、无需文字输入。

就这样,我前后忙了一个多月,终于大功告成。

评论

此博客中的热门博文

黑暗的宇宙:读刘慈欣的《三体全集》

第一次读《三体》已经是十年前的事了。那时《三体》在科幻圈子里已经非常出名了,不过还没有进入大众视野。我读完第一本后印象一般,就没继续读下去。转眼十年过去,《三体》的影响力持续提升,俨然成为新世纪头二十年里最成功的中文通俗小说。不仅国内互联网总提到《三体》,身边的外国朋友中也不乏《三体》书迷,搞得没读完全书的我似乎成了异类。为了搞懂「黑暗森林」「降维打击」,我终于花了一个星期,把三部曲从头到尾看完了。 三体 简单来说,三体系列讲的是地球与外星之间的星际战争。这题材算得上复古,《三体》的内容与风格都让人联想到上世纪四五十年代的经典科幻小说。 书中的外星人来自太阳系四光年之外的三体世界,这里有三个「太阳」。三个天体在万有引力作用下的运动规律是著名的三体问题,也正是这套书标题的由来。现在已知三体问题是无法精确求解的,三个太阳的运行轨迹没有规律,这给三体人所在的行星造成极其严酷的生存环境。过于靠近或过于远离太阳都是致命的,三体文明被毁灭了无数次,还有彻底坠入太阳的潜在危险。小说中借由电子游戏的形式,模拟了三体文明反复诞生与毁灭的过程。虽然听上去很复杂,其实不过是在说:外星人处于水深火热中,有强烈的移民外星的意愿。把三体问题换成其它危机,比如太阳衰败,这个故事同样成立。直到有一天,三体星接收到了地球发来的信号,发现地球是宜居星球,决定侵略地球。 考虑到三体人处于生死存亡之际,而且拥有远超地球文明的太空科技,我很奇怪为什么他们不主动寻找移民星球,而是被动地监听信号。能不能收到外星信号纯属偶然,而且按照书中的宇宙观,这信号很可能具有欺骗性,回复信号要冒非常大的风险。太阳系是距离三体世界最近的恒星系统,没理由不主动勘测。对比一下,离太阳系最近的半人马座阿尔发星,也就是小说中三体世界的原型,已经在科幻作品中被觊觎无数次了,三体人没理由从未关心过自己的邻居。 以三体人的科技水平,需要450年才能抵达地球。经过漫长的450年,没准到时候地球科技已经超过三体人了。为了解决这一问题,三体人制造了「智子」来封锁地球科技发展。 智子是小说第一部中最重要、也是最精彩的科幻设定,也为后来两部埋下伏笔。智子是一颗高维空间的质子,在二维空间展开后雕刻成智能计算机。按照书中的说法,从高维降到低维会「变大」(不妨想象一瓶墨水,变成二维——涂在纸上——会拥有庞大的面积)。一颗质子从九维降到二维,其面积足以包覆整

豆瓣阅读:理想很丰满,现实很骨感

  写作网站中的清流 在青春年少、懵懂无知的时候,我怀揣着纯真的文学梦想,打算为自己的文字寻找一个理想的归宿。不矫情了,简单说来就是攒了几篇伤春悲秋的文章,想要找个地方发文。身为计算机专业人士,第一反应当然是搭建个人网站。不过博客早就退流行了,连大公司的博客平台都撑不下去,个人网站更没有流量,所以我还是想要发到大网站去。大陆热门的写作网站主要分成两类: 一是起点、晋江这类网络小说网站,主流题材是修仙、穿越,要把读者当大爷伺候,爆肝日更才有人气,停更还要跟读者写请假条; 二是微信公众号、今日头条这类自媒体平台,热门文章基本都是「震惊!XX居然是XX!?」「你不知道的十大XX!!」「十个看完,九个都哭了的XXX」。 不用想也知道我与这些网站水土不服。正当我灰心丧气的时候,突然发现了豆瓣阅读,立马眼前一亮! 豆瓣阅读是一个电子阅读平台,作者可以出版自己的原创电子书。不要担心不懂电子书制作,作者只要投稿就好,网站有专门的编辑负责审稿,还有美工帮忙做封面。作者还可以开专栏,付费订阅制,连载完结后可以直接作为电子书出版。 豆瓣阅读一开始主要推广两三万字的中篇小说,包括幻想、悬疑、文艺、历史等类型,同时也有不少散文专栏。豆瓣阅读定期举办征文大赛,不仅有奖金拿,还有机会出版纸质书和售卖影视版权。 要知道,大陆盗版非常猖獗,读者根本没有电子阅读付费的习惯。豆瓣阅读逆潮流而行,我相信他们一开始时是真心想要开拓市场,挖掘作者。在浮躁的大环境下,当年的豆瓣阅读真算的上是一股清流了。 我当机立断开了专栏,感觉自己就要出书成名了,想想还有些小兴奋呢! 埋葬文字的坟墓 可惜好景不长,我很快就发现了问题:咦?我的专栏怎么没人看? 何止我的专栏没人看,是整个网站都没几个读者啊!豆瓣阅读是一个典型的作者比读者多的网站。现在打开豆瓣阅读首页,还用大字标着「XX位作者正在豆瓣阅读写作」。当年好像两三万人,现在作者已经超过十二万了。请问,这么多人都忙着写作,做着赚钱成名的美梦,读者又在哪里? 表面上看,豆瓣阅读背靠着豆瓣这座大山,应该不愁没用户。然而豆瓣用户群体是割裂开的,记录书影音的,混豆瓣小组的,在豆瓣阅读码字的,根本不是同一群人。而且豆瓣不知脑子搭错了哪根筋,好像还嫌用户不够分裂,连APP都分成了好几个。 总而言之,豆瓣阅读超级冷清,连首页热推的作品都没几个人看。在豆瓣阅读出电子书,只有在新书首月免费

读冰临神下的《死人经》

武侠小说衰落已久,老一辈武侠名家「金古梁温黄」中四位已经作古,硕果仅存的温瑞安也好多年没出过新书了。名噪一时的「大陆新武侠」同样归于平淡,成了明日黄花。在一片萧条的环境下,每当在网上聊起武侠,我总能看到有人提起《死人经》,称赞其为近年来罕有的武侠佳作。我起了好奇心,花大概一周的时间读完了《死人经》的第一卷《杀手少年》,聊聊想法。 这本书开头部分写的一般,主角惨遭灭门报仇雪恨这种故事实在太老套了。而且文字很平淡,人物对话写的尤其不好。写对话很考验作者的笔力,说什么话、怎么说话是塑造人物的重要手段之一。《死人经》里人物讲话差不多都是一个调调,而且偏书面语,给人感觉有点不自然。戏剧性强烈的地方、角色们互撂狠话时还成,日常对话就有些别扭。 很快地,这本书出色的情节就挽回文字上的那些小缺点了。主角被强盗掳走、卖到仇家金鹏堡里当奴隶,这时好戏才正式上演。主角在石堡里命悬一线,时刻处于危机之中,又处心积虑报仇,这段无论情节、风格、手法,明显是借鉴古龙的《白玉老虎》,专门培养杀手的金鹏堡几乎就是唐门的翻版。如同《白玉老虎》一样,《死人经》成功地渲染出压抑紧张的氛围,让读者时刻为着主角的将来提心吊胆。复仇故事讲究先抑后扬,主角前期越惨,后期复仇才越痛快。主角每天扛死尸,受虐待,自身无比弱小,处在石堡最底层,在绝望中拼命挣扎。主角陷害遥奴走火入魔、暗杀认识自己真实身份的杀手,随后被雪娘挟持,被设下三年内走火入魔的死亡期限,这一系列情节环环相扣,悬念迭起,写的特别好。读到这里,很惊讶于作者情节编排的老练,逐日连载的网络小说能维持这样稳定的质量真的很难得。雪娘教主角武功,让他和石堡千金上官如比武,这段明显是化用自《鹿鼎记》。主角落悬崖、奇遇大鹏鸟获得武功秘籍这段勉强算是俗而有力吧,武侠小说的主人公总是难逃落悬崖的命运。之后盗宝这段把之前的种种戏剧冲突一起引爆,处理的干净利落。 主角当上杀手学徒之后,故事陡然一变。虽说主角仍处在危机之中,却由被动转向主动。之前是受命运摆布,想放弃复仇也逃不掉,这时却开始主动出击了。主角从当初只有一腔愤恨的少年彻底转变成了冷静、聪明、阴狠毒辣的杀手。杀手学徒乱战这段写的很好,一群十余岁的少年间的血腥杀戮让人想到了《蝇王》。同时荷女这个角色开始登上前台,从配角变为两大女主角之一。荷女冷静沉着,办事滴水不漏,对主角衷心耿耿,几乎就是主角的女版化身。两人合练死人经