跳至主要内容

我三年前写的这篇小说,预言了ChatGPT


去年年底Chatgpt发布后立即产生轰动,引发了新一波人工智能热潮(我们公司的市场部门也在宣传词里大量加入了AI字样,纯属蹭热点,呵呵)。我身边连电脑都用不顺的人,居然也都讨论起AI来了。其实早在三年前,我就在一篇小说里预言了与ChatGPT相似的产品!

我的小说《告别:瘟疫时期的爱情故事》最早于2020年6月发表在我的博客,后来也曾在Matters上连载。这篇小说前半部分是以Covid为背景的写实风格爱情故事,后半部分则加入了科幻元素。男主角为了追念染病去世的女友,创造了一个女友人格的AI(原文请见这里):

我的想法估计听起来荒诞不经,像是天方夜谭:我想要制造出一个和雯雯一样的人工智能。

在嘲笑我之前,请听我做一番解释。我无意也没有能力制造出一个科学怪人来。到底能不能制造出能像人类一样思考的人工智能,这仍旧是一个未解难题。我的想法其实很简单,就是想写出一个计算机程序合成雯雯的样貌和声音。我想再见雯雯一次,哪怕是虚拟的也好。依靠现在的人工智能技术,这个目标完全能够实现。我不能继续沉沦,再这样无所事事。无论想法多荒唐,这至少能让我忙起来。我在网上租用了昂贵的服务器,全身心投入到这个项目中。

一开始他只是想合成女友的声音和外形:

我从相对简单的任务着手:合成雯雯的声音。过去一年里雯雯给我发了很多视频、音频,我有足够多的声音素材。想要重现每一个字的读音并不困难,可以说只要截取雯雯的发音就可以了。但是这样的声音必然是机械化的,冰冷生硬,没有人类的感情。当人讲话时,词语和句子间会有间隔,音调会有高低起伏,速度时快时慢,此外还有个人化的发音习惯、口音特点。我用了现成的人工智能朗读引擎,把雯雯的声音素材导入进去,再一点点地调整模型参数。这一步进展的很顺利,很快我就听到与雯雯十分相似的声音了。

接下来是模拟雯雯的外形。我从图像专业公司购买了人体数字模型,这个模型可以做动作、做表情,模拟讲话时的口型,等等。当然这个模型是计算机动画,与雯雯长得一点都不像。我的下一步就是给模型换脸。这一技术非常热门,在网上有数不清的技术资源。我使用了深度学习技术,用雯雯的照片和视频来训练一个人工神经网络,把我电脑中的模型变成雯雯的样子。

后来他开始研究怎么让AI实现真正的对话:

到了第二天,我开始思考一个问题,怎样才能让程序自动地跟我聊天呢?

自然语言处理,也就是让人工智能理解人类的语言,是人工智能领域的一门显学。对于人工智能来说,理解单个词或者单个句子并不十分困难。可是人类的语言是精妙的,经常出现内容省略,每一句话都要在上下文语境中理解。比如说,我先讲了「我母亲下星期过生日」,之后又问「买什么礼物好」,那么人工智能需要明白我的意思是「我母亲过生日,我要给她买什么礼物」。这样的上下文语境可能会有很长的时间跨度,比如前两天说的笑话,甚至于去年一起看过的电影,在对话中我一提起这些话题来,对方就应该明白我的意思,而不需要我长篇大论把整个笑话、整部电影情节复述一遍。人类对话中还会大量使用文化典故,比如形容一个人是「猪八戒」「诸葛亮」,人工智能要准确地理解其中的隐含意义,而不是误以为在谈论小说和历史中的人物。家人、朋友、情侣之间会有更私人的谈话方式,有小圈子里的、只属于彼此的称呼、笑话、隐喻,这些就更没有规律、更加复杂了。而且人类讲话是连贯的,一句接着一句,这就要求人工智能要及时响应,运行速度要快,而不是每次讲话都停顿好久。

了解ChatGPT的朋友应该立即就会明白,这段内容讲的是Prompt,也就是自然语言提示词,AI通过提示词来生成对话。

小说中接下来还写到:

我安装好人工智能语言会话模型,再把我和雯雯之间所有的聊天记录全部导入进去。随着训练时长的增加,这个模型的对话能力越来越强,逐渐能够流畅地与我交流。然后我又补充了聊天记录之外的、自己与雯雯相处时两人共同的回忆,只要是我能想起来的,一处细节也不放过。就这样,人工智能生成的会话越来越像雯雯了。

这个就是模型训练的过程,与ChatGPT无异。区别在于,ChatGPT是通用模型,用网上海量数据训练。而小说中只是用私人数据训练,毕竟个人开发者不可能有大公司的人力物力。

最后更进一步,还添加了更多的交互方式:

最后一步是为人工智能增添额外的部件:语音识别、人像识别、表情识别等等。这些都是通用的技术,只需要一点点调整就能用了。这样一来人工智能就能通过摄像头看到我,认出我,直接通过语音与我对话、无需文字输入。

我相信随着技术发展,小说中写到的有人格的AI会成为现实。目前ChatGPT只是用来文字聊天,也没有性格可言。但是完全可以将ChatGPT的技术与虚拟形象相结合,并且添加独有的语言特色,让每个用户都有自己专属的AI。不知道大家知不知道恋爱模拟游戏LovePlus(爱相随),如果游戏中的角色有了ChatGPT一样的对话能力,无数宅男都会为之疯狂吧?更加实用的想法是虚拟秘书,辅助日常工作,还有同声传译等等。现如今Google、微软等大公司纷纷入场,数年之内必然会有面向大众的AI产品,绝对会成为新一波产业革命。

当然我要承认,自己的预言并没有那么了不起。虽然ChatGPT对外行人来说很新鲜,但是相关的机器学习理论技术早就有了。ChatGPT的成功,一方面要佩服开发者的技术能力,另一方面也是他们实在太有钱了。ChatGPT用了三万多片高性能显卡,初始投资就要8亿美元,训练一次的费用高达千万,每天的电费都要五万美元。我这样的普通人,也就只能在小说里幻想一下了!

眼见着自己的幻想成为现实,不得不感慨时代发展迅速。AI会给人类社会带来怎样的影响,现在还很难评估。有兴趣的朋友不妨读一读我的小说,没准能为您带来一些启发。

评论

此博客中的热门博文

读古龙的《英雄无泪》

说起来这本书可以算是古龙最后一本像样子的小说。按照网上资料,《英雄无泪》出版于1979年,同年还有一本不知所云的《午夜兰花》。写《英雄无泪》时古龙刚过不惑之年,他的创意少了,可是笔力、精力都处于成熟期,假以时日未必不能更进一步、再攀高峰。只可惜命运给他来了一下狠的。古龙于1980年负伤入院,之后受健康状况的影响,创作力急剧下降,再也没有写出什么像样子的小说了。 《英雄无泪》篇幅不长,在古龙作品中算是比较中庸的一本,保持了古龙一贯的优点,同时也没能摆脱一贯的缺点。虽然难称佳作,却很能体现古龙的写作风格。 先说优点。古龙的一大特色是描写偏离主流、甚至畸形的人物,与金庸、梁羽生笔下高大上的主角们形成鲜明对比。《英雄无泪》表面上的主角是高渐飞,实际上的核心角色却是卓东来。卓东来先天残疾,不是「完整」的男人,而且母亲难产而死,双胞胎弟弟也胎死腹中,导致卓东来始终摆脱不了自卑与自责。同时他又是一个爱美、有野心、心狠手辣的人,理想与现实的对比造成他内心的矛盾,使他陷入了病态。卓东来耗费一生精力打造司马超群这个高大威武、武功盖世的英雄,司马超群像是他的弟弟、儿子、情人,更是他心中理想的投射。卓东来的人物塑造是循序渐进、层层展开的,一开始是华丽贵公子的形象,之后一步步地揭开黑暗面,使得这个虚构出来病态人物形象立体、令人信服。单凭卓东来这个人物,《英雄无泪》就值得一读。 古龙善于烘托悬疑气氛,情节发展快速流畅,在这一点上《英雄无泪》同样做的不错。《英雄无泪》开头迅速展开激烈的戏剧冲突,两大势力中一派要杀人,一派要保人,同时引出神秘的、使用一口箱子的杀手。随后的情节发展也是环环相扣,基本没有拖沓的地方。结尾谈不上多好,但大体上也把故事说圆了。 再说缺点。《英雄无泪》除了卓东来,其他角色的塑造都比较失败。 朱猛是卓东来的敌人,两人的争斗是故事主线。全书一直试图把朱猛写成一个英雄,动不动就借用旁观者的描述来印证朱猛的英雄气概。但是无论如何大碗喝酒、说话如何嚣张,朱猛的实际行动证明了他不过是一介莽夫,而且为了自己的私欲牺牲手下弟兄,与英雄两字毫不沾边。朱猛的武功和智谋都太弱了,对卓东来构不成真正的威胁,导致故事紧张感不足。 这本书的核心人物是卓东来,而占了最多篇幅的角色却是高渐飞。高渐飞是一个背景不明、性格模糊的人,在故事中像一个过客,莫名其妙地被写成了主角。看完全书后回想一下,高渐飞与整个故

黑暗的宇宙:读刘慈欣的《三体全集》

第一次读《三体》已经是十年前的事了。那时《三体》在科幻圈子里已经非常出名了,不过还没有进入大众视野。我读完第一本后印象一般,就没继续读下去。转眼十年过去,《三体》的影响力持续提升,俨然成为新世纪头二十年里最成功的中文通俗小说。不仅国内互联网总提到《三体》,身边的外国朋友中也不乏《三体》书迷,搞得没读完全书的我似乎成了异类。为了搞懂「黑暗森林」「降维打击」,我终于花了一个星期,把三部曲从头到尾看完了。 三体 简单来说,三体系列讲的是地球与外星之间的星际战争。这题材算得上复古,《三体》的内容与风格都让人联想到上世纪四五十年代的经典科幻小说。 书中的外星人来自太阳系四光年之外的三体世界,这里有三个「太阳」。三个天体在万有引力作用下的运动规律是著名的三体问题,也正是这套书标题的由来。现在已知三体问题是无法精确求解的,三个太阳的运行轨迹没有规律,这给三体人所在的行星造成极其严酷的生存环境。过于靠近或过于远离太阳都是致命的,三体文明被毁灭了无数次,还有彻底坠入太阳的潜在危险。小说中借由电子游戏的形式,模拟了三体文明反复诞生与毁灭的过程。虽然听上去很复杂,其实不过是在说:外星人处于水深火热中,有强烈的移民外星的意愿。把三体问题换成其它危机,比如太阳衰败,这个故事同样成立。直到有一天,三体星接收到了地球发来的信号,发现地球是宜居星球,决定侵略地球。 考虑到三体人处于生死存亡之际,而且拥有远超地球文明的太空科技,我很奇怪为什么他们不主动寻找移民星球,而是被动地监听信号。能不能收到外星信号纯属偶然,而且按照书中的宇宙观,这信号很可能具有欺骗性,回复信号要冒非常大的风险。太阳系是距离三体世界最近的恒星系统,没理由不主动勘测。对比一下,离太阳系最近的半人马座阿尔发星,也就是小说中三体世界的原型,已经在科幻作品中被觊觎无数次了,三体人没理由从未关心过自己的邻居。 以三体人的科技水平,需要450年才能抵达地球。经过漫长的450年,没准到时候地球科技已经超过三体人了。为了解决这一问题,三体人制造了「智子」来封锁地球科技发展。 智子是小说第一部中最重要、也是最精彩的科幻设定,也为后来两部埋下伏笔。智子是一颗高维空间的质子,在二维空间展开后雕刻成智能计算机。按照书中的说法,从高维降到低维会「变大」(不妨想象一瓶墨水,变成二维——涂在纸上——会拥有庞大的面积)。一颗质子从九维降到二维,其面积足以包覆整

破碎迷幻的天才之作:读胡安·鲁尔福的《佩德罗·巴拉莫》

  提起外国文学,国内读者比较熟悉的主要是英法德美俄这些大国,还有邻近的日本。其它国家也不乏璀璨名著,只是很少受人关注。比如这本《佩德罗·巴拉莫》是墨西哥最著名的现代小说,可在国内恐怕没几个人听说过。我对墨西哥文化了解极少,要不是听说博尔赫斯和加西亚·马尔克斯对此书极度推崇,大概率也会错过这本书。 在《私人藏书:序言集》里,博尔赫斯称「《佩德罗·巴拉莫》是西班牙语各国文学中最优秀的小说之一,也是所有文学中最优秀的小说之一。」而马尔克斯更夸张,在《对胡安·鲁尔福的简短追忆》中他写道:「我能够背诵全书,且能倒背,不出大错。并且我还能说出每个故事在我读的那本书的哪一页上,没有一个人物的任何特点我不熟悉。」所以我是抱着非常高的期待来读这本书的。读完确实感觉不同凡响,堪称天才之作。 《佩德罗·巴拉莫》非常短,还不到十万字,份量却特别足,第一次读根本消化不过来。我想很多读者读完这本书后的第一反应就是从头再读一遍。 这本小说的故事情节很普通,主要讲一个名叫佩德罗·巴拉莫的地主,欺男霸女无恶不作,搞得民不聊生,村民死的死逃的逃,最后整个村庄衰败成一座死城。只要了解过一点儿拉美历史或小说,对这类暴权故事不会感到陌生。《佩德罗·巴拉莫》的出色之处不在于故事情节,而在于极具开创性的写作手法。 一般来说,一部小说会有统一的叙事视角,比如第一人称、第三人称,随之会有一个或数个推进叙事的线索人物。虽然倒叙、插叙的手法很常见,但绝大多数小说还是按照时间先后顺序来叙述的。而这本书将叙事视角、人物、时间、空间完全打乱了,感觉像是电影中的蒙太奇。 在小说一开始,「我」接受母亲的临终嘱托,回到家乡科马拉去寻找自己未曾谋面的父亲佩德罗·巴拉莫。可是读着读着,内容突然跳到一个男孩子身上,他正在想念着一个叫苏萨娜的女孩。再读几页我们会发现,这个男孩就是童年时代的佩德罗·巴拉莫。接下来笔锋一转,重新回到「我」这边,「我」在和借宿人家的房东爱杜薇海斯太太聊天,她滔滔不绝、颠三倒四地讲述着陈年往事,小说内容又变成了由她来叙述。整本书都是这样写成的,每隔几页就变成了一段貌似毫不相干的内容,仔细琢磨一下又相互关联。而且这本书不分章节,也不标注叙事者是谁,读的时候一定要全神贯注,否则一不小心就搞糊涂了。随着对人物和事件的熟悉,越读到后面故事会越清晰,慢慢理清人物关系和时空顺序,但是第一次读难免会错过或是混淆一些细节,所以