2

米哈游《未定事件簿》实装AI配音,音质如真人,把玩家惊到了!

 1 year ago
source link: http://www.gamelook.com.cn/2022/09/496739
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

米哈游《未定事件簿》实装AI配音,音质如真人,把玩家惊到了!

2022-09-08 • 国内新闻

【GameLook专稿,未经授权不得转载】

WD.png

GameLook报道/近些年AI技术的不断发展,对各行各业都产生了不小的影响,其中影响最为深远的显然非文娱产业莫属。像是在虚拟偶像、配音、电子竞技等等领域,多多少少都能看到AI的身影。

在表现形式更加单一的配音领域,由于可以较好地模拟真人的声音,也可以完成一些基础性工作,AI逐渐展露出了在配音方面极高的商业价值,并成为了许多广告主的选择,甚至大有取代真人配音演员的趋势。

此前,GameLook就报道过米哈游旗下的《未定事件簿》因配音演员出事,而需要更换角色配音一事。在官方的说明中,角色莫弈的新配音正是由米哈游的“逆熵AI”生成。

lazy.png

而在昨日(6号)更新后,官方也正式为角色实装了新语音。从实际反馈来看,此次AI配音的效果着实惊艳到了许多玩家。

点击视听《未定事件簿》AI配音片段:

“纸片人”有救了,以假乱真的逆熵AI

如果你是第一次透过这款游戏接触逆熵AI,你可能会被米哈游的技术所折服。若是用一句话来概括的话,那新的AI配音可以说几乎达到了“以假乱真”的地步。

比如在语调方面,逆熵AI的表现就相当不错,不仅说话的节奏会随着文本的不同而收放有度,而且在演绎一些例如“闻到了什么味道?”、“这样就觉得难了?”等带有疑问性质的语句时,音调还会很自然地上扬,如同真人说话一般。

lazy.png

而在更深一层的情感层面,逆熵AI也十分可圈可点。莫弈的人设是一名著名的心理医生,行为举止从容优雅,性格方面成熟稳重,因此该角色的声音也更多主打的是温柔成熟的风格。逆熵AI此次合成的音色偏向沉稳的男声,与莫弈人设的契合度颇高。

细节上,若仔细听可以很容易听出,逆熵AI其实是有通过分析文本的语境,从而对声音做出相应改变。一个典型的例子是,逆熵AI在演绎“听话的孩子才能得到最终奖励”时,为了表现出此时莫弈正捉弄主角的情境,而采用了挑衅意味十足的气声,在最后甚至还加入了一声略带坏意的嗤笑。

当然,尽管在一些方面表现得确实不错,但若要用放大镜去细究整段声音表现,逆熵AI也并非是完美的。像是在诠释一些情感比较激烈的句子时,逆熵AI就缺少了足够强硬的声音表现。而在整体上,相比起真人,逆熵AI在情感细节上也少了一点温柔和甜蜜的感觉。

但就像一位玩家所说,如果“你告诉我这是AI,我反而会去找瑕疵,但如果你不告诉我这是AI,这一段我是听不出来AI的感觉的”。这至少可以说明,逆熵AI的表现已经足够应付大多数情况。而这也引得一些玩家惊叹“怪不得米哈游一上来就敢放纯语音卡”。

lazy.png
lazy.png

 一直以来,我们都普遍认为真人配音比AI更有沉浸感,但部分玩家在体验完莫弈的AI配音后,却出现了与之相反的观点。在这部分玩家看来,尽管逆熵AI的配音比起真人少了真实感,但却是莫弈第一次打破次元壁与自己对话,这反而极大增加了代入感。

lazy.png

巨头云集,为何AI成了罗马斗兽场?

实际上,这并不是米哈游第一次使用逆熵AI来为角色配音。此前,米哈游所推出的虚拟偶像鹿鸣,其声音就是通过逆熵AI所合成,音色听起来十分自然,但缺点是有时反应会显得少许迟缓。

当然,《未定事件簿》也不是圈内第一款使用AI配音的游戏。同样是在今年8月份,网易旗下的乙女游戏《时空中的绘旅人》也遇到了需要更换配音演员的问题,而游戏中的角色叶瑄原本由姜广涛配音。

8月22日,时空中的绘旅人发布声明,表示将与网易互娱AI Lab合作,提取叶瑄角色原有配音的声纹特征,录制新的语音。换句话说,这波操作其实就相当于给叶瑄进行AI换声。

而在更早之前的2018年,互联网巨头微软其实也早早就对AI配音下手了,旗下的虚拟歌姬小冰凛菜在日本出道时,宣称首次实现了用人类歌手一样的充沛“中气”演唱,将人工智能虚拟歌声质量提升到了新的一个高度。

lazy.png

但问题是,为什么像米哈游、网易、微软这些巨头都对AI配音如此看重?关于这一点,米哈游总裁大伟哥(刘伟)2019年在他的母校上海交大的一次演讲中就有过解释。

lazy.png

在这次演讲上,大伟哥就展示对逆熵技术的极大期望,据他介绍,逆熵AI的目标是通过深度学习记录配音演员的声音和情感,做到输入文字就能输出对应的配音。未来还可以将声音塑造成IP,永久保留,甚至出售声音的版权。

今年7月,鹿鸣在B站开启了首次直播,二在直播简介中,鹿鸣的声音一栏赫然填写着“逆熵AI生成”。但令玩家震惊的地方在于,逆熵AI生成的声音居然可以实时对弹幕做出回应,并且还能带上真人特有的感情色彩。

直播时鹿鸣的AI生成语音究竟达到了大伟哥预期目标的哪一步,无人知晓。但结合此前的演讲,若米哈游真实现了只靠文字输入就能达到媲美真人的语音输出,并且还能附带感情色彩,这无疑是令人兴奋的技术突破。

lazy.png

从商业角度来看,AI配音相比真人配音无疑有着巨大优势,不仅成本低,且效率高。以往,配音行业一直都采用人工配音,人的不确定性便会导致耗时费力、准确度不够等问题。而AI则可以有效地降低人力成本。

不仅如此,由于AI配音是对目标声音的未排序数据进行训练的,所以可以简单、快速的生成一段流畅标准的完整音频,避免了人工配音时可能会出现的发音错误等问题,大大的提高了配音的效率。

更重要的是,从作品适配性上去看,AI由于能不断变化音色,故而能极大拓展自身对于作品的适配度。毕竟AI的声音通常是对数据的重复学习组成,因此只要有足够多的采集样本,它就可以随意的变换音色,结合不同的场景配出不同的声音。

此前,英国一家创业公司Sonantic曾发布过一段名为《Faith_ First AI That Can Cry》的视频。视频中的AI在吞噬大量数据,以及有目的去训练区分机械声与人声之间细微差别的能力后,能够逼真地模拟人声和表达情感。

lazy.png

你可能会认为这个AI所展现的情感可能是提前设定好的,但实际上,这种情感是AI通过对文本的分析理解得来,与作品的适配度极高。也正因如此,一旦AI技术足够成熟,很可能会出现AI比真人更理解作品,从而在配音表现上更优的情况。

除了上述优势外,AI配音还有一点是真人配音所无法企及的,那就是它可以模仿或者重现一个声音。从小的方面看,这种能力能够很好地规避、修补真人配音演员“塌房”的问题,从而极大减少了后者对游戏角色的影响。

而从大的方面看,利用AI复现逝者的声音,对于一些丧亲之痛的人而言,无疑是一种疗愈。而对于许多先天语言障碍的聋哑人,AI技术也能让其拥有自己的声音。由此可见,AI配音不仅对游戏行业有所影响,对游戏之外的领域也有着积极贡献。

当然,列举了AI如此多优势的同时,真人也并非没有一战之力。在作品表达时,真人往往比AI更容易突出作品的“神韵”。很多时候,神韵往往是人的一种主观判断,而AI即便表达出人所认为的神韵,也需要足够多的时间去吞噬足够多的数据。

而从结果来看,AI由于只是冰冷数据的综合体,其最终呈现的效果通常不会超出人的预期。而真人虽然不如AI表现稳定,但却会时不时出现神来之笔,利用自己对作品的理解和人生经历升华作品。这一点,或许AI永远也超越不了。

如若转载,请注明出处:http://www.gamelook.com.cn/2022/09/496739


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK