麻省理工科技评论-全民声音克隆时代将到来！30分钟克可完成声音克隆，家人都无法分辨真假

全民声音克隆时代将到来！30分钟克可完成声音克隆，家人都无法分辨真假

在过去的几十年里，许多经典的 TVB 影视片都离不开配音，如果你认为周星驰也可以讲一口流利的普通话，那就太幼稚了。

在过去的几十年里，许多经典的 TVB 影视片都离不开配音，如果你认为周星驰也可以讲一口流利的普通话，那就太幼稚了。

另外，如动漫等影视中最逼真的声音合成，也大多通过配音演员的声音录制来实现的，然后将他们的声音剪切成不同的片段，像做拼图一样，将这些声音“拼接”在一起，形成一整段声音。

图｜繁琐的录音、配音工作（来源：Pixabay）

近年来，随着黑科技产品不断迭代升级，更多有趣的应用逐渐被发掘并实现。在语音合成领域，由于人工智能克隆技术的出现，昔日繁琐且枯燥的配音工作有望被取代。

配音将不再是专业人士的标配，任何人都可以自主且简单地克隆自己的声音，而克隆出来的声音近乎逼真。

现在，神经网络可以对目标声音的未排序数据进行训练，最终以简单快速、容易的方式，生成一段完整的音频。当人们将克隆的音频从设备中导出时，音色和音质几乎不会受到压缩和影响。尽管有部分环节还需要手动调整，但不久的将来将会更加完善。

这标志着，全民声音“克隆时代”的到来。

30 分钟克隆出的声音，家人和朋友都无法分辨真假

这种声音克隆技术使用起来并不复杂，人们只需要拿着事先准备好的台词，对着麦克风仔细录制 30 分钟左右，即可完成第一步克隆工序。录制的过程中难免会读错字，或者有发音没有很清晰等情况，这不用太担心，只要停下来重新录制这部分即可。

全部录制完之后，将生成的音频文件导出并做一定的处理，几个小时以后你克隆的声音就做好了。此刻，你可以互动界面中输入各种你想表达话语，人工智能克隆技术就可以在较短的时间内生成专属你自己的“逼真声音”。

当你将这段语音发给家人或朋友时，他们在短时间内根本无法分辨真假，这个克隆技术令许多人感到兴奋。

声音克隆技术可让经典再现

2014 年，电影《永远的蝙蝠侠》中知名演员瓦尔·基尔默（Val Kilmer），因患喉癌被迫做气管切开手术，导致声音受损。至此，瓦尔·基尔默与许多优秀影片擦肩而过，演艺生涯近乎跌入谷底。

今年 8 月，一家名为奏鸣曲（Sonantic）的初创公司声称，他们已经通过人工智能语音克隆技术创造出了瓦尔·基尔默的“原声”。Sonantic 公司的这一举动得到了市场普遍称赞，因为它为演员提供了其他解决方案无法提供的技术。

然而，社会中也有一些质疑的声音，有人认为：“这项技术有违社会道德。”另外一位艺人的经历，就是最好的反例。

在前几年，对于社会大众来说，人工智能声音克隆技术既陌生又遥远，在一些艺术品中被用于生产赝品。

今年 7 月，一部关于安东尼·波登（Anthony Bourdain）的纪录片引发了争议，据制片人向有关人士透露，他们使用人工智能声音克隆技术，为安东尼·波登制作了一段台词音频，但是当时并没有多少人注意。

该“声音门”被曝光后，许多人谴责安东尼·波登这一做法。

毫无疑问，人工智能声音克隆技术具有很好的商业化前景。

今年年初，维睿通（Veritone）公司就推出了类似的声音克隆服务，该公司将网红、运动员和演员的在录音棚里录制好的声音，通过人工智能克隆技术获得其“逼真声音”，然后再获得网红等人的声音授权，就可以从事代言、广播节目等活动。之后网红、运动员和演员无需真人出镜即可实现同样的效果。

图｜无明星出镜的音乐厅现场（来源：Pixabay）

Veritone 公司执行副总裁肖恩·金（Sean King）表示：“将一个人的声音克隆得形象逼真，以及如何对其应用场景进行扩展只是时间的问题，我们对很多不同行业带来的新机会，感到非常兴奋。”

网红、演员和名人的“声音”可以毫不费力地被出租出去，经纪公司希望能够通过克隆和出租公司旗下艺人的声音，以最小的努力轻松获得不菲的收入。

网红、演员和明星等角色的声音克隆技术，可能是未来几年最为明显的商业化应用。随着这些克隆技术的成熟，加之克隆出声音的技术壁垒较低，将会有许多初创公司可以提供类似服务。