

全民声音克隆时代将到来!30分钟克可完成声音克隆,家人都无法分辨真假
source link: http://www.mittrchina.com/news/detail/9901
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.


在过去的几十年里,许多经典的 TVB 影视片都离不开配音,如果你认为周星驰也可以讲一口流利的普通话,那就太幼稚了。
另外,如动漫等影视中最逼真的声音合成,也大多通过配音演员的声音录制来实现的,然后将他们的声音剪切成不同的片段,像做拼图一样,将这些声音“拼接”在一起,形成一整段声音。
图|繁琐的录音、配音工作(来源:Pixabay)
近年来,随着黑科技产品不断迭代升级,更多有趣的应用逐渐被发掘并实现。在语音合成领域,由于人工智能克隆技术的出现,昔日繁琐且枯燥的配音工作有望被取代。
配音将不再是专业人士的标配,任何人都可以自主且简单地克隆自己的声音,而克隆出来的声音近乎逼真。
现在,神经网络可以对目标声音的未排序数据进行训练,最终以简单快速、容易的方式,生成一段完整的音频。当人们将克隆的音频从设备中导出时,音色和音质几乎不会受到压缩和影响。尽管有部分环节还需要手动调整,但不久的将来将会更加完善。
这标志着,全民声音“克隆时代”的到来。
30 分钟克隆出的声音,家人和朋友都无法分辨真假
这种声音克隆技术使用起来并不复杂,人们只需要拿着事先准备好的台词,对着麦克风仔细录制 30 分钟左右,即可完成第一步克隆工序。录制的过程中难免会读错字,或者有发音没有很清晰等情况,这不用太担心,只要停下来重新录制这部分即可。
全部录制完之后,将生成的音频文件导出并做一定的处理,几个小时以后你克隆的声音就做好了。此刻,你可以互动界面中输入各种你想表达话语,人工智能克隆技术就可以在较短的时间内生成专属你自己的“逼真声音”。
当你将这段语音发给家人或朋友时,他们在短时间内根本无法分辨真假,这个克隆技术令许多人感到兴奋。
声音克隆技术可让经典再现
2014 年,电影《永远的蝙蝠侠》中知名演员瓦尔·基尔默(Val Kilmer),因患喉癌被迫做气管切开手术,导致声音受损。至此,瓦尔·基尔默与许多优秀影片擦肩而过,演艺生涯近乎跌入谷底。
今年 8 月,一家名为奏鸣曲(Sonantic)的初创公司声称,他们已经通过人工智能语音克隆技术创造出了瓦尔·基尔默的“原声”。Sonantic 公司的这一举动得到了市场普遍称赞,因为它为演员提供了其他解决方案无法提供的技术。
然而,社会中也有一些质疑的声音,有人认为:“这项技术有违社会道德。”另外一位艺人的经历,就是最好的反例。
在前几年,对于社会大众来说,人工智能声音克隆技术既陌生又遥远,在一些艺术品中被用于生产赝品。
今年 7 月,一部关于安东尼·波登(Anthony Bourdain)的纪录片引发了争议,据制片人向有关人士透露,他们使用人工智能声音克隆技术,为安东尼·波登制作了一段台词音频,但是当时并没有多少人注意。
该“声音门”被曝光后,许多人谴责安东尼·波登这一做法。
网红、演员和名人等声音商业化热潮将来临
毫无疑问,人工智能声音克隆技术具有很好的商业化前景。
今年年初,维睿通(Veritone)公司就推出了类似的声音克隆服务,该公司将网红、运动员和演员的在录音棚里录制好的声音,通过人工智能克隆技术获得其“逼真声音”,然后再获得网红等人的声音授权,就可以从事代言、广播节目等活动。之后网红、运动员和演员无需真人出镜即可实现同样的效果。
图|无明星出镜的音乐厅现场(来源:Pixabay)
Veritone 公司执行副总裁肖恩·金(Sean King)表示:“将一个人的声音克隆得形象逼真,以及如何对其应用场景进行扩展只是时间的问题,我们对很多不同行业带来的新机会,感到非常兴奋。”
网红、演员和名人的“声音”可以毫不费力地被出租出去,经纪公司希望能够通过克隆和出租公司旗下艺人的声音,以最小的努力轻松获得不菲的收入。
网红、演员和明星等角色的声音克隆技术,可能是未来几年最为明显的商业化应用。随着这些克隆技术的成熟,加之克隆出声音的技术壁垒较低,将会有许多初创公司可以提供类似服务。
Recommend
-
83
原文:ES6时代,你真的会克隆对象吗(二) 上一篇,我们从Symbol和是否可枚举以及属性描述符的角度分析了ES6下怎么浅拷贝一个对象,发表在掘金和segmentfault上,从评论看,部分人觉着看不懂,今天,我们用更简单的方式来聊聊深拷贝的问题 写在前面 深
-
81
GitHub is where people build software. More than 27 million people use GitHub to discover, fork, and contribute to over 80 million projects.
-
28
据艾瑞上月发布的报告显示, 2017 年中国知识付费产业规模约 49 亿元,2020 年将达到 235 亿元,大众为内容的付费会更加常态化。 但供给端的准入门槛正在变高, 公众号及各⼤内...
-
40
文/卡萨来源:鹿鸣财经(luminglab)“你会用信用卡的临时额度吗”“当然用啊”“那下个月还款日怎么办”“到时候再说啊”临近双十一的一周,身边人陆陆续续收到了信用卡临时提额的通知,5K到1W不等,甚至有些银行直接在双十一“大气”抛出了永久提额。面对突如其来的“钱包丰...
-
6
这个 GitHub 项目能克隆你的声音 (查看原文) 今天推荐一个黑科技开源项目,只需要你 5 秒钟的声音对话,就能克隆出你的声音,而且...
-
9
大家好,这里是每周更新的Github精彩分享周刊,我是每周都在搬砖的蛮三刀酱。我会从Github热门趋势榜里选出 高质量、有趣,牛B 的开源项目进行分享。1.
-
5
2023-12-12 06:26 Meta 推出可克隆声音并生成环境音效的人工智能 Audiobox 据 VentureBeat 报道,12 月 12 日,Meta 旗下 Facebook 人工智能研究(FAIR)实验室推出可克隆声音并生成环境音效的人工智能 Audiobox。它被描述为“...
-
7
Clone-Voice :简易的AI声音克隆工具,免费开源下载 1月 3, 2024 发表于: 优秀设计资源.
-
5
剪映克隆声音教程,做一本有自己声音的AI绘本吧! 3月 14, 2024 发表于: AI绘画教程.
-
3
OpenAI:可从15秒的音频中克隆出声音 OpenAI 刚刚宣布
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK