4

腾讯发布AIGC报告:数字内容迎全新变革,版权伦理问题值得关注

 1 year ago
source link: http://www.gamelook.com.cn/2023/02/509307
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

腾讯发布AIGC报告:数字内容迎全新变革,版权伦理问题值得关注

2023-02-03 • 数据/报告

【GameLook专稿,未经授权不得转载!】

GameLook报道/2022年是AIGC,或生成式AI“Generative AI”爆发的一年。以OpenAI、Stability AI、Midjourney、NovaAI等为代表的企业和工具,在全球范围内掀起了一场从消费者到资本市场的狂热浪潮。

虽然来到2022年年底、2023年年初,AIGC领域也并不太平,爆发了比如Art Station上“AI vs人类”的战争、三位海外艺术家起诉了Stability AI、Midjourney公司等事件,以及面临着第一批AIGC公司,比如StockAI,因为数据、算力的庞大支出等正式关停的现状,但这些挫折和争议并非不可解决。

lazy.png

Point-E

当下AI已经在绘画、音乐甚至是游戏资产的生成方面,展现出了相当的潜力,OpenAI、谷歌、英伟达等公司也推出了文字生成3D模型实验技术Point-E等工具,未来随着各国法律的完善、行业的竞争、自律和规范,AI作为全新的生产力工具、AIGC作为全新的内容创作阶段,在2023年及以后在各行各业继续发展的大趋势,依旧值得关注。

近日,腾讯研究院也就AIGC的相关技术和应用前景,从生态、趋势、挑战等多个维度思考,发布了《AIGC发展趋势报告2023:迎接人工智能的下一个时代》(以下简称为《AIGC报告》)。

lazy.png
  • 以下图片均来自报告中截取的内容

消费端:AIGC成未来互联网基础设施

首先是消费市场,伴随着现如今全球数字内容消费市场的持续扩张、升级和转型,数字内容进入强需求、视频化、拼创意的螺旋式升级周期,《AIGC报告》认为,“AIGC有望塑造数字内容生产与交互新范式,成为未来互联网的内容生产基础设施”。

lazy.png

得益于过去多年来,大型预训练语言模型和人类反馈强化学习(RLHF)技术等技术出现和发展,当下的AIGC技术已经在文字、音乐、图片、视频、3D多种媒介形态的生产中,担任了多样化的助手工作,也已经有不少消费者体验到了AIGC的优势,就比如米哈游在《未定事件簿》实装的AI配音。

“根据6pen预测,未来五年,互联网上10%—30%的图片内容将由AI参与生成,有望创造超过600亿的市场空间,若考虑到下一代互联网对内容需求的迅速提升,国外商业咨询机构Acumen Research and Consulting预测,2030年AIGC市场规模将达到1100亿美元。”

lazy.png

而ChatGPT这种级别的AI问答系统的出现,也为数字人这种元宇宙相关的领域,提供了全新的可能。《AIGC报告》中称,AIGC工具将在制作效能、交互体验等多方面升级当前的数字人。

“基于AIGC的3D数字人建模已经初步实现产品化,目前精度可以达到次世代游戏人物级别,通过便捷化地上传图片即可生成3D数字人面部模型。”

lazy.png

除了数字人,《AIGC报告》还从技术、个性化、创作自由等方面,论证了未来“AIGC推动元宇宙发展”的重要性。

“在元宇宙发展的过程中,游戏是虚拟世界重要的载体,AIGC可以极大提高数字原生内容的幵发效率,降低游戏幵发成本。具体来说,剧情、角色、头像、道具、场景、配音、动作、特效、主程序未来都可以通过AIGC生成。”

“同时,AIGC将赋予用户更多的创作权力和自由,促进创新并提升元宇宙的用户体验。AIGC将作为生产力工具为元宇宙用户提供个性化内容体验。”

产业端:合成数据牵引人工智能的未来

而在产业端,合成数据(synthetic data)领域可以说是当下AIGC技术持续创新发展的重点,也是全新的发展契机所在。

所谓合成数据,是值得“计算机模拟(computer simulation)技术或算法创建、生成的自标注(annotated)信息,可以在数学上或统计学上反映真实世界数据的属性,因此可以作为真实世界数据的替代品,来训练、测试、验证AI模型。”

《AIGC报告》中指出,数据是当前制约AI技术发展的最大原因,根据合成数据服务商AI.Reverie的信息,人工标注一张图片可能需要6美元,但人工合成的话只需要6美分。

lazy.png

除了成本和获取难度上相较于真实世界数据存在优势,合成数据还在隐私、算法偏见、稀有数据场景的生成、AI模型训练速度方面,相较于真实世界数据存在优势。特别是在金融、医疗等数据较为敏感的行业,合成数据由于是用程序生成,与真实世界无关,能够更好地在相关领域规避风险,发力研究,持续拓展AIGC的应用空间。

当然对于市场而言,更大的机遇在于,当前合成数据领域还处于互联网大厂加大投资布局,创业公司方兴未艾、不断涌现的状态。

lazy.png

“在过去的18个月,公众视野中已知的合成数据公司融资总额达到3.28亿美元,比2020年高出2.75亿美元。”

“根据Cognilytica的数据,合成数据市场规模在2021年大概是1.1亿美元,到2027年将达到11.5亿美元。Grand View Research预测,AI训练数据市场规模到2030年将超过86亿美元。Gartner预测,到2024年用于训练AI的数据中有60%将是合成数据,到2030年AI模型使用的绝大部分数据将是人工智能合成的。”

《AIGC报告》表示“合成数据有望推动人工智能迈向2.0阶段(AI2.0)。”

lazy.png

社会价值和风险

正所谓技术的革新一定会对社会产生影响,《AIGC报告》认为“AIGC的社会价值体现为革新数字内容与艺术创造领域,并将辐射到其他领域和行业,孕育新的技术形态与价值模式,甚至会成为通用人工智能的可能性路径”。

就比如在过去一年AIGC中最热闹的AI绘画,以及其代表的AI艺术领域,AI可以解放人类的创造力,革新艺术领域。通过对现有艺术的模仿,在取代大量基础性的艺术创作工作的同时,AIGC还可以利用不同于人类思维的模式,为艺术家的创作提供新的灵感,甚至是新的艺术风格。

“AI虽然不拥有真正的创造力,但是它让使用者拥有了新的创造力。”

但随着AIGC带来的社会文化、生产变革而来的,还有已经正在发生,甚至迫在眉睫的一系列问题。《AIGC报告》中,主要囊括了“知识产权挑战”“信息安全挑战”“伦理挑战”“环境挑战”四大AIGC领域目前面临的问题。

知识产权挑战是在AI绘画等领域,目前被各界讨论最多的主题之一。对于AI生成内容的版权风险,《AIGC报告》表示“目前国内国外的通行做法也都是会考虑除了AI之外,是否有人的智力或创造性劳动”

lazy.png

其次安全挑战,主要指的是AI生成的内容的安全,以及隐私数据的安全。前者最直接的例子就是AI换脸,借助深度伪造的音视频内容以及欺诈勒索等手段,全球各地的不法分子已经造成了不小的经济损失。

而后者在此之前也有过经典案例,在GPT-2模型里,只用一段特殊的前缀,AI生成的内容就会包括特定个人的姓名、电话等信息。

第三点伦理挑战则主要体现在AI存在明显的歧视现象,以及AIGC是否具有自我意识(去年谷歌的工程师曾声称旗下的AI已经有了自我意识)。

“OpenAI在对DALL-E 2的生成结果进行公平性测试时发现,其表现出显著的性别和种族歧视。即倾向于更高频地生成男性和白色人种的人类图像。”

lazy.png

至于最后的环境挑战。作为一个需要强大算力支撑的新兴技术领域,“有研究人员对Transformer、ELMo、BERT、GPT-2、GPT-3等进行了碳排放研究。在一天的训练时长里,GPT-3模型训练的二氧化碳排放量为552吨。”

Midjourney的创始人大卫•霍尔兹也将算力支持而非用户量,视作AIGC大规模的商业扩展的阻力,“如果(Midjourney)用户量达到1000万人,那么世界上将没有足够的算力来支持。”

如若转载,请注明出处:http://www.gamelook.com.cn/2023/02/509307


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK