1

快手光合大会公开全模态大模型AIGC解决方案 人机协同助力创作全流程提效

 9 months ago
source link: https://www.dingkeji.com/post/sj/152536.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

快手光合大会公开全模态大模型AIGC解决方案 人机协同助力创作全流程提效--丁科技网

快手光合大会公开全模态大模型AIGC解决方案 人机协同助力创作全流程提效
2023-08-15 14:34:07
来源:丁科技网  

8月10日,2023快手光合创作者大会在上海召开。大会以“热爱,让收获更多”为主题,深入解读快手创作者成长及内容生态走势,重点阐释平台好内容背后的AI技术支持,帮助创作者更好地提升短视频内容的创作力和生产力。

在大会“AI赋能,守护创作”板块,快手生产&社交业务负责人肖新攀、快手AI&用户增长业务负责人王仲远分别发表了主题演讲,从技术角度解析了如何借助AI生产短视频好作品。快手在演讲中还首次正式公开了大模型方面的进展并重点介绍了AIGC数字人解决方案。

AI技术加码好作品生成,视频创作也可以很简单

对于一个好的短视频作品来说,好内容和好形式缺一不可。那么如何用短视频的方式将好内容呈现出来呢?这就需要借助对于分镜和构图、片段剪辑、转场、背景音乐等形式设计来做出更好的视听效果,而这也无疑对创作者提出了更高的要求。

image-20230815143139-1-1692081100528.jpeg

一直以来,快手始终致力于让所有人都可以用短视频轻松地记录、表达和社交,并为此打造好用的视频创作工具,满足广大创作者的需求。伴随着AIGC等新技术的出现,快手也在不断优化技术产品功能、上新产品,为创作者们提供更便捷、高效的创作服务。

在肖新攀看来,AIGC能够让视频创作变得更简单。具体而言,对于专业创作者来说,AIGC能够大幅降低视频制作的成本,让大家把更多时间放在打磨创意和内容上;对于有好想法,但在创作视频上有所欠缺的普通用户来说,通过AIGC也能够轻松制作出效果精美的视频,成为一名视频创作者。

在降低创作者视频制作成本方面,借助AI技术,快手不仅可以帮助创作者将繁琐复杂的操作简单化,还能通过AI生成海量图片、视频、贴纸、音色素材、文案等供创作者们使用。例如,当创作者在剪辑时需要用到“飞机划过天空”的图片素材,但相册中没有、当下又没有条件拍这样的素材时,就可以借助快影上的AI文生图功能,实时生成所需素材。

据肖新攀介绍,在过去一段时间里,快手不仅在AI技术方面投入了大量的资源,还在快手App、快手官方剪辑工具快影,以及官方拍摄工具一甜相机上线了一系列创作功能、素材和效果玩法。“接下来,我们还计划在快影和一甜相机上线AI四格漫画、AI生成影视解说脚本、AI生成商品介绍脚本、AI一键Vlog剪辑等一系列AIGC能力,赋能更多的创作者。”

全模态大模型AIGC解决方案亮相,人机共创提升创造力和生产力

为了更好地服务广大创作者,快手持续迭代更新AIGC技术能力,以帮助创作者解决创作过程中的各种痛点。王仲远表示:“快手AIGC以创作者为核心,人机共创,全流程提升短视频内容的创造力和生产力。”

image-1692081202245.png

目前,快手AI团队致力于用AIGC能力去帮助广大的快手创作者解决创作过程中的各种痛点,提升创造力和生产力。快手AI团队打造的“全模态、大模型AIGC 解决方案”,基于强大的自研基座AI大模型,具备文本生成、图像生成、3D素材生成、音频音乐生成、视频生成等全模态AIGC能力,覆盖从灵感启发到创意生成、从多元素材提供到智能化制作的创作全流程,通过人机协同,让创意更新奇、素材更多元、制作更轻松。

在创意激发方面,快手基于自研语言大模型,强化了计算机系统对自然语言的理解和生成能力,能够根据用户一个指令,在一分钟内完成故事撰写、脚本整理,并基于场景主题生成对应图片和配乐,从而节省创作者的时间和精力,同时提供更多视角的灵感和创意。快手的语言大模型在同等规模参数下,在行业里主流的绝大部分基准模型测试中取得第一(例如侧重英文综合能力的MMLU,侧重中文综合能力的C-Eval、C-MMLU,侧重代码能力的Human-Eval),在相关人工评测中也表现优异,擅长内容创作、逻辑推理、解数学题等任务。

据凤凰网科技报道,快手基于自研大语言模型的「快手AI对话」已经于8月8日开启内测。「快手AI对话」以搜索场景为入口,依托于快手丰富的内容生态训练,用户可以通过对话互动的形式,查找快手站内的短视频、达人、百科等内容,是一种全新的搜索形态。「快手AI对话」在多元内容的呈现上,相比传统的搜索将有更多可能性,有望在未来大大降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。

在素材挖掘方面,快手自研文生图大模型,基于强大的图像生成能力,能够帮助创作者生成对应主题的图片素材,让创意和想象力可以被更好地描绘。同时,该模型提供对图片素材进行局部修改、全局魔改、图像多方位拓展、多张图像融合等图像编辑能力,灵活高效地满足创作者们对AI素材的“再创造”需求。

而针对创作者们对多元化音乐素材的需求,快手在歌词和旋律两方面提供强大的音乐生成能力。从歌词的“形”、“意”、“蕴”入手,快手设计并实现了基于预训练的可控歌词生成系统,可以根据主题AI生成歌词,再完成结构化旋律生成。

在剪辑和制作方面,快手AIGC视频生成解决方案可以实现一键制作特效大片,生成的视频帧间稳定不抖动,支持各种风格和时空转场,还可以单图输入生成高品质表情姿态。

image-20230815143139-3-1692081100475.png

本次大会上快手还重点介绍了AIGC数字人解决方案——快手智播。快手智播支持用户快速制作自己的孪生数字人,并使用其快速开直播、做短视频,可在本地消费、本地生活、电商直播等场景落地,部分场景效果可以接近真人实拍。

快手智播使用也非常便捷,最低只需要3分钟的视频和音频素材(5分钟以上更佳),就可以制作相应的数字孪生形象,同时快手还将提供整套的SaaS服务工具,不需要用户另外采购任何硬件设备,真正做到一键开播。这套流程在当前的技术能力下,仅需千元即可完成,而此前传统数字人制作费用一般需10万元以上。

王仲远表示,身处这场 AI 技术变革之中,快手坚信AIGC将赋予普通用户更多的创作权力和自由,也坚信AIGC正在成为短视频内容生产的基础设施。通过不断升级技术能力、优化产品功能,快手将为创作者提供更便捷、更智能的创作体验。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK