6

美图公司自研大模型上新,各类AIGC玩法可直接体验

 7 months ago
source link: https://www.qbitai.com/2023/10/88922.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

美图公司自研大模型上新,各类AIGC玩法可直接体验

head.jpg明敏 2023-10-11 12:48:14 来源:量子位

美图自研大模型3.0发布

明敏 发自 厦门

量子位 | 公众号 QbitAI

美图自研大模型3.0,正式发布!

并且全面应用于美图旗下影像与设计产品。

美图公司自研大模型上新,各类AIGC玩法可直接体验

这是自美图大模型面世100天后的最新迭代。

相较于最初版本,3.0版能够生成更加真实细腻的画面细节。

美图公司自研大模型上新,各类AIGC玩法可直接体验

如上这些生成能力,在美图秀秀上能直接体验。

美图公司自研大模型上新,各类AIGC玩法可直接体验

最近正流行的AIGC玩法,在其中都能找到。

美图公司自研大模型上新,各类AIGC玩法可直接体验

美图公司创始人、董事长兼CEO吴欣鸿透露,现在美图大部分产品都融入了自研大模型。

除了影像和设计领域,美图自研大模型还将在电商、广告、游戏、动漫、影视五大行业发力。

美图秀秀可直接体验

美图自研大模型名叫MiracleVision(奇想智能)。

其最显著的特点是更懂美学。

美图把长期积累的美学认知融入MiracleVision视觉大模型,并搭建了基于机器学习的美学评估系统,为模型生成结果打上“美学分数”,从而不断地提升模型对美学的理解。

所以美图也将自己的大模型称为是“艺术生和理科生的结合”。

目前MiracleVision3.0的最新能力在美图秀秀上即可体验。

美图公司自研大模型上新,各类AIGC玩法可直接体验

而且操作很简单。比如涂鸦生图,寥寥几笔的草图再加上提示词,大模型都能“力挽狂澜”。

美图公司自研大模型上新,各类AIGC玩法可直接体验

更加专业、控制更多的体验可以在AI视觉创作工具“WHEE”上体验。

比如“图生图”功能里,可以通过智能联想来生成完善的提示词。

同时也能通过文字控制不希望呈现的内容。

美图公司自研大模型上新,各类AIGC玩法可直接体验

更进一步可控制生成图像风格。

美图公司自研大模型上新,各类AIGC玩法可直接体验

以及可以通过参数调整、画面控制能让生成图片更加符合自己的预期。

在提升工作流效率方面,美图大模型MiracleVision现在进入了电商、游戏、动漫、广告和影视五大领域。

美图公司自研大模型上新,各类AIGC玩法可直接体验

从6月首次面世以来,MiracleVision经历了三次迭代。

  • 1.0版本主要初步构建大模型架构和基础;
  • 2.0版本联合了设计师、艺术院校老师学生共同构建了高质量数据集,使得大模型在美学方面达到更好状态;
  • 3.0版本更强调模型的可控性,在细节和局部控制上做了提升,使得模型在技术层面达到更好效果。
美图公司自研大模型上新,各类AIGC玩法可直接体验

目前,美图AI视觉创作工具“WHEE”的AI效果生成数已超过550万张,已初步打造设计师生态;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者。

美图吴欣鸿也表示,如今的美图全员拥抱AI。随着AIGC趋势的发生,美图有了更加明确的发展战略。

比如快速推出自研大模型、布局五大行业,这些动作都基于美图对于AIGC趋势的理解和洞察。

上半年投3个亿做研发

最明显的一个方面,是美图对于当下AIGC趋势活跃用户的理解。

吴欣鸿表示,他们观察到如今离AIGC趋势最近的人,不是设计师,而是“传播者”。

以新媒体运营、电商运营和KOL为主的群体。

这部分人群没有专业从业者的“包袱”和高要求,同时又能向下连接更多普通人。美图目前的发力点之一就是抓住这部分人群,逐步开发更加完善的AI工具、构建工作流。

美图公司自研大模型上新,各类AIGC玩法可直接体验

同时,美图也认为自身在大模型趋势下具备一个先天优势——可以很快得到用户反馈

作为一家成立已有15年的产品公司,美图已经构建起了足够庞大的用户群体,能够通过在自身平台上试水新功能,快速得到市场反馈并快速调整效果,这样能让大模型更高效地和实际场景结合起来。

作为AI能力的提供方,美图吴欣鸿认为,目前AI视觉大模型在生产端的三个待解决的问题是:垂直领域的极致效果、工作流整合、变现能力

一一对应来看,美图在这三方面已开始发力。

其一,美图快速迭代自研大模型,在100天时间里让模型生成效果更加丰富且可控,能在满足用户新鲜体验的基础上,提供更加具有实用价值的图像设计作品。

其二,美图选择了五大方向,面向生产者提供了AI设计工具。据透露,美图选择电商、游戏、动漫、广告和影视这几个行业,主要是看重了它们和互联网行业有更加原生的关系。这使得AI工具能更好融入其工作链路,整合工作流速度更快。

其三,变现能力。美图目前已经构建了一个创作者生态,这部分对AI感兴趣的创作者,可以将自己原创的AI视觉效果做成配方,在美图搭建的平台上售卖。这样一来,创作者能够获得更多收入,同时他们也能起到传播推广的作用,吸引更多人来使用AI视觉创作工具。

基于这些理解,今年美图正式提出了AI产品形态,包括底层、中间层和应用层。

底层为MiracleVision自研大模型。

中间层由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。

应用层由普通用户更熟悉的各类应用APP构成。

三层架构的搭建,根本逻辑还是为产品出发。

以底层研发为例,美图旗下美图影像研究院(MT Lab)早在2010年成立。目前公司大模型研发相关人员为600人左右。

今年上半年公司研发投入2.94亿元,同比增长10.8%。

美图坦言做研发是遵循更务实的逻辑,也就是看最终在用户和收入增长方面,是否能带来实际增长。而且这一切都自然都能通过实际业绩来证明。

今年上半年,美图公司实现总收入12.61亿元,同比增长29.8%。月活跃用户数达2.47亿,同比增长2.5%。VIP会员数超720万,创下历史新高。以VIP订阅为主的影像与设计产品业务收入6.02亿元,同比增长62.2%;美业解决方案业务收入2.86亿元,同比增长31.1%;广告业务收入3.49亿元,同比增长28.2%;其他业务收入2309万元。

不过回到当下,美图也坦言视觉大模型应用还正处在探索期。当下很多应用开发都是齐头并进,各家也都在摸索路径。

在吴欣鸿看来,视觉大模型应用普及将经历三个阶段:2024年之前为探索期,2024-2025年为高速发展期,2026-2030年为成熟期。

美图公司自研大模型上新,各类AIGC玩法可直接体验

而想要成功穿越周期,不仅要有审视趋势的能力,当然还要有真金白银的支撑。

就以当下让厂商们焦虑的算力问题,美图透露目前正在和多家云厂商合作,有充足算力可以使用。

吴欣鸿更进一步补充,美图“很幸运”能快速通过订阅和单购获得回报。

如果光投入没有回报,换谁都会紧张。

但是对于我们来说,都还好。

我们的毛利也还好,所以都能cover掉。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK