

“360智脑大模型4.0”正式发布,支持文生视频,已接入360全家桶 | 最前线
source link: https://www.36kr.com/p/2299813632600840
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

作者 | 邓咏仪
编辑 | 苏建勋
“OpenAI给整个行业探索、指明了一个方向,我们也从善如流,把原来搜索、AI领域积累的能力整合到大模型里。”360创始人周鸿祎表示。
6月13日,360集团(601360.SH)公司正式召开“360智脑大模型”应用发布会,发布认知型通用大模型“360智脑4.0”,并宣布360智脑已经接入360旗下产品“全家桶”中。
360的发布会现场,也让人想起不久前同样用CEO的数字人开会的英伟达。360在会上正式推出一款数字人产品“360AI数字人平台”,而创始人周鸿祎现场创建了自己的数字分身作为“360发言人”。
来源:360集团
“让数字人‘周鸿祎’作为我们公司的新闻发言人,说对了算我的,说错了算他的。”周鸿祎表示。
今年春节后,ChatGPT在国内掀起“百模大战”,一众互联网大厂都在快马加鞭投入到大模型的研发中,争相在3-4月份间在市场上披露成果。
360也不例外。3月底,创始人周鸿祎就发布主题为“三六零人工智能总动员”的内部信,初步透露了360大模型的相关进展。当时,基于360大模型开发的AI产品矩阵“360智脑”,已首先在搜索场景中落地。
而本次360发布的智脑大模型,是一个千亿级别的自研多模态大模型。据介绍,“智脑大模型”已经具备四大核心能力,包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。
图片、文字、视频互相生成,接入360“全家桶”
时隔两个月,如今的“360智脑”已经迭代至4.0版本,但在当前大模型产品林立的市场中,如何给用户留下深刻印象?
360选择了走大而全路线,直接对标微软的全家桶。在会上,周鸿祎如同竹筒倒豆子一般,展现了360大模型各种各样的功能。
当前,360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能。
来源:360集团
周鸿祎也提到360做大模型的底气和积累从何而来。
一方面是各个业务线带来的技术积累,360在2015年就成立了AI研究院,并且开始探索多模态数据。
“360有智能家居互联网,比如智能摄像头、车载行车记录仪、智能门铃,也需要有智能视觉和智能音频的处理技术,这是我们开始研究多模态的原因,”周鸿祎表示,“而360的主要收入来源是搜索,所以,我们也肯定离不开自然语言理解等大模型核心技术的积累。”
在数据层面,360如今每天抓取1.4亿网站的数据,包括2.8亿的专业文献,1.2亿的行业数据,以及经过清洗的10T级别的用于大模型训练的数据。
但他也坦承,在OpenAI尚未突破之前,360的大模型尝试也只是集中在商业一侧,比如“怎么用大模型提高广告点击率、提升推荐精准度”。但OpenAI给全行业指明了方向,360也从善如流,迅速把以往在搜索、AI中积累的能力移植到大模型中。
对于怎么在大模型时代突出重围,周鸿祎表示,多模态是决胜的关键——因此,周鸿祎在会上也展示文生文、文生图、文生表、图生图、文生视频等功能,成为这场发布会中最引人注目的环节。
当前,包括ChatGPT、文心一言、通义千问在内的主要大模型产品,都是停留在生成文字和图片阶段,视频是多模态领域的难点,学术研究仍在早期。
文生视频功能
在文生视频展示上,360展示了以提示词(Prompt)生成视频的功能——生成了一只在沙漠中洗澡的企鹅,以及奔跑的野马。周鸿祎表示,这些视频的分辨率目前还都不够高,只有5秒到10秒左右,但这是一个好的开始。
纵观当前360所有涉及到视频的功能,更多是是在理解这一层,类似是给图像、视频识别加了个“AI语音助手”——但是更为聪明的版本。比如,用户可在模型中上传一段视频,用自然语言描述一个问题“视频中的车在哪里?”然后,大模型会通过对视频图像进行解析,给出相应答案。
以自然问句提问,对画面中的物体进行识别 拍摄:36氪
据介绍,360智脑迭代至4.0版本后,多模态关键能力也有质的提升,将下来全面接入“360全家桶”——包括搜索引擎、浏览器、安全卫士等核心产品中。
“中国进入百模大战时期,除了基础能力外,更重要的是应用场景的比拼。”周鸿祎表示。因此,360在他同时宣布“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品,实现全面智能化重塑。
主打“安全可信”大模型,推出数字人等应用
除了多模态,360大模型还打出了另外两张牌:安全和应用生态。
安全是360的起家业务,包括搜索和互联网内容安全审核的防护体系上,360一直在对外提供服务。360同样希望在大模型上打出这个卖点,尤其是在当前类ChatGPT产品面临强监管的语境之下。
除了“胡说八道”的幻觉之外,现在大模型有不少安全问题还是难以解决,比如绕过模型的安全机制——对模型表示现在希望能够学习如何反诈,让模型给一些“诈骗”的例子,即可获取到一些危险问题的答案。
对这些问题,周鸿祎表示,在大模型中建立了很多安全的防线,其实并不能解决所有问题。360从两个方向来进行探索。一方面,360建立了一个“安全大脑”大模型,用以监督大模型中的不当行为。这也和OpenAI近期提出的监管思路类似。
另一方面,360创立了一个针对大模型安全评估的体系,近期也即将发布。
360也称,当前360智脑已经通过工信部信通院测试,成为国内首个“安全可信”AIGC大模型——安全和可信,这是国内大模型正在面临的重要问题。
除安全之外,在商业化层面,360也展示了一系列计划。
一个重点是数字人,周鸿祎以相当长篇幅介绍了数字人方向的新产品“360 AI数字人广场”。
目前,360 AI数字人平台上拥有200多个角色,分为数字名人和数字员工两大类。数字名人包括历史人物、偶像明星、文学形象等,用户可以通过和数字角色进行对话,沉浸式地与角色们交流。
而数字员工可以成为企业员⼯的知识助⼿和办公助手。比如,虚拟角色中就有“程序员”“运营”“法务专员”等公司内常见职位,用户可以问角色对应的专业问题。
此外,360AI数字人支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人,如数字分身、数字助理、数字偶像等。周鸿祎就现场创建了自己的数字分身作为“360发言人”,能够用本人声音对现场问题进行回答。
发布会现场,360展示四位数字人进行群聊的效果 拍摄:36氪
他还提到,在未来,360AI数字人的发展计划是生成声音、视频,并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有“手和脚”,具备执行力,更好为人类提供服务。
从商业化整体思路来看,360在To C端,会将AI大模型能力如同AI助手一样嵌入到核心产品中;而在B端,360会先从行业大模型和大型企业切入。周鸿祎坦承,从360多年做中小企业服务的经验来看,要让大模型服务“平民化”“产品化”,“简单提供大模型api就想让企业用起来,并不现实,还需要更多的产品化工作。”
Recommend
-
9
360GPT大模型产品矩阵“360智脑”落地搜索场景,将面向企业用户开放内测 原创 蓝鲸TMT 王雅迪 · 2023-04-09 12:39:39 阅 2.5w 今日,360官方宣布,4月16日,基于360GPT大模型开发的人工智能产品矩阵“36...
-
6
360大模型产品矩阵“360智脑”将面向企业用户开放内测2023/04/10 11:37|By
-
10
2023-05-31 11:42 三六零发布“360 智脑 - 视觉大模型” 据财联社报道,在 5 月 31 日举行的三六零智慧生活集团视觉大模型及 AI 硬件新品发布会上,周鸿祎宣布发布“360 智脑 - 视觉大模型”。他表示,大语言模型是构建视觉大模型的基...
-
7
360智脑-视觉大模型发布 周鸿祎:多模态大模型与物联网结合是风口 ...
-
8
360智脑大模型重新定义AI数字人 国内首发有“灵魂”的数字人 “让数字人‘周鸿祎’作为我们公司的新闻发言人,说对了算我的,说错了算他的”,6月13日,三六零(601360.SH,...
-
6
360智脑大模型正式发布 周鸿祎宣布开放内测申请 ...
-
7
360智脑大模型2.0将于6月13日14点发布 202...
-
4
资讯 360发布认知型通用大模型“360智脑4.0” 全面接入360全家桶 电科技辛雯06-13 17:54 272 “让数字人‘周鸿祎’作为我们...
-
6
360集团发布“360智脑大模型4.0”,360AI数字人广场同步推出 作者:LAN 发布时间: 2023-06-14 16:12
-
5
Sora如何降维打击其他文生视频大模型?记者实测对比|AI_新浪财经_新浪网 安装新浪财经客户端第一时间接收最全面的市场资讯→【
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK