0

韩国游戏巨头NCsoft发布AI大模型VARCO,面向图文及数字人创作

 8 months ago
source link: http://www.gamelook.com.cn/2023/08/525771
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

韩国游戏巨头NCsoft发布AI大模型VARCO,面向图文及数字人创作

2023-08-21 • 海外企业新闻

【GameLook专稿,未经授权不得转载!】

GameLook报道/人工智能无疑是当今世界最热门的话题之一,尤其是游戏行业。

不过目前大家对AI的热情更多其实集中在应用侧,无论是将相关工具投入到公司内部,试图辅助降本增效,还是利用生成式AI的能力探索其打造更加沉浸、新颖的游戏体验可能,各大公司对人工智能都表现出了十分的兴趣。

而一切应用和工具的基础,即大型语言模型(LLM),目前世界上领先的LLM大多来自美国、英国、加拿大等英语国家或地区。

但过去一年里,可能是受数据、安全、隐私、技术积累等问题,以及地缘政治风险的影响,国内头部的游戏和互联网公司,就比如腾讯、阿里、百度和网易等,也都在同时积极探索相关领域,前后发布了自己的AI大模型。

lazy.png

中国如此,韩国公司自然也不例外。

在前不久Kakao宣布将在10月发布其最高630亿参数的KoGPT后,近日,韩国游戏公司 NCsoft 就直接拿出了自研的韩语LLM“VARCO”,并直接放上了亚马逊的托管平台SageMaker,并提供了一个月的免费使用。

根据NCsoft的说法,VARCO是“Via AI,Realize your Creativity and Originality”的缩写,作为韩国第一个由游戏公司开发的LLM,体现了NCsoft以AI技术赋能游戏开发者和用户的愿景,可用于文本生成、文生图、数字人创建和会话代理等各种用途。

面向韩语优化成VARCO最大优势

结合了 NCsoft 最新的 AI 和 NLP 技术的大模型, VARCO的5大核心功能包括Vision(视觉)、Art(艺术)、Reasoning(推理)、Communication(沟通)和Operation(操作)。 VARCO 旨在通过提供基于 NCsoft IP 的专业模型以及向公众和游戏开发者提供有竞争力的AI和游戏开发工具。

目前,VARCO 官宣将支持的主要功能包括VARCO 文本(Text)、VARCO 艺术(Art)和VARCO数字人(Human)。

lazy.png

其中Varco 文本可用于一般游戏文本和文档。用户可以轻松创建和管理基本设置,例如角色、游戏世界观和地点,并借助 VARCO Text AI 模型为游戏角色生成逼真的对话。

VARCO 文本还涵盖游戏领域外的一般文档创建功能,例如撰写电子邮件等。

lazy.png

VARCO 艺术是一款文生图工具,通过网页(Varco Studio 将于明年上半年发布),任何人都将可以将其创造力变为现实。用户可以根据自然语言输入生成图像或修改现有图像以实现各种效果。

此外,不需要使用插件,VARCO 艺术还支持从原始图像中提取姿态或轮廓等元素,用户可以基于这些元素创建全新的图像。

lazy.png

VARCO 数字人则涵盖了创建、编辑和操作数字人类的全流程。类似于Epic的MetaHuman,用户可以选择并构建角色、然后自定义其外观、声音、动作和行为。

通过自定义数字人的特性,VARCO 数字人可以化身不同领域的专家,通过语音或文本与用户实时交互。

lazy.png

根据NCsoft官方的说法, VARCO目前一共有13亿、64亿以及130亿参数的三个版本,目前在亚马逊SageMaker上开放免费试用的为最大130亿参数的版本,后续才会上线更大参数的版本。

虽然这与GPT-4以及 Claude 2等大型语言模型相比,从纸面数据上并不占优势。

但如果你使用过OpenAI的ChatGPT,或是基于GPT-3.5的API,处理任何韩语相关的工作,就会发现即便这些欧美大模型即便宣称其支持多语种输入,但在效果和能力上,其实就会出现相当明显的滑坡。

就比如GameLook经常会接触到的翻译工作,在调用OpenAI的API时,且不论文字的准确性,其运行的稳定性就有待提高。

lazy.png

OpenAI API

在将一篇不长的韩语文章翻译成中文时,调用OpenAI的API还容易会出现以上这种,三段文字返回的翻译结果包括中韩英三语的现象。

而在将英文内容翻译成中文时,就笔者的个人体验,即便是上万字的专业性内容,类似抽风的现象从未出现过。

针对韩语生成或理解进行优化,或将成为韩国公司发布的AI大模型最大的优势之一 。

据悉,VARCO使用了可公开用于预训练的数据集、从互联网收集的数据集以及由 NCsoft 内部构建的数据集进行训练。 VARCO 还采纳了韩国用户的反馈来改进其行为和性能。

打造数字人流水线

作为韩国最大的游戏公司之一,NCsoft其实一直都在积极探索和应用AI技术到其游戏产品和服务上。

NCsoft最早于2018年成立了一个AI中心,该中心由专门从事语音、视觉、自然语言处理、机器学习和深度学习等不同领域的各种实验室组成。

AI中心的一些成果包括支持10种语言的NC语音实时机器翻译服务;能识别和分析各种图像的NC视觉计算机视觉服务;可以理解和生成各种任务和应用自然语言文本的NC NLP自然语言处理服务;以及可以从数据中学习和优化游戏中的各种过程和系统的NC ML/DL机器学习和深度学习服务。

lazy.png

NCsoft CCO Taekjin Kim的数字人 图片来源:NCsoft官网

此次VARCO的发布,也算是NCsoft多年AI研究积累下的一大关键成果。而在此次VARCO发布的三大核心功能组件中,VARCO 数字人可以说是最让GameLook期待的功能。

一方面,游戏与数字人之间的关系在本质上是分不开的。游戏中的虚拟空间是数字人可以积极参与的区域,设计良好的数字人使虚拟世界更具吸引力。

特别是对于NCsoft这种MMO公司而言,与他人一起玩MMORPG可能比单独玩更令人愉快,而AI驱动的数字人将能够模仿人类的思考和行为,与玩家互相交流,创造更高的乐趣。因此,“与数字人的互动是游戏中不可忽视的重要元素,创造能像人一样深入交互的数字人非常重要”。

另一方面,则源自以NCsoft为代表的韩国公司,一直以来对于数字人的积极态度。

2023年3月,NCsoft在旧金山举行的GDC 2023上发布了旗下动作冒险游戏《Project M》的预告片。NCsoft的CCO Taekjin Kim当场化身数字人介绍解释了《Project M》开发的当前状态,以及预告片中呈现的视觉研发和AI技术。

此前NCsoft也曾通过一整集的“TECH Standard”纪录片,宣告其通过AI技术,试图打造更有效、更高效地产生、编辑和管理数字人的流水线的愿景。

lazy.png

而正如上文所说的VARCO 数字人是一个集成工具,涵盖了数字人的整个创建、编辑和操作的全过程。

通过使用VARCO Human,游戏开发者可以创建更逼真、更多样化和更个性化的NPC,可以用自然语言与玩家交互。这可以提高游戏内容的质量、多样性和创造力,也可以减少游戏开发所需的成本、时间和劳动力。

AI进入新阶段,期待幻灭但重要性依旧

虽然对于生成式AI带动的本轮AI浪潮,不少企业依旧抱有极高的热情。

但最近,市场研究机构Gartner发布报告判断,从生成式AI的炒作循环(Hype Cycle)来看,它已经达到了“过度期望峰值”(Peak of Inflated Expectations)。因为消费者和媒体对它有过高的期望,它在未来会迅速落入“幻灭谷”(Trough of Disillusionment)阶段。

lazy.png

这对于整个行业而言,不仅是在上头氛围下的一盆冷水,在GameLook看来,其实也是提醒各大公司需要对AI的发展保持理性,做好长线战斗的预期。

就像NCsoft和其他外国公司利用大型语言模型开发VARCO一样,中国企业也需要在后续没有如此顺利、狂热的时期,继续积累技术和数据,培养AI人才,并为未来做好充分准备。

尽管目前生成式AI表现出令人难以置信的创造力,但距离真正的通用AI还有很长的路要走。

当然这并不意味着中小型企业也许要想方设法投入大量资源,研发AI大模型。在技术潮流不断涌现的当下,企业完全可以根据自身条件,选择涉足其他新兴技术领域,比如提高开发者体验的新技术、基于云计算的创新平台或者AI领域相当敏感的安全与隐私技术等。

只有把握新技术的方向和节奏,中国企业才能在未来更激烈的市场竞争中保持优势。

如若转载,请注明出处:http://www.gamelook.com.cn/2023/08/525771


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK