1

盘点2023年AI行业:从GPT-4到AI孙燕姿席卷华语乐坛

 3 months ago
source link: https://www.digitaling.com/articles/1038736.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

盘点2023年AI行业:从GPT-4到AI孙燕姿席卷华语乐坛

remote_170721385563649.png

作者:卷毛,编辑:张洁,来源:头号AI玩家
原标题:2023年AI行业大事件盘点:从GPT-4到百模大战,从AI孙燕姿到OpenAI“宫斗”大戏

最近GPT商店正式上线,AI玩家们又热闹了起来,钻研着怎么做个GPT上架赚钱。

自从ChatGPT引爆大模型热潮,2023年,在全球范围内,生成式AI技术的突破和应用不断刷新着我们的认知。从大型语言模型的迭代升级到多模态AI、Agent的兴起,再到AI在各个行业的深入融合,AI领域的竞争愈发激烈。

在国内,各大科技公司纷纷推出自家的AI产品,掀起“百模大战”,众多AI创业者开始“卷”AI创新应用,政策层面也逐步完善对AI技术的监管和引导。

loadimg.gif
loadimg.gif

(制图:NUPD)

“头号AI玩家”按时间整理了2023年AI行业大事件,并从中选出十大热门事件,在下文展开回顾。以OpenAI为代表的海外AI玩家正引领着AI技术的前沿发展,国内这些内容平台的AI功能虽然在应用范围和讨论热度上不及头部产品,但考虑到平台的用户规模和在国内的影响力,这些依然是值得注意的尝试。

AI行业日新月异,随着AI技术的不断成熟,我们将看到更多AI原生的应用玩法,AI也将更加深入地融入我们的日常生活,从工作助手到生活伙伴,从内容创作到决策支持,AI会逐步成为推动社会进步和创新的重要力量。

01
史上最强大模型GPT-4登场

2023年3月15日,OpenAI发布大型多模态模型GPT-4,可以接收图像和文本输入,输出文本,虽然它在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上与人类水平相当。

loadimg.gif

GPT-4博客地址:https://openai.com/research/gpt-4
GPT-4技术报告地址:https://cdn.openai.com/papers/gpt-4.pdf

相比上一代GPT-3.5,GPT-4拥有更广的知识面和更强的解决问题能力,在创意、视觉输入和长内容上的表现也都更好了。

GPT-4能理解梗图

loadimg.gif

GPT-4能根据草图快速生成网页HTML代码

loadimg.gif

如今GPT-4仍然是业内领先的、最受瞩目的大模型,不过需要订阅ChatGPT Plus或通过API访问,也可以通过微软Copilot免费体验。

附OpenAI重要发布时间线:

2022年11月,OpenAI悄然发布GPT-3.5,ChatGPT随之推出
2023年2月,ChatGPT Plus订阅计划推出,每月20美元起
2023年3月,ChatGPT API、GPT-4、ChatGPT插件先后发布
2023年5月,免费的ChatGPT iOS应用程序上线,支持语音输入
2023年7月,ChatGPT新增“自定义指令”功能,安卓版ChatGPT上线
2023年8月,ChatGPT Enterprise推出
2023年9月,OpenAI发布DALL-E 3,并将其集成至ChatGPT
2023年11月,OpenAI在DevDay上发布GPT Builder、GPT-4 Turbo、Assistants API等更新

02
百度发布文心一言,打响“百模大战”

随着ChatGPT的一鸣惊人,互联网大厂、科研机构、AI创业公司等国内玩家纷纷上场,开启了“百模大战”。

2023年2月7日,百度宣布在筹备大模型新项目——文心一言(英文名ERNIE Bot),到了3月16日,文心一言开放测试,展示了在文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景中的表现,打响了国内大模型竞赛的第一枪。

文心一言官网

loadimg.gif

其基础模型文心大模型在10月升级到4.0版本,同时,百度发布了全线重构的新搜索、新地图等十余款AI原生应用。截至2023年12月底,文心一言的用户规模已突破1亿。

百度创始人、董事长兼首席执行官李彦宏被《时代》周刊评为“全球AI领袖”,他预言:“我们即将进入一个AI原生的时代。”在12月16日举办的极客公园创新大会2024上,他再次强调“卷AI原生应用才有价值,大模型进展对大多数人不是机会”

03
AI孙燕姿席卷华语乐坛

2023年5月,“AI孙燕姿”惊艳出道,网友用AI音色转换技术Sovits4.0(全称So-vits-svc)训练复刻了她的嗓音,翻唱起周杰伦的《发如雪》、云南山歌《朝你大垮捏一把》等歌曲,B站相关视频播放量累计超千万。

loadimg.gif

不过,这类合成的AI歌手存在侵犯版权的风险,比如未经授权使用他人的声音素材训练生成AI音频并发布,涉嫌构成著作权侵权。

孙燕姿本人的回应将事件推向新的高潮,她说:“你跟一个每几分钟就推出一张新专辑的人还有什么好争的。”

她认为,AI耸现并将威胁到成千上万个由人类创造的工作,包括唱歌,“讽刺的是,人类无法超越它已指日可待”,“你并不特别,你已经是可预测的,而且不幸你也是可定制的”。

loadimg.gif

从积极的角度看,生成式AI的发展使AI音乐制作和翻唱的门槛进一步降低,平台也开始与创作者拥抱AI,将AI音乐规范化,比如YouTube和Charlie Puth、Troye Sivan等歌手合作测试Dream Track功能,可以模仿歌手风格生成音乐片段。

04
妙鸭相机爆火,AI写真产品兴起

2023年7月17日,妙鸭相机小程序正式上线,迅速在朋友圈刷屏

用户只要上传一定数量的照片,选择好模版,就可以一键生成AI风格化写真,包括证件照、艺术照等。虽然首次生成需要支付9.9元的数字分身制作费,但爆火初期仍有上千人深夜排队等待生成。

loadimg.gif

妙鸭相机出自阿里大文娱团队,阿里内部评价它为“国内AIGC领域第一个爆火的C端产品”。此后国内涌现出诸多同类AI写真产品,B612咔叽、美图秀秀、轻颜相机等APP也有类似的AI写真/头像功能。

这类工具型产品要面临的难题是如何在竞争中维持住热度,持续吸引更多的用户。妙鸭相机在之后几个月内不断上新写真模板,其中一部分与品牌合作联名,此外还推出了发型设计、AI修脸、拍合照的新功能,并和阿里系其他业务进行联动,比如冠名综艺《这就是街舞6》。

05
《生成式人工智能服务管理暂行办法》公布

过去一年,“狂飙”的AIGC产业迎来了国家级规范性政策。

2023年4月11日,国家网信办就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,我们在第一时间进行了重点解读。7月,《生成式人工智能服务管理暂行办法》(以下简称《办法》)公布,自8月15日起施行。

loadimg.gif

《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。

对于生成式AI领域的监管问题,全球各国都处于探索之中。《办法》是中国立法者的一次先行“试水”,为后续更为全面、细致的立法工作做了铺垫。目前人工智能法已被列入我国2023年立法计划,这意味着未来AI统一监管立法已提上日程。

06
更聪明的AI画图神器:DALL·E 3+ChatGPT

DALL·E 3是OpenAI在2023年9月推出的AI绘图模型,原生构建在ChatGPT之上,用户可以在对话中将自己的想法转化成准确的图像,甚至还能画出正确的文字。

loadimg.gif

用户问ChatGPT“我5岁的孩子说的超级向日葵刺猬,它应该长什么样子”,ChatGPT立马写了四段不同风格的提示词,并生成对应图像

对于不擅长写提示词的普通玩家来说,这一改进大大降低了AI绘画门槛。

与Midjourney相比,DALL·E 3的交互式绘图比较直观方便,能直接读懂大段文字自动作图。而且与OpenAI深度合作的微软已将DALL·E 3集成在Bing(现为Copilot)中,可以免费使用。

07
微软AI助手Copilot全面集成至Win11

作为OpenAI最重要的投资方,微软率先将GPT-4引入搜索引擎,从2023年9月26日开始,微软重磅发布全球版智能副驾Copilot,将作为Windows 11免费更新的一部分推出,并陆续扩展到必应、Edge浏览器以及微软365 Copilot中。

在11月的Ignite全球技术大会上,微软又将Bing Chat升级更名为Copilot,允许所有用户创建类似于GPTs的AI助手。

loadimg.gif

全新的Copilot,用微软账户登录即可免费体验:https://copilot.microsoft.com/

Copilot Studio作为一个低代码工具,支持在同一网页中构建、部署、分析和管理所有内容,可以让用户创建自定义Copilot,或集成定制版的GPT、生成式AI插件和主题等,包括GPTs的功能。

2024年,微软还将在键盘上新增Copilot键,一键调用AI助手,也许未来每个人都可以拥有自己的AI电脑。

08
Sam Altman的“离职”风波

从被苹果扫地出门到王者归来,乔布斯花了12年时间。而AI时代的“乔布斯”只用了4天。

美国时间2023年11月17日午间,OpenAI突然宣布领导层换届,首席执行官Sam Altman被开除了,因为他“在与董事会的沟通中始终不坦诚,阻碍了董事会履行职责的能力”

消息一出,震惊整个AI圈。这场闹剧之后经历了几次反转,上一秒Sam Altman回到公司谈判,似乎有望重返OpenAI,下一秒微软就宣布Sam Altman及其同事将加入微软,领导一个新的AI研究团队。最终Sam Altman还是在众多同事的支持和微软的推动下回来了,董事会成员大换血,新增一名无投票权的观察员——微软副总裁Dee Templeton。

loadimg.gif

目前这场高层震荡的起因依旧众说纷纭,不过OpenAI的发展已回到正轨,正式发布GPT商店,不断构建AI商业生态。

09
Pika 1.0发布,AI视频元年来了

2023年11月28日,AI视频生成产品Pika 1.0发布,官宣推文浏览量1天内就破了一千万。

Pika内测版支持输入文字或图像来生成各种风格的视频,此次Pika 1.0新增局部实时重绘、扩展视频尺寸等功能,效果不输Runway Gen2,甚至在易用性、3D动画生成上更胜一筹。

loadimg.gif

我们也尝试用ChatGPT、Pika等AI生成工具创作了一条圣诞动画,对于没有专业学习过动画制作的爱好者来说,现在AI可以帮助实现7、8成的故事脚本了。
Pika一夜爆火,而令人惊讶的是其团队只有4个人,创立6个月就在Discord上吸引了50万用户,公司估值超2亿美元。

目前AI视频生成领域的动作进展较快,不乏新玩家入局,除了Pika,还有Meta发布了Emu Video,Stability AI发布了首个AI视频开源模型SVD,Midjourney也即将发布视频生成模型。

loadimg.gif

10
《纽约时报》起诉微软和OpenAI侵权

这或许是OpenAI史上最难的AI版权诉讼。

2023年12月底,《纽约时报》因版权侵权起诉微软和OpenAI,220000页附件,罗列了多达100个铁证,证明ChatGPT输出的内容与他们的新闻内容几乎一模一样。

左边为GPT4的输出,右边为《纽约时报》的新闻

loadimg.gif

为此,《纽约时报》要求OpenAI和微软销毁侵权材料的模型和训练数据,并对非法复制和使用《纽约时报》独有价值的作品造成的“数十亿美元的法定和实际损失”负责。

OpenAI发布公告回应称,公司使用公开的互联网材料训练人工智能模型是合理的,OpenAI已提供了退出的选择。并指出,《纽约时报》没有讲述完整的事实,暗示AI“抄袭”原文的情况是故意操纵提示词,让模型“反刍”(Regurgitation)的结果。

AI模型和训练数据的版权之争颇受关注,此次诉讼或将成为影响AIGC领域走向的重大事件。

通过以上精选的重要事件,我们回顾了2023年AI行业的蓬勃发展,我们有理由相信,2024年将有更多激动人心的技术创新和应用落地。

“至少在未来的五年或十年内,这项技术将处于一个非常陡峭的成长曲线上。现有这些模型都将变成最愚蠢的模型。”正如Sam Altman最近在访谈中所说的,多模态、可定制性和个性化很重要,AI还可以做更多复杂的事情,真正提升生产力。

AI将继续在内容创作、医疗健康、教育等多个领域发挥其潜力,同时,随着AI技术的不断进步,我们也将面临新的挑战,包括伦理、隐私和安全等问题,我们需要尽快适应并确保让技术的力量服务于全人类。

作者公众号: 头号AI玩家(ID:AIGCplayer)
1707296073593884.png


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK