3

让程序员失业?OpenAI聊天机器人颠覆搜索引擎

 1 year ago
source link: https://cn.technode.com/post/2022-12-05/chatgpt/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

让程序员失业?OpenAI聊天机器人颠覆搜索引擎

2022/12/05 20:32
|作者 黄 尘

近日,OpenAI 的 AI 聊天机器人 ChatGPT,因其令人印象深刻的聊天 “技巧”,在海外引发热潮,OpenAI 的联合创始人马斯克毫不掩饰自豪情绪,在推特上称 “许多人陷入了疯狂的 ChatGPT 循环中”。

ChatGPT 是一个基于对话的原型 AI 聊天机器人,12 月 1 日,OpenAI 的另一位联合创始人山姆·奥特曼(Sam Altman)在推特上公布 ChatGPT 并邀请人们免费试用。经网友测试后发现,与大部分 AI 工具不同,ChatGPT 不仅对答如流,还可以写出较高水平的代码和论文。其论文写作技巧和可用性也一度震惊了学者。

最令人感到毛骨悚然的是,一名叫扎克·德纳姆(Zac Denham)工程师诱导(直接问会被一口回绝)ChatGPT 告诉自己如何一步步毁灭人类,ChatGPT 列出了详细步骤,诸如入侵计算机系统、掌握武器、破坏通讯、破坏交通……还给出了一段代码示例。OpenAI 自然语言模型 GPT-3.5 加持下的 ChatGPT 有如此能力,不禁令许多人对 AIGC 的未来又狠狠憧憬了一把。

AIGC 的发展

AIGC 并不是一个新概念,其萌芽阶段可以追溯到上世纪 50 年代,90 年代从实验性向实用性逐渐转变。从 2014 年起,随着以 GAN(生成对抗网络)为代表的深度学习算法的提出和迭代更新,AIGC 打开了新局面,生成内容水平越来越高。2018 年,AI 生成的画作以 43.25 万美元的价格被成功拍卖,引发各界关注。

2020 年 OpenAI 推出的语言模型 GPT-3 算法,以及 NLP(自然语言处理)技术和 Diffusion Model(扩散模型)的发展,人工智能不仅能够模仿人的思维方式,而且能够理解并运用人类的语言。

近两年,新一代模型已经可以处理的格式内容包括文字、语音、代码、图像、视频、机器人动作等等。AIGC 被认为是继专业生产内容、用户生产内容之后的新型内容创作方式,可以在创意、传播、个性化等方面,充分发挥技术优势。

目前,业界已经有相关的实践。百度推出了 AI 艺术和创意辅助作画平台 “文心一格”,腾讯发布了写稿机器人 “梦幻写手”,阿里巴巴则有旗下的 AI 在线设计平台 Lubanner,字节跳动则推出剪映提供 AI 生成视频功能……然而,相较于 ChatGFT,仍不够全面。

AI-openai.png

从深度学习到强化学习

以对象识别为中心的深度学习已经被用于各个领域,包括谷歌在内的许多科技公司都致力于研发更好用的深度学习模型。

在深度学习出现之前,由于诸如局部最优解和梯度消失之类的技术问题,没有对具有四层或更多层的深度神经网络进行充分的训练,并且其性能也不佳。但是,近年来,Hinton 等人通过研究多层神经网络,提高学习所需的计算机功能以及通过 Web 的开发促进培训数据的采购,使充分学习成为可能。结果,它显示出高性能,压倒了其他方法,解决了与语音,图像和自然语言有关的问题,并在 2010 年代流行。

而 ChatGFT 的模型训练方式主要通过语料库进行自然语言处理的训练。首先,将大量的聊天记录和语料库分词并处理成可供模型识别的格式。然后,通过使用自然语言处理技术,如语言模型、神经网络、深度学习等,对模型进行训练,让模型能够通过对语料库的学习,模拟人类的聊天行为,并能够回答用户提问。值得一提的是,随着这些信息被反馈到模型中,模型会根据训练师的偏好来调整答案,这是一种训练人工智能的标准方法,被称为强化学习。

目前,ChatGPT 模型甚至具有一定的图灵完备性(图灵完备:一个计算机系统能够完成任何计算问题,并且能够在有限的时间内完成这些计算任务)。ChatGPT 模型通过对语料库的学习,能够模拟人类的聊天行为,并且能够在有限的时间内回答用户提问。但是其并非十全十美的工具,当下其还面临着一些不足。

首先是理解能力不足。目前的 ChatGPT 模型在回答用户提问时,还存在理解能力不足的问题,对于一些比较难懂的问题,它无法准确地回答。其次,在回答问题时,ChatGPT 模型还不能够很好地进行句法分析,容易出现回答不够灵活的问题。再次,学习能力有限,无法通过自己的学习提升自己的回答能力。最后,对语料库的依赖性较强,如果语料库的质量较差,它的回答能力会打折扣。

计算生物学教授卡尔·伯格斯特罗姆(Carl Bergstrom)要求 ChatGPT 写一篇维基百科式的生平条目,ChatGPT 做出来了,但是有一些细节站不住脚。OpenAI 表示,解决这个问题很困难,因为他们用于训练模型的数据中没有真相来源,监督培训也可能具有误导性,“因为理想的答案取决于模型知道什么,而不是人类演示者知道什么”。

openai-2018-robotics.jpg

结语

今年 2 月,在 DeepMind 的新论文《A Data-driven Approach for Learning to Control Computers》,研究者重点探究了训练智能体像人一样进行键盘和鼠标的基本计算机控制。如果机器可以像人类一样使用计算机,则可以帮助我们完成日常任务。在这种情况下,我们也有可能利用大规模专家演示和人类对交互行为的判断,推动人工智能进一步发展。

作为一个十分 “聪明” 的 AI 聊天机器人,有人称 ChatGPT 或将打败谷歌。不过 OpenAI 则认为 ChatGPT 提供不了任何专业建议,因为其知识只来自训练数据中的统计规律,而不是任何类似人类对世界复杂和抽象系统的理解。甚至像开篇中提到的测试那样,如果被不当使用,可能会引导用户走向危险和错误。

但无论如何,它的问世还是为人工智能的后续发展打开了思路,毕竟谁不想要一个能够进行互动式答疑,还能够服从指令产出内容的通用人工智能应用呢?


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK