7

看看函数名和注释,AI就能自动生成代码,程序员:这不真实,我要失业

 3 years ago
source link: https://www.jiqizhixin.com/articles/2020-05-22-8
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

aIjaAvb.gif

上面这段 demo 是不是看着很爽?这就是 OpenAI CEO Sam Altman 刚刚介绍的最新研究成果——根据函数签名和注释,利用语言模型自动生成 Python 代码。这个语言模型用到了和 OpenAI 的 GPT 模型相同的无监督技术。

为了让模型学会「写代码」,研究人员在微软的超级计算机上,借助数千个开源 GitHub 库里的代码对该模型进行了微调。

先来看一下生成效果。

研究人员首先展示了一个较为简单、使用 Python 编写回文检测的例子。回文指的是「正读反读都能读通的句子」,例如:「anna」、「level」等。下面是使用该模型自动生成的代码:

VVBnIb7.gif

可以看到,在你输入了函数签名和注释之后,模型正确地生成了回文检测的代码。当然,对于回文检测,我们也可以用如下更「秀」的递归方法来实现:

a6RJ3m3.png!web

看到这里,也许大家并没有对该模型的效果感到很惊艳,毕竟像回文检测这类基础任务的代码网上一抓一大把,模型大可以直接从训练集中复制过来即可。

先别着急,咱们继续往下看。

接下来,研究人员要求模型生成从一个列表中查找长度不少于 7 个字符的代码,而且该任务并没有在训练集中。我们来看看在这样的情况下,模型表现如何:

2yYnAr2.gif

还是出色地完成了任务!

从这个例子我们可以确定,模型不是简单地复制网上的现成代码,而是依据函数名及相关注释产生了对应的解决方案,它甚至还使用了之前生成的代码。

试过了单一函数的例子,研究者还展示了其在类中的运行效果。

F3yMZjb.png!web

这次的任务是计算商品的总价格,并对名称是回文的商品打折。我们来看一看该模型生成的代码:

qymENr7.gif

模型自动地为我们生成了计算商品总价方法的注释及对应代码。然而这并不是我们想要的结果,我们只想要对名字是回文的商品打折,而不是对所有商品都打八折。研究人员之后修改了该方法的注释,详细描述了想要实现的功能。修改注释后,该模型生成的代码如下:

Q3iMFfv.gif

可以看到模型几乎生成了我们想要的结果。这里仅有一个小问题,我们想要对回文名称的商品打八折,而不是打二折,简单修改一下即可。

最后研究者展示了让模型生成购物收据的结果:

mA3mEbb.gif

OpenAI 放出的 demo 的确惊艳,甚至是革命性的。如果照这个思路走下去,以后简单的「搬砖工」似乎都不需要了。但问题也出在这儿:效果未免太惊艳了,让人不禁怀疑是否存在造假或精心挑选……

mayUrmq.png!web

不过也有人说,「这可是 OpenAI!他们的口袋里有的是好玩意儿。」

mYBB7bV.png!web

那么,如果这是真的,对程序员来说意味着什么?

bIzIZrM.jpg!web

程序员的未来何去何从?

在 AI 领域,每种新鲜技术的出现似乎都会掀起一番「XX 从业者是否会被 AI 取代」的讨论,这次也不例外。

MVbi2eR.jpg!web

首先,这种工具的出现所带来的效率提升是毋庸置疑的。我们假设这个 demo 是没有掺水的,那么公司可能会出于成本的考虑裁掉一些初级码农,用一个码农来充当「审码员」,完成原来十个码农的工作。

eAZ7veV.png!web

也有人认为,就目前这个模型来讨论程序员是否会被取代未免有点超前。首先,这还只是一个语言模型,即使在非常简单的函数中也可能出错,更别说遇到比较难以理解的自然语言注释语句了。这时候,还是需要人来介入。

jQR3aai.png!web

其次,这一流程中用到的「注释」还不是需要人来写吗?

Bjiumee.png!web

但也有人认为,这些都可以通过时间和技术来解决:总有一天,模型犯的错误会越来越少,甚至少于检查代码的那个人类。

JrqqAr2.png!web

或者你再训练一个模型来写单元测试,然后不断对其进行改进,直到它可以给出大部分时候合理的解决方案。

aumQfu6.png!web

当然,这些都是一些非常超前的假设,现在的技术还很难做到,真正应用起来也会有各种各样的问题。但回想起 19 世纪初期大批纺织工人的命运,这种讨论还是很有意义的。

参考链接:https://www.reddit.com/r/MachineLearning/comments/gnmjki/dn_microsoft_demos_language_model_that_writes/


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK