「ChatGPT克星」升级：老师可以把全班作业丢进去检测了！华人作者：免费用

十三 2023-01-31 14:40:14 来源：量子位

支持Word、PDF，开放API

金磊发自凹非寺

量子位 | 公众号 QbitAI

「ChatGPT克星」，升级了！

没错，就是之前华人小哥Edward Tian所打造出来的那个GPTZero，几秒内就能摸清文字是人类还是AI写的。

eb3451dc6b454b03928f7cf9ca59ea2f~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=BVN1vNvqGJClUuPj168ZcggCNIo%3D

而时隔近一个月，小哥所推出的版本名叫GPTZeroX，并且他还说：

这是专门为教育工作者打造的AI模型。

e760646a91944aa1a9e6d65ca5f9953b~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=QwHX9GvPRuGLA%2FiFi6XHe6ybjns%3D

消息一出，立即吸引了大批网友涌入，一天之内便有40万的访问量和220万的服务请求。

d55c6a499f784976943e2324c5569706~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=Rb8m2VT7vzpTiqLDKtHlFljwx04%3D

那么这一次，这位「ChatGPT克星」又带来了哪些新能力？

混写也能测，还支持Word等格式

升级的一大特点，就是GPTZeroX可以检测出来“人类+AI”混写的文字内容。

例如我们先把一段人类写的新闻丢进去检测：

145e03747c4243aaae505e7bc9ff004b~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=gJf5gr8KBQSkf6lIbPRGWG4%2Bel0%3D

GPTZeroX在短短几秒钟时间内，非常迅速的给出了答案：

Your text is likely to be written entirely by a human.

你的文本很可能完全是由人写的。

接下来，我们再把一段ChatGPT写的文字，丢进刚才那段新闻的后边，来一场混合检测：

137939fc3f2240ca8859a016928c2447~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=uxxXa5CI0Ei5NR9XySX8yCCmMaY%3D

这一次，GPTZero给出的回答是：

Your text includes parts written by AI.

你的文本一部分是由AI编写的。

并且ChatGPT生成的内容还会用黄色高亮标记出来。

f83aeae583dd406a8a91d88e36da150c~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=seQkSYvJuoTdnkBdoKPJVxUgB%2FQ%3D

小哥对此表示：

这是教育工作者一直想要的一个关键功能。

但老师们检查学生作业的时候，一段一段的把文字复制粘贴进来也相当繁琐的工作了。

于是乎，这位小哥还贴心地推出了另一个新功能——可批量导入文件，支持Word、PDF和TXT等格式。

并且网站在介绍这个功能时，是这么描述的：

2eedacc45dfe45d1a554885b3c876881~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=APZa83HeKrDv72TiU%2F7n4AQHa%2BM%3D

除此之外，为了防止服务发生崩溃，小哥还搞了一个Python API，是已经完成压力测试的那种。

8d68a979d3d740a8b10f6af4043f8ad1~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=OjgWn4neTVhtbv4HeaGGD1GbWoA%3D

最后，小哥还贴心地说了一句：

我承诺，本网站对个体教师和教育工作者，保持免费！

75100eec9ef648cd8ab2fc4b1badb14b~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=%2BgG1qhva8iqvo6WY75XElHbEoxw%3D

怎么做到的？

它主要靠“perplexity”，即文本的“困惑度”作为指标来判断所给内容到底是谁写的。

NLP领域的朋友们都知道，这个指标就是用来评价一个语言模型的好坏的。

在这里，每当你喂给GPTZero一段测试内容，它就会分别计算出：

1、文字总困惑度

这个值越高，就越可能出自人类之手。

62c8abb62fd843f1bd256f7186eb9ae4~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=ByFTuZtGoqLxn2KdIQnlb2J66qk%3D

2、所有句子的平均困惑度

句子越长，这个值通常就越低。

fb0ecfc98a964b888e02dbe6c34bb80f~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=Ls7VxJz8eLV%2FViVfEbIRGcF0OtQ%3D

3、每个句子的困惑度

通过条形图的方式呈现，鼠标悬浮到各个方块就可以查看相应的句子是什么（这里就两块，因为我此时输入的测试内容就俩句子）。

9ae0c03eeb854f698fe5fbb48158368d~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=SqkFZk%2FQk3ppZl7cnJBywepC%2BnQ%3D

之所以要绘制这样的条形图，作者也作出了解释：

根据最新的一些研究：人类书写的一些句子可能具有较低的困惑度（前面说过，人类的困惑度是比较高的），但随着继续写，困惑度势必会出现峰值。

相反，用机器生成的文本，其困惑度是均匀分布的，并且总是很低。

除此之外，GPTZero还会挑出困惑度最高的那个句子（也就是最像人写的）：

69145eba4332493eaf02f5d61a45da2d~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=ycOin6s3tpT0HDpHsb%2BFGMZAMXo%3D

反ChatGPT之风正盛

正所谓道高一尺魔高一丈，在ChatGPT尽显十八般武艺之际，诸如小哥GPTZero一样“用魔法打败魔法”的工具、研究也在层出不穷。

例如最近斯坦福大学为了不让学生借助ChatGPT之力来写论文或作弊，推出了“反侦察”神器——DetectGPT。

67a97c2ea8ba481fa4ee2f4a0cf529e5~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=npwWvGkdrGHYNeZfx2arRw3lsJI%3D

这种方法既不需要训练单独的分类器，也不需要收集真实或生成的段落的数据集，是一种基于概率曲率的零样本方法。

c8919460991e458ca0f7fb0b91f46f5c~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=IPnSBJaaYfwtYcDOhe8%2F4h0Fh1E%3D

除此之外，就连OpenAI自己也联合哈佛等高校机构联合打造了一款检测器：GPT-2 Output Detector。

1369f55b22154e74b1f99ff8a66d9733~tplv-tt-shrink:640:0.image?traceid=20230131143230A4149968CB7776F8AD90&x-expires=2147483647&x-signature=g3utrpqOCFJalhbzz2NxtYLRp7k%3D

作者们先是发布了一个“GPT-2生成内容”和WebText（专门从国外贴吧Reddit上扒下来的）数据集，让AI理解“AI语言”和“人话”之间的差异。

随后，用这个数据集对RoBERTa模型进行微调，就得到了这个AI检测器。其中人话一律被识别为True，AI生成的内容则一律被识别为Fake。

（RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集，但RoBERTa使用了包含6300万条英文新闻的160GB数据集。）

嗯，看来ChatGPT在大步向前迈的同时，顺便还推动了“反ChatGPT”研究的发展。

参考链接：

[1] https://twitter.com/edward_the6/status/1619874139954905090
[2] https://arxiv.org/abs/2301.11305

「ChatGPT克星」升级：老师可以把全班作业丢进去检测了！华人作者：免费用

「ChatGPT克星」升级：老师可以把全班作业丢进去检测了！华人作者：免费用

混写也能测，还支持Word等格式

怎么做到的？

反ChatGPT之风正盛

Recommend

Lonely World .info 😿

2023推荐关注的亚马逊后台新增工具及政策

blog重构啦！

我花了1万块给猫过年：六菜一汤、专人陪护、智能喂养

Read and Create Cookies in JavaScript

Weird Little Valentines

2月20日关闭！亚马逊将关闭慈善捐赠工具 AmazonSmile！

请教各位， pt 站维护期间下载量，上传量，魔力值等会被计算嘛？

百度被曝3月推出自家ChatGPT/小米全球副总裁辞职/苹果折叠屏iPad有消息了…今日更多新...

JD.com shuts down e-commerce operations in Thailand, Indonesia, focuses on suppl...

About Joyk