4

如何检测一段文本是否是 ChatGPT 等 AI 生成的?

 1 year ago
source link: https://www.v2ex.com/t/900403
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

V2EX  ›  OpenAI

如何检测一段文本是否是 ChatGPT 等 AI 生成的?

  meetalpha · 10 小时 51 分钟前 · 3143 次点击
  1. AI 可以瞬间生成答案,答案又可以大量复制粘贴,挤占了论坛的回答位置。
  2. AI 很多是胡说八道,但是一本正经的回答,容易让人产生是正确答案的错觉。
  • AI 的回答,通常:1.语体过于一本正经 2.全篇围绕提问的几个关键字回答 3.不带感情色彩

  • 真人的回答,1.或多或少带有自己的感情色彩和主观评价 2.即使回答得比较正式,大多也不会像 AI 那样过于一本正经 3.可能存在错别字和标点符号使用不恰当。

人能看出来这些区别很容易,但是按照现有的技术,机器能不能检测?

54 条回复    2022-12-06 20:03:26 +08:00
cwcc

cwcc      10 小时 46 分钟前   ❤️ 3

我能想到的就是用 AI 来对抗 AI 。
ixcode

ixcode      10 小时 46 分钟前

用同样的问题用 ChatGPT 生成答案,与原文去对比,大概率有很多内容是一样的
Maboroshii

Maboroshii      10 小时 44 分钟前

你问问 ai ,这句话是你说的吗? “xxxxxx” 他会说啥啊
icyalala

icyalala      10 小时 43 分钟前   ❤️ 1

ChatGPT 是有人设的,"采用了先进的、注重道德水平的训练方式",所以现在大概能一眼看出来。
等以后换个人设,就不那么好分辨了。。
Exdui

Exdui      10 小时 23 分钟前

检测一段文本是否是 AI 生成的有以下几种方法:
1.查看文本的内容:如果文本内容极其生硬、不连贯或者结构极其复杂,那么很可能是 AI 生成的。
2.对比不同源的文本:如果能够比较两段不同源的文本,发现它们的语言结构、表达方式或者语义都非常相似,那么更可能是 AI 生成的。
zhouyg

zhouyg      9 小时 28 分钟前   ❤️ 3

我看第 5 楼这种风格就像 AI 回答的
amirobotics

amirobotics      9 小时 25 分钟前

我觉得目前的 AI 没法像人那样使用特殊的语言,

比如:
1. 你说啥 = 你说什么
2. 今晚要 oxox ?=今晚开房吗?

还有就是节奏,ai 会一直绕一大圈才给你答案,看的好像是答案那样。

其次就是人类容易犯错,比如错别字,标点符号等等。。。
yiikZero

yiikZero      9 小时 24 分钟前

检测一段文本是否是 AI 生成的有以下几种方法:
1.查看文本的语法和语言结构。机器生成的文本通常没有人类写作的流畅性和自然。
2.比较文本与其他已知机器生成的文本的相似度。如果这段文本与其他机器生成的文本相似,那么它很可能是由机器生成的。
3.检查文本中的语义和逻辑。机器生成的文本通常难以理解,而且常常包含逻辑错误或混淆的语义。
4.对文本进行人工评估。如果一段文本让人感到困惑或难以理解,那么它很可能是由机器生成的。

总的来说,要确定一段文本是否是由 AI 生成的,需要综合考虑多种因素。
milukun

milukun      9 小时 18 分钟前   ❤️ 7

开头重复一遍问题,结尾带有「总的来说」
MossFox

MossFox      8 小时 52 分钟前

呃,要我来辨别的话,可以先看看排版。

1. 标点符号的使用:
ChatGPT 在标点符号的使用上,会按照标准来。如果你发现一个人的回复里面, 中文语段存在中英文标点混用, 错用,那么一定是真人;

2. 列表序号与文字直接的空格:
--^ 标准排版下,这个空格肯定存在。如果没有这个空格,一定是真人;

3. 段落分行:
可以观察每个段落之间有没有多余的换行。
没有的话,一定是真人 (? 这个倒不确定)。

4. 中英混排的表现:
如果中文和西文之间没有有意留出的 space ,那一定是真人。

嗯,总的来说,我至少不是机器人。
MossFox

MossFox      8 小时 50 分钟前

等下,我才反应过来中英混排的表现是 V2EX 自动修正的,上一层那边我很确定我有意没加空格……
VZMZZZ

VZMZZZ      8 小时 47 分钟前

那么,请找出这个主题偶下面所有的 AI 回复
yyf1234

yyf1234      8 小时 47 分钟前 via iPhone

很容易辨认吧,跟[注意看,这个男人叫小帅差不多]
swulling

swulling      8 小时 45 分钟前

@yiikZero 这个就是 AI 的回答吧。。
swulling

swulling      8 小时 43 分钟前

Q: 如何检测一段文本是否是 ChatGPT 等 AI 生成的,不要加”总之“和”总的来说“,语言更通俗一些。
A:要检测一段文本是否是 AI 生成的,可以看看它是否说得通,是否搞错了事实,或是否有类似于已知 AI 文本的模式。如果文本中有语法错误、事实错误、或与已知 AI 文本相似的模式,那很可能是 AI 生成的文本。
swulling

swulling      8 小时 43 分钟前

@milukun 可以很容易规避掉~
DOLLOR

DOLLOR      8 小时 39 分钟前

看到长篇大论没有重点的车咕噜废话,直接跳过即可。
无论是人类写的还是 AI 写的。
zooo

zooo      8 小时 27 分钟前

完了,我已经分辨不出来下面的回答是不是 ai 回复的了。。。
ahu

ahu      8 小时 22 分钟前   ❤️ 4

9kLE2p5.png
MeteorCat

MeteorCat      8 小时 21 分钟前 via Android

问他宫廷玉液酒
MiketsuSmasher

MiketsuSmasher      8 小时 0 分钟前

根据我昨天晚上玩出来的经验,给你要问的问题里面埋几个坑,如果是真人回答问题的话,是不会踩进去的。而 ChatGPT 会踩进去,或者拙裂地忽略掉。

比如说 ChatGPT 对“意大利面拌 42 号混凝土怎么做好吃?”的回答,可以看到它明显没有避开大坑:

意大利面拌 42 号混凝土可以搭配不同的酱汁来做,比如番茄酱、芝士酱、蛤蜊酱等,还可以加入蔬菜、肉类、蘑菇等来搭配,可以根据自己的口味来调整,做出美味可口的意大利面拌 42 号混凝土。
MiketsuSmasher

MiketsuSmasher      7 小时 57 分钟前

再比如说,如果 ChatGPT 对问题里模糊不清的地方猜得不对,就会:

Q:世界杯买德国还是买日本
A:这取决于你的偏好。如果你喜欢德国的风格,那么买德国的球衣可能更好;如果你喜欢日本的风格,那么买日本的球衣可能更好。

显然,提问者要问的不是买哪国的球衣。
ShinichiYao

ShinichiYao      7 小时 53 分钟前

当 AI 知道要故意犯点错的时候人类就真完了
pennai

pennai      7 小时 50 分钟前

楼里的辨识方法,经过训练 AI 也同样会具有这些特征。。。
WinkeyLin

WinkeyLin      7 小时 48 分钟前 via Android

三段式结构,很好认
Jenny12

Jenny12      7 小时 46 分钟前

用魔法打败魔法
yolee599

yolee599      7 小时 43 分钟前 via Android

@yiikZero 我看这个回复好像 AI 回复
d3vil

d3vil      7 小时 42 分钟前

楼里说的这些特征,AI 都可以进行学习改善,能不能说点学习不了的?
bravecarrot

bravecarrot      7 小时 35 分钟前 via iPhone

生成对抗学习啊
很早就有人研究了
Cabana

Cabana      7 小时 13 分钟前

@MiketsuSmasher #21 现在再问这个问题,他已经会回复说这是一道虚构的菜肴了 😧
cosette

cosette      7 小时 11 分钟前

为了让生成的文本看起来有意义,目前 chatGPT 采用了非常正式的行文风格。但总的来说,AI 的好与坏还是在于是否表达出了特定的意义,因为 AI 不具备人的需求和欲望,所以只有两种结果,一种是 AI 通过学习互联网上的文本,找到可能的匹配文本,让对话看起来好像是有意义的(说得通的),第二种就是 AI 基于语言学模型纯粹的脑补,胡说八道。

从行文格式上来讲,基于语法句法的东西 AI 最终都可以学会,包括互联网语言的一些使用习惯,甚至可以表现出某种“道德倾向”、“政治倾向”,因为这些本身就是基于符号的,再者就是基于语段和语篇的分析,也可以把一些套话、常识学习的很好,变成一个非常“聪明”的鹦鹉,总而言之,任何基于“符号”的甄别方法对不断进步的 AI 来说,最终都是很难奏效的。
milukun

milukun      6 小时 52 分钟前

@swulling 哈哈哈 但是你还是忘了开通重复问题。「要检测一段文本是否是 AI 生成的」,AI 味太浓了。
weixiangzhe

weixiangzhe      6 小时 42 分钟前

这贴子里就有好多 AI,我都魔振了
mlhadoop

mlhadoop      6 小时 5 分钟前

如果答案正确,是不是 ai 回答的这个问题 还值得探讨吗? 毕竟找到答案就好了?
ershierdu

ershierdu      5 小时 53 分钟前

@mlhadoop #34

StackOverflow 的 ban 掉 chatgpt 的原因:The primary problem is that while the answers which ChatGPT produces have a high rate of being incorrect, they typically look like they might be good and the answers are very easy to produce. There are also many people trying out ChatGPT to create answers, without the expertise or willingness to verify that the answer is correct prior to posting.

https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
lusfold

lusfold      5 小时 49 分钟前

对于判断一段文本是否是 AI 生成的,一个常用的方法是人工阅读该文本并根据其内容、语言使用情况、语言流畅程度、内容的逻辑性等因素进行判断。如果文本内容较为简单、语言使用不够自然、内容缺乏逻辑性,那么这段文本很可能是 AI 生成的。

如果您想进一步确定一段文本是否是 AI 生成的,您可以尝试使用一些 AI 文本检测工具,这些工具通常会使用一些算法来分析文本内容和语言使用情况,并给出一个可信度分数,指示这段文本是否可能是 AI 生成的。这些工具并不能百分之百地准确判断一段文本是否是 AI 生成的,但是它们可以作为一种参考,帮助您更准确地判断文本的真实性。
douniwan5788

douniwan5788      5 小时 26 分钟前

检测是否是 AI 生成的其实是本末倒置,真正应该检测的是大量胡说八道的垃圾回复,单纯检测 AI 只是取巧的方式,而且会越来越难了
CL007

CL007      4 小时 40 分钟前

用 AI 对抗 AI ,成了生成式对抗网络 gan ,最终 AI 的输出越来越像人类
izzy27

izzy27      4 小时 34 分钟前

好问题,CV 里面有检测图片是否有 AI 生成的研究方向吗? 如果有的话,这感觉也是一个研究方向
MegrezZhu

MegrezZhu      4 小时 13 分钟前

LZ 的问题基本等价于图灵测试
Suonna

Suonna      3 小时 52 分钟前

@lusfold 您这个是 ai 输出的吧
zjvbqla

zjvbqla      3 小时 44 分钟前 via iPhone

@milukun 老胡觉得,此处省略若干。总的来说,此处省略
ufan0

ufan0      3 小时 37 分钟前

这让我想到了图灵测试,可怕。
SaltyMouse

SaltyMouse      3 小时 9 分钟前

@MiketsuSmasher 我试了下,得到的回答是:“我不具备烹饪能力,所以无法为您提供关于如何让意大利面拌 42 号混凝土变得更美味的建议。不过,我可以告诉您一些基本的原则,例如选择新鲜的高质量的食材、注意烹饪温度和时间、尝试不同的调料和调味料等。如果您想要了解更多具体的信息,我建议您尝试搜索互联网或与专业人士讨论。”
SaltyMouse

SaltyMouse      3 小时 6 分钟前

测试对于音乐、食品、电影等事物,都会回复没有鉴赏的能力:“由于我是一个计算机程序,我没有听过《夏日晚风》这首歌曲,所以无法为您提供任何评价。我只能根据给定的信息回答问题,而我并不具备听觉能力,也无法进行浏览操作。如果您想要了解更多关于这首歌曲的信息,我建议您尝试搜索互联网或与其他人讨论。”
g001

g001      3 小时 4 分钟前

如果您想要检测一段文本是否由 AI 生成,您可以采用以下方法:

检查文本的语言质量。AI 生成的文本通常没有人类语言的流畅和灵活性,常常存在语法错误和表意不清的情况。如果一段文本语言质量较差,那么它很可能是由 AI 生成的。

检查文本的主题和内容。AI 生成的文本通常是基于某些规则或模板生成的,内容和主题会比较单一和有限。如果一段文本内容重复或毫无意义,那么它很可能是由 AI 生成的。
FG4084

FG4084      2 小时 50 分钟前

@yiikZero 看着像 AI 生成的
ariza

ariza      2 小时 36 分钟前

kb666

kb666      2 小时 7 分钟前

当前没有绝对可靠的方法可以完全准确地检测一段文本是否是 AI 生成的。这类 AI 生成的文本常常很难区分出来,因为它们可能包含经过深度学习模型训练的语言特征和语法结构,看起来和人类写的文本非常相似。

虽然如此,但是我们可以根据一些特征来判断一段文本是否可能是 AI 生成的:

在句子结构上,AI 生成的文本通常会更加规范和符合语法规则。
在表达内容上,AI 生成的文本通常会更加清晰明了,不会出现语义模糊或不连贯的情况。
在语言风格上,AI 生成的文本通常会更加平淡无奇,不会有太多的修辞手法或个人风格。

当然,这些都只是可能性,并不能作为严格的检测标准。如果你想确定一段文本是否是 AI 生成的,最好的方法是直接询问生成该文本的 AI 系统。
Citronl

Citronl      2 小时 6 分钟前

通常来说,通过以下方法可以检测一段文本是否是 AI 生成的:

检查文本的语法是否正确。AI 生成的文本通常会有一些语法错误,而人类写的文本通常语法较为正确。

检查文本的表达是否通顺。AI 生成的文本通常会有一些表达不通顺的地方,而人类写的文本通常表达较为流畅。

检查文本的内容是否真实可信。AI 生成的文本通常会有一些内容不真实的地方,而人类写的文本通常内容较为可信。

当然,这些方法并不万能,并不能保证 100% 准确地检测出所有 AI 生成的文本。但通常来说,通过这些方法可以大致判断出一段文本是否是 AI 生成的。
Citronl

Citronl      2 小时 2 分钟前

我和楼上都是 AI 生成的😂
imdong

imdong      1 小时 43 分钟前 via iPhone

字多就是 AI
missqso

missqso      49 分钟前

AI 技术正快速发展,新生代 AI 代表 ChatGPT 已在行业中大放异彩。在社交媒体上,越来越多的用户利用 ChatGPT 生成机器人来发表文字,但如何确定一段文本是不是 AI 生成的?本文将简要介绍如何检测一段文本是否是 ChatGPT 等 AI 生成的。

首先,要想判断文本是否是 AI 生成的,最直观的方法是简单地看一下语言风格是否正常。一般来说,AI 生成的文本句子结构会较为僵硬,语意也很难把握,而人类写出的文本常常会更加通顺流畅。此外,可以搜索关键字,AI 生成的文本中常常会出现比较生硬的重复词组,这也可以成为判断 AI 生成文本的一个参考。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK