30

虚假账号不断进化,AI能做的还是有限

 5 years ago
source link: https://www.pintu360.com/a56884.html?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

你的社交平台拥有多少个粉丝?

一千?一万?还是更多?你知道其中存在多少个“僵尸粉”吗?

i6niQbu.png!web

近日,据美国权威科技媒体The Information引述研究机构Ghost Data的报告称,2015年,Instagram平台的僵尸账号占比为7.9%,到目前已经攀升至9.5%。Instagram的阅读用户已经增加到了十亿人。根据上述比例,Instagram平台上现在大约有9500万个僵尸账号。

有媒体评论指出,如此规模的“僵尸账号”,让Instagram成为下一个互联网行业打击假新闻、假信息和政客营销的重要阵地。

为什么这么说 ,恐怕得看看“网络水军”在近些年的“杰作”。 2017 年,至少有 18 个国家在选举中遭遇了线上操纵和虚假信息策略,包括德国联邦总统选举期间社交机器人活跃和垃圾新闻频出等。

显然,治理“网络水军”已成为全球难题。而由于其分散、量大兼具技术隐蔽性,对其的治理更需要讲究专业化和智能化。此时,人工智能也派上了用处。  

道高一尺,魔高一丈,虚假账号与AI的斗智斗勇

从创建应用软件、官方网站或内容传播平台,到生产具有实质性内容的图像、视频或文字,通过或真或假或自动地与用户交互,虚假账号已经越来越“真实”。就在去年,有研究表明,连人工智能都可以被用来生成复杂的点评信息,而这些虚假的点评不仅机器无法检测出来,就连人类读者也分辨不出来。

虚假账号不再“虚假”,整个社交网站都面临着潜在却严重的冲击。智能相对论(aixdlun)分析师颜璇梳理了三种智能“鉴粉”方式,分别囊括了用户行为、内容和情感特征三种形式,试图解决这一问题。

首先是用户行为特征的分析。这种方式大多依托于爬虫技术,即通过主动爬取特定微博或者论坛的主体相关的注册行为、社交行为、转发与评论等行为 , 从而进行多维特征向量刻画。同时,有研究者还采用了隐马尔可夫模型来对用户行为进行建模,利用模型参数来对用户行为进识别和分类,毕竟“僵尸”掉进了“植物”里,总是有区别的。

这主要是利用账号之间的社会关系来识别那些“僵尸号”。而面对这种方式,水军们也“与时俱进”,比如一些职业差评师的账号在注册行为上就无懈可击,他们的账号一般会同时配备有身份证、用户手持证件照、实名手机号码卡、实名银行卡等,还能通过作弊软件骗过实名认证系统。即使是微博里的“僵尸粉”,也会存在一些粉丝关系。

第一种方式被“见招拆招”,AI也不得不拿出第二种方式,即对内容特征的分析。基于内容分析的识别技术主要从发帖内容本身切入 ,建立“僵尸粉”、恶意或者美化信息等本体模型, 同时建立敏感语义库,通过语言特征统计区分虚假账号。

但是,由于语义领域的不统一性,同一本体在不同领域,甚至同一领域都会存在很多象征意义的现状,比如用户在讨论某手机时,提到“这手机的上网速度真快”,“快”是一种夸赞,如果说“这手机耗电速度真快”,“快”又变成了一种批评。因此,内容特征模型在不同的情况、平台上都会有较大的变化,这也造成了AI分析内容特征进而识别“僵尸粉”的通用性较差的问题。

如此来看,基于单一特征对虚假账号进行识别还是比较困难的,因此,AI也不得不开始思考第三种方式。第三种方式源于第二种方式,即对内容中情感特征的分析。

有研究者通过分析推特内容中的情感,发现在线社交网络中的内容创建、传播与证券市场波动、期货商品价格及国家、社会重大事件之间有着紧密的联系。这也表明情感倾向是社交网站内容中的重要特征。

而水军也往往带有强烈的感情色彩(好评或差评),针对单个发帖的情感倾向性,AI可以设定一个阈值,若对某个主题发表的正面或者负面帖子比例超过设定阈值,,则认为该用户为水军。

但是,用于虚假账号监测的内容和情感特征的融合,属于比较明显的特征,而忽视了隐藏式的异常用户,比如用户上传与文字内容没有任何关系的图片, 抑或者用户评论情感与用户打分不匹配等新特征。

当网友对水军开始麻木,活着的水军其实已经死了

事实上,网络水军要想操作舆论,只需要错开发帖时间、编辑同一核心的不同文字内容就可以了,虽然这样做的成本会高一点,但是具体操作起来也不是什么高难度的事情。如果有人真心实意想要给某个作品一个差评,人工智能还真不能立即判断出他是真实用户还是水军。

那我们就拿这些虚假账号没办法了吗?

新浪微博里首个突破一亿粉丝的女艺人,我们不会真的相信是有一亿个人关注了她;一部好电影上映,众口皆碑下也不会有人在意零星几个差评;百分百好评的商品,消费者也会对其持有怀疑;疫苗事件后,网民对调查记者的呼唤,其实是一种自我保护……不得不说,中国的舆论形成和监督机制正在翻新,水军操纵舆情的力量也越来越弱。

以最近的疫苗事件为例,在事件刚爆发时,也不乏一些别有用心的人,整理出一些儿童因疫苗残疾的图片,却不做任何文字说明,引起了许多人的恐慌和愤怒,但是笔者在其中还是发现了许多比较理性的言论,表明疫苗的不良反应也是客观存在的,这类危言耸听的做法反而会阻碍健康疫苗在国内的普及。

iUbUn2y.png!web

​目前,网上对疫苗流向的追问,有关人员的责问,各种po文有理有据,也是众多网友理性思考后的结果。

所以,尽管虚假账号的痕迹越来越隐蔽,但网民们的理性和成熟也在不断加快,更多网民也不再盲目轻信,反而会批判式地去看待每一个舆论观点,从情绪化到更加理智,从感性到理性,社交软件上的观点已经越来越多元化,网络水军也越来越难以左右舆论走向。

文 | 颜璇

来源 | 智能相对论(ID:aixdlun)


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK