21

奇客 【奇客故事专栏】数据不是石油

 3 years ago
source link: https://www.solidot.org/story?sid=65706
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

数据不是石油

wanwan (42055)发表于 2020年10月02日 11时35分 星期五 新浪微博分享 豆瓣分享 人人分享 来自部门

作者:高飞

<编者按>此前,奇客Solidot进行了一次用户投票,问大家对发展方向的看法,其中排名前三的选项之一是专栏。于是,我们就先进行这样一个尝试,开设“奇客故事”专栏,本专栏将主要探讨“技术文化如何改变社会文化”话题。这是奇客solidot第一次尝试发布长文章,自然也是对专栏功能的试水。专栏文章只代表作者本人看法,不代表站方意见,如果大家也有兴趣在奇客solidot开设专栏,不妨联络站方。此为奇客故事专栏第一篇文章,讲的是数据隐私问题。

不同的地方有不同地方的名言警句,比如在水浒里的景阳冈,除了武松,当地人都相信“三碗不过岗”。在科技业,也有这样的名言共识,最出名的一句是 “数据是新时代的石油”。

这句话流行于大数据时代,在人工智能时代,声誉则达到顶峰。人工智能的三要素是算法、算力和数据,算法几十年间没有本质的变化,深度学习是旧技术,是暴力计算加上海量数据,导致了新一轮人工智能井喷。

对于人工智能而言,数据确实有点像发动机里的燃油,没有燃油,发动机没有动力,没有数据,人工智能也没法产生智能。

而在上一次工业革命时期,谁掌握能源,谁就有最强大的工业能力;而在第四次工业革命时代,在数字经济时代,谁拥有最多的数据,谁就能有更强大的人工智能平台。

从这个角度看,数据确实像石油。

但是,我们可能忽略了一点,石油是没有生命的,而数据是有生命的。

沉积岩中的石油虽然看起来是“生物”的后代,是历代古生物遗骸被加热加压后的产物,但黑色的石油归根到底是没有生命迹象的,我们无法从石油中,还原出生物的DNA(因此,很多人怀疑,石油压根不是生物产物,而是像石头一样是纯自然产物)。

而零一代码组成的数据看起来毫无生命气息所在,甚至连一个实体都没有,它们就这样安静的存放在计算机的存储设备之中。但数据却是有生命的,因为它是人类在数字世界的真实行为的直接映射。

我们的每一句网络发言,数字摄像头里拍到的每一个画面,每一笔购物清单,这些数据,并不是冷冰冰的代码。这些数据整合起来,就是人类自身,就是属于每一个人的数字自传。

在技术的作用下,我们完全可以通过这些数据还原成一个人,看看他到底是不是购物狂,是不是体育迷或者某明星的死忠粉。

数据可以让一个人完全透明化。有句话说,看人要论迹不论心,但在数据时代,网络踪迹就是人心。

所以数据就成了我们每一个人的数字DNA,数据能做的事情其实远不止于还原一个人,它甚至还能操控一个人。

现在美国正在进行总统选举辩论,大选如火如荼。

就在几年前,偶然间接触了一位来自某国的某竞选团队的CTO,一个长得像黑客的技术高手。但是他说,你知道吗,哥们,黑掉一部电脑的黑客已经过时了,黑掉一个人的大脑才是高手。

什么叫黑掉一个人的大脑?就是通过这个人的行为数据,分析其喜好,然后对其发送各种有针对性的信息,影响他的认知判断,最终改变其行为。或者相反,根据他的兴趣爱好,不停的灌输同一种信息,让其坚信既有观念不动摇。

这个被黑掉的大脑以为自己在自行其是的做决策,其实一切都是设计好的结果。很多事,你以为是你以为的,但是其实是别人让你以为是你以为的,你在第一层,黑掉大脑的黑客在第二层,操控这些大脑黑客的在第三层。

还记得诺兰的电影《盗梦空间》么?现实世界里,我们无法到一个人的梦里,但是有些“黑客”就是可以通过一个人的数据,到他的大脑里。不是盗梦空间,胜似盗梦空间。

当然,除了人类会产生数据,机器也会产生数据。但是别忘了,机器产生的数据,也是为人类服务的,所以机器数据,即是人类数据。

所以,无论怎么看,数据里都有活生生的生命力,数据就是人类自身。我们不在写书法,只会敲代码,几千年后的考古,就是在数据中发现我们的生活足迹。

我曾经在一次大会主持上,问几位人工智能专家,假设未来有一天真的出现人工智能,它能看到我们现在访谈的场面,你现在对这个摄像机镜头,要对它说什么?几位专家发言立刻变得很谨慎,因为专家们知道,有一天,有一部机器,它真能看到这一刻。

所以,没有生命力的石油是可以随便出口的,哪怕是敌对的国家,也不在意两国互换石油。

但是数据不一样,数据的生命力让数据的迁移和人口的迁移没有什么两样。如果人类到某国需要签证,那么数据也需要签证。

甚至,不出国的数据也很敏感。前一阵,李开复说帮助旷世科技拿到了蚂蚁金服的数据,立刻引来两家公司的第一时间澄清。你看,数据之敏感,连有股份关系的合作伙伴都要避嫌。对数据的避嫌,比对有竞业条款的员工的限制还要多。

N年前,李彦宏曾经说过一句话,中国人不在乎数据隐私,愿意牺牲掉这些换取一些互联网服务的便利。其实,当时的人不是不在乎,是不知道数据有多重要。就像写于1031-1095的《梦溪笔谈》,并不知道石油可以带来第二次工业革命一样。

不过说过这番话的李彦宏,并没有做出依赖数据算法推荐的今日头条。而前一阵,李彦宏又说,算法不应该太照顾用户的喜好,这句话用本文的逻辑翻译一下,意思就是系统不应该轻易动用数据权力,黑掉一个人的大脑,这句话就挺好的,比用户不在乎隐私好。只不过,固然系统不应该总为用户喂甜食,但是不当的喂垃圾食品也是不对的。

1947年10月,衍生出 WTO的关贸总协定出现了,人类有了一个基于商品互换的全球贸易谈判体系。那之后,无论国与国的贸易怎么谈,无非是代价价码问题。但是70年之后,WTO已无法解决数据问题,因为WTO不是为处理依靠人类数据喂养滋生,有意识形态的“商品”设立的,老革命遇到了新问题。所以,上个月11号,邻国上任很久,即将卸任的首相和英国上任不太久的首相谈了个贸易协议,其中有个专门的数据条款,有可能是标志性的。

前阵看一部国产动画,叫元龙,一部穿越题材作品,当男主人公掏出一把手枪,干掉了古代一个功夫不错的公子哥时,弹幕上有句话刷了屏:“大人,时代变了”。

可不,时代变了。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK