81

比起科技巨头,普通人中的AI开发者都在做什么?

 6 years ago
source link: http://www.tmtpost.com/2988755.html?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
1400x777&ext=.jpeg

怎么样?是不是已经被BAT、谷歌、微软、亚马逊的人工智能故事给弄疲乏了?这次,咱们不如去看看AI世界里那些聚光灯之外的普通人——比如那些只能下班之后才搞搞AI的开发者。

DuerOS之前开始推出了普通开发者就可以申领的开发套件。一段时间之后,我们在论坛里找到了几位开发者公开的个人日记。希望得到这样一个答案:今天的AI开发者到底在做什么?

这些不全职、不赚钱,只凭兴趣做AI开发的普通人,也许代表了AI这个巨型话语的边界。他们是距离资本最远的一群人,却又真真正正的生活在AI这个前沿技术当中。

我们选择了六位开发者的故事,其中三位是软件工程师,一位是硬件工程师,一位也是从事编程类工作,还有一位是河北大学计算机系的老师。他们的故事可能告诉我们最直白的东西,大概就是在普通人心中,到底希望AI变成什么样子。

冷静与热爱:开发者是最挑剔的用户

自己动手做人工智能开发,在今天还是一件蛮酷的事。有心从事这件事的绝对是深度发烧友,并且对各家的AI业务都熟稔于心。同类对比这些开发者的日志,给我的第一个感受就是,这是一群最挑剔的用户。

来自合肥的张晓宇,是一名软件开发工程师,论坛上的ID叫奉天逍遥,是霹雳布袋戏里的一个角色。他在日志里写到这样一个认识:在他看来,市场上的智能产品,做的最好的是微软的小娜和小冰。这两个产品已经让他觉得AI语音这件事已经不怎么新奇。直到他看到其他网友分享如何在DuerOS进行Java版技能二次开发后,才意识到可能在DuerOS这里获得开发空间。

再比如一位没有透露姓名的开发者,他尝试过叮咚、小爱和一些物联网设备的开发。比较了几家的优劣之后,他会从生态圈、开发难度等几个维度给出自己对不同产品和平台的意见。并且在开发过程中透露对AI语音技术的思考,比如在他看来,声纹识别是现在平台迫切需要给出的能力。很多东西假如每个人都能控制,那么会限制大量AI语音产品的想象力,尤其是在安全设备层面。

对比了六个人的开发日志后,很容易发现开发者绝不是一门心思跟着平台的节奏走。他们会对比不同的品牌,不同的产品,会自己思考和质疑,会试探AI产品目前的能力边界在哪里。

个人开发者对于AI细节有深刻而理性的认识,应该是很多人没有想到的。当这个群体在数量和话语权上都成长起来之后,会不会像手机、电商等领域一样,成长出一批KOL呢?想想也是蛮有意思的。

目前支撑这些开发者的,大多仅仅是热爱。他们做的东西还离商业比较远,能把做出来的语音硬件发个朋友圈就已经不错了。我注意到,河北大学的倪志宏老师很多时候都是凌晨1、2点才发日志,他自己说,是孩子白天会来捣乱,只能等小孩睡了才能自己开电脑做开发。而妻子的态度是不支持也不反对。

这种情况下还会坚持做某件事,让我们看到了AI也不全是跟风和泡沫。

“一定要有名字”:AI开发的另一面

另一个值得注意的细节,是我们在对比了六位开发者的日志,并且观察了更多开发者的开发记录之后,得出了一个“小结论”:做智能语音开发的,差不多一定会更改唤醒词。也就是要自己给硬件起个名字。

这当然很好理解了,毕竟是自己辛辛苦苦做的东西。希望它有独属性是不言而喻的,但有意思的是,开发者给AI语音命名,往往是一件很认真,甚至有点庄重的事情。

郑立安是一名硬件工程师,他给DuerOS更换的唤醒词是“伊伊”,这是他一岁女儿的名字。在家他的女儿也会跟着一起叫这个名字来唤醒AI,在他看来是很好玩的一件事。

也有人用自己老婆的名字、用自己最喜欢的动漫角色,或者印象深刻的小说角色名来命名自己开发的语音设备。

在福州的李智,则是从最开始就立志给孩子做一套跟电影类似的“钢铁侠”。做模型的朋友负责外形,而他则用AI开发钢铁侠战衣的内在系统。

每位开发者在谈到自己的开发成就感时,基本都会提到同样的词:赋予灵魂。他们并不希望开发出一件电器或者工具,而是希望打造一个可以陪伴家人,尤其是孩子的虚拟人物。

AI的目的是拟人化交互和拟智慧思维,一定要让AI的载体更加拟人可感,这一切才有前提。但大公司提供的产品必然是量产和工业化的,这个短期内难以更改。

但在开发者手中,智能硬件却是完全向着个性化、拟人化发展的。这中间的落差一方面说明了个人开发者的价值何在,另一方面或许也说明了普通家庭真正对AI产品的期待在哪里。

当拟人AI被印证为刚需的时候,可能另一些变数和开发者的机会就出现了

脑洞时代:驰向无数场景的AI众

可以注意到,在开发者的故事中,技能平台的开放是一件比较重要的事。

虽然开发者的工作和知识基础可能相对大体相似,但在开发AI能力这件事上的脑洞,却是绝对天差地别的。

比如说家住石家庄、名叫王亭的开发者,就希望用AI语音的技能来满足盲人出行的需要。他本来想做AI语音给盲人导航,但后来发现还是会遇到很多问题。比如按照设定路线导航没有十字路口车辆之类的提醒。如果路面有坑或者障碍的话也无法感知。后来他希望能够用AI语音交互结合传感器和地图导航,做成一个类似自动驾驶系统的辅助工具。

不言而喻,这个设想是非常有价值的。当然还有很多困难,但基础条件已经在AI平台能力升级下陆续成熟。

这样的脑洞还有很多,比如有人想做老年人专属的通话系统,有人希望打造真实的钢铁侠来操纵家居系统,有人希望做语音控制的门锁,有人希望做一个语音交互的菜谱,在炒菜的时候可以实时指导——仿佛看到了直男厨艺拯救方案。

还有一个有意思的脑洞,是倪志宏老师在日志中提出,想要在车的后车窗上放一个LED的显示屏。驾驶者一说话文字就会显示出来,这样就能和后车人随时交流。据他说,虽然要在车上引电路,工程量比较大,但在理论上已经完全可以实现。假如有了这个东西,堵车时的气氛应该能好很多吧…..

看了不少开发者的日志后,基本可以得出这样的结论:每个开发者都是有目的、有场景的在做开发。他们大多会发现生活中的一点点小问题、小不方便,来针对性的用AI解决之。

这些细小的场景是大公司无暇做的,但其中很多价值绝对不菲。今天的AI众们在积蓄的商业力量,大概就蕴藏在这些脑洞和场景里。

为了写这篇稿子,看了不少开发者的故事。如果要很理性地看,他们表达出的东西或许大同小异,进度和困难也都差不多。但说实话,在这些东西之外,还是会留给我一些非理性因素的触动。

上文提到的郑立安,在描述他开发AI时的感受,用了这样一段话:“唤醒的一瞬间感觉这个东西还挺奇妙的,交互这个东西让人浮想联翩,让人感觉在赋予生命,有操作、有反馈,激励我继续玩下去。”

普通人的小确幸,小成就,大概就是如此。看似他们在做的事情很简单,却蕴含着坦诚和努力思考。

所以说,AI的未来说不定根本不在大公司手中,不在垄断的商业帝国里。这些企业和象牙塔,或许就像蓄水池,虽然水源充沛,但却是一滩难以流动的死水。只个体的创意加入进来,开始修筑沟渠,引水入田,才能“海归百川”,才能有生态,才能有真实的需要和细节化的商业价值。

所以,千万不要小瞧这些哄孩子睡觉之后,才能打开电脑研究主板的开发者们。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK