0

未来属于提出问题的人

 1 year ago
source link: http://www.geekpark.net/news/302944
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
今日看点
8min read

未来属于提出问题的人

2022/05/27
0c1a46992c767796b0a0ae9329c423ba.jpeg

AI 是如何做好人类帮手的?

软件工程思想家杰拉尔德·温伯格曾经给「问题」下了个定义:问题,就是理想状态和现实状态之间的差别。

我们的工作,就是应对问题的挑战。问题可能是「我想要产品检测更准确」,「我想要快速完成重复的任务」, 或者,「我想要沙漠变成绿洲」。

「我想要沙漠变成绿洲」这个问题,是高鸿志提出来的。他是个大学生,来自甘肃省古浪县。在这个紧贴腾格里沙漠的县,有几位被称为「治沙六老汉」的固执老农,用 38 年造林 21.7 万亩,在风沙中一寸寸夺回耕地,保护农田。

图片

「治沙六老汉」三代治沙人合影 | 图片来源:视觉中国

高鸿志也想做同样的事。不过作为自动化专业的学生,他想换一种方法。他和朋友们开发出栽种和养护树苗的智能机器人,这些小家伙能在复杂沙漠地形中,找到合适的地方栽下树苗;在巡视林地时能识别树苗根部,精准浇水和施肥。

成为时代楷模的「治沙六老汉」凭借毅力和人定胜天的信念,靠双手阻住了风沙的脚步;在人工智能(AI, Artificial Intelligence)的帮助下,高鸿志找到了解决问题的新方法,让新时代的治沙人,有了新的眼睛和新的手脚。

那么,AI 是怎么帮人解决问题的?

01、智能时代的操作系统

AI 是计算机科学的分支,它尝试让机器去做到那些传统上只有人能做到的事情——听起来很简单,但是要实现却很困难。自上世纪五十年代 AI 的概念提出以来,这个蕴含希望的领域让人们激动了两次,又失望了两次。直到 2006 年,多伦多大学的杰弗里·辛顿教授提出一种基于多层人工神经网络的机器学习方法,AI 才迎来了第三次发展浪潮。

人工神经网络模仿了神经元相互传递信号的方式,它会在训练数据的帮助下逐渐学习,做出的判断越来越准确。而多层神经网络,是在数据输入层和结果输出层之间,夹着更多 「隐藏层」的神经网络。各层中的神经元彼此相连,构成类似大脑皮层的复杂结构。

这种让多层神经网络从训练数据中学习的方法,就是大名鼎鼎的「深度学习」。它是目前最受重视的机器学习方法,也是近年来 AI 迅速发展的基础。无论是打败李世石的 AlphaGo, 还是能听懂我们说话的小度音箱,都是基于深度学习技术;处理人类的自然语言、看到和识别物体、转换不同数据形式,都是深度学习技术能够分担人类工作的领域。

图片

简单人工神经网络和深度人工神经网络

在这项技术发展的早期,往往是研究者自己编写神经网络,经由数据训练,转化成能解决问题的深度学习模型。很快地,人们把构建深度学习模型的几个必要过程提炼出来,形成稳定通用的组合,构成「深度学习框架」。它们隐藏了复杂的底层工作,大幅降低深度学习的使用门槛。因其重要,框架被称为「智能时代的操作系统」,成为大多数 AI 用户的入口。

许多 IT 企业都以开放源代码的方式发布了自己的深度学习框架,希望能将 AI 引入更多行业中。在世界上,谷歌的 TensorFlow,Meta(原脸书)的 PyTorch , 百度的飞桨 PaddlePaddle,亚马逊的 MXNet 都拥有大量用户,吸引了大批开发者和研究者;2020 年以来,国内又相继出现了旷视 MegEngine、清华大学 Jittor、华为 MindSpore、一流科技 OneFlow 等等一批开源深度学习软件框架。

但是,并不是所有的框架,都适合所有企业和场景。

网易云音乐就碰到了独特的问题。作为规模巨大的音乐社区,网易云音乐希望能向用户推荐合口味的音乐、歌单甚至直播。但是它的数据很特别:类型多,规模大,动态程度高。网易云音乐的数据类型从声音、数据条目直到文本都有,9,000 万首歌,28 亿个歌单,还有 2 亿活跃用户每天产生的海量评论和互动,数据关系高达千亿级别以上。

经过连番测评,大多数框架都败下阵来。最终,网易云音乐以「飞桨图学习」(PGL, Paddle Graph Learning) 组件为基础升级了推荐系统,提升了冷门歌曲分发、云村广场、陌生人一起听等等业务场景的效率,最高甚至提升了近一倍。

百度飞桨是目前国内最受欢迎的开源深度学习框架,综合市场份额第一。但是,飞桨想做的并不仅仅是框架。它的目标是成为 AI 时代的基础设施,让 AI 能力成为即需即用的资源,像电,像自来水,像移动互联网。

只有 AI 能力灵活可用且随时可得时,它才能真正发挥作用,真正帮助各行各业跨入 AI 时代。那些在行业中真正实践的人,那些面对真正问题的人提出需求、定义问题,AI 就能以强大的能力,帮助他们解决。

在互联网高速发展的时代,IT 企业中都会有产品经理,他们是发现需求、定义问题,再组织资源去解决问题的人。好的产品经理可遇不可求。今天,在 AI 的帮助下,产品经理更需要的是懂得如何运用前沿的 AI 技术,更好更容易地解决问题。

时代变了,关键在于能不能提出好问题。

02、有 AI 的未来

世界是由提出问题的人推动的。提出一个好问题,往往比找到答案更重要。当莱特兄弟不再模仿鸟类飞行,而开始研究空气动力学的时候,人类才真正能飞翔。

那么,有 AI 的未来会是怎样的?

百度飞桨认为,AI 应该帮助各行各业提升能力,更便捷地解决问题。AI 能力应该像大工业生产那样标准化、模块化、自动化,让任何人都能容易地学习和使用。

这也是目前 AI 平台面临的普遍问题。正如亨利·福特所说,「如果我去问人们想要什么,他们会说想要更快的马。」技术的发展往往先于大众认知,有问题的人们未必意识到 AI 可以帮助他们解决问题;AI 技术的门槛还是偏高,人们未必会容易学会使用 AI 来解决问题。

飞桨想要解决这些问题,成为智能时代的增长引擎。从 2016 年开放源代码以来,飞桨一直致力于与开发者社区、与各种行业和企业合作,提供针对行业独特需求的 AI 能力,优化与硬件的适配,以及降低学习和使用门槛。

北京大兴区长子营镇有一座植物工厂,厂长李开一个人最多可以照看 100 亩地——是过去的 5 倍。提供助力的,依然是 AI:计算机视觉组件不仅会自动识别蔬菜是否健康、能否采收,还能及时发现害虫。搭建这样的系统也并不困难:飞桨提供了 EasyDL 零门槛 AI 开发平台 ,将构建深度学习模型的过程转变成搭积木般的活动。

图片

这是相对简单的 AI 能力。在其他内容更繁杂、上下游更多样的行业,飞桨使用另一种策略:开发预训练大模型,并针对任务和行业优化,形成基础能力、任务能力、行业能力的组合。

提高 AI 的「智力」,关键在于算法、数据和算力。解决问题能力强的深度神经网络,需要大量数据和强大计算能力的支撑。神经网络会通过学习训练数据,在内部为一些变量赋值,这些变量被称作「模型参数」,是深度学习模型解决问题能力的关键。而预训练大模型,就是参数很多的、用大量数据预先训练好的深度学习模型,可以帮用户降低创建和训练 AI 模型的成本。

更强的计算能力,更多的数据,这是「大力出奇迹」的思路,往往有效。从 2019 年到 2021 年,模型参数的数量每年都增加一个数量级:微软的 T-NLG 有 170 亿参数, OpenAI 的 GPT-3 有 1,750 亿个参数,谷歌的 Switch Transformer 的参数更是达到了 16,000 亿。

图片

大模型参数数量的迅速攀升

同样迅速猛增的,是大模型的训练成本。GPT-3 使用了 285,000 个 CPU 核心,10,000 个 GPU, 以每秒 400Gb 的高速网络连接 GPU 服务器;这样的配置,足以在全球超级计算机排行榜前五中占据一席。在超大算力的需求下,GPT-3 训练一次就要用掉 19 万度电,花掉 460 万美元。

这样的发展是不可持续的。虽然大模型通用性强,但提升效果所需的成本增加得更快。而且,通用性强并不意味着在具体问题上表现更好。

用户以为自己想要更快的马,但是他们真正想要的是更快、更安全、更方便的交通工具;用户使用某种工具,是为了解决某个问题。市场营销大师西奥多·莱维特曾说:「用户不想要四分之一英寸的钻头。他们想要的是个四分之一英寸的洞。」

AI 大模型要与应用场景匹配,才能更好地解决问题。所以,飞桨文心大模型将能力分了类。基础大模型沉淀知识与认知推理能力,任务大模型为特定任务优化,行业大模型再叠加行业特有的数据和知识,来让 AI 获得更好的认知,帮助人们做出更好的决策。在 5 月 20 日的 Wave Summit 2022 深度学习开发者峰会上,飞桨文心大模型一口气发布了十个大模型,涉及多种专项任务,以及能源电力和金融两个垂直行业。

与行业合作,让能源电力和金融领域的任务提升效果,意味着强大的 AI 能力开始帮助人们解决重要问题了。

但是这还不够。工具要易学易用,才能广泛使用;飞桨文心大模型还配套了开发套件、API 以及内置了文心大模型能力的 EasyDL 和 BML 开发平台,努力降低使用门槛,争取让人人都可以成为 AI 开发者。开放良好的生态,才能带来更多创造,文心大模型共创共享飞桨生态,推出大模型创意和探索社区旸谷;飞桨平台已经凝聚 477 万开发者,服务 18 万个企事业单位,创建 56 万个解决问题的 AI 模型。依托飞桨这个平台,百度协同产学研培养了超过 200 万 AI 人才。

飞桨的目标很明确:让更多人意识到,AI 可以帮助人们解决问题;让更多人知道,如何使用 AI 来解决问题。

03、未来属于提出问题的人

毕竟,世界是以问题来组织的。世界不在乎学科门类,只是向人们抛出挑战。

未来正在变得越来越快,越来越不确定。适者生存,未来属于能敏锐地发现问题、提出问题的人。

然后,他们将和 AI 一起,面对世界的挑战。

提出问题的人,将不仅是政治家、商业领袖或学者;他们可能是创业者,小团队,行业专家,以及任何想把世界变得更好的人。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK