
9

听云总裁赵宇辰:AI+业务运维成就数字新基建
source link: http://www.ciotimes.com/index.php?m=content&c=index&a=show&catid=365&id=196159
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

听云总裁赵宇辰:AI+业务运维成就数字新基建
听云总裁赵宇辰:AI+业务运维成就数字新基建
2020-11-03 15:29:05
来源:CIO时代网
2020年10月23-25日,“第六届中国行业互联网大会暨CIO班15周年年会”在北京隆重开幕,本次大会由CIO时代学院主办,新基建创新研究院协办,汇聚了数智时代的院士、顶尖行业专家、研究学者、优秀CIO群体和科技厂家,大家围绕大会主题“新基建引领新模式”纷纷发表重要观点。在24日下午举行的金融CIO论坛,听云总裁、首席科学家赵宇辰发表题为“AI+业务运维成就数字新基建”的主题演讲,以下为演讲实录:
赵宇辰:“大家好,我是赵宇辰,很高兴有这样的机会和大家分享。也很感谢大家坚持到现在,其实我的职业生涯10年都是在美国从事很多数字化的研究和数字化的优化,服务了很多国外的比较优秀的银行,比如说美洲银行等等。后来回国加入听云,今天很高兴有这样一个机会跟大家分享一下我今天的主题,就是AI+业务运维成就数字新基建。

我们想想,其实很多人可能还记得我们图上的这个场景,去银行我们拿一个泛黄的存折去柜台进行存钱、取钱,进行交易,刚刚很多领导说门店已经越来越少人真正去实体进行交互。我们发现很多信用卡都是用手机银行网上银行操作。各个银行都有数据中心,都是银行的私有云或者跟其它合作做公有云,甚至网管中心有网络,包括很多银行在对外提供一些服务,有混合运营。同时客服中心也在建立非常数字化的过程。我们看到很多银行正在引入一些AI的手段,做智能机器人,智能客服,服务更多的老百姓。

整个数字化带来非常大的挑战,虽然给很多的客户带来了很多便捷,其实这个数字化并不是一蹴而就的,并不是一下能搞定的事。随着数字化进程,大家在网上可以畅所欲言,包括很多APP,在买基金或者进行转账的时候,可能经常看到转不出来,导致很多用户到网上抱怨。出现无法登录或者无法绑定银行卡等各种各样的问题。数字系统它的性能、体验、包括刚才讲的风险的控制,其实直接影响业务。以前业务是线下进行各种各样的操作,现在全部搬到线上。
我们就会发现要使业务正常进行,就需要一定有好的监控手段,不管是用户角度,还是业务角度,还是刚刚讲的从风控、安全的角度,都需要做监控。以前传统的基建,盖各种高楼大厦有很多监控的手段,比如布各种摄像头,而数字领域如何做监控,则需要用数字化手段。

数字化时代监控越来越重要,有四个比较大的数字化的变革。我们讲数字新基建,到底体现在什么地方?很多非常传统的行业都在进行变化,除去我们刚刚讲的银行,其它行业也是这样。比如买车票,买飞机票,很少去实体,都是通过手机购买。包括保险,可能做一次赔付很多都是APP做的。未来所有的企业被很多人称做金融科技。
另外IT本身正在进行非常大的变革,传统的IT是成本中心,到我们企业内部很多东西放到了数据中心里边,本质上相当于是一个数据库,比如ERP是财务的数据,HR是企业内部员工的数据,其实IT系统体验好不好、有没有问题,一般都在内网,安全的不会出现太大问题,这个是支撑业务的成本中心。而这个非常大的变革就是,越来越多数字系统在前台,不单单在后台,可能跟用户之间的交互、跟客户之间的交流,直接代表业务的本身。同时直接代表了一些竞争优势,很多新一代的使用者,可能仅凭你的数字体验更好更方便,所以就选择你的服务。
另外,应用复杂度也呈爆炸式的增长,很多时候我们为了让这个系统更加安全更加高效,会引入新的功能,新的工具,这样导致整个的IT系统,或者数字新基建系统非常复杂。可能在简单的购买基金过程中,经过几十个交付,这样中间出现比如客户说这个基金买不了,或者红包为什么没抢成功,中间是某一台服务器出问题,或者手机机型不适配,或者网络某一个地级市的移动宽带出现问题等等,如今这么高的应用系统怎么保障性能和安全,是一个非常重要的事情。
同时很多人很关注开发,需要去招聘很好的工程师,招聘很好的研发人员做各种各样的开发,各个银行有自己的软件开发中心。Google也说到,开发和运营在水下,占很多成本。一个软件或者APP,任何一个数字化系统,搭建的时候需要半年、一年的时间,搭建完持续运营的时间会达到三到五年,甚至更长时间,运营的成本非常高。同时数字化体验也非常高。如果说用户一个网站超过5秒或者8秒打开不了就会放弃,又或者一个APP老崩溃,就会换另一个。同时福布斯报告说81%的买家单纯因为体验感好,就会选择一个体验更好的数字化服务。

综合这四点,传统的很多监控是不能解决问题的,传统监控只监控最底层,比如看网络内存很基础的指标,实际上没有从上往下看,从上往下看是一个用户真正使用数字化系统的时候,比如使用网银,使用渠道系统的时候真正的体验如何?对业务造成收益是如何的?如果有一个故障,有一个BUG造成损失,整个数字化交易成功率是多少?同时监控各种各样的层面,为什么还有很多客户仍然在投诉?我的VIP客户怎么保证?

同时有很多外包团队,有一些是自己的团队做的,有一些是外包团队做的。我们从四个角度观察,第一个角度从最底层的资源层面,怎么保证数字基建的性能;第二层面从系统层面,软件层,各种各样的软件,有可能是自己内部开发的,或者各种云开发;第三从人的角度,真人用户用得怎么样?流不流畅?第四个是从业务的角度,任何一个企业不单单是一个业务,内部是非常多的不同的业务,一个业务里有子业务,作为CEO关注每个业务表现怎么样,每个业务里子业务情况又如何。核心是这四点,中间是我们的数据,希望把各种各样的数据搜集下来服务这四点。
听云有多元探针的手段,解决以前的困境。以前企业内部数据来自不同的部门,这些数据是相互打架的,那我们把小的探针放到不同的服务上,把数据回传回来。偏业务的比如说全局有交易流水号,这笔金额过来的时候,金额是多少?如果是跟用户,那么用户手机号是多少,这笔交易是成功还是失败,所以业务数据可以抓取下来,如此就形成端到端的数字基建性能感知了。
比如前端的时候用的是网页端,小程序,甚至微信公众号的推送,包括APP,经过网络到了我们后台服务端,后台上千台服务器,各种各样软件应用,最后把结果返回。期望能不能构建全视图就知道交互关系怎么样。对于用户体验希望有整套指标管理体系,我们精确到什么程度?下载一个APP,把这个APP杀掉,再启动一次,或者把这个APP放在后台打开微信再切回来,都有非常完整的指标体系来衡量。很多时候关注的是业务的表现情况,比如今天有多少笔交易,这些交易来自全国哪些地方?我的环比、同比怎么样,每类业务日活分布如何,每一类交易重点用户分布怎么样?这些能不能同时也相应地制定一些监控,企业根据这些指标做监控,出现异常的时候,可以智能地进行软件的推送。

比如整个银行,我想看除了IT系统之外,承载的IT系统上面有多少交易指标,每天这么多交易量,有多少错误,比如典型的业务错误--用户的今天区块金额导致上限了,导致失败;或者这个渠道满了,所以不能从这个渠道买了,所有的一切是不是关联到一起?具体看看交易类型的错误的分布情况。
另外可以点击详情,看看每一笔错误交易,失败或者成功的原因是什么?目前因为数据最终都汇聚到中台也好,也能做很多不一样的事情。刚才有老师讲做一些转换,现在银行渠道也很多,这些可能很多用户通过互联网其他渠道过来,我们是不是可以把业务流转换刻画出来。如果一个用户从提交注册到实名认证,到人脸识别,再到银行卡提交,每个操作流失的用户数比例多少,流失大的原因是产品没设计好,还是有IT故障。比如人脸识别掉了一个第三方的KPI,这样可能会去换第三方人脸识别,要不然采用一些别的方式进行补救,这样清晰的刻画业务流转过程。因此可以让企业或者银行做到更加精细化的管理。
同时其实我们数字化手段在于会把很多的客户的投诉聚合起来。以前的投诉会通过当地的支行门店进行解决,现在发现这些客户投诉会更加中心化,怎么处理很复杂的场景。比如支付就是不成功,但是实际上并不能复线,或者客户人员复线不了。发现经常走一些不一样的流程;比如老人家手比较抖,他不小心点到回馈,就导致程序崩溃了。碰到这种场景,数据全部输到系统里,到底这个用户进行了哪些操作,一系列操作真的确实出现问题。我们看经过哪些流程和步骤最后导致失误。可能在强的网络情况下,wifi不会出错,很弱的情况下会出现这样的错误。如果是这样的话我们会具体地分析,客户为什么去投诉,投诉的原因是什么,怎么解决这样的问题。

总体来说由于现在数据化系统越来越多,希望各个银行各个数字化系统用一套系统说话,避免每个业务部门只说自己的数据,导致不再一个频道或者用一个标准、一个体系来进行沟通。我们希望可以构架这个IT和业务之间的桥梁。比如一个客户,他们的实施关联交易是多少,他们的趋势是怎么样?今年错误率提升了,到底有哪些影响,是否是前端或者后端的问题,出错的情况下,把出错的东西专发给产品。

那我们结合下主话题,希望能跟AI结合起来,到底怎么结合?本质上AI不是目的,目的是帮助用户降本增效。以前几天几个小时做的事,现在是不是分钟能解决。同时以前主动地系统里看,现在是不是能自动推送?今天是不是就这两个问题需要解决,AI为什么认为这是一个问题。出现问题的时候,是否能够一键排查,可能数据库出现问题,可能这个前端的银行代码出现问题,或者就是对某个机型适配性出现问题。
同时每天会有大量的告警,这么多的告警不能形成一个数据孤岛,分别散落在不同的地方,是不是合在一起智能地判断,这些告警是因为一个事故造成的。可能是因为某个数据出错了,导致出现一系列连锁反应。
我们希望有一体化的解决方案,去智能监控,让这个数字世界更美好,核心就是希望有一个统一的数据采集的模式,不管数据来源于前端、后端、各种各样的数据,只有数据是整个平台的核心,这样可以打破生态和系统割裂,做成统一的平台。同时能结合各种各样的场景,不管是安全的、运维的、运营的场景,都能满足其场景需求。
虽然内在的数据是一样,但表现形式是不一样的,以前是偏人工,现在是更加智能。所以最后总结一下,其实我们很多时候,最开始做的数字基建,关心的首先是这个系统可以用起来,最起码让用户的体验和性能可以理解的。再往前,企业每年这么多IT投入,上面到底有哪些业务,如果出现问题会影响哪些关键业务,怎么做业务分析,获客分析,渠道分析,是不是能够加入一些智能。这样更加为企业提质增效,降低成本。将人力释放出来,可做更多创造性的东西,很多重复性的劳动交给机器,对于未来对于风险管控是不是把智慧沉淀下来。只有结合了这四个阶段,我们才能帮企业帮银行做最好的决策的推荐,同时帮助我们达成这样的业务目标。这就是我今天分享的内容,谢谢大家!”
目前,AI能够帮助企业解决很多繁琐的问题,听云注重提升AIOps能力,持续增加研发投入,结合大数据分析、机器学习和AI可解释性,通过使用基于算法的技术推进数字化的IT运营,让IT运维变得简单化和高效,为银行以及其它企业带来更优质的服务体验!
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK