31

再谈服务报表需求分析(10.13)

 5 years ago
source link: http://blog.sina.com.cn/s/blog_493a84550102xyzn.html?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

对于服务运行分析报表,前期我专门整理了一篇文章,这篇文章主要是再梳理下还有哪些统计分析和报表类需求,报表的目的最终还是帮助我们分析服务运行的健康状态,关注潜在的服务运行性能风险,同时对当前服务总线提供的完整服务能力有一个全局的掌握和把控。

服务运行全局情况

前面做了按组织,按系统两个维度的服务运行报表,但是没有做服务运行全局分析报表。服务运行全局情况就是服务总线提供的所有运行中服务,当天实际的服务运行次数情况,成功和失败情况。总线提供的所有服务究竟有哪些没有消费过也需要在报表里面能够体现出来。

服务运行并发量究竟如何,有哪些服务运行并发量最大,具体大并发出现在哪个时间段。

前面只在谈时间段和服务运行次数和并发,实际上还可以进一步统计按时间段的服务运行吞吐量数据,即某个时间段时间同服务总线传递的输入输出数据量。

当然采用了负载均衡集群,实际上在服务运行监控的时候最好还能监控到按集群节点进行分组统计的上述数据,才好进一步分析服务调用请求在各个集群节点之间是否分配平均。

服务运行失败类型统计,原来我们的分析仅仅是一个比例的报表展示,而实际上最好是按运行失败类型进行列表展示,并且细化到每一个服务。即每个服务当前运行失败的次数中,各种异常类型具体的占比究竟是多少,其中包括服务本身的业务系统异常。同时点击到其中一个服务的时候,能够下钻到所有这些失败调用究竟是哪些业务系统消费方调过来的,以方便精确定位到具体的服务消费方。

按系统维度的服务消费情况

当前虽然提供了按系统维度的服务运行分析报表,但是很多内容我们都是只排了Top10的内容,而无法对整体服务消费和调用有一个完整的了解。按系统维度的服务消费情况报表实际上需要体现如下信息:

业务系统实际订购了多少服务,某天或某月究竟消费了多少个服务,有哪些服务根本就没有消费过,消费的总次数,成功失败次数情况如何,这是一个完整列表方便我们分析为何有些服务订购了没有消费。或者说业务系统实际消费服务占订购服务的占比情况是如何的。

其次在按系统维度需要统计服务运行故障情况,最好也是独立的报表来分析服务运行故障情况。即首先还是选择业务系统,然后按天来实时分析当天的服务运行故障情况,其中每个小时为一个间隔单位,可以看到在该小时是否有服务故障产生,具体的故障数。再点击到具体的服务故障时候可以看到详细的故障对应的服务调用。在这里还需要进一步分组,即究竟哪些服务出现调用故障,每个服务运行故障异常出现了多少次错误,成功了多少次。有了这些数据,可以更加清楚的看到业务系统的运行稳定性情况。

当然对于业务系统服务运行异常和故障,包括ESB服务总线本身的服务运行故障异常,最好的方法还是能够有实时的服务告警,预警和邮件通知,以方面第一时间进行处理。

路由服务和JMS消息订阅

对于路由服务,应该有独立的分类统计功能,即能够看到某个路由服务,在某一个时间区间,每个路由地点的服务运行分类统计情况。仍然是包括了调用次数,错误数,平均时长,数据量等基础统计数据。这样可以很方便的查看路由服务本身的性能问题和异常。

对于JMS消费发布订阅,由于存在1对多的情况,因此需要能够分析实际JMS消息分发的订阅情况,究竟分发了多少个消息,有多少系统在订阅,订阅成功取走了多少,还有多少没有取走。以方便来监控实际的JMS订阅消息是否正常,是否有延迟等情况。

对于MFT文件传输,实际上也需要统计分析功能,重要的还是按文件传输模板来进行分类统计,每个文件传输通道在某一个时间段里面,究竟传输了多少次,成功和失败了多少次,传输的数据量有多少,传输速率是多少。以方面分析当前的文件传输是否正常,文件传输性能究竟如何。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK