您的位置:jz7z.com > 国内 >

公有云运维责任划分不再难

叮铃铃~

“客户又投诉了!还是投诉网络慢,快查查是怎么回事!”

“好的,马上排查!”

王亮放下电话立刻展开对整个数据中心网络的排查,心想,这已经是这个月第3次接到这个客户投诉了,每次都是投诉网络慢,但紧迫排查之后却又没有发现任何问题,这是怎么一回事呢?

王亮作为一名运维工程师,任职于西北某省中国移动公司云数据中心(后简称“数据中心”),数据中心肩负着全省众多机关单元的托管业务,王亮作为运维团队的一员,事情中最大的困扰就是接到客户投诉,却又无法排查出故障所在。

偶然一次关于公有云运维的技术论坛上,王亮接触到了明辰智航云安网络与虚拟化性能治理系统,通过与明辰智航云安团队的交流,试探的提出了此前困扰数据中心运维团队数月的问题,咨询该问题是否能够获得解决,令王亮没想到的是,明辰智航云安团队马上就为数据中心开展了测试部署,将常接到投诉的应用拉到同一个服务组,并与王亮约定一周后可以检察效果。

经由一周的数据收罗后,部署的明辰智航云安收集了足够的数据,并针对性的为数据中心举行了故障诊断。测试工程师进入明辰智航云安的操作界面,点击进入应用服务组,检察应用拓扑图,发现Web-server03服务器泛起了红色示警,而且WebServer03与APP-LB-1外部网络通信也同样泛起了红色示警:

测试工程师接着点击红色示警的服务器WebServer03进一步检察,服务器详细界面中http服务泛起了应用法式响应时间过长的问题:

点击红色示警的http进一步检察基础原因,在基础原因界面中,显示基础原因与CPU、内存、存储有关系的可能性为0%,与应用法式中http由WebServer03提供有关系的可能性为50%:

同时在应用交互信息界面中,部门客户端在与服务器WebServer03通过http服务交互历程中,应用法式响应时间过长,而且每次针对与同一请求都泛起响应时间过长的情况,且请求回应均能够通过:

③ 应用法式每次针对同一请求都泛起响应时间过长的情况,且请求回应均能够通过。

联合以上三点,测试工程师判断问题可能是出在客户应用法式上,故障点开端确定!

明辰智航云安随即通知王亮故障诊断效果,王亮喜出望外,马上通过数据中心将明辰智航云安的诊断数据记载发送给客户,客户工程师凭据数据记载检查,最终找到问题确实出在了应用法式代码上,修正后,网络慢的问题终于被解决了!客户方工程师表现很是惊讶,一直追问是如何找到问题所在。王亮露出了释然的笑容。

在公有云运维中,由于应用法式造成的故障时有发生,而通例手段的排查运维人员很难详细判断出故障所在,从而导致无法举行责任划分。

运维人员可通过明辰智航云安直观的看到整个公有云情况的康健状态,通过简朴的鼠标点击就可以进一步检察红色示警信息的基础原因;其中应用拓扑图可以清晰的展现各服务器应用之间的联系和状态;应用的交互信息界面则记载了每个生意业务请求的响应情况,为公有云运维责任划分提供强有力的证据。

经由此次与明辰智航云安的接触,数据中心的王亮真诚的说道,“在我们团队日常运维中,如何举行责任划分,是困扰了大家良久的问题,我们迫切的需要一款像明辰智航云安这样能快速定位故障,并明确举行责任划分的运维治理系统。”

——入运维苦似海,手无法器难称佛。

想要云运维,就要有云安!

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。