关于运维体系建设有没有什么好点的建议?

如题所述

作为企业数字化转型的重要手段,IT运维效率的高低会直接影响到业务的正常运转,传统运维走向智能运维,其实就是运维数字化的过程。在智能运维建设过程中,先平台还是先场景,对于很多企业用户来说一直是个难题。如果用户对自身数据情况了解非常清晰,且希望打破数据孤岛以建立统一运维数据平台,那么可以优先选择平台建设;如果用户明确知道底层平台需要的能力,寄希望于能直接带来业务价值,可以优先选择场景建设。



例如一家城市商业银行,它目前最大的问题可能只是监控效能低下,误报漏报多,我们可以先从集中告警入手,利用算法去重降噪,再查看相关告警之间的有效告警场景,筛选出最可能影响业务问题的告警。在提高告警处理效率后,再通过分析告警的源头,进一步解决监控指标静态阈值设定不准确的问题,用智能异常检测替代之,从而根本上提升监控效能。这就是场景化方式导入智能运维的方法。

智能运维建设,可以根据用户实际运维情况,同步开展,循序渐进地进行建设。擎创根据以往经验,总结出三个原则六步走的最佳实践方案,我们首先可以通过集中监控智能化改造、指标监控智能化改造和日志异常检测(弥补监控手段不足)等提升实时性数据处理能力,再通过智能故障排查(根因分析和定位)、智能知识管理(知识图谱)和故障自愈提升数据事后分析和处理能力。

对于有些公司提出的,运维成熟度不高不敢考虑智能运维?

运维成熟度度高的的企业,可以按照数据处理能力的维度,统一规划、分层实施,实现从运维数据局部集中到跨域集中,也就是先建立运维大数据平台,通过加强数据治理、优化数据质量,而后再过渡到基于算法的统计分析乃至流式实时处理,构建多样化智能运维场景,逐层实现智能运维能力建设。

但这种方式并非放之四海而皆准,对于成熟度不高的企业,迫切需要解决的是实际运维问题,而智能运维这时应该能成为解决实际问题的工具,它可以根据客户当前的运维成熟度选择具体应用场景,按照不同的路线图进行建设,这才是智能运维的应有的能力。智能运维的本质就是逐步提升对运维数据的分析处理能力。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-05-19

首先要明确智能化运维建设最关键的三件事情:

第一,要把基础设施全面数字化,让所有东西都变成可衡量的体系。

第二,建设端到端、从业务到基础设施全链条的自动化平台,保证决策规划和响应速度。

第三,建立 TCO 模型,实现很好的反馈机制,利用反馈不断优化模型。

以淘宝为例,在智能化运维领域,淘宝采用的是横跨专业、机器学习以及优化算法的跨界思考逻辑,基于这样的思路,阿里巴巴重新规划建设了 基础设施领域的三大平台——基础设施规划与交付平台、集群自动化运维平台和数据中心智能运营平台。

第2个回答  2020-12-17
复杂的架构、繁杂的工作,纷繁的系统,众多的管理团队等等,随着这些业务的发展确实为IT带来了不小的挑战,这就需要运维不断的增强了,可以构建统一监控体系实现数据层的融合打通,提供全面的数据支持,解决多部门沟通的障碍;从管理视角建设服务管理体系,提升效率,降低运维成本;初步实现以告警为核心的智能运维体系,提升运维的质量等等,这些仅供你参考。有需求的话你可以去听云了解下,听云是中国应用性能管理行业的领军企业,毕竟大公司更专业,对你的业务和公司更有帮助。本回答被提问者采纳
相似回答