近年来,关于可观察性的讨论很多,可观察性已经取代传统监控成为管理现代IT环境性能的首选解决方案。
然而,虽然大多数讨论都集中在其他环境中的可观察性(如云环境),但关于数据中心的可观察性的讨论相对较少。
这很遗憾,因为数据中心的可观测性在很多方面都是独一无二的。尽管现代可观测性方法可以帮助改善数据中心的运营,但一些适用于其他系统的可观测性工具和策略可能并不总是适用于数据中心。
什么是数据中心可观察性?
可观察性是指利用外部输出推断复杂系统的内部状态。这至少是近年来科技行业流行的可观察性的定义。然而,可观察性作为一个概念有着更长的历史,可以追溯到20世纪60年代初,而且最初并不涉及IT系统。
但从大约五年前开始,各种技术思想领袖和供应商开始认可这样一种观点:当今的软件架构、环境和基础设施已经变得非常复杂,传统的监控技术不足以支持它们。他们认为,我们需要基于可观察性概念的新工具和技术,而不仅仅是监控。
可观察性与监控究竟有何不同是一个复杂的问题,人们对此有不同的回答。但总的来说,可观察性可以归结为这样一个概念:可观察性不仅仅从单个应用或服务收集日志和指标(监控就是如此),而是将复杂系统各个组件的复杂数据集关联起来,以创建关于整个系统健康和性能的可行见解。
在实践中,监控和可观察性之间的区别仍然有点模糊。出于本文的目的,我们假设可观察性是一种合法的方法,它需要与传统监控不同的工具和技术。
数据中心的可观察性挑战
在公共云环境中,可观察性通常相当于部署可以收集各种日志、指标和跟踪的工具,然后串联分析它们以识别性能问题。然而,在数据中心,可观察性并不是那么简单或直接。数据中心可观察性特别具有挑战性,原因如下:
还有更多需要观察的内容:在数据中心,不仅要跟踪虚拟基础设施和应用,还要跟踪物理基础设施。这意味着需要收集和关联更多的数据。
可观察性数据并不总是可访问的:使用标准可观察性软件并不总是能够简单地收集网络交换机或暖通空调系统等物理设备的日志,这些软件旨在从传统应用程序或服务器收集数据。
性能问题可能跨越多个数据中心:有时,可能会遇到并非某个数据中心独有的问题,例如在两个设施之间移动数据时的高延迟。因此,有效的数据中心可观察性需要能够收集和关联来自多个站点的数据。
数据中心有多个可观察性优先级:可观察性的主要目的通常是管理工作负载性能。但在数据中心,可能面临可观察性的额外要求,例如跟踪电力消耗或用水量。
简而言之,数据中心可观察性比通用可观察性更难,因为在数据中心中,需要观察的内容更多,需要追求的可观察性目标更多,在尝试管理复杂系统时可能出错的地方也更多。
克服数据中心可观测性的挑战
解决这些挑战并不容易。迄今为止,很少有可观察性软件供应商能够构建满足数据中心可观察性需求的解决方案,因此为数据中心实施有效的可观察性策略可能需要大量的人工工作,不能只购买一个工具来解决您的问题。
但是,可以系统地识别所有将推动数据中心可观察性策略的系统和数据源,然后实施跟踪和关联它们的工具。这将花费时间和精力,但它将增强检测数据中心性能问题并快速找出根本原因的能力。
密切关注可观察性领域
数据中心可观察性尚未受到可观察性软件供应商,或有意帮助企业超越传统监控的技术思想领袖的重视。
尽管如此,想要了解硬件和软件环境各个层面发生情况的数据中心运营商应该采用可观察性策略,作为现代化管理数据中心性能和可用性方法的一种手段。
数据中心的可观察性不是一件容易的事情,但它却很重要,而且随着数据中心变得越来越复杂,它将变得更加重要。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。