监控云中的盲点以及如何处理它们

发现 3 个主要监控盲点,以及您和您的团队可以做些什么来保持对隐藏的性能问题的了解。

云采用正在增长,因为它具有许多优势,例如在需要时轻松配置新资源。另外,通常还有短期资金储蓄。

云不仅仅是 SaaS;有许多第三方提供商使用云,包括 DNS、CDN 和 API。

这意味着要监控的内容比以往任何时候都多,在这篇文章中,我们将介绍避免复杂基础设施带来的最大盲点的最佳方法。

我们涵盖的 3 个盲点是:

  • 第三方控制什么
  • 用户控制什么
  • 你控制什么
  • 1. 第三方控制什么

    由于所有迁移到云,您不再控制您所依赖的大部分网络。您的提供商可能会或可能不会监控他们自己的基础架构。您的供应商也在使用云解决方案和其他第三方,因此您和您的客户都依赖于许多互连。

    使用 SaaS,您无需编写任何代码。相反,您只需打开浏览器窗口并登录产品。您也许可以自定义点点滴滴,但控制权最终掌握在提供者手中。

    你能为这个做什么?

    选择合适的第三方

    您将需要第三方,因此最好的第一步是选择合适的第三方。

  • 确保他们了解您的业务需求,并且有一个共同的 SLA,并且他们遵守它。
  • 如果您要迁移到云,则必须为迁移前和迁移后制定可靠的计划。监控系统将帮助您在迁移前后对性能进行基准测试,以便您可以在需要时进行改进。
  • 制定冗余计划

    一旦您选择了合适的第三方来满足您的业务需求,就该制定冗余计划了。

  • 为所有第三方备份,因为您无法控制第三方中断;你只能控制你的准备。
  • 为发生中断时发生的事情制定计划。谁负责与第三方沟通?您将如何与内部团队沟通?
  • 除了拥有备份 CDN、服务器和应用程序之外,您还需要制定一个备份计划,以便在发生中断时该怎么做。与您的团队一起制定与用户沟通的计划,并准备好一个备份站点——了解如何使这个备份站点不仅仅是一个错误页面。
  • 管理第三方标签

    您应该使用信誉良好的标签管理器。这将帮助您快速解决问题,通常是在问题影响您的客户之前。

  • 确保您知道您的标签在哪里以及它们属于哪些第三方。
  • 在活动期间尽可能保持标签精简。消除您不需要的任何不必要的广告标签。如果您必须在其中放置广告,请确保它们没有提供 Flash、视频或大图像文件。
  • 2. 你的用户控制什么

    这并不总是您网站上的某些东西的错。它可能是浏览器问题、设备问题或地理问题——所有这些都由您的用户决定。

    我们曾经检测到 Internet Explorer 用户的加载时间错误。事实证明这是 JavaScript 和 iframe 的问题——但如果他们的用户使用的是 Internet Explorer 而不是其他浏览器,则无法采取任何措施来提高速度。

    您无法控制用户的浏览器,但您可以执行以下操作:

  • 你不选择他们的设备。因此,请确保您的网站具有响应性。
  • 你不选择他们的位置。因此,部署多个 CDN 以在您的主要存在点 (PoP) 更快地交付内容。
  • 3. 你控制什么

    信不信由你,有许多流行的盲点在您的控制之下。也就是说,您没有监控基础设施的所有部分。让我们看一些例子。

    MQTT

    MQTT 是一种支持物联网的机器对机器 (M2M) 协议。监控 MQTT 意味着您可以发现您的设备或您的用户设备之间发生的中断。查明 MQTT 问题将帮助您的团队提高平均解决时间 (MTTR)。

    API

    监控 API 将帮助您查明执行不佳的情况并检测导致特定问题的 API 或位置——无论是内部 API 还是外部 API。这是改进关键业务交易的关键,例如您的结账流程。

    域名系统

    如果您不监控您的 DNS,那么您就错过了客户/客户旅程中的一个关键点——他们旅程的开始——以及一个可以决定或破坏他们对您的品牌忠诚度的关键点。如果他们无法访问您的网站,您需要了解它。

    SMTP

    如果您监控 SMTP 服务器,则可以提高应用程序可用性并快速检测中断和协议故障。您将能够确定中断是由于连接失败还是您的用户浏览器不支持 SSL。

    监控盲点

    尽管无法控制第三方、云或用户行为,但您仍然可以部署一些监控最佳实践,以帮助自己快速检测问题并提高平均解决时间 (MTTR)。

    这些监控实践将确保您的第三方满足您的要求,它们还将帮助您确定问题是您的问题、供应商的问题还是 SaaS 提供商的问题。

    云端

    云中的应用程序应该具有比迁移前更好或相同的性能。要测试您的云提供商是否满足您的性能要求,您应该结合使用合成和真实用户监控(见下文)。

    完全迁移到云后,您可以继续使用 RUM 和合成,以确保您的第三方遵守 SLA。

    综合监控

    如果没有综合监控,您就无法将问题扼杀在萌芽状态。综合监控意味着您可以使用 SaaS 应用程序和第三方自动执行典型的用户行为。您可以监控页面加载、响应和事务时间。

    真实用户监控

    您不能仅仅依靠合成,因为您的用户可能正在体验不同的东西——您需要确切地知道他们的体验是什么。

    结合朗姆酒和合成

    增加合成用户以测试新功能或为高流量事件做准备。查看不同 PoP 的 RUM — 即,确保您没有从 AWS 中查看 AWS 中的用户。

    您的用户在哪里

    您需要从用户所在的任何位置(即您的 PoP)衡量性能。监控解决方案应衡量用于从世界各地的互联网骨干网交付 SaaS 应用程序的互联网服务质量。包括支持应用交付的 DNS 和加速服务以及内部网络服务。

    3 个关键要点

    当涉及到盲点时,没有比做好准备更好的处理方法了。

  • 确保您选择正确的供应商
  • 为基础架构的每个部分(包括备份站点)准备好备份
  • 监控基础架构的每一部分,以便确定问题所在并改进 MTTR。
  • 来源:科技狠活与软件技术

    声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

    上一篇 2022年7月5日
    下一篇 2022年7月5日

    相关推荐