如何在 AWS 上为物联网平台实施灾难恢复解决方案 官方博客
在 AWS 上为物联网平台实施灾难恢复解决方案
关键要点
这篇文章介绍了一个现实世界的案例,重点展示了物联网IoT服务提供商如何利用 AWS IoT 的灾难恢复DR解决方案来提升其平台的可靠性。灾难恢复解决方案在保证设备连接性及工作负载的无缝转移中起到了至关重要的作用,尤其是在地区出现服务中断时。本文陈述了一个可定制的解决方案,能够实现 AWS IoT Core 和相关应用服务的跨区域转移。
引言
在物联网平台中集成灾难恢复DR解决方案已成为物联网领域公司的一项关键任务。物联网系统的复杂性在于有众多互联设备和庞大的数据流,这使得潜在的中断风险增大。物联网平台通常在医疗、制造和自动驾驶等行业承载着关键应用,短时间的停机或数据丢失可能导致严重的财务损失、客户信任度降低和法规合规问题。通过在您的物联网架构中引入灾难恢复功能,可以主动减轻这些风险,实现业务连续性,并增强物联网平台在网络故障、应用程序不可用以及其他突发事件中的可靠性。
解决方案概览
下面的架构图展示了如何将灾难恢复解决方案采用并扩展到物联网提供商的综合 DR 实施中。该架构中使用了多个 AWS 账户,因为许多物联网服务提供商更喜欢使用 多账户策略。
组件描述Amazon Route 53控制故障转移,依据健康检查返回的结果进行判断。AWS IoT Core物联网服务提供商的应用部署在物联网服务账户中,同时包含 DR 解决方案。命令与控制账户提供 API 用于与外部管理控制台集成,发出设备管理命令。数据分析账户使用 Amazon EventBridge 吸收来自物联网服务账户的数据。
灾难恢复实现
该解决方案使用 Amazon DynamoDB 全球表 将关于 AWS IoT Core 的所有操作从主区域同步到辅助区域。AWS Step Functions 和辅助区域的 AWS Lambda 函数会将所有这些操作复制至辅助区域的 AWS IoT Core。同样,为了实现灾难恢复,所同步的数据与应用无关,用户无须进行维护。
健康检查
该解决方案利用 Amazon Route 53 的健康检查来决定何时启动故障转移。以下因素均受到监控,任一因素的故障都可能触发故障转移过程:
AWS IoT Core 消息代理应用服务命令与控制服务数据分析服务健康检查的状态通过部署在物联网服务账户、命令与控制账户和数据分析账户的 API 进行检测。API 及其背后的 Lambda 函数使用预定义检查点来确定返回的响应是失败还是成功。
故障转移过程
Amazon Route 53 根据记录中定义的策略执行故障转移。一旦故障转移开始,设备上的 AWS IoT 设备 SDK 需要断开与主区域 AWS IoT Core 的连接,并连接到辅助区域的 AWS IoT Core。
以下为触发重连的几种方法:
从 Amazon Route 53 健康检查发出 Amazon Simple Notification Service (SNS) 通知。中断物联网服务的当前连接,通知设备进行重连。设备频繁查找 DNS 目标,若发现不同时主动重新连接。恢复时间目标 (RTO) 与恢复点目标 (RPO)
架构的 RTO 主要取决于故障转移的持续时间。主要由以下四个因素组成:
DNS 解析器缓存 Amazon Route 53 记录的时间,即 TTL 配置。每次健康检查的响应时间与下一次健康检查请求之间的时间间隔。故障阈值,即改变当前目标状态所需连续健康检查通过或失败的次数。健康检查的处理时间以及使用的 API 性能。通过减少这些因素,可以缩短故障转移的持续时间。
RPO 受到以下因素的影响:
当主 AWS IoT Core 发生故障时,MQTT 消息可能无法被规则引擎处理,即使已被 AWS IoT Core 接收。初级区域的命令与控制服务不可用时,来自管理控制台的所有 API 调用将自动转发至辅助区域。AWS Lambda 函数通过 Amazon EventBridge 全球终端节点 访问 Amazon EventBridge 事件总线。总结
通过利用本博文中介绍的 DR 架构,物联网服务提供商可以简单高效地在其物联网平台内实施灾难恢复,带来众多好处。这不仅可以帮助保护潜在的收入损失,还能提升客户信任度和忠诚度,增强物联网平台的安全性能。
实施灾难恢复还能够提高物联网业务的运营效率,减少因停机而产生的费用,并在中断期间降低手动干预的需求。
我们期待着看到您如何利用灾难恢复加强在 AWS 上构建的物联网平台的可靠性。立即访问 AWS IoT 开始您的旅程,前往 AWS 管理控制台。
熊猫加速器安卓版下载关于作者
Shi Yin 是 AWS 专业服务部的高级物联网顾问,位于加利福尼亚州。他与众多企业客户合作,利用 AWS IoT 服务构建智能家居、智能仓库、连接汽车、商业物联网和工业物联网等解决方案。
四种减轻滥用通用顶级域名的方法 媒体
域名欺诈攻击的再认识关键要点域名欺诈攻击是网络钓鱼的老手法,施害者模仿知名品牌网站的域名,以误导用户进入假网站。常见的域名伪造类型包括相似域名、子域名劫持和同形攻击。新的通用顶级域gTLD正在被广泛用...
新的 AWS 安全构建者培训现已通过 SANS Institute 提供 安全博客
新版AWS安全构建者培训现已通过SANS学院提供关键要点AWS与SANS学院合作开发了新课程《SEC480 AWS安全构建者》,旨在帮助工程师和开发人员在AWS云中自信地构建和部署安全的工作负载。课程...