Serverless技术也不免Meltdown的影响


【编者的话】Meltdown是影响Intel x86微处理器,IBM POWER处理器和一些基于ARM的微处理器的硬件漏洞,许多服务器和云服务广泛受到影响。

由于Meltdown安全补丁产生的内部和基于云的CPU压力的挑战,工程师和DevOps领导正在承担着运行系统带来的成本影响和性能降级。

TNS分析师Lawrence Hecht对Sysdig,AWS和Red Hat的总结指出了一些可能成为持续关注影响的早期数据。 Meltdown安全补丁将继续需要更高的CPU工作负载来解决英特尔和其他处理芯片中的漏洞。 毕竟,芯片本身没有打补丁,安全补丁必须围绕硬件工作,这意味着应用程序和基础架构的运营费用会跳到新常态。

Grab是一家快速发展的东南亚出租车,交付和支付提供商,是最新公布的Meltdown对其基础设施造成影响的公司之一。 虽然他们的无状态弹性云计算(EC2)实例相对安全——它们只是终止现有实例并启动新实例——对其ElastiCache和Redis实例(如Sysdig也报告)的影响,可以从CPU利用率急剧上升看出来。

Grab在管理其性能峰值问题上正在与时间赛跑:其峰值流量点发生在星期五,因此它需要在最繁忙的客户需求期之前继续实施任何潜在性能问题的解决方案。 随着AWS开始向ElastiCache节点执行滚动补丁,Grab的工程师可以监控他们的CPU峰值,看到故障转移被触发到新节点,然后再次观察,因为新节点被打补丁,产生新的CPU峰值。 为了解决这个问题Grab的工程师引入了更多Redis集群以及额外的分片,以更好地分散负载,而导致新的平均CPU使用率达到24%至30%左右。

Grab和其他人的经验表明,Meltdown的影响因所执行的工作量类型而异。 但无服务器工作负载是否比其他架构安排更能抵御性能(和价格)的飙升?

自1月3日以来,AWS几乎每天都会发布定期新闻更新,宣布其针对Meltdown和Spectre的安全补丁。到1月4日,运行Lambda功能的AWS基础架构的所有实例——AWS的无服务器产品的核心——已被修补,无需终端用户采取任何措施。

对于Serverless用户,与那些管理自己的云基础设施的云用户截然不同,包括在EC2上(他们面临审查是否在Windows实例上启用了自动更新的繁琐任务)。总的来说,DevOps工程师被鼓励修补他们的实例操作系统,但是,像Grab的工程师一样,可能需要对所有常规和业务关键工作负载的性能影响进行更全面的分析。

Serverless行业专家表示,Meltdown可能会产生一些无服务器影响。一些人推测,当Lambda假设一个实例(实际上是一个容器)时,该过程会产生很大的性能影响。 Amazon空间,内核空间和终端用户工作空间之间存在本地安全差异,因此安全补丁可能导致新Lambda功能的冷启动速度较慢。

原文链接:Serverless Technologies are not Immune to Meltdown(翻译:edge_dawn)

0 个评论

要回复文章请先登录注册