机器学习平台在Kubernetes上的实践

翔宇 发表了文章 • 0 个评论 • 225 次浏览 • 2020-11-25 22:31 • 来自相关话题


【编者的话】本文回顾总结近一段时间网易云音乐机器学习平台(GoblinLab)在容器化实践的一些尝试。

背景

过去音乐算法的模型训练任务,是在物理机上进行开发、调试以及定时调度。每个算法团队使用属于自己的独立物理机,这种现状会造成一些问题。比如物理机的分...
查看更多

2020云原生调查报告:较首次调查,生产环境的容器使用量飙升300%

ylzhang 发表了文章 • 0 个评论 • 325 次浏览 • 2020-11-25 17:00 • 来自相关话题


【编者的话】从2015年Google主导成立了云原生计算基金会(CNCF)到2019年的云原生大放异彩,业内对云原生也有许多定义和预判,在2020年疫情大流行的大环境下,伴随着企业的数字转型云原生又会有怎么样的趋势呢?CNCF关于云原生的一个调查报告从一定程度...
查看更多

申通快递 双11 云原生应用实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 377 次浏览 • 2020-11-25 14:07 • 来自相关话题


来源 | [阿里巴巴云原生公众号](http://mp.weixin.qq.com/s%3F__ ... f9...
查看更多

Kubeflow V1.2发布:全部功能特性综述

大卫 发表了文章 • 0 个评论 • 403 次浏览 • 2020-11-25 12:25 • 来自相关话题


作为面向Kubernetes构建的开源机器学习工具包,Kubeflow如今正式迎来1.2版本。新版本的主要更新包括对模型构建、训练调优以及机器学习管道进行了增强;引入自动配置超参数机制以提高准确度;提供Kubernetes上的无服务器接口;提供交互式编码环境以...
查看更多

CNCF宣布etcd正式毕业!

尼古拉斯 发表了文章 • 0 个评论 • 482 次浏览 • 2020-11-25 09:22 • 来自相关话题


专为云原生软件构建可持续生态系统的云原生计算基金会(CNCF)今天宣布,etcd项目已经正式毕业。从孵化初期一步步走向毕业,etcd凭借着不断提高的采用率、开放的治理、完善的功能成熟度以及对于社区、可持续性以及包容性的坚定承诺完成了整个成长蜕变。

etcd是...
查看更多

Cilium 1.9:eBPF是Linux和云原生网络的未来

aoxiang 发表了文章 • 0 个评论 • 524 次浏览 • 2020-11-25 08:12 • 来自相关话题


背景

几十年来,IPtables一直是Linux网络的基石,但是现在不再如此。在过去的几年中,网络和安全性必须与IP和端口等底层抽象脱钩,而应在与开发人员,DevOps和SecOps团队如何考虑他们的应用程序相一致的更高层。

在现代系统中,我们很少考虑...
查看更多

Code Review 是一场苦涩但有意思的修行

老马 发表了文章 • 0 个评论 • 614 次浏览 • 2020-11-24 20:35 • 来自相关话题


前言

最近 CodeReview(以下简称CR )心态相当的平和,代码是一个讲道理的东西,是就是,否就否。在 CR 时,沟通特别轻松,问题讨论也特别聚焦,因为它是量化和定向的。CR 的过程不是恃强凌弱,也不是一言堂,大家看着代码,当作是一种灵魂的交流,...
查看更多

OpenKruise:阿里巴巴 双11 全链路应用的云原生部署基座

阿里巴巴云原生 发表了文章 • 0 个评论 • 725 次浏览 • 2020-11-24 14:08 • 来自相关话题


来源 | [阿里巴巴云原生公众号](http://mp.weixin.qq.com/s%3F__ ... 9c...
查看更多

如何用Prometheus监控十万container的Kubernetes集群

阿娇 发表了文章 • 0 个评论 • 1004 次浏览 • 2020-11-23 23:07 • 来自相关话题


概述

不久前,我们在文章《如何扩展单个Prometheus实现近万Kubernetes集群监控?》中详细介绍了腾讯云容器服务TKE团队大规模Kub...
查看更多

怎么实现 K8s 零中断滚动的更新?

回复

李文通 发起了问题 • 1 人关注 • 0 个回复 • 212 次浏览 • 2020-11-23 17:04 • 来自相关话题