监控

监控

SpringCloud 应用在 Kubernetes 上的最佳实践 — 高可用(熔断)

阿里巴巴云原生 发表了文章 • 0 个评论 • 145 次浏览 • 2020-09-18 15:16 • 来自相关话题


作者 | 宿何

导读:前几篇我们主要站在应用发布的场景,描述在发布过程中会遇到的灰度、监控、回滚、优雅上下线等保障发布能顺利进行的注意事项。作为一个程序员 GG,可灰度的发布顺利上线往往意味着准点下班。而我们今天要分享的内容则关系到我们能否...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(优雅上下线)

阿里巴巴云原生 发表了文章 • 0 个评论 • 776 次浏览 • 2020-09-15 14:38 • 来自相关话题


作者 | 骄龙


导读:本篇是《SpringCloud 应用在 Kubernetes 上的最佳实践》系列文章的第八篇,主要介绍了如何做到流量的无损上/下线。更多相关文章阅读可查看文末。

前言

上篇我们讲的是发布回滚过程,尤其是在 K...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可回滚)

阿里巴巴云原生 发表了文章 • 0 个评论 • 949 次浏览 • 2020-09-14 14:39 • 来自相关话题


作者 | 长门

导读:本篇是《SpringCloud 应用在 Kubernetes 上的最佳实践》系列文章的第七篇,主要介绍了新功能上线时,如何尽快减少对线上用户的影响?发布系统需要提供回滚到前一个或前几个版本的能力,达到快速恢复线上业务的目的。

...
查看更多

流量暴增,掌门教育如何基于 Spring Cloud Alibaba 构建微服务体系?

阿里巴巴云原生 发表了文章 • 0 个评论 • 752 次浏览 • 2020-09-10 14:36 • 来自相关话题


作者 | 童子龙  掌门教育基础架构部架构师

导读:本文整理自作者于 2020 年云原生微服务大会上的分享《掌门教育云原生落地实践》,本文主要介绍了掌门教育云原生落地实践,主要围绕 Spring Cloud Alibaba & Nacos &...
查看更多

详细教程丨使用Prometheus和Thanos进行高可用K8S监控

Rancher 发表了文章 • 0 个评论 • 729 次浏览 • 2020-09-10 11:19 • 来自相关话题


本文转自Rancher Labs

介 绍

Prometheus高可用的必要性

在过去的几年里,Kubernetes的采用量增...
查看更多

如何管理越来越多的 operator?OLM 给你答案

阿里巴巴云原生 发表了文章 • 0 个评论 • 719 次浏览 • 2020-09-09 14:46 • 来自相关话题


作者 | 匡大虎、阚俊宝

导读:OLM(Operator Lifecycle Manager) 作为 Operator Framework 的一部分,可以帮助用户进行 Operator 的自动安装,升级及其生命周期的管理。同时 OLM 自身...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可监控)

阿里巴巴云原生 发表了文章 • 0 个评论 • 633 次浏览 • 2020-09-07 16:24 • 来自相关话题


作者 | 骐羽  阿里巴巴技术专家


导读:本篇是“SpringCloud 应用在 Kubernetes 上的最佳实践”系列文章的第六篇,主要介绍了如何保障生产环境服务稳定,做到随时发布,从而加快业务的迭代和上线速度。
相关文章推荐:

-...
查看更多

云原生应用实现规范 - 初识 Operator

阿里巴巴云原生 发表了文章 • 0 个评论 • 589 次浏览 • 2020-09-07 14:48 • 来自相关话题


作者 | 匡大虎、阚俊宝  

基于 Kubernetes 平台,我们可以轻松的搭建一些简单的无状态应用,比如对于一些常见的 web apps 或是移动端后台程序,开发者甚至不用十分了解 Kubernetes 就可以利用 Deployment,Service ...
查看更多

Arthas 初探--安装初步适用

阿里巴巴云原生 发表了文章 • 0 个评论 • 666 次浏览 • 2020-09-01 15:29 • 来自相关话题


作者 | agmtopy

【Arthas 官方社区正在举行征文活动,参加即有奖品拿~点击投稿

由于在项目中遇到一种情况,某段代码在进行单元测试和在 tomc...
查看更多

国货之光业务增长背后的技术支持 - 完美日记的云原生实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 876 次浏览 • 2020-08-18 16:47 • 来自相关话题


“使用 ACK 容器服务可以帮助我们快速拉起测试环境,利用 PTS 即时高并发流量压测确认系统水位,结合 ARMS 监控,诊断压测过程中的性能瓶颈,最后通过 AHAS 对突发流量和意外场景进行实时限流降级,加上阿里云 团队保驾护航,保证了我们每一次...
查看更多

爱奇艺微服务监控的探索与实践

老马 发表了文章 • 0 个评论 • 1474 次浏览 • 2020-06-13 17:53 • 来自相关话题


作为一线程序猿,是否有过类似经历?新接手一个系统,各接口入口流量是多少,又是哪些业务方在调用?系统大量异常报警,如何快速锁定影响范围,恢复故障并定位问题?

监控的重要性不言而喻,可是接入监控的额外工作又让人望而却步?每天编写代码之余,又要花多少时间定位线上问...
查看更多

打造云原生大型分布式监控系统(三):Thanos 部署与实践

aoxiang 发表了文章 • 0 个评论 • 2861 次浏览 • 2020-04-20 16:41 • 来自相关话题


【编者的话】上一篇《Thanos 架构详解》我们深入理解了 Thanos 的架构设计与实现原理,现在我们来聊聊实战,分享一下如何部署和使用 Thanos。

部署方式

本文聚焦 Thano...
查看更多

Thanos 组件介绍以及使用心得

徐亚松_v 发表了文章 • 0 个评论 • 3108 次浏览 • 2020-04-16 10:00 • 来自相关话题


背景

在《高可用 Prometheus:问题集锦》文章中有简单提到 Prometheus 的高可用方案,尝试了联邦、Remote Write 之后,我们最终选择了 Thanos 作为...
查看更多

DockOne微信分享(二五二):滴滴开源监控夜莺的架构设计思考

尼古拉斯 发表了文章 • 0 个评论 • 3486 次浏览 • 2020-04-11 23:35 • 来自相关话题


【编者的话】Nightingale是一套衍生自Open-Falcon的互联网监控解决方案,融入了滴滴的最佳实践,在性能、易用性、可用性方面都做了大幅改进,在滴滴抗住了7.7亿(包括物理机、虚机、容器、网络、业务模块的)监控指标。本次分享首先会介绍夜莺监控的总体...
查看更多

滴滴开源夜莺Nightingale:企业级监控解决方案

齐达内 发表了文章 • 0 个评论 • 4650 次浏览 • 2020-03-26 15:24 • 来自相关话题


【编者的话】滴滴发布新开源项目——夜莺(Nightingale),是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。

夜莺(Nightingale)是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足...
查看更多

爱奇艺在日志实时数据监控的探索与实践

aoxiang 发表了文章 • 0 个评论 • 1817 次浏览 • 2020-03-09 11:58 • 来自相关话题


2019年6月爱奇艺会员规模突破1亿,爱奇艺的会员服务业务随之迅速增长,同时也带来了机器集群规模的增加,原有的监控体系也暴露出一些问题。数据监控体系是业务维持稳定服务的基石,会员日志监控体系形成闭环,从网络、应用、异常、页面加载多维度监控,极大提高了系统的成功...
查看更多

通过Prometheus和Grafana监控Linux进程

xiaoyh 发表了文章 • 0 个评论 • 4709 次浏览 • 2019-07-21 18:38 • 来自相关话题


【编者的话】本文介绍了如何通过Prometheus以及Grafana监控Linux系统中进程的资源使用率。

不论你是Linux系统管理员还是DevOps工程师,你都会花很多时间来追踪服务的性能指标。

有时,你可能会遇到运行速度非常慢的实例,但你找不到任何引...
查看更多

一篇文章全面了解运维监控知识体系

阿娇 发表了文章 • 0 个评论 • 2830 次浏览 • 2019-06-22 20:49 • 来自相关话题


监控目标

我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同、公司不同、业务不同、岗位不同、对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用。
![](http://s...
查看更多

携程框架团队对于应用监控系统的探索与思考

阿娇 发表了文章 • 0 个评论 • 2188 次浏览 • 2019-05-18 11:46 • 来自相关话题


一、为什么需要应用监控系统

随着市场环境的变化以及国际化的进程,企业的各种对内、对外需求也日益增长。服务化的架构以及容器化的应用加速了各种功能、产品的迭代与更新。随之而来,我们也面临着一个不断膨胀,日渐复杂的系统。

复杂度的成倍增加对故障的根因分析、执...
查看更多

DockOne微信分享(一六一):聊聊Docker监控那点事儿

尼古拉斯 发表了文章 • 0 个评论 • 7157 次浏览 • 2018-03-11 18:06 • 来自相关话题


【编者的话】现在有很多的开源的Docker监控方案的实现,我们可以很容易的搭建一套监控系统出来;但是如果你有定制化的需求,则需要自己去实现;那么我们该怎么实现呢?需要监控哪些指标呢?这些指标又是什么含义呢?应该怎样去收集呢?本次分享我们来一起探讨。

这里我不...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 高可用(熔断)

阿里巴巴云原生 发表了文章 • 0 个评论 • 145 次浏览 • 2020-09-18 15:16 • 来自相关话题


作者 | 宿何

导读:前几篇我们主要站在应用发布的场景,描述在发布过程中会遇到的灰度、监控、回滚、优雅上下线等保障发布能顺利进行的注意事项。作为一个程序员 GG,可灰度的发布顺利上线往往意味着准点下班。而我们今天要分享的内容则关系到我们能否...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(优雅上下线)

阿里巴巴云原生 发表了文章 • 0 个评论 • 776 次浏览 • 2020-09-15 14:38 • 来自相关话题


作者 | 骄龙


导读:本篇是《SpringCloud 应用在 Kubernetes 上的最佳实践》系列文章的第八篇,主要介绍了如何做到流量的无损上/下线。更多相关文章阅读可查看文末。

前言

上篇我们讲的是发布回滚过程,尤其是在 K...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可回滚)

阿里巴巴云原生 发表了文章 • 0 个评论 • 949 次浏览 • 2020-09-14 14:39 • 来自相关话题


作者 | 长门

导读:本篇是《SpringCloud 应用在 Kubernetes 上的最佳实践》系列文章的第七篇,主要介绍了新功能上线时,如何尽快减少对线上用户的影响?发布系统需要提供回滚到前一个或前几个版本的能力,达到快速恢复线上业务的目的。

...
查看更多

流量暴增,掌门教育如何基于 Spring Cloud Alibaba 构建微服务体系?

阿里巴巴云原生 发表了文章 • 0 个评论 • 752 次浏览 • 2020-09-10 14:36 • 来自相关话题


作者 | 童子龙  掌门教育基础架构部架构师

导读:本文整理自作者于 2020 年云原生微服务大会上的分享《掌门教育云原生落地实践》,本文主要介绍了掌门教育云原生落地实践,主要围绕 Spring Cloud Alibaba & Nacos &...
查看更多

详细教程丨使用Prometheus和Thanos进行高可用K8S监控

Rancher 发表了文章 • 0 个评论 • 729 次浏览 • 2020-09-10 11:19 • 来自相关话题


本文转自Rancher Labs

介 绍

Prometheus高可用的必要性

在过去的几年里,Kubernetes的采用量增...
查看更多

如何管理越来越多的 operator?OLM 给你答案

阿里巴巴云原生 发表了文章 • 0 个评论 • 719 次浏览 • 2020-09-09 14:46 • 来自相关话题


作者 | 匡大虎、阚俊宝

导读:OLM(Operator Lifecycle Manager) 作为 Operator Framework 的一部分,可以帮助用户进行 Operator 的自动安装,升级及其生命周期的管理。同时 OLM 自身...
查看更多

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可监控)

阿里巴巴云原生 发表了文章 • 0 个评论 • 633 次浏览 • 2020-09-07 16:24 • 来自相关话题


作者 | 骐羽  阿里巴巴技术专家


导读:本篇是“SpringCloud 应用在 Kubernetes 上的最佳实践”系列文章的第六篇,主要介绍了如何保障生产环境服务稳定,做到随时发布,从而加快业务的迭代和上线速度。
相关文章推荐:

-...
查看更多

云原生应用实现规范 - 初识 Operator

阿里巴巴云原生 发表了文章 • 0 个评论 • 589 次浏览 • 2020-09-07 14:48 • 来自相关话题


作者 | 匡大虎、阚俊宝  

基于 Kubernetes 平台,我们可以轻松的搭建一些简单的无状态应用,比如对于一些常见的 web apps 或是移动端后台程序,开发者甚至不用十分了解 Kubernetes 就可以利用 Deployment,Service ...
查看更多

Arthas 初探--安装初步适用

阿里巴巴云原生 发表了文章 • 0 个评论 • 666 次浏览 • 2020-09-01 15:29 • 来自相关话题


作者 | agmtopy

【Arthas 官方社区正在举行征文活动,参加即有奖品拿~点击投稿

由于在项目中遇到一种情况,某段代码在进行单元测试和在 tomc...
查看更多

国货之光业务增长背后的技术支持 - 完美日记的云原生实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 876 次浏览 • 2020-08-18 16:47 • 来自相关话题


“使用 ACK 容器服务可以帮助我们快速拉起测试环境,利用 PTS 即时高并发流量压测确认系统水位,结合 ARMS 监控,诊断压测过程中的性能瓶颈,最后通过 AHAS 对突发流量和意外场景进行实时限流降级,加上阿里云 团队保驾护航,保证了我们每一次...
查看更多