Grafana 使用教程 - 构建你的第一个仪表盘

KalaSearch

Grafana 使用教程

为什么要写这个教程

前段时间代码中有个问题,找了非常久才找到,最后发现是因为服务器在阿里云,而阿里云到 Datadog 的网络不通。于是我们不得不放弃了 DataDog,用 Grafana 搭起来一套监控系统

搜资料的时候发现,Grafana 中文的优秀教程非常少,不是已经过时就是 CSDN 上复制粘贴的各种奇怪文章。于是我们在搭起来监控系统的过程中,特意将过程抽象记录了下来,结合之前在厂里的经验写了这篇教程,并附上了代码

这篇文章里,我会从原理出发,讲到为什么要用 Grafana,再到 Grafana 的启动和配置。系统监控不只是运维赖以生存的工具,它对日常开发也有非常大的作用。这也是为什么之前在厂里,虽然是工程师也推荐阅读 Google SRE 手册(同样强烈推荐)

能熟练地使用 Grafana/Prometheus 等系统,对于开发来说绝对是走到哪都好用的技能,希望这篇文章能够帮到大家。如果对你有帮助欢迎留言告诉我

全文请戳 => Grafana 使用教程 - 构建你的第一个仪表盘

本文对应的: GitHub Repo

补充:GitHub 代码链接转到了: https://github.com/Kalasearch/tutorials/tree/master/grafana/grafana-with-prometheus
补充

GitHub 链接转到了 => https://github.com/Kalasearch/grafana-tutorial

defunct9:讲讲如何收集交换机带宽并计算 95th 吧

KalaSearch:@defunct9 好的,不过这篇已经非常长了。如果你有好的文章推荐也请发给我,我会加到后面

chotow:楼主要不要再写一下 Logstash 和 Kibana,ELK 也是挺常用的。

iplcbest:配置挺复杂,感谢分享

opengps:文章特别好,Grafana 对于大厂来说简直不可或缺

v2byy:通俗易懂,赞

wenbinwu:把不同种类的 metrics 都解释清楚就更好了

RedBeanIce:强无敌

KalaSearch:@chotow 有空可以写写,不过实在话说我们 LK 用得少,主要是因为日志服务用了 Loggly 了已经。对于绝大多数可以买的服务,一般都懒得自己搭,性价比不高 😀

@iplcbest 谢谢喜欢 <3

@opengps 感谢!是的,我在做研究的时候发现 Tableau 内部也用 Grafana 😀

@v2byy 谢谢支援

@wenbinwu 要下一章了

@RedBeanIce 谢谢老哥喜欢

hhyvs111:我们公司也用的这个,不错

linvon:prometheus 的话,还是在文章里改下描述吧,是 prometheus 主动向数据源拉取数据的,这也是它与 influxdb 这种数据库的主要区别,不然容易误导新手

KalaSearch:@linvon 能详细点说下哪个部分让你觉得表意不是这样吗?

summer0:@KalaSearch 同问 讲讲如何收集 90,95th 的

fenglangjuxu:应该讲下怎么画图 画各种各样的图形

lzlee:兄弟你这是要当 教程王 啊
粗略看了一下, 感觉把简单事情讲得很清楚
楼主费心了

nowcoder:请教一下楼主,时间序列的数据里,如果中途有一段时间是没数据的,展示的折线图如何在这段时间内显示为 0 ?
现在是直接一条折线过去的,希望两个数据点的时差超过 k 秒,就显示为空

ETiV:@nowcoder 可以配置没数据点的时候,展现是否为连线还是 0

linvon:@KalaSearch #12

Grafana 使用教程 - 构建你的第一个仪表盘

两次提到数据传递都是用“发送”修饰的,个人感觉不太妥的

seanxx:是不错,我们一直在用

weilongs:去年公司让做了 Grafana 的汉化。 过后来版本代码变化有点大,不能复用其他版本。

nowcoder:@ETiV 木有找到,请问是在哪里配置的?

KentY:@chotow 我觉得 kibana 是非常难用的软件.... 实在摸不着头脑... 哎

agdhole:楼主的卡拉搜索怎么收费的,有免费额度吗?

ETiV:@nowcoder 我不知道你数据源是啥,我是 influxdb

在查询语句编辑界面,GROUP BY 那行,有一个 fill(XXX),点击一下括号里是可以选的

选一个你觉得合适的呗

KalaSearch:@linvon 感谢,编辑的时候没读到,的确不太严谨,一会改一下

clifftts:先收藏

leestar54:隐约感觉是广告贴,但是又没有证据的样子[狗头]。

csdreamdong:同问,,带宽 95 计费的问题

ixinshang:@csdreamdong 表示关注

ixinshang:请教 1 个问题
@csdreamdong @KalaSearch
我是配合 zabbix 使用的,通过 SNMP 获取的值,原始数据是间隔 5 分钟,在使用 grafana 查看值的时候,两天之内,数据间隔是 5 分钟的。 超过 2 天,时间间隔就大于 5 分钟,查了相关的资料,没查到能设置的地方,两位能否赐教一下。

WilsonGGG:这个网站设计的蛮好看的,手撸还是模板?

StrongNoodles:先收藏,有空再看。。

Leigg:可以先把 es 教程出完吗

KalaSearch:@WilsonGGG 手写的

@Leigg 慢慢来

tianshiyeben:我也贴下我的监控系统,哈哈,www.wgstart.com

zoyua:学习了,多谢

nowcoder:@ETiV 找到了。感谢

请问大家,哪里服务器最便宜?

zaqzhin:我的需求是需要一台 24 小时不间断运行的 windows 系统 服务器,运行几个软件。 哪里能搞到最便宜呢? 我在阿里云算过,最便宜的是抢占式实例 2 核 4g,20g 硬盘。大概三十几一个月。 用了几个月,目测抢占式实例基本不会被系统释放。。。就算释放了也没关系,我再买一次就行了。 我就想,还有能比这更便宜的吗? 我只是运行软件而已,别的…

作为城市里生活的高智个体,我们需要智慧城市解决哪些生活问题?

trueGate:最近被“困在系统里的外卖小哥”文章刷屏,从中感受作者在替外卖从业者抒发一种被程序支配而不得不脱离现实的愤慨。作为旁观者,尚可以像看待“楚门的世界”一样,表达一些同情即可;但转念一想,城市在建的“智慧城市”系统,会不会将每一个人困住。__________________________脑洞分割线________________________…

阿里云官网后台数据库控制台出现严重问题

lijiayan:目前已知的为 RDS 问题。 已知出问题时间 5 点至今仍未修复~~~

跨考渣硕求指教!软件测试和软件开发工作方向怎么选?

Heyrobot:21 应届双非渣硕,本科自动化,有一些控制程序的编写经验,没有比较系统的开发经验。目前的考虑是现在尽量找比较大一点的厂的软件测试,以后有机会再转开发。不知道这条路可行性大不大,诚向各位大佬请教!

怎么修复电脑版微信聊天记录

wzehai:我的微信数据文件目录是 C:\Users\zehai\OneDrive\文档\WeChat Files\,平时一直通过 OneDrive 同步,这几天我重装了一下系统,这次重装系统安装完微信程序后,打开微信程序通常都需要从数据文件目录下载需要的文件来启动微信,但这次下载了一半我就给取消下载了,然后微信出了个报错提示,再然后我又重新下载数据文件后…