分布式跟踪系统dapper

1. 介绍

简单研究过全链路的同学想必一定看过google dapper的这篇论文。我这里直接看了中文翻译的,并且对其内容进行了一些总结。具体地址见:Dapper分布式跟踪系统-翻译

2. 为什么使用dapper

文章首先举了一些例子说明了跟踪系统的必要性。尤其当一个用户操作设计大量的服务的时候,跟踪系统可以方便我们定位到底是在哪个服务的调用上产生了问题。

3. 跟踪系统在设计时需要考虑的问题

低消耗: 由于是7*24的监控,所以开销要小,不影响在线服务

应用级透明:应用程序不需要关注如何使跟踪系统生效。可以在线程调用、控制流、RPC库中埋点来做到。

扩展性: 支持......

iftop工具监控网络流量

1. 介绍

今天介绍的工具可以方便我们实时监控进程的网络流量情况。这个在帮助我们排查网络异常的问题时非常有用。

2. 安装

#安装依赖

yum install flex byacc libpcap ncurses ncurses-devel gcc make

# 进入安装目录

sudo ./configure

sudo make

sudo make install

iftop下载地址

可以选择0.17版本,这个是最后发布的稳定版了。

3. 使用

3.1 界面

界面上面显示的是类似刻度尺的刻度范围,为显示流量图形的长条作标尺用的。

中间的<......

zabbix存储值理解

这个差值是两个值对比。

一个是单纯的差量变化,一个是差量的秒率

举个例子 第一个采集值10 ,第二个30 那么两个值差量是20

秒率的话,就是差量/你的更新时间比如你 采集更新时间是60s

算的每秒的差量变化

一般这个大部分用来计算流量的,流量一般都用1秒跑多少流量来统计。