本篇文章1306字,读完约3分钟
阿里云国际站经销商,主营阿里云,腾讯云,华为云,亚马逊aws,谷歌云gcp,微软云az,免费开户,代充值优惠大,联系客服飞机@jkkddd
对于绝大多数的分布式系统,不是每一条调用链都值得被可观测平台记录,因为其中包含大量重复的,低关注度的信息。因此需要引入采样技术降低整体可观测成本,并过滤对用户没有帮助的噪音。
调用链采样的基本原则是优先记录您最关心、最有可能访问的调用链。ARMS提供两种采样模式:
固定采样率
自适应采样
固定采样率
固定比例采样就是根据TraceId顺序号记录一定比例的调用链数据。例如,固定比例为10%,则每10条调用链数据记录1条。固定比例采样不会导致调用链数据本身不完整,要么保留整条链路数据,要么丢弃整条链路数据。
设置固定比例采样的操作步骤如下:
登录ARMS控制台,在左侧导航栏选择应用监控 > 应用列表。
在应用列表页面顶部选择目标地域,然后单击目标应用名称。
在左侧导航栏中单击应用设置,并在右侧页面单击自定义配置页签。
在采样率设置区域设置采样率。选择采样率模式为固定采样率,在采样率设置字段输入百分比的数字部分,例如输入10代表采样10%。
自适应采样
为了更进一步的降低使用成本,提高链路查询体验,阿里云可观测团队推出了自适应采样模式。与固定采样率不同,自适应采样通过引入多项采样命中策略,动态决定是否对一条链路进行采样,从而解决固定采样率在小采样率下的覆盖度问题以及大采样率下的成本问题。在大流量场景,以及业务流量变化比较大的场景,推荐您选择自适应采样模式。
自适应采样涉及的主要命中策略包括特定接口全采样、接口Top N采样、小流量兜底采样三种。
特定接口全采样指您可以通过自定义接口名、接口前后缀,来标记需要100%采样的接口。对于这些接口收到的请求,会触发整条链路的100%采样。由于特定接口全采样会造成采集数据量的大幅增加,请确保只对最重要的接口开启,或在必要的时候临时开启。
接口Top N采样使用变种LFU算法实现,在单位时间内只对每个接口的有限条目请求进行采样,其目的是为了保证数据采集规模不随接口的实际流量而线性增长。
小流量兜底采样是指在单位时间内,每个接口都至少保证有1次采样。这样可以在流量比较低的时候,对每个业务接口都确保记录最有价值的特征信息。
设置自适应采样的操作步骤如下:
登录ARMS控制台,在左侧导航栏选择应用监控 > 应用列表。
在应用列表页面顶部选择目标地域,然后单击目标应用名称。
在左侧导航栏中单击应用设置,并在右侧页面单击自定义配置页签。
在采样率设置区域设置采样率。选择采样率模式为自适应采样,您可以自定义需要全采样的接口、接口前缀、接口后缀。
补充说明
为了避免大流量场景下因为链路采集影响业务正常运行,ARMS对探针每秒最大链路采集量进行了限制,默认为100。这个保护性措施对固定采样率和自适应采样都是生效的,您可以通过自定义配置的限流阈值修改探针每秒最大链路采集量。
下一篇:没有了