开启/关闭可观测性系统(新)
为便于后续排查故障、定位问题,请在正式上线使用前开启可观测。
一、前置约束
适用版本:ONES版本 >= 6.5.0 || 6.1 LTS >= 6.1.94
二、开启可观测性系统
1.修改配置
执行下面命令进入运行中的 ones 容器
ones-ai-k8s.sh
修改 config/private.yaml 配置文件
# 添加如下配置
onesTelemetryExportEndpoint: "https://hybridcloud.ones.cn/telemetry/otlp/"
onesTelemetryExportLogEnabled: true
otlpExportGrpcAddr: "otlp-collector-service.ones-telemetry:4317"
grafanaLocalNodePort: "31380"
当不启用混合云上报时, 用如下配置:
onesTelemetryClickhouseEnable: true
otlpExportGrpcAddr: "otlp-collector-service.ones-telemetry:4317"
grafanaLocalNodePort: "31380"
默认访问 http://IP:31380 grafana 页面无账号密码,如需安全配置,请再添加如下2个配置:
grafanaLocalBasicAuthUser: "" # example: "admin"; Grafana BasicAuth username.
grafanaLocalBasicAuthPassword: "" # example: "sToIgoAV4m2ho"; for password admin run: openssl passwd -6 admin
2.卸载旧组件(仅升级场景)
从 6.5.0 或 LTS 6.1.94 版本以下升级上来的环境,需要先卸载旧组件:
make delete-ones-logging RETAIN_DATA=false
make delete-monitoring-system RETAIN_DATA=false
make delete-prometheus RETAIN_DATA=false
make delete-fluent-bit RETAIN_DATA=false
make delete-ones-alert RETAIN_DATA=false
# 若集群使用本地存储,且无需保留监控数据,可以执行下面命令删除数据
# 默认 ONES 数据目录是 /data/ones
rm -r /data/ones/ones-local-storage/ones-logging/ones-logging
rm -r /data/ones/ones-local-storage/others-static-pvc/monitoring-system
3. 安装可观测性系统
make setup-ones-telemetry
make setup-ones