贝利信息

Golang如何进行微服务间的健康检查

日期:2026-01-06 00:00 / 作者:P粉602998670
微服务健康检查需区分/health(存活)和/ready(就绪)路径,前者轻量检测进程状态,后者带超时并发检查全量依赖并返回503;K8s探针须严格对应路径,避免无超时、缓存、错误码混用等坑。

Golang 微服务间的健康检查,**不是服务自己查自己,而是让其他服务(或基础设施)能快速、可靠地判断“你是否真的可用”**。关键在于暴露语义明确、响应迅速、可组合的 HTTP 接口,并区分 /health(存活)、/ready(就绪)两类探针。

为什么不能只用 http.StatusOK 简单返回 "OK"

单纯返回 200 + "OK" 只能说明进程没挂,但微服务真实可用性取决于依赖:数据库连不上、Redis 超时、下游 API 返回 503,服务其实已不可用。Kubernetes 的 readinessProbe 若仍把流量导过来,会导致请求堆积、雪崩。生产环境必须把依赖状态显式聚合进响应。

如何用 net/http 实现可组合的依赖检查器

硬编码一堆 if db.Ping() != nil 很难维护。推荐用函数类型 Checker 抽象每个依赖的探测逻辑,便于复用、测试和开关:

type Checker func() (string, error)

func DBChecker(db *sql.DB) Checker {
    return func() (string, error) {
        ctx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
        defer cancel()
        if err := db.PingContext(ctx); err != nil {
            return "database", fmt.Errorf("ping failed: %w", err)
        }
        return "database", nil
    }
}

func RedisChecker(client *redis.Client) Checker {
    return func() (string, error) {
        ctx, cancel := context.WithTimeout(context.Background(), 1*time.Second)
        defer cancel()
        if _, err := client.Ping(ctx).Result(); err != nil {
            return "redis", fmt.Errorf("ping failed: %w", err)
        }
        return "redis", nil
    }
}

这样,/ready 处理器只需遍历 map[string]Checker 并并发执行,既清晰又可控。

Kubernetes 探针配置与路径分工必须匹配

Go 服务暴露了 /health/ready,但若 K8s 的 livenessProbereadinessProbe 都指向同一个路径,就失去了语义分离的意义。

YAML 示例片段:

livenessProbe:
  httpGet:
    path: /health
    port: 8080
  initialDelaySeconds: 30
  periodSeconds: 10
readinessProbe:
  httpGet:
    path: /ready
    port: 8080
  initialDelaySeconds: 5
  periodSeconds: 5

常见踩坑:超时、缓存、错误码混用

健康检查接口看似简单,但线上最常出问题的恰恰是细节:

真正健壮的微服务健康检查,核心就三点:路径语义分明、依赖探测带超时、响应状态码严格对齐基础设施约定。别把它当成一个“加个路由”的小任务——它是一道防止级联故障的关键闸门。