使用go test -bench可对比算法性能,需编写规范的Benchmark函数,以Benchmark开头并接收*testing.B参数,在循环中执行被测代码。函数命名应体现算法差异,如BenchmarkSearchLinear与BenchmarkSearchBinary。初始化操作应放在b.ResetTimer()前或用b.StopTimer()/b.StartTimer()控制计时范围,避免干扰结果。调用b.ReportAllocs()以获取内存分配数据。为确保公平,所有测试应使用相同预生成数据、相同环境和编译条件,可通过全局变量或init()初始化。运行时设置GOGC=off减少GC影响,固定CPU频率提升稳定性。建议多次运行(-count=5)取中位数,并结合-benchmem查看内存表现。输出中ns/op表示每次操作耗时,B/op为分配字节数,allocs/op为分配次数,均越低越好。后缀数字代表GOMAXPROCS值,影响并发性能。进阶用法包括生成CPU和内存profile进行热点分析,使用benchstat工具对比测试结果显著性,以及通过b.Run划分不同输入规模,观察性能随数据量变化趋势。关键细节在于控制变量,否则可能误测setup代码而非算法本身。
直接用 go test -bench 就能对比不同算法的性能,关键在于写好 Benchmark 函数、控制变量、看懂 ns/op 和内存分配数据。
Benchmark 函数必须以 Benchmark 开头,参数是 *testing.B,且必须在循环中调用待测代码(b.N 次)。Go 会自动调整 b.N 让测试时间稳定在约 1 秒。
BenchmarkSearchLinear 和 BenchmarkSearchBinary
b.ResetTimer() 前;若必须初始化,用 b.StopTimer() / b.StartTimer() 控制计时范围b.ReportAllocs(),它会显示每次操作的内存分配次数和字节数相同输入、相同环境、相同编译条件,才能看出算法本身差异。
init() 初始化),避免每次生成带来额外开销GOGC=off(如 GOGC=off go test -bench=.),尤其当算法涉及大量短生命周期对象时cpupower frequency-set -g performance),避免动态调频影响结果稳定性-count=5 多次运行取中位数,再配合 -benchmem 查看内存表现执行 go test -bench=. -benchmem 后,输出类似:
BenchmarkSearchLinear-8 10000000 124 ns/op 0 B/op 0 allocs/op BenchmarkSearchBinary-8 20000000 62.1 ns/op 0 B/op 0 allocs/op
124 ns/op:每次操作平均耗时 124 纳秒,数值越小越快0 B/op:每次操作分配 0 字节内存,越少越好;高分配常意味着频繁 GC 压力0 allocs/op:每次操作零次内存分配,比字节数更反映逃逸和堆分配行为-8 表示 GOMAXPROCS=8,多核并行能力也会影响结果,必要时用 GOMAXPROCS=1 测试单核表现单纯看 ns/op 不够,需结合工具深挖原因。
go test -bench=. -cpuprofile=cpu.out 生成 CPU profile,再用 go tool pprof cpu.out 分析热点函数-memprofile=mem.out -memprofilerate=1 抓内存分配栈
benchstat(go install golang.org/x/perf/cmd/benchstat@latest)对比多次测试结果,自动判断性能提升是否显著(如 benchstat old.txt new.txt)Benchmark 时可嵌套子测试(b.Run),按输入规模分组(如 1e3, 1e5, 1e6),观察算法随数据量增长的变化趋势基本上就这些。不复杂但容易忽略细节,尤其是初始化位置和 GC 干扰——一不留神,测的就不是算法,而是你的 setup 代码了。