贝利信息

Go语言如何实现文件压缩解压_Golang工具项目

日期:2026-01-18 00:00 / 作者:P粉602998670
Go用archive/zip压缩文件打不开,主因是header.Name未转义路径分隔符(需将\替换为/)、未调用zipWriter.Close()致EOCD缺失;解压时须用filepath.Clean校验路径防穿越;大文件需流式处理避免内存溢出。

Go 语言用 archive/zip 压缩文件时,为什么生成的 zip 打不开?

常见原

因是没正确设置 zip.FileHeader.Name,或忽略了路径分隔符转换。Windows 下路径是 \,而 ZIP 规范强制要求使用 /。直接写入本地路径会导致解压失败或目录结构错乱。

fh, _ := zip.FileInfoHeader(fi)
fh.Name = strings.ReplaceAll(filePath, "\\", "/") // 关键
fh.Name = strings.TrimPrefix(fh.Name, basePath+"/")
w, _ := zw.CreateHeader(fh)
io.Copy(w, f)

解压 zip 到指定目录时,如何防止路径穿越(path traversal)攻击?

用户提供的 zip 包可能包含恶意路径如 ../../../etc/passwd,直接用 header.Name 创建文件会覆盖系统关键位置。必须做白名单校验。

cleanName := filepath.Clean(header.Name)
if strings.Contains(cleanName, "..") || strings.HasPrefix(cleanName, "/") {
    return fmt.Errorf("illegal path: %s", header.Name)
}
dstPath := filepath.Join(destDir, cleanName)
if !strings.HasPrefix(filepath.ToSlash(dstPath), filepath.ToSlash(destDir)+"/") {
    return fmt.Errorf("escaping from target dir: %s", header.Name)
}

需要同时支持 tar.gz 和 zip,该选 archive/tar 还是第三方库?

Go 标准库已完整支持 archive/tar + compress/gzip 组合,无需引入外部依赖。但要注意:tar 本身不压缩,gzip 是外层封装,解压时要先 gzip.NewReader,再传给 tar.NewReader

大文件压缩卡住或内存爆掉,怎么流式处理?

别把整个文件读进 []byte 再写入 zip —— 这会让内存占用飙升到文件大小的 2–3 倍。所有操作必须基于 io.Reader / io.Writer 流式完成。

真正容易被忽略的是错误传播:流式操作中任一环节出错(如磁盘满、权限不足),必须立刻中断并清理已创建的临时文件,否则留下残缺 zip 或空目录。