贝利信息

Python中换行字符_Python字符串中的换行字符处理技巧

日期:2026-01-09 00:00 / 作者:幻夢星雲
Python中换行符在内存中统一为\n,但文件读写时受平台和newline参数影响:Windows文本模式自动转\r\n,Linux/macOS保持\n;splitlines()比split('\n')更安全,能处理各种换行符。

Python中换行符到底是\n还是\r\n

取决于你运行的系统和字符串来源。Python在内存中统一用\n表示换行,但写入文件或与外部交互时,会受newline参数和平台影响。Windows默认文本模式下print()f.write()会自动把\n转成\r\n;Linux/macOS保持\n不变。

常见误判场景:

splitlines()split('\n')更安全

str.splitlines()专为换行设计,能正确处理\n\r\n\r\v\f等所有Unicode行边界,且默认不保留换行符;而split('\n')只切\n,遇到\r\n会留下末尾的\r

text = "line1\r\nline2\nline3"
print(text.split('\n'))      # ['line1\r', 'line2', 'line3']
print(text.splitlines())   # ['line1', 'line2', 'line3']

额外注意点:

写文件时控制换行符用newline参数

这是最容易被忽略的关键参数。直接写f.write('a\nb')时,如果文件以文本模式打开(默认),Python会根据系统自动转换换行符。要强制输出\n,必须显式指定newline=''

with open('out.txt', 'w', newline='') as f:
    f.write('line1\nline2')  # 确保写入的是 \n,不是 \r\n

对比:

读文件时newline=None(默认)启用通用换行支持;设为''则关闭转换,原样返回所有换行符。

正则匹配换行时别漏掉re.DOTALL

.默认不匹配\n,所以re.search('a.b', 'a\nb')匹配失败。多数人第一反应是改用[\s\S],但更规范的做法是加re.DOTALL标志:

import re
text = "start\nmiddle\nend"
re.search(r'start.*end', text)           # None(默认不跨行)
re.search(r'start.*end', text, re.DOTALL)  # Match object

其他相关点:

跨平台处理换行最麻烦的往往不是语法,而是混用不同来源的字符串(用户输入、网络响应、文件读取)又没做标准化。建议在数据入口处统一用str.replace('\r\n', '\n').replace('\r', '\n')归一化,后续逻辑就能专注业务,不用反复判断换行符类型。