贝利信息

C++如何使用正则表达式?(std::regex示例)

日期:2026-01-14 00:00 / 作者:穿越時空
C++11起标准库提供std::regex支持模式匹配、查找与替换,但部分编译器实现不完整;regex_match要求全串匹配,regex_search用于子串查找,regex_replace支持捕获组引用;需注意转义、异常及性能。

从 C++11 开始,标准库提供了 std::regex(定义在 头文件中),可用于模式匹配、查找、替换等操作。它语法接近 Perl 风格(ECMAScript 默认),但功能比 Boost.Regex 简化,且部分编译器(如早期 MSVC 或某些 libstdc++ 版本)实现不完整或性能较差,使用前建议确认标准库支持情况。

基本匹配:

判断字符串是否符合模式

std::regex_match 检查整个字符串是否完全匹配正则表达式:

#include 
#include 
#include 

int main() {
    std::string s = "123-456-7890";
    std::regex pattern(R"(\d{3}-\d{3}-\d{4})"); // 匹配电话格式

    if (std::regex_match(s, pattern)) {
        std::cout << "格式正确\n";
    }
}

注意:regex_match 要求**全串匹配**;若只需子串匹配,应改用 regex_search

查找子串:提取所有匹配内容

std::regex_search 可在字符串中查找第一个匹配;配合迭代器和 std::sregex_iterator 可遍历全部匹配:

示例:提取所有邮箱地址

std::string text = "联系我:a@b.com 或 x.y@domain.org";
std::regex email_pat(R"(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b)");
auto begin = std::sregex_iterator(text.begin(), text.end(), email_pat);
auto end = std::sregex_iterator();

for (auto it = begin; it != end; ++it) {
    std::cout << "找到邮箱:" << it->str() << "\n";
}

替换文本:简单替换与带捕获组的重构

std::regex_replace 返回替换后的新字符串(原字符串不变):

示例:把日期格式 YYYY-MM-DD 转成 DD/MM/YYYY

std::string date = "2025-12-25";
std::regex date_pat(R"((\d{4})-(\d{2})-(\d{2}))");
std::string result = std::regex_replace(date, date_pat, "$3/$2/$1");
// result == "25/12/2025"

常见注意事项与建议

正则在 C++ 中易出错,需特别留意:

实际项目中若需更强大、稳定或跨平台的正则能力,可考虑 Boost.Regex 或 PCRE2 绑定,但对简单验证和解析,std::regex 已足够轻量可用。