std::unordered_set查找快因底层哈希表,平均O(1);自定义类型须特化std::hash并重载==;insert返回pair,find返回iterator;需用reserve/rehash预分配桶避免rehash卡顿。
因为底层是哈希表,平均时间复杂度 O(1);不像 std::set 那样用红黑树、要 O(log n)。但注意:最坏情况(大量哈希冲突)会退化到 O(n),所以别随便用自定义类型又不写好 std::hash 特化。
直接用 insert() 和 find(),返回值类型不同,容易混淆:
insert() 返回 std::pair,second 是是否新插入find() 返回 iterator,查不到时等于 end()
operator[] —— unordered_set 没下标访问std::unordered_sets; s.insert(42); // OK s.insert(42); // 无效果,返回 {已有迭代器, false} auto it = s.find(42); // it != s.end() 表示找到了 if (it != s.end()) { std::cout << *it << "\n"; // 输出 42 }
否则编译报错,典型错误信息:error: call to implicitly-deleted default constructor of 'std::hash。两个条件缺一不可:
std::hash,重载 operator() 返回 size_t
operator==,也可传入第 3 个模板参数 EqualKey)struct Point {
int x, y;
bool operator==(const Point& other) const {
return x == other.x && y == other.y;
}
};
namespace std {
template<>
struct hash {
size_t operator()(const Point& p) const {
return hash{}(p.x) ^ (hash{}(p.y) << 1);
}
};
}
std::unordered_set pts;
pts.insert({1, 2});
插入导致负载因子超限会触发 rehash,所有元素重新散列,瞬间卡顿。可提前预留空间避免:
reserve(n) 预分配至少能存 n 个元素的桶数(不是直接设 bucket_count)max_load_factor() 默认是 1.0,设太小会频繁 rehash,太大则冲突增多rehash() 手动扩桶时,传入的是桶数量(bucket_count),不是元素数如果事先知道大概有 1000 个元素,建议:s.reserve(1024) 或 s.rehash(1024),而不是 s.reserve(1000) —— 因为内部桶数通常是 2 的幂。