Java Stream API 是数据处理管道,支持懒加载的中间操作(如filter、map、sorted)和触发执行的终端操作(如collect、forEach);不可复用,不适用于存储,慎用parallelStream。
Java Stream API 不是用来替代集合或存储数据的,它本质是一个**数据处理管道**——你把数据源“塞进去”,用一串声明式操作“加工”,最后用终端操作“取出来”或“消费掉”。能做什么?一句话:把原本要写 for 循环 + if + new ArrayList() 的事,变成可读、可链、可并行的一行逻辑。
filter、map、sorted 这些中间操作到底在干啥?它们不立即执行,只记下“等会儿要这么处理”,属于懒加载。只有遇到 collect、forEach、count 这类终端操作时,整条链才真正跑起来。
filter 是守门员:只放行满足 Predicate 条件的元素(比如 n -> n % 2 == 0)map 是翻译官:把每个元素按规则转成另一个值(比如 String::length 把字符串变数字)sorted 是排序器:默认按自然序,也可传 Comparator 自定义(注意:对引用类型排序前确保 compareTo 或 Comparator 不抛 NullPointerException)List
numbers = Arrays.asList(3, 1, 4, 1, 5); List evensSorted = numbers.stream() .filter(n -> n % 2 == 0) // 留下 4 .map(n -> n * 2) // 变成 8 .sorted() // 单元素,效果不显,但合法 .collect(Collectors.toList());
collect 是终点,但不是万能终点它负责把流“收口”成你要的结果,但选错收集器会出问题:
List?用 Collectors.toList() —— 它不保证线程安全,也不保证返回的是 ArrayList(可能是不可变实现)Collectors.toSet() 更合适,但注意元素必须正确重写 equals 和 hashCode
Collectors.summingInt(Person::getAge) 比手写 reduce 直观且不易空指针Collectors.collectingAndThen(..., Objects::requireNonNull) 这类包装——先判空再 collect 更稳妥parallelStream()?不是“用了就快”,而是“大集合 + 无状态计算 + CPU 密集”才值得开并行:
System.out.println、数据库连接等副作用?并行下结果不可预测,直接禁用LinkedList?并行性能可能暴跌——因为 Spliterator 切分效率低ArrayList 或数组出发,并确认所有中间操作是无状态的(比如不用 peek 改外部计数器)最常被忽略的一点:Stream 不能复用。调一次 collect 后再调 forEach,会直接抛 IllegalStateException。需要多次消费?要么重新生成 Stream(list.stream() 再来一遍),要么先 collect 成集合再反复用——别试图“缓存 Stream 对象”。