java8 Streams API 详解(上) -- streams 入门

2020-09-19 22:50:07   最后更新: 2020-09-19 22:50:07   访问数量:112




streams api

 

多年前,我们在介绍 java8 新特性的时候,提到过作为 java8 一个亮点的新特性 -- streams api:

java8 新特性

 

但上文中只是简单介绍了 streams api 的基本用法,事实上,streams api 拥有十分强大的功能,能够大幅缩减编码量,有效提升编码效率与代码质量,达到事半功倍的效果。

本文我们就来详细介绍一下 streams api,来看看他究竟能做到多么强大

 

2.1 Streams API 能做什么

Streams API 是对 java 中集合对象功能的增强,他可以让集合的操作变得更加便利、高效

他会自动通过并发执行的方式优化大批量数据集合的聚合操作,同时,结合另一个 java8 的新特性 -- Lambda 表达式,可以极大地提升编程效率,增加代码可读性

基于 jvm 底层的硬件优化,streams api 可以十分方便的利用多核性能,达到并发编程的效果,传统的并发编程往往因为其复杂性十分容易出错,但使用 streams api 则无需担心这个问题

 

2.2 Stream 是什么

stream 顾名思义,就是“流”,这个名字突出了集合对象流式处理的含义

说到“流式处理”,读者朋友们肯定并不陌生,在 java 中,迭代器就是一种通用的流式处理手段,stream 可以看成是迭代器的高级版本,他不保存数据,他只负责执行预定的算法和计算过程,因此 stream 很像是迭代器的函数式编程版本

和迭代器一样,stream 也是对集合单向遍历一次,并且不可以回头往复,但不同的是,stream 支持了这个过程的自动并发执行,并且将遍历过程变得更加简洁易读

 

2.3 Stream 的构成

一个流的使用通常包括三个基本步骤:

  1. 获取数据源
  2. 数据转换 -- Intermediate
  3. 执行操作 -- Terminal

 

其中,数据转换操作是以数据源为输入,进行一些操作后返回一个新的流进行接下来操作,数据转换操作可以多次进行,从而让整个流变成一个流管道:

 

 

最终,一个流只能有一个 terminal 执行操作,作为流的终结,他生成一个结果或一个 side effect

事实上,真正触发流的遍历操作的就是 terminal 操作的执行

 

除此以外,如果流的输入是一个无限大的集合,那么还必须具有 short-circuiting 操作,他有两个作用:

  1. 对于一个 intermediate 操作,如果它接受的是一个无限大(infinite/unbounded)的 Stream,但返回一个有限的新 Stream
  2. 对于一个 terminal 操作,如果它接受的是一个无限大的 Stream,但能在有限的时间计算出结果

 

2.4 流能做什么

知道了 Streams Api 的构成,你可能会很好奇,Streams 究竟可以做到哪些实用的事情呢?对我们的编程又有多大的帮助呢?

 

下面来看一个小例子,假设我们有一个学生集合,需要对这个集合中分数大于 80 的对象按照他们的 score 进行排序,并且返回由这些对象的 id 组成的 List<Long> 类型集合,我们应该怎么做呢?

 

2.4.1 java7 版本

private static List<Long> sortStudents(List<Student> students) { List<Student> studentsOverThreshold = new ArrayList<>(); for (Student student: students) { if (student.getScore() >= THRESHOLD) { studentsOverThreshold.add(student); } } Collections.sort(studentsOverThreshold, new Comparator<Student>() { @Override public int compare(Student student1, Student student2) { return student2.getScore().compareTo(student1.getScore()); } }); List<Long> idResultList = new ArrayList<>(); for (Student student : studentsOverThreshold) { idResultList.add(student.getId()); } return idResultList; }

 

 

虽然整个流程中规中矩,但从可读性上来说并不是十分的一目了然

 

2.4.2 Streams API 版本

下面,我们使用 Streams API 来优化上面的代码,整个流程就会显得简单了很多:

private static List<Long> sortStudents(List<Student> students) { return students.stream() .filter(t -> t.getScore() >= THRESHOLD) .sorted(Comparator.comparingLong(Student::getScore).reversed()) .map(Student::getId) .collect(Collectors.toList()); }

 

 

相较于上述代码,Streams API 版本的代码显然更加简洁和清晰,可读性、可维护性都有了显著提升,并且如果使用并发模式,Streams API 版本还会在性能上得到增强

 

由此可见,如果熟练掌握了 Streams API,那么在你的开发过程中,效率会大幅提升,Streams API 的灵活运用也会让你的程序拥有更好的可维护性

 

流的创建方式有很多种:

 

3.1 从 Collection 和数组创建流

  1. Collection.stream()
  2. Collection.parallelStream()
  3. Arrays.stream(T array)
  4. Stream.of(T array)

 

  • 额外一提,java8 除了通用的 Stream 外,还为基本数值类型提供了 IntStream、LongStream、DoubleStream 三种包装类型可供使用

 

3.2 通过 BufferedReader 读取

  • java.io.BufferedReader.lines()

 

3.3 通过静态工厂生成流

  1. java.util.stream.IntStream.range()
  2. java.nio.file.Files.walk()

 

3.4 其他创建方式

  1. 自定义构建 -- java.util.Spliterator
  2. 随机数流 -- Random.ints()
  3. 位操作流 -- BitSet.stream()
  4. 字符流 -- Pattern.splitAsStream(java.lang.CharSequence)
  5. jar 文件内容流 -- JarFile.stream()

 

上面我们已经提到,流共有三种操作:

  1. Intermediate 操作
  2. Short-Circuiting 操作
  3. Terminal 操作

 

下面,我们就来一一介绍一下这三大类操作中具体的那些操作

 

4.1 Intermediate 操作

Intermediate 操作的输入是已经创建好的流,输出是进行转换后的流,主要有以下操作:

  • map -- 将输入流转换为另一个流
  • mapToInt/mapToLong -- 将转换结果的原始数值自动包装,转换后生成一个 IntStream/LongStream
  • flatMap -- 转换后生成多于原集合数量的新元素流
  • filter -- 过滤只保留符合条件的元素
  • distinct -- 去重
  • sorted -- 排序
  • peek -- 执行一个无返回的操作,不影响原来的流
  • limit -- 保留流的前 N 个元素,可以用于无限元素的流,作为 Short-circuiting 操作
  • skip -- 跳过流的前 N 个元素
  • parallel -- 让流并行化
  • sequential -- 让流串行化
  • unordered -- 删除流的有序标记,不强制让流有序

 

4.2 Terminal 操作

在一系列 Intermediate 操作之后,一定需要一个终极操作,来对流中的数据做最终的处理,这个“终极操作”就是 Terminal 操作,它包括:

  • forEach -- 对流中每个元素执行相同的操作
  • forEachOrdered -- 对流中每个元素有序地执行相同的操作
  • toArray -- 将流转换为数组返回
  • reduce -- 将流中所有数据汇总执行一个操作,返回一个值
  • collect -- 将流中所有参数汇总为一个集合并返回
  • min -- 求流中数据最小值
  • max -- 求流中数据最大值
  • count -- 计算流中的数据量
  • anyMatch -- 有任何元素命中规则则返回 true,可以用于无限元素的流,作为 Short-circuiting 操作
  • allMatch -- 全部元素均命中规则时返回 true,可以用于无限元素的流,作为 Short-circuiting 操作
  • noneMatch -- 全部元素均未命中规则时返回 true,可以用于无限元素的流,作为 Short-circuiting 操作
  • findFirst -- 返回首个命中规则的元素,可以用于无限元素的流,作为 Short-circuiting 操作
  • findAny -- 返回所有命中规则的元素,可以用于无限元素的流,作为 Short-circuiting 操作
  • iterator -- 返回由流数据构造的迭代器

 

4.3 Short-circuiting

当你要处理无限数据的集合时,通过 short circuiting 操作让程序能够在有限的时间内返回显然是非常必要的

包括上述已经标记过可以用作 Short-circuiting 操作的:

  • anyMatch
  • allMatch
  • noneMatch
  • findFirst
  • findAny
  • limit

 

本文我们通过一个例子看到了 Streams API 是如何使用的,以及列出了 java8 中 Streams API 包含的所有操作

那么,这些操作具体应该如何使用呢?敬请关注下一篇文章,详细介绍每一种操作

 

欢迎关注微信公众号,以技术为主,涉及历史、人文等多领域的学习与感悟,每周三到七篇推文,只有全部原创,只有干货没有鸡汤

 

 

https://developer.ibm.com/zh/articles/j-lo-java8streamapi/

 

 






      streams      集合      collection      java8     


京ICP备15018585号