3 분 소요

image



Ⅰ. Stream API에 대한 이해

Stream API에 대한 소개

Java는 객체지향 언어이기 때문에 기본적으로 함수형 프로그래밍이 불가능하다.
(함수형 프로그래밍에 대해 이해가 부족하다면 이 포스팅를 참고하길 바란다.
하지만 JDK8부터 Stream API와 람다식, 함수형 인터페이스 등을 지원하면서 Java를 이용해 함수형으로 프로그래밍할 수 있는 API들을 제공해주고 있다. 그 중에서 Stream API는 데이터를 추상화하고, 처리하는데 자주 사용되는 함수들을 정의해두었다.
여기서 데이터를 추상화했다는 것은 데이터의 종류에 상관없이 같은 방식으로 데이터를 처리할 수 있다는 것을 의미하며, 그에 따라 재사용성을 높일 수 있다.

예를 들어 주어진 배열이나 리스트의 데이터를 정렬된 상태로 출력하고자 한다고 하자. Stream API를 사용하지 않은 경우 다음과 같이 코드를 작성할 수 있다.

// Stream 사용 전
String[] nameArr = {"IronMan", "Captain", "Hulk", "Thor"};
List<String> nameList = Arrays.asList(nameArr);

// 원본의 데이터가 직접 정렬됨
Arrays.sort(nameArr);
Collections.sort(nameList);

for (String str: nameArr) { 
    System.out.println(str);
}

for (String str : nameList) {
    System.out.println(str);
}

위의 코드들로 충분히 괜찮은 코드들이다. 하지만 이를 더욱 간결하고 가독성있게 정리할 수 있으며, 원본의 데이터에 변형을 가하지 않는 방법이 있다며 그것은 분명 더욱 좋은 코드일 것이다.

Java의 Stream API는 원본의 데이터에 변경 없이 위의 코드를 더욱 간략하게 작성하는 방법을 제공하고 있다. 위의 내용을 함수형으로 리팩토링하면 다음과 같이 작성할 수 있다.

// Stream 사용 후
String[] nameArr = {"IronMan", "Captain", "Hulk", "Thor"};
List<String> nameList = Arrays.asList(nameArr);

// 원본의 데이터가 아닌 별도의 Stream을 생성함
Stream<String> nameStream = nameList.stream();
Stream<String> arrayStream = Arrays.stream(nameArr);

// 복사된 데이터를 정렬하여 출력함
nameStream.sorted().forEach(System.out::println);
arrayStream.sorted().forEach(System.out::println);

이처럼 Stream API를 활용하면 코드의 라인수도 줄이고, 가독성도 높일 수 있다. 이러한 많은 장점을 지닌 Stream API에 대해 자세히 살펴보도록 하자.

Stream API의 특징

  • 원본의 데이터를 변경하지 않는다.
  • 일회용이다.
  • 내부 반복으로 작업을 처리한다.

1. 원본의 데이터를 변경하지 않는다.

Stream API는 원본의 데이터를 조회하여 원본의 데이터가 아닌 별도의 요소들로 Stream을 생성한다. 그렇기 때문에 원본의 데이터로부터 읽기만 할 뿐이며, 정렬이나 필터링 등의 작업은 별도의 Stream 요소들에서 처리가 된다.

List<String> sortedList - nameStream.sorted().collect(Collections.toList());

2. Stream은 일회용이다.

Stream API는 일회용이기 때문에 한번 사용이 끝나면 재사용이 불가능하다. Stream이 또 필요한 경우에는 Stream을 다시 생성해주어야 한다. 만약 닫힌 Stream을 다시 사용한다면 IllegalStateException이 발생하게 된다.

userStream.sorted().forEach(System.out.print);

// 스트림이 이미 사용되어 닫혔으므로 에러 발생
int count = userStream.count();

// IllegalStateException 발생
java.lang.IllegalStateException: stream has already been operated upon or closed
    at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:229)
    at java.util.stream.ReferencePipeline.noneMatch(ReferencePipeline.java:459)

3. 내부 반복으로 작업을 처리한다.

Stream을 이용하면 코드가 간결해지는 이유 중 하나는 ‘내부 반복’ 때문이다. 기존에는 반복문을 사용하기 위해서 for이나 while 등의 같은 문법을 사용해야 했지만, stream에서는 그러한 반복 문법을 메소드 내부에 숨기고 있기 때문에, 보다 간결한 코드의 작성이 가능하다.

// 반복문이 forEach라는 함수 내부에 숨겨져 있다.
nameStream.forEach(System.out.println);



Ⅱ. Stream API의 연산 종류

Stream은 데이터를 처리하기 위해 다양한 연산들을 지원한다. Stream이 제공하는 연산을 이용하면 복잡한 작업들을 간단히 처리할 수 있는데, 스트림에 대한 연산은 크게 생성하기, 가공하기, 결과만들기 3가지 단계로 나눌 수 있다.

1. 생성하기

  • Stream 객체를 생성하는 단계
  • Stream은 재사용이 불가능하므로, 닫히면 다시 생성해주어야 한다.

Stream 연산을 하기 위해서는 먼저 Stream 객체를 생성해주어야 한다. 배열, 컬렉션, 임의의 수, 파일 등 거의 모든 것을 가지고 스트림을 생성할 수 있다. 여기서 주의할 점은 연산이 끝나면 Stream이 닫히기 때문에, Stream이 닫혔을 경우 다시 Stream을 생성해야 한다는 것이다.

2. 가공하기

  • 원본의 데이터를 별도의 데이터로 가공하기 위한 중간 연산
  • 연산 결과를 Stream으로 다시 반환하기 때문에 연속해서 중간 연산을 이어갈 수 있다.

가공하기 단계는 원본의 데이터를 별도의 데이터로 가공하기 위한 중간 연산의 단계이다. 어떤 객체의 Stream을 원하는 형태로 처리할 수 있으며, 중간 연산의 반환값은 Stream이기 때문에 필요한 만큼 중간 연산을 연결하여 사용할 수 있다.

3. 결과 만들기

  • 가공된 데이터로부터 원하는 결과를 만들기 위한 최종 연산
  • Stream의 요소들을 소모하면서 연산이 수행되기 때문에 1번만 처리가능하다.

Stream 연산 예시 코드

List<String> myList = Arrays.asList("a1", "a2", "b1", "c2", "c1");

myList
    .stream()                           // 생성하기
    .filter(s -> s.startsWith("c"))     // 가공하기
    .map(String::toUpperCase)           // 가공하기
    .sorted()                           // 가공하기
    .count()                            // 결과만들기

위의 코드에서 먼저 stream()을 통해 Stream 객체를 생성하고 있다. 그리고 원하는 데이터를 필터링하고, 변형하고, 정렬하는 중간 연산을 진행하고 있다. 이렇듯 중간 연산이 세미콜론 없이 여러 번 연결되는 것은 해당 중간 연산이 Stream을 반환하기 떄문이다. 이렇게 Stream 연산이 연결된 것을 연산 파이프라인이라고 하기도 한다. 최종 연산에서는 필요한 결과를 만들 수 있다. 위의 예제에서는 count()를 통해 남아 있는 요소의 갯수를 최종적으로 반환하도록 되어 있다. 물론 forEach와 같이 값을 반환하지 않는 최종 연산도 존재한다. 위의 예시 코드에서 확인 가능하듯 Stream 연산들은 매개변수로 함수형 인터페이스(Functional Interface)를 받도록 되어있다. 그렇기 때문에 Stream API의 연산들에 대해 알아보기 전에 함수형 인터페이스와 람다식을 먼저 자세히 알아보도록 하자.



관련 포스팅

  1. Stream API에 대한 이해 (1/5)
  2. 람다식(Lambda Expression)과 함수형 인터페이스(Functional Interface) (2/5)
  3. Stream API의 활용 및 사용법 - 기초 (3/5)
  4. Stream API의 활용 및 사용법 - 고급 (4/5)
  5. Stream API 연습문제 풀이 (5/5)




참고자료

  • https://morioh.com/p/6b859b7a83e6
  • https://mangkyu.tistory.com/112

태그:

카테고리:

업데이트:

댓글남기기