Blog
스터디
CS Study with SON
2주차
가비지 컬렉션

출처 - https://github.com/jmxx219/CS-Study (opens in a new tab)

가비지 컬렉션 Garbage Collection(GC)


가비지 컬렉션이란?

  • Heap 영역에서 동적으로 할당했던 메모리 중 사용하지 않는 메모리 객체(garbage)를 모아 주기적으로 제거하는 프로세스

  • 자바는 JVM에 탑재된 가비지 컬렉터가 메모리 관리를 대행하기에 개발자 입장에서 메모리 관리와, 메모리 누수(Memory Leak) 문제에 대해 완벽히 관리하지 않아도 된다.

  • 특정 개체가 garbage 인지 판단하기 위해서 도달능력(Reachability) 이라는 개념을 사용한다

  • 객체에 레퍼런스가 있으면 Reachable로 구분되고, 객체에 유효한 레퍼런스가 없으면 Unreachable로 구분하고 가비지 컬렉션의 대상이 된다.

가비지 컬렉션의 장점

  • 생산성 향상: C / C++ 언어에서 프로그래머가 수동으로 메모리를 할당, 해제를 했던 것에 반해 JVM의 가비지 컬렉터가 자동으로 메모리를 관리해주기 때문에 개발자는 개발에 집중 할 수 있다.
  • 메모리 누수 방지: Garbage Collector가 메모리 관리를 대행하기 때문에 메모리 누수를 방지하여 안정성을 높인다.

가비지 컬렉션의 단점

  • 오버 헤드: GC가 실행될 때 성능 저하가 발생할 수 있다.(stop-the-world)
  • 예측 불가능: GC가 예측 불가능한 시점에 실행 될 수 있기 때문에 이 또한 성능문제로 귀결될 수 있다.

stop-the-world

  • GC을 실행하기 위해 JVM이 애플리케이션 실행을 멈추는 것
  • stop-the-world가 발생하면 GC를 실행하는 스레드를 제외한 나머지 스레드는 모두 작업을 멈춘다.
  • 어떤 GC 알고리즘을 사용하더라도 stop-the-world 는 발생하고, GC 튜닝이란 이 stop-the-world 시간을 줄이는 것

weak generational hypothesis

자바 가비지 컬렉터는 두 가지 가설(전제 조건)하에 만들어졌다.

  • 대부분의 객체는 금방 접근 불가능 상태(unreachable)가 된다.
  • 오래된 객체에서 젊은 객체로의 참조는 아주 적게 존재한다.

Heap 영역의 구성

Young Generation과 Old Generation
  • Young Generation 영역

    • Eden 영역, 2개의 Survival 영역
    • 새롭게 생성한 객체의 대부분이 여기에 위치한다.
    • 대부분의 객체가 금방 접근 불가능 상태가 되기 때문에 많은 객체가 Young 영역에 생성되었다가 사라진다.
    • 이 영역에서 객체가 사라질 때 minor GC가 발생한다고 한다.
  • Old Generation 영역

    • 접근 불가능 상태로 되지 않아 Young 영역에서 살아남은 객체가 여기로 복사된다.
    • 대부분 Young 영역보다 크게 할당하며, 크기가 큰 만큼 Young 영역보다 GC는 적게 발생한다.
    • 이 영역에서 객체가 사라질 때 Major GC 혹은 Full GC가 발생한다고 한다.

Garbage Collection 과정

Minor GC - Young Generation

  • 새로 생성한 대부분의 객체는 Eden 영역에 위치한다.
  • Eden 영역에서 GC가 한 번 발생한 후 살아남은 객체는 Survivor 영역 중 하나로 이동된다.
  • Eden 영역에서 GC가 발생하면 이미 살아남은 객체가 존재하는 Survivor 영역으로 객체가 계속 쌓인다.
  • 하나의 Survivor 영역이 가득 차게 되면 그 중에서 살아남은 객체를 다른 Survivor 영역으로 이동한다.
  • 그리고 이전에 가득찬 Survivor 영역은 아무 데이터도 없는 상태가 된다.
  • 이 과정을 반복하다가 계속해서 살아남아 있는 객체는 Old 영역으로 이동하게 된다.

Major GC - Old Generation

  • Survivor 영역 객체의 age(객체가 살아남은 횟수) 값이 임계값에 다다르면 Old 영역으로 객체가 넘어오고 이 과정을 프로모션(Promotion) 이라고 한다.
  • Major GC는 객체들이 계속 프로모션 되어 Old 영역의 메모리가 부족해지면 발생한다.
  • stop-the-world 가 발생하고, Mark and Sweep 작업을 한다.
img1 daumcdn

Garbage Collection의 종류

Serial GC

  • 서버의 CPU 코어가 1개일 때 사용하기 위해 개발된 가장 단순한 GC

  • GC를 처리하는 스레드가 1개이기에 stop-the-world 시간이 가장 길다.

  • mark-sweep-compact 알고리즘 사용

    • 이 알고리즘의 첫 단계는 Old 영역에 살아 있는 객체를 식별(Mark)하는 것이다.
    • 그 다음 heap의 앞 부분부터 확인하여 살아 있는 것만 남긴다.(Sweep)
    • 마지막 단계에서 각 객체들이 연속되게 쌓이도록 힙의 가장 앞 부분부터 채워서 객체가 존재하는 부분과 객체가 없는 부분으로 나눈다.(Compaction)

Serial GC 실행 명령어

  • 자바 프로그램을 실행할때 -XX:+UseSerialGC GC 옵션을 지정하여 해당 가비지 컬렉션 알고리즘으로 힙 메모리를 관리하도록 실행할 수 있다.
java -XX:+UseSerialGC -jar Application.java

Parallel GC

  • Java 8의 디폴트 GC, Java 9에서부터 deprecated
  • Serial GC와 기본적인 알고리즘은 같지만, Young 영역의 Minor GC를 멀티 스레드로 수행 (Old 영역은 여전히 싱글 스레드)
  • GC 대상을 파악하는 과정이 복잡한 여러 단계로 수행되므로 다른 GC에 비해 CPU 사용량이 높다.
  • Serial GC에 비해 stop-the-world 시간 감소

Serial GC와 Parallel GC의 스레드 비교한 그림

serial GC and Parallel GC

Parallel GC 실행 명령어

  • GC 스레드는 기본적으로 cpu 개수만큼 할당된다.
  • 옵션을 통해 GC를 수행할 스레드의 갯수 등을 설정해줄 수 있다.
java -XX:+UseParallelGC -jar Application.java
# -XX:ParallelGCThreads=N : 사용할 스레드의 갯수

Parallel Old GC

  • Parallel GC를 개선한 버전

  • Young 영역 뿐만 아니라 Old 영역도 멀티 스레드를 사용한다.

  • Mark-Summary-Compaction 사용

    • Summary 단계는 앞서 GC를 수행한 영역에 대해서 살아 있는 객체를 식별한다는 점에서 Mark-Sweep-Compaction 알고리즘의 Sweep와 다르며 더 복잡한 단계를 거친다.

Parallel Old GC 실행 명령어

java -XX:+UseParallelOldGC -jar Application.java
# -XX:ParallelGCThreads=N : 사용할 스레드의 갯수

CMS GC

아래의 그림은 Serial GC와 CMS GC의 절차를 비교한 그림이다.

helloworld-1329-5
  • Initial Mark 단계에서 클래스 로더에서 가장 가까운 객체 중 살아 있는 객체만 찾는 것으로 끝낸다.

    • 따라서 멈추는 시간이 매우 짧다.
  • Concurrent Mark 단계에서는 방금 살아있다고 확인한 객체에서 참조하고 있는 객체들을 따라가면서 확인한다.

    • 이 단계의 특징은 다른 스레드가 실행중인 상테에서 동시에 진행한다는 것이다.
  • Remark 단계에서는 Concurrent Mark 단계에서 새로 추가되거나 참조가 끊긴 객체를 확인한다.

  • Concurrent Sweep 단계에서는 가비지를 정리하는 작업을 실행한다.

    • 이 작업도 다른 스레드가 실행되고 있는 상황에서 진행한다.

CMS GC의 장단점

  • 장점

    • 이런 단계로 진행되는 GC 방식이기에 stop-the-world 시간이 매우 짧다.
    • 모든 애플리케이션의 응답 속도가 매우 중요할 때 CMS GC를 사용한다.
  • 단점

    • 다른 GC 방식보다 메모리와 CPU를 더 많이 사용한다.
    • Compaction 단계가 기본적으로 제공되지 않는다.

CMS GC 실행 명령어

# deprecated in java9 and finally dropped in java14
java -XX:+UseConcMarkSweepGC -jar Application.java

G1 GC

  • CMS GC를 대체하기 위해 jdk 7 버전에서 최초로 release된 GC
  • ava 9+ 버전의 디폴트 GC로 지정
  • 구조는 Young 영역과 Old 영역과는 사뭇 다른 Region 이라는 개념을 사용한다.
  • 전체 Heap 영역을 Region이라는 영역으로 체스같이 분할하여 상황에 따라 Eden, Survivor, Old 등 역할을 고정이 아닌 동적으로 부여
  • Garbage로 가득찬 영역을 빠르게 회수하여 빈 공간을 확보하므로, 결국 GC 빈도가 줄어드는 효과를 얻게 되는 원리
img1 daumcdn

G1 GC 실행 명령어

java -XX:+UseG1GC -jar Application.java

ref

Java Garbage Collection (opens in a new tab)
가비지 컬렉션 동작 원리 & GC 종류 💯 총정리 (opens in a new tab)
[10분 테코톡] 🐥엘리의 GC (opens in a new tab)