출처 - https://github.com/jmxx219/CS-Study (opens in a new tab)
가비지 컬렉션 Garbage Collection(GC)
가비지 컬렉션이란?
-
Heap 영역에서 동적으로 할당했던 메모리 중 사용하지 않는 메모리 객체(garbage)를 모아 주기적으로 제거하는 프로세스
-
자바는 JVM에 탑재된 가비지 컬렉터가 메모리 관리를 대행하기에 개발자 입장에서 메모리 관리와, 메모리 누수(Memory Leak) 문제에 대해 완벽히 관리하지 않아도 된다.
-
특정 개체가 garbage 인지 판단하기 위해서 도달능력(Reachability) 이라는 개념을 사용한다
-
객체에 레퍼런스가 있으면 Reachable로 구분되고, 객체에 유효한 레퍼런스가 없으면 Unreachable로 구분하고 가비지 컬렉션의 대상이 된다.
가비지 컬렉션의 장점
- 생산성 향상: C / C++ 언어에서 프로그래머가 수동으로 메모리를 할당, 해제를 했던 것에 반해 JVM의 가비지 컬렉터가 자동으로 메모리를 관리해주기 때문에 개발자는 개발에 집중 할 수 있다.
- 메모리 누수 방지: Garbage Collector가 메모리 관리를 대행하기 때문에 메모리 누수를 방지하여 안정성을 높인다.
가비지 컬렉션의 단점
- 오버 헤드: GC가 실행될 때 성능 저하가 발생할 수 있다.(stop-the-world)
- 예측 불가능: GC가 예측 불가능한 시점에 실행 될 수 있기 때문에 이 또한 성능문제로 귀결될 수 있다.
stop-the-world
- GC을 실행하기 위해 JVM이 애플리케이션 실행을 멈추는 것
- stop-the-world가 발생하면 GC를 실행하는 스레드를 제외한 나머지 스레드는 모두 작업을 멈춘다.
- 어떤 GC 알고리즘을 사용하더라도 stop-the-world 는 발생하고, GC 튜닝이란 이 stop-the-world 시간을 줄이는 것
weak generational hypothesis
자바 가비지 컬렉터는 두 가지 가설(전제 조건)하에 만들어졌다.
- 대부분의 객체는 금방 접근 불가능 상태(unreachable)가 된다.
- 오래된 객체에서 젊은 객체로의 참조는 아주 적게 존재한다.
Heap 영역의 구성
-
Young Generation 영역
- Eden 영역, 2개의 Survival 영역
- 새롭게 생성한 객체의 대부분이 여기에 위치한다.
- 대부분의 객체가 금방 접근 불가능 상태가 되기 때문에 많은 객체가 Young 영역에 생성되었다가 사라진다.
- 이 영역에서 객체가 사라질 때 minor GC가 발생한다고 한다.
-
Old Generation 영역
- 접근 불가능 상태로 되지 않아 Young 영역에서 살아남은 객체가 여기로 복사된다.
- 대부분 Young 영역보다 크게 할당하며, 크기가 큰 만큼 Young 영역보다 GC는 적게 발생한다.
- 이 영역에서 객체가 사라질 때 Major GC 혹은 Full GC가 발생한다고 한다.
Garbage Collection 과정
Minor GC - Young Generation
- 새로 생성한 대부분의 객체는 Eden 영역에 위치한다.
- Eden 영역에서 GC가 한 번 발생한 후 살아남은 객체는 Survivor 영역 중 하나로 이동된다.
- Eden 영역에서 GC가 발생하면 이미 살아남은 객체가 존재하는 Survivor 영역으로 객체가 계속 쌓인다.
- 하나의 Survivor 영역이 가득 차게 되면 그 중에서 살아남은 객체를 다른 Survivor 영역으로 이동한다.
- 그리고 이전에 가득찬 Survivor 영역은 아무 데이터도 없는 상태가 된다.
- 이 과정을 반복하다가 계속해서 살아남아 있는 객체는 Old 영역으로 이동하게 된다.
Major GC - Old Generation
- Survivor 영역 객체의 age(객체가 살아남은 횟수) 값이 임계값에 다다르면 Old 영역으로 객체가 넘어오고 이 과정을 프로모션(Promotion) 이라고 한다.
- Major GC는 객체들이 계속 프로모션 되어 Old 영역의 메모리가 부족해지면 발생한다.
- stop-the-world 가 발생하고, Mark and Sweep 작업을 한다.
Garbage Collection의 종류
Serial GC
-
서버의 CPU 코어가 1개일 때 사용하기 위해 개발된 가장 단순한 GC
-
GC를 처리하는 스레드가 1개이기에 stop-the-world 시간이 가장 길다.
-
mark-sweep-compact 알고리즘 사용
- 이 알고리즘의 첫 단계는 Old 영역에 살아 있는 객체를 식별(Mark)하는 것이다.
- 그 다음 heap의 앞 부분부터 확인하여 살아 있는 것만 남긴다.(Sweep)
- 마지막 단계에서 각 객체들이 연속되게 쌓이도록 힙의 가장 앞 부분부터 채워서 객체가 존재하는 부분과 객체가 없는 부분으로 나눈다.(Compaction)
Serial GC 실행 명령어
- 자바 프로그램을 실행할때 -XX:+UseSerialGC GC 옵션을 지정하여 해당 가비지 컬렉션 알고리즘으로 힙 메모리를 관리하도록 실행할 수 있다.
java -XX:+UseSerialGC -jar Application.java
Parallel GC
- Java 8의 디폴트 GC, Java 9에서부터
deprecated
- Serial GC와 기본적인 알고리즘은 같지만, Young 영역의 Minor GC를 멀티 스레드로 수행 (Old 영역은 여전히 싱글 스레드)
- GC 대상을 파악하는 과정이 복잡한 여러 단계로 수행되므로 다른 GC에 비해 CPU 사용량이 높다.
- Serial GC에 비해 stop-the-world 시간 감소
Serial GC와 Parallel GC의 스레드 비교한 그림
Parallel GC 실행 명령어
- GC 스레드는 기본적으로 cpu 개수만큼 할당된다.
- 옵션을 통해 GC를 수행할 스레드의 갯수 등을 설정해줄 수 있다.
java -XX:+UseParallelGC -jar Application.java
# -XX:ParallelGCThreads=N : 사용할 스레드의 갯수
Parallel Old GC
-
Parallel GC를 개선한 버전
-
Young 영역 뿐만 아니라 Old 영역도 멀티 스레드를 사용한다.
-
Mark-Summary-Compaction 사용
- Summary 단계는 앞서 GC를 수행한 영역에 대해서 살아 있는 객체를 식별한다는 점에서 Mark-Sweep-Compaction 알고리즘의 Sweep와 다르며 더 복잡한 단계를 거친다.
Parallel Old GC 실행 명령어
java -XX:+UseParallelOldGC -jar Application.java
# -XX:ParallelGCThreads=N : 사용할 스레드의 갯수
CMS GC
아래의 그림은 Serial GC와 CMS GC의 절차를 비교한 그림이다.
-
Initial Mark 단계에서 클래스 로더에서 가장 가까운 객체 중 살아 있는 객체만 찾는 것으로 끝낸다.
- 따라서 멈추는 시간이 매우 짧다.
-
Concurrent Mark 단계에서는 방금 살아있다고 확인한 객체에서 참조하고 있는 객체들을 따라가면서 확인한다.
- 이 단계의 특징은 다른 스레드가 실행중인 상테에서 동시에 진행한다는 것이다.
-
Remark 단계에서는 Concurrent Mark 단계에서 새로 추가되거나 참조가 끊긴 객체를 확인한다.
-
Concurrent Sweep 단계에서는 가비지를 정리하는 작업을 실행한다.
- 이 작업도 다른 스레드가 실행되고 있는 상황에서 진행한다.
CMS GC의 장단점
-
장점
- 이런 단계로 진행되는 GC 방식이기에 stop-the-world 시간이 매우 짧다.
- 모든 애플리케이션의 응답 속도가 매우 중요할 때 CMS GC를 사용한다.
-
단점
- 다른 GC 방식보다 메모리와 CPU를 더 많이 사용한다.
- Compaction 단계가 기본적으로 제공되지 않는다.
CMS GC 실행 명령어
# deprecated in java9 and finally dropped in java14
java -XX:+UseConcMarkSweepGC -jar Application.java
G1 GC
- CMS GC를 대체하기 위해 jdk 7 버전에서 최초로 release된 GC
- ava 9+ 버전의 디폴트 GC로 지정
- 구조는 Young 영역과 Old 영역과는 사뭇 다른 Region 이라는 개념을 사용한다.
- 전체 Heap 영역을 Region이라는 영역으로 체스같이 분할하여 상황에 따라 Eden, Survivor, Old 등 역할을 고정이 아닌 동적으로 부여
- Garbage로 가득찬 영역을 빠르게 회수하여 빈 공간을 확보하므로, 결국 GC 빈도가 줄어드는 효과를 얻게 되는 원리
G1 GC 실행 명령어
java -XX:+UseG1GC -jar Application.java
ref
Java Garbage Collection (opens in a new tab)
가비지 컬렉션 동작 원리 & GC 종류 💯 총정리 (opens in a new tab)
[10분 테코톡] 🐥엘리의 GC (opens in a new tab)