Inno Db Engine

MySQL InnoDB 스토리지 엔진

MySQL 전체 구조 참고 (opens in a new tab)

MySQL 서버 구성

MySql서버는 MySQL 엔진과 스토리지 엔진으로 구성되어 있다.

MySQL 엔진 : 클라이언트로부터 오는 요청 처리(요청된 SQL 문장을 분석, 최적화, ...)를 담당
스토리지 엔진 : 실제 데이터를 디스크 스토리지에 저장하거나 조회하는 부분을 담당

InnoDB 스토리지 엔진

특징

MySQL 서버의 다른 스토리지 엔진과 달리 트랜잭션과 잠금, MVCC(Multi-Version Concurrency Control) 등의 기능을 내장하고 있다.
MySQL 서버에서는 InnoDB 스토리지 엔진을 기본 스토리지 엔진으로 사용한다.

구조

메모리 영역
- InnoDB 버퍼 풀: 실제 데이터 블록(페이지)을 메모리에 적재하는 영역 + 인서트 버퍼 + 언두 레코드
- 로그 버퍼: 로그 스레드에 의해 로그 파일로 기록되기 전 버퍼링 하는 영역
디스크 영역
- 시스템/사용자 테이블 스페이
- 리두(Redo) 로그

InnoDB 스토리지 엔진의 특징

1. PK에 의한 클러스터링

기본적으로 InnoDB의 모든 테이블은 기본적으로 PK를 기준으로 클러스터링되어 저장됨
- 클러스터링된다는 것은, PK 값이 비슷한 레코드끼리 묶어서 저장하는 것을 의미함
- PK 값이 레코드의 저장 위치를 결정하기 때문에 신중하게 결정해야 함
PK가 클러스터링 인덱스이기 때문에 PK를 통한 Range 스캔이 매우 빠르게 처리될 수 있음

2. 외래 키(FK) 지원

InnoDB 스토리지 엔진 레벨에서 지원하는 기능으로, MyISAM이나 MEMORY 테이블에서는 사용할 수 없음
InnoDB에서 외래 키는 부모 테이블과 자식 테이블 모두 해당 컬럼에 인덱스 생성이 필요하고, 변경 시에는 반드시 부모 테이블이나 자식 테이블에 데이터가 있는지 체크하는 작업이 필요함
따라서 잠금이 여러 테이블로 전파되고, 그로 인해 데드락이 발생할 때가 많으므로 개발 시에 외래 키의 존재에 주의하는 것이 좋음

3. MVCC(Multi Version Concurrency Control)

개념
- 동시 접근을 허용하는 데이터베이스에서 동시성을 제어하기 위해 사용하는 방법 중 하나
  - 여기서 Multi Version은 하나의 레코드에 대해서 여러 개의 버전을 동시에 관리한다는 의미함
- 일반적으로 레코드 레벨의 트랜잭션을 지원하는 DBMS가 지원하는 기능
  - 여러 트랜잭션이 동시에 같은 데이터에 접근할 때, 데이터의 일관성과 동시성을 보장하는 방식
  - 트랜잭션 동시성과 일관성을 보장하기 위해 여러 버전의 데이터를 관리하는 방식
핵심
- 잠금(Locking)을 사용하지 않으면서 일관된 값을 읽도록 만드는 것이 목적
  - InnoDB 스토리지 엔진은 트랜잭션의 격리 수준을 위해 잠금을 사용하지 않고 읽기 작업을 수행함
  - 즉, 잠금을 사용하지 않고 하나의 레코드에 대해 여러 개의 버전이 동시에 관리될 수 있다는 것을 의미함
- InnoDB의 경우 언두 로그 (opens in a new tab)를 활용하여 이 기능을 구현함

언두 로그(Undo Log)

DML(UPDATE, DELETE)과 같이 데이터를 변경하는 쿼리로 데이터를 변경했을 때 변경되기 이전 데이터를 보관하는 공간, 백업해둔 데이터
- 롤백 용도나 트랜잭션 격리 수준을 유지하면서 높은 동시성을 제공하기 위한 용도로 사용됨
기능
- 트랜잭션 보장: 트랜잭션이 롤백되면 언두 로그에 백업해둔 이전 버전의 데이터를 이용해 복구함
- 격리 수준 보장: 데이터를 변경하는 도중 다른 커넥션에서 데이터를 조회하면 격리 수준에 맞게 언두 로그에 백업해둔 데이터를 읽어서 반환함

언두 로그 영역을 활용한 MVCC

MySQL은 레코드를 여러 버전으로 관리하는 방법으로 트랜잭션의 커밋/롤백 여부와 상관없이 변경 이전 레코드의 데이터를 Undo 로그에 남겨두는 방법을 사용함
Undo 로그를 남겨서 여러 버전으로 관리하면 격리 수준에 따라 Lock(잠금)을 사용하지 않고 일관된 조회가 가능함
- READ_UNCOMMITTED: InnoDB 버퍼 풀이 현재 가지고 있는 최신 버전의 데이터를 읽어서 반환함
  - 즉, 커밋됐든 아니든 변경된 상태의 데이터를 반환함
- READ_COMMITTED나 그 이상의 격리 수준인 경우: 아직 커밋되지 않았기 때문에 InnoDB 버퍼 풀이나 데이터 파일에 있는 내용 대신 변경되기 이전의 내용을 보관하고 있는 언두 영역의 데이터를 반환함
  - Undo 로그에 저장된 레코드 값으로 레코드를 조회하면 굳이 레코드의 Lock을 걸 필요가 없이 일관된 읽기가 가능해짐
UPDATE 쿼리가 실행되면 어떻게 될까?
```
update member set password='realpassword' where id = 1;
```
- UPDATE 쿼리가 실행되면 커밋 실행 여부와 관계없이 변경 이전의 값을 undo 로그에 저장하고, InnoDB 버퍼 풀에는 새로운 값으로 업데이트 됨
- 아직 커밋이나 롤백이 되지 않은 이 상태에서 다른 사용자가 작업 중인 레코드를 조회(SELECT)하게 되면 격리 레벨에 따라서 어디에 있는 데이터를 조회할지 달라짐

이렇게 하나의 레코드에 대해서 여러 개의 버전 (버퍼 풀, 언두 로그)를 관리하기 때문에 'MVCC'라고 표현하며, 필요에 따라 어떤 데이터가 보여질지 달라지게 된다는 것을 의미함

4. 잠금 없는 일관된 읽기(Non-Locking Consistent Read)

MVCC를 사용해 잠금없는 일관된 읽기 제공

읽기작업은 다른 트랜잭션의 잠금에 대기하지 않고 바로 실행 됨
- 순수한 읽기 작업(SELECT)이 다른 트랜잭션의 변경 작업에 영향을 받지 않음
  - 특히 SERIALIZABLE이 아닌 격리 수준(READ_UNCOMMITTED, READ_UNCOMMITTED, REPEATABLE_READ)일때
활성 트랜잭션이 길어질 시, 오랜 시간 동안 활성 상태인 MySQL 서버 속도저하 문제 발생 가능
- 원인: 잠금 없는 일관된 읽기의 특성(언두 로그를 지속적으로 유지) 때문
- 따라서 트랜잭션 시작 시, 롤백이나 커밋을 통해 가능한 한 빠르게 트랜잭션 완료 권장

5. 자동 데드락 감지

InnoDB 스토리지 엔진은 내부적으로 잠금이 교착 상태에 빠지지 않았는지 체크하기 위해, 잠금 대기 목록을 그래프(Wait-for List) 형태로 관리함

데드락 감지 시스템 (`innodb_deadlock_detect`)

주기적인 잠금 대기 그래프 검사로 교착 상태에 빠진 트랜잭션들을 찾아 그 중 하나를 강제 종료
트랜잭션 강제 종료 판단 기준 : 트랜잭션의 언두 로그 양
- 언두 로그 레코드를 더 적게 가진 트랜잭션이 일반적으로 롤백의 대상이 됨
- 이유: 적은 언두로그 레코드 → 롤백 시 언두처리할 내용 적음 → 트랜잭션 강제 롤백으로 인한 MySQL 서버의 부하 덜 유발
데드락 감지 스레드의 성능
- 느려질 경우
  - 서비스 쿼리를 처리 중인 스레드는 더는 작업 진행을 못하고 대기하면서 서비스에 악영향 미침
- 동시성 처리의 개수에 따라 영향을 받음

6. 자동화된 장애 복구

데이터베이스 시스템이 예기치 않게 종료되었을 때 자동으로 장애 복구 수행.

InnoDB 데이터 파일은 기본적으로 MySQL 서버가 시작될 때 항상 자동 복구 수행
이 단계에서 자동으로 복구될 수 없는 손상 있을 경우 자동 복구 멈추고 MySQL 서버 종료 됨
종료되었을 시, MySQL 서버의 설정 파일의 innodb_force_recovery 시스템 변수 설정으로 MySQL 서버 시작
- innodb_force_recovery: 시스템 변수를 1~6으로 설정하여 MySQL 서버를 다시 시작

InnoDB MyISAM 비교

항목	InnoDB	MyISAM
저장 방식	행 기반 저장 방식	테이블 기반 저장 방식
트랜잭션 지원	트랜잭션 지원 (ACID 준수)	트랜잭션 미지원
외래 키(Foreign Keys)	외래 키 지원	외래 키 미지원
락(Locking)	행 수준 락	테이블 수준 락
전문 검색(Full-Text Search)	MySQL 5.6부터 지원	기본적으로 지원
크래시 복구(Crash Recovery)	자동 복구 가능	크래시 후 수동 복구 필요
데이터 무결성	참조 무결성 보장	참조 무결성 보장 안 함
성능	읽기-쓰기 작업에서 우수	읽기 작업에서 더 빠름
테이블 크기	대용량 데이터 처리 가능	상대적으로 작은 테이블 크기
지리 정보(GIS)	GIS 기능 지원	기본적인 지원
저장 형식	클러스터 인덱스를 사용하는 압축 저장	단순하고 비압축 저장 방식

사용 사례:

InnoDB: 트랜잭션, 외래 키, 데이터 무결성이 중요한 애플리케이션에 적합.
MyISAM: 읽기 작업이 많은 애플리케이션, 예를 들어 데이터 웨어하우스나 간단한 쿼리 위주의 웹 애플리케이션에 적합.

InnoDB 메모리 구조

InnoDB 버퍼 풀

InnoDB 스토리지 엔진에서 가장 핵심적인 부분

데이터 캐싱
- 버퍼 풀은 디스크의 데이터 파일이나 인덱스 정보를 메모리에 캐시해두는 공간
- 페이지 단위로 테이블 데이터를 관리한다
- 페이지 교체 알고리즘으로 LRU (opens in a new tab)를 사용한다
쓰기 지연 버퍼
- 버퍼 풀은 쓰기 작업을 지연시켜 일괄 작업으로 처리할 수 있게 해주는 버퍼 역할을 수행함
  - 변경된 데이터는 즉시 디스크에 쓰여지지 않고 버퍼 풀에 일시적으로 저장됨
  - 이후 적절한 시점에 이 데이터들이 일괄적으로 디스크에 쓰여짐
  - 이 과정을 통해 랜덤 I/O 작업을 줄이고, 시스템의 성능을 최적화함

Adaptive Hash Index

B-Tree

InnoDB에서는 B-Tree를 이용해 데이터들을 Primary Key 순으로 정렬되어 관리하고, Secondrary Key는 인덱스 + PK 조합으로 정렬되어 있다. - B-Tree를 통해 데이터에 접근하는 시간은 향상되어도 자주 접근하는 데이터일지라도 반복적으로 접근하는 것은 효율이 좋지 않다!
이를 해결하기 위해 Adaptive Hash Index가 사용된다.

Adaptive Hash Index

자주 사용되는 컬럼을 해시로 정의하여 B-Tree를 타지않아도 바로 데이터에 접근 가능하게 된다
그러나, 자주 사용되는 데이터를 옵티마이저가 판단하여 해시 키로 만들기 때문에 제어가 어렵고, 수개월 동안 사용되지 않던 테이블일지라도 기존 해시 자료 구조에 데이터가 남아 있게 되면 테이블 Drop시 영향을 줄 수 있다.

체인지 버퍼

RDBMS에서 레코드가 Insert, Update가 될 때 데이터 파일을 변경하는 작업 뿐만 아니라 해당 테이블에 포함된 인덱스를 업데이트하는 작업도 필요합니다.
이때 인덱스를 업데이트하는 작업은 랜덤하게 디스크를 읽는 작업을 선행해야하므로, 테이블에 인덱스가 많으면 이 작업은 많은 자원을 소모하게 됩니다.
InnoDB는 변경해야 할 인덱스 페이지가 버퍼풀에 있으면 바로 업데이트하지만, Disk I/O가 필요하다면 즉시 실행하지 않고 임시 공간에 업데이트사항을 저장해두고 사용자에게 결과를 반환하는 형태로 성능을 향상시킵니다.
이때 임시 메모리 공간을 체인지 버퍼라고 합니다!!

유니크 인덱스의 경우 중복 체크를 해야 하므로 체인지 버퍼를 사용할 수 없다.체인지 버퍼에 저장된 인덱스 레코드는 백그라운드 스레드 중 '체인지 버퍼 머지 스레드 (Merge Thread)'에 의해서 병합된다.

innodb_change_buffering이라는 변수를 통해서 어떤 작업인지에 따라 체인지 버퍼를 활성화할 수 있다.

리두 로그(Redo Log) 및 로그 버퍼

리두 로그

트랜잭션이 커밋되기 전에 변경 사항이 리두 로그에 기록된다.
- 데이터의 파일쓰기는 디스크의 랜덤 액세스가 필요하므로 성능 저하를 막기 위해 데이터베이스 서버는 쓰기 비용이 낮은 자료 구로 리두 로그를 가지고 있으며 트랜잭션이 커밋되기 전에 변경사항이 리두 로그에 먼저 저장된다.
이때 DB에 장애가 발생해서 메모리의 데이터를 디스크로 옮기지 못한 채 서버가 다운되는 경우 Redo Log를 활용해서 데이터를 복구할 수 있다.
1. 커밋됐지만 데이터 파일에 기록되지 않은 데이터
  - 리두 로그에 저장된 데이터를 파일에 저장
2. 롤백됐지만 데이터 파일에 이미 기록된 데이터
  - 그 변경이 커밋됐는지, 롤백됐는지, 아니면 트랜잭션의 실행 중간 상태였는지 실행 상태를 확인하기 위해 리두 로그 사용
  - 롤백되기 전의 데이터는 언두 로그에 저장되어 있기 때문에 언두 로그에서 데이터를 찾아서 복구

로그 버퍼

사용량이 매우 많은(변경 작업) DBMS 서버의 경우, 리두 로그의 기록 작업이 큰 부하를 줄 수 있다.
- 이러한 작업 역시 버퍼링을 통해 개선할 수 있으며 이 때 사용되는 공간이 로그 버퍼이다.
로그 버퍼의 크기는 기본 16MB이며, BLOB나 TEXT와 같이 큰 데이터를 자주 변경하는 경우에는 더 크게 설정하는 것이 좋다.

➕ InnoDB 디스크 구조

MySQL Architecture - InnoDB: On-Dist Structure (opens in a new tab) 참고

Ref

DHCP String, StringBuilder, StringBuffer

MySQL InnoDB 스토리지 엔진

MySQL 서버 구성

InnoDB 스토리지 엔진

특징

구조

InnoDB 스토리지 엔진의 특징

1. PK에 의한 클러스터링

2. 외래 키(FK) 지원

3. MVCC(Multi Version Concurrency Control)

언두 로그(Undo Log)

언두 로그 영역을 활용한 MVCC

4. 잠금 없는 일관된 읽기(Non-Locking Consistent Read)

5. 자동 데드락 감지

데드락 감지 시스템 (innodb_deadlock_detect)

6. 자동화된 장애 복구

InnoDB MyISAM 비교

InnoDB 메모리 구조

InnoDB 버퍼 풀

Adaptive Hash Index

B-Tree

Adaptive Hash Index

체인지 버퍼

리두 로그(Redo Log) 및 로그 버퍼

리두 로그

로그 버퍼

➕ InnoDB 디스크 구조

Ref

데드락 감지 시스템 (`innodb_deadlock_detect`)