[Day6] 한 권으로 LLM 온라인 스터디 1기

프로그래밍/LLM

[Day6] 한 권으로 LLM 온라인 스터디 1기 - GPU 병렬화 기법

31weeks 2025. 1. 25. 18:44

728x90

3.3.1 데이터 병렬 처리(Data Parallelism, DP)

3.3.2 모델 병렬화(Model Parallelism, MP)

3.3.3 파이프라인 병렬화(Pipeline Parallelism, PP)

3.3.4 텐서 병렬 처리(Tensor Parallelism, TP)

3.3.5 FSDP(Fully Sharded Data Paralle)

딥러닝에서 사용되는 고급 데이터 병렬 처리 기법 중 하나로, 대규모 모델 학습에 효과적
GPU가 모델의 일부만을 메모리에 보유하도록 해 전체 모델의 메모리 요구 사항을 줄이는 것을 목표로 함
모델을 샤드(Shads)라고하는 더 작은 조각으로 분할, 각 GPU에 샤드를 할당해서 실행하는 방식
FSDP의 작동 원리
- 모델 샤딩 : 모델의 파라미터를 여러 개의 샤드로 나누고, 각 샤드를 별도의 GPU에 할당해 독립적으로 관리
- 메모리 절약 : 각 GPU는 할당된 샤드의 파라미터만 메모리에 로드
- 동적 샤드 로딩 : 필요에 따라 파라미터 샤드를 GPU 메모리에 로드하고, 사용이 끝나면 메모리에서 제거
- 효율적인 그레이디언트 집계 : 각 GPU에서 계산된 그레이디언트는 중앙 집계 서버나 특정 GPU에서 수집되어 전체 모델의 파라미터를 업데이트 하는데 사용 → 네트워크 통신 비용을 최소화

728x90

[Day8] 한 권으로 LLM 온라인 스터디 1기 - 단일 GPU Gemma 파인튜닝 2 (0)	2025.01.25
[Day7] 한 권으로 LLM 온라인 스터디 1기 - 단일 GPU Gemma 파인튜닝 1 (0)	2025.01.25
[Day5] 한 권으로 LLM 온라인 스터디 1기 - GPT, Gemma, Llama3 모델 특징 비교 (0)	2025.01.25
[Day4] 한 권으로 LLM 온라인 스터디 1기 - 파인튜닝 개념 (1)	2025.01.25
[Day3] 한 권으로 LLM 온라인 스터디 1기 - 멀티헤드 어텐션 & 피드포워드 (0)	2025.01.25

250x250

31weeks blog

작괘법, 학습 방법, 비트코인, 원본해설, 사주팔자, 괘상수, 가이드, 파이썬, 토정비결, 암호화폐, 이지함, 기술사, 운세, MBTI, 문제풀이, 트럼프, 풀이, 괘상, 기출문제, 가스,