llm post training 썸네일형 리스트형 AI 모델의 성능을 극대화하는 스케일링 기법 총정리 지난 편에 이어서 작성합니다. 이 글은 2025년 4월 23일 오후 5시부터 6시까지 진행된 업스테이지 프라이빗 세미나의 내용을 기반으로 정리했습니다. 지난 편: 실전에서 바로 써먹는 'Post-training' 테크닉, 튜닝 계보 한방 정리스케일링이란?스케일링은 모델 학습을 완료한 후 실제 인퍼런스 단계에서 결과(아웃풋)를 최적화하는 기법들을 의미합니다. 이 분야는 크게 Thought-based reasoning, Sampling-based inference, Search-based inference 세 가지 접근법으로 나눌 수 있습니다. Thought-based Reasoning (사고 기반 추론)Thought-based reasoning은 구조화된 단계별(스텝 바이 스텝) 추론을 모델이 할 수 있도.. 더보기 실전에서 바로 써먹는 'Post-training' 테크닉, 튜닝 계보 한방 정리 업스테이지 프라이빗 세미나 3회차에서는 ‘LLM Post Training Techniques’를 주제로 업스테이지 정민별 박사님이 강연을 해주셨습니다. 내용이 매우 매우 방대하여 한번에 정리하기 너무 어려운 것 같아, 나눠서 업로드합니다. 이 글은 2025년 4월 23일 오후 5시부터 6시까지 진행된 업스테이지 프라이빗 세미나의 내용을 기반으로 정리했습니다. Post-training이란?Post-training은 이미 pre-train 되어 있는 모델을 가져와 특정 태스크나 도메인에 맞춰 추가적으로 학습을 시키는 과정입니다. 모델을 우리가, 원하는 작업이나 분야에 적응시키고 적용하기 위한 필수적인 단계라고 볼 수 있습니다. Post-training의 주요 분야포스트 트레이닝에는 크게 튜닝, 강화학습, 스.. 더보기 이전 1 다음