LLM 파인튜닝, 학습부터 서빙까지 한 흐름

LoRA든 풀 파인튜닝이든 GPU에서 돌리고, 결과 가중치를 바로 추론 서버로. 데이터는 한국 리전에 머뭅니다.

무료로 시작하기 → 다른 활용 사례

무엇인가요

우리 데이터에 맞춘 모델 만들기

범용 모델로는 부족한 도메인 용어·말투·형식이 있을 때, 오픈 모델을 우리 데이터로 파인튜닝하면 작은 모델로도 큰 효과를 낼 수 있습니다. onpod은 파인튜닝용 GPU를 빌려주고, 결과를 곧장 서빙으로 잇습니다.

민감한 학습 데이터를 외부로 보내기 어려운 경우, 한국 리전 GPU에서 파인튜닝해 데이터 주권을 지킬 수 있습니다. 학습 → 평가 → 서빙이 같은 플랫폼 안에서 이어집니다.

onpod — deploy

# 코딩 에이전트(Claude Code·Codex·Cursor…)에게 한 마디
나 이 데이터로 모델을 LoRA 파인튜닝 onpod에 배포해줘

에이전트 → onpod 매뉴얼 읽음 → 빌드 → 배포 실행…
✓ 배포 완료
공개 주소: https://ft.onpod.ai (SSL 자동)

자주 묻는 질문

궁금한 것들

LoRA와 풀 파인튜닝 둘 다 되나요?

둘 다 GPU에서 돌릴 수 있습니다. 모델 크기와 데이터에 맞는 GPU를 시간 단위로 빌리면 됩니다.

학습 데이터가 외부로 나가나요?

한국 리전 GPU에서 파인튜닝하면 데이터가 리전 내에 머물러 데이터 주권을 지킬 수 있습니다.

파인튜닝한 모델을 어떻게 쓰나요?

결과 가중치를 vLLM 추론 서버로 배포해 OpenAI 호환 API로 바로 서빙할 수 있습니다.

지금 한 줄이면 배포 끝.

코딩 에이전트에게 “onpod에 배포해줘”라고 말하기만 하면 됩니다. 무료 티어로 시작하세요.

5초 가입하고 시작 →

우리 데이터에 맞춘 모델 만들기

궁금한 것들

관련 활용 사례

지금 한 줄이면 배포 끝.