LoRA든 풀 파인튜닝이든 GPU에서 돌리고, 결과 가중치를 바로 추론 서버로. 데이터는 한국 리전에 머뭅니다.
무엇인가요
범용 모델로는 부족한 도메인 용어·말투·형식이 있을 때, 오픈 모델을 우리 데이터로 파인튜닝하면 작은 모델로도 큰 효과를 낼 수 있습니다. onpod은 파인튜닝용 GPU를 빌려주고, 결과를 곧장 서빙으로 잇습니다.
민감한 학습 데이터를 외부로 보내기 어려운 경우, 한국 리전 GPU에서 파인튜닝해 데이터 주권을 지킬 수 있습니다. 학습 → 평가 → 서빙이 같은 플랫폼 안에서 이어집니다.
자주 묻는 질문
관련 키워드
이어 보기