주말엔 학습, 평일엔 추론. 같은 GPU를 용도만 바꿔 쓰고, 체크포인트는 자동 백업. 플랫폼 운영에 시간 뺏기지 않게.
누구한테 딱일까요
혼자 모델을 다루는 ML 엔지니어에게 인프라는 부수입니다. onpod은 학습용 GPU 확보, 체크포인트 백업, 추론 서빙으로의 전환을 단순한 흐름으로 묶어, 모델 작업에 집중하게 합니다.
학습이 끝난 가중치를 vLLM 추론 서버로 바로 띄우고, 호출이 없으면 절전으로 비용을 줄입니다. 트래픽이 오면 자동 확장이 받아냅니다.
자주 묻는 질문
관련 키워드
이어 보기