← 프로젝트 목록
숏폼 콘텐츠 현지화 운영사 · 2026 · AI·RAG

중국 숏폼 영상을
한국 콘텐츠로 자동 각색

중국 숏폼 영상의 자막을 자동으로 추출해 한국어 내레이션 대본으로 각색하는 AI 파이프라인. 운영자가 코드 배포 없이 각색 톤을 실시간으로 튜닝할 수 있도록 어드민까지 묶어 설계했습니다.

AI 파이프라인 · 영상 · 어드민
01 — CHALLENGE

중국 숏폼을 한국 시장에 옮기는 일은 사람 손이 가장 많이 드는 작업이었습니다.

자막을 옮겨 적고, 번역하고, 한국어 내레이션 톤에 맞게 각색하고, 다시 SRT로 정리하고, 그 결과를 운영자가 다운로드받아 영상에 입히는 과정이 매번 수작업이었습니다. 한 영상에 사람이 붙는 시간이 늘어날수록 운영사가 다룰 수 있는 콘텐츠 양은 줄어들 수밖에 없었습니다.

톤은 또 한 가지 정답이 없었습니다. 채널마다 톤이 달라야 했고, 그래서 "한 번 각색 잘 됐다"가 다음 영상의 보장이 아니었습니다.

02 — APPROACH

수작업 5단계를 하나의 자동화 파이프라인으로 묶고, 톤 튜닝은 코드가 아니라 어드민 프롬프트에서 처리할 수 있게 분리했습니다.

영상이 업로드되면 PaddleOCR이 프레임 단위로 자막을 인식하고, GPT-4o가 번역·각색을 함께 처리합니다. 결과는 SRT 자막, 중국어+한국어 대본, 한국어 전용 대본 세 가지 포맷으로 동시에 나와 운영자가 용도에 맞게 골라 받습니다.

각색 톤을 바꾸려고 매번 배포할 필요 없이, 어드민에서 프롬프트를 실시간으로 수정하면 다음 영상부터 그 톤이 적용됩니다. 사용자 승인제 가입을 통해 누가 어떤 영상을 처리했는지도 추적합니다.

03 — STACK

사용 기술.

01

Next.js 15 · React 19

Tailwind CSS 기반 반응형 어드민. 영상 업로드부터 결과 다운로드까지 한 화면에서.

02

Python 3.11 · AWS Lambda

OCR·번역·각색 전 단계를 서버리스 이벤트로 묶고, 컨테이너 이미지로 모델을 미리 적재해 콜드 스타트를 줄였습니다.

03

PaddleOCR · GPT-4o

프레임 자막 인식은 PaddleOCR, 번역과 각색은 GPT-4o. 어드민 프롬프트로 톤 제어.

04

DynamoDB · JWT

Job·Frame·User·Config를 싱글 테이블 디자인으로 통합. 관리자 승인제 가입은 JWT 커스텀 인증.

비슷한 프로젝트,
함께 해볼까요?

상담 요청하기 →다른 프로젝트 보기