요즘 AI를 활용한 영상 제작, 많이들 들어보셨을 겁니다. 그런데 단순한 이미지 나열이 아니라, 지브리 애니메이션 같은 감성 시네마틱 영상도 AI로 만들 수 있다는 사실, 알고 계셨나요?
이번 글에서는 지브리 스타일 AI 영상 만들기를 처음부터 끝까지 순서대로 정리했습니다. Auto Whisk, Grok AI, AI Studio, 캡컷 등 주요 도구들을 활용해 스토리 구상부터 이미지 생성, 나레이션 삽입, 영상 편집까지 완성하는 실제 실전 프로세스를 상세히 알려드립니다.
지브리 스타일 AI 영상 만들기, 이 순서대로만 따라하세요

| ▣ 목차 (LIST) ▣ |
- 지브리 스타일 AI 영상이란?
- 전체 작업 흐름 요약
- 단계별 상세 작업법
- 스토리 스크립트 만들기
- 장면별 프롬프트 생성
- 이미지 자동 생성 (Auto Whisk)
- AI 나레이션 삽입 (Grok AI + AI Studio)
- 영상 편집 및 완성 (CapCut)
- 마무리 팁과 참고자료
| ※ 코코 쥬안(Cocojuan) 티스토리 블로그 |
| ◉ 인공지능 AI 사이트 사용법 정리 https://cocojuan.tistory.com/489 |
1. 지브리 스타일 AI 영상이란?
지브리 스타일 AI 영상은 단순히 컷을 이어 붙인 일반 영상이 아닙니다. 특유의 감성을 전달하기 위해 다음과 같은 특징을 갖춘 감성 중심 시네마틱 영상입니다.
- 부드러운 수채화 느낌
- 따뜻한 색감과 얕은 심도
- 감정을 담은 시나리오와 캐릭터 중심 구도
과거에는 이런 고유한 느낌을 구현하기 위해 전문 일러스트 작가와 영상 편집자가 협업하여 오랜 시간 작업해야 했습니다. 하지만 이제는 AI 도구와 정교한 프롬프트 기술만으로도 누구나 비슷한 퀄리티의 결과물을 만들어낼 수 있게 되었습니다.
1.1. 주요 특징 상세
AI를 통해 생성된 이미지는 지브리 특유의 빛의 산란과 자연 경관의 세밀한 묘사를 재현해내며, 시청자에게 깊은 몰입감을 선사합니다.
2. 전체 작업 흐름 요약
지브리 스타일 영상을 제작하는 전체 과정은 아래와 같은 흐름으로 진행됩니다. 각 단계의 연결성을 이해하는 것이 중요합니다.
| 단계 | 1단계 | 2단계 | 3단계 | 4단계 | 5단계 |
| 주요 작업 | 시나리오 | 프롬프트 | 이미지 생성 | TTS 생성 | 영상 편집 |
| 사용 도구 | Grok/GPT | 장면 구성 | Auto Whisk | AI Studio | CapCut |
| 결과물 | 스크립트 | 묘사 문구 | 배경/캐릭터 | 음성 파일 | 최종 영상 |
위의 과정은 대부분 오픈소스 또는 무료 툴 기반으로 진행이 가능하여, 누구나 비용 부담 없이 시작할 수 있습니다.
3. 단계별 상세 작업법
3-1. 스토리 스크립트 만들기
영상은 시네마틱 감성의 이야기가 핵심입니다. 지브리 스타일의 전형적인 구조를 활용하면 더 효과적입니다.
- 주인공의 외로움 혹은 무언가에 대한 갈망
- 자연 속 신비한 존재와의 우연한 만남
- 조용하고 따뜻한 감정의 변화
이러한 구성을 프롬프트로 만들어 AI에 입력하면 ‘그림이 그려지는 대사’를 포함한 풍부한 시나리오가 완성됩니다.
예시) "한 소녀가 바람 부는 숲속에서 빛나는 여우를 만난다. 카메라는 그녀의 놀람과 여우의 눈빛을 번갈아 담는다."
3-2. 장면별 프롬프트 생성
각 장면(Scene)을 시각적으로 구현하기 위해서는 등장인물, 감정, 배경, 시간대를 정확하게 묘사하는 것이 중요합니다.
예시 프롬프트:
"지브리 스타일, 소녀와 빛나는 여우, 늦은 오후 햇살, 얕은 심도, 바람에 흩날리는 꽃잎, 감성적인 수채화"
3-3. Auto Whisk로 이미지 자동 생성
Auto Whisk는 설정된 프롬프트를 기반으로 지브리풍 이미지를 일관성 있게 생성해주는 강력한 도구입니다.
- 설치는 GUI 또는 CLI 방식으로 모두 가능합니다.
- 고성능 GPU가 없어도 로컬 환경에서 실행할 수 있습니다.
- 여러 장면을 단위별로 연속 생성하는 기능이 뛰어납니다.
프롬프트를 텍스트(.txt) 파일로 미리 정리해두고 순차적으로 입력하면, 전체 영상에서 일관된 톤앤매너를 유지하는 이미지를 손쉽게 얻을 수 있습니다.
3-4. AI 나레이션 삽입 (Grok AI + AI Studio)
아름다운 이미지만으로는 부족한 감동을 채우기 위해 TTS(Text-to-Speech) 나레이션을 삽입합니다.
- Grok AI: 텍스트 기반의 감성적인 음성 스크립트를 생성합니다.
- AI Studio: 생성된 스크립트를 실제 사람 같은 목소리로 변환합니다. (한국어 완벽 지원)
주의할 점은 목소리의 톤과 속도를 영상 분위기에 맞춰 세밀하게 조절해야 한다는 것입니다. 대사와 장면의 타이밍을 맞추는 것이 지브리 감성 영상의 가장 큰 핵심입니다.
3-5. 영상 편집 및 완성 (CapCut)
마지막으로 모바일이나 PC에서 CapCut(캡컷)을 사용하여 모든 요소를 하나로 합칩니다.
- 이미지 클립을 타임라인에 맞게 정렬합니다.
- 나레이션과 잔잔한 배경음악(BGM)을 삽입합니다.
- 감성적인 트랜지션(화면 전환)과 효과를 추가합니다.
- 유튜브용 16:9 또는 쇼츠용 9:16 포맷으로 변환하여 내보냅니다.
단 하나의 앱에서 기획부터 업로드 준비까지 모두 처리할 수 있다는 것이 큰 장점입니다.
4. 마무리 팁과 참고자료
지브리 스타일의 핵심은 "느림"과 "공감"에 있습니다. 너무 빠르게 지나가는 화려한 영상보다는 시청자가 여운을 느낄 수 있는 긴 호흡의 연출을 추천합니다.
더 구체적인 프롬프트 예시와 이미지 샘플, 그리고 실제로 완성된 영상이 궁금하시다면 아래 링크를 참고해 주세요.
🛠 작업 툴 요약 정리
- 스토리 생성: ChatGPT / Claude
- 이미지 생성: Auto Whisk
- 나레이션: Grok AI + AI Studio
- 최종 편집: CapCut
댓글