Page 30 -

P. 30

2 대사를 입력하는 방법은 두 가지가 있습니다. 아래 설명을 참고하여 텍스트 또는 오디오를 입
력한 후 [Generate]를 클릭하면 영상과 음성의 합성이 시작됩니다.

A B

텍스트 프롬프트 입력

목소리 선택
클릭하여 영상 생성

A Text to Speech: 영상 속 등장인물이 말할 내용을 텍스트 스크립트로 직접 입력하는 방식입니다. 클링에 내장
된 텍스트-투-스피치(TTS) 엔진이 이 텍스트를 음성으로 합성하고, 그 음성에 맞게 영상 속 인물의 입술 움직임
을 조정합니다. 언어는 영어 또는 중국어만 지원합니다.

B Upload Local Dubbing: 미리 녹음해둔 음성 오디오 파일(MP3, WAV)을 업로드하면 해당 음성에 맞게 인물의
입술 움직임을 조정하여 영상을 생성합니다. 실제 목소리를 입힐 때 사용하면 좋습니다.

3 잠시 기다리면 영상 속 인물이 마치 그 음성을 말하고 있는 것처럼 입 모양이 움직이는 영상이
생성됩니다.

TIP 인물의 입 부분이 잘 보이는 영상을 업로드해야 정확한 합성이 가능합니다. 얼굴이 너무 옆을 향하고 있거나, 입이 손이나 물
체에 가려져 있는 경우에는 결과물이 어색하게 생성됩니다. 또, 음성의 감정이나 억양까지 완벽히 반영되지는 않으므로, 가능하다면
영상의 분위기와 어울리는 억양의 음성을 선택하는 것이 좋습니다.

PART 5 AI 영상 생성 툴 살펴보기 | 229

책1.indb 229 2025. 7. 31. 오전 10:45

25 26 27 28 29 30 31 32 33 34