Page 30 -
P. 30

2   대사를 입력하는 방법은 두 가지가 있습니다. 아래 설명을 참고하여 텍스트 또는 오디오를 입
                         력한 후 [Generate]를 클릭하면 영상과 음성의 합성이 시작됩니다.







                                                                A         B

                                                  텍스트 프롬프트 입력










                                                                 목소리 선택
                                                                           클릭하여 영상 생성



                             A   Text to Speech: 영상 속 등장인물이 말할 내용을 텍스트 스크립트로 직접 입력하는 방식입니다. 클링에 내장
                              된 텍스트-투-스피치(TTS) 엔진이 이 텍스트를 음성으로 합성하고, 그 음성에 맞게 영상 속 인물의 입술 움직임
                              을 조정합니다. 언어는 영어 또는 중국어만 지원합니다.

                             B   Upload Local Dubbing: 미리 녹음해둔 음성 오디오 파일(MP3, WAV)을 업로드하면 해당 음성에 맞게 인물의
                              입술 움직임을 조정하여 영상을 생성합니다. 실제 목소리를 입힐 때 사용하면 좋습니다.


                          3   잠시 기다리면 영상 속 인물이 마치 그 음성을 말하고 있는 것처럼 입 모양이 움직이는 영상이
                         생성됩니다.























                         TIP   인물의 입 부분이 잘 보이는 영상을 업로드해야 정확한 합성이 가능합니다. 얼굴이 너무 옆을 향하고 있거나, 입이 손이나 물
                         체에 가려져 있는 경우에는 결과물이 어색하게 생성됩니다. 또, 음성의 감정이나 억양까지 완벽히 반영되지는 않으므로, 가능하다면
                         영상의 분위기와 어울리는 억양의 음성을 선택하는 것이 좋습니다.



                                                                                PART 5  AI 영상 생성 툴 살펴보기     |    229






          책1.indb   229                                                                            2025. 7. 31.   오전 10:45
   25   26   27   28   29   30   31   32   33   34