유튜버들은 왜 AI 음성에 집중할까?
얼굴과 목소리를 노출하지 않아도 인기 유튜버가 될 수 있는 방법이 여기에 있다.
BY 에디터 안세은(싱글즈 프렌즈) | 2023.07.24영상출처: 유튜브 ‘내하루’
영상출처: 유튜브 ‘뛰뛰빵빵 김옥순’
알고리즘에 이끌려 한 번쯤 들어본 급발진 목소리
혜성처럼 등장한 유튜버 내하루는 자신의 하루를 소개하는 짧은 영상으로 채널 개설 약 한 달 만에 21만 구독자를 달성했고, 숏츠 영상의 대부분이 조회 수 100만 회 이상을 기록했다. 또 유튜버 뛰뛰빵빵 김옥순 채널은 짧은 리뷰 영상으로 채널 개설 약 3주가 지난 시점에 최고 조회수 508만 회를 기록했다. 두 계정 모두 특이한 목소리와 재밌는 드립으로 사람들의 시선을 사로잡은 것이 특징이다.
여기서 주목할 점은 두 계정의 정체성이라고 할 수 있는 그 특이한 목소리가 똑같다는 사실이다. 이유는 해당 유튜버의 실제 목소리가 아닌 AI로 생성한 목소리이기 때문. 이를 인지하지 못한 시청자들은 왜 목소리가 비슷한지에 의문을 품기도 했다. 실제로 ‘내하루’를 검색하면 세 번째로 높은 연관 검색어가 ‘내하루 목소리’일 정도로 많은 사람이 여전히 많은 의문을 품고 있음을 알 수 있다.
다양한 AI 음성 서비스
두 유튜버는 AI 목소리 변환을 위해 타입캐스트를 활용했다. 타입캐스트는 인공지능 연기자 서비스로 텍스트만 입력하면 쉽게 가상 인간이 말하는 영상을 만들 수 있도록 돕는다. 이 서비스는 유튜버들 사이에서 입소문이 나면서 사용자가 많이 늘었고, 2022년 11월 기준 120만 명 이상이 사용 중이라고 한다.
이러한 AI 음성 생성 서비스를 음성합성시스템 및 TTS(Text To Speech)라고 부른다. 낯설다고 느껴질 수 있지만 사실 이는 일상생활 속에서 생각보다 자연스럽게 자주 접한다. 트위치 영상을 보다 만나는 후원 도네이션 목소리, 지하철과 신호등의 안내 멘트 등 다양한 영역에서 활발하게 활용되고 있기 때문이다. 이 TTS는 유튜브, 틱톡, 인스타그램 등 SNS에서는 실제 자신의 목소리를 공개하기 싫은데 영상을 찍고 싶거나 좀 더 친근하게 다가가고, 재미를 주기 위해 사용된다. 즉, 효과음으로만 사용되던 짧은 음성이 이제는 영상 전체에 사용되고 있다. 이는 영상 콘텐츠계의 새로운 움직임이며, 이미 많은 사람들이 이러한 TTS 서비스를 더욱 적극적으로 사용하고 있다.
숏츠계의 샛별을 꿈꾸고 있는 당신을 위한 TTS 사이트

이미지 출처 : 클로바 더빙 홈페이지 clovadubbing.naver.com
클로바더빙
클로바더빙은 네이버에서 출시한 AI 더빙 서비스로 자사 음성 합성 AI 기술인 ‘클로바 보이스’를 활용하고 있다. 따로 녹음을 하지 않고 타이핑만으로 더빙이 가능하며, 남녀노소 130종의 목소리를 제공하고 있다. 여기에 한국어는 물론 영어, 일본어까지 지원하며, 영상물 제작을 함께 할 수 있어 영상 편집 프로그램처럼 활용할 수 있다는 점도 장점이다. 현재까지 생성된 더빙 음성은 약 1000만 건, 더빙 콘텐츠 다운로드 수는 약 100만 건에 이를 정도로 이미 많이 사용되고 있다.

이미지 출처 : 타입캐스트 홈페이지 typecast.ai
타입캐스트
400여 개의 특색 있는 목소리를 제공하는 타입캐스트는 전문 성우가 녹음한 것 같은 자연스러운 AI 보이스가 담긴 점이 특징이다. AI 성우와 가상 인간으로 나만의 콘텐츠를 만들 수 있는 만큼 얼굴 노출에 자신이 없어 영상 제작을 주저하던 사람에게 특히 추천한다. 특히 감정 조절이 가능하여 어색한 기계음이 아닌 콘텐츠에 적합한 생생한 감정과 함께 톤, 말 빠르기 등을 조절할 수 있는 점은 타입캐스트의 강점. 클로바 더빙과 마찬가지로 비디오 제작도 가능해 편집의 수고도 적기 때문에, 유튜브와 같은 SNS는 물론 수업 자료 등에서 다양하게 활용하기 좋다.
다만 이러한 TTS 영상을 만들 때 주의할 점이 있다. 당연한 이야기지만 가짜 영상을 만들면 안 된다. TTS 기술이 발전하면서 실제 상황과 비슷한 가짜 영상이 많은 사람에게 혼란을 주고 있다. 최근 인터넷에서 화제가 된 영상 중 프랑스 축구 선수 음바페의 기자회견 영상이 대표적인 예. 해당 영상에서 음바페는 일본 기자의 “이강인 선수의 영입이 마케팅 목적이라고 생각하나”라는 질문에 대해 이강인을 감싸는 듯한 말을 하는데, 사실 이 영상은 기자의 질문을 TTS로 생성해 합성한 가짜 영상이었다. 해당 영상의 조회수가 1100만 회를 넘은 만큼 많은 사람을 속이는데 성공한 것. 따라서 사회의 혼란을 야기하는 가짜 영상 제작은 경계를 해야 한다.
ai성우
클로바더빙
타입캐스트
유튜브
ai더빙
숏츠
유튜버
네이버
유튜브
클로바


