[AIDEA] 쓰기만 하면 내 목소리로 말해준다고? AI VOICE
대홍기획 기사입력 2024.08.14 09:48 조회 525
 

* ‘AIDEA’는 AI와 IDEA의 합성어로 크리에이티브 아이디어에 AI를 결합한 사례를 다룹니다. 이번 글에서는 롯데어워즈에서 상영했던 창업주 격려사 사례를 통해 Voice 생성 AI인 ‘Eleven Labs’를 소개합니다.

 

대홍기획 AI 스튜디오는 국내 최초, 국내 유일의 Non-shooting film 제작 스튜디오입니다. AI를 어떻게 크리에이티브에 녹여낼지, 더 크리에이티브한 활용 방안은 없는지, AI가 끼칠 수 있는 선한 영향력은 없을지 고민하며 다양한 클라이언트와 함께하고 있습니다.

롯데어워즈는 매년 도전과 혁신 정신으로 고객가치를 창출한 성과를 격려하고 전파하기 위해 개최됩니다. 올해 행사를 위해 신격호 창업주의 목소리로 전하는 격려사 영상을 AI STUDIO에서 제작했는데요. AI 기술로 신 창업주의 목소리를 복원해 임직원들에게 도전과 혁신을 이어가자는 응원의 메시지를 담았습니다.

 
대홍기획 AI 스튜디오에서 AI 기술을 바탕으로 롯데 신격호 창업주의 목소리로 전하는 격려사 영상을 제작했다. 영상 내 48분 26초부터 들을 수 있다. 

 

AI가 구현해내는 자연스러운 목소리, Eleven Labs


거의 완벽한 보이스 복제 AI로 많은 우려와 함께 발전하고 있는 Eleven Labs를 소개합니다. Eleven Labs는 발렌시아가 버전의 해리포터 영상에서부터 활용됐던, 꾸준히 개발 중인 AI입니다. 당시만 해도 목소리에 약간의 일반 TTS처럼 부자연스러움이 있었지만 현재로서는 거의 완벽하게 자연스러워진 상황입니다.

Eleven Labs의 압도적인 성능은 다양한 언어로 구동된다는 데서 드러납니다. 영어 보이스를 학습시켜 한국어로 출력하는 것도 가능하고 반대도 가능합니다. 대략 29개의 언어가 서로 호환됩니다. 다른 언어인데도 불구하고 말투가 재현되는 기술이 대단합니다.

Eleven Labs 자체에서 제공하는 목소리들도 있지만 무엇보다 Eleven Labs를 주목받게 만드는 기술은 Voice Cloning입니다. 특정인의 목소리를 10 문장에서 20 문장 정도, 더 정교하길 원한다면 30초에서 1분 정도의 스피치를 Eleven Labs에 입력해줍니다. 잠시 후면 Eleven Labs가 이를 분석하고 목소리를 복제하는데요. 이때부터는 기존의 TTS처럼 어떤 문장이든 읽도록 할 수 있습니다. 한 번에 원하는 결과물이 나오진 않지만, 여러 번 읽도록 하면 몇 번 지나지 않아 자연스러운 목소리가 생성됩니다.

 


Voice Cloning은 다른 방식으로도 가능한데요. 기존의 Text to Speech 방식이 아닌 Speech to Speech 기능입니다. 목소리를 통째로 변환하는 기술로 녹음 파일을 입력하면 다른 목소리로 바꿔줍니다. 기존의 음성 변조 기술처럼 높낮이를 조절하거나 누구인지 못 알아보게 하는 기술이 아닙니다. 아예 다른 사람의 목소리인 것처럼 바꿔주는데요. Text to Speech 보다 더 유용한 점은 목소리의 강약이나 맥락을 좀 더 원하는 대로 조절할 수 있다는 점입니다.

Voice Cloning 기술이 나레이션에서는 유용하지만 아직 연기나 리액션 등 감정을 담기에는 부족함이 있는데 Speech to Speech 기능을 사용하면 이를 보완할 수 있습니다. 다만 단점은 원본 음성의 발음이 정확해야만 AI가 바르게 인식한다는 것입니다.

AI 보이스 기술의 활용에는 많은 고민과 사회적 합의, 각 개인의 윤리의식 제고와 실천이 필요합니다. 연예인, 성우 등의 목소리를 악용하거나 타인의 목소리를 복제해 이용하는 시대를 대비해야 합니다. 목소리 복제를 실현하는 비용도, 시간도, 난이도도 매우 낮아졌기 때문에 자신이 하지 않은 말이 마치 자신이 한 것처럼 인터넷을 돌아다닐 수 있는 날이 눈앞에 다가왔습니다. AI STUDIO에서도 이와 같은 문제들을 미연에 방지하기 위해 임직원 스스로의 목소리로 테스트하거나 꼼꼼하게 감수를 받고 있습니다.

 

이런 팁을 적용해보세요!
Eleven Labs에서 뜻대로 결과물이 생성되지 않는다면 쉼표와 마침표, 느낌표와 물결표 등의 기호를 적극 활용해보세요. Eleven Labs는 그 어조 차이를 인식합니다. 예를 들어서 “안녕하세요” “안녕하세요~” “안녕하세요!” 이 셋 모두가 일레븐 랩스에서 전혀 다른 톤으로 출력됩니다.

또 하나의 팁은 발음 그대로 입력하는 것입니다. 일레븐 랩스가 한국어와 한글을 굉장히 잘 인식하지만, 한국인만 알 수 있는 차이를 반영하지 못한다면 연음이나 두음법칙, 구개음화 등을 직접 입력해주세요. 예를 들면 “국물을 국자로 떴다”와 같은 문장을 “궁무를 국짜로 떴다” 이렇게 입력해주는 겁니다. 한 음절, 한 음절 세세하게 신경쓸수록 더 자연스럽게 한국인이 말하는 듯한 보이스가 완성됩니다.

 

프로젝트를 마치며
AI가 더 잘할 수 있는 일, AI라서 할 수 있는 일, AI가 해서 의미가 있는 일의 세 가지 모두에 해당했던 프로젝트였습니다. 롯데어워즈의 창업주 격려사 영상은 신 창업주의 목소리를 복원하는 것으로 시작됐는데요. 생전의 목소리를 재현하는 과정이 흥미롭고 의미 깊었습니다. 이 프로젝트를 진행하면서 이제 세상에 없어서 그리운 분들의 목소리를 다시 들려주는 방식으로도 보이스 AI가 긍정적으로 활용될 수 있다는 것을 알았습니다. AI 보이스의 영역은 점점 더 넓어질 것으로 예상됩니다. 이번 롯데어워즈 창업주 격려사 프로젝트처럼 새로운 기술이 새로운 감동을 줄 수 있는 계기가 되도록 AI STUDIO도 더욱 노력하겠습니다.

 

앞으로도 다양한 AI 툴을 크리에이티브에 접목한 사례를 소개할 예정이니 많은 관심 부탁드립니다. 사용팁이 궁금한 생성형 AI, 혹은 제작 과정이 흥미로운 AI 스튜디오의 결과물이 있다면 메일로 보내주세요. 글의 소재에 최대한 반영하겠습니다.

Ai ·  AIvoice ·  AI목소리 ·  AI스튜디오 ·  AI툴 ·  ElevenLabs ·  insight ·  고유진 ·  대홍AI ·  롯데어워즈 · 
이 기사에 대한 의견 ( 총 0개 )
2023년 광고 시장 결산 및 2024년 전망
2023년 연초 광고 시장에 드리웠던 불안한 예감은 현실이 됐다. 지난 2021년 20.4%라는 큰 성장 이후 2022년 5.4% 재 성장하며 숨 고르기로 다시 한번 도약을 준비하던 광고 시장이었다. 하지만 발표된 다수의 전망들은 2023년 광고 시장의 축소를 내다보고 있다. 한국방송광고진흥공사에 따르면 2023년 광고비는 전년 대비 3.1%p 하락으로 전망됐고, 이중 방송 광고비는 17.7% 감소가 예상됐다.
[어텐션, 크리에이터]2023 최다 조회수 인기 쇼츠 TOP 5
하루에도 수없이 올라오는 유튜브 쇼츠. 그중에서도 소수의 영상만이 알고리즘의 선택을 받아 대중에게 널리 널리 퍼진다. 그렇다면 과연 지난해엔 어떤 쇼츠가 우리들의 눈길을 사로잡았을까? 올해 콘텐츠를 준비하기에 앞서 2023년 가장 많은 조회 수를 끈 쇼츠를 복습해 보자.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
2024년 미디어&광고 동향
    변화하는 시대의 흐름과 하나가 되어 지난 2월, ‘DUNE : Part Two’ 홍보를 위해 한국을 찾은 티모시 샬라메(Timothee Chalamet)의 소식으로 한동안 연예계가 들썩였다. 덕분에 생각지 못한 멋진 영화를 접했고, 올해 미디어 전략의 방향성을 고민하던 나에게 광활한 아라키스 행성의 사막 폭풍을 헤쳐 나가는 티모시의 여정은 좀 더 색다른 의미로 다가왔다. 영화 속 결정적인
[Close up] 2022년 국내 광고 시장 9.3% 성장한 15조 2,842억 원 전망
 2022년 국내 광고 시장 9.3% 성장한 15조 2,842억 원 전망 제일기획, 국내 총 광고비 결산 및 전망 발표 자료제공 제일기획  
[Column] 광고의 사회적·문화적·경제적 순기능
광고는 자유 시장경제를 추구하고 있는 사회에서 다양한 역할들을 수행하고 있다. 때로는 사람들에게 풍요로운 삶을 제안하여, 인생의 목표를 수정하게 하고, 현실의 고독함을 미래의 희망으로 대체하기도 한다. 또 때로는 그 풍요로운 삶의 제안으로 인해 평범한 사람들에게 허탈감을 느끼게 한다. 그러나 문명사회에서 광고는 사람들과의 관계 속에서 그 역할이 결정되고, 사회의 다른 제도들과 통합적인 기능을 할 때 인간의 희망적인 삶이 광고로 인해 형성될 수 있다는 점은 분명하다. 따라서 광고가 현재 인간과 사회에 어떤 기능을 하고 있는지를 살펴본다면 광고가 미래에 무엇을 어떻게 해야할 것인지를 예측할 수 있을 것이다.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
[테크 돋보기] 얼굴이 말해 주는 것들 | 얼굴 인식 기술을 활용한 맞춤형 서비스
  MIT는 매년 3월마다 격월지 『테크놀로지 리뷰』를 통해 10대 유망 기술(Breakthrough Technologies)을 선정한다. IT 전문 기관 가트너가 매년 10월 선정하는 전략 기술과 마찬가지로 업계에서 무게감을 가지며, 기술의 발전 속도나 활용성에 대해 가늠하는 잣대가 된다. 올해 선정된 유망 기술 중 얼굴 인식 기술을 기반으로 한 결제 기술에 대해 살펴보자.     MIT 선정 혁신 기술, ‘얼굴 인식&rsquo
광고회사 광고주 현황조사
광고회사 현황조사 광고회사 성장세 주춤한 가운데, 해외물량 늘어 ’23년 10대 광고회사 취급액 20조 8,218억 원
우리가 궁금한 소비 트렌드가 여기에! <2025 D.라이프 시그널 리포트>
  어느새 다가온 2025년. 새해에 우리는 어떤 변화를 맞게 될까요? 라이프스타일과 비즈니스는 어떻게 달라질까요? 대홍기획이 발간한 <2025 D.라이프 시그널 리포트>에서 그 시그널을 확인해보세요. 우리 주변의 흥미로운 현상들, 파편처럼 보이던 이슈를 이어 그 저변을 관통하는 소비와 비즈니스의 맥락을 찾을 수 있답니다!   Q 대홍기획이 발행하는 <D.라이프 시그널 리포트>란 무엇인가요?
[Column] 광고의 사회적·문화적·경제적 순기능
광고는 자유 시장경제를 추구하고 있는 사회에서 다양한 역할들을 수행하고 있다. 때로는 사람들에게 풍요로운 삶을 제안하여, 인생의 목표를 수정하게 하고, 현실의 고독함을 미래의 희망으로 대체하기도 한다. 또 때로는 그 풍요로운 삶의 제안으로 인해 평범한 사람들에게 허탈감을 느끼게 한다. 그러나 문명사회에서 광고는 사람들과의 관계 속에서 그 역할이 결정되고, 사회의 다른 제도들과 통합적인 기능을 할 때 인간의 희망적인 삶이 광고로 인해 형성될 수 있다는 점은 분명하다. 따라서 광고가 현재 인간과 사회에 어떤 기능을 하고 있는지를 살펴본다면 광고가 미래에 무엇을 어떻게 해야할 것인지를 예측할 수 있을 것이다.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
[테크 돋보기] 얼굴이 말해 주는 것들 | 얼굴 인식 기술을 활용한 맞춤형 서비스
  MIT는 매년 3월마다 격월지 『테크놀로지 리뷰』를 통해 10대 유망 기술(Breakthrough Technologies)을 선정한다. IT 전문 기관 가트너가 매년 10월 선정하는 전략 기술과 마찬가지로 업계에서 무게감을 가지며, 기술의 발전 속도나 활용성에 대해 가늠하는 잣대가 된다. 올해 선정된 유망 기술 중 얼굴 인식 기술을 기반으로 한 결제 기술에 대해 살펴보자.     MIT 선정 혁신 기술, ‘얼굴 인식&rsquo
광고회사 광고주 현황조사
광고회사 현황조사 광고회사 성장세 주춤한 가운데, 해외물량 늘어 ’23년 10대 광고회사 취급액 20조 8,218억 원
우리가 궁금한 소비 트렌드가 여기에! <2025 D.라이프 시그널 리포트>
  어느새 다가온 2025년. 새해에 우리는 어떤 변화를 맞게 될까요? 라이프스타일과 비즈니스는 어떻게 달라질까요? 대홍기획이 발간한 <2025 D.라이프 시그널 리포트>에서 그 시그널을 확인해보세요. 우리 주변의 흥미로운 현상들, 파편처럼 보이던 이슈를 이어 그 저변을 관통하는 소비와 비즈니스의 맥락을 찾을 수 있답니다!   Q 대홍기획이 발행하는 <D.라이프 시그널 리포트>란 무엇인가요?
[Column] 광고의 사회적·문화적·경제적 순기능
광고는 자유 시장경제를 추구하고 있는 사회에서 다양한 역할들을 수행하고 있다. 때로는 사람들에게 풍요로운 삶을 제안하여, 인생의 목표를 수정하게 하고, 현실의 고독함을 미래의 희망으로 대체하기도 한다. 또 때로는 그 풍요로운 삶의 제안으로 인해 평범한 사람들에게 허탈감을 느끼게 한다. 그러나 문명사회에서 광고는 사람들과의 관계 속에서 그 역할이 결정되고, 사회의 다른 제도들과 통합적인 기능을 할 때 인간의 희망적인 삶이 광고로 인해 형성될 수 있다는 점은 분명하다. 따라서 광고가 현재 인간과 사회에 어떤 기능을 하고 있는지를 살펴본다면 광고가 미래에 무엇을 어떻게 해야할 것인지를 예측할 수 있을 것이다.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
[테크 돋보기] 얼굴이 말해 주는 것들 | 얼굴 인식 기술을 활용한 맞춤형 서비스
  MIT는 매년 3월마다 격월지 『테크놀로지 리뷰』를 통해 10대 유망 기술(Breakthrough Technologies)을 선정한다. IT 전문 기관 가트너가 매년 10월 선정하는 전략 기술과 마찬가지로 업계에서 무게감을 가지며, 기술의 발전 속도나 활용성에 대해 가늠하는 잣대가 된다. 올해 선정된 유망 기술 중 얼굴 인식 기술을 기반으로 한 결제 기술에 대해 살펴보자.     MIT 선정 혁신 기술, ‘얼굴 인식&rsquo
광고회사 광고주 현황조사
광고회사 현황조사 광고회사 성장세 주춤한 가운데, 해외물량 늘어 ’23년 10대 광고회사 취급액 20조 8,218억 원
우리가 궁금한 소비 트렌드가 여기에! <2025 D.라이프 시그널 리포트>
  어느새 다가온 2025년. 새해에 우리는 어떤 변화를 맞게 될까요? 라이프스타일과 비즈니스는 어떻게 달라질까요? 대홍기획이 발간한 <2025 D.라이프 시그널 리포트>에서 그 시그널을 확인해보세요. 우리 주변의 흥미로운 현상들, 파편처럼 보이던 이슈를 이어 그 저변을 관통하는 소비와 비즈니스의 맥락을 찾을 수 있답니다!   Q 대홍기획이 발행하는 <D.라이프 시그널 리포트>란 무엇인가요?