지난 편에서는 카피, 이메일, 시나리오처럼 광고 업무에 활용해 볼 수 있는 텍스트 위주의 생성 AI 툴을 소개했다. 이번 편에서는 영상, 사운드, 디자인 등 시각적인 측면에서 크리에이티브한 업무의 효율성을 높일 툴에 대해 알아보자.
비주얼 크리에이티브, 콘티 제작에는: Midjourney, DALL·E, Stable Diffusion, Adobe Firefly
정교한 표현의 이미지를 생성할 수 있는 Midjourney
(출처: Midjourney 공식 홈페이지)
좋은 아이디어라도 사람들에게 말로만 설명하기는 쉬운 일이 아니다. 비주얼 크리에이티브를 함께 보여주면 보다 쉽게 전달할 수 있다. Text to Image 생성 AI 툴은 내가 생각하는 것을 텍스트로 나타내면 이미지로 만들어 준다. 각 툴의 모델에 따라 그림 스타일이나 사진의 느낌이 다르기 때문에 다양한 툴을 사용해 보고, 나타내고자 하는 크리에이티브에 적절한 툴을 선택하면 된다. 생성된 이미지를 조금씩 수정하거나 확대하는 등의 기능을 활용해 내가 상상하는 비주얼과 최대한 유사하게 제작할 수 있다. 생성 AI에서는 추상적인 의미의 단어들은 잘 그려주지 못하는 경향이 있어, 최대한 명확하게 표현할 수 있는 배경 및 오브제들을 설명해 이미지를 제작하자. 이제는 등장인물의 포즈, 시각, 카메라 각도 등까지 디테일하게 설정할 수 있어 정교한 표현이 가능해지고 있다. 광고 영상을 제작할 스토리가 있다면 여러 장면으로 나누어 프롬프트를 작성하고 이미지를 생성해, 순서대로 나열하면 콘티 결과물이 나올 수 있다.
동영상 생성에는: Runway, Kaiber, DID, Synthesia, Pictory, Fliki, Descript
텍스트만으로 비디오를 생성해 주는 Runway
(출처: Runway 공식 홈페이지)
최근 서비스를 시작한 생성 AI 툴들은 이미지뿐만 아니라 동영상까지 빠르게 생성하는 기능을 가지고 있다. 만족스러운 디테일은 아닐 수 있지만, 이미지를 기반으로 움직이는 영상을 제작하는 툴들이 등장하고 있다. 예를 들어 호수 사진으로 물이 찰랑이는 영상이나, 모닥불 사진으로 불이 바람에 흩날리는 영상을 만든다. 또는 영상을 제작할 스크립트가 있으면 텍스트의 내용을 바탕으로 자동으로 장면을 나누어, 장면 별로 가장 적절한 스탁 이미지 및 영상 풋티지를 검색해 불러오고, 배경음악 등을 삽입해 몇 분 만에 그럴듯한 영상을 만들어 낸다. 사람의 상반신 이미지와 텍스트를 기반으로, 말하는 인간의 영상을 즉석에서 제작하는 생성 AI 솔루션도 인기를 얻고 있다.
음악, 목소리 등의 사운드 생성에는: MusicLM, Eleven Labs, Wellsaid, Resemble.ai, Murf.ai
내 목소리를 바탕으로 오디오를 생성할 수 있는 ElevenLabs
(출처: ElevenLabs 공식 홈페이지)
이미지나 텍스트만 만들어 내는 것이 아니다. 사운드도 만든다. 작곡도 생성 AI로 한다. 분위기와 박자, 표현하고 싶은 느낌 등을 토대로 간단하게 음악을 생성할 수 있다. 희망하는 남녀 목소리 톤을 선택하거나 자신의 목소리를 기반으로 학습해, 내가 원하는 텍스트를 말하게 하는 음성을 생성할 수도 있다. 최근에는 AI 음악 커버가 유행이다. 얼마 전 방한해 콘서트를 가졌던 ‘브루노 마스’의 목소리로 ‘뉴진스’의 ‘Hype Boy’를 들을 수 있다. 대중들이 직접 좋아하는 노래를 듣고 싶은 가수의 목소리로 생성해 음원을 만들어 내고 유튜브에 올려 많은 반응을 얻고 있다. 목소리의 라이선스를 사고파는 시대가 머지않았다. 곧 내 최애 가수의 목소리로 모든 노래를 들을 수 있는 서비스가 나올지도 모른다.
캡션, 회의록 작성 등 비디오 및 오디오 정보 추출이 필요할 때는: 클로바, Vrew, Assembly, Whisper, Twelve Labs
회의록 작성에 최적화된 클로바노트
(출처: 클로바노트 공식 홈페이지)
말을 꽤 잘 알아듣는 AI들로 인해 내 귀와 손이 더 편해진다. 회의나 강의 시간에 녹음기를 켜 놓기만 하면 그 내용이 상당히 정확하게 텍스트로 변환된다. 회의록과 컨택 리포트 작성에 큰 도움이 될 수 있다. 비슷한 기술을 활용해 비디오 자막도 쉽게 생성이 가능하다. 영상에서 말하는 내용이 자막으로 자동 생성되게 만드는 방법으로 단순 작업을 효율화해 보자.
로고, UI, 웹 디자인 등의 디자인에는: Galileo AI, Uizard, Looka(로고), FlairAI, Poly, Tome, Typeface, Debuild
디자이너가 아닌데 디자인해야 하는 상황이라면? 그럴 때 사용할 수 있는 디자인 생성 AI 툴이 존재한다. 상용 서비스의 결과물은 실력 있는 디자이너가 맡아야 하겠지만, 간단한 초안이나 사내에서 활용하는 이미지들은 AI에 맡겨봐도 좋다. 컨셉과 내용이 준비되었다면, 로고부터 웹페이지 디자인 등의 결과물을 받아보자. 수많은 디자인 이미지를 학습해 프롬프트 텍스트로 GUI를 그려주어 디자인을 완성하는 서비스들이다. 100% 만족스럽다기보다는 레퍼런스로 쓸만한 디자인을 빠른 시간 내에 얻을 수 있을 것이다.
코딩으로 업무 성과 높이기: Github Copilot, ChatGPT, Replit Ghostwriter
완성도 높은 코드를 생성하는 Github
(출처: Github 공식 홈페이지)
수많은 개발자가 서로 코드를 공유하는 Github의 방대한 데이터를 바탕으로 학습해 엄청난 코딩 천재가 탄생했다. 개발을 전문적으로 배우지 않은 사람이라도 어느 정도의 지식만 있다면 자연어로 요청해 원하는 기능의 코드를 생성할 수 있다. ChatGPT도 원하는 기능과 맥락, 레퍼런스 등을 통해 요청하면 완성도 높은 코드를 생성한다. 파이썬 같은 프로그래밍 언어로 업무에 필요한 간단한 크롤링, 랜덤 추첨 기능의 코드를 생성하거나, 웹페이지를 구축할 때 사용되는 HTML, CSS, Javascript 코드 등을 생성해 업무에 활용해 보자. 코딩을 조금만 할 줄 알아도 코딩 천재 생성 AI의 도움을 받아 혼자서는 못 만들 결과물을 만들어 낼 수 있다. 생성 AI를 활용한 코딩으로 업무에 자동화를 적용한다면, 반복 업무를 줄여 효율적으로 일할 뿐만 아니라, 창의적인 업무에 집중해 성과를 높일 수 있을지도 모른다.
다양한 업무에 적용할 수 있는 생성 AI는 가장 중요한 것에 집중하도록 시간과 노력을 절약해 줄 수 있다. 필요에 맞는 도구를 찾아 활용하면 업무 수행 방식을 개선하고 성과를 거두고, 복잡한 작업을 효율적으로 해결하며 창의적인 역량을 발휘할 수도 있다. 앞으로 더 많은 서비스가 쏟아져 나올 것이며, 앱스토어와 유사하게 생성 AI를 다운받아 사용하는 형태가 보편화될지도 모른다. 생성 AI는 일상과 업무에 혁신을 가져올 수 있는 강력한 도구가 될 수 있다.
하지만 이와 함께 조심해야 할 사항도 있다. 업무에 생성 AI를 도입할 때는 저작권과 보안 관련 등의 사항에 대해 신중한 고려가 필요하다. AI가 학습한 데이터를 기반으로 결과물을 생성하다 보니, 결과물이 학습을 거친 원본 데이터와 유사해 원작자의 권리를 침해할 수도 있고, AI를 통해 생성된 결과물의 권리를 제대로 보장받을 수 없는 경우가 발생할 수도 있다. 생성 AI의 결과물을 상용으로 사용하기 위해서는 저작권 이슈가 없는 보증된 도구를 사용하거나, 생성된 콘텐츠의 저작권을 최종적으로 확인할 필요가 있다. 또한 업무 시 조직의 보안에 민감한 비밀 정보가 유출되지 않도록 조심해야 한다. 고객들이 프롬프트로 입력한 데이터가 학습에 사용될 가능성도 있고, 정말 중요한 정보라면 모종의 경로를 통해 유출될 가능성까지 염두에 두어야 한다. 꼭 사용이 필요하다면 비밀 내용을 제외하고 일반화하여 프롬프트를 작성해야 한다. 기업에서 직접 AI 모델을 만들고 환경을 구축하여 사용하면 최적일테지만, 불가한 상황이라면 저작권 및 보안 등의 이슈 사항을 고려해 업무에 도입하자.