구글의 AI는 자비스를 꿈꾸고 있을까?
제일기획 기사입력 2024.07.17 09:33 조회 844
 전승민 과학 전문 저술가

챗GPT를 발표해 세상을 놀라게 했던 오픈AI가 챗GPT의 새 버전 ‘GPT-4o’를 깜짝 발표했다. GPT-4o의 가장 큰 특징은 지금까지 키보드로 소통해야 했던 대화형 AI에 사람의 말을 알아듣고 반응하는 ‘음성 대화’ 기능을 추가했다는 점이었다.

GPT-4o를 활용한 각종 기능을 시연하는 라이브 데모 (출처 : OpenAI 유튜브)

오픈AI가 이날 예정에도 없던 발표회를 갑작스럽게 단행한 이유는 분명했다. 하루 뒤인 14일, 경쟁사인 구글이 새로운 AI ‘아스트라’를 공개할 거라는 소식을 사전에 입수했기 때문이다. 아스트라 역시 GPT-4o처럼 자연스러운 대화가 가능한 AI다. 오픈AI 입장에선 비슷해 보이는 기술을 경쟁사보다 하루라도 늦게 공개하는 건 치명적일 수 있다. 지금까지 쌓아온 ‘대화형 AI 분야 선두 기업’ 이미지를 단 하루 차이에 잃을 수도 있기 때문이다. 대화형 AI 분야 양강으로 불리는 두 기업의 신경전이 극에 달했다는 평가가 나오는 대목이다.

‘AI’라는 말은 몰라도 ‘챗GPT’는 어디서 들어 봤다는 세상이다. 챗GPT는 이미 대화형 AI의 대명사가 됐으며, 실제로 오픈AI는 관련 시장에서 선두를 차지하고 있다. 그러나 기업으로서의 ‘종합적인 역량’을 따진다면 오픈AI가 구글을 넘어서기 어려워 보인다. 구글은 정보기술 분야 전 사업에 손을 뻗고 있다. 오픈AI 역시 자사와 협력 관계에 있는 여러 기업을 통해 다양한 서비스를 펴나가겠지만, 이미 IT 시장을 선점하고 있는 구글의 영향력이 상대적으로 크다는 점을 부인할 수 있는 사람은 그리 많지 않을 것이다.

이 점은 구글 스스로도 알고 있다. 따라서 구글이 강조한 것은 ‘생태계’였다. 자사의 AI ‘제미나이’를 이용해 모든 서비스를 유기적으로 통합하겠다는 것이다. 구글은 오픈AI의 발표 하루 뒤인 14일 오전(현지시간) 미국 캘리포니아 마운틴뷰에서 연례 개발자 컨퍼런스 ‘구글 I/O 2024’를 개최하고 “앞으로 모든 서비스에 제미나이를 연동하겠다”고 발표했다.

이미지, 텍스트, 음성 등을 통합적으로 이해해 검색하는 구글 제미나이 (출처 : 구글 공식 유튜브)

현재 구글의 ‘제미나이’는 ‘프로1.5’ 버전까지 공개돼 있는데, 굳이 버전을 새로 바꾸지는 않았지만 성능을 대폭 높였다고 했다. 고성능 멀티모달(텍스트, 이미지, 음성 등 여러 자료를 한 AI로 처리하는 방식)을 지원하므로 입력된 키워드를 이해할 뿐만 아니라, 다양한 주제어 간 연결 관계도 인식한다.

이걸로 뭘 할 수 있을까? 우선 들여다볼 부분은 ‘검색’이다. 구글이 IT 시장에서 두각을 드러낼 수 있었던 건 막강한 ‘인터넷 ‘검색’ 기능 덕분이었으며, 현재도 이 분야에서 가장 높은 점유율을 기록하고 있다. 제미나이를 통합하면 일반적인 문장 검색은 물론 사진을 이용한 포토 검색 등 기존 모든 서비스의 성능이 크게 높아진다. 그뿐 아니라 구글 포토, 구글 워크스페이스, 구글 자체 유통 스마트폰 ‘구글 픽셀’ 등도 모두 제미나이와 통합해 갈 계획이다. 즉 구글의 승부수는 ‘데이터의 통합’에 있다는 사실을 알 수 있다.

구글은 지난해에도 개발자 컨퍼런스를 통해 텍스트, 이미지, 비디오, 코드 등 다양한 자료를 통합적으로 인식하는 AI모델을 개발하겠다고 밝힌 바 있는데, 이제 그 본격적인 작업을 시작하려는 것이다. 변화의 핵심축은 제미나이 기반으로 작동하는 새로운 검색 서비스 ‘AI오버뷰’다.

복잡하고 긴 명령어로 검색을 해도 이를 종합적으로 분석, 한층 더 정확한 결과를 제공해 준다. 이전에는 단번에 답을 찾기 어려웠던 복잡한 질문도 알려줄 수 있다. 다양한 키워드를 뒤섞어 입력해도 AI의 다단계 추론 기능을 통해 답을 도출하는 기능도 갖고 있다.

예를 들어 제미나이가 통합되지 않은 현재 검색 기술을 사용해 집 주변에서 정기적으로 다닐 ‘헬스클럽’을 찾아본다고 가정해 보자. 헬스클럽, 피트니스센터, 다이어트 등의 검색어를 무작위로 입력해 검색창에 나타나는 업체의 정보를 하나하나 확인하고, 집에서 거리는 얼마나 되는지, 매월 회비는 얼마인지, 시설은 어떤지 등을 일일이 찾아봐야 한다. 이는 적지 않은 노동이다. 그런데 AI오버뷰를 이용하면 제미나이를 통해 지시만 하면 된다. “집에서 걸어서 30분 거리에 있고, 평점이 4.0 이상이어야 하며, 샤워 시설이 포함돼 있어야 한다”는 식으로 조건을 내걸기만 하면 AI가 이를 이해하고 자동으로 적합한 곳을 찾아 준다.

응용 방법은 다양하다. 사진 관리도 가능하므로 스마트폰 카메라로 촬영된 영상을 실시간으로 분석할 수도 있다. 사진 속 물체를 분석해 관련 정보를 찾아낼 수 있는 것이다. 신발을 촬영하면서 반품 방법을 묻는다면, 이미지 속 구매 영수증을 찾아내 제시한다.

이런 점만큼은 오픈AI의 기술력이 아무리 뛰어나다 해도 구글을 극복할 수 없다. 구글은 전 세계 사용자들에게 받아 축적해 온 방대한 ‘데이터’를 갖고 있는데, 오픈AI는 이것이 절대적으로 부족하다.

구글도 GPT-4o 같은 음성인식 AI 비서를 공개했다. ‘프로젝트 아스트라(이하 아스트라)’다. 바둑 AI ‘알파고’로 세계를 놀라게 했던 데미스 하사비스 구글 딥마인드 CEO가 개발을 직접 지휘했다. 글자가 아니라 사람의 목소리로 명령할 수 있고, 스마트폰 카메라를 통해 주변도 인식한다. 컴퓨터 화면 속에 보이는 프로그래밍 언어 소스코드의 오류를 인식해 해결 방법을 조언하는 모습도 보여준다. 심지어 과거 영상도 어느 정도 기억했다가 판단의 재료로 쓴다. 예를 들어 “내가 안경을 어디에다 뒀지?”라고 물어보면 “아까 탁자 위에 내려놓는 것을 봤어요”라고 답해줄 수 있다.

마블 시네마틱 유니버스에 등장하는 토니 스타크의 인공지능 비서 자비스 (출처 : 영화 아이언맨)

GPT-4o는 개발 과정에서 다분히 AI와 인간의 사랑을 다룬 영화 ‘그녀(Her)’를 염두에 둔 것으로 보인다. 심지어 영화 Her의 목소리 주인공이던 ‘스칼릿 조핸슨(Scarlett Johansson)’과 꼭 닮은 목소리를 가진 성우를 기용해 논란이 되기도 했다. ‘인간과 소통하는 AI’가 개발 목적이라는 것을 알 수 있다.

반대로 아스트라는 ‘만능 비서’ 느낌이 강하다. 마치 영화 ‘아이언맨’에서 주인공을 보조하는 AI 비서 ‘자비스’를 떠올리게 한다. 구글은 아스트라에 실제로 비서라는 타이틀을 달았다. 정보를 검색해 답변을 제공하던 기존 AI 챗봇을 뛰어넘어 추론, 계획, 기억 능력을 보여준다는 의미에서 ‘고급 AI 비서’라는 이름을 제안했다. ‘세상에 대한 폭넓은 정보’를 누구보다 많이 가지고 있는 구글만이 가능한 포석이다.

아스트라와 제미나이, 둘의 만남은 미래가 된다

아스트라와 제미나이는 점차 유기적으로 연결돼 갈 것으로 보인다. 궁극적으로 하나의 AI모델로 통합될 가능성도 적지 않다. 구글 측은 아스트라 개발 당시부터 제미나이 기반으로 텍스트, 오디오 및 비디오 입력을 처리하도록 모델링 됐다고 했다. 데미스 허사비스도 자신의 블로그를 통해 “일상생활에 유용한 범용 에이전트를 구축하고 싶었다”며 “아스트라는 우리가 하는 일을 보고 들으면서, 우리가 처한 상황을 이해하고 대화에 신속하게 응답할 수 있는, 자연스러운 상담원 같은 역할을 할 것”이라고 했다.

구글에서 개발 중인 AI 비서 아스트라 시연 모습 (출처 : 구글 공식 유튜브)

이정도까지 성능이 높아지려면 아직 추가적인 연구와 개발은 필수적이다. 하지만 적어도 구글이 ‘이런 방향’으로 나아가고 있는 것은 명확해 보인다. 내 말을 척척 알아듣고 온 세상의 정보를 검색해 최적의 답변을 내놓는 만능 비서. 이 정도면 영화 속 ‘자비스’도 부러워할 필요가 없어 보인다. 이것이 현재 구글이 꿈꾸는 AI의 미래인 셈이다.


전승민 과학 전문 저술가

‘현실 세계에 도움 되는 기술이 진짜 과학’이라는 모토로 20여년 간 다양한 과학기술 이야기를 풀어나가고 있는 전문 저술가. 과학기술 전문 미디어 기업 ‘동아사이언스’에서 11년간 일하며 월간 <과학동아> 기자, <동아일보> 과학팀장, <동아사이언스> 온라인뉴스 편집장 및 수석기자를 지냈다. 이후 세계적 과학기술 매체 <와이어드(Wired)>의 한국판(Korean Edition) 정보과학부장을 지냈다. 현재는 프리랜서 기자 및 과학저술가로 <국민일보>, <아시아경제> 등 여러 매체에 고정 필진을 맡고 있다. ‘인공지능과 4차산업혁명의 미래’, ‘AI시대 직장인 생존법’, ‘소설로 알아보는 바이오 사이언스’ 등 많은 저서를 출간했다.

 
GPT-4o 광고 구글 마케팅 자비스 제미나이 제일기획 챗GPT 트렌드 · 
이 기사에 대한 의견 ( 총 0개 )
2023년 광고 시장 결산 및 2024년 전망
2023년 연초 광고 시장에 드리웠던 불안한 예감은 현실이 됐다. 지난 2021년 20.4%라는 큰 성장 이후 2022년 5.4% 재 성장하며 숨 고르기로 다시 한번 도약을 준비하던 광고 시장이었다. 하지만 발표된 다수의 전망들은 2023년 광고 시장의 축소를 내다보고 있다. 한국방송광고진흥공사에 따르면 2023년 광고비는 전년 대비 3.1%p 하락으로 전망됐고, 이중 방송 광고비는 17.7% 감소가 예상됐다.
[어텐션, 크리에이터]2023 최다 조회수 인기 쇼츠 TOP 5
하루에도 수없이 올라오는 유튜브 쇼츠. 그중에서도 소수의 영상만이 알고리즘의 선택을 받아 대중에게 널리 널리 퍼진다. 그렇다면 과연 지난해엔 어떤 쇼츠가 우리들의 눈길을 사로잡았을까? 올해 콘텐츠를 준비하기에 앞서 2023년 가장 많은 조회 수를 끈 쇼츠를 복습해 보자.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
2024년 미디어&광고 동향
    변화하는 시대의 흐름과 하나가 되어 지난 2월, ‘DUNE : Part Two’ 홍보를 위해 한국을 찾은 티모시 샬라메(Timothee Chalamet)의 소식으로 한동안 연예계가 들썩였다. 덕분에 생각지 못한 멋진 영화를 접했고, 올해 미디어 전략의 방향성을 고민하던 나에게 광활한 아라키스 행성의 사막 폭풍을 헤쳐 나가는 티모시의 여정은 좀 더 색다른 의미로 다가왔다. 영화 속 결정적인
[Close up] 2022년 국내 광고 시장 9.3% 성장한 15조 2,842억 원 전망
 2022년 국내 광고 시장 9.3% 성장한 15조 2,842억 원 전망 제일기획, 국내 총 광고비 결산 및 전망 발표 자료제공 제일기획  
[Column] 광고의 사회적·문화적·경제적 순기능
광고는 자유 시장경제를 추구하고 있는 사회에서 다양한 역할들을 수행하고 있다. 때로는 사람들에게 풍요로운 삶을 제안하여, 인생의 목표를 수정하게 하고, 현실의 고독함을 미래의 희망으로 대체하기도 한다. 또 때로는 그 풍요로운 삶의 제안으로 인해 평범한 사람들에게 허탈감을 느끼게 한다. 그러나 문명사회에서 광고는 사람들과의 관계 속에서 그 역할이 결정되고, 사회의 다른 제도들과 통합적인 기능을 할 때 인간의 희망적인 삶이 광고로 인해 형성될 수 있다는 점은 분명하다. 따라서 광고가 현재 인간과 사회에 어떤 기능을 하고 있는지를 살펴본다면 광고가 미래에 무엇을 어떻게 해야할 것인지를 예측할 수 있을 것이다.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
[테크 돋보기] 얼굴이 말해 주는 것들 | 얼굴 인식 기술을 활용한 맞춤형 서비스
  MIT는 매년 3월마다 격월지 『테크놀로지 리뷰』를 통해 10대 유망 기술(Breakthrough Technologies)을 선정한다. IT 전문 기관 가트너가 매년 10월 선정하는 전략 기술과 마찬가지로 업계에서 무게감을 가지며, 기술의 발전 속도나 활용성에 대해 가늠하는 잣대가 된다. 올해 선정된 유망 기술 중 얼굴 인식 기술을 기반으로 한 결제 기술에 대해 살펴보자.     MIT 선정 혁신 기술, ‘얼굴 인식&rsquo
광고회사 광고주 현황조사
광고회사 현황조사 광고회사 성장세 주춤한 가운데, 해외물량 늘어 ’23년 10대 광고회사 취급액 20조 8,218억 원
우리가 궁금한 소비 트렌드가 여기에! <2025 D.라이프 시그널 리포트>
  어느새 다가온 2025년. 새해에 우리는 어떤 변화를 맞게 될까요? 라이프스타일과 비즈니스는 어떻게 달라질까요? 대홍기획이 발간한 <2025 D.라이프 시그널 리포트>에서 그 시그널을 확인해보세요. 우리 주변의 흥미로운 현상들, 파편처럼 보이던 이슈를 이어 그 저변을 관통하는 소비와 비즈니스의 맥락을 찾을 수 있답니다!   Q 대홍기획이 발행하는 <D.라이프 시그널 리포트>란 무엇인가요?
[Column] 광고의 사회적·문화적·경제적 순기능
광고는 자유 시장경제를 추구하고 있는 사회에서 다양한 역할들을 수행하고 있다. 때로는 사람들에게 풍요로운 삶을 제안하여, 인생의 목표를 수정하게 하고, 현실의 고독함을 미래의 희망으로 대체하기도 한다. 또 때로는 그 풍요로운 삶의 제안으로 인해 평범한 사람들에게 허탈감을 느끼게 한다. 그러나 문명사회에서 광고는 사람들과의 관계 속에서 그 역할이 결정되고, 사회의 다른 제도들과 통합적인 기능을 할 때 인간의 희망적인 삶이 광고로 인해 형성될 수 있다는 점은 분명하다. 따라서 광고가 현재 인간과 사회에 어떤 기능을 하고 있는지를 살펴본다면 광고가 미래에 무엇을 어떻게 해야할 것인지를 예측할 수 있을 것이다.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
[테크 돋보기] 얼굴이 말해 주는 것들 | 얼굴 인식 기술을 활용한 맞춤형 서비스
  MIT는 매년 3월마다 격월지 『테크놀로지 리뷰』를 통해 10대 유망 기술(Breakthrough Technologies)을 선정한다. IT 전문 기관 가트너가 매년 10월 선정하는 전략 기술과 마찬가지로 업계에서 무게감을 가지며, 기술의 발전 속도나 활용성에 대해 가늠하는 잣대가 된다. 올해 선정된 유망 기술 중 얼굴 인식 기술을 기반으로 한 결제 기술에 대해 살펴보자.     MIT 선정 혁신 기술, ‘얼굴 인식&rsquo
광고회사 광고주 현황조사
광고회사 현황조사 광고회사 성장세 주춤한 가운데, 해외물량 늘어 ’23년 10대 광고회사 취급액 20조 8,218억 원
우리가 궁금한 소비 트렌드가 여기에! <2025 D.라이프 시그널 리포트>
  어느새 다가온 2025년. 새해에 우리는 어떤 변화를 맞게 될까요? 라이프스타일과 비즈니스는 어떻게 달라질까요? 대홍기획이 발간한 <2025 D.라이프 시그널 리포트>에서 그 시그널을 확인해보세요. 우리 주변의 흥미로운 현상들, 파편처럼 보이던 이슈를 이어 그 저변을 관통하는 소비와 비즈니스의 맥락을 찾을 수 있답니다!   Q 대홍기획이 발행하는 <D.라이프 시그널 리포트>란 무엇인가요?
[Column] 광고의 사회적·문화적·경제적 순기능
광고는 자유 시장경제를 추구하고 있는 사회에서 다양한 역할들을 수행하고 있다. 때로는 사람들에게 풍요로운 삶을 제안하여, 인생의 목표를 수정하게 하고, 현실의 고독함을 미래의 희망으로 대체하기도 한다. 또 때로는 그 풍요로운 삶의 제안으로 인해 평범한 사람들에게 허탈감을 느끼게 한다. 그러나 문명사회에서 광고는 사람들과의 관계 속에서 그 역할이 결정되고, 사회의 다른 제도들과 통합적인 기능을 할 때 인간의 희망적인 삶이 광고로 인해 형성될 수 있다는 점은 분명하다. 따라서 광고가 현재 인간과 사회에 어떤 기능을 하고 있는지를 살펴본다면 광고가 미래에 무엇을 어떻게 해야할 것인지를 예측할 수 있을 것이다.
[월간 2024밈] 12월 편 - 사실 넘 부러웠어요
  •  사실 넘 부러웠어요 •  아이폰 스티커가 이모티콘으로!? •  집에서 만드는 초간단 트리?밖에서 만드는 동물 눈사람??  •  도레미 챌린지 •  가나디? 귀여워?    사실 넘 부러웠어요   상대방이 부러울 때 사용하기 좋은 '사실 넘 부러웠어요' 밈. 틱톡의 댓글에서 시작된 밈이
[테크 돋보기] 얼굴이 말해 주는 것들 | 얼굴 인식 기술을 활용한 맞춤형 서비스
  MIT는 매년 3월마다 격월지 『테크놀로지 리뷰』를 통해 10대 유망 기술(Breakthrough Technologies)을 선정한다. IT 전문 기관 가트너가 매년 10월 선정하는 전략 기술과 마찬가지로 업계에서 무게감을 가지며, 기술의 발전 속도나 활용성에 대해 가늠하는 잣대가 된다. 올해 선정된 유망 기술 중 얼굴 인식 기술을 기반으로 한 결제 기술에 대해 살펴보자.     MIT 선정 혁신 기술, ‘얼굴 인식&rsquo
광고회사 광고주 현황조사
광고회사 현황조사 광고회사 성장세 주춤한 가운데, 해외물량 늘어 ’23년 10대 광고회사 취급액 20조 8,218억 원
우리가 궁금한 소비 트렌드가 여기에! <2025 D.라이프 시그널 리포트>
  어느새 다가온 2025년. 새해에 우리는 어떤 변화를 맞게 될까요? 라이프스타일과 비즈니스는 어떻게 달라질까요? 대홍기획이 발간한 <2025 D.라이프 시그널 리포트>에서 그 시그널을 확인해보세요. 우리 주변의 흥미로운 현상들, 파편처럼 보이던 이슈를 이어 그 저변을 관통하는 소비와 비즈니스의 맥락을 찾을 수 있답니다!   Q 대홍기획이 발행하는 <D.라이프 시그널 리포트>란 무엇인가요?