챗GPT를 발표해 세상을 놀라게 했던 오픈AI가 챗GPT의 새 버전 ‘GPT-4o’를 깜짝 발표했다. GPT-4o의 가장 큰 특징은 지금까지 키보드로 소통해야 했던 대화형 AI에 사람의 말을 알아듣고 반응하는 ‘음성 대화’ 기능을 추가했다는 점이었다.
GPT-4o를 활용한 각종 기능을 시연하는 라이브 데모 (출처 : OpenAI 유튜브)
오픈AI가 이날 예정에도 없던 발표회를 갑작스럽게 단행한 이유는 분명했다. 하루 뒤인 14일, 경쟁사인 구글이 새로운 AI ‘아스트라’를 공개할 거라는 소식을 사전에 입수했기 때문이다. 아스트라 역시 GPT-4o처럼 자연스러운 대화가 가능한 AI다. 오픈AI 입장에선 비슷해 보이는 기술을 경쟁사보다 하루라도 늦게 공개하는 건 치명적일 수 있다. 지금까지 쌓아온 ‘대화형 AI 분야 선두 기업’ 이미지를 단 하루 차이에 잃을 수도 있기 때문이다. 대화형 AI 분야 양강으로 불리는 두 기업의 신경전이 극에 달했다는 평가가 나오는 대목이다.
구글, “모든 서비스에 AI 통합”
‘AI’라는 말은 몰라도 ‘챗GPT’는 어디서 들어 봤다는 세상이다. 챗GPT는 이미 대화형 AI의 대명사가 됐으며, 실제로 오픈AI는 관련 시장에서 선두를 차지하고 있다. 그러나 기업으로서의 ‘종합적인 역량’을 따진다면 오픈AI가 구글을 넘어서기 어려워 보인다. 구글은 정보기술 분야 전 사업에 손을 뻗고 있다. 오픈AI 역시 자사와 협력 관계에 있는 여러 기업을 통해 다양한 서비스를 펴나가겠지만, 이미 IT 시장을 선점하고 있는 구글의 영향력이 상대적으로 크다는 점을 부인할 수 있는 사람은 그리 많지 않을 것이다.
이 점은 구글 스스로도 알고 있다. 따라서 구글이 강조한 것은 ‘생태계’였다. 자사의 AI ‘제미나이’를 이용해 모든 서비스를 유기적으로 통합하겠다는 것이다. 구글은 오픈AI의 발표 하루 뒤인 14일 오전(현지시간) 미국 캘리포니아 마운틴뷰에서 연례 개발자 컨퍼런스 ‘구글 I/O 2024’를 개최하고 “앞으로 모든 서비스에 제미나이를 연동하겠다”고 발표했다.
이미지, 텍스트, 음성 등을 통합적으로 이해해 검색하는 구글 제미나이 (출처 : 구글 공식 유튜브)
현재 구글의 ‘제미나이’는 ‘프로1.5’ 버전까지 공개돼 있는데, 굳이 버전을 새로 바꾸지는 않았지만 성능을 대폭 높였다고 했다. 고성능 멀티모달(텍스트, 이미지, 음성 등 여러 자료를 한 AI로 처리하는 방식)을 지원하므로 입력된 키워드를 이해할 뿐만 아니라, 다양한 주제어 간 연결 관계도 인식한다.
이걸로 뭘 할 수 있을까? 우선 들여다볼 부분은 ‘검색’이다. 구글이 IT 시장에서 두각을 드러낼 수 있었던 건 막강한 ‘인터넷 ‘검색’ 기능 덕분이었으며, 현재도 이 분야에서 가장 높은 점유율을 기록하고 있다. 제미나이를 통합하면 일반적인 문장 검색은 물론 사진을 이용한 포토 검색 등 기존 모든 서비스의 성능이 크게 높아진다. 그뿐 아니라 구글 포토, 구글 워크스페이스, 구글 자체 유통 스마트폰 ‘구글 픽셀’ 등도 모두 제미나이와 통합해 갈 계획이다. 즉 구글의 승부수는 ‘데이터의 통합’에 있다는 사실을 알 수 있다.
사람과 대화하듯 자연스럽게 검색 돕는 제미나이
구글은 지난해에도 개발자 컨퍼런스를 통해 텍스트, 이미지, 비디오, 코드 등 다양한 자료를 통합적으로 인식하는 AI모델을 개발하겠다고 밝힌 바 있는데, 이제 그 본격적인 작업을 시작하려는 것이다. 변화의 핵심축은 제미나이 기반으로 작동하는 새로운 검색 서비스 ‘AI오버뷰’다.
복잡하고 긴 명령어로 검색을 해도 이를 종합적으로 분석, 한층 더 정확한 결과를 제공해 준다. 이전에는 단번에 답을 찾기 어려웠던 복잡한 질문도 알려줄 수 있다. 다양한 키워드를 뒤섞어 입력해도 AI의 다단계 추론 기능을 통해 답을 도출하는 기능도 갖고 있다.
예를 들어 제미나이가 통합되지 않은 현재 검색 기술을 사용해 집 주변에서 정기적으로 다닐 ‘헬스클럽’을 찾아본다고 가정해 보자. 헬스클럽, 피트니스센터, 다이어트 등의 검색어를 무작위로 입력해 검색창에 나타나는 업체의 정보를 하나하나 확인하고, 집에서 거리는 얼마나 되는지, 매월 회비는 얼마인지, 시설은 어떤지 등을 일일이 찾아봐야 한다. 이는 적지 않은 노동이다. 그런데 AI오버뷰를 이용하면 제미나이를 통해 지시만 하면 된다. “집에서 걸어서 30분 거리에 있고, 평점이 4.0 이상이어야 하며, 샤워 시설이 포함돼 있어야 한다”는 식으로 조건을 내걸기만 하면 AI가 이를 이해하고 자동으로 적합한 곳을 찾아 준다.
응용 방법은 다양하다. 사진 관리도 가능하므로 스마트폰 카메라로 촬영된 영상을 실시간으로 분석할 수도 있다. 사진 속 물체를 분석해 관련 정보를 찾아낼 수 있는 것이다. 신발을 촬영하면서 반품 방법을 묻는다면, 이미지 속 구매 영수증을 찾아내 제시한다.
이런 점만큼은 오픈AI의 기술력이 아무리 뛰어나다 해도 구글을 극복할 수 없다. 구글은 전 세계 사용자들에게 받아 축적해 온 방대한 ‘데이터’를 갖고 있는데, 오픈AI는 이것이 절대적으로 부족하다.
‘자비스’ 같은 AI 현실로 다가올까?
구글도 GPT-4o 같은 음성인식 AI 비서를 공개했다. ‘프로젝트 아스트라(이하 아스트라)’다. 바둑 AI ‘알파고’로 세계를 놀라게 했던 데미스 하사비스 구글 딥마인드 CEO가 개발을 직접 지휘했다. 글자가 아니라 사람의 목소리로 명령할 수 있고, 스마트폰 카메라를 통해 주변도 인식한다. 컴퓨터 화면 속에 보이는 프로그래밍 언어 소스코드의 오류를 인식해 해결 방법을 조언하는 모습도 보여준다. 심지어 과거 영상도 어느 정도 기억했다가 판단의 재료로 쓴다. 예를 들어 “내가 안경을 어디에다 뒀지?”라고 물어보면 “아까 탁자 위에 내려놓는 것을 봤어요”라고 답해줄 수 있다.
마블 시네마틱 유니버스에 등장하는 토니 스타크의 인공지능 비서 자비스 (출처 : 영화 아이언맨)
GPT-4o는 개발 과정에서 다분히 AI와 인간의 사랑을 다룬 영화 ‘그녀(Her)’를 염두에 둔 것으로 보인다. 심지어 영화 Her의 목소리 주인공이던 ‘스칼릿 조핸슨(Scarlett Johansson)’과 꼭 닮은 목소리를 가진 성우를 기용해 논란이 되기도 했다. ‘인간과 소통하는 AI’가 개발 목적이라는 것을 알 수 있다.
반대로 아스트라는 ‘만능 비서’ 느낌이 강하다. 마치 영화 ‘아이언맨’에서 주인공을 보조하는 AI 비서 ‘자비스’를 떠올리게 한다. 구글은 아스트라에 실제로 비서라는 타이틀을 달았다. 정보를 검색해 답변을 제공하던 기존 AI 챗봇을 뛰어넘어 추론, 계획, 기억 능력을 보여준다는 의미에서 ‘고급 AI 비서’라는 이름을 제안했다. ‘세상에 대한 폭넓은 정보’를 누구보다 많이 가지고 있는 구글만이 가능한 포석이다.
아스트라와 제미나이, 둘의 만남은 미래가 된다
아스트라와 제미나이는 점차 유기적으로 연결돼 갈 것으로 보인다. 궁극적으로 하나의 AI모델로 통합될 가능성도 적지 않다. 구글 측은 아스트라 개발 당시부터 제미나이 기반으로 텍스트, 오디오 및 비디오 입력을 처리하도록 모델링 됐다고 했다. 데미스 허사비스도 자신의 블로그를 통해 “일상생활에 유용한 범용 에이전트를 구축하고 싶었다”며 “아스트라는 우리가 하는 일을 보고 들으면서, 우리가 처한 상황을 이해하고 대화에 신속하게 응답할 수 있는, 자연스러운 상담원 같은 역할을 할 것”이라고 했다.
구글에서 개발 중인 AI 비서 아스트라 시연 모습 (출처 : 구글 공식 유튜브)
이정도까지 성능이 높아지려면 아직 추가적인 연구와 개발은 필수적이다. 하지만 적어도 구글이 ‘이런 방향’으로 나아가고 있는 것은 명확해 보인다. 내 말을 척척 알아듣고 온 세상의 정보를 검색해 최적의 답변을 내놓는 만능 비서. 이 정도면 영화 속 ‘자비스’도 부러워할 필요가 없어 보인다. 이것이 현재 구글이 꿈꾸는 AI의 미래인 셈이다.
전승민 과학 전문 저술가
‘현실 세계에 도움 되는 기술이 진짜 과학’이라는 모토로 20여년 간 다양한 과학기술 이야기를 풀어나가고 있는 전문 저술가. 과학기술 전문 미디어 기업 ‘동아사이언스’에서 11년간 일하며 월간 <과학동아> 기자, <동아일보> 과학팀장, <동아사이언스> 온라인뉴스 편집장 및 수석기자를 지냈다. 이후 세계적 과학기술 매체 <와이어드(Wired)>의 한국판(Korean Edition) 정보과학부장을 지냈다. 현재는 프리랜서 기자 및 과학저술가로 <국민일보>, <아시아경제> 등 여러 매체에 고정 필진을 맡고 있다. ‘인공지능과 4차산업혁명의 미래’, ‘AI시대 직장인 생존법’, ‘소설로 알아보는 바이오 사이언스’ 등 많은 저서를 출간했다.