구글은 화요일 캘리포니아 마운틴뷰에서 열린 구글 I/O 개발자 컨퍼런스에서 제미니 라이브 어시스턴트, 안드로이드 및 워크스페이스 플랫폼 업데이트, 개편된 검색 제품 등 일련의 생성형 인공지능(AI) 제품을 공개했습니다.
이번 발표는 2022년 마이크로소프트와 OpenAI의 깜짝 제휴에 이어 실리콘밸리의 AI 리더로서의 입지를 되찾기 위한 구글의 광범위한 전략의 일환입니다.
또한, Google은 새로운 디바이스와 AI 기반 도구를 통해 핵심 광고 사업을 넘어 다각화를 목표로 하고 있습니다.
순다르 피차이 구글 CEO는 AI의 중요성을 강조하면서 구글의 AI 플랫폼인 제미니가 집계한 결과, 행사 기간 동안 'AI'라는 용어가 120번 언급되었다고 언급했습니다.
이러한 업데이트는 최근 휴대폰 카메라를 통해 사람의 표정을 읽고 유창하고 심지어 시시덕거리는 대화를 나누는 등의 고급 기능을 선보인 최신 AI 시스템인 GPT4o의 출시에 이은 것입니다.
Google은 자사의 AI 도구가 이러한 유형의 '멀티모달' 이해에 똑같이 능숙하다는 것을 입증하려는 의도가 분명합니다.
'당신이 할 수 있는 것은 무엇이든, 내가 더 잘할 수 있다'는 경쟁적 사고방식을 명확히 보여주기 위해, 구글은 OpenAI 발표 직전에 전략적으로 휴대폰에서 실행되는 AI 시스템을 미리 선보였습니다.
시청할 수 있습니다.구글 I/O 컨퍼런스의 에캡을 여기에서 확인하세요. .
AI가 모든 일의 일부가 되기를 바라는 구글
기조연설에서 구글은 AI를 사용자의 일상 생활에 통합하려는 비전을 제시하고, AI 제품이 정보 공유, 타인과의 상호 작용, 집 주변 사물 찾기, 일정 관리, 쇼핑, 안드로이드 기기 사용 등을 어떻게 지원하는지 보여줬습니다.
Google은 AI가 사용자가 하는 모든 일의 필수적인 부분이 되는 것을 목표로 합니다.
피차이는 최신 AI 모델인 Gemini 1.5 Pro로 구동되는 몇 가지 새로운 기능을 소개했습니다.
'사진에 질문'이라는 주목할 만한 기능을 통해 사용자는 사진 라이브러리를 검색하여 딸이 언제 수영을 배웠는지 확인하거나 저장된 이미지에서 차량 번호판을 불러오는 등 특정 인사이트를 얻을 수 있습니다.
또한 Pichai는 Gemini 1.5 Pro가 첨부파일을 분석하고 핵심 사항과 조치 항목을 추출하여 자녀의 학교에서 보낸 최근 이메일을 요약하는 방법도 선보였습니다.
Gemini 1.5 Pro 모델의 두 가지 버전이 공개되었습니다: 멀티모달 기능과 1M 토큰 컨텍스트 길이를 갖춘 가볍고 빠르며 비용 효율적인 Gemini 1.5 프로 플래시는 기존 모델의 81.9%에 비해 78.9%의 MMLU를 자랑합니다. 표준 Gemini 1.5 Pro 모델은 이제 컨텍스트 길이가 두 배인 2M 토큰을 제공합니다.
이 새로운 모델은 API를 통해 일부 개발자를 대상으로 대기자 명단을 통해 사용할 수 있습니다.
발표 내내 구글 경영진은 최신 모델의 교과서 '읽기' 기능과 질문에 답할 수 있는 자연스러운 음성의 교사와 함께 AI 강의로 변환하는 기능 등 다른 기능도 강조했습니다.
AI 개요: 검색 결과 생성의 혁신
지난 5월, 피차이는 모든 제품을 AI를 통해 재창조하겠다는 야심찬 계획을 발표한 바 있습니다.
그러나 허위 정보 확산 가능성 등 새로운 생성 AI 기술과 관련된 위험성을 고려할 때, 구글은 처음에는 20억 명 이상의 사용자에게 서비스를 제공하고 지난해 1,750억 달러의 매출을 올린 검색 엔진에 이를 통합하는 데 신중을 기했습니다.
이번 컨퍼런스에서 피차이는 검색 엔진에 AI를 도입하기 위해 회사가 기울인 노력을 공개했습니다.
이번 주부터 미국(미국) 사용자들은 Google I/O 2023에서 발표된 새로운 기능인 AI 오버뷰(이전에는 검색 생성 경험(SGE)으로 알려졌던 기능)를 경험할 수 있습니다.
이 기능은 기존 검색 결과 위에 정보 요약을 생성하는 기능으로, 곧 전 세계 사용자들에게 제공될 예정입니다.
올해 말까지 10억 명이 넘는 사람들이 이 기술을 이용할 것으로 예상됩니다.
새로 취임한 구글의 검색 책임자 리즈 리드(Liz Reid)는 이렇게 말했습니다:
"제너레이티브 AI의 장점은 검색을 더 많은 부분을 Google이 대신 해준다는 점입니다. 검색의 수고를 덜어주므로 사용자는 원하는 작업을 완료하거나 흥미를 느끼는 탐색 부분에 집중할 수 있습니다."라고 말합니다;
그렇다면 AI 오버뷰는 어떻게 작동할까요?
Google의 새로운 환경은 생성형 AI를 검색 결과와 통합하여 실시간 정보를 기반으로 AI가 생성한 요약과 답변을 제공합니다.
제미니 AI 모델을 기반으로 하는 이 개선 사항은 시스템이 제너레이티브 AI가 도움이 될 수 있다고 판단할 때 많은 쿼리에 대해 AI 개요를 표시합니다.
이러한 AI가 생성한 요약은 기존 검색 결과 위에 표시되어 페이지 아래쪽으로 밀려납니다.
일반적으로 AI 개요에는 쿼리당 몇 개의 관련 링크가 표시되지만 응답을 확장한 후에야 완전히 표시됩니다.
Google은 AI 개요를 지식창이나 추천 스니펫과 같은 기능과 비교하며 완전히 비활성화할 수 없습니다.
하지만 Google은 검색에 '웹' 필터를 도입하여 AI 응답을 우회하고 기존 링크만 표시할 예정입니다.
Google의 AI 강화 검색에 대한 주요 우려 사항은 검색 트래픽에 크게 의존하는 웹사이트에 미치는 영향입니다.
가장 큰 우려는 AI 오버뷰가 구글 검색 트래픽 감소에 대한 웹 퍼블리셔의 우려를 심화시켜 이미 다른 기술 플랫폼과의 갈등으로 어려움을 겪고 있는 업계의 문제를 더욱 악화시킬 수 있다는 점입니다.
Google에서 사용자는 다양한 주제에 대한 긴 요약을 접하게 되므로 외부 웹사이트를 방문할 필요성이 줄어들 수 있습니다.
일부 추산에 따르면 이러한 변화로 인해 향후 몇 년 동안 웹사이트 트래픽이 최대 25%까지 감소할 수 있으며, 검색 알고리즘으로 인한 최근의 감소세와 겹칠 수 있다고 합니다.
하지만 구글은 AI 개요에 포함된 링크가 기존 검색 결과의 링크보다 더 많은 클릭을 받는다고 주장합니다.
회사는 AI 오버뷰가 더 많은 사용자에게 도달할 수 있도록 퍼블리셔와 크리에이터에게 트래픽을 유도하는 데 주력하고 있다고 강조합니다.
에서최근 블로그 게시물 리드는 AI 개요에 표시된 링크가 기존 검색 결과로 표시될 때보다 사용자로부터 더 많은 클릭을 받는다고 밝혔습니다.
리드는 덧붙였습니다:
"앞으로도 퍼블리셔와 크리에이터에게 가치 있는 트래픽을 전송하는 데 집중할 것입니다."
또한 Google은 검색에서 랩 참가자들을 대상으로 테스트할 새로운 기능을 발표했습니다.
이러한 기능에는 언어를 단순화하고, 복잡한 쿼리에 대한 다단계 추론을 가능하게 하고, 계획 기능을 제공하고, AI로 검색 결과를 구성하고, 검색 프롬프트의 일부로 동영상을 통합하여 AI 개요를 구체화하는 옵션이 포함되어 있습니다.
구글은 이러한 개발이 구글 검색을 재창조하기 위한 노력의 시작에 불과하며, 더 많은 혁신이 곧 있을 것이라고 밝혔습니다.
나만의 맞춤형 AI 비서: 제미니 라이브
구글은 최근 사용자 상호작용에 혁신을 가져올 개인화된 AI 비서인 Gemini Live도 공개했습니다.
Google의 고급 Gemini 1.5 Pro 모델을 기반으로 하는 Gemini Live는 사용자가 음성 명령을 통해 챗봇과 대화할 수 있는 기능을 제공하며, 자연스러운 음성으로 응답을 제공합니다.
챗봇의 적응력이 뛰어나 사용자가 대화 도중에 끼어들어 명확한 질문을 할 수 있다는 점이 차별화 포인트입니다.
구글의 쌍둥이자리 경험 엔지니어링 담당 부사장인 아마르 수브라마냐는 야후 파이낸스와의 인터뷰에서 쌍둥이자리 라이브의 혁신적 잠재력에 대한 인사이트를 공유했습니다.
수브라마냐는 브레인스토밍 세션과 아이디어 교환을 위해 Gemini Live를 개인적으로 활용하고 있다고 밝히며, 창의적인 프로세스를 지원하는 어시스턴트의 다재다능함을 보여주었습니다.
초기 테스터들은 번역과 같은 작업에 Gemini Live의 기능을 활용하여 기대할 만한 결과를 얻었습니다.
앞으로 Google은 카메라 액세스를 Gemini Live에 통합하여 어시스턴트가 실제 환경 및 사물과 상호작용할 수 있도록 지원할 계획이며, 이는 OpenAI의 GPT4o 시연을 연상시키는 기능입니다.
수브라마냐는 어시스턴트에게 15명이 모일 수 있는 파인애플 거꾸로 케이크 레시피를 구하고 Keep 쇼핑 목록에 재료를 원활하게 추가하는 시나리오에 대해 이야기했습니다.
이 도우미는 8인분의 레시피를 능숙하게 조정하고, 그에 따라 비율을 조정하고, 수브라마냐의 편의를 위해 필요한 품목을 효율적으로 정리했습니다.
또한 Android의 경우 Google은 Google 메시지 및 Gmail과 같은 인기 앱으로 어시스턴트의 범위를 확장하여 Gemini-생성 이미지를 메시지에 삽입하는 등의 작업을 가능하게 함으로써 사용자 생산성을 향상시키고 있습니다.
구글의 제미니 나노는 대화 중에 잠재적인 전화 사기범을 식별할 수 있는 기능을 자랑합니다.
이 기능은 일반적으로 사기 활동과 연관된 특정 대화 패턴을 감지하여 작동합니다.
놀랍게도 모든 사기 탐지 처리는 디바이스에서 로컬로 이루어지므로 대화 내용이 웹에 업로드되지 않고 휴대폰에만 보관되므로 개인정보 보호가 보장됩니다.
구글 딥마인드 AI 연구소의 프로젝트 아스트라
구글은 휴대폰 카메라를 활용해 실제 정보를 해석함으로써 일상 생활에 혁신을 가져올 프로젝트 아스트라를 딥마인드 AI 연구소에서 개발 중이라고 잠시 공개했습니다.
이러한 노력은 사물을 식별하고 잘못 놓인 물건의 위치까지 파악할 수 있어 향후 증강 현실 안경과의 통합을 암시합니다.
데미스 카사비스, 딥마인드 최고 경영자,블로그 게시물에 자세히 설명되어 있습니다. 프로젝트 아스트라의 일부 기능을 올해 안에 Gemini 챗봇 사용자들이 이용할 수 있게 될 것입니다.
Gemini를 기반으로 하는 이 프로젝트는 오디오, 텍스트, 비디오 및 이미지 형식에 대한 실시간 지원을 제공합니다.
아스트라는 아직 프로토타입으로 공개되었지만, 모든 사용자가 사용할 수 있는 것은 아니기 때문에 사전 녹화 영상을 통해 아스트라의 잠재력을 보여주었습니다.
초기 테스터들은 GPT4o에 비해 지연 시간이 길고 감성 지능과 어조에서 한계가 있다고 지적했습니다.
그러나 Astra는 강력한 텍스트 음성 변환 기능을 갖추고 있으며 진행 중인 비디오 및 긴 문맥의 상호 작용에 대해 잠재적으로 우수한 지원을 제공합니다.
Veo, OpenAI의 소라 경쟁자
다음 단계로 구글은 간단한 텍스트 입력으로 고화질 동영상을 제작하도록 설계된 최신 AI 모델인 Veo를 선보였는데, 이는 OpenAI의 Sora 시스템과 유사합니다.
#Google 구글의 AI 모델인 '베오'를 크리에이터가 사용할 수 있다고 구글의 수석 부사장 제임스 만니카가 차세대 AI의 활용 가능성에 대해 설명합니다. Google은 Google I/O 2024 컨퍼런스에서 가장 진보된 동영상 생성 모델인 Veo를 공개했습니다.Google아쉬트테즈쿠마르#GoogleIO#AI#Veopic.twitter.com/2WcOS1YDNN
- CNBC-TV18 (@CNBCTV18News)2024년 5월 15일
a
이 기술은 동영상 생성 기능의 획기적인 발전을 의미하며, 크리에이터가 Veo를 미리 보고 액세스 대기자 명단에 이름을 올릴 수 있는 기능을 제공합니다.
구글이 올해 말 Veo의 기능을 YouTube 쇼트 및 기타 플랫폼에 통합할 계획이어서 기대감이 커지고 있습니다.
구글 딥마인드에서 개발한 Veo는 인상적인 기능을 자랑합니다:
-놀라운 1080p 해상도의 동영상을 제공합니다.
-동영상의 길이가 1분을 초과할 수 있어 콘텐츠 제작에 유연성을 제공합니다.
-Veo는 다양한 취향에 맞는 다양한 시네마틱 및 비주얼 스타일을 제공합니다.
이 다목적 모델은 이미지에 애니메이션을 적용하거나 텍스트 프롬프트를 기반으로 동영상을 편집할 수 있으며, 마스크 편집을 지원하여 동영상 내에서 원하는 대로 수정할 수 있습니다.
Google은 동영상 캡션에 추가 세부 정보를 보강하여 Veo의 학습 데이터를 개선했습니다.
또한 Veo는 성능, 생성 속도 및 효율성을 향상시키기 위해 잠재적이라고 하는 비디오의 압축 표현을 활용합니다.
구글, 다양한 AI 기능 발표
2시간 동안 진행된 이 세션에서는 검색, 작업 공간, 사진, Android 등 Google 생태계를 아우르는 다양한 제품 업데이트와 발표로 가득했으며, 개선된 기능을 선보였습니다.
특히 최첨단 이미지 생성 모델인 Imagen 3는 빠른 스케치부터 고해상도 이미지 제작까지 다양한 작업에 맞게 여러 번 반복하여 사용할 수 있는 기능을 곧 선보일 예정입니다.
또한 Gemma 제품군에 새롭게 추가된 Gemma 2와 PaliGemma는 오픈 소스 모델에서 중요한 진전을 이루었습니다.
Google의 첫 번째 비전 언어 오픈소스 모델인 PaliGemma는 현재 사용 가능하며, 270억 개의 파라미터를 자랑하는 Gemma 2는 전작을 능가하는 성능으로 6월에 출시됩니다.
또한, 구글의 음악 생성 도구인 Lyria의 공개는 혁신적인 서비스에 또 다른 차원을 더합니다.
15개 이상의 프로젝트 출시와 제품 발표를 통해 다양한 영역에서 기술을 발전시키려는 Google의 노력을 강조하는 행사입니다.
장애물과 라이벌로 가득한 구글의 AI 지배를 향한 길
Emarketer의 애널리스트 제이콥 본의 눈에 올해 구글 개발자 컨퍼런스에서 AI가 주목받은 것은 놀라운 일이 아닙니다.
그는 이렇게 말했습니다:
"구글은 최신 모델과 이를 통해 강력한 소비자 도달 범위를 가진 기존 제품을 강화하는 방법을 선보임으로써 경쟁사와 효과적으로 차별화할 수 있는 방법을 보여주고 있습니다."라고 말합니다;
그는 이러한 새로운 도구의 도입을 구글이 진화하는 제너레이티브 AI 환경에 맞게 검색 제품을 조정하는 능력에 대한 리트머스 시험지로 보고 있습니다.
그는 덧붙였습니다:
"경쟁력을 유지하고 투자자들을 만족시키기 위해 구글은 AI 혁신을 수익성 있는 제품과 서비스로 대규모로 전환하는 데 집중해야 할 것입니다."
Facebook은 AI 활용을 확대함에 따라 잠재적인 오용을 완화하기 위해 추가적인 안전장치를 마련할 것을 약속합니다.
또한 Google은 전문가 및 기관과의 파트너십을 통해 새로운 모델의 기능을 개선하기 위한 노력을 기울이고 있음을 강조합니다.
하지만 구글은 지난 한 해 동안 AI에 집중하는 과정에서 적지 않은 장애물에 부딪혔습니다.
작년에 처음에 Bard로 명명되었다가 나중에 Gemini로 브랜드가 변경된 생성 AI 도구의 출시가 회사의 주가 하락으로 이어지면서 그러한 좌절 중 하나가 발생했습니다.
이러한 하락세는 제임스 웹 우주망원경에 대한 문의에 대해 사실과 다른 답변을 제공하는 데모 동영상이 공개된 후 이어졌습니다.
최근 2월, 구글은 역사적으로 부정확한 이미지를 주로 백인 대신 유색인종을 등장시켜 소셜 미디어에서 비판에 직면했습니다.
이에 따라 회사는 Gemini의 사람 이미지 생성 기능을 중단했습니다.
ChatGPT와 같은 다른 AI 도구와 마찬가지로 Gemini는 온라인에서 제공되는 광범위한 데이터셋을 활용합니다.
그러나 전문가들은 부정확성, 편견, 잘못된 정보의 유포 등 AI 기술의 한계와 잠재적 함정에 대해 지속적으로 경고해 왔습니다.
2022년 말 출시와 동시에 기술 업계에서 강력한 경쟁자로 떠오른 ChatGPT는 온라인 정보 검색 플랫폼인 구글의 지배적인 검색 엔진에 대한 잠재적 위협에 대한 논의를 촉발시켰습니다.
이에 따라 Google은 AI 영역에서 패권을 되찾기 위한 단호한 여정에 착수했습니다.
긍정적인 면을 보면, 오펜하이머의 애널리스트 제이슨 헬프스타인은 보고서에서 다음과 같이 말했습니다:
전날 열린 OpenAI의 제한된 제품 데모와 비교했을 때, 구글은 본질적으로 무제한의 R&D 예산을 바탕으로 강력한 경쟁력을 보여줬다고 생각합니다;
에버코어 ISI의 애널리스트인 마크 마하니도 보고서에서 이렇게 말했습니다:
구글은 올해 I/O에서 과대 광고와 의구심에 대한 우려를 불식시키는 성과를 거두었습니다. 이번 I/O에서는 구글이 차세대 AI를 사용하여 자사 서비스를 하나의 전체적인 경험으로 더욱 긴밀하게 연결하는 데 중점을 두는 것을 확인할 수 있었습니다. 그리고 이러한 새로운 혁신이 '온리 온 안드로이드'라는 점을 강조했습니다;
하지만 다른 거대 기술 기업들도 그 뒤를 바짝 쫓고 있습니다.
5월 20일부터 시작되는 빌드 컨퍼런스에서 Microsoft는 Microsoft 365 생산성 제품군을 위한 AI 기반 코파일럿의 향상된 기능을 공개할 예정입니다.
한편, Apple은 6월 10일에 열리는 WWDC 행사에서 제너레이티브 AI로 구동되는 새로운 버전의 Siri 음성 비서를 소개할 계획입니다.
AI 패권을 향한 경쟁이 치열해지면서 누가 승자가 될까요?
누군가 '획기적인' 혁신을 내놓으면 다른 혁신이 바로 그 뒤를 따르는 것처럼 보입니다.
따라서 누가 승자가 될지, 누가 낙오자가 될지는 시간이 지나야 알 수 있습니다.