https://a16z.com/2022/11/17/the-generative-ai-revolution-in-games/
이 작업의 혁신적인 점은 품질을 제공하는 동시에 시간과 비용을 절약한다는 것뿐만 아니라 "비용, 품질 또는 속도 중 두 가지만 가질 수 있습니다"라는 고전적인 삼각형을 깨뜨립니다. 아티스트는 이제 수작업으로 생성하는 데 몇 주가 걸리는 고품질 이미지를 몇 시간 만에 생성하고 있습니다. 진정으로 혁신적인 것은 다음과 같습니다.
- 이 창조적인 힘은 이제 몇 가지 간단한 도구를 배울 수 있는 모든 사람이 사용할 수 있습니다.
- 이러한 도구는 매우 반복적인 방식으로 수많은 변형을 만들 수 있습니다.
- 일단 훈련되면 프로세스는 실시간으로 이루어지며 거의 즉각적으로 결과를 얻을 수 있습니다.
실시간 3D 이후 게임에 이렇게 혁신적인 기술은 없었습니다. 언제든지 게임 제작자와 이야기를 나누면 흥분과 경이로움을 느낄 수 있습니다. 그렇다면 이 기술은 어디로 갈까요? 게임을 어떻게 변화시킬까요? 먼저 Generative AI가 무엇인지 검토해 봅시다.
제너레이티브 AI란?
Generative AI는 컴퓨터가 사용자의 프롬프트에 응답하여 원본 새 콘텐츠를 생성할 수 있는 머신 러닝의 범주입니다. 오늘날 텍스트와 이미지는 이 기술의 가장 성숙한 응용 프로그램이지만 애니메이션에서 음향 효과, 음악, 완전히 구체화된 가상 캐릭터 생성에 이르기까지 거의 모든 창의적 영역에서 작업이 진행 중입니다.
물론 AI는 게임에서 새로운 것이 아닙니다. Atari의 Pong과 같은 초기 게임에서도 컴퓨터로 제어되는 상대가 플레이어에게 도전했습니다. 그러나 이러한 가상의 적은 오늘날 우리가 알고 있는 AI를 실행하지 않았습니다. 그것들은 게임 디자이너들이 만든 단순한 스크립트 절차였습니다. 그들은 인공 지능 상대를 시뮬레이션했지만 배울 수 없었고 그것을 만든 프로그래머만큼만 훌륭했습니다.
이제 다른 점은 더 빠른 마이크로프로세서와 클라우드 덕분에 사용 가능한 컴퓨팅 성능의 양입니다. 이 힘으로 매우 복잡한 도메인에서 패턴과 표현을 식별할 수 있는 대규모 신경망을 구축할 수 있습니다.
이 블로그 게시물은 두 부분으로 구성되어 있습니다.
- 1부는 게임용 Generative AI 분야에 대한 관찰과 예측으로 구성됩니다.
- 파트 II는 공간의 시장 지도로서 다양한 세그먼트를 요약하고 각각의 주요 회사를 식별합니다.
1부 - 관찰 및 예측
가정
먼저 이 블로그 게시물의 나머지 부분에 깔려 있는 몇 가지 가정을 살펴보겠습니다.
1. 일반 AI에서 수행되는 연구의 양은 계속해서 증가하여 더욱 효과적인 기술을 창출할 것입니다.
기계 학습 또는 인공 지능에 대해 출판된 학술 논문의 수에 대한 이 그래프를 고려하십시오.arXiv 아카이브 매월:
보시다시피 논문의 수는 줄어들 기미 없이 기하급수적으로 증가하고 있습니다. 그리고 여기에는 출판된 논문만 포함됩니다. 대부분의 연구는 출판되지도 않고 오픈 소스 모델이나 제품 R&D에 직접 사용됩니다. 그 결과 관심과 혁신이 폭발적으로 증가했습니다.
2. 모든 엔터테인먼트 중에서 게임은 Generative AI의 영향을 가장 많이 받을 것입니다.
게임은 관련된 자산 유형(2D 아트, 3D 아트, 음향 효과, 음악, 대화 등)의 순전한 수 측면에서 가장 복잡한 형태의 엔터테인먼트입니다. 게임은 또한 실시간 경험에 중점을 두고 가장 상호작용적입니다. 이것은 새로운 게임 개발자에게 가파른 진입 장벽을 만들 뿐만 아니라 현대적인 차트 1위 게임을 제작하는 데 막대한 비용을 초래합니다. 또한 Generative AI 중단을 위한 엄청난 기회를 창출합니다.
이제 Red Dead Redemption 2를마이크로소프트 비행 시뮬레이터, 그냥 큰 것이 아니라 엄청납니다. Microsoft Flight Simulator를 통해 플레이어는 1억 9700만 평방 마일에 달하는 지구 전체를 비행할 수 있습니다. 마이크로소프트는 어떻게 그렇게 거대한 게임을 만들었을까? AI에게 맡기면 됩니다. 마이크로소프트와 제휴blackshark.ai, AI를 훈련시켜2D 위성 이미지에서 사실적인 3D 세계 생성.
이것은 AI를 사용하지 않고는 문자 그대로 빌드가 불가능했을 게임의 예이며, 더 나아가 이러한 모델이 시간이 지남에 따라 지속적으로 개선될 수 있다는 사실로부터 이점을 얻습니다. 예를 들어, "고속도로 클로버잎 육교" 모델을 개선하고 전체 빌드 프로세스를 다시 실행하면 갑자기 전 세계의 모든 고속도로 고가도로가 개선됩니다.
3. 게임 제작과 관련된 모든 자산에 대한 생성 AI 모델이 있습니다.
지금까지 Stable Diffusion 또는 MidJourney와 같은 2D 이미지 생성기는 생성할 수 있는 이미지의 눈길을 끄는 특성으로 인해 Generative AI에 대한 대중적인 흥분의 대부분을 포착했습니다. 그러나 이미 3D 모델에서 캐릭터 애니메이션, 대화 및 음악에 이르기까지 게임과 관련된 거의 모든 자산에 대한 Generative AI 모델이 있습니다. 이 블로그 게시물의 후반부에는 각 콘텐츠 유형에 중점을 둔 일부 회사를 강조하는 시장 지도가 포함되어 있습니다.
4. 콘텐츠 가격이 급격하게 떨어지며 경우에 따라 사실상 0이 될 수도 있습니다.
Generative AI를 프로덕션 파이프라인에 통합하는 실험을 하고 있는 게임 개발자와 이야기할 때 가장 큰 흥분은 시간과 비용의 극적인 감소에 있습니다. 한 개발자는 단일 이미지에 대한 컨셉 아트를 생성하는 데 걸리는 시간이 처음부터 끝까지 3주에서 1시간으로 줄었다고 말했습니다. 즉, 120분의 1로 단축되었습니다. 우리는 전체 생산 파이프라인에서 비슷한 비용 절감이 가능할 것이라고 믿습니다.
예술가들은 대체될 위험에 처해 있지 않습니다. 이는 아티스트가 더 이상 모든 작업을 직접 수행할 필요가 없음을 의미합니다. 이제 초기 크리에이티브 방향을 설정한 다음 많은 시간이 소요되는 기술적 실행을 AI에 넘길 수 있습니다. 손그림 애니메이션 초창기의 셀페인터처럼 고도로 숙련된 "잉커"가 애니메이션의 윤곽선을 그리고 저비용 "페인팅" 부대가 시간이 많이 걸리는 작업을 수행합니다. 애니메이션 셀, 줄 채우기. 게임 생성을 위한 "자동 완성" 기능입니다.
5. 우리는 아직 이 혁명의 초기 단계에 있으며 많은 관행이 여전히 개선되어야 합니다.
최근의 모든 흥분에도 불구하고 우리는 여전히 출발선에 있습니다. 이 새로운 기술을 게임에 활용하는 방법을 파악하는 과정에서 엄청난 양의 작업이 진행되고 있으며 이 새로운 공간으로 빠르게 이동하는 회사에는 엄청난 기회가 생성될 것입니다.
예측
이러한 가정을 바탕으로 게임 산업이 어떻게 변화할 수 있는지에 대한 몇 가지 예측은 다음과 같습니다.
1. 제너레이티브 AI를 효과적으로 사용하는 방법을 배우면 시장성이 있는 기술이 될 것입니다.
이미 일부 실험자들은 다른 실험자들보다 Generative AI를 더 효과적으로 사용하고 있습니다. 이 새로운 기술을 최대한 활용하려면 다양한 도구와 기술을 사용하고 그 사이를 오가는 방법을 알아야 합니다. 우리는 이것이 아티스트의 창의적인 비전과 프로그래머의 기술력을 결합하여 시장성 있는 기술이 될 것으로 예상합니다.
크리스 앤더슨은 “모든 풍요는 새로운 결핍을 낳는다”는 말로 유명합니다. 콘텐츠가 풍부해짐에 따라 AI 도구와 가장 효과적으로 협업하고 효과적으로 작업하는 방법을 아는 아티스트가 가장 부족할 것이라고 생각합니다.
예를 들어 프로덕션 아트워크에 Generative AI를 사용하려면 다음과 같은 특별한 문제가 있습니다.
- 통일. 모든 프로덕션 자산을 사용하면 자산을 변경하거나 편집할 수 있어야 합니다. AI 도구를 사용하면 동일한 프롬프트로 자산을 재현할 수 있어야 변경이 가능합니다. 동일한 프롬프트가 매우 다른 결과를 생성할 수 있으므로 까다로울 수 있습니다.
- 스타일. 주어진 게임의 모든 아트가 일관된 스타일을 갖는 것이 중요합니다. 즉, 도구를 훈련시키거나 주어진 스타일에 연결해야 합니다.
2. 장벽을 낮추면 더 많은 위험을 감수하고 창의적으로 탐색할 수 있습니다.
우리는 곧 게임 개발의 새로운 "황금 시대"에 진입할 수 있습니다. 진입 장벽이 낮을수록 더 혁신적이고 창의적인 게임이 폭발적으로 증가하는 시대입니다. 제작 비용이 낮아져 위험이 낮아질 뿐만 아니라 이러한 도구를 통해 더 많은 청중을 위한 고품질 콘텐츠를 만들 수 있기 때문입니다. 다음 예측으로 이어집니다…
3. AI 지원 "마이크로 게임 스튜디오"의 증가
제너레이티브 AI 도구와 서비스로 무장하면 직원이 1~2명에 불과한 작은 "마이크로 스튜디오"에서 제작되는 보다 실행 가능한 상용 게임을 보게 될 것입니다. 작은 인디 게임 스튜디오의 아이디어는 새로운 것이 아닙니다 – 히트 게임우리 가운데 단 5명의 직원으로 스튜디오 Innersloth에서 제작했지만 이 소규모 스튜디오에서 만들 수 있는 게임의 크기와 규모는 점점 커질 것입니다. 이로 인해…
4. 매년 출시되는 게임 수의 증가
Unity와 Roblox의 성공은 강력한 크리에이티브 도구를 제공하면 더 많은 게임을 제작할 수 있음을 보여주었습니다. Generative AI는 기준을 훨씬 더 낮추어 훨씬 더 많은 게임을 만들 것입니다. 업계는 이미 발견 문제로 어려움을 겪고 있습니다.10,000개의 게임이 Steam에 추가되었습니다. 작년 한 해에만 – 이것은 발견에 더 많은 압력을 가할 것입니다. 그러나 우리는 또한 볼 것입니다…
5. Generative AI 이전에는 불가능했던 새로운 게임 유형 생성
Generative AI 없이는 불가능했던 새로운 게임 장르가 발명되는 것을 보게 될 것입니다. 우리는 이미 Microsoft의 비행 시뮬레이터에 대해 이야기했지만 새로운 콘텐츠의 실시간 생성에 의존하는 완전히 새로운 장르가 발명될 것입니다.
고려하다화살술사 , 에 의해스펠브러시 . 거의 무제한의 새로운 게임 플레이를 위해 AI가 만든 캐릭터를 특징으로 하는 RPG 게임입니다.
우리는 또한 AI를 사용하여 플레이어가 자신의 게임 내 아바타를 만들 수 있도록 하는 또 다른 게임 개발자를 알고 있습니다. 이전에는 플레이어가 자신의 아바타를 만들기 위해 믹스 앤 매치할 수 있는 손으로 그린 아바타 이미지 컬렉션이 있었습니다. 이제 그들은 이것을 완전히 버리고 플레이어의 설명에서 아바타 이미지를 생성합니다. 플레이어가 AI를 통해 콘텐츠를 생성하도록 하는 것이 플레이어가 처음부터 자신의 콘텐츠를 업로드하도록 하는 것보다 안전합니다. AI는 공격적인 콘텐츠를 생성하지 않도록 훈련시키면서 플레이어에게 더 큰 소유권을 부여할 수 있기 때문입니다.
6. 기본 모델뿐만 아니라 산업별 AI 도구에 가치가 발생할 것입니다.
Stable Diffusion 및 Midjourney와 같은 기본 모델에 대한 흥분과 소문은 놀라운 평가를 불러일으키고 있지만, 계속되는 새로운 연구의 홍수로 인해 새로운 기술이 개선됨에 따라 새로운 모델이 등장하고 사라질 것입니다. Dall-E, Midjourney 및 Stable Diffusion의 3가지 인기 있는 Generative AI 모델에 대한 웹 사이트 검색 트래픽을 고려하십시오. 각각의 새 모델이 주목을 받고 있습니다.
대안적인 접근 방식은 특정 고객에 대한 깊은 이해와 기존 프로덕션 파이프라인(예: 게임용 Unity 또는 Unreal)에 대한 풍부한 통합을 통해 특정 산업의 제너레이티브 AI 요구 사항에 초점을 맞춘 산업 조정 도구 제품군을 구축하는 것일 수 있습니다.
좋은 예는통로 비디오 편집, 그린 스크린 제거, 인페인팅, 모션 트래킹과 같은 AI 지원 도구를 사용하여 비디오 제작자의 요구 사항을 대상으로 합니다. 이와 같은 도구는 시간이 지남에 따라 새로운 모델을 추가하여 지정된 청중을 구축하고 수익을 창출할 수 있습니다. 우리는 아직 Runway와 같은 게임용 제품군이 등장하는 것을 본 적이 없지만 이것이 활발한 개발 공간이라는 것을 알고 있습니다.
7. 법적 문제가 다가오고 있습니다.
이러한 모든 Generative AI 모델의 공통점은 종종 인터넷 자체를 스크랩하여 생성되는 방대한 콘텐츠 데이터 세트를 사용하여 훈련된다는 것입니다. 예를 들어 Stable Diffusion은 웹에서 스크랩한 50억 개 이상의 이미지/캡션 쌍에 대해 학습됩니다.
현재 이러한 모델은 "공정한 사용" 저작권 원칙에 따라 작동한다고 주장하고 있지만 이 주장은 아직 법정에서 확실하게 테스트되지 않았습니다. 분명한 것 같다법적 문제가 온다 이는 Generative AI의 지형을 바꿀 가능성이 높습니다.
대규모 스튜디오는 명확한 권한과 권한을 가진 내부 콘텐츠를 기반으로 독점 모델을 구축하여 경쟁 우위를 추구할 가능성이 있습니다. 에 제목. 예를 들어, Microsoft는오늘 23개의 퍼스트 파티 스튜디오 , 그리고 또 다른 7Activision 인수 마감 .
8. 적어도 아직은 프로그래밍이 예술적 콘텐츠만큼 크게 중단되지는 않을 것입니다.
소프트웨어 엔지니어링은 게임 개발의 또 다른 주요 비용이지만 a16z Enterprise 팀의 동료들이 최근 블로그 게시물에서 공유한 것처럼예술은 죽은 것이 아니라 기계가 생성한 것일 뿐입니다 , AI 모델로 코드를 생성하는 것은 더 많은 테스트와 검증이 필요하므로 크리에이티브 자산을 생성하는 것보다 생산성 향상이 적습니다. Copilot과 같은 코딩 도구는 엔지니어에게 약간의 성능 향상을 제공할 수 있지만 동일한 영향을 미치지는 않습니다. 적어도 조만간.
추천
이러한 예측을 바탕으로 다음 권장 사항을 제공합니다.
1. 지금 제너레이티브 AI 탐색 시작
다가오는 Generative AI 혁명의 힘을 최대한 활용하는 방법을 알아내는 데는 시간이 걸릴 것입니다. 지금 시작하는 회사는 나중에 유리할 것입니다. 우리는 이러한 기술이 프로덕션에 어떤 영향을 미칠 수 있는지 알아보기 위해 내부 실험 프로젝트를 진행 중인 여러 스튜디오를 알고 있습니다.
2. 시장 지도 기회 찾기
우리 시장 지도의 일부는 이미 애니메이션이나 음성 & 대화하지만 다른 영역은 활짝 열려 있습니다. 우리는 이 공간에 관심이 있는 기업가들이 "Runway for Games"와 같이 아직 개척되지 않은 영역에 노력을 집중할 것을 권장합니다.
2부 – 시장 지도
시장의 현재 상태
우리는 Generative AI가 게임에 영향을 미치는 것을 볼 수 있는 이러한 각 범주에서 식별한 회사 목록을 캡처하기 위해 시장 지도를 만들었습니다. 이 블로그 게시물은 이러한 각 범주를 살펴보고 좀 더 자세히 설명하고 각 범주에서 가장 흥미로운 회사를 강조 표시합니다.
2D 이미지
텍스트 프롬프트에서 2D 이미지를 생성하는 것은 이미 가장 널리 적용되는 생성 AI 영역 중 하나입니다. 다음과 같은 도구중도 ,안정적인 확산 , 그리고달이 2 텍스트에서 고품질 2D 이미지를 생성할 수 있으며 이미 게임 수명 주기의 여러 단계에서 게임 제작에 적용되었습니다.
컨셉 아트
제너레이티브 AI 도구는 "발상"에 뛰어나거나 게임 디자이너와 같은 비예술가가 개념과 아이디어를 매우 빠르게 탐색하여 제작 프로세스의 핵심 부분인 개념 아트워크를 생성하도록 돕습니다. 예를 들어, 한 스튜디오(익명 유지)는 컨셉 아트 프로세스의 속도를 획기적으로 높이기 위해 이러한 여러 도구를 함께 사용하고 있습니다. 이전에는 3주나 걸리던 이미지를 만드는 데 단 하루가 걸립니다.
- 첫째, 게임 디자이너는 Midjourney를 사용하여 다양한 아이디어를 탐색하고 영감을 주는 이미지를 생성합니다.
- 이들은 전문 컨셉 아티스트에게 인계되어 함께 조립하고 그 결과에 페인트를 칠하여 하나의 일관된 이미지를 생성합니다. 그런 다음 Stable Diffusion에 입력되어 다양한 변형을 생성합니다.
- 그들은 이러한 변형에 대해 논의하고, 하나를 선택하고, 일부 편집을 수동으로 칠한 다음 결과에 만족할 때까지 프로세스를 반복합니다.
- 그 단계에서 마지막으로 이 이미지를 Stable Diffusion으로 다시 전달하여 "업스케일"하여 최종 예술 작품을 만듭니다.
2D 프로덕션 아트
일부 스튜디오는 이미 인게임 프로덕션 아트워크에 동일한 도구를 사용하여 실험하고 있습니다. 예를 들어, 여기 좋은Albert Bozesan의 튜토리얼 Stable Diffusion을 사용하여 게임 내 2D 자산을 만드는 방법.
3D 아트워크
3D 자산은 모든 최신 게임의 구성 요소이자 곧 출시될 메타버스입니다. 가상 세계 또는 게임 레벨은 기본적으로 환경을 채우도록 배치 및 수정된 3D 자산 모음입니다. 그러나 3D 자산을 만드는 것은 2D 이미지를 만드는 것보다 더 복잡하며 3D 모델을 만들고 텍스처와 효과를 추가하는 등 여러 단계가 필요합니다. 애니메이션 캐릭터의 경우 내부 "스켈레톤"을 만든 다음 해당 스켈레톤 위에 애니메이션을 만드는 작업도 포함됩니다.
모델 생성, 캐릭터 애니메이션 및 레벨 구축을 포함하여 이 3D 자산 생성 프로세스의 각 단계 이후에 여러 스타트업이 진행되는 것을 볼 수 있습니다. 그러나 이것은 아직 해결된 문제가 아닙니다. 어떤 솔루션도 아직 생산에 완전히 통합될 준비가 되어 있지 않습니다.
3D 자산
3D 모델 생성 문제를 해결하려는 스타트업은 다음과 같습니다.개딤 ,신기루 , 그리고가설 . Nvidia를 포함한 대기업들도 이 문제를 살펴보고 있습니다.Get3D 그리고 Autodesk의클립포지 . Kaedim과 Get3d는 image-to-3D에 중점을 두고 있습니다. ClipForge와 Mirage는 텍스트에서 3D로, Hypothetic은 텍스트에서 3D로의 검색과 이미지에서 3D로의 검색에 모두 관심이 있습니다.
3D 텍스처
3D 모델은 메시에 적용된 질감이나 재료만큼만 사실적으로 보입니다. 중세 성 모델에 적용할 이끼 낀 풍화된 돌 질감을 결정하면 장면의 모양과 느낌이 완전히 바뀔 수 있습니다. 텍스처에는 빛이 재료에 반응하는 방식(예: 거칠기, 광택 등)에 대한 메타데이터가 포함되어 있습니다. 아티스트가 텍스트 또는 이미지 프롬프트를 기반으로 텍스처를 쉽게 생성할 수 있도록 하면 창작 프로세스 내에서 반복 속도를 높이는 데 매우 유용할 것입니다. 여러 팀이 이 기회를 추구하고 있습니다.바륨 ,폰즈 , 그리고아머랩 .
생기
훌륭한 애니메이션을 만드는 것은 게임 제작 프로세스에서 가장 시간이 많이 걸리고 비용이 많이 들고 숙련된 부분 중 하나입니다. 비용을 줄이고 보다 사실적인 애니메이션을 만드는 한 가지 방법은 모션 캡처를 사용하는 것입니다. 배우나 댄서에게 모션 캡처 수트를 입히고 특별히 설치된 모션 캡처 단계에서 움직임을 기록하는 것입니다.
이제 비디오에서 바로 애니메이션을 캡처할 수 있는 제너레이티브 AI 모델을 볼 수 있습니다. 이는 값비싼 모션 캡처 장치가 필요하지 않고 기존 비디오에서 애니메이션을 캡처할 수 있기 때문에 훨씬 더 효율적입니다. 이 모델의 또 다른 흥미로운 측면은 기존 애니메이션에 필터를 적용하는 데 사용할 수도 있다는 것입니다. 예를 들어 취하거나 늙거나 행복해 보입니다. 이 공간을 추구하는 회사는 다음과 같습니다.키네틱스 ,딥모션 ,근본적인 ,무브 아이 , 그리고튀김 .
레벨 디자인 & 세계관
게임 제작에서 가장 시간이 많이 걸리는 측면 중 하나는 게임의 세계를 구축하는 것인데, 이는 제너레이티브 AI가 적합해야 하는 작업입니다. Minecraft, No Man’s Sky, Diablo와 같은 게임은 레벨을 생성하기 위해 절차적 기술을 사용하는 것으로 이미 유명합니다. 레벨은 무작위로 매번 다르게 생성되지만 레벨 디자이너가 정한 규칙을 따릅니다. 새로운 Unreal 5 게임 엔진의 큰 판매 포인트는 나뭇잎 배치와 같은 오픈 월드 디자인을 위한 절차적 도구 모음입니다.
우리는 공간에서 다음과 같은 몇 가지 이니셔티브를 보았습니다.프로메테우스 ,MLXAR , 또는 메타빌더 봇 , 생성 기술이 절차적 기술을 대체하는 것은 시간 문제일 뿐이라고 생각합니다. 한동안 이 공간에 대한 학술 연구가 있었습니다.Minecraft용 생성 기술 또는Doom의 레벨 디자인 .
레벨 디자인을 위한 생성 AI 도구를 기대하는 또 다른 강력한 이유는 다양한 스타일로 레벨과 세계를 생성할 수 있는 능력입니다. 1920년대 플래퍼 시대 뉴욕, 디스토피아적 블레이드 러너 같은 미래, 톨킨 같은 판타지 세계를 생성하기 위한 도구를 요구하는 것을 상상할 수 있습니다.
Midjourney는 "... 스타일의 게임 레벨"이라는 프롬프트를 사용하여 다음 개념을 생성했습니다.
오디오
사운드와 음악은 게임 플레이 경험의 큰 부분을 차지합니다. 제너레이티브 AI를 사용하여 그래픽 측면에서 이미 진행 중인 작업을 보완하기 위해 오디오를 생성하는 회사를 보기 시작했습니다.
음향 효과
음향 효과는 AI에게 매력적인 개방 영역입니다. 가 있었다학술 논문 AI를 사용하여 영화(예: 발자국)에서 "폴리"를 생성하는 아이디어를 탐색하지만 게임에서는 아직 상용 제품이 거의 없습니다.
우리는 이것이 단지 시간 문제라고 생각합니다. 게임의 상호작용적 특성으로 인해 생산의 일부로 정적 사운드 효과("스타워즈 스타일의 레이저 총 사운드")를 생성하고 런타임에 실시간 대화형 사운드 효과를 생성합니다.
플레이어의 캐릭터에 대한 발소리를 생성하는 것과 같은 간단한 것을 고려하십시오. 대부분의 게임은 잔디 위 걷기, 자갈 위 걷기, 잔디 위 달리기, 자갈 위 달리기 등 미리 녹음된 소수의 발자국 소리를 포함하여 이 문제를 해결합니다. 이러한 소리는 생성하고 관리하기가 지루하며 런타임 시 반복적이고 비현실적으로 들립니다.
더 나은 접근 방식은 폴리 음향 효과를 위한 실시간 생성 AI 모델이 될 것입니다. 이 모델은 지면, 캐릭터의 무게, 보행, 신발 등
음악
음악은 항상 게임에 대한 도전이었습니다. 영화나 텔레비전에서와 마찬가지로 감정적 톤을 설정하는 데 도움이 될 수 있기 때문에 중요하지만 게임은 수백 또는 수천 시간 동안 지속될 수 있기 때문에 빠르게 반복되거나 성가시게 될 수 있습니다. 또한 게임의 상호작용 특성으로 인해 주어진 시간에 음악이 화면에서 일어나는 일과 정확히 일치하기 어려울 수 있습니다.
적응형 음악은 20년 이상 게임 오디오의 주제였으며 Microsoft의 "DirectMusic ” 인터랙티브 음악 제작 시스템. DirectMusic은 주로 형식으로 작곡하기 어렵기 때문에 널리 채택되지 않았습니다. Monolith와 같은 몇 가지 게임만아무도 영원히 살지 않는다 , 진정한 대화형 악보를 만들었습니다.
이제 우리는 다음과 같은 AI 생성 음악을 만들려고 노력하는 많은 회사를 보고 있습니다.사운드풀 ,음악가 ,하모니 ,인피니트 앨범 , 그리고그는 ~였다 . 오늘날 일부 도구는주크박스 Open AI에 의해 매우 계산 집약적이며 실시간으로 실행할 수 없으며 대부분은 초기 모델이 구축되면 실시간으로 실행할 수 있습니다.
연설과 대화
게임 내 캐릭터의 사실적인 목소리를 만들기 위해 노력하는 많은 회사가 있습니다. 음성 합성을 통해 컴퓨터에 음성을 제공하려는 오랜 역사를 감안할 때 이것은 놀라운 일이 아닙니다. 회사에는 다음이 포함됩니다.소난틱 ,요리하다 ,복제 스튜디오 ,Resemble.ai ,Readspeaker.ai , 그리고 더 많은.
음성에 생성 AI를 사용하면 여러 가지 이점이 있으며, 이는 이 공간이 왜 그렇게 붐비는지 부분적으로 설명합니다.
- 즉석에서 대화를 생성합니다. 일반적으로 게임의 음성은 성우가 미리 녹음하지만 미리 녹음된 미리 녹음된 음성으로 제한됩니다. 생성 AI 대화를 통해 캐릭터는 무엇이든 말할 수 있습니다. 즉, 플레이어가 하는 일에 완전히 반응할 수 있습니다. NPC를 위한 보다 지능적인 AI 모델(이 블로그의 범위를 벗어나지만 지금은 똑같이 흥미로운 혁신 영역)과 결합하여 플레이어에게 완전히 반응하는 게임이 곧 출시될 예정입니다.
- 역할 놀이. 많은 플레이어가 현실 세계의 정체성과 거의 닮지 않은 판타지 캐릭터로 플레이하기를 원합니다. 하지만 이러한 환상은 플레이어가 자신의 목소리로 말하는 순간 무너집니다. 플레이어의 아바타와 일치하는 생성된 음성을 사용하면 그 환상이 유지됩니다.
제어. 음성이 생성되면 음색, 억양, 감정적 공명, 음소 길이, 악센트 등과 같은 음성의 뉘앙스를 제어할 수 있습니다. - 현지화. 대화를 모든 언어로 번역하고 동일한 음성으로 말할 수 있습니다. 같은 회사딥덥 이 틈새 시장에 특별히 집중하고 있습니다.
NPC 또는 플레이어 캐릭터
많은 신생 기업이 생성 AI를 사용하여 상호 작용할 수 있는 믿을 수 있는 캐릭터를 만드는 것을 고려하고 있습니다. 부분적으로는 가상 비서나 안내원과 같이 게임 외부에서 매우 광범위하게 적용할 수 있는 시장이기 때문입니다.
사실적인 캐릭터를 만들기 위한 노력은 AI 연구의 시작으로 거슬러 올라갑니다. 사실, 인공 지능에 대한 고전적인 "튜링 테스트"의 정의는 인간이 AI와의 채팅 대화와 인간을 구별할 수 없어야 한다는 것입니다.
현재 범용 챗봇을 구축하는 수백 개의 회사가 있으며, 그 중 다수는 언어 모델과 같은 GPT-3으로 구동됩니다. 소수의 사람들은 특히 다음과 같은 엔터테인먼트 목적으로 챗봇을 구축하려고 시도하고 있습니다.레플리카 그리고영혼 가상 친구를 구축하려는 사람. 영화 Her에서 탐구한 가상 여자 친구와 데이트하는 개념은 생각보다 가까울 수 있습니다.
우리는 이제 다음과 같은 이러한 챗봇 플랫폼의 다음 반복을 보고 있습니다.Charisma.ai ,Convai.com , 또는인월드.ai , 제작자가 이러한 캐릭터에 목표를 부여할 수 있는 도구와 함께 감정 및 대행사가 있는 완전히 렌더링된 3D 캐릭터를 강화하기 위한 것입니다. 순전히 윈도우 드레싱에 비해 게임에 적합하거나 줄거리를 진행하는 데 내러티브 위치가 있는 경우 중요합니다.
올인원 플랫폼
가장 성공적인 생성 AI 도구 중 하나는Runwayml.com , 단일 패키지에 광범위한 제작자 도구 모음을 함께 제공하기 때문입니다. 현재 비디오 게임을 제공하는 플랫폼은 없으며 이것이 간과된 기회라고 생각합니다. 우리는 다음과 같은 기능을 갖춘 솔루션에 투자하고 싶습니다.
- 전체 생산 프로세스를 포괄하는 전체 생성 AI 도구 세트입니다. (코드, 자산 생성, 텍스처, 오디오, 설명 등)
- Unreal 및 Unity와 같은 인기 있는 게임 엔진과 긴밀하게 통합됩니다.
- 일반적인 게임 제작 파이프라인에 맞도록 설계되었습니다.
결론
지금은 게임 크리에이터가 되기에 정말 좋은 때입니다! 이 블로그 게시물에 설명된 도구 덕분에 게임을 만드는 데 필요한 콘텐츠를 생성하는 것이 그 어느 때보다 쉬워졌습니다. 게임이 지구 전체만큼 큰 경우에도 마찬가지입니다!
언젠가는 플레이어가 원하는 것을 정확히 기반으로 플레이어만을 위해 만들어진 전체 개인화 게임을 상상하는 것도 가능합니다. 이것은 Ender's Game의 "AI Mind Game"이나 Star Trek의 홀로덱과 같이 오랫동안 공상 과학 소설에 등장했습니다. 그러나 이 블로그 게시물에 설명된 도구가 빠르게 발전함에 따라 이러한 현실이 곧 다가올 것이라고 상상하는 것은 어렵지 않습니다.
게임 회사용 AI 구축에 관심이 있는 창업자 또는 잠재적 창업자라면 연락해 주세요! 우리는 당신의 의견을 듣고 싶습니다!