인류 전복을 위한 AI의 첫걸음: 사람의 마음 읽기
사람들은 AI에 대해 가장 효율적인 비서 또는 우리를 전복시킬 '기계 군단'의 역할을 부여해 왔습니다. AI는 인간이 부여한 작업을 완수할 수 있어야 할 뿐만 아니라 사람의 마음과 생각을 '읽을' 수 있어야 하며, 사람의 마음과 생각을 읽는 능력은 올해 AI 분야의 주요 초점이었습니다.
올해 엔터프라이즈 SaaS의 신흥 기술에 대한 PitchBook의 연구에서 '감정 AI'가 주요 기술로 주목받았는데, 이는 정서 컴퓨팅과 AI 기술을 사용하여 인간의 감정을 인지하고 이해하며 상호 작용하는 것을 말하며 텍스트, 표정, 음성 및 기타 생리적 신호를 분석하여 인간의 감정을 이해하려고 시도하는 것을 의미합니다. 간단히 말해, 감성 AI는 기계가 인간만큼, 아니 인간보다 더 잘 감정을 '읽을 수 있기를 바라는 희망입니다.
주요 기술은 다음과 같습니다.
표정 분석. strong>: 카메라, 컴퓨터 비전, 딥러닝을 통해 미세한 표정과 얼굴 근육의 움직임을 감지합니다.
음성 분석: 음성 지문, 톤, 리듬을 통해 감정 상태를 식별합니다.
텍스트 분석: 자연어 처리(NLP) 기술을 통해 발화 및 문맥을 해석합니다.
생리적 신호 모니터링: 웨어러블을 사용하여 심박수, 피부 반응 등을 분석하여 상호작용의 개인화 및 정서적 풍부함을 향상시킵니다.

감정 AI
감정 AI의 전신은 소셜 미디어의 텍스트를 통한 사용자 감정 분석 및 추출 등 주로 텍스트 상호작용을 분석하는 감정 분석 기술이지만, AI의 지원과 시각 및 오디오 등 여러 입력의 통합을 통해 감정 AI는 보다 정확하고 완전한 완벽한 감정 분석을 약속합니다.
VC들이 돈을 쏟아붓고, 스타트업들이 막대한 자금을 확보
Silicon Bunny는 감정 AI의 잠재력이 많은 투자자들의 관심을 끌고 있으며, 많은 스타트업이 이 분야에 집중하고 있다고 말합니다. 유니포어, 모프캐스트 등 많은 스타트업이 이미 이 분야에서 상당한 투자를 받았습니다.
캘리포니아에 본사를 둔 유니포어는 2008년부터 기업을 위한 자동화된 대화 솔루션을 연구해 왔으며 U-Self Serve, U-Assist, U-Capture, U-Analyze 등 여러 제품군을 개발해 왔습니다. U-Self Serve는 대화의 감정과 어조를 정확하게 파악하여 기업이 보다 개인화된 서비스를 제공함으로써 사용자 참여 만족도를 향상시키는 데 중점을 두고 있습니다.


U-Self Serve
U-Assist는 실시간 코칭과 워크플로 자동화를 통해 상담원의 생산성을 향상시키고, U-Capture는 자동화된 감정 데이터 수집 및 분석을 통해 조직이 고객의 요구와 만족도에 대한 깊은 통찰력을 제공하며, U-Analyze는 고객이 상호작용의 주요 트렌드와 감정 변화를 파악하여 데이터 기반 서비스를 제공하도록 돕습니다. U-Analyze는 고객이 상호 작용의 주요 트렌드와 감정 변화를 파악하여 브랜드 충성도를 높이기 위한 데이터 기반 의사 결정 지원을 제공합니다.
유니포어의 기술은 기계가 단순히 언어를 이해하는 데 그치지 않고 인간과 상호작용할 때 목소리 톤과 표정 뒤에 숨겨진 감정을 포착하고 해석할 수 있을 것으로 기대합니다. 이러한 능력을 통해 조직은 기계적인 대응을 넘어 고객과 상호작용할 때 고객의 정서적 요구를 더 잘 충족시킬 수 있으며, 유니포어를 사용한 기업들은 87%의 사용자 만족도와 30%의 고객 서비스 성과 개선을 달성할 수 있었습니다.
유니포어는 현재까지 6억 2천만 달러 이상의 자금 조달을 완료했으며, 가장 최근에는 2022년 3월 Capital과 같은 기존 투자자들의 참여로 NEA가 주도하는 4억 달러 규모의 라운드가 진행되었고, 이 라운드 이후 25억 달러의 가치를 평가받게 될 예정입니다.

유니포어
Hume AI는 목소리, 얼굴, 제스처의 뉘앙스를 파악하는 의미 공간 이론을 개척한 것으로 유명한 전 구글 과학자 앨런 코웬이 설립한 세계 최초의 공감 음성 AI를 공개했습니다. 코웬의 연구는 Nature와 Trends in Cognitive Science를 비롯한 수많은 저널에 게재되었으며, 지금까지 연구된 가장 광범위하고 다양한 감정 샘플을 다루고 있습니다.
이 연구를 바탕으로 Hume은 대규모 언어 모델과 공감 알고리즘을 결합하여 인간의 감정 상태를 심층적으로 이해하고 파싱하여 음성에서 감정을 인식할 뿐만 아니라 사용자와의 상호작용에서 보다 미묘하고 개인화된 응답을 제공하는 대화형 음성 API인 EVI를 개발했습니다. 개발자는 단 몇 줄의 코드만으로 이러한 기능을 사용하여 모든 애플리케이션에 구축할 수 있습니다.

Hume AI
현재 대부분의 AI 시스템의 주요 한계 중 하나는 인간이 주로 지시를 내리기 때문에 오류가 발생하기 쉽고 AI의 엄청난 잠재력을 활용하지 못한다는 것입니다. 흄의 공감적 대규모 언어 모델(eLLM)은 사용자의 감정이 담긴 단어와 톤을 맥락과 사용자의 기분에 맞게 조정합니다. 인간의 행복을 기계 학습, 조정 및 상호 작용의 첫 번째 원칙으로 삼은 흄은 문맥과 사용자의 감정 표현에 따라 단어와 목소리 톤을 조정하는 공감형 대규모 언어 모델(eLLM)을 개발하여 정신 건강, 교육 및 훈련, 응급 전화, 브랜드 분석 등 다양한 시나리오에서 보다 자연스럽고 진정성 있는 경험을 제공합니다.
올해 3월, Hume AI는 유니온 스퀘어 벤처스, 냇 프리드먼, 다니엘 그로스 등의 투자자와 함께 EQT 벤처스가 주도하는 5천만 달러 규모의 시리즈 B 투자 라운드를 완료했습니다, 메타플래닛, 노스웰 홀딩스 등이 투자자로 참여했습니다.
또한 소비자의 인지 및 감정 반응 측정을 전문으로 하는 Entropik은 감성 AI, 행동 AI, 생성 AI, 예측 AI를 결합한 Decode를 통해 소비자의 행동과 선호도를 더 잘 이해하고 보다 개인화된 마케팅 추천을 제공하기 위해 최근 엔트로픽은 2023년 2월 SIG 벤처 캐피탈과 베세머 벤처 파트너스 등의 투자자로부터 2,500만 달러 규모의 시리즈 B 펀딩 라운드를 마감했습니다.
: 가운데">
엔트로픽
거대한 참여, 혼전 양상
기술 전공자들도 각자의 강점을 내세워 이 감성 AI 분야에 뛰어들었습니다.
얼굴 표정과 감정을 분석해 사진과 동영상에서 기쁨, 분노, 슬픔, 놀라움 등 다양한 감정을 인식할 수 있는 Microsoft Azure 코그니티브 서비스의 이모션 API를 비롯해
IBM Watson의 자연어 이해 API는 대량의 텍스트 데이터를 처리하여 기본 감정 성향(예: 긍정, 부정, 중립)을 파악하여 사용자의 의도를 보다 정확하게 해석할 수 있습니다.
.
Google Cloud AI의 Cloud Vision API는 이미지에서 감정 표현을 빠르게 식별할 수 있는 강력한 이미지 분석 기능을 갖추고 있으며 텍스트 인식 및 감정 상관관계를 지원합니다.
AWS의 Rekognition은 감정 감지, 얼굴 특징 인식, 표정 변화 추적도 가능하며, 다른 AWS 서비스와 결합하여 완전한 소셜 미디어 분석 또는 감정 AI 기반 마케팅 앱으로 사용할 수 있습니다.

Cloud Vision API<
일부 스타트업은 AI 연구로 투자자 Microsoft의 주목을 받은 유니콘 Inflection AI와 같이 기술 대기업이 '포치'할 정도로 감정 AI 분야에서 더욱 빠르게 움직이고 있습니다. 예를 들어 유니콘 인플렉션 AI는 빌 게이츠, 에릭 슈미트, 엔비디아 등과 함께 13억 달러를 투자한 마이크로소프트가 투자한 후 AI 분야 최고의 인재이자 인플렉션 AI의 공동 창업자인 무스타파 술레이만에게 올리브 가지를 던져 프로젝트에 참여하게 한 바 있습니다. 수레이만은 70여 명의 직원과 함께 이 프로젝트에 6억 5천만 달러에 가까운 금액을 지불한 Microsoft로 자리를 옮겼습니다.
그러나 Inflection AI는 빠르게 조직을 재정비하여 Google 번역, AI 컨설팅, AR 분야의 경력을 갖춘 새로운 팀을 구성하여 핵심 제품인 사용자의 감정을 이해하고 반응하는 개인 비서 Pi를 계속 개발했습니다. Pi는 사용자와 정서적 관계를 형성하고 음성, 텍스트 및 기타 입력을 분석하여 감정을 감지하고 대화에서 공감을 표시하는 데 더 중점을 두며, Inflection AI는 Pi를 단순한 AI 비서가 아닌 코치, 친구, 경청자, 창의적인 파트너로 인식하고 있습니다. 또한 Pi는 상호작용의 연속성을 높이고 경험을 개인화하기 위한 방법으로 사용자의 여러 대화 기록을 기억하는 강력한 메모리를 갖추고 있습니다.

인펙션 AI Pi<
개발의 길,고민과 질문
감성 AI는 모든 AI 기술과 마찬가지로 사람과 더 인간적인 방식으로 상호 작용할 수 있는 가능성을 제시하지만, 그 출시에는 우려와 의문이 함께 따릅니다. 첫째, 감성 AI가 과연 인간의 감정을 정확하게 해석할 수 있을까요? 이론적으로 이 기술은 실제로 서비스, 기기 및 기술의 경험을 더욱 풍부하게 만들 수 있지만, 현실적인 관점에서 볼 때 인간의 감정은 본질적으로 모호하고 주관적이며, 2019년 초 일부 연구자들은 얼굴 표정이 인간의 실제 감정을 안정적으로 반영하지 못하므로 기계에만 의존하여 인간의 표정, 몸 자세, 억양을 시뮬레이션하여 이해하는 것은 한계가 있다고 말하며 이 기술에 의문을 제기한 바 있습니다. 사람의 표정, 몸의 자세, 억양 등을 기계에만 의존해 감정을 이해하는 데는 한계가 있습니다.
둘째, 교육 등의 분야에서 컴퓨터 비전 감정 감지 시스템의 사용을 금지하여 특정 감정 AI 솔루션의 보급을 제한할 수 있는 유럽연합의 AI법, 허가 없이 생물학적 기반 테스트를 금지하는 법을 가진 미국 일리노이주, 허가 없이 생물학적 기반 테스트를 금지하는 법을 가진 미국 등 엄격한 규제는 AI 개발의 걸림돌로 작용하고 있습니다. 일리노이주를 비롯한 미국의 여러 주에서는 허가 없이 생체 데이터를 수집하는 것을 금지하는 법률이 있어 감성 AI에 특정 기술을 사용하는 전제를 직접적으로 제한하고 있습니다. 동시에 데이터 프라이버시 및 보호는 중요한 문제이며, 감정 AI는 일반적으로 교육, 건강, 보험 및 기타 데이터 프라이버시 요구 사항이 특히 엄격한 분야에서 사용되므로 감정 데이터의 보안 및 법적 사용을 보장하기 위해 모든 감정 AI 회사는이 문제에 직면해야합니다.
마지막으로, 서로 다른 문화권의 사람들 간의 의사소통과 감정 해석은 어려운 문제이며, AI에 더 많은 테스트를 요구합니다. 예를 들어 지역마다 감정을 이해하고 표현하는 방식이 다르기 때문에 감정 AI 시스템의 효과와 무결성에 영향을 미칠 수 있으며, 나아가 인종, 성별, 성적 문제를 다룰 때 감정 AI가 동일한 문제에 직면하지 않을 수 있습니다. 또한 감정 AI는 인종, 성별, 성 정체성 편견을 다룰 때에도 상당한 어려움에 직면할 수 있습니다.
감성 AI는 인간의 노동력을 줄여주는 효율성뿐만 아니라 사람의 마음과 생각을 읽는 사려 깊음을 약속하지만, 과연 인간 상호작용의 만능 솔루션이 될 수 있을까요, 아니면 진정한 감정 이해가 필요한 작업에서는 평범하게 수행하는 Siri와 같은 스마트 비서가 될까요? 미래에는 AI의 '마음 읽기'가 인간과 기계, 나아가 인간 간의 상호작용을 파괴할 수도 있겠지만, 적어도 현재로서는 인간의 감정을 진정으로 이해하고 반응하기 위해서는 여전히 인간의 개입과 신중함이 더 필요할 수 있습니다.
출처:
Uniphore, 인간 기계 상호작용을 위한 4억 달러 규모의 유니파마 펀드 조성 발표 유니포어, 4억 달러 규모의 시리즈 E 투자 유치 발표 (유니포어)
Hume AI, 5천만 달러 규모의 펀드레이징 및 Empathic 음성 인터페이스 (야후 파이낸스)
개인 인공지능 파이 소개 (인플렉션 AI)
Hume AI, 5천만 달러 펀드레이징 및 공감 인터페이스 발표 (야후 파이낸스)
'감정 AI'가 비즈니스 소프트웨어의 다음 트렌드가 될 수 있으며, 이는 문제가 될 수 있습니다 (TechCrunch)< /p>
이머징 테크 리서치 엔터프라이즈 Saas 보고서(PitchBook)