AI颠覆人类的第一步:读懂人心
在关于AI的大讨论中,人们为其赋予的角色要么是我们最得力的高效助手,要么则是将颠覆我们的“机器军团”,不管是敌是友, AI不仅要能完成人类布置的任务,还要能“读懂”人心,而这一读心能力也正是今年以来AI领域的重头戏。
在PitchBook今年发布的企业Saas新兴技术研究报告中,「情感AI」成为了一大技术亮点,它指的是使用情感计算和人工智能技术来感知、了解和进行对人类情感的互动,试图通过分析文字、面部表情、声音和其他生理信号来理解人类的情绪,简单来说,情感AI就是希望机器能像人类一样,甚至比人类更好地“读懂”情感。
它的主要技术包括:
面部表情分析:通过摄像头、计算机视觉和深度学习,检测微表情与面部肌肉运动。
声音分析:通过声纹、语调、节奏识别情绪状态。
文本分析:借助自然语言处理(NLP)技术解读语句和上下文。
生理信号监测:使用可穿戴设备分析心率、皮肤反应等,提升互动个性化和情感丰富度。
Emotion AI
情感AI的前身是情感分析技术,它主要是通过文本互动进行分析,比如在社交媒体上通过文字进行用户情感的分析和提取,而有了AI的加持,整合视觉和音频等多种输入方式,情感AI承诺着更加精准和完整的情感分析。
VC撒钱,创企获巨额融资
硅兔君观察,情感AI的潜力吸引了众多投资者的关注,一些专注于这个领域的初创公司像Uniphore、MorphCast等,已经在这一赛道上获得了大量投资。
来自加州的Uniphore从2008年起就在探索为企业提供自动化对话解决方案,已经开发出包括U-Self Serve、U-Assist、U-Capture和U-Analyze等多个产品线,帮助客户通过语音、文本、视觉和情感AI技术进行更加个性化和情感丰富的互动。U-Self Serve主打精准识别对话中的情感和语气,让企业能够提供更加个性化的服务,来提升用户参与满意度;
U-Self Serve
U-Assist则能通过实时指导和工作流程的自动化来提高客服代理的工作效率;U-Capture可以通过自动化的情感数据收集和分析,让企业拥有对客户需求和满意度的深度洞察;而U-Analyze则能够帮助客户识别互动中的关键趋势和情感变化,提供由数据驱动的决策支持来增强品牌忠诚度。
Uniphore的技术并不仅仅是让机器理解语言,而是希望它们能在与人类互动时,捕捉和解读隐藏在语气、表情背后的情感。这种能力让企业在与客户互动时,不再只是机械化应对,而是能够更好地满足客户的情感需求,通过使用Uniphore, 企业的用户满意度能够达到87%,客服表现提升30%。
Uniphore至今已经完成了超6.2亿美元融资,最近一轮投资来自于2022年由NEA领投的4亿美元,March Capital等现有的投资者也进行了参投,此轮后估值达到了25亿美元。
Uniphore
Hume AI则推出了世界上第一个能够共情的语音AI,由前Google科学家Alan Cowen创立,他曾以开创了语义空间理论而出名,这一理论通过揭示声音、面部和手势的细微差别,来理解情绪体验和表达,Cowen的研究成果发表在“自然“和“认知科学趋势”等众多期刊上,涉及迄今为止研究范围最广、最多样化的情绪样本。
以此研究驱动的Hume开发出了对话式语音 API - EVI,它结合了大型语言模型和同理心算法,能够深入理解和解析人类的情感状态,它不但能识别语音中的情感,还能在与用户的互动中做出更加细腻和个性化的反应,而开发人员只需几行代码即可使用这些功能,并可将其内置到任何应用程序中。
Hume AI
当前大多数AI系统的主要限制之一在于它的指令主要由人类给出,这些指令和提示容易出错且无法挖掘出人工智能的巨大潜力,而Hume所开发出的共情大型语言模型 (eLLM) 能够根据上下文和用户的情绪表达调整其使用的词语和语调,通过将人类快乐作为第一原则进行机器的学习、调整和互动,在心理健康、教育培训、急救呼叫、品牌分析等多个场景中都能为用户带来更加自然和真实的体验。
就在今年3月,Hume AI 完成了由EQT Ventures领投的5000万美元B轮融资,投资方还包括Union Square Ventures、Nat Friedman & Daniel Gross、Metaplanet和Northwell Holdings等机构。
在这一领域的还有专门衡量消费者认知和情感反应的Entropik,通过 Decode这一融合了情感AI、行为AI、生成AI和预测AI综合力量的功能,它能够更好了解消费者的行为和偏好,从而提供更个性化的营销建议,Entropik最近在2023年2月完成了2500万美元的B轮融资,投资方包括SIG Venture Capital和Bessemer Venture Partners。
Entropik
巨头参与,一片混战
科技大厂凭借自身优势,在情感AI这一领域也有所布局。
包括 Microsoft Azure 认知服务的情感API,能够通过分析面部表情和情绪,来识别图片和视频中的喜悦、愤怒、悲伤、惊讶等多种情绪;
IBM Watson的自然语言理解API可以处理大量文本数据,识别出背后的情感倾向(如积极、消极或中性),来更精准的解读用户意图;
Google Cloud AI 的 Cloud Vision API 拥有强大的图像分析功能,能够快速识别图片中的情绪表达,且支持文字识别和情绪关联;
AWS 的 Rekognition也能够检测情绪、识别面部特征并追踪表情变化,还可以与其他AWS服务结合使用,成为完整的社媒分析或情感AI驱动的营销应用。
Cloud Vision API
有些初创公司在情感AI领域的研发脚步更快,甚至到了科技巨头都要“挖人”的地步,比如独角兽Inflection AI就被投资方微软看中了AI团队和模型,微软在与Bill Gates、Eric Schmidt和NVIDIA等多方共同为Inflection AI投下了13亿美元后,向AI领军人物也是Inflection AI的联合创立者之一Mustafa Suleyman抛出橄榄枝,随后Suleyman连带70多位员工转投微软,而微软也为此支付了近6.5亿美元。
不过,Inflection AI也很快重整旗鼓,组建了来自拥有谷歌翻译、 AI咨询和AR 多个背景的新团队,继续在其核心产品Pi上持续发力。Pi是一款能够理解并回应用户情感的个人助手,与传统的AI不同,Pi 更加注重与用户建立情感连接,通过分析语音、文字等输入感知情绪,在对话中展现出同理心。Inflection AI将Pi视为教练、知己、倾听者和创意伙伴,而不是简单的AI助手。此外,Pi 拥有强大的记忆功能,能够记住用户的多次对话历史,以此来提升互动的连续性和个性化体验。
Inflection AI Pi
发展之路,关注和质疑并存
虽然情感AI寄托着我们对更加人性化互动方式的期许,但就像所有的AI技术一样,它的推广更伴随着关注和质疑。首先,情感AI是否真的能够准确解读人类的情感?在理论上,这项技术的确能够使服务、设备和技术的体验更加丰富,但从现实的角度来看,人类的情感本质上是模糊和主观的,早在2019年就有研究人员曾对这项技术提出质疑,表示面部表情并不能可靠的反映人类的真实情感,因此单纯依赖机器来模拟人类的面部表情、体态和语调来理解情感, 存在着一定的局限性。
其次,严格的法规监管也一直是AI发展路上的绊脚石,比如欧盟的AI法案禁止在类似教育等领域使用使用计算机视觉情感检测系统,因此可能会限制某些情感AI解决方案的推广;像是美国伊利诺伊等州也有法律禁止在未获许可的情况下进行生物识别数据的收集,这就直接限制了情感AI某些技术使用的前提。同时,数据隐私和保护更是一个重要问题,情感AI通常应用于教育、健康、保险等对数据隐私要求格外严格的领域,因此确保情感数据的安全和合法使用,是每一家情感AI公司都需要面对的课题。
最后,不同文化地域的人与人之间进行交流和情绪解读都是难题,对AI来说更是考验,比如不同地区对情感的理解和表达方式各不相同,这可能影响情感AI系统的有效性和完整性,此外,情感AI在处理种族、性别和性别认同偏见时,也可能面临不小的困难。
情感AI不仅承诺着减少人力的高效,还有着读人心的体贴,但它是否能够真的成为人类互动中的万能解决方案,还是会成为和Siri大同小异的智能助手,在需要真正情感理解的任务中表现平平?或许在未来,AI的“读心术”将会颠覆人机甚至是人类互动,但至少在现在,真正理解和回应人类情感,或许还是更需要人的参与和审慎。
参考来源:
Uniphore Announces $400 Million Series E(Uniphore)
Hume AI Announces $50 Million Fundraise and Empathic Voice Interface(Yahoo Finance)
Introducing Pi, Your Personal AI(Inflection AI)
‘Emotion AI’ may be the next trend for business software, and that could be problematic(TechCrunch)
EMERGING TECH RESEARCH Enterprise Saas Report (PitchBook)