1994년 플로리다의 보석 디자이너 다이애나 듀이저는 구운 치즈 샌드위치에서 성모 마리아의 얼굴을 봤다고 주장했고, 이 발견은 2만 8천 달러에 경매에 부쳐진 것으로 유명합니다. 이 사건은 헤드라인을 장식하면서 사람들이 무생물에서 얼굴이나 무늬를 인식하는 고대 심리 현상인 파레이돌리아에 대한 관심도 불러일으켰습니다. 하지만 정확히 무엇이 이러한 경향을 유발하며, 발전된 기능을 갖춘 기계가 인간과 같은 방식으로 파레이돌리아를 경험할 수 있을까요?
MIT의 컴퓨터 과학 및 인공 지능 연구소(CSAIL)의 획기적인 새 연구는 이러한 질문에 답하기 위해 사람이 라벨을 붙인 5,000개의 환영 얼굴 이미지로 구성된 방대한 데이터 세트를 소개합니다. 연구자들은 이 데이터 세트를 통해 인간과 인공지능(AI) 시스템이 환상의 얼굴을 처리하는 방법의 미묘한 차이를 분석하고 그 과정에서 예상치 못한 인사이트를 발견할 수 있었습니다.
페이스 파레이돌리아의 기원
MIT의 박사 과정 학생인 마크 해밀턴이 주도한 이 연구는 파레이돌리아의 더 깊은 기원을 탐구합니다. 해밀턴은 "얼굴 파레이돌리아는 오랫동안 심리학자들의 관심을 끌었지만 컴퓨터 비전 커뮤니티에서는 거의 탐구되지 않은 분야였습니다."라고 설명합니다. 연구팀의 목표는 이러한 격차를 해소하고 인간과 AI가 구름, 전기 콘센트, 심지어 구운 치즈 샌드위치와 같이 기술적으로 존재하지 않는 곳에서 얼굴을 감지하는 방법을 조사하는 것이었습니다.
파레이돌 얼굴을 인식하기 위한 AI의 고군분투
주요 연구 결과 중 하나는 AI 모델이 처음에는 인간과 같은 방식으로 패어돌릭 얼굴을 인식하지 못한다는 사실이었습니다. 인간은 자동차의 헤드라이트나 바닥의 패턴과 같은 일상적인 물체에서 얼굴을 즉시 '볼 수 있지만, 기계는 더 복잡한 훈련이 필요합니다. 이 연구에 따르면 동물의 얼굴을 감지하도록 알고리즘을 미세 조정한 후에야 동물의 얼굴을 훨씬 더 잘 식별할 수 있게 되었습니다.
동물 얼굴 인식과 환영 얼굴 인식 사이의 이 놀라운 연관성은 파레이돌리아의 진화적 기원에 대한 가능성을 시사합니다. 특히 포식자나 먹잇감의 얼굴을 발견하는 것은 먼 조상들의 생존 메커니즘이었을 수 있습니다. "이 결과는 파레이돌리아가 인간의 사회적 행동에서 비롯된 것이 아니라 숨어 있는 호랑이를 빨리 발견하거나 사슴이 어느 방향을 보고 있는지 파악하여 원시 조상이 사냥을 할 수 있도록 하는 것과 같은 더 깊은 것에서 비롯되었을 수 있음을 시사합니다."라고 해밀턴은 설명합니다.
파레이돌리아의 골디락스 지역
MIT 연구의 또 다른 중요한 발견은 "파레이돌리아의 골디락스 영역"을 발견한 것입니다. 이 용어는 인간과 기계 모두 얼굴이 없는 물체에서 얼굴을 인식할 가능성이 가장 높은 특정 범위의 시각적 복잡성을 의미합니다. MIT 교수이자 이 프로젝트의 책임 연구자인 윌리엄 프리먼(William T. Freeman)에 따르면 이미지가 너무 단순하면 얼굴을 형성하기에 충분한 디테일이 없지만 너무 복잡하면 시각적 노이즈가 된다고 합니다.
이 현상을 모델링하기 위해 연구진은 파레이돌리아가 발생할 가능성이 가장 높은 위치를 예측하는 공식을 개발했습니다. 연구진은 특정 복잡성 범위 내에서 얼굴을 감지할 가능성이 최고조에 이른다는 사실을 발견하고, 인간 피험자와 AI 시스템 모두에 대한 테스트를 통해 이를 검증했습니다. 이 '파레이돌리아 피크'는 인간의 두뇌와 기계가 환영의 얼굴을 인식하는 데 필요한 단순성과 복잡성 사이의 미묘한 균형을 강조합니다.
최대 규모의 파레이돌릭 데이터 세트 구축
이 연구의 핵심 구성 요소는 이전의 안면 자극 수집보다 훨씬 더 작은 데이터 세트를 만드는 것이었습니다. CSAIL 팀은 LAION-5B 데이터 세트에서 약 20,000개의 후보 이미지를 선별하여 얼굴에 대한 인간의 인식을 바탕으로 세심하게 라벨을 지정하고 판단했습니다. 각 이미지는 얼굴이 불러일으키는 감정, 나이, 우연인지 의도적인지 여부 등 다양한 요소에 따라 평가되었습니다. 몇 시간 동안 사람이 주석을 달아야 하는 이 과정은 AI와 인간 인지 분야의 연구를 발전시킬 수 있는 리소스를 구축하는 데 필수적이었습니다.
해밀턴은 이 기념비적인 작업에 들어간 개인적인 노력을 유머러스하게 인정하며 "데이터 세트의 대부분은 어머니 덕분에 존재하게 되었습니다."라고 말하며 이미지에 라벨을 붙이는 데 도움을 준 은퇴한 은행가인 어머니를 언급합니다.
파레이돌리아 그 이상의 애플리케이션: 얼굴 인식에서 제품 디자인까지
이 연구는 파레이돌리아의 독특한 현상에 초점을 맞추고 있지만, 그 의미는 이보다 훨씬 더 넓습니다. 이 연구에서 얻은 인사이트는 AI 기반 얼굴 인식 시스템을 크게 개선하여 오탐지를 줄일 수 있습니다. 이는 잘못된 얼굴 감지가 위험한 실수로 이어질 수 있는 자율 주행 자동차나 로봇 공학 및 인간과 컴퓨터의 상호 작용과 같은 분야에서 파레이돌리아를 인식하거나 피함으로써 기계와의 상호 작용을 더 원활하게 만들 수 있는 실용적인 응용 분야에도 적용될 수 있습니다.
또한 이 연구 결과는 제품 디자인에 응용할 수 있는 잠재력이 있습니다. 파레이돌리아를 이해하고 제어하면 디자이너가 더 친근하고 덜 위협적으로 보이는 제품을 만드는 데 도움이 될 수 있습니다. 해밀턴은 "자동차나 어린이 장난감의 디자인을 자동으로 조정하여 더 친근하게 보이도록 하거나 의료 기기가 의도치 않게 위협적으로 보이지 않도록 할 수 있다고 상상해 보세요."라고 말합니다.
인간과 기계의 인식 격차
이 연구는 또한 인간과 기계의 인식 차이에 대한 흥미로운 질문을 제기합니다. 인간은 본능적으로 인간과 유사한 특성을 가진 무생물을 해석하지만, AI 알고리즘은 그렇지 않습니다. 예를 들어, 사람들은 전기 콘센트를 '노래하는 것'으로 인식하고 심지어 '움직이는 입술'이라고 상상할 수도 있지만, AI는 이러한 만화 같은 얼굴을 '보지' 못합니다.
"인간의 인식과 알고리즘의 해석 사이에 이러한 차이가 발생하는 이유는 무엇일까요? 파레이돌리아는 유익할까요, 아니면 해로울까요?" 해밀턴이 묻습니다. 이러한 질문은 다른 많은 질문과 함께 이 고전적인 심리 현상에 대한 연구팀의 지속적인 조사의 기초를 형성합니다.
앞으로의 전망: 인간과 유사한 AI 시스템을 향해
CSAIL 팀은 데이터 세트를 더 넓은 과학 커뮤니티와 공유할 준비를 하면서 이미 미래를 내다보고 있습니다. 잠재적인 다음 단계로는 AI 시스템을 훈련시켜 사시성 얼굴을 감지할 뿐만 아니라 보다 인간과 유사한 방식으로 이해하고 설명할 수 있도록 하는 것이 포함됩니다. 예를 들어, 시각 언어 모델은 인간의 경험과 더 밀접하게 일치하는 방식으로 시각적 자극에 관여하도록 설계될 수 있습니다.
"정말 유쾌한 논문입니다! 읽는 재미가 있고 많은 생각을 하게 합니다."라고 연구에 참여하지 않은 칼텍의 교수인 피에트로 페로나는 말합니다. 그는 "해밀턴 등은 흥미로운 질문을 제시합니다: 왜 우리는 사물에서 얼굴을 볼까?"라고 말합니다.
궁극적으로 이 연구는 파레이돌리아에 대한 이해를 높일 뿐만 아니라 인간과 기계의 지각에 대한 더 광범위한 메커니즘을 밝혀낼 수 있을 것입니다. 미국 국립과학재단, 미국 공군 연구소, 미국 공군 인공지능 가속기의 지원을 받은 이 연구는 인간과 유사한 경험과 상호작용을 더 잘 파악하는 AI 시스템을 개발할 수 있는 길을 열어줍니다.
인공지능에 의해 세상이 계속 변화함에 따라 인간의 직관과 알고리즘 논리 사이의 간극을 이해하는 것은 매우 중요합니다. MIT 연구진은 파레이돌리아처럼 기발한 현상을 조사함으로써 기계가 어떻게 세상을 더 잘 '볼 수 있는지, 그리고 언젠가는 구운 치즈 샌드위치 속 얼굴의 경이로움을 공유할 수 있는지에 대해 더 깊이 이해할 수 있는 문을 열었습니다.