최근 몇 년 동안 블록체인 분야에서는 많은 화제가 있었고 인공지능(AI) 분야에서는 많은 폭죽이 터졌지만, 이 두 혁신 기술 간의 교차점은 거의 없는 것 같습니다. 그러나 개념적으로 블록체인과 AI는 블록체인 기술 고유의 탈중앙화 특성으로 AI의 중앙화 문제를 해결할 수 있고, 블록체인의 투명하고 검증 가능한 특성으로 AI 모델의 불투명성 문제를 해결하는 데 도움이 될 수 있는 등 상호 보완적인 측면이 많이 있습니다.
얼마 전 '블록체인 X AI' 개념의 과대광고로 인해 많은 관련 암호화폐의 시장 가치가 급격히 상승하여, 그림 1과 같이 전체 섹터의 시장 가치가 한때 200억 달러를 넘어섰습니다. 이는 시장이 이 조합에 대해 상당히 낙관적이며 투자자들이 상당히 자신감을 갖고 있다는 것을 보여줍니다.
그림 1: 세그먼트별 암호화폐 시가총액, 2024년 4월 18일 데이터
블록체인과 AI의 통합은 실제로도 드러나고 있습니다. 그러나 블록체인과 암호화폐의 통합은 AI가 집중적인 연산과 대량의 저장 공간을 필요로 하는 반면, 블록체인의 분산 원장 아키텍처는 각 노드가 동일한 양의 정보를 저장하고 계산하는 중복성을 강조한다는 사실과 같이 두 기술 간의 상충되는 부분도 드러냈습니다.
최근 칭화대학교와 프라운호퍼 HHI 연구팀은 블록체인과 인공지능 사이에 존재하는 기술적 시너지와 상충을 분석한 논문 '블록체인과 인공지능: 시너지와 상충'을 발표했습니다. 특히, 연구팀은 이론을 분석하는 데 그치지 않고 암호화폐 시장을 살펴보고 시가총액 1천만 달러 이상의 '블록체인 X AI' 프로젝트와 몇 가지 구체적인 사용 사례를 분석했습니다.
이 백서의 내용과 흥미롭고 유용한 인사이트를 살펴보세요.
블록체인과 인공지능: 시너지와 상충
그림 2는 블록체인과 인공지능의 상호 보완적인 측면과 상반되는 측면을 보여줍니다.
블록체인과 AI의 시너지 효과
탈중앙화 대 중앙성. GPT와 같은 현재 최고 수준의 대규모 언어 모델(LLM)을 훈련하고 유지하려면 연산, 전력 및 데이터의 상당한 리소스가 필요합니다. 예를 들어, 2020년 릴리즈된 GPT-3의 훈련 과정의 계산 비용은 약 460만 달러에 달합니다. 이러한 높은 비용으로 인해 AI 빅 모델은 소수의 대형 기술 기업의 각축장이 되었으며, 이들은 사실상 AI 시장에서 독과점 체제를 구축하게 되었습니다. 이러한 독점이 경쟁을 저해할 가능성은 시장 균형을 유지하고 단일 기업이 시장을 지배하는 것을 막기 위해 반독점법을 매우 적극적으로 시행하는 미국이나 유럽과 같은 지역의 정책 입안자들이 자주 우려하는 부분입니다. 이와는 대조적으로 블록체인 기술은 탈중앙화되어 있으며, 이러한 특징은 AI 시스템의 중앙 집중화 문제를 해결하는 데 사용될 수 있습니다. 블록체인의 탈중앙화 특성은 적절하게 배포될 경우, 어느 한 주체가 전체 네트워크를 통제하는 것을 방지합니다. 이 기능은 AI 시스템 내에서 일종의 규제 메커니즘을 구현하여 보다 균형 잡힌 권력 분배를 달성하고 모든 당사자 간의 협업을 촉진하는 데 도움이 될 수 있습니다. 따라서 블록체인 기술을 통합하면 AI 분야 내 규제와 독점에 대한 논쟁을 해결하고 AI 거버넌스를 더욱 포용적이고 공정하게 만들 수 있을 것으로 기대됩니다.
투명성과 블랙박스 특성. 블록체인 기술의 또 다른 주요 특징은 거래와 기록을 검증할 수 있고 위변조가 불가능한 투명성입니다. 반면에 인공지능은 블랙박스와 같아서 그 결정의 근거를 이해하기 어렵습니다. 블록체인 원장을 사용해 AI의 의사결정 과정을 기록하면 투명한 감사 추적을 통해 AI 애플리케이션의 신뢰성을 높일 수 있습니다. 또한 블록체인은 고급 암호화(예: zk-SNARK와 같은 영지식 증명)를 통합하거나 보안 하드웨어(예: 신뢰할 수 있는 실행 환경/TEE)를 사용할 수 있습니다. 이러한 기술은 특정 계산 단계가 충실하고 정확하게 수행되고 있는지 검증하는 데 도움이 될 수 있습니다.
데이터 관리 및 종속성. 블록체인은 행성 간 파일 시스템(IPFS)과 같은 프로토콜과 스마트 계약을 통해 데이터와 데이터 액세스를 규제할 수 있습니다.
오픈 소스 및 클로즈드 소스. 블록체인은 암호화 프로토콜을 통해 소유권을 공유할 수 있게 함으로써 독점적인 AI 모델의 한계를 해결하고, 이를 통해 세분화된 개인정보 보호를 구성할 수 있습니다. 참여자들이 공동으로 훈련하고 제어하는 공유 AI 시스템이 상용 모델 수준의 성능을 발휘하도록 만들 수 있다면 AI 개발의 투명성이 크게 높아질 것입니다. 또한 보다 공정하고 포괄적인 AI 솔루션의 개발이 촉진될 수 있습니다.
블록체인과 AI의 충돌
앞서 언급한 블록체인과 AI의 시너지 효과에도 불구하고, 두 기술의 통합을 방해하는 상당한 운영상의 상충되는 요건들이 존재합니다.
컴퓨팅 비용 및 부하. GPT-4 및 Llama 3과 같은 대규모 언어 모델(LLM)의 경우, 학습과 추론 모두 상당한 컴퓨팅 리소스가 필요합니다. 블록체인 합의 메커니즘, 암호화 연산, 불리한 데이터 구조는 모두 계산 부담을 가중시켜 확장성에 영향을 미칩니다.
저장 공간의 한계와 데이터 집약도. 블록체인의 탈중앙화된 특성은 보안과 중복성을 보장하지만, 데이터 기반 AI 시스템에는 의심할 여지 없이 비용이 많이 들고 비효율적인 상당한 스토리지 요구 사항을 초래할 수 있습니다. 이더와 같은 범용 블록체인 시스템(GBPS)에서는 모든 노드가 모든 정보를 저장해야 하는데, 이중화는 해당 블록체인 네트워크의 보안과 복원력을 보장하지만 확장성에는 해로울 수 있기 때문입니다. 이더리움 가상 머신(EVM)의 새로운 데이터는 트랜잭션 형식으로 저장되기 때문에 EVM 구조의 공통 데이터는 검색 속도를 저해할 수 있습니다. 반면에 AI 애플리케이션은 대량의 데이터를 생성하고 처리하므로 효율적이고 확장 가능한 스토리지 솔루션이 필요합니다.
가명 익명성 및 보안 문제. 블록체인은 비대칭 암호화를 통해 허가 없는 의사 익명 액세스를 허용하며, 전산 또는 금융 장벽을 설정하여 네트워크를 시빌 공격 가능성으로부터 보호할 수 있습니다. 또한, 특정 사용 사례에서는 연합 학습과 같은 기술을 사용하여 블록체인을 플랫폼으로 사용하여 개인 정보 보호와 분산형 AI 훈련을 강화하고 있으며, 이러한 사용 사례가 훈련 과정에서 익명 참여를 지원하는 경우 위험이 발생할 수 있습니다.
이러한 방법은 적대적인 연합 학습 공격에 취약하며, 설계상 전체 AI 모델에 대한 기여도가 비공개로 되어 있고 측정하기 어렵기 때문에 악의적인 공격자를 식별하기가 어려울 수 있습니다.
운영 불일치. 대부분의 블록체인 가상 머신은 고정 원장 연산을 사용하여 결과가 결정론적이라는 것을 보장하는데, 이는 결국 금융 거래가 돈을 수반하기 때문에 중요합니다. 반면에 부동 소수점 연산은 특히 크기가 크게 달라지는 여러 값을 계산할 때 계산의 정밀도가 떨어질 수 있습니다. 그러나 AI 학습에서는 부동 소수점 매개변수를 0과 1 사이로 정규화하는 것이 일반적인데, 이는 안정적이고 효율적인 그라데이션 흐름을 달성하는 데 도움이 되고 암시적 정규화를 제공하여 전반적인 학습 결과를 개선하기 때문입니다.
블록체인과 AI: 사용 사례 연구
위에서 살펴본 블록체인과 AI의 시너지 효과와 상충 관계를 바탕으로 이제 사용 사례를 살펴볼 차례입니다. 저희 팀은 블록체인과 AI를 가장 잘 통합하고 있는 몇 가지 프로젝트를 조사했습니다. 이들은 제품을 보유하고 있고 시가총액이 천만 달러 이상인 토큰을 발행한 프로젝트에 집중했습니다. 또한 시가총액이 천만 달러 미만이지만 새로운 사용 사례를 보유한 프로젝트도 살펴봤습니다. 다음 세 가지 연구 질문에 따라 프로젝트를 분류했습니다.
블록체인과 AI 기술이 프로젝트 내에서 얼마나 잘 통합되어 시너지를 내고 있는가?
프로젝트에서 블록체인의 역할은 무엇인가요?
이 프로젝트에서 AI의 역할은 무엇인가요?
클러스터 분석 결과는 그림 3에 나와 있으며, AI는 블록체인의 주변 기술, AI가 블록체인에 관여, 블록체인이 AI 프로세스를 관리, 블록체인이 AI의 핵심 인프라라는 네 가지 주요 클러스터로 구성되어 있습니다.
AI는 블록체인을 위한 주변 기술입니다
AI는 블록체인과 상호작용하는 사용자 경험을 향상시키고, 지능형 분석을 가능하게 하며, 블록체인 애플리케이션의 개발 프로세스를 간소화하는 등의 작업을 지원합니다.
블록체인에 대한 AI의 참여
AI는 블록체인 생태계와 거버넌스 구조에 적극적으로 참여할 수 있습니다. 연구팀은 논문에서 두 가지 방향을 제시했습니다. 하나는 인공지능이 스스로 덱스에 투기하도록 하는 등 분산 네트워크에 참여자 또는 이해관계자로 참여하는 것이고, 다른 하나는 현재로서는 어렵지만 인공지능이 DAO(탈중앙화 자율 조직)의 거버넌스에 참여하는 것입니다.
블록체인, AI 프로세스를 관리하다
블록체인 기술은 리소스 공유, 데이터 관리, 애플리케이션 배포를 위한 탈중앙화된 프레임워크를 구축하여 AI 프로세스를 관리하는 데 점점 더 많이 활용되고 있습니다.
AI의 핵심 인프라로서의 블록체인
이더리움과 같은 일반 블록체인 시스템(GPBS)은 확장성, 보안, 탈중앙화 사이의 삼각 트레이드오프에 직면해 있습니다.
이더의 경우 전 세계에 분산된 수천 개의 노드와 백만 명 이상의 검증자를 통해 보안이 보장됩니다. 합의와 최종성을 달성하기 위해 새로운 정보 블록은 글로벌 네트워크의 모든 노드에 도달하여 검증을 받아야 하며, 각 블록의 크기는 킬로바이트이고 12초마다 생성되므로 스토리지 및 컴퓨팅 비용이 많이 듭니다.
따라서 컴퓨팅 집약적인 AI 작업을 온체인에서 직접 수행하거나 저장하는 것은 비현실적이지만, 레이어2 롤업은 이제 대중적인 패러다임으로 자리 잡고 있습니다. 간단히 말해 레이어2 롤업은 온체인이 아닌 오프체인에서 트랜잭션을 처리한 다음 그 결과를 취합하여 온체인에 기록하는 솔루션으로, 처리량 증가와 비용 절감 측면에서 모두 비용 효율적인 솔루션입니다.
마찬가지로, AI 사용 사례를 위해 특별히 개발된 블록체인은 (1) 높은 컴퓨팅 및 스토리지 비용, 공용 액세스, 기본 가상머신 제한과 관련된 문제를 극복하고 (2) 블록체인을 순수한 관리, 거버넌스, 보안 계층으로만 사용해야 합니다. 표 1은 블록체인을 핵심 인프라로 사용하는 새로운 시스템을 보여줍니다.
표 1: 블록체인을 AI 인프라로 사용하기, 여기서 DAI = 분산형 인공 지능, BC = 블록체인, DT/FL = 분산 훈련/연합 학습, C-Layer = 계산 계층, TA = 기술 분석, DM = 분산 관리, PoS = 지분 증명 , DPoS = 위임 지분 증명, dBFT = 위임 비잔틴 장애 허용, FL = 연합 학습, DID = 탈중앙화 신원, ZK = 제로 지식, DePIN = 탈중앙화 물리적 인프라 네트워크, DC = 분산 컴퓨팅, DD = 분산 데이터, ASBS = 애플리케이션별 블록체인 시스템, IPFS = 인터스텔라 파일 시스템, * = 낮은 성숙도/공개 없음 코드, ? = 정보를 사용할 수 없음.