개인정보 보호는 인간과 조직의 기본 권리입니다. 개인에게는 제3자에게 공유하고 싶지 않은 정보를 공개하지 않고도 자유롭게 자신을 표현할 수 있도록 도와줍니다. 오늘날 대부분의 조직에서 데이터는 주요 상품으로 간주되며, 데이터 프라이버시는 이러한 상품을 보호하기 위해 필수적입니다. 크립토펑크 운동과 데이터 상품화는 암호화 기본 요소에 대한 연구와 개발을 가속화했습니다.
암호화는 상당히 광범위한 분야이며, 계산적 맥락에서 암호화를 살펴보면 영지식 증명, 동형 암호화, 비밀 공유 등과 같은 다양한 체계가 1960년대에 처음 등장한 이후 개선되어 왔습니다. 이러한 방식은 프라이빗 컴퓨팅 방식을 실현하는 데 결정적인 역할을 해왔습니다(데이터가 주요 상품이 되는 이유는 데이터에서 얻을 수 있는 인사이트 때문입니다). 오늘날까지 프라이빗 컴퓨팅 분야는 다자간 연산과 영지식 증명 측면에서 크게 발전해왔지만, 입력 데이터 자체에 대한 프라이버시 문제는 항상 존재해왔습니다.
가장 중요한 상품이 공개적으로 이용 가능한 경우, 데이터 소유자가 법적 계약 없이 이 데이터의 계산을 아웃소싱하는 것은 매우 어렵습니다. 오늘날 모든 사람은 건강 데이터에 대한 HIPAA, 특히 유럽 지역의 데이터 프라이버시에 대한 GDPR과 같은 데이터 프라이버시 준수 표준에 의존하고 있습니다.
블록체인 분야에서는 규제 기관의 무결성보다 기술의 무결성을 더 중요하게 생각합니다. 탈라이선스와 소유권 극대화를 신봉하는 저희는 사용자가 데이터를 소유하는 미래를 믿는다면 신뢰할 수 없는 방식으로 데이터를 계산할 수 있어야 한다고 생각합니다. 암호화된 데이터에서 연산을 수행한다는 개념은 2009년 Craig Gentry의 연구 이전까지는 획기적인 개념이 아니었습니다. 암호 텍스트(즉, 암호화된 데이터)에서 연산(덧셈과 곱셈)을 수행할 수 있게 된 것은 이번이 처음입니다.
1. 전체 Strong>동형 암호화(FHE) 작동
컴퓨터에서 입력 내용을 몰라도 계산을 수행할 수 있게 해주는 이 '마법의 수학'이란 무엇일까요? 무엇일까요?
전체 동형 암호화(FHE)는 데이터를 해독하지 않고도 암호화된 데이터(암호문)에 대해 계산을 수행할 수 있는 암호화 체계의 한 종류로, 개인정보 및 데이터 보호를 위한 다양한 사용 사례를 열어줍니다.
FHE 프로세스에서는 데이터가 암호화될 때 원본 데이터에 노이즈라는 추가 데이터가 추가됩니다. 이것이 바로 데이터를 암호화하는 과정입니다.
동형 연산(덧셈 또는 곱셈)이 수행될 때마다 추가 노이즈가 추가됩니다. 계산이 너무 복잡하고 매번 노이즈가 추가되면 결국 암호 텍스트를 해독하기가 매우 어려워집니다(계산적으로 매우 무겁습니다). 덧셈의 경우 노이즈가 선형적으로 증가하는 반면 곱셈의 경우 노이즈가 기하급수적으로 증가하기 때문에 이 프로세스가 더하기에 더 적합합니다. 따라서 복잡한 다항식 곱셈이 있는 경우 출력을 해독하기가 매우 어렵습니다.
노이즈가 주요 문제이고 그 증가로 인해 FHE를 사용하기 어렵다면 이를 제어해야 합니다. 이를 위해 "부트스트래핑"이라는 새로운 프로세스가 등장했습니다. 부트스트래핑은 새 키를 사용하여 암호화된 데이터를 암호화하고 해독하는 프로세스입니다. 이는 계산 오버헤드와 최종 출력물의 암호 해독 오버헤드를 크게 줄여주기 때문에 중요합니다. 부트스트랩을 사용하면 최종 암호 해독 오버헤드가 줄어들지만, 이 과정에서 상당한 양의 운영 오버헤드가 발생합니다. 이는 비용과 시간이 많이 소요될 수 있습니다.
현재 사용 가능한 주요 FHE 체계는 BFV입니다, BGV, CKKS, FHEW, TFHE입니다. TFHE를 제외한 이 체계의 약자는 논문 저자의 이름입니다.
이러한 체계는 같은 나라에서 사용되는 서로 다른 언어가 각각 다른 언어에 최적화되어 있다고 생각할 수 있습니다. 이상적인 것은 이 국가를 통합하는 것, 즉 이 모든 언어가 동일한 기계로 이해되는 것입니다. 많은 FHE 워킹 그룹이 이러한 다양한 체계의 결합 가능성을 위해 노력하고 있습니다. SEAL(BFV와 CKKS 스키마 결합) 및 HElib(BGV + 근사치 CKKS)와 같은 라이브러리는 서로 다른 계산을 위한 FHE 스키마 또는 스키마의 조합을 구현하는 데 도움이 됩니다. 예를 들어, Zama의 Concrete 라이브러리는 TFHE용 Rust 컴파일러입니다.
2. 2. strong>FHE 스키마 비교
다음은 Charles Gut, Dimitris Mouris, Nektarios Georgios Choussos가 논문 "SoK: 정규화된 벤치마크를 통한 완전 동형 암호화 라이브러리에 대한 새로운 통찰"에서 제시한 FHE 스키마를 비교한 것입니다. 표준화된 벤치마크를 통한 완전 동형 암호화 라이브러리에 대한 인사이트(2022)는 다양한 라이브러리의 성능을 비교합니다.
Web3 사용 사례
오늘날 블록체인과 앱을 사용하면 모든 데이터가 공개되고 모든 사람이 볼 수 있습니다. 이는 대부분의 사용 사례에 유리하지만 기본적으로 프라이버시 또는 데이터 기밀성이 필요한 많은 사용 사례(예: 머신러닝 모델, 의료 데이터베이스, 유전체학, 개인 금융, 조작되지 않은 게임 등)를 완전히 제한합니다. FHE 지원 블록체인 또는 가상 머신은 기본적으로 처음부터 전체 체인 상태를 암호화하여 프라이버시를 보장하면서도 암호화된 데이터에서 임의의 연산을 수행할 수 있도록 허용합니다. FHE를 지원하는 블록체인 네트워크에 저장되거나 처리되는 모든 데이터는 본질적으로 안전합니다. Zama는 완전히 동형화된 환경에서 EVM 계산을 수행할 수 있는 fhEVM 체계를 갖추고 있습니다. 이는 이 라이브러리를 사용해 구축된 모든 L1/L2 프로젝트의 실행 수준에서 프라이버시를 보장합니다. 프라이버시 체인은 멋진 기술이지만, 채택률과 토큰 성능은 크게 증가하지 않았습니다.
범용 컴퓨팅 아웃소싱의 측면에서 FHE 자체는 ZK와 MPC를 대체하는 것이 아니라 서로를 보완하여 신뢰 없는 프라이빗 컴퓨팅 거인을 만들 수 있습니다. 예를 들어, 선스크린은 "프라이버시 엔진"을 구축하고 있는데, 이는 기본적으로 모든 블록체인 애플리케이션이 계산을 FHE 컴퓨팅 환경에 아웃소싱하고 결과를 다시 가져올 수 있도록 합니다. 결과 계산은 ZK 증명으로 검증할 수 있습니다. 옥트라도 비슷한 작업을 하고 있지만, hFHE라는 다른 유형의 암호화 체계를 사용합니다.
ZK 증명은 데이터를 공개하지 않고 무언가를 증명하는 데 효과적이지만 증명자는 특정 시점에 여전히 데이터에 접근할 수 있게 됩니다. ZK 증명은 개인 데이터에 대한 계산에는 사용할 수 없으며, 특정 계산이 올바르게 수행되었는지 확인할 수 있을 뿐입니다.
MPC는 암호화된 데이터의 계산을 여러 컴퓨터에 분산하여 병렬로 계산을 수행한 다음 최종 계산을 함께 연결합니다. 계산을 수행하는 대부분의 컴퓨터가 정직하다면 원본 데이터를 검색할 수 없지만 이는 여전히 신뢰 가정입니다. 하드웨어를 통한 확장은 MPC에서 필요한 당사자 간의 지속적인 통신(데이터를 지속적으로 분할, 계산, 재연결해야 함)으로 인해 어려워집니다.
FHE에서는 모든 계산이 암호화된 데이터에서 수행되므로 데이터를 해독할 필요가 없으며 단일 서버에서 이 작업을 수행할 수 있으며, 더 나은 하드웨어, 더 많은 컴퓨팅 리소스 및 하드웨어 가속을 통해 FHE의 성능을 확장할 수 있습니다.
현재 블록체인 분야에서 FHE의 가장 좋은 사용 사례는 내장형 FHE L1/L2 구축보다는 범용 계산을 아웃소싱하는 것입니다. 다음은 FHE가 활용할 수 있는 몇 가지 흥미로운 사용 사례입니다.
1세대(암호화폐 네이티브): 온체인 DID, 카지노, 베팅, 투표, 게임, 프라이빗 디파이, 프라이빗 토큰, 다크 풀, 2FA, 백업, 비밀번호.
2세대(모듈형): 프라이버시를 위한 체인링크, 아웃소싱 프라이빗 컴퓨팅, 블록체인과 컨트랙트 간의 엔드투엔드 암호화, 암호화된 데이터 가용성 검증 가능한 보안 데이터 저장.
3세대(기업): 복잡한 소비자 앱, 암호화 및 탈중앙화된 LLM, 인공 지능, 웨어러블, 통신, 군사, 의료, 개인 정보 보호 결제 솔루션, 프라이빗 P2P 결제.
현재 FHE 기반 산업 프로젝트
완전동형암호(FHE)의 개발은 이 기술을 활용하여 데이터를 강화하는 여러 혁신적인 블록체인 프로젝트에 영감을 불어넣었습니다. 개인 정보 보호 및 보안을 강화하는 혁신적인 블록체인 프로젝트에 영감을 주었습니다. 이 섹션에서는 Inco, Fhenix, Zama와 같은 주목할 만한 프로젝트의 기술적 세부 사항과 독특한 접근 방식에 대해 자세히 살펴봅니다.
Inco
Inco는 FHE와 블록체인의 통합을 선도하여 데이터 계산을 안전하고 비공개적으로 만드는 플랫폼을 만들고 있습니다. Inco는 격자 기반 암호화를 사용하여 FHE 솔루션을 구현하여 암호문(암호화된 데이터)의 조작을 노출하지 않고도 기본 평문을 노출하지 않고도 암호 텍스트(암호화된 데이터)를 조작할 수 있습니다. 이 플랫폼은 암호화된 데이터를 블록체인에서 직접 처리할 수 있는 개인정보 보호 스마트 컨트랙트를 지원합니다.
격자 기반 FHE: Inco는 양자 이후 보안 기능으로 주목받는 격자 기반 암호화를 FHE 구현에 활용하며 다음과 같은 복원력을 보장합니다. 복원력을 보장합니다.
개인정보 보호 스마트 계약: Inco의 스마트 계약은 암호화된 입력에 대해 임의의 기능을 실행할 수 있으므로 계약이나 이를 실행하는 노드 모두 일반 텍스트 데이터에 액세스할 수 없습니다.
노이즈 관리 및 부트스트래핑: 동형 연산 중 노이즈 증가를 처리하기 위해 Inco는 암호문을 새로 고치고 복호화를 유지하는 효율적인 부트스트래핑 기술을 구현합니다. 복호화를 유지하는 효율적인 부트스트랩 기술을 구현합니다.
Fhenix
Fhenix는 개인정보 보호 애플리케이션을 위한 강력한 인프라를 제공하는 데 주력하며, FHE를 활용하여 사용자 데이터를 보호하기 위한 엔드투엔드 암호화 솔루션을 제공합니다.Fhenix의 플랫폼은 보안 메시징에서 개인 금융 거래에 이르기까지 광범위한 애플리케이션을 지원하도록 설계되었습니다. 금융 거래에 이르기까지 광범위한 애플리케이션을 지원하도록 설계되어 모든 컴퓨팅 프로세스에서 데이터 프라이버시를 보장합니다.
Zama
Zama는 FHE 분야의 선도업체로, fhEVM 솔루션 개발로 가장 잘 알려져 있습니다. 이 체계는 완전한 동형 환경에서 이더넷 EVM 계산을 실행할 수 있게 해주며, 라이브러리를 사용하여 구축된 모든 L1/L2 프로젝트의 실행 수준에서 프라이버시를 보장합니다.
fhEVM 체계: Zama의 fhEVM 체계는 FHE와 이더넷 VM을 통합하여 암호화된 스마트 컨트랙트 실행을 가능하게 합니다. 이를 통해 이더리움 생태계에서 기밀 거래와 계산이 가능합니다.
콘크리트 라이브러리: Zama의 콘크리트 라이브러리는 TFHE(FHE의 변형)를 위한 Rust 컴파일러입니다. 이 라이브러리는 동형 암호화 체계의 고성능 구현을 제공하여 암호화 연산을 보다 효율적으로 만듭니다.
상호운용성: Zama는 기존 블록체인 인프라와 원활하게 작동하는 솔루션을 만들기 위해 최선을 다하고 있습니다. 여기에는 다양한 암호화 기본 요소와 프로토콜을 지원하여 광범위한 호환성과 손쉬운 통합을 보장합니다.
3. 암호화 및 AI 인프라 및 애플리케이션에서 FHE의 핵심 역할
암호화와 AI의 교차점은 오늘날 본격화되고 있습니다. 이 교차점에 대해 자세히 설명하지는 않겠지만, 새로운 모델과 데이터 세트의 혁신은 여러 참여자의 오픈 소스 협업에 의해 주도될 것이라는 점에 주목할 필요가 있습니다. 계산을 넘어 궁극적으로 가장 중요한 것은 데이터이며, 데이터는 이러한 협업 파이프라인에서 가장 중요한 부분입니다. AI 애플리케이션과 모델의 유용성은 궁극적으로 기본 모델, 미세 조정된 모델, AI 지능형 에이전트 등 학습된 데이터에 따라 달라집니다. 이 데이터를 안전하게 비공개로 유지하면 오픈 소스 협업을 위한 거대한 설계 공간이 열리고, 데이터 소유자는 모델 또는 최종 애플리케이션을 학습하여 계속 수익을 얻을 수 있습니다. 이 데이터가 본질적으로 공개되면 누구나 귀중한 데이터 세트에 액세스할 수 있기 때문에 수익 창출이 어려워지므로 이 데이터는 엄격하게 보호될 가능성이 높습니다.
이 경우 FHE가 중요한 역할을 할 수 있습니다. 이상적으로는 기본 데이터 집합을 공개하지 않고 모델을 학습시킬 수 있으며, 데이터 집합의 수익화를 실현할 수도 있고 그렇지 않을 수도 있어 데이터 집합 소유자 간의 오픈 소스 협업을 크게 촉진할 수 있습니다.
출처:Source:. >바젤 네트워크
FHE가 개인 정보 보호 머신 러닝(PPML)을 향상시키는 방법
데이터 프라이버시: FHE를 사용하면 의료 기록, 금융 정보, 개인 식별자 등의 민감한 데이터를 ML 모델에 입력하기 전에 암호화할 수 있습니다. 따라서 컴퓨팅 환경이 손상되더라도 데이터가 기밀로 유지됩니다.
보안 모델 학습: ML 모델을 학습하려면 대량의 데이터가 필요한 경우가 많습니다. FHE를 사용하면 이러한 데이터를 암호화하여 원본 데이터를 노출하지 않고 모델을 학습시킬 수 있으며, 이는 매우 민감한 정보를 처리하고 엄격한 데이터 개인정보 보호 규정을 적용받는 산업에 매우 중요합니다.
기밀 추론: 훈련 외에도 FHE는 암호화 추론에도 사용할 수 있습니다. 즉, 모델이 학습되면 암호화된 입력에 대해 예측을 수행할 수 있으므로 추론 프로세스 내내 사용자 데이터를 비공개로 유지할 수 있습니다.
FHE를 위한 PPML 적용 분야:
FHE의 문제점:
언제 언급했듯이 FHE 프로그램 간에는 '목적의 통일성'이 존재하지 않습니다. ". 스키마는 서로 결합할 수 없으며, 다양한 유형의 계산을 위해 서로 다른 FHE 스키마를 결합해야 하는 경우가 많습니다. 동일한 계산에 대해 서로 다른 스키마를 실험하는 과정도 상당히 번거롭습니다. TFHE, BFV, HEAAN과 같은 서로 다른 FHE 체계를 전환할 수 있도록 개발 중인 CHIMERA 프레임워크는 현재로서는 사용할 수 있는 단계가 아닙니다. 이는 벤치마킹의 부족이라는 다음 문제로 이어집니다. 벤치마킹은 개발자가 이 기술을 채택하는 데 매우 중요합니다. 많은 개발자의 시간을 절약하는 데 도움이 될 것입니다. 계산 오버헤드(암호화, 암호 해독, 부트스트랩, 키 생성 등)를 고려할 때 사용 가능한 범용 하드웨어의 대부분은 그다지 적합하지 않습니다. 어떤 형태의 하드웨어 가속이 필요하거나, FHE의 보다 주류적인 애플리케이션을 활성화하기 위해 특정 칩(FPGA 및/또는 ASIC)을 만들어야 할 수도 있습니다. 이러한 모델의 문제점은 ZK(제로 지식) 산업의 문제와 비교할 수 있습니다. 똑똑한 수학자, 응용 과학자, 엔지니어 그룹이 이 분야에 관심을 갖고 있는 한, 저희는 프라이버시를 위한 FHE와 검증 가능성을 위한 ZK 모두에 대해 계속해서 호의적으로 바라볼 것입니다.
4.4. strong>FHE 드라이브의 미래는 어떤 모습일까요
모든 것을 지배하는 하나의 FHE 솔루션이 있을까요? 업계에서는 여전히 이에 대한 논의가 진행 중입니다. 하나의 통합 솔루션이 있다면 이상적이지만, 다양한 애플리케이션의 다양한 요구사항에 따라 특정 업무에 최적화된 전문 솔루션이 필요할 수 있습니다. 프로그램 간의 상호 운용성이 최선의 솔루션인가요? 상호운용성은 실제로 다양한 컴퓨팅 요구사항을 유연하게 처리하는 동시에 다양한 체계의 강점을 활용할 수 있는 실용적인 방법일 수 있습니다.
FHE는 언제부터 사용할 수 있나요? 가용성은 컴퓨팅 오버헤드 감소, 벤치마킹 표준 개선, 전용 하드웨어 개발의 진전과 밀접하게 연관되어 있습니다. 이러한 영역에서 진전이 이루어지면 FHE의 접근성과 유용성이 더욱 향상될 것입니다.
요약하면, FHE는 데이터 개인정보 보호와 안전한 컴퓨팅을 위한 강력한 도구를 제공합니다. 상호운용성, 컴퓨팅 오버헤드, 하드웨어 지원과 관련하여 아직 해결해야 할 과제가 남아 있지만 블록체인, 개인정보 보호 머신러닝, 광범위한 Web3 애플리케이션에 대한 FHE의 잠재력은 무시할 수 없습니다. 기술이 계속 발전하고 혁신함에 따라 FHE는 개인정보 보호 및 보안 컴퓨팅의 미래에서 핵심적인 역할을 할 것으로 기대됩니다.