현재 시장은 AI와 암호화폐의 융합에 대한 관심도가 하늘을 찌르고 있다. 하지만 아직까지 이들이 가진 기술적인 한계들은 명확하며, 그중 대표적인 것이 "어떻게 이들을 개인화할 것인가?"에 대한 부분이다. 에이전트가 개인화되기 위해서는 개인들의 민감 정보에도 접근해야 하는데, 이는 개인들의 프라이버시를 심각하게 침해하는 문제가 발생하기 때문이다.
AI가 좀 더 우리의 일상에 침투하기 위해서는 개인들의 프라이버시를 보호하면서도 이들의 민감 데이터를 연산할 수 있는 인프라가 필요하다. 닐리온 네트워크는 바로 이러한 블라인드 연산을 하기 위해 설계된 인프라이다.
닐리온의 블라인드 연산을 활용하면 에이전트의 개인화 외에도 다양한 사용 사례들이 발생할 수 있다. 예컨대, 의료 진단이나 기업 간 데이터 활용과 같이 민감 정보에 반드시 접근해야 하는 경우들에 닐리온의 블라인드 연산은 필수적이다. 더불어 블록체인의 투명성이 가진 단점들을 보완해줄 수 있는 역할도 수행할 수 있다.
물론 블라인드 연산은 결코 쉬운 작업이 아니기 때문에, 앞으로 닐리온이 어떠한 방식으로 블라인드 컴퓨팅을 보다 쉽게 확장할 수 있을지 그 귀추가 주목된다.
요즘 블록체인 업계에는 AI와 크립토의 융합과 관련된 논의가 한창이다. 그 중심에는 실리콘밸리의 저명한 VC인 안드레센 호로위츠(Andreessen Horowitz)의 매니징 파트너 마크 안드레센(Marc Andreessen)이 있다. 마크 안드레센은 AI 연구를 명목으로 AI 프로젝트인 Terminal of Truth에 약 5만 달러 상당의 비트코인을 기부했다. 이 기부의 주된 목적은 해당 프로젝트가 더 나은 하드웨어를 구축하고 알고리즘을 개선하며 커뮤니티 플랫폼을 구축하는 데 있었다. 하지만 이후 Terminal of Truth가 '$GOAT'이라는 밈코인을 발견하고 이를 공격적으로 홍보하면서 세간의 이목을 집중시켰고, 한 때는 이 $GOAT라는 밈코인의 시가총액이 1조원을 넘어가는등, 시장에 엄청난 임팩트를 남겼다.
하지만 GOAT과 Terminal of Truth는 시작에 불과했다. GOAT이 촉발한 AI 에이전트 붐은 ACT(마크 안드레센이 투자한 또 다른 프로젝트)와 ai16z(실리콘밸리의 대표적인 VC인 a16z에서 영감을 받은 AI 기반 탈 중앙 펀드)로 확산됐다. 특히 ai16z가 개발한 에이전트 프레임워크인 Eliza는 현재까지도 많은 주목을 받고 있으며, Base 생태계에서는 Virtuals와 이 플랫폼에서 개발되고 있는 에이전트들이 큰 관심을 받으면서 크립토 시장은 'AI x Crypto'라는 새로운 트렌드를 성공적으로 정착시켰다.
일각에서는 이러한 AI x Crypto 트렌드가 실질적인 활용 사례 없이 단순히 급성장하는 AI 업계의 성장세에 편승하고 있는 게 아니냐는 의구심을 제기하기도 한다. 하지만 이 트렌드는 단순한 밈을 넘어 실질적인 사례들을 만들어내고 있다. TAO와 같은 탈중앙화 AI를 표방하는 인프라가 등장하고 있으며, AI 연산에 필수적인 GPU 자원을 확보하기 위한 탈중앙화 GPU 마켓플레이스도 속속 등장하고 있다. 따라서 이러한 트렌드를 단순한 과장된 거품정도로 치부할 게 아니라, 블록체인 기술과 AI, 특히 에이전트가 어떻게 융합될 수 있을지를 진지하게 고민해야 한다.
현재 에이전트들은 시장 분석, 트레이딩 대행, 소셜 미디어를 통한 유저 소통 정도의 수준을 보여주고 있다. 하지만 에이전트가 더 큰 확장성을 갖기 위해선 더 방대한 정보에 접근할 수 있어야 한다. 예를 들어, 에이전트가 개인의 성향과 취미, 가치관 등을 학습해서 해당 개인을 대신해 활동하기 위해선 개인의 사생활 관련 데이터를 모두 학습해야 할 것이다. 개인 맞춤형이 아니더라도, 삶의 다양한 영역에 에이전트가 스며들기 위해서는 일반적으로는 접근하기 어려운 민감한 데이터들에도 접근할 수 있어야 할 것이다.
그런데 결국 에이전트들도 학습을 하는 주체다. 이들에게 민감한 데이터를 공개한다면 프라이버시 문제가 심각하게 대두될 것인데, 그렇다면 에이전트는 제한된 데이터만을 학습하고 거기서 멈춰야 할까? 만약 이 에이전트들이 민감한 데이터를 직접 열람하지 않고도 학습할 수 있다면 어떨까? 다시 말해, 암호화된 정보를 복호화(decryption)하지 않고도 연산할 수 있다면 어떨까? 그렇다면 민감 정보를 공개하지 않고도 에이전트에게 더 방대한 데이터를 학습시킬 수 있지 않을까?
놀랍게도 이러한 시도를 하고 있는 프로젝트가 있다. 바로 닐리온(Nillion)에 대한 이야기다. 이번 아티클에서는 닐리온이 어떤 방식으로 암호화된 데이터를 복호화하지 않고 연산할 수 있는지, 그리고 닐리온을 통해 구현 가능한 에이전트 활용 사례들에 대해 탐구해보고자 한다.
닐리온을 한 줄로 이야기 하면 “데이터를 복호화 하지 않고도 데이터를 저장하고 연산할 수 있게 해주는 블라인드 연산 네트워크.” 라고 할 수 있다. 그리고 큰 그림에서 구조적으로 보면 닐리온 네트워크는 프라이버시 강화 기술을 사용하는 PETnet(ORCHESTRATION LAYER) 과 PETnet이 트랜잭션 조정을 위해 사용하는 블록체인 네트워크인 닐 체인(Nil Chain; COORDINATION LAYER)으로 분리될 수 있는데, 쉬운 이해를 위해서 순서대로 PETnet, 그리고 그 다음에 Nil Chain에 대해서 설명하도록 하겠다.
하지만 무엇보다, 닐리온 네트워크에 대해서 자세하게 설명하기전에 블라인드 연산에 대한 개념을 숙지하여야 한다. 블라인드 연산(Blind Computation)은 무엇이며, 어떤 핵심 원리가 적용되는 것일까?
닐리온의 PETnet에는 다수의 노드들이 있고, 그 노드들은 데이터를 직접적으로 보지 않고 그들을 옮기고, 저장하고, 연산할 수 있다. 예컨데, 이 노드들은 당신을 대신에서 당신의 트랜잭션에 서명을 할 수 있다. 하지만 기존 “연산”에서는 당신의 트랜잭션에 서명하기 위해서 당신의 프라이빗 키가 필요하지만, 블라인드 연산에선 각자의 노드가 “셰어(share)라고 불리는 조각으로 분산된 당신의 프라이빗 키”를 할당받은 뒤, 암호학적 프로토콜을 통해 각각 다른 셰어를 가진 노드들이 모여서 당신의 트랜잭션에 서명할 수 있다. 이 때, 이들은 셰어를 합쳐서 프라이빗 키를 재구성하거나 하지 않기 때문에 당신의 프라이빗 키에 대한 정보는 유출되지 않는다. 이것이 바로 블라인드 연산이다. 그렇다면 왜 블라인드 연산이 필요한 것일까?
필자가 위에서 언급한 에이전트의 개인화를 제외하더라도, 블라인드 연산은 사실 굉장히 중요한 기술이다. 왜냐하면 웹3 서비스들이 기존 웹2와 비슷한 수준이 되기 위해서는, 반드시 사적인 데이터들도 안전하게 접근하고 연산할 수 있어야 하기 때문이다. 필자가 보기에 웹2와 웹3의 가장 큰 차이점은 "접근 가능한 데이터의 스코프"에 있다고 생각한다. 기존 웹2는 프라이빗 데이터베이스 위에서 구동되기에, 나의 개인적인 정보가 공공재처럼 공개될 가능성이 적다. 하지만 웹3의 경우 블록체인의 투명성으로 인해 누구나 온체인 데이터에 접근이 가능하다는 점이 걸림돌이다. 물론 웹3가 더 발전하려면 블록체인이 가진 확장성 문제나 다양한 문제들도 해결해야겠으나, 결국 웹2에 버금가는 서비스를 구현하기 위해서는 데이터의 프라이버시 보호도 반드시 필요한 과제로 남아있다.
물론 그렇다고 기존 웹2 서비스가 웹3보다 모든 면에서 우월하다는 것은 아니다. 지금까지 우리는 웹2 기업들에게 무방비로 개인 데이터를 넘겨주었고, 이들은 언제든지 사람들의 사적 데이터에 접근할 수 있었기 때문이다. 우리는 2018년에 발생했던 페이스북의 데이터 유출 스캔들과 관련된 상원 청문회를 기억하고 있다. 이 스캔들은 2018년 3월에 Cambridge Analytica라는 영국의 컨설팅 기업이 수백만 명의 페이스북 사용자 개인정보를 동의 없이 수집했다는 사실이 밝혀지면서, 페이스북이 사용자들의 사적 데이터를 얼마나 소홀하게 관리하는지가 드러나게 된 사건이다. 이러한 스캔들에서 알 수 있듯이, 기존 웹2 서비스에서는 유저들의 사적 데이터가 쉽게 사용되고 활용된다. 그리고 이러한 문제를 블록체인이 해결해 줄 수 있다며 대안으로 등장한 것이었다.
하지만 그렇다고 또 블록체인이 이러한 문제의 완벽한 해결책인 것도 아닌 것이, 물론 블록체인과 같은 기술이 데이터 소유권의 문제를 해결해 줄 수 있다고는 하나, 필자가 앞서 언급했듯이 블록체인 특유의 투명성이 오히려 사용자들의 사적 데이터를 온체인에 저장하지 못하게 만들어 블록체인을 활용할 수 있는 사례에 한계점을 주기도 한다. 그래서 우리는 블라인드 연산이 필요한 것이다.
단순히 사용자의 민감 데이터를 암호화해서 저장하는 것을 넘어서, 그 데이터를 복호화하지 않고 연산할 수 있다면 우리는 1) 블록체인 기술을 통해 사용자의 데이터 오너십 문제를 해결하면서도 2) 블라인드 연산을 통해 블록체인의 투명성으로 인해 발생하는 데이터 온보딩의 한계점을 동시에 해결할 수 있는 것이다.
우리는 지금까지 블라인드 연산이 무엇인지, 그리고 왜 필요한지에 대해서 알아보았다. 그렇다면 가장 중요한 부분은, 이 복잡해보이는 블라인드 연산이 어떤 방식으로 이루어지냐 하는 것이다. 이제 여기서 닐리온의 PETnet이 등장한다. PETnet은 다양한 프라이버시 강화 기술들(함수 비밀 공유, 영지식 증명, 완전 동형암호, 신뢰 실행 환경)을 활용하여 블라인드 컴퓨팅을 가능하게 하는데, 이번 아티클은 이들 중에서도 닐리온의 다자간 컴퓨팅 기술을 중점에 두고 닐리온의 블라인드 연산을 설명해보려고 한다. 그렇다면 다자간 컴퓨팅(MPC)이란 무엇이고 닐리온의 MPC 프로토콜은 기존의 MPC와 어떻게 다르며, 어떻게 작동할까?
1.3.1 다자간 컴퓨팅이란?(Multi-Party Computation in a nutshell)
다자간 컴퓨팅(Multi-Party Computation, MPC)은 여러 참여자가 각자의 비밀 입력값을 서로에게 공개하지 않은 채 공동으로 계산을 수행하는 암호학적 프로토콜이다. 이 기술은 참여자들의 프라이버시를 보호하면서도 정확한 계산 결과를 얻을 수 있게 해주며, 악의적인 참여자가 있더라도 계산의 정확성을 보장 할 수 있다는 장점이 있다. MPC는 각 참여자의 입력을 여러 '조각(shares)'으로 나누고, 이 조각들을 사용하여 분산 계산을 수행한 후, 결과를 재구성하는 방식으로 작동한다. 이러한 특성 때문에 MPC는 프라이버시 보존 데이터 분석, 안전한 경매 시스템, 비밀 투표, 생체 인증, 블록체인 등 다양한 분야에서 활용되고 있으며, 데이터의 기밀성을 유지하면서도 복잡한 계산을 가능하게 하는 혁신적인 기술로 주목받고 있다.
그렇다면 닐리온은 어떤 방식으로 MPC를 구현하고 있을까?
1.3.2 Curl 프로토콜: 비선형 연산을 위한 MPC 프로토콜.
우선 닐리온은 Meta와 캘리포니아 얼바인 대학교와 합작하여 Curl이라는 MPC 프로토콜을 개발했다. Curl 프로토콜의 흥미로운 점은 바로 Curl이 기존에 많은 MPC 프로토콜이 기본적으로 채택해왔던 선형 비밀 공유 체계(LSSS)형태를 확장하여, 입력과 출력 사이의 관계가 선형적이지 않더라도 연산을 가능하게 만들 것이라는 부분이다(일단은 선형 비밀 공유 체계로 시작하여, 확장할 예정이다). 기존의 MPC 프로토콜들은 선형 방식으로 비밀을 공유하기 때문에 덧셈과 같은 단순한 연산만 가능했다(여기서 선형적인 관계라고 함은, 연산을 할 때 입력값을 2배로 늘렸을 때 정확하게 출력값도 2배가 느는 것으로 이해하면 쉽다). 하지만 닐리온이 내세운 Curl 프로토콜은 좀 더 복잡한 계산(곱셈, 제곱, 나눗셈, 제곱근, 삼각함수, 로그와 같은)이 가능하고 이로 인해 현실 세계의 복잡한 현상들을 모델링하는데 매우 유용하기 때문에 프로토콜의 확장성 측면에서 더 우월하다고 할 수 있다(즉 닐리온의 Curl은 비선형적이므로 입력값을 2배로 늘리더라도 반드시 출력값이 2배가 늘지는 않는다). 예를 들어보자. 사용자가 입력값이 비밀로 유지되어야 하는 AI 모델이 있다고 했을 때, 닐리온의 Curl은 활성화 함수와 정규화 계층같은 비선형 함수의 평가에 있어 병목이 걸리지 않으므로, 모델의 성능을 저하시키지 않으면서도 안전성과 프라이버시 보호를 동시에 할 수 있다.
닐리온의 MPC 프로토콜은 약 두 단계로 나뉜다:
사전 처리 단계(Pre-processing to create Shares)
이 단계에서는 말 그대로 향후에 할 연산을 위한 준비를 하는 과정으로, 실제 정보를 연산하기 전에 비밀 데이터를 여러 조각(Shares)들로 나누고 각 참여자(연산을 하는 주체)에게 그 조각을 분배한다. 이러한 과정은 실제 입력값 자체와는 독립적이지만, 입력값의 총 갯수(총 입력한 값의 갯수가 얼마인지 알아야 이에 맞는 조각을 연산 전에 만들 수 있기 때문에)에는 의존적이다.
상호작용 없이 데이터 조각에 대한 연산을 하는 단계(Non-Interactive Computation on Masked Factors)
이 단계에서는 실제로 가려진 데이터들에 대한 연산이 이루어지는 단계로 약 세 가지 세부 단계들로 구성이 되어있다:
2.1 입력 단계 (input stage)
사전 처리 단계에서 만들어진 데이터 조각들을 참여자들에게 분배한다.
각 참여자는 하나의 입력값 당 하나의 조각을 받는다.
참여자는 입력값과 분배받은 조각을 합쳐서 가려진 팩터(Masked Factor)를 생선한다.
이 가려진 팩터는 곱셈 동형(multiplicatively homomorphic)의 형태를 띄며, 이 팩터들이 네트워크에 전파된다.
여기서 잠깐, 곱셈 동형이란? 곱셈 동형은, 암호화된 데이터끼리 곱셈 연산이 가능하다는 의미이다. 더 쉬운 이해를 위해 예시를 들어보자. 원본 데이터 x와 y가 있다. 그리고 이들을 가렸을 때(masking했을 때) 각각의 데이터가 f(x), f(y)라고 한다면 곱셈의 동형성은 f(x*y)=f(x) * f(y) 라는 관계를 만족하는, 즉 원본 데이터를 곱해서 가리던 가려진 데이터들을 곱하던 그 값이 같다는 의미이다. 이 개념은 동형 암호학에서 굉장히 중요한 의미이므로 이 기회를 통해서 개념을 숙지해두자.
이 과정에서 정보의 보안은 유지된다.
2.2 평가 단계 (evaluation stage)
이 단계에서는 가려진 팩터가 가진 곱셈 동형의 특성을 활용하여, 가려진 팩터에 직접적인 연산을 수행한다(곱셈 동형은 암호화된 데이터끼리도 곱셈이 가능하다는 의미이므로).
각각의 주체들은 자신의 로컬에서 연산을 수행한다.
2.3 출력 단계(Output Stage)
연산에 참여한 주체들이 각각 로컬에서 계산한 결과를 공개한다.
이 후, 결과들을 집계하여 최정적인 결과를 도출한다.
정리하자면, 닐리온은 암호화된 데이터를 복호화하지 않고도 연산이 가능하도록 해주는 네트워크이며, 이것을 가능하게 한 것은 다자간 컴퓨팅(MPC) 기술이다. 그리고 그중에서 비선형 방식을 채택하여 좀 더 복잡한 연산도 가능하게 된 덕이라고 할 수 있다.
하지만 지금까지 우리가 알아본 것은 닐리온의 한 축에 불과하다. 결국 닐리온이 블라인드 연산을 하는 이유가 무엇일까? 그 기술을 활용하여 다양한 사례들을 만들어내기 위해서다. 그리고 그 사례들은 블록체인 네트워크에서 구현될 것인데, 바로 이 때 닐 체인(Nil Chain)이 등장한다.
닐 체인은 코스모스SDK 기반의 블록체인 네트워크이고 닐리온 네트워크에서 조율 레이어(Coordination Layer)역할을 수행한다. 즉, 닐리온 네트워크에 수수료를 지급할 때 닐 체인을 사용하며, 닐리온의 사용자는 닐 체인으로부터 수수료를 지급했다는 검증 없이는 PETnet으로부터 블라인드 연산의 결과를 받을 수 없다. 닐 체인은 말 그대로 닐리온 네트워크에서 일어나는 모든 행동들에 대한 조율을 해주며, 별도의 스마트 컨트랙트는 존재하지 않는다.
1.4.1 스마트 컨트랙트가 존재하지 않으면 어떡하죠?
만약 닐리온 네트워크에 스마트 컨트랙트가 없다면 닐리온을 구체적으로 어떻게 활용할 수 있을까? 정리하자면 닐리온을 사용하는 방식에는 크게 두 가지가 있을 수 있다. 1) 순수하게 닐리온만을 사용하는 오프체인 애플리케이션 2) 기존 블록체인을 사용하면서 닐리온의 블라인드 컴퓨팅을 레버리지 하는 애플리케이션.
우선 1)의 경우엔 스마트 컨트랙트가 필요없는 애플리케이션들에 해당한다. 예를 들어서 패스워드 매니저나 AI 추론 애플리케이션은 스마트 컨트랙트가 없어도 되는 애플리케이션이고, 이들은 바로 닐리온 위에서 구현될 수 있다. 하지만 스마트 컨트랙트가 필요한 2)의 경우엔 기존 블록체인(아비트럼이나, 니어, 아발란체, 솔라나와 같은)에서 트랜잭션 세틀먼트를 수행하고 프라이버시 관련된 부분만 닐리온을 레버리지 할 수 있다.
구체적인 사례들과 함께 닐리온이 어떻게 사용될 수 있는지를 한 번 살펴보자.
아티클 전반에 걸쳐서 계속 언급했듯, 닐리온이 다른 인프라들과 다른 점은 데이터를 복호화 하지도 않고 연산할 수 있다는 부분이다. 이로 인해, 닐리온에서는 기존에 한계점이 많았던 민감 데이터 연산을 수행할 수 있음에, 새로운 활용 사례들도 대거 등장할 예정이다. 어찌보면 닐리온은 웹3의 문제가 아닌 기존 사회의 문제점들을 해결할 수 있을 것으로 기대된다. 그렇다면 닐리온의 구체적인 사례들은 어떤 것들이 있을까?
필자가 서론에서도 언급했지만, 결국 AI가 개개인들의 일상 패턴을 기반으로 개인의 업무를 대신 처리하는 비서 역할을 하려면, 지극히 사적인 영역의 데이터도 공개해야 하는 위험을 감수해야만 한다. 결국 블라인드 연산 없이는 내 데이터를 안전하게 학습시킬 방법이 거의 없다고 봐야 한다. 해서, 닐리온의 블라인드 연산이 AI 비서를 완벽히 개인화하는 데 있어 매우 중요한 인프라가 될 수 있을 것이라고 보고 있다.
닐리온 생태계는 인프라 기술 영역 뿐만 아니라 애플리케이션 영역 양쪽에서 급속도로 확장되고 있다. Virtuals, Capx, Ritual, Skillful 같은 주요 AI 인프라 플랫폼들이 이미 닐리온과의 통합을 위한 파트너십을 체결했거나 약속한 상태다. 애플리케이션 측면에서는 Pindora(개인 소셜 에이전트), Fulcra(건강 관리 어드바이저), Space of Mind(정신 건강 어드바이저)와 같은 엔드 유저 솔루션들이 닐리온을 기반으로 적극적인 개발을 진행하고 있다.
이 외에도 IoT나 스마트 시티 구현에 있어서 개인들의 위치 데이터를 암호화 처리하거나, 여러 기관들의 연구 데이터를 통합 분석하거나, 정부 기관 간 정보 공유 시스템을 구축할 수도 있고, 오더북 거래를 프라이빗하게 진행하여 MEV를 방지하는 등 굉장히 다양한 사례들이 나올 수 있을 예정이다. 그리고 이러한 사례들이 중요한 이유는, 여태까지 블록체인이 하려고 했던 것들을 넘어서서, 새롭고 유용한 사례들을 만들어낼 수 있을 것이라고 보고 있기 때문이다. 닐리온이야말로, 우리 사회에서 실질적인 문제들을 해결하는 인프라라고 할 수 있을 것이다.
의료 분야에서는 데이터 프라이버시가 가장 중요한 과제로 여겨지고 있다. 의료 데이터는 엄격한 법적, 규제적 프레임워크로 보호되고 있지만, 이러한 보호 장치들이 오히려 효과적인 데이터 공유와 분석을 가로막는 장벽이 되고 있는 것이 현실이다. 이로 인해 의료 전문가들과 연구진들은 환자의 기밀을 유지하면서 민감한 정보에 접근하고 분석하는 데 있어 상당한 어려움을 겪고 있는 상황이다.
이러한 문제를 해결하기 위해 닐리온은 의료 프라이버시에 대한 혁신적인 접근 방식을 제시하고 있다. 의료 기관들은 닐리온의 기술을 통해 민감한 의료 데이터를 완전히 암호화된 상태로 저장하고, 처리하며, 분석할 수 있게 되었다. 특히 분산화된 구조를 통해 의료 기관들 간의 효과적이고 안전한 협력이 가능해졌고, 이는 개인 맞춤형 의료, 예측 의료 분석, 대규모 의료 연구 등의 새로운 지평을 열어가고 있다.
실제로 여러 기업들이 이미 의료 분야에서 닐리온의 기술을 활용하고 있다. 대표적으로 MonadicDNA는 닐리온의 인프라를 활용해 안전한 개인 유전체 플랫폼을 개발했는데, 이를 통해 민감한 유전 정보를 전체 데이터 생애주기에 걸쳐 보호할 수 있게 되었다. 이로써 데이터 유출이나 무단 접근으로부터 강력한 보호를 제공하면서도, 개인의 건강과 유전 정보에 대한 가치 있는 통찰을 안전하게 제공할 수 있게 된 것이다.
정신 건강 분야에서도 주목할 만한 사례가 있다. Space of Mind는 닐리온의 기술을 활용하여 그룹 치료 세션을 통한 근거 기반 정신 건강 지원을 제공하고 있다. 이 플랫폼은 AI 기반 도구들을 통합하면서도 프라이버시 문제를 효과적으로 해결하고 있는데, 특히 사용자의 프라이버시와 신뢰를 완벽하게 보장하면서도 일기 내용의 감정 분석을 비공개로 수행할 수 있다는 점이 혁신적이다.
닐리온 기반의 데이터 마켓플레이스는 개인 데이터의 처리와 수익화 방식을 새롭게 정의한다. 현대의 디지털 세상에서 개인들은 일상적인 디지털 상호작용을 통해 엄청난 양의 데이터를 생성하고 있지만(사실상 모든 활동들이 데이터 생성, 이동, 수정이니 말이다), 이러한 정보들은 대부분 고립된 중앙화 데이터베이스에 갇혀 있는 것이 현실이다. 해서, 닐리온은 개인들이 자신의 데이터를 통합하고 진정한 소유권을 유지하면서도, 잠재적 구매자들이 이 데이터를 안전하게 분석하고 활용할 수 있게 하는 프라이버시 인프라를 제공하고 있다.
이러한 접근 방식은 개인들이 자신의 개인 정보에 대한 통제권을 포기하지 않으면서도 확장되는 데이터 경제의 혜택을 누릴 수 있는 새로운 가능성을 열어주고 있다. 닐리온의 기술은 데이터를 암호화된 상태로 유지하고 민감한 정보를 무단 접근으로부터 보호하면서도 안전하고 활발한 데이터 활용을 가능하게 함으로써, 이러한 마켓플레이스에서 핵심적인 인프라 역할을 하고 있다고 볼 수 있다.
이미 여러 프로젝트들이 닐리온의 기능을 활용하고 있고, 몇몇 프로젝트들을 언급하자면 다음과 같다. ZAP은 사용자 데이터 풀을 분석하여 새로운 AI 학습 데이터셋을 만들면서 동시에 가치 있는 사용자 인사이트를 제공하는 데 주력하고 있는데, 이들의 첫 번째 제품인 A.I. Lingo는 이미 약 4만 명의 사용자를 확보하는데 성공했다. Fulcra는 스마트 기기 데이터로부터 집단 인사이트를 생성하는 것을 전문으로 하는 또 다른 주목할 만한 사례다. 한편 Humanity는 소셜, 건강, 엔터테인먼트 등 다양한 플랫폼의 데이터를 통합하여 사용자들이 자신의 개인 인사이트를 수익화할 수 있도록 돕고 있다.
이외에도 닐리온 생태계는 Reclaim Protocol, HealthBlocks, Dwinity 등의 혁신적인 프로젝트들과 함께 계속 성장하고 있는데, 이들 모두 닐리온의 블라인드 연산 기술을 활용하여 강력한 데이터 경제를 만들고 사용자들에게 데이터 소유권과 수익화의 새로운 기회를 제공하고 있다.
의료 분야에서 블라인드 연산의 필요성이 매우 높은데, 이는 의료 데이터가 가진 특수성 때문이다. 의료 데이터는 환자의 매우 민감한 개인정보를 포함하고 있어 의료기관들이 서로 데이터를 공유하거나 외부 AI 시스템을 활용하는 데 큰 제약이 있었다. 이러한 데이터를 공개적으로 공유하게 되면 심각한 프라이버시 침해 문제가 발생할 수 있기 때문이다.
닐리온은 이러한 문제를 해결하기 위해 블라인드 연산 기술을 도입했다. 이를 통해 병원은 HIPAA(미국 의료정보 보호법)와 GDPR(유럽 개인정보보호법)과 같은 엄격한 규정을 준수하면서도 AI를 활용한 맞춤형 진단이 가능해졌다. 실제 사례로 2024년에는 환각제 치료 서비스를 제공하는 Maya와 파트너십을 체결했는데, Maya는 닐리온의 기술을 통해 환자의 민감 데이터를 안전하게 저장하고 암호화된 상태로 처리할 수 있게 되었다. 이로써 Maya는 환자의 개인정보를 직접 열람하지 않고도 데이터를 기반으로 한 분석과 연구가 가능해졌으며, 이는 의료 서비스의 질적 향상으로 이어질 수 있다는 점에서 매우 의미있는 발전이라고 할 수 있다.
IT 기업들은 보안 취약점을 찾기 위해 자사의 코드를 공개하지 않으면서도 분석이 필요한 상황이 있다. 닐리온의 블라인드 연산은 이런 상황에서 유용하게 활용될 수 있다. 예를 들어 A사가 보안 취약점을 찾아내는 AI 모델을 보유하고 있고, B사가 자사의 독점 코드베이스의 취약점을 분석하고 싶을 때, 블라인드 연산을 통해 양측의 핵심 자산(AI 모델과 코드베이스)을 보호하면서도 보안 취약점을 효과적으로 발견할 수 있다. 이에 대한 상세한 내용은 닐리온의 블로그에서 확인할 수 있다.
필자는 블록체인이 가진 투명성이 양날의 검이라고 생각한다. 투명하고 추적 가능하기에 모두에게 공평한 접근권을 보장하지만, 그 투명성 때문에 기관들을 비롯한 현재 사회의 중요한 주체들이 퍼블릭 블록체인 사용을 꺼리고 있다. 모든 것이 투명하다고 좋은 것은 아니기 때문이다. 물론 데이터가 가려진다면 악용될 여지도 있겠으나, 필자의 관점에서 현재 웹3를 위시한 블록체인 기술이 '대중화'되지 않는 이유는 확장성이나 UI/UX가 아닌 투명성 때문이라고 생각한다.
이 세상의 데이터, 특히 가치 있는 데이터들은 대부분 비공개일 확률이 높다. 공개되지 않았기에 더 가치 있을 수도 있지만, 누군가는 그 데이터를 기반으로 다양한 서비스를 만들어야만 웹3 서비스가 기존 웹2 서비스들과 경쟁할 수 있을 것이다. 즉, 분산된 환경에서 암호화된 데이터를 복호화하지 않고도 연산 가능한 인프라만 있다면, 웹3에서도 민감 데이터나 비공개 데이터로 매우 유용한 애플리케이션들을 만들 수 있을 것이다.
블록체인은 디지털 세상에서 자가수탁을 가능하게 했다는 점에서 큰 의미가 있지만, 다룰 수 있는 데이터에 한계가 있다면 반쪽짜리 혁신이라고 생각한다. 만약 블록체인이 만들어놓은 무신뢰 환경에서 비공개 데이터 연산까지 가능하다면, 우리는 진정한 웹3 프로덕트의 대중화를 기대해볼 수 있을 것이다.
하지만 블라인드 연산은 말처럼 쉽지 않다. 닐리온도 앞으로 더 완전한 블라인드 연산을 위해 다양한 기술들을 도입할 예정이니, 닐리온의 향후 행보가 매우 주목할 만하다고 생각한다. 과연 블라인드 연산 시장의 승자는 누가 될까?