새로운 블록체인 기술을 활용한 창조적 AI?
생성적인 인공지능(AI)은 빠르게 최근 몇십 년간 가장 핫하고 변혁적인 기술 트렌드 중 하나가 되었습니다. 생성적 AI의 영향력은 인프라에서 응용프로그램까지 기술 스택의 모든 영역에서 확인할 수 있습니다.
ChatGPT의 출시와 그 후의 GPT-4에 이르러서, Web3 커뮤니티는 생성적 AI와 Web3의 잠재적 교차점에 대해 추측하고 있습니다. 당연한 사용 사례인 대화형 지갑이나 언어 탐색과 같은 것들 외에도 더 복잡한 논문들을 탐구할 가치가 있습니다.
Jesus Rodriguez는 IntoTheBlock의 CEO입니다.
생성적 AI가 독자적인 블록체인을 가질만한 가치가 있는지에 대해 생각해보세요.
- 바이낸스, 코인 상장에 대한 압력에 굴복하여 프라이버시에 대한 승리를 거둡니다.
- FTX의 파산에 얼마나 많은 돈을 쓰는 것이 너무 많은가요?
- 유럽의 디지털 유로는 정말로 개인정보를 보호할 수 있을까요?
오픈소스의 힘과 중앙집중화된 통제
생성적 AI를 위한 블록체인의 타당성을 분석하기 위해서는 현재의 상황을 이해하는 것이 중요합니다. 특히, GPT-4와 같은 API 기반 기술에 대한 대체물로서의 오픈소스 대안의 등장 및 그러한 기반 모델들의 중앙집중화된 통제에 대한 우려의 증가에 대해 알아보아야 합니다.
몇 달 전까지 API 기반과 오픈소스 기반의 기반 모델 간의 격차는 상당했습니다. OpenAI의 GPT-4, Anthropic의 Claude(언어 분야), DALL-E, Midjourney(컴퓨터 비전 분야)와 같은 모델들은 오픈소스 대안들과 비교해 상당히 선진해 보였습니다. 그러나 지난해 말에는 Stable Diffusion이라는 놀라운 오픈소스 모델이 릴리스되면서 변화가 시작되었습니다. 이 모델은 API 기반의 텍스트-이미지 모델에 대한 대안으로서 충분한 선택이 되었습니다. 이에도 불구하고, 대규모 언어 모델(Large Language Models, LLMs)은 생성적 AI의 초점이 되었으며, 이 도메인에서 오픈소스 모델은 품질 측면에서 API 기반 대안들에 비해 미비한 수준으로 남아 있었습니다.
올해 초, Meta AI Research는 GPT-3의 성능을 유지하면서 훨씬 작은 크기의 LLM인 LLaMA를 소개하는 논문을 게재했습니다. 이 모델은 처음에는 오픈소스로 공개되지 않을 목적으로 만들어졌지만, 예상치 못한 일이 발생했습니다. 게재 한 주 후에 모델이 4chan에 유출되었고, 즉시 수천 명의 사람들이 다운로드했습니다. LLaMA “사고”로써 기반 LLM이 누구나 사용할 수 있게 되었으며, 이는 오픈소스 혁신에 예상치 못한 힘을 불어넣었습니다.
유출 이후, 유머러스한 동물 이름을 가진 새로운 오픈소스 기반 모델들이 어디에서나 등장하기 시작했습니다. 스탠포드 대학은 Alpaca를 공개했고, Databricks는 Dolly를 공개했으며, 버클리 대학은 Koala를 오픈소스로 공개했고, 캘리포니아 대학 버클리와 Carnegie Mellon 대학은 Vicuna를 공동으로 공개했으며, Together는 Red Pajama 프로젝트를 발표했으며, 이와 같은 목록은 끝이 없습니다. Stable Diffusion과 LLaMA는 오픈소스 생성적 AI의 규모를 키우고 상당한 힘을 만들어냈습니다. 게다가, 오픈소스 기반 모델들은 품질 측면에서 상업적인 기존 모델들과 점점 더 가까워지고 있습니다.
생성적 AI 블록체인의 등장을 촉진하는 또 다른 요인은 기반 모델들의 투명성 부족과 중앙집중화된 통제에 대한 우려입니다. 기반 모델을 구동하는 신경 아키텍처의 크기와 복잡성은 정확한 해석을 거의 불가능하게 만듭니다. 결과적으로, 산업은 더 개방적인 아키텍처와 신중한 규제와 같은 중간 단계에 의존해야 합니다. 시장에서 가장 강력한 모델들을 몇 개의 중앙집중화된 엔티티들이 통제하는 것은 생성적 AI의 실제 책임, 투명성, 해석 가능성을 달성할 수 있는 타당성에 대한 또 다른 우려 요소를 추가합니다.
더 읽어보기: Jesus Rodriguez – 다음 ChatGPT가 Web3에 등장하려면 몇 가지가 바뀌어야 합니다
오픈소스 기반 모델에 대한 혁신의 폭발은 Web3 플랫폼이 생성적 AI 기능을 통합하는 데 필요한 진입 장벽을 크게 낮추었습니다. Web3 플랫폼에서 기반 모델의 채택은 두 가지 기본적인, 순차적인 경로를 따를 수 있습니다:
- 대화 형태의 기능을 가능하게 하는 DApps 구축
- 생성적 AI를 기반 요소로 설계된 새로운 Web3 플랫폼 구축
첫 번째 시나리오에서는 교환소, 탐색기, 지갑 등이 대규모 언어 모델을 기반으로 한 대화 기능을 포함하는 도구들이 등장할 것으로 예상됩니다. 게다가, 생성적 모델을 기반으로 한 새로운 세대의 DApps가 구축될 것입니다. 이 시나리오에서, Web3는 주로 생성적 AI 기능의 소비자 역할을 하며, 모델은 전통적인 Web2 클라우드 인프라에서 실행됩니다.
웹3 플랫폼에서는 원천적으로 생성적 AI 모델을 지원할 수 있는 더욱 흥미로운 대안들이 나타납니다. LLaMA, 도리(Dolly), 알파카(Alpaca)와 같은 오픈 소스 원천 모델이 분산된 블록체인 내의 노드에서 실행되는 상상해보세요. 이러한 비전의 궁극적인 실현은 생성적 AI를 특별히 지원하기 위해 설계된 블록체인입니다.
생성적 AI를 위해 최적화된 새로운 블록체인 개념은 매력적으로 들릴 수 있지만, 단연 논란의 여지가 있습니다. 결국, DeFi나 NFT를 위해 만들어진 새로운 블록체인은 없었습니다. 그렇다면 생성적 AI는 무엇이 다른 것일까요?
답은 원천 모델을 실행하고 블록체인 런타임을 실행하는 요구 사항 사이의 아키텍처적 불일치에 있습니다. 일반적인 사전 훈련된 원천 모델은 수십만 개의 뉴런이 상호 연결된 수만 개의 계층에 걸쳐 퍼져 있는 것으로 구성되며, GPU 클러스터나 특수한 딥러닝 하드웨어 토폴로지에서 실행됩니다. 웹3의 역사상 어떤 스마트 계약도 그 수준의 복잡성에 근접하지 못합니다. 따라서 새로운 유형의 아키텍처가 필요하다는 결론을 내리는 것은 논리적입니다. 심지어 Web2 인프라도 대규모 생성적 AI 모델을 지원하도록 진화하고 있으며, 이는 웹3 아키텍처에서 요구되는 변경의 규모를 보여줍니다.
생성적 AI를 위한 새로운 블록체인을 고려할 때, 가능성은 무한합니다. 하지만, 이 아이디어의 가장 간단한 버전은 핵심 기능 집합을 포함해야 합니다. 생성적 AI에 특화된 블록체인을 위해 원천 모델을 실행하는 노드를 실행하는 능력은 필수입니다. 원천 모델의 수행, 세밀 조정 및 추론 워크플로우를 실행하는 능력도 동일하게 중요합니다. 이러한 워크플로우는 원천 모델의 수명 주기에서 세 가지 주요 단계입니다. 사전 훈련이나 세밀 조정 모델에 사용된 데이터셋을 게시하고 공유하는 기능도 원하는 특징입니다. 기반층으로 블록체인 런타임을 확립한 후에는 투명성과 해석 가능성의 다양한 기능을 활성화할 수 있습니다. 예를 들어, 사전 훈련에 독성이 없거나 편향된 데이터셋이 사용되었는지를 검증하는 모델의 특정 가중치에 대한 투명성을 제공하는 지식 증명 프로토콜을 상상할 수 있습니다.
왜 새로운 블록체인이 필요한가요?
생성적 AI에 특화된 블록체인 개념은 매력적일 수 있지만, 정말로 필요한 것일까요? 기존의 블록체인 런타임에 생성적 AI 기능을 통합하는 것에는 타당한 가치 제안이 있습니다. 그러나 소프트웨어의 역사는 새로운 아키텍처 패러다임이 인프라 기술에 영향을 미치는 반복적인 경향을 보여줍니다. 최근의 클라우드 컴퓨팅이나 빅 데이터도 그 예입니다. 원천 모델은 기본적으로 다른 아키텍처 패러다임을 대표하며, 이는 효과적인 운영을 위해 더 특화된 블록체인 인프라가 필요한 것으로 보입니다.
또한, 생성적 AI가 블록체인 스택의 하위 레이어를 변형할 수 있는 잠재력을 간과해서는 안 됩니다. 언어를 기반으로 한 번역자가 트랜잭션을 처리하는 소유 증명(Proof-of-Stake) 블록체인을 상상하는 것은 과하다고 할 수 없습니다. 마찬가지로 스마트 계약은 언어를 메시지 교환의 근본적인 수단으로 활용할 수 있습니다.
생성적 AI는 전체 블록체인 스택에 변화를 일으킬 수 있는 잠재력을 가지고 있습니다. 이 관점에서, 이러한 변화를 수용할 수 있는 유연성을 갖춘 새로운 런타임을 가능하게 하는 것은 첫 원리 접근법을 채택하는 논리적인 선택으로 보입니다.
웹3에서 생성적 AI를 무시하는 위험
생성적 AI 블록체인의 아이디어는 분명 논란이 될 수 있으며 도전적인 면이 없지는 않습니다. 그러나 부정적인 방식으로 이 아이디어를 탐구하는 것을 권장합니다.
생성적 AI를 위한 새로운 블록체인을 구축하지 않는다면 어떤 일이 발생할까요?
현재, 생성적 AI는 웹2와 웹3 아키텍처 간의 중요한 기술적 격차를 만들어냈습니다. 네이티브 생성적 AI 기능이 웹3에 존재하지 않을 때 이 격차는 계속 확대됩니다. 생성적 AI는 소프트웨어 개발의 근본적인 측면을 재구성하고 있으며, 이러한 패러다임 전환을 지원하기 위해 새로운 프레임워크와 플랫폼이 빠르게 등장하고 있습니다.
네이티브 생성적 AI 기능을 개발하는 것은 웹3에게 본질적인 도전과제입니다. 원천 모델의 세계로의 새로운 이동을 가능하게 하는 많은 접근 방식 중 하나로 생성적 AI 블록체인을 구축하는 것은 다양한 도전이 따르지만, L2 런타임의 신속한 발전, Cosmos와 같은 플랫폼, Aptos나 Sui와 같은 고성능 L1 생태계의 등장은 지난 몇 년간 생성적 AI 블록체인의 가능성을 훨씬 더 실현 가능하게 만듭니다.
Ben Schiller가 편집했습니다.