作者:Anastasia Matveeva,Gonka 协议联合创始人
目录
- 真正的“去中心化”
- 区块链与推理验证
- 实际运作方式
- 安全与性能的权衡
- 优化空间
当我们开始构建 Gonka 时,我们提出了一个问题:如果任何人都能运行 AI 推理并因此获得报酬,世界会怎样?如果我们不再依赖昂贵的中心化服务商,而是利用全球未被充分利用的计算能力,结果又会如何?
当前的人工智能格局由少数几家大型云服务提供商主导,如 AWS、Azure 和 Google Cloud。这种高度集中化的基础设施带来了诸多问题:单点故障、高昂的价格以及对敏感应用的审查风险。例如,当 OpenAI 的 API 宕机时,数千个依赖其服务的应用程序也随之崩溃;而 AWS 中断则可能导致整个互联网的大范围瘫痪。
即使是前沿模型的训练成本也十分惊人。Anthropic 曾透露训练 Claude 3.5 Sonnet 花费了“数千万美元”,而未来更复杂的模型可能需要数十亿美元。同时,运行这些模型进行推理的成本对于中等活跃度的应用而言,每天可能高达数百到数千美元。
然而,在全球范围内,大量计算资源却被闲置或用于低价值活动,例如比特币挖矿中的无意义哈希计算。如果这些资源能够被重新分配到有意义的工作负载上,比如 AI 推理,将带来巨大的效率提升。
去中心化方法可以通过汇集分散的计算能力,降低资本门槛,消除单一供应商瓶颈。我们设想一个网络,任何拥有 GPU 的人都可以加入,通过运行 AI 推理获得奖励。
尽管构建这样的去中心化解决方案充满挑战,从共识机制到资源分配,每个环节都需要精心设计。本文将聚焦于其中一个核心问题:如何运行特定 LLM 的推理任务,并在安全与性能之间取得平衡。
什么是真正的“去中心化”
当我们谈论去中心化的 AI 推理时,我们指的是一种非常具体的系统架构。它不仅要求 AI 模型分布在多个服务器上运行,还必须允许任何人自由加入网络,贡献算力,并因诚实工作获得奖励。
关键在于系统的无信任性:用户无需信任任何个人或公司即可确保模型按预期运行。这意味着必须有密码学保证,证明输出确实来自指定的模型和参数。
这种无信任特性带来了新的挑战。首先,系统必须具备可验证性——即能够确认给定输出是由正确的模型生成的。这对于智能合约尤为重要,因为它们需要验证 AI 响应的合法性。
但增加验证过程也会牺牲性能。完全信任所有参与者自然会提高速度,却增加了安全风险;而彻底验证每一次推理则会导致系统过于缓慢,难以与中心化方案竞争。这正是我们努力解决的核心矛盾:如何在安全与性能之间找到平衡。
区块链与推理验证
那么,如何验证某人是否正确运行了模型?区块链成为了一个显而易见的选择。虽然它存在固有的局限性,但仍然是创建不可篡改记录的最佳工具之一。
基本思路很简单:每次推理完成后,执行者需提交一份使用正确模型的证明,该证明会被记录在区块链上,形成永久且防篡改的日志。
然而,区块链的速度是一个显著问题。如果尝试将推理的每一步都记录在链上,庞大的数据量很快会使网络不堪重负。为了解决这一限制,我们在设计 Gonka 网络时采用了折衷策略。
我们选择让一个完整模型托管在一个节点中,而非将其分片至多个节点。尽管这提高了参与的硬件门槛(每个节点需具备足够的计算能力和内存),但它避免了跨设备协调的巨大开销。同时,我们引入了 vLLM 技术,以支持张量和流水线并行化,从而优化单节点内的性能。
实际运作方式
基于上述原则,我们设计了一个流程:每个节点独立运行完整模型并处理完整的推理请求,区块链仅用于记录验证信息。实际计算则在链下完成。
为了实现完全去中心化,每个参与者至少部署两个节点:一个负责通信的网络节点,另一个或多个负责推理的 ML 节点。推理请求到达后,网络节点随机选择一个执行者(即其他参与者的 ML 节点)。为了节省时间,输入请求先发送给执行者启动推理,同时将输入记录到链上。推理完成后,执行者将结果返回给客户端,并将验证工件记录在链上。
这种方法确保了区块链记录不会拖慢推理计算或响应时间。验证过程是异步进行的,只有在发现作弊行为时才会影响后续操作。
安全与性能的权衡
安全与性能之间的冲突无法回避。追求极致安全性意味着需要验证所有推理,但这既耗时又昂贵;追求极致性能则需要信任所有人,却容易遭受攻击。
经过反复试验和调整,我们找到了一种平衡方法。具体而言:
- 存储前 k 个 token 的概率分布作为轻量化验证工件,用以检测潜在篡改行为。
- 采用基于声誉的动态验证机制,新参与者 100% 的推理都将被验证,随着声誉增长,验证比例逐步下降至约 1%。
参与者根据权重获得报酬,权重反映了其在网络中的贡献和可信度。经济激励在这里发挥了重要作用,通过让作弊代价高昂、诚实参与有利可图,我们推动了良性循环。
优化空间
经过数月开发和测试,我们已初步构建了一个结合区块链安全性和高性能推理的去中心化网络。虽然安全与性能的矛盾依然存在,但我们相信,随着技术迭代和社区扩展,Gonka 将有能力与中心化服务商一较高下。
如果您对我们的项目感兴趣,欢迎访问 官网、GitHub 或加入我们的 Discord 社区,共同探讨未来的可能性。
关于Gonka.ai
Gonka 是一个旨在提供高效 AI 算力的去中心化网络,目标是最大化利用全球闲置 GPU 资源,为开发者和研究人员提供无需许可的算力访问渠道。通过原生代币 GNK,Gonka 鼓励所有参与者共享算力并获得奖励。
Gonka 由美国 AI 开发商 Product Science Inc. 孵化,创始人包括 Web 2 行业资深人士 Libermans 兄妹。项目早期获得了 Coatue Management、Slow Ventures 等知名投资机构的支持。
官网|Github|X|Discord|白皮书|经济模型|用户手册