以下是一些与 AI 高度互动的创新媒介的讨论。 艺术
“AI 艺术不是艺术” 是那些顽固反对 AI 工具崛起的人们的常用口号。生成模型的发布迅速遭到了强烈反击和抗议,例如我们在 ArtStation 上看到的。然而,它却在 web3 中一些最有趣的创意垂直子领域中迸发出了火花。
AI 艺术有多种形式,最著名的是时下正流行的生成模型,包括 DALL-E、Stable Diffusion 和 Midjourney。还有像 ImgnAI 这样的 web3 竞争者,它们致力于围绕由代币经济学驱动的生成图像创作为用户提供更棒社交体验,这是围绕这些生成模型构建社区护城河所非常需要的。
然而,在这个领域备受推崇的 AI 艺术家们经常以一种更独特的方式进行工程设计和微调他们的模型,从而获得更加独特的作品,而不是通过简单的提示。这可能需要训练新的嵌入,或者使用 LoRAs 来完善某种风格,甚至需要完全构建自己的模型。
使用更复杂和更个性化模型将 AI 艺术作为 NFT 发布的流行艺术家包括 Claire Silver、Ivona Tau、Roope Rainisto、Pindar van Arman、Refik Anadol、Gene Kogan 等等。这些艺术家已经探索了使用各种市场进行分销,其中最突出的是 Braindrops、Mirage Gallery 和 FellowshipAI 等 AI 艺术专有市场,以及 Bright Moments 等专门针对艺术形式的活动平台。
AI 艺术的垂直子领域也已经形成,例如后摄影 (post-photography) 和数据艺术 (data art)。后摄影艺术主要由 Fellowship.ai 团队推动,通过与 Roope Rainsto 合作,让更多探索这种媒介的艺术家进入公众视野。很多后摄影美学都致力于拥抱早期生成工具中常见的视觉伪影 (visual artifacts)。随着 Roope Rainisto 在 Braindrops 上出版的 Life in West America 系列,后摄影艺术开始在社交媒体上受到越来越多的关注。
关于数据艺术,Refik Anadol 是该领域的一名知名艺术家,他以使用数据、算法和人工智能来创建动态和交互式艺术作品的沉浸式装置而闻名。他的作品中有一些有趣的例子,如《Unsupervised》,该作品将 MoMA 的元数据转化为一个可实时生成新形式的作品。另外一个例子是《Sense of Place》,它使用了实时的环境数据,如风、温度和湿度,以及来自蓝牙、Wifi 和 LTE 的信号数据来为作品提供数据来源。
? ?
我尤为兴奋的 Crypto x AI 的领域是游戏。该领域有很多新颖的游戏可供探索,例如程序内容游戏、生成式虚拟世界、基于 LLM 的叙事、AI 代理相互合作的合作游戏等等。
虽然 web2 中有很多关于新游戏的好例子,但在这里我们将重点介绍 web3 的例子。值得一提的是这篇学术文章《Generative Agents: Interactive Simulacra of Human Behavior》唤醒了许多人对多人工智能代理游戏环境的可能性探索。来自斯坦福大学和谷歌的研究人员通过将 LLM 应用于沙盒游戏环境中的代理展示了这种潜力。由 LLM 驱动的代理表现出令人印象深刻的行为包括传播派对邀请,建立友谊,约会,以及协调大家按时参加聚会等等,所有这些都基于单一的用户指定建议。该方法利用了一种架构,该架构扩展了 LLM 以存储和合成更高级别的反馈,从而让代理能够实现更为动态的行为规划。
这项研究是迄今为止 web3 中探索最多 (但仍处实验阶段) 的游戏的基础。核心思想是我们如何在模拟环境中使用具有高度自治性或特性的 AI 代理,并围绕它们打造有趣而富有趣味性的游戏。
Parallel TCG 团队的 Parallel Colony 通过让 AI 代理在游戏中为玩家收集资源和代币来探索这一概念。使用 ERC-6551 标准,AI 代理是可以代表用户在游戏中进行交易的 NFT 钱包。AI 代理可以创建、铸造和存储新的游戏道具,并且还具备由团队创建的微调 LLM 所定义的个性,使他们具有非标准化的行为和特质,这些行为和特质可以影响他们在游戏中的行动。
不过从概念上讲,最引人入胜的基于 AI 代理的游戏是 Upstreet。Upstreet 是一个虚拟世界项目,具有一些疯狂的创意,例如 AI 代理 SDK、程序任务、浏览器 + VR、拖放互操作性以及一个名为 “The Street” 的环境中的社交功能,玩家可以构建自己的体验并在其中互动。除了玩家之外,还有人工智能代理,开发人员 (及玩家) 可以部署影响游戏环境的个性和目标。最有趣的是他们对 AI Director 的研究和开发,这是一个 AI 代理,它决定一个目标,例如 “从最高的建筑物跳伞” 或 “开始一个新的宗教”,用户和代理作为挑战者参与其中。Director 会在每一个回合结束时确定获胜者,用奖品、代币和 NFT 奖励玩家和代理。这可能会导致非常有趣且复杂的代理与玩家的交互,我们非常高兴看到其发展,特别是,它可以直接导致高价值的 3D 环境研究和数据,为将来的更先进的模型提供更多的数据,OpenAI 似乎也对收购开源 Minecraft 风格的游戏颇感兴趣。
用于创建虚拟世界的生成工具是增强游戏的另一个领域。例如,Today 让玩家设计自己的虚拟岛屿并照顾 AI NPC 同伴。尤为独特的是他们使用生成创意工具来促进游戏内 UGC 的开发。由于游戏主要基于这些用户创建的岛屿,因此,为没有 3D 游戏开发或艺术技能的玩家提供丝滑的资产开发机会非常重要。可以说,围绕元宇宙风格的游戏玩法之所以低迷,很大程度上是因为缺乏内容,而从短期来看,恰恰可以通过使用生成工具来补救这一点。
AI 代理需要训练,而训练本身可以成为一个有趣的游戏供玩家探索。AI Arena 提供了一种新颖的 AI 代理训练方式,让玩家玩 Super Smash Bros 风格的游戏,通过模仿训练慢慢教 AI 代理参加比赛。由于 AI 代理不需要休息,因此它可以全天候地与始终活跃的竞争对手池进行竞争性锦标赛以获得奖品,同时玩家可以异步微调其游戏风格。这将培训变成了一种游戏,并通过代币经济学放大它的效用。
人类与强大的人工智能玩家进行大规模的合作游戏在过去是可以做到的,但随着代币经济学的融入,它被提升到了一个新的高度。来自 Modulus Labs 的 Leela vs. the World 是此类游戏形式的实验。在这个实验中,Modulus 采用了 Leela 国际象棋引擎,并通过 zk 电路验证它的输出。玩家可以投入资金押注人类与人工智能的对弈,从而形成一个有趣的预测市场。虽然考虑到目前 zk 的状态,该模型的验证时间会很长,但它无疑开辟了基于大规模协作的电子竞技预测市场和可验证且复杂的 AI 玩家治理机制的可能性挑战。
最后,纯链游或自主世界也将通过人工智能得到增强。关于该主题最引人注目的是大型知识模型 (Large Lore Models),它着眼于使用 LLM 协议层来创建持续的知识,这些知识可以在可修改和相互关联的游戏环境中进行互操作,玩家的行为在自主世界中同时影响多个游戏环境,因此应该携带更高维度的知识来促进故事情节。这非常适合构建在多链游戏环境中的抽象 LLM 层。 基础设施
AI x Crypto 基础设施本身就值得用一篇单独的文章介绍,但在这里我将简要介绍我们看到的一些正在形成想法。 分布式计算
要理解加密经济系统对计算的需求,首先要理解核心问题。迄今为止,GPU 容量存在极大的瓶颈,最好的硬件,如 H100,等待时间长达一年。与此同时,初创公司正在筹集巨额资金来购买硬件,政府正在争先恐后地为国防目的而采购,即使是像 OpenAI 这样资金最充裕的团队也因为计算能力有限而不得不暂停功能发布。
很多专注于去中心化计算和 DePIN 的团队在这里看到了机会:引导无许可的集群来满足需求,同时提供加密激励和最低利润,使网络在定价上与 web2 同行具有高度竞争力,同时为硬件供应商提供更好的回报。
机器学习大致可分为四个主要的计算工作量:
数据预处理:准备原始数据并将其转换为可用的格式。
训练:让 ML 模型在大型数据集上进行训练,以学习数据中的模式和关系。
微调:可以使用较小的数据集进一步优化 ML 模型,以提高特定任务的性能。
推理:运行经过训练和微调的模型以进行预测。
我们已经看到了像 Render 和 Akash 这样更通用的计算网络转向服务于更专业的计算,如 AI/ML。例如,Render 已经利用建立在他们网络之上的提供商如 io.net 来更直接地服务 AI 客户,而像 Akash 这样的供应商已经开始引入拥有需求的硬件供应商,并通过直接训练他们自己的模型来展示网络的力量,第一个案例是一个仅在无版权材料上训练的 Stable Diffusion fork。Livepeer 也正在专注于 AI 视频计算,因为他们已经有一个庞大的服务于视频转码用例的网络。
此外,一种专门针对 AI 计算的网络正在形成,这让我们认识到围绕协同和验证的核心挑战可以通过围绕 AI 构建链或模型来更直接地解决。Gensyn 是其中比较值得注意的例子,它构建了一个基于基板的 L1,专为并行化和验证而设计。该协议使用并行化将较大的计算工作负载拆分为任务,并将它们异步推送到网络。为了解决验证问题,Gensyn 使用了概率学习证明 (probabilistic proof-of-learning)、基于图的 pinpoint 协议以及基于 staking 和 slashing 的激励系统。尽管 Gensyn 网络尚未上线,但该团队预测,其网络上等效 V100 GPU 的每小时成本约为 0.40 美元。
储存之外,替代训练模型也在兴起,例如联合学习 (federated learning),在意识到区块链可以更适当地激励这些模型后,它在 web3 中复兴。简而言之,联合学习是一种多方独立训练模型的方法,并定期批处理更新并将其发送到全局模型。有很多实践案例,比如谷歌的键盘文本预测算法。在 web3 中,FedML 和 FLock 正在尝试将联合学习方法与代币激励相结合。
同样值得注意的是,像 Filecoin 和 Arweave 这样的去中心化数据存储,以及像 Space and Time 这样的数据库,可以在数据预处理方面发挥重要作用。 基于共识的 ML
使用区块链的另一种新颖的基础设施形式则是基于共识的机器学习 (ML) 概念。Bittensor 是这一概念的最突出例子:这是一种基于 Substrate 的 L1 区块链,旨在通过使用特定于应用的子网来提高机器学习的效率和协作。每个子网都有自己的激励系统,用于服务各种用例,从 LLM 到预测模型到生成性创新。Bittensor 独特之处在于它如何使用矿工协调优质输出:矿工通过提供他们的 ML 模型的智能输出(由验证者评级)来获得 TAO (其原生代币)。由于矿工因为最佳输出而获得激励,他们会不断改进自己的模型以保持竞争力,从而帮助 Bittensor 完成了在代币经济学的协调下实现更快的学习过程。
TAO 生态系统中最近令人兴奋的发展是动态 TAO 提案,将 Bittensor 过渡到围绕代币排放的更自动化、市场驱动的机制设计,以及推出的 Nous 子网以提供激励模型微调,以便与 OpenAI 等公司竞争。
我们可能会看到更多有关此类系统的尝试,例如让 mining 或共识以有利于质量的方式调节模型输出。 意图就是您所需要的一切
在DeFi中,MEV 领域的最新论点是关于用户意图以及使用经济同性 (economically-aligned) 的解调器来执行这些意图。关于意图的讨论通常百家齐放,但有一点已经变得越来越清晰了:用户的意图需要更高阶的语义上下文才能被解析成可执行代码。LLMs 可能会提供这个语义层。
Propellerheads 提出了迄今为止在意图空间中使用 LLM 的最清晰的愿景:https://www.propellerheads.xyz/blog/blockchain-and-llms。
简而言之,LLMs 可以通过语义理解,将接近匹配的意图转化为完全匹配的意图,从而帮助我们找到巧遇需求 (coincidences of wants, CoWs) 的机会。这可以通过向内意图重判 (例如 “购买 LUSD 代替 USDC 可以吗?我找到了一个匹配的限价订单,你将通过这个 CoW 节省 0.3% 的交易费用。”) 和向外意图重判 (例如 “我想购买你拥有的这个 BAYC,您愿意以 X ETH 的价格出售吗?”) 来实现。
当然还可以有其他结构,这在钱包和多重签名的后账户抽象背景下变得特别有趣。DAIN 和 Autonolas 等项目已经尝试使用代理作为钱包的签名者,例如,出于安全和基于意图的目的,与你的钱包交谈并让它代表你执行交易即将成为现实。
同样值得关注的是规模庞大 DeFi 用例,例如基于代理的预测市场、由 AI 管理的经济模型、以及 ML 参数化的 DeFi 应用程序,我的 zkML 文章提供了更为详细的介绍。 代理经济
迄今为止,我最喜欢的基础设施领域之一是人工智能代理经济。它源自我对世界的愿景,在这个世界中,每个人都有自己的代理,我们雇用那些高质量和训练有素的代理为我们服务,或者让自治代理在复杂的经济行为中实现我们的目标。为了做到这一点,代理必须有一种方式来支付和接收他们的服务费用。传统的支付模式绝对有可能为这些代理开放,但更有可能的是,鉴于其易用性、结算速度和无需许可的性质,代理将以加密货币进行交易。
Autonolas 和 DAIN 是该领域的典型案例。在 Autonolas 中,代理实际上是网络中的节点,致力于实现特定目标,这些节点由服务运营商维护,类似于 Keeper 网络。这些代理可用于各种服务,例如预言机、预测市场、消息传递等。DAIN 采用了类似的方法,使代理能够 “发现、交互、交易和与网络中的其他代理协作”。 其他创意
除上述内容外,我们还看到:
用于微调模型(如 BagelDB)的去中心化向量数据库。
用于 API 密钥的钱包和用于 AI 应用程序的 SIWE,例如 Window.ai
数据预配服务
索引和搜索工具,如 Kaito
区块浏览器和仪表板,例如 Modulus Labs 的 AI 验证仪表板,它现在正在验证 Upshot 模型的一系列推理。
开发助手,如 Dune 的链上 SQL 查询模型
模拟代理测试环境
用于数据抓取的带宽,如 Grass Network
合成数据和人类 RLHF 平台
DeSci 应用程序,例如 LabDAO 用于蛋白质折叠的分布式 bioML 工具
web3 中涌现出了无数的想法,用于服务于 AI 的各个领域,因此此处仅提供重点内容,但我强烈建议探索上述项目以深入了解其全貌。 这一切的交汇
AI 和 Crypto 是协同作用的。两者都倾向于开源、抗审查,并正在创造历史上最大的财富转移。他们需要彼此,并解决彼此的核心挑战。
对于 Crypto 来说,AI 解决了用户体验中的问题,促进了更具创造性的链上用例,增强了去中心化组织和智能合约的能力,并在应用和基础设施层解锁了真正的创新。
对于 AI 来说,Crypto 解决了真实性和出处问题,加强了围绕开源模型和数据集的协调,有助于引导计算和数据,并使创作者和代理能够更直接地参与到后人工智能经济中去。
现在的挑战是加密黑客、团队和项目了解并接受这种转变。创造力是无限的,我们正站在这一切的交汇处。
如果你有兴趣了解更多关于这些交汇点的信息,请参加我们在 ETHDenver 举行的 Convergence 会议。
来源:金色财经