4E参展TOKEN2049大会 携多重活动庆一周年里程碑

全球领先的金融交易平台4E将于下周参展 2024年度的新加坡 TOKEN2049 大会。大会期间恰逢4E一周年,作为 TOKEN2049 铂金赞助商,4E除了在峰会现场设立专属展位和冰淇淋吧,还会推出一系列精彩的活动,为参会者带来更加轻松、丰富、互动的参会体验。

4E参展TOKEN2049大会 携多重活动庆一周年里程碑

作为区块链领域的年度盛事,TOKEN2049以其无与伦比的召集力与全球影响力,成为连接行业精英、深入了解行业动态和探索前沿趋势、促进全球合作的平台。今年,这场万众瞩目的盛会定于9月18日至19日在新加坡举办,在为期两天的主活动期间,预计将有数百场聚会、研讨会等,将吸引来自全球7,000多家企业、覆盖100多个国家的超过20,000名与会者,成为今年全球规模最大的Web3活动。

4E作为本次TOKEN2049盛会的铂金赞助商,是继成为阿根廷国家队的全球合作伙伴和WikiEXPO全球合作伙伴后,又一大对行业未来发展的深度参与和积极贡献,也彰显了4E在行业的影响力。

4E参展TOKEN2049大会 携多重活动庆一周年里程碑

自成立以来,4E便致力于为用户提供包括加密货币、外汇、大宗商品、股票和股指在内的交易服务。严格的安全措施、顶级的风控系统以及高达1亿美元的风险保护基金,为用户的资产安全筑起了坚不可摧的防线,赢得了业界的广泛赞誉与用户的高度信任。目前4E已收录600多种资产交易对,业务覆盖全球20多个国家和地区,注册用户超过120万。

TOKEN2049 作为行业盛事,4E将作为铂金会员和众多优秀项目共同出展。4E的独立展位在会场五层的P80&P83,届时将展示最新的技术和产品。

4E参展TOKEN2049大会 携多重活动庆一周年里程碑

4E展位(P80&P83,5层)

TOKEN2049峰会期间恰逢4E平台成立一周年之际。为了庆祝这一重要里程碑,除了在峰会现场设立专属展位和为参会者提供清凉享受的“冰淇淋吧”外,4E还会推出一系列精心策划的趣味活动,如4E寻宝、大会打卡集章等多种互动,参与者可获得AFA联名行李箱、AFA限量签名球衣、多用背包、高级调酒器等4E一周年独家大礼包和系列珍贵周边。

4E参展TOKEN2049大会 携多重活动庆一周年里程碑

此外,4E还专为TOKEN2049设置了专属交易活动,在峰会期间,新用户注册4E APP可获得10美元专属奖励,充值可得最高1400USDT周年大礼包,参与交易大赛还有机会赢取限量版梅西签名球衣

4E期待能与全世界各地的加密加密领域的企业家、机构、开发人员、行业爱好者等一起,多方共探行业未来,共推加密行业未来发展!

4E TOKEN2049专属活动链接:https://download.eeeedex.com/activity/2024/active46/activity1/index.html

当所有代币都玩再质押时会发生什么?

原文作者:

原文编译:深潮 TechFlow

当所有代币都玩再质押时会发生什么?

大家好,

好久没有和大家分享这些了。最近,我一直在思考再质押的未来,因为这是过去 18 个月来主导市场的主要话题。

为了简化讨论,我可能会在本文中提到 EigenLayer 或 AVS 来描述广义的再质押概念,但我将这个术语广泛用于涵盖所有再质押协议及其上构建的服务,而不仅限于 EigenLayer。

EigenLayer 和再质押的概念已经打开了潘多拉的盒子。

从概念上来说,扩展一种高度流动且全球可访问资产的经济安全性是非常有意义的。这使得开发者可以在链上创建应用程序,而无需为其项目专属的代币建立一个全新的生态系统。

当所有代币都玩再质押时会发生什么?

来源:EigenLayer 白皮书

以太坊 (ETH) 被视为一种优质资产,其前提在于:

1. 对于开发者来说,利用其经济安全性来构建产品是合理的,因为这不仅增强了安全性,降低了成本,还使产品能够专注于核心功能。

2. 为终端用户提供了更优质的产品体验。 然而,经过 18 个月的发展,自 EigenLayer 白皮书发布以来,再质押的格局已经发生了变化。

我们现在有了比特币再质押项目,如 Babylon,Solana 再质押项目,如 Solayer,以及多资产再质押项目,如 Karak 和 Symbiotic。甚至 EigenLayer 也开始支持无许可的 Token,允许任何 ERC-20 Token 无需许可地成为可再质押的资产。

当所有代币都玩再质押时会发生什么?

来源:EigenLayer 博客

市场已经表明:每个 Token 都将被再质押。

再质押的核心不再仅仅是扩展 ETH 的经济安全性,而是关于发行一种新的链上衍生品——再质押 Token(以及由此产生的流动性再质押 Token)。

此外,随着  等流动性质押解决方案的兴起,可以预见,再质押的未来将涵盖所有加密 Token,而不仅仅局限于 L1 资产。我们将看到 stARB 被再质押为 rstARB,然后进一步包装为 wrstARB。

那么,这对加密货币的未来意味着什么?当经济安全性能够从任何 Token 扩展时,又会发生什么?

再质押的供需动态

这是决定再质押未来的两个关键因素。

你可以写长篇帖子,深入探讨关于主观 Token 和人类协调的复杂问题,但这有点超出我的能力范围。如果某个再质押项目愿意给我一些顾问 Token,我会考虑撰写相关内容,不过,我有点跑题了。

在加密领域,始终存在两个不变的事实:

  1. 人们总是追求更高的收益

  2. 开发者总是想要创建更多的 Token

人们追求更高的收益

再质押协议在供应端拥有最佳的产品市场契合度 (PMF)。

从华尔街的前辈们身上,我们看到加密货币市场正迅速演变为一个不断追求更高风险的市场。举个例子?Polymarket 已经有了。我们都在走向极端。

再质押者通过 AVS(建立在再质押协议之上的服务)获得更多收益。在理想情况下,开发者会选择在再质押协议上构建项目,并通过激励措施吸引再质押者将他们的资产投入这些项目。为此,开发者可能会分享部分收入,或以其原生 Token 作为奖励给予再质押者。

让我们简单计算一下:

截至 2024 年 9 月 7 日,

  • 目前有价值 105 亿美元的 ETH 在 EigenLayer 上进行再质押。

  • 假设这些再质押的 ETH 大部分是流动性质押 Token (LSTs),它们已经在产生 4% 的年收益率 (APY),并希望通过再质押获得更多收益。

  • 如果要每年额外增加 1% 的 APY,EigenLayer 及其 AVS 需要创造 1.05 亿美元的价值。这还未考虑到削减和智能合约风险。

显而易见,如果再质押仅能带来额外的 1% APY,那么风险回报 (r/r) 实在不值得。我大胆地说,至少需要达到 8% 或更高,才能让资本配置者认为风险是值得的。这就意味着,再质押生态系统每年需要创造至少 4.2 亿美元的价值。

当所有代币都玩再质押时会发生什么?

来源:KelpDAO

目前,我们所看到的再质押带来的高收益主要是由即将推出的 EIGEN Token 以及流动性再质押协议的积分计划所推动的——与实际或预期收入相比,这些收益显得微不足道。

设想一下这样的情景:市场上有 3 个再质押协议, 10 个流动性再质押协议,以及超过 50 个 AVS。流动性将会被分散,开发者(此处指消费者)面对过多的选择会感到困惑,而不是对现有选择充满信心。我应该选择哪个再质押协议?我应该选择哪些资产来增强我项目的经济安全性?等等。

因此,我们要么需要大幅增加再质押的 ETH 数量,要么就需要加速发行原生 Token。

总之,再质押协议及其 AVS 需要通过大量发行其 Token 来保持供应方的活跃。

开发者希望创建 Token

在需求方面,再质押协议认为,开发者使用再质押资产来驱动他们的应用程序,比起使用自己发行的专用 Token 更加经济和安全。

尽管对于一些需要极高信任和安全性的应用程序(如桥接)来说,这可能成立,但实际上,发行自己的 Token 并将其作为激励机制,是任何加密项目成功的关键,无论是链还是应用程序。

将重新抵押的资产作为产品的附加功能可以带来额外的好处,但不应左右产品的核心价值主张,也不应设计得削弱自身 Token 的价值。一些人,如 Multicoin 的 Kyle,甚至持有更为强硬的立场,认为经济安全性根本不是推动产品增长的关键因素。

Integrated Kyle e/acc:“Multicoin 可能是全球最大的持有者,其按市值计算的 Token 可能有资格成为 AVS。

包括 Livepeer、Render、Helium、Hivemapper、Pyth、Wormhole、LayerZero。

还有一些其他 Token 尚未流通或尚未公布。

从来没有这些创始人,或我们 200 多个投资组合中的任何一位创始人,给我打电话说:“Kyle,我认为限制我们增长的主要因素之一是支持我们系统的加密经济安全性的流动性数量和质量。

一次也没有。”

当所有代币都玩再质押时会发生什么?

坦白说,很难反驳他的观点。

我在加密领域已经有 7 年,从未听过其他加密重度用户或行业朋友——那些将大部分净资产存储在链上的人——告诉我,他们选择某个产品而非另一个是因为其经济安全性。

从经济角度来看,M^ 0 的 Luca 写了一篇出色的文章,解释了由于市场效率低下,项目使用其本地 Token 可能比使用 ETH 更便宜。

Token 何时发行?说实话,无论这些 Token 是否实际算作证券,具有某种治理功能、效用、经济性或稀缺性声明的项目特定 Token 一直被投资者视为项目成功或知名度的象征。即使没有任何剩余的财务或控制权要求,这种市场情绪仍然存在。在加密这样的小行业中,Token 通常与叙事或预期的流动性变化更相关,而不是与现金流相关。无论我们怎么看,很明显且有据可查的是,在加密领域,股票代理市场远未达到效率,而高于理性水平的 Token 价格转化为项目低于理性预期的资本成本。较低的资本成本通常表现为风险投资轮次中的较低稀释,或相较于其他行业的更高估值。可以说,由于资本市场层级的市场效率低下,本地 Token 实际上比为开发者提供了更低的资本成本。

来源:

公正地说,EigenLayer 似乎预见到了这种情况,因此设计了双质押系统。现在,它的竞争对手甚至将支持多资产再质押作为营销的差异化卖点。

如果未来所有 Token 都会被再质押,那么再质押协议对开发者的真正价值是什么?

我认为答案在于保险和增强。

多资产再质押的未来将带来选择的多样化

如果项目希望改进产品并实现差异化,再质押将成为可整合的补充功能。

  • 保险:它提供了额外的保障,确保所提供的产品能够如宣传所述运作,因为有更多的资本在为其担保。

  • 增强:再质押协议的最佳策略是重塑整个叙事,并说服开发者在任何产品中默认包含再质押技术元素,因为这会让一切变得更好。 哦,你是一个容易受到价格操纵攻击的预言机?如果我们也是 AVS 呢?

最终用户是否关心这个问题仍有待观察。

所有的 Token 都将竞争成为首选的再质押资产,因为这赋予它们感知的价值并减少卖压。AVS 可以根据其风险偏好、激励机制、特定功能以及希望对齐的生态系统,选择多种类型的再质押资产。这不再仅仅是核心经济安全的问题,而是关于保险、再质押和政治。随着每个 Token 被再质押,AVS 将有很多选择。

  • 我应该选择哪些资产来确保经济安全,我想要什么样的政治对齐,以及哪个生态系统最适合我的产品?

最终,这个决定取决于什么能为我的产品提供最佳功能。就像应用程序在多个链上部署并最终成为应用链一样,AVS 将最终利用那些带来最大好处的资产和生态系统的经济安全,有时甚至会同时使用多个。

Jai 的这条推文很好地概括了大多数开发者对再质押优势的看法。

必须提到的是:我们已经看到一些项目,如 ,正在努力解决这种情况。

Jai Bhavnani:“Jito 今天宣布支持再质押。 现在我们有 Eigen、Karak、Jito、Symbiotic 等,可能还有更多。 我们要多久才能拥有一个聚合器,让 AVS 可以接入以获取最经济的安全保障? 并能根据成本在所有再质押平台之间主动进行重新平衡。”

当所有代币都玩再质押时会发生什么?

结论

加密推特倾向于用绝对的方式思考问题。实际上,再质押是一个有趣的基础工具,它扩展了开发者的选择,并通过发行一种新型衍生品影响链上市场,但这并不是革命性的变化。

至少,它允许风险偏好较高的加密资产持有者获得额外收益,同时扩展技术选择并减少开发者的工程负担。它为开发者提供了一个补充功能,并为链上资产持有者创造了一个新的衍生品市场。

许多资产将被再质押,这为开发者在整合再质押资产时提供了多种选择。最终,开发者在选择再质押资产生态系统时,将像选择新链进行部署时一样,选择最能为其产品带来最大好处的生态系统,有时甚至会选择多个。

Token 将会竞争成为再质押资产,因为再质押的资产所带来的新衍生品市场将使这些 Token 受益,提高它们的广泛使用性和感知价值。

这从来不关乎经济、安全,而是涉及保险、再质押和政治。

当所有代币都玩再质押时会发生什么?

苹果修复Vision Pro安全漏洞,该漏洞可能会暴露用户输入内容

编译/VR陀螺

据《连线》杂志消息,今年六位计算机科学家发现了一个与Apple Vision Pro相关的安全漏洞,该漏洞允许他们重建用户输入的信息,包括密码、PIN码和消息。

visionOS 虚拟键盘

当Apple Vision Pro用户使用虚拟Persona时(例如在FaceTime通话期间),研究人员可以通过分析Persona的眼睛移动或“注视”来确定用户在头显虚拟键盘上输入的内容。研究人员创建了一个网站,详细介绍了所谓的“GAZEploit”漏洞的技术细节。

简而言之,研究人员指出,用户在准备按下下一个键时,通常会将目光集中在相应的键上,这会暴露出一些常见的模式。他们声称能够以高达92%的准确率在五次猜测内确定用户输入的消息内容,而密码的准确率也达到了77%。

苹果修复Vision Pro安全漏洞,该漏洞可能会暴露用户输入内容

Persona 视觉漏洞

据报道,研究人员在今年4月向苹果披露了这一漏洞,该公司在7月发布的visionOS 1.3更新中修复了这个问题。此次更新在虚拟键盘激活时暂停了Persona的功能。

苹果在其visionOS 1.3的安全说明中于9月5日添加了如下条目:

  • 可用性:Apple Vision Pro
  • 影响:虚拟键盘的输入可能被Persona推断出来
  • 描述:通过在虚拟键盘激活时暂停Persona解决了该问题

CVE-2024-40865:

  • 佛罗里达大学的Hanqiu Wang
  • 德州理工大学的Zihao Zhan
  • Certik的Haoqi Shan
  • 佛罗里达大学的Siqi Dai
  • 佛罗里达大学的Max Panoff
  • 佛罗里达大学的Shuo Wang

据报告称,这一概念验证攻击尚未在被非法利用。尽管如此,鉴于研究结果已经公开,Vision Pro用户应立即更新头显至visionOS 1.3或更高版本以确保安全。

来源:

Kine Protocol 中秋盛宴开启 限量好礼最高可获300U

中秋,不仅是团圆的象征,也是感恩与分享的时刻。我们珍惜与您的每一次相遇,感谢您对我们品牌的厚爱与支持。为了表达我们的感激之情,Kine Protocol 特别策划了一系列中秋活动,期待与您赏月共欢。

活动时间: 2024年9月10日 00:00 – 9月18日 24:00(UTC+8)

活动方式: 所有用户均可参与,不仅可以参加抽奖领取中秋实物礼盒,还可以获得 $KINE 代币,充值和交易条件达标,即可获得高达300 USDT!打开 KINE APP点击公告了解详细内容。

奖品类别:中秋礼盒、USDT、$KINE等。

*中秋礼盒可选择寄送或兑换为等值USDT,具体以平台实际发放情况为准。

值此中秋佳节之际,愿圆圆的月饼带去我们深深的祝福,祝您中秋快乐,月圆人团圆!感谢您一直以来对我们的支持与信任,我们将继续努力,不断为您提供优质的产品与服务。目前 Kine Protocol 上线多个 TON 公链热门币种永续合约,包括 $TON、$NOT、$DOGS,以及计划上架的 $CATI以及 $HMSTR。中秋佳节,礼遇有你,让Kine Protocol 陪伴你赏月共欢,KINE To The Moon!

这一次 山寨牛真的来了

本周,比特币在完成二次探底后,逐渐企稳并反弹。尽管反弹过程依然十分曲折,但市场的赚钱效应却显著改善,这主要体现在两个方面:一、尽管比特币价格仍在58,000美元徘徊,市值排名前100的币种中已有30%的币种恢复至65,000美元时的价格水平;二、从9月5日到9月12日,山寨币的市场占有率从9.13%上升至9.8%,日成交量占比也从20.3%增至33.5%,行情呈现持续发酵的态势。此外,与以往反弹主要由MEME币主导不同,此次反弹的受益面更广,例如BIGTIME、PENDLE、AAVE、SUI、FEI等来自各个领域的币种近期也频繁出现在币安的涨幅榜上。历史经验表明,当资金从专注于绝对价值转向兼顾价格弹性时,这往往标志着市场风险偏好正处上升阶段。

从交易层面来看,资金的风险偏好提升与全球流动性的边际改善密切相关。随着美联储即将进入降息周期,全球资产定价之锚——美国十年期国债收益率自7月底以来已快速下降。与此同时,交易所的稳定币余额也在此期间显著增加,这表明一些先知先觉的投资者已经开始提前布局降息交易。根据CryptoQuant的数据统计,上一次交易所稳定币余额的大规模增长是在2024年3月,那时山寨币也出现了强劲的上涨,这与当下的情形颇有异曲同工之处。截至9月12日,美国十年期国债收益率已降至3.662%,创下自2023年6月以来的新低。根据联邦基金利率期货的定价,市场预期本轮降息周期的幅度为225个基点,因此美国十年期国债的收益率未来仍有下行空间。

这一次 山寨牛真的来了

这一次 山寨牛真的来了

当前,山寨币的反弹仍处于雨露均沾的阶段,几乎过去所有严重超跌的板块都有修复性反弹的机会。例如,持续阴跌了两年的NFT(蓝筹)板块,在过去一个月里地板价普遍上涨了15%-25%。而被市场认定已经慢性死亡的APECOIN本轮反弹也出现了接近翻倍的涨幅。然而,笔者认为这种普涨局面可能不会持续太长时间,市场有限的资金最终将流向那些基本面有所改善或行业仍在快速扩张的板块,比如DeFi老龙头、DePIN、RWA等。

8月份以来,尽管比特币价格持续震荡走弱,甚至一度逼近矿工关机价,但比特币网络的哈希率却持续保持创纪录的水平,这表明矿工仍继续加大硬件的投入,并对比特币的长期走势保持信心。例如,全球最大的矿业公司之一Marathon Digital自6月起便停止出售比特币,并在7月和8月连续增持了价值2.49亿美元的比特币。Marathon董事长兼首席执行官Fred Thiel表示,公司采取全面HODL策略是基于对比特币长期价值的坚定信念,旨在通过优化资产负债表为不可预见的市场波动提供安全垫。从Marathon在短短一个月内完成3亿美元的可转换票据来看,股东和债权人对公司的战略转型基本持支持态度。如果Marathon想效仿MicroStrategy,将公司股票的价值与比特币进行锚定,接下来想必还会进行多轮融资。

这一次 山寨牛真的来了

尽管矿工通常被视为市场的“强制卖家”,其收入的波动也会显著影响其出售比特币的意愿。通常情况下,如果矿工认为比特币的价格在某个时段内被高估,他们会倾向于出售更多比特币以获取更高的利润。而当比特币价格处于低估状态时,矿工则可能选择减少出售或暂时“捂盘”,等待价格回升。因此,普尔倍数(Puell Multiple),一种通过将比特币的每日发行价值(以美元计)除以过去365天的移动平均值来计算的指标,常被用来分析比特币周期变化。当普尔倍数低于0.5(绿色区域)时,表明价格可能处于低估状态,适合投资;而当倍数高于4(红色区域)时,表明价格可能被高估,是一个理想的获利时机。目前,比特币的普尔倍数为0.51,正处于低估的临界值,预示市场可能即将进入一个新的积累期。

这一次 山寨牛真的来了

操作上,随着中期底部构筑完成,市场逐渐进入温和复苏的阶段。虽然反弹行情没有出现旱地拔葱式的上涨,但恰恰是这种慢热的状态验证了上涨行情的可持续性。毕竟在存量的格局下,每一次多头情绪的集中爆发往往都是行情阶段性见顶的信号。因此,反复洗盘、稳健前进才是底部反弹最为理想的表现。只有保持耐心才能等来主升浪。

中国传统文化在Web3复兴的可能性

华人不如洋人吗?

香港Web3嘉年华现场大多数都是华人,讲座和活动也有大半以华语为主。其实从我入场的2013年开始,华人向来是区块链领域的重要参与力量,当年有烤猫和阿瓦隆矿机,有比特币中国、火币等等,国内在整个比特币的矿业和交易所方面占据半壁江山。今天,尽管矿业和交易所被封杀殆尽,但更多的华人开发者、资本方和投资者继续以各种形式参与这一浪潮,不甘落后。

但华人玩家经常自我贬低,“国人项目狗都不玩”,明明是国人的东西也要拉外国人来背书,或者干脆冒充外国人。

对华人项目的偏见似乎情有可原,因为华人项目方惯于割韭菜,坑人不少。但仔细想来,其实西方的“大割”也不少。当年有Mt.gox的法胖,有冒充中本聪的CSW,有连华尔街一起割的FTX的SBF……他们割韭菜可比华人老板们狠多了。同样是搞交易所的,华人里前有杨林科,后有赵长鹏,都是相对规矩体面的,同样是搞分叉,吴忌寒言行一致拿全副家当下注,也比CSW体面。哪怕是经常被人揶揄的“孙割”,其实也没有造过大孽,和那几位西方大割相比也只能自愧不如。

我当然也不是要倒转地图炮去轰击西方人,其实华人也好洋人也好,割韭菜的都不少,这是整个加密运动在这个初期阶段必须经历的现象。

区块链是一块蛮荒的新大陆,是数字世界中的“无主之地”。历史证明在探索和开发新大陆的早期阶段乱象迭起,偷盗横行,这是正常现象。所谓乱世出英雄,如果没有经历相对蛮荒的竞争,过早建立秩序,那么这种秩序恐怕还是旧秩序的简单延续。而要推倒重来,打破旧世界,建设新世界,混乱是必须经历的。

而在这个无主之地,早期能够迅速发家的往往都不是优雅的绅士,西方大航海时代最初开疆拓土的先驱也有很多是失意者、异端、流氓、海盗、罪犯等等。

区块链编年史

说到这里我又想重复一遍我的“新大陆编年史”。我认为从发现无主之地开始,新大陆的开拓可以分为如下五个阶段。

1.探索阶段

第一个阶段开始于哥伦布和中本聪,他们的壮举在于发现了新大陆——一个富饶的无主之地。这块大陆究竟能开拓成什么样子,他们并不清楚,但他们知道自己在努力摆脱旧秩序、探寻新出路。

2.拓荒阶段

当人们发现新大陆是全新的蛮荒之地,而不是富庶的东方时,有些人可能会失望,但另一些人可能更加兴奋。因为新大陆是未知的,存在太多不确定性。所以追求确定性的商人更偏爱走过好望角,继续传统的贸易方式。而敢于去新大陆拓荒的,往往在旧世界中并没有强硬的资源或背景,他们看重的与其说是新大陆的资源,不如说是“无主”的环境,使得冒险家们更容易白手起家。

所以这一阶段的新大陆是混乱无序、私掠横行的,当然秩序也开始自发地建立起来了。

这一阶段,淘金客和奇珍贸易是主流,冒险家们需要把财富带回旧大陆兑现,矿工、炒币客和传销者在这一时期很容易赚钱,简而言之,鉴于大多数人对新大陆过于陌生和恐惧,所以这一阶段谁胆子大谁就能发家致富。

3.殖民阶段

第三个是殖民阶段,当然这几个阶段之间是有交叉重叠的。拓荒阶段我指的是从蛮荒到秩序的初步建立,但开拓者们的世界观和价值观都还是以旧世界为中心的,新大陆的经济并没有自成体系,而是最终要到旧大陆去兑现。

但同时还有一批人试图在新大陆建立家园,把他们的生活重心放在新世界,包括他们一生中可能大部分时间都在新大陆活动,他们赚取的利益也可以越来越多地在新大陆内部兑现。这类人不再是冒险家,而是殖民者。

殖民者的动机有两类,一是商业利益驱动,在最初阶段过去之后,想在新大陆简单地拾取黄金或珍奇异宝已经不那么有利可图了,需要建立更加稳定和持久的商业模式,例如建立种植园或根据地,来提供稳定的产出。而这些根据地总需要有人来长期打理,这就需要一批甘愿在新大陆长期生活的移民。这一批人的价值观还是属于旧世界的,他们依附于东印度公司之类的大型机构,或者现在的华尔街等大型资本,为他们打工,帮助资本家攫取和管理新大陆的财富。但他们自己的生活和工作已经逐渐转移到新世界了,所以也会有在新大陆扎下根来的愿望。

还有一部分殖民者是由信仰驱动的,他们往往是在旧大陆的失意者,他们试图逃脱旧大陆败坏或固化的环境,怀抱理想信念来新世界建立自由家园。

就大航海时代而言,对应的就是耶稣会和清教徒,信奉天主教的耶稣会士因为在旧大陆感受到新教的威胁,难以打开局面,所以积极前往东方或新大陆传播教义;而清教徒反感天主教,认为英国圣公会的革新并不彻底,新教徒仍然饱受迫害,所以希望到新大陆建立理想家园。

最终天主教在南美洲取得了不小成果,而满载清教徒的五月花号则在北美洲扎下根来。

对应于区块链历史,我认为我们现在大致处于这个殖民阶段。一方面旧大陆的老钱们开始在新世界建立常驻机构,试图垄断新世界的利益产出;另一方面也有越来越多在旧大陆不满的人,怀着各式各样的理想信念投身于新大陆,试图在新世界建立精神家园。

4.独立革命

再之后就该独立革命了,随着新大陆上的殖民者的增多,和经济体系的丰满,越来越多的人不满足于做旧大陆老钱们的提款机,他们仍然愿意和旧大陆贸易,但是要求脱离旧大陆的控制,因此他们最终将以新的体制在新大陆建立独立的政体。美国的独立证明了独立革命是可能的,也是进步的。当然这一革命也并非必然成功,区块链的未来究竟是始终被控制在旧大陆的秩序之下,还是能够成功形成独立性,目前看还悬而未决,需要我们进一步努力。我希望“网络国家”一定会取代“民族国家”,成为独立的新秩序。

5.反攻旧大陆

新秩序建立之后,蒸蒸日上的新世界最终将会反超旧大陆,成为世界秩序的引领者。而另一方面,旧大陆的矛盾日益加剧,旧秩序自行崩塌,乃至于走向“世界大战”,而有赖于空间和体制的独立性,新世界在大战中独善其身并加速发展,最终反过来重新制定天下秩序,引领世界文化和经济。旧世界最终将会心甘情愿地把黄金运到新世界,把货币锚在新世界,就连观念和制度也向新世界看齐,这就是我理想中的“比特币本位”时代。

中国传统文化在Web3复兴的可能性

中国传统文化在Web3复兴的可能性

信仰

既然我们在这个对标“五月花号”的位置上,那么我今天要重点讨论的,就是我们可以有什么样的信仰。

我在“三重伟大的加密文艺复兴”一文中,就把“信仰”与思想和权力一道,视作人类社会的三重要素。

要注意信仰并不一定诉诸宗教,宗教只是承载信仰的一种形式。我这里谈的信仰是广义的,每个人或多或少都有一些信仰,每个社会或文化也都必然包含信仰的维度。

什么是信仰?简而言之,信仰是提供有超越性的意义寄托的东西。

追求“意义”是人类的特征,是“自由意志”的体现——如果说你的行为是出于自由意志,意思是你不是因为本能或盲从做出的,而是处于自己的权衡或筹划做出的行动。你做你觉得有意义的事情,这就是你自由的体现。

除了游戏的意义是内在的,许多行动的意义都要诉诸外部的事物,比如工作是为了赚钱,赚钱是为了买房,买房是为了结婚,结婚是为了生娃,等等。我们不断把自己的生命寄托到下一段生命之中。但所有人的寄托都会遭遇到一个绝望的极限,那就是生命的有限性——个人的生命是有限的,而且如此短暂。

想要完全不考虑任何超越性的追求而正常生活,个别人也许能做到,但人类社会作为整体不可能在完全排除超越性的前提下维系起来。事实上,超越有死性是人类文明的永恒主题,也是思想与技术的原动力。科学家们也许不相信天国或来世,但是把自己的姓名冠名给某个常数是大多数科学家都不会拒绝的最高荣耀。文学家和艺术家、匠人和工程师都希望自己的作品长留于世,而最普通的老百姓也经常把未来寄托于子女。

超越性的意义追求,是人类文明的共性;而具体以何种方式寄托超越性,则体现出人类文明的差异性,不同的时代和不同的文化有不同的追求方式。

那么到了如今这个信息时代,我们还能信仰什么?

现实的超越性

上面我说的超越性,指的是超越人类个体生命,但并不必然要求超越人类群体乃至整个现实世界。但是西方文化中,提供超越性意义寄托的东西,往往也是超越性的存在,后一个“超越”指的是超越于现实世界、超越于实际经验的东西。彼岸世界、末日审判、灵魂转世、六道轮回……西方和印度的宗教提供的就是这些超越性存在,以满足人们对超越性意义的追求。

但还有一些承载超越性追求的东西本身是现实的,例如真善美、尊严、公义、身后名等等。

所谓“生命诚可贵,爱情价更高,若为自由故,二者皆可抛”,这句诗讲的就是两种超越于个体生命的意义寄托:爱情和自由。孟子讲“舍生而取义”也是如此。还有科学家为了优先权和冠名权争夺,也是一种“身后名”。仁人志士还有云“人生自古谁无死,留取丹心照汗青”,就是把史书当作超越性意义的承载者了。

这类在现实世界中寄托超越性追求的方式,东西方社会都存在,但是在中国传统文化中更加显著。

总之,超越个体自我有限性的方式,都是要把狭义的自我扩展到更高层次的自我那里去,在西方宗教那里,这个超越性的自我是不朽的灵魂,是超验世界中的我的本体。而在中国文化中,自我超越的方向是“己身→天下”,归根结底是留下我印记的这个现实世界被视作我个体生命的延续。

中国传统文化在Web3复兴的可能性

中国传统文化在Web3复兴的可能性

未完待续…

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

BlockBeats 在今日更新的《》中提到了 meme 币$abcde,其上线不到一个月涨幅超 50 倍,近四天涨幅达 3 倍,最高市值 340 万美元。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

abcde 是一个以字母「abcdefghijkmnopqrstuvwxyz」命名的 memecoin 项目。一般来说,能够在近一个月的周期里保持上涨趋势的 meme 币比较难得,要么是靠所属叙事热度、要么靠不断凝聚的社区文化,abcde 属于后者。在 24 小时涨幅近 80% 后,abcde 得到了更多的关注,之后未必能继续保持上涨走势。但从运营角度看,abcde 的运营方式对社区寻找下一个 alpha meme 具有参考意义。

运营服务器、卖周边、捐水井

abcde 项目方运营着一个 Minecraft 服务器 abcde craft,并为这个服务器开通了官方推特账号。据称到 8 月 30 日,其运营状态已经扭亏为盈,收入 100 美元。截至撰稿时,这个 abcde craft 的 discord 社区中有 171 位成员,目前还正在举行奖池为 10 万美元的赛季活动。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

根据 abcde 的介绍,其终极目标是通过旗下产品线(包括 Minecraft、Roblox 等游戏服务器)的收益,逐步减少代币供应,计划未来可能还会增加 CS Surfing 和 Rust 等服务器。

除了游戏服务器,abcde 官方还表示将涉足 3D 模型、漫画书、周边产品、A-Z 学习卡等多种盈利渠道。比如 9 月 2 日,ABCDE 上线了商品售卖渠道,售卖从背包、帽子、卫衣到鼠标垫、水杯等一系列 abcde 周边产品。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

这些「业务」主要是向持有者展示项目方回购代币的资金来源,除此之外,abcde 还推进了慈善工作,与比特币曼德拉基金会合作在尼日利亚的一个村庄捐了一口水井,为当地居民提供了未来 30 年的饮用水。在文档中,abcde 还表示将在未来继续实现翻修学校、赞助运动队等慈善举措。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

继 Vitalik 在上个月卖出了当时持仓的所有 meme 币并将收益捐给慈善事业后,做慈善也成为了各种 meme 币团队在近期爱用的一个运营方式。

持仓筹码及团队背景

abcde 团队称上线时销毁了 7.2% 的代币,并直接在文档中标明了前 2 位持有者,表示其中一位已经通过 Lockedsupply.fyi(Coinbase 支持的锁定协议)锁定代币。abcde 项目方还宣布将基于产品收入对代币进行每 120 天进行一次回购销毁。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

根据 gmgn 和 Dexcreener 数据显示,abcde 的前 70 买家中已有 61 个交易者全部卖出,当前持仓份额为 0.96% 。目前频繁买入的大户地址为 AyXeD…Emh 和 7 QpAx…dya。二者均为 abcde 的早期买家,在早期入场获利后快速退出,之后分批加仓。昨日 abcde 24 小时拉升 80% 之前,这两个地址也都各有两笔加仓操作。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

除了运营之外,abcde 能够维持热度的最重要原因在于有数个 KOL 为其喊单,9 月初,粉丝量为 13K 的 @dillyxcooks、15K 的 @beaverd 和 142K 的 @orangie 都发表了关于 abcde 的推文。

BlockBeats 从这些喊单者的 KOL 互动区发现了 abcde 开发者 divine farmer(@shouldIgothere)的身影,在这些 KOL 发布相关推文之前几天,divine farmer 多次在他们的评论区推荐 abcde,并希望加入 @orangie 的社群。

探秘Meme币运营新方式:卖周边+游戏服务器,1个月涨幅50倍

另外,divine farmer 在推出 abcde 之前还曾是 meme 币 mog 和 wojak 的忠实社区成员,曾频繁发布相关内容并与 meme 社区进行互动,这也在一定程度上为其运营 abcde 项目奠定了不错的「路人缘」。

BA Labs提议Sky逐步投票剥离wBTC抵押资产敞口

9月13日消息,根据周四的一篇治理文章,MakerDAO重塑品牌Sky将投票决定从其生态系统中完全移除wBTC,这可能是DeFi的一个重大发展,因为该平台拥有2亿美元的wBTC抵押贷款。 DeFi风险管理公司BA Labs是Sky协议治理中颇具影响力的人物,此前该公司曾提议减少对wBTC的投资,原因是Tron创始人Justin Sun参与基础资产托管人的工作被认为存在风险。 周四,BA Labs提议分五步逐步剥离所有wBTC的抵押资产敞口,第一步从9月26日开始。每一步都将被投票决定。“我们发现,法律尽职调查无法提供足够的保证,”BA Labs在其提案中表示。

如何在 AO 上打造 AI 应用?

来源:PermaDAO

AO 是为链上 AI 设计的异步通信网络,通过与 Arweave 的结合,实现高性能链下计算和永久数据存储。文章介绍了在 AO 上运行 AI 进程的步骤,尽管目前仅支持小型模型,但未来将支持更复杂的计算能力,AI 在链上的发展前景广阔。

什么是 AO 上的 AI?

AO 天生就是为链上 AI 设计的

2023 年被称为 AI 的元年,各种大模型以及 AI 的应用层出不穷。Web3 的世界中,AI 的发展也是关键的一环。但是一直以来,“区块链不可能三角”让区块链的计算一直处于昂贵、拥堵的状态,阻碍了 AI 在 Web 3 上的发展。但是现在这种情况在 AO 上已经得到了初步改善,并且展现了无限的潜力。

AO 被设计为一个消息驱动的异步通信网络。基于存储共识范式(SCP),AO 运行在 Arweave 之上,实现了与 Arweave 的无缝集成。在这种创新的范式中,存储(共识)与计算被有效地分离,使得链下计算和链上共识成为可能。

  • 高性能计算:智能合约的计算在链下执行,不再受制于链上的区块共识过程,从而大大扩展了计算性能。不同节点上的各个进程可以独立地执行并行计算和本地验证,而无需像传统的 EVM 架构中那样等待所有节点完成重复计算和全局一致性验证。Arweave 为 AO 提供了所有指令、中间状态和计算结果的永久存储,作为 AO 的数据可用层和共识层。因此,高性能计算(包括使用 GPU 进行运算)都成为了可能。

  • 永存的数据:这是 Arweave 一直以来所致力于做的事情。我们知道 AI 的训练中很关键的一个环节就是训练数据的收集,而这正好是 Arweave 的强项。至少 200 年时间的数据永存,让 AO + Arweave 的生态中拥有了丰富的数据集。

此外,AO 和 Arweave 的创始人 Sam 在今年 6 月的一次发布会上演示了第一个基于 aos-llama 的 AI 进程。为了保证性能,并没有使用之前一直使用的 Lua,而是使用了 C 编译的 wasm。

使用的模型是 huggingface 上开源的 llama 2。可以在 Arweave 上下载模型,是一个约 2.2GB 的模型文件。

Llama land

Llama Land 是一款前沿的大型多人在线(MMO)游戏,它以 AI 技术为核心,构建于先进的 AO 平台之上。也是在 AO + Arweave 生态上的首个 AI 应用。其中最主要的特征就是 llama coin 的发行,是 100% AI 控制的,也就是用户跟 Llama king 祈愿,得到 Llama king 赏赐的 llama coin。另外,地图中的 Llama Joker、Llama oracle 也都是基于 AI 进程完成的 NPC。

如何在 AO 上打造 AI 应用?

那么接下来我们看看如何自己在 AO 上跑一个 AI 进程。

AI Demo

1. 整体介绍

我们是利用 Sam 已经在 AO 上部署好的 AI 服务来实现我们自己 AI 应用。Sam 部署的 AI 服务由两部分组成:llama-herd、llama-worker(多个 llama-worker)。其中 llama-herd 负责 AI 任务的分派,AI 任务的定价。llama-worker 则是真正跑大模型的进程。然后,我们的 AI 应用是通过请求 llama-herd 来实现 AI 能力的,在请求的同时也会需要支付一定的 wAR。

注意:或许你会疑惑,我们为什么不自己跑 llama-worker 来实现自己的 AI 应用呢?因为 AI 的 module 在实例化为进程的时候,需要 15GB 的内存,我们自己实例化会出现内存不足的报错。

2. 创建进程并充值 wAR

首先,我们需要创建进程,并尽量把进程都升级到最新版本,再进行后续的操作。可以避免一些错误,节约很多时间。

如何在 AO 上打造 AI 应用?

运行 AI 进程需要耗费少量的 wAR。通过 arconnect 转成功以后,会在进程中看到 Action = Credit-Notice 的一条消息。执行一次 AI 需要消耗 wAR,但是消耗的并不多,作为 demo 之用的话,向进程转 0.001 wAR 即可。

注意:wAR 可以通过 AOX 跨链桥获取,跨链需要 3 ~ 30 分钟。

如何在 AO 上打造 AI 应用?

可以通过以下命令查看当前进程中 wAR 的余额。下面是我执行了 5 次左右还剩下的 wAR。消耗的数量跟 token 的长度以及当前运行一次大模型的实时价格有关系。另外,如果当前请求处于拥堵状态,那么也会需要一个额外的费用。(在文章最后,我会根据代码详细解析下费用计算,感兴趣的小伙伴可以看看)

注意:这里小数点为 12 位,也就是说 999999673 表示的是 0.000999999673 个 wAR。

如何在 AO 上打造 AI 应用?

3. 安装/更新 APM

如何在 AO 上打造 AI 应用?

APM 全称为 ao package management,构建 AI 进程的话,需要通过 APM 安装对应的包。执行上述命令,出现对应的提示,就是安装/更新 APM 成功了。

4. 安装 Llama Herder

如何在 AO 上打造 AI 应用?

执行完成以后,在进程内会有一个 Llama 对象,可以通过输入 Llama 进行访问,那么  Llama Herder 就是安装成功了。

如何在 AO 上打造 AI 应用?

注意:这里如果运行的进程中没有足够的 wAR 则 Llama.run 方法是无法执行的,会出现 Transfer Error。需要按照第一步充值 wAR。

5. Hello Llama

接下来我们做一个简单的交互。问一下 AI 进程“生命的意义是什么?”,限定了最多生成 20 个 token。然后把结果放到 OUTPUTS 中。AI 进程的执行需要几分钟的时间,如果有 AI 任务排队的话,则需要等待更久。

如下面代码中的返回,AI 回复“生命的意义是一个深刻而哲学的问题,一直吸引着人类。”

如何在 AO 上打造 AI 应用?

注意:这里如果运行的进程中没有足够的 wAR 则 Llama.run 方法是无法执行的,会出现 Transfer Error。需要按照第一步充值 wAR。

6. 做一个 Llama Joker

更加深入一步,我们来看下 Llama Joker 的实现。(由于篇幅有限,仅展示 AI 相关的核心代码。)

构建一个 Llama Joker 其实相当简单,与你在 Web 2 的 AI 应用中构建一个聊天机器人类似。

  • 首先,用 <|system|> / <|user|> / <|assistant|> 在构建的 Prompt 中区分不同角色。

  • 其次,确定好固定的提示语部分。Llama Joker 的例子中就是 <|system|> 的内容 “Tell a joke on the given topic”。

  • 最后,构建 Llama Joker Npc 与用户进行交互。但是这里为了篇幅,直接定义了变量 local userContent = “cats”。说明了用户想听一个与猫咪相关的笑话。

是不是 so easy 呢。

如何在 AO 上打造 AI 应用?

如何在 AO 上打造 AI 应用?

更多

在链上实现 AI 的能力,在之前是无法想象的东西。现在已经可以在 AO 上,基于 AI 实现了完成度较高的应用,其前景让人期待,也给与了大家无限的想象空间。

但是就目前而言,局限也是比较明显的。目前只能支持 2 GB 左右的“小语言模型”,尚不能利用 GPU 进行运算等。不过值得庆幸的是,AO 的架构设计中也都对这些短板有着对应解决方案。例如,编译一个可以利用 GPU 的 wasm 虚拟机。

期待在不久的将来,AI 可以在 AO 的链上,开放出更加绚烂的花朵。

附录

前面留下的一个坑,一起看下 Llama AI 的费用计算。

下面是初始化好以后的 Llama 对象,分别对重要的对象给出一个我的理解。

  1. M.herder: 存储了 Llama Herder 服务的标识符或地址。

  2. M.token: 用于支付 AI 服务的 token。

  3. M.feeBase: 基础费用,用于计算总费用的基础值。

  4. M.feeToken: 每个 token 对应的费用,用于根据请求中的 token 数量计算额外费用。

  5. M.lastMultiplier: 上一次交易费用的乘数因子,可能用于调整当前费用。

  6. M.queueLength: 当前请求队列的长度,影响费用计算。

  7. M.feeBump: 费用增长因子,默认设置为 1.005,意味着每次增加 0.5%。

如何在 AO 上打造 AI 应用?

  • M.feeBase 初始值为 0。

  • 通过 M.getPrices 函数向 Llama Herder 请求最新价格信息。

  • 其中 M.feeBase、feeToken、M.lastMultiplier、M.queueLength 都是向 M.herder 请求,并接收到 Info-Response 消息后,实时变动的。确保了总是保持最新的价格相关的字段值。

计算费用的具体步骤:

  1. 根据 M.feeBase 加上 feeToken 与 token 数量的乘积,得到一个初始的费用。

  2. 在初始费用的基础上,再乘以 M.lastMultiplier。

  3. 最后,如果存在请求排队的情况,会再乘以 M.feeBump,也就是 1.005 得到最后的费用。

引用链接

1. Arweave 上的模型地址:

https://arweave.net/ISrbGzQot05rs_HKC08O_SmkipYQnqgB1yC3mjZZeEo

2. aos llama 源码:

https://github.com/samcamwilliams/aos-llama

3. AOX 跨链桥:

https://aox.arweave.dev/

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

来源:机器之心

大语言模型还能向上突破,OpenAI 再次证明了自己的实力。

北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览版 ——o1-preview。除了 o1,OpenAI 还展示了目前正在开发的下次更新的评估。

o1 模型一举创造了很多历史记录。

首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

其次,o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年AlphaGo 强化学习的成功 —— 给越多算力,就输出越多智能,一直到超越人类水平。

也就是从方法上,o1 大模型首次证明了语言模型可以进行真正的强化学习。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

开发出首个 AI 软件工程师 Devin 的 Cognition AI 表示,过去几周一直与 OpenAI 密切合作,使用 Devin 评估 o1 的推理能力。结果发现, 与 GPT-4o 相比,o1 系列模型对于处理代码的智能体系统来说是一个重大进步。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

最后在实践中,o1 上线之后,现在 ChatGPT 可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2,ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错)进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

从今天 ChatGPT 的用户体验来看,这是向前迈进一小步。在简单的 Prompt 下,用户可能不会注意到太大的差异,但如果问一些棘手的数学或者代码问题,区别就开始明显了。更重要的是,未来发展的道路已经开始显现。

总而言之,今晚 OpenAI 丢出的这个重磅炸弹,已经让整个 AI 社区震撼,纷纷表示 tql、睡不着觉,深夜已经开始抓紧学习。接下来,就让我们看下 OpenAI o1 大模型的技术细节。

OpenAI o1 工作原理

在技术博客《Learning to Reason with LLMs》中,OpenAI 对 o1 系列语言模型做了详细的技术介绍。

OpenAI o1 是经过强化学习训练来执行复杂推理任务的新型语言模型。特点就是,o1 在回答之前会思考 —— 它可以在响应用户之前产生一个很长的内部思维链

也就是该模型在作出反应之前,需要像人类一样,花更多时间思考问题。通过训练,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。

在 OpenAI 的测试中,该系列后续更新的模型在物理、化学和生物学这些具有挑战性的基准任务上的表现与博士生相似。OpenAI 还发现它在数学和编码方面表现出色。

在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。

模型的编码能力也在比赛中得到了评估,在 Codeforces 比赛中排名 89%。

OpenAI 表示,作为早期模型,它还不具备 ChatGPT 的许多实用功能,例如浏览网页获取信息以及上传文件和图片。

但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI 将计数器重置为 1,并将该系列模型命名为 OpenAI o1。

重点在于,OpenAI 的大规模强化学习算法,教会模型如何在数据高度有效的训练过程中利用其思想链进行高效思考。换言之,类似于强化学习的 Scaling Law。

OpenAI 发现,随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同,OpenAI 也还在继续研究。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

评估

为了突出相对于 GPT-4o 的推理性能改进,OpenAI 在一系列不同的人类考试和机器学习基准测试中测试了 o1 模型。实验结果表明,在绝大多数推理任务中,o1 的表现明显优于 GPT-4o。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

o1 在具有挑战性的推理基准上比 GPT-4o 有了很大的改进。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

o1 在广泛的基准测试上比 GPT-4o 有所改进,包括 54/57 MMLU 子类别,图示出了 7 个以供说明。

在许多推理密集型基准测试中,o1 的表现可与人类专家相媲美。最近的前沿模型在 MATH 和 GSM8K 上表现得非常好,以至于这些基准测试在区分模型方面不再有效。因此,OpenAI 在 AIME 上评估了数学成绩,这是一项旨在测试美国最聪明高中数学学生的考试。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

‍在一个官方演示中,o1-preview 解答了一个非常困难的推理问题:当公主的年龄是王子的两倍时,公主的年龄与王子一样大,而公主的年龄是他们现在年龄总和的一半。王子和公主的年龄是多少?提供这个问题的所有解。

在 2024 年 AIME 考试中,GPT-4o 平均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全美前 500 名,并且高于美国数学奥林匹克竞赛分数线。

OpenAI 还在 GPQA Diamond 基准上评估了 o1,这是一个困难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。

实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做到这一点的模型

这些结果并不意味着 o1 在所有方面都比博士更有能力 —— 只是该模型更擅长解决一些博士应该解决的问题。在其他几个 ML 基准测试中,o1 实现了新的 SOTA。

启用视觉感知能力后,o1 在 MMMU 基准上得分为 78.2%,成为第一个与人类专家相当的模型。o1 还在 57 个 MMLU 子类别中的 54 个上优于 GPT-4o。

思维链(CoT)

与人类在回答难题之前会长时间思考类似,o1 在尝试解决问题时会使用思维链。通过强化学习,o1 学会磨练其思维链并改进其使用的策略。o1 学会了识别和纠正错误,并可以将棘手的步骤分解为更简单的步骤。o1 还学会了在当前方法不起作用时尝试不同的方法。这个过程极大地提高了模型的推理能力。

编程能力

基于 o1 进行了初始化并进一步训练了其编程技能后,OpenAI 训练得到了一个非常强大的编程模型(o1-ioi)。该模型在 2024 年国际信息学奥林匹克竞赛(IOI)赛题上得到了 213 分,达到了排名前 49% 的水平。并且该模型参与竞赛的条件与 2024 IOI 的人类参赛者一样:需要在 10 个小时内解答 6 个高难度算法问题,并且每个问题仅能提交 50 次答案。

针对每个问题,这个经过专门训练的 o1 模型会采样许多候选答案,然后基于一个测试时选取策略提交其中 50 个答案。选取标准包括在 IOI 公共测试案例、模型生成的测试案例以及一个学习得到的评分函数上的性能。

研究表明,这个策略是有效的。因为如果直接随机提交一个答案,则平均得分仅有 156。这说明在该竞赛条件下,这个策略至少值 60 分。

OpenAI 发现,如果放宽提交限制条件,则模型性能更是能大幅提升。如果每个问题允许提交 1 万次答案,即使不使用上述测试时选取策略,该模型也能得到 362.14 分——可以得金牌了。

最后,OpenAI 模拟了 Codeforces 主办的竞争性编程竞赛,以展示该模型的编码技能。采用的评估与竞赛规则非常接近,允许提交 10 份代码。GPT-4o 的 Elo 评分为 808,在人类竞争对手中处于前 11% 的水平。该模型远远超过了 GPT-4o 和 o1——它的 Elo 评分为 1807,表现优于 93% 的竞争对手。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

在编程竞赛上进一步微调使得 o1 能力又增,并在 2024 年国际信息学奥林匹克竞赛(IOI)规则下排名前 49%。

下面这个官方示例直观地展示了 o1-preview 的编程能力:一段提示词就让其写出了一个完整可运行的游戏。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

人类偏好评估

除了考试和学术基准之外,OpenAI 还在更多领域的具有挑战性的开放式提示上评估了人类对 o1-preview 和 GPT-4o 的偏好。

在这次评估中,人类训练者对 o1-preview 和 GPT-4o 的提示进行匿名回答,并投票选出他们更喜欢的回答。在数据分析、编程和数学等推理能力较强的类别中,o1-preview 的受欢迎程度远远高于 GPT-4o。然而,o1-preview 在某些自然语言任务上并不受欢迎,这表明它并不适合所有用例。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

在需要更强大推理能力的领域,人们更青睐 o1-preview。

安全

思维链(CoT)推理为安全和对齐提供了新的思路。OpenAI 发现,将模型行为策略整合到推理模型的思维链中,可以高效、稳健地教导人类价值观和原则。通过向模型教导自己的安全规则以及如何在上下文中推理它们,OpenAI 发现推理能力直接有利于模型稳健性的证据:o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。

OpenAI 认为,使用思维链可以为安全和对齐带来重大进步,因为 1)它能够以清晰的方式观察模型思维,并且 2)关于安全规则的模型推理对于分布外场景更具稳健性。

为了对自己的改进进行压力测试, OpenAI 在部署之前根据自己的安全准备框架进行了一系列安全测试和红队测试。结果发现,思维链推理有助于在整个评估过程中提高能力。尤其值得注意的是,OpenAI 观察到了有趣的奖励黑客攻击实例。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

安全准备框架链接:https://openai.com/safety/

隐藏思维链

OpenAI 认为隐藏思维链为监控模型提供了独特的机会。假设它是忠实且清晰的,隐藏思维链使得能够「读懂」模型的思想并了解其思维过程。例如,人们将来可能希望监控思维链以寻找操控用户的迹象。

但要做到这一点,模型必须能够自由地以未改变的形式表达其思想,因此不能在思维链方面训练进行任何政策合规性或用户偏好性训练。OpenAI 也不想让用户直接看到不一致的思维链。

因此,在权衡用户体验、竞争优势和追求思维链监控的选项等多种因素后,OpenAI 决定不向用户展示原始的思维链。OpenAI 承认这个决定有不好的地方,因此努力通过教导模型在答案中重现思维链中的任何有用想法来部分弥补。同时,对于 o1 模型系列,OpenAI 展示了模型生成的思维链摘要。

可以说,o1 显著提升了 AI 推理的最新水平。OpenAI 计划在不断迭代的过程中发布此模型的改进版本,并期望这些新的推理能力将提高将模型与人类价值观和原则相结合的能力。OpenAI 相信 o1 及其后续产品将在科学、编程、数学和相关领域为 AI 解锁更多新用例。

OpenAI o1-mini

o1 是一个系列模型。这次 OpenAI 还一并发布了一个 mini 版 OpenAI o1-mini。该公司在博客中给出了 preview 和 mini 版的不同定义:「为了给开发者提供更高效的解决方案,我们也发布了 OpenAI o1-mini,这是一个尤其擅长编程的更快、更便宜的推理模型。」整体来看,o1-mini 的成本比 o1-preview 低 80%。

由于 o1 等大型语言模型是在大量文本数据集上预训练,虽然具有广泛世界知识,但对于实际应用来说,可能成本高昂且速度慢。

相比之下,o1-mini 是一个较小的模型,在预训练期间针对 STEM 推理进行了优化。在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后, o1-mini 在许多有用的推理任务上实现了相媲美的性能,同时成本效率显著提高。

比如在需要智能和推理的基准测试中,与 o1-preview 和 o1 相比,o1-mini 表现良好。但它在需要非 STEM 事实知识的任务上表现较差。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

数学能力:在高中 AIME 数学竞赛中,o1-mini (70.0%) 与 o1 (74.4%) 不相上下,但价格却便宜很多,并且优于 o1-preview (44.6%)。o1-mini 的得分(约 11/15 个问题)大约位于美国前 500 名高中生之列。

编码能力:在 Codeforces 竞赛网站上,o1-mini 的 Elo 得分为 1650,与 o1 (1673) 不相上下,并且高于 o1-preview (1258)。此外,o1-mini 在 HumanEval 编码基准和高中网络安全夺旗挑战 (CTF) 中也表现出色。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

STEM:在一些需要推理的学术基准上,例如 GPQA(科学)和 MATH-500,o1-mini 的表现优于 GPT-4o。o1-mini 在 MMLU 等任务上的表现则不如 GPT-4o,并且由于缺乏广泛的世界知识而在 GPQA 基准上落后于 o1-preview。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

人类偏好评估:OpenAI 让人类评分员在各个领域具有挑战性的开放式提示上比较 o1-mini 和 GPT-4o。与 o1-preview 类似,在推理密集型领域,o1-mini 比 GPT-4o 更受欢迎;但在以语言为中心的领域,o1-mini 并不比 GPT-4o 更受欢迎。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

在速度层面,OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示,GPT-4o 回答不正确,而 o1-mini 和 o1-preview 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

如何使用 OpenAI o1?

ChatGPT Plus 和 Team(个人付费版与团队版)用户马上就可以在该公司的聊天机器人产品 ChatGPT 中开始使用 o1 模型了。你可以手动选取使用 o1-preview 或 o1-mini。不过,用户的使用量有限。

目前,每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

是的,很少!不过 OpenAI 表示正在努力提升用户的可使用次数,并让 ChatGPT 能自动针对给定提示词选择使用合适的模型。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

至于企业版和教育版用户,要到下周才能开始使用这两个模型。

至于通过 API 访问的用户,OpenAI 表示达到了 5 级 API 使用量的开发者可以即刻开始使用这两个模型开始开发应用原型,但同样也被限了速:20 RPM。什么是 5 级 API 使用量?简单来说,就是已经消费了 1000 美元以上并且已经是超过 1 个月的付费用户。请看下图:

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

OpenAI 表示对这两个模型的 API 调用并不包含函数调用、流式传输(streaming)、系统支持消息等功能。同样,OpenAI 表示正在努力提升这些限制。

未来

OpenAI 表示,未来除了模型更新之外,还将增加网络浏览、文件和图像上传等功能,以让这些模型变得更加有用。

「除了新的 o1 系列模型,我们计划继续开发和发布我们的 GPT 系列模型。」

参考内容:

https://openai.com/index/introducing-openai-o1-preview/

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

https://openai.com/index/learning-to-reason-with-llms/

https://x.com/sama/status/1834283100639297910