Binance Square

RC池以恒

insiders.bot 创始人, 15岁入圈, 0xU协会前主席, 宾夕法尼亚大学链协成员, 前City Protocol创始成员, 推特:@MrRyanChi
Odprto trgovanje
Občasni trgovalec
4.2 let
4 Sledite
22 Sledilci
2 Všečkano
0 Deljeno
Objave
Portfelj
·
--
Članek
预测市场交易员的数学101原文作者: Roan (@RohOnChain) 翻译、注释与改写: @MrRyanChi 原文链接:https://x.com/RohOnChain/status/2028489070394171427 序言:为什么你一定要读这一篇文章 在过去半年,不论为了是创立 insiders.bot, 还是在 Polymarket,Predict.fun,和 Opinion Labs 上进行预测市场投资,我都和大量的预测市场交易员有过很深度的交流,自己也在交易上踩过各式各样的坑。 在这个过程中,一个很直观的感受是:在 Polymarket 上真正持续赚钱的人,靠的从来不是”消息灵通”或者”感觉准”。他们靠的是一套对概率、风险和市场微观结构的数学直觉——而这套直觉,是可以学的。 Roan 这篇文章做了一件我在中英文社区都很少见到的事:他把 MIT 金融数学课里的每一个核心概念,拆开来,一个一个对应到 Polymarket 的真实交易场景里。不是”这个理论很重要你去学吧”,而是”这个公式,对应的就是你昨天下单时犯的那个错误”。 我自己是一个数学生,虽然大学的时候就为了做项目,放弃了帝国理工数学系的Offer,直接“弃数从商”了。即便如此,作为打过几次IMO,在AMC也算是名列前茅的前数学生,我觉得这篇文章真的很精妙。 如果你想认真做预测市场,而不只是凭感觉赌大小,这篇值得你花一个下午读完。 考虑到文章非常非常技术性,我和我的agent一起,做了大量改写和添加。数年前,我还在靠补习赚零花钱的时候,就教出过几个IBDP高级数学满分的学生,运用当时的习惯,我会针对一些专业术语以及公式的背景和使用方法进行进一步补充,让它更好理解,对你的实际交易更有帮助。 这篇文章的来历 先说说作者 Roan 是谁。他是一个专注系统设计、高频执行和量化交易系统的后端开发者,日常工作就是研究预测市场在高负载下的真实行为——说白了,就是研究当大量订单同时涌入时,市场到底会怎么反应。 事情的起因是他看到 @GoshawkTrades 发了一篇帖子,说”40 小时的免费课程,顶一个量化交易学位”,列了 MIT、耶鲁、牛津、哥伦比亚四所大学的公开课。 Roan 看完之后做了一个决定:不再把这些课程当”收藏夹里吃灰的东西”。他清了几天时间,拿出笔和本子,从头到尾看完了 MIT 的金融数学课程——YouTube 上免费的 20 多个小时 [1]。不跳、不倍速、不懂就倒回去重看。 他说,看完之后,再看 Polymarket 上的每一个价格、每一笔订单、每一个买卖价差,感觉完全不一样了。 这篇文章就是他的学习笔记。但不是那种”第一讲讲了什么、第二讲讲了什么”的流水账,而是把每个数学概念翻译成了你在 Polymarket 上能直接用的语言。 第一章:线性代数——你以为你分散了风险,其实没有 “线性代数”这四个字,大多数人听到就想跑。 别跑。这一章可能会改变你看自己持仓的方式。 矩阵不只是一张表格 MIT 课程上来就讲了一个很关键的区分:矩阵有两种理解方式。 第一种,你已经很熟了——矩阵就是一张表格。行是日期,列是不同的合约,格子里填的是价格。Excel 里天天见。 第二种,才是真正有用的——矩阵是一个变换器。它能把一组数据从一个”视角”映射到另一个”视角”。 这什么意思? 打个比方。你在 Polymarket 上同时持有 40 个 YES 合约。如果你只用”表格思维”去看,你看到的是:“我在这 40 个市场各买了多少”。 但如果你用”变换思维”去看,你看到的是一个完全不同的东西:当某一条新闻出来的时候,这 40 个仓位会怎么同时动?风险是怎么从一个仓位传导到另一个仓位的? 这就是矩阵思维的威力。同样的数据,换一个看法,你看到的世界完全不同。 特征值和特征向量:找到”幕后推手” 接下来课程引入了一对概念:特征值(eigenvalue) 和 特征向量(eigenvector)。 公式长这样: Av = λv 先别被公式吓到,我用大白话解释一下。 想象你有一面哈哈镜。你站在镜子前面,镜子会把你的形象”变形”——可能拉宽、可能压扁、可能扭曲。这个”变形”就是矩阵在做的事。 但是,有一些特殊的方向,镜子只会把你拉长或缩短,不会改变方向。这些特殊方向就是特征向量。而拉长或缩短的倍数,就是特征值。 好,这跟交易有什么关系? 关系大了。假设你在选举周期里,对 100 个 Polymarket 合约做了一个相关性分析(就是看它们的价格是不是经常一起涨、一起跌)。然后你对这个相关性矩阵做特征值分解。 你会发现一个让人不安的事实:第一个特征向量(对应最大特征值的那个),几乎总是代表”整体政治情绪”。 什么意思?就是说,一条重磅新闻出来,不是只影响一个合约——它会同时推动几十个合约的价格。这些合约表面上看起来是不同的市场,但它们的价格背后,被同一股力量在驱动。 更扎心的是,你以为你持有 100 个仓位,风险很分散?做完特征值分解你可能会发现,3 个特征向量就解释了 80% 的总波动。你的”分散化”是个幻觉。你的真实风险,集中在 3 个你可能连名字都叫不出来的底层因子上。 用人话说,特征向量本质上是回答一个问题——“我这 100 个仓位,到底是被几股力量在推着走?”如果答案是”3 股”,那你不是在做 100 笔独立的交易,你是在同一个赌注上下了 100 次。想深入了解可以看 MIT 课程第 2 讲 [1]。 SVD:更通用的”照妖镜” 课程还讲了奇异值分解(SVD),公式是 A = UΣVᵀ。 你不需要记这个公式。你只需要知道它能干什么: 把几个月的 Polymarket 合约价格变动数据扔进去,SVD 会告诉你——在你所有的市场里,真正独立的价格驱动因素有几个。 实际结果几乎总是让人意外:你以为有 50 个独立的市场,SVD 告诉你其实只有 5 个独立的驱动力,剩下的都是这 5 个力量的不同组合。 怎么操作: Python 里一行代码 numpy.linalg.svd() 就能算。关键不是算,是理解结果——如果前几个奇异值远大于其他的,说明你的市场远没有你想象的那么”多样化”。 第一章的核心收获 你在 Polymarket 上持有的每一个仓位,都不是独立的。它们是一个整体结构的组成部分。 用数学理解这个结构,是”管理一本账”和”真正看懂一本账”之间的区别。 第二章:概率论——你最熟悉的假设,可能正在悄悄吃掉你的利润 如果第一章讲的是”你的仓位之间有什么隐藏的联系”,第二章讲的是”你对概率的理解,从根上可能就是歪的”。 正态分布:好用,但在预测市场里是错的 正态分布(就是那个钟形曲线),你在任何统计课上都见过。它很优雅,只需要两个数字(均值和标准差)就能完全描述。 但用它来直接建模 Polymarket 的价格,有两个致命问题: 问题一:正态分布允许负数。 但 Polymarket 合约的价格永远不可能低于 0。一个合约要么值 0(NO),要么值 1(YES),中间的价格代表市场认为 YES 的概率。你见过概率是 -5% 的吗? 问题二:它搞不定百分比。 一个合约从 $0.10 涨到 $0.15,涨了 50%。另一个从 $0.80 涨到 $0.85,只涨了 6.25%。但在正态分布的眼里,这两个都是”涨了 $0.05”,一样大。这显然是错的——第一个涨幅是第二个的 8 倍。如果你的模型分不清这个区别,它产出的每一个概率估计都是歪的。 对数正态分布:正确的起点 正确的做法是用对数正态分布 [3]。 听起来吓人,其实很简单。核心思想就一句话:不要直接对价格建模,而是对价格的”对数”建模。 为什么这样更好?因为对数有一个天然的好处——它把乘法变成了加法。 举个例子:一个东西涨 50% 再跌 50%,你觉得回到原点了?没有。100 块涨 50% 变 150,150 跌 50% 变 75。亏了 25 块。涨跌幅是不对称的。 但如果你用对数来算:ln(1.5) ≈ 0.405,ln(0.5) ≈ -0.693。加起来是负的,正确地反映了你亏钱的事实。 对数正态分布天然处理了这种不对称性,而且保证价格永远为正。这就是为什么几乎所有严肃的金融模型都用它,而不是直接用正态分布。 一个容易踩的坑: 对数正态分布里的参数 μ 和 σ,是对数世界里的参数,不是价格世界里的。这听起来像个小细节,但搞混了会让你的模型系统性地偏离——你以为你在估计价格的波动,其实你在估计一个完全不同的东西。 大数定律:为什么”有 edge 就一直打”是对的 大数定律说的是: 如果你重复做同一件事足够多次,平均结果会越来越接近”期望值”。 用扔硬币来理解:扔 10 次,可能 7 次正面 3 次反面,看起来很不均匀。但扔 10000 次,正面的比例会非常接近 50%。 这对 Polymarket 交易者意味着什么? 如果你的模型有真实的 edge——比如说,你判断一个合约的真实概率是 50%,但市场只定价在 35%——那你每次买入都有 15% 的期望利润。 单笔交易可能亏。连续几笔可能都亏。但大数定律告诉你:只要你的 edge 是真的,交易次数足够多,利润一定会来。 这就是为什么”精确估计你的 edge 有多大”比”在某个具体合约上押对”重要一万倍。单笔交易的输赢是噪音,上千笔交易的期望才是信号。 中心极限定理:为什么你的总收益会”变正常” 这个定理的名字听起来很唬人,但它说的事情其实很直觉。 想象这个场景: 你去菜市场买菜。每个摊位的价格都不一样,有的贵有的便宜,分布很不规则。但如果你每天都去买一大堆菜,把每天的总花费记下来,过一个月再看——你会发现,每天的总花费形成了一个漂亮的钟形曲线。 这就是中心极限定理在说的事:不管单个随机事件的分布长什么奇怪的样子,只要你把足够多的随机事件加在一起,总和的分布就会趋近正态分布。 对 Polymarket 交易者来说:你的单笔交易收益分布可能很怪——可能是”要么赚 65%,要么亏 35%“这种双峰分布,完全不是正态的。但当你把几百笔交易的收益加总起来,总收益的分布开始趋近正态。 这意味着什么? 意味着你可以用正态分布的工具(比如标准差、置信区间)来管理你的整体组合风险,即使单笔交易的收益分布一点都不”正态”。 但有个前提:交易次数要够多,而且交易之间要足够独立。如果你的 100 笔交易其实都在赌同一个事件(回想第一章的特征值分解),中心极限定理的”魔法”就不灵了。 第三章:随机过程——价格到底是怎么动的 这是 Roan 说”MIT 课程开始不像在讲数学,而像在直接描述我每天在 Polymarket 上看到的东西”的部分。 先搞清楚一个概念:什么是随机过程 你现在打开 Polymarket,看到某个合约的价格图——一条从左到右的折线。 这条折线,只是无数种可能中的一种。 随机过程描述的不是这一条线,而是所有可能的线的集合。从现在到结算,价格可能走出无数条不同的路径。你看到的那条,只是命运随机选中的一条。随机过程就是那个”命运”——它定义了每条路径出现的概率。 理解了这一点,你看价格图的方式就会变。你不再问”价格会涨还是跌”,而是问”所有可能的路径里,涨的路径占多大比例”。 随机游走和一个被大多数人忽略的规律 最简单的随机过程叫随机游走:每一步要么 +1 要么 -1,各 50% 概率。 关键结论来了:经过 T 步之后,你的位置的不确定性(标准差)跟 √T 成正比。 这什么意思?我用数字说话: 一个 7 天后结算的合约,不确定性是 √7 ≈ 2.65。一个 28 天后结算的合约,不确定性是 √28 ≈ 5.29。 28 天是 7 天的 4 倍,但不确定性只有 7 天的 2 倍,不是 4 倍。 为什么这很重要? 因为如果你在给不同到期时间的合约定价差(spread),而你用的是线性关系(“28 天的价差应该是 7 天的 4 倍”),你就在系统性地错误定价。正确的做法是用平方根关系。 从具体操作上来说,下次你在比较不同到期时间的合约时,用 √(剩余天数) 来调整你的价差,而不是直接按天数等比例放大。这一个改动就能让你的定价比大多数人准确得多。 赌徒破产公式:你会不会在赚钱之前先爆仓 课程讲了一个经典问题:一个随机游走,它先碰到上界 B 还是先碰到下界 -A? 答案很简洁: P(先碰到 B) = A / (A + B) 这个公式在 Polymarket 上有一个非常直接的应用。 假设你在一个定价 $0.90 的合约上做空(你认为它不会发生)。如果你是对的,你赚 $0.10。如果你是错的,你亏 $0.90。 在结算之前,价格会随机波动。这个公式告诉你:在你最终赚到那 $0.10 之前,价格先反向波动到让你爆仓的概率有多大。 当 A 很小(你的潜在利润很薄)而 B 很大(你的潜在亏损很大)时,你被”震出去”的概率非常高。这就是为什么在极端概率附近交易,即使你的方向判断是对的,也经常亏钱——你扛不到结算就被波动杀死了。 马尔可夫性:价格”没有记忆”……真的吗? 马尔可夫性质说的是:未来只取决于现在,跟过去无关。 用人话说:一个合约现在定价 $0.60,不管它是从 $0.30 涨上来的,还是从 $0.90 跌下来的,未来的走势应该是一样的。因为当前价格已经包含了市场知道的所有信息。 大多数定价模型都建立在这个假设上。它让数学变得简单很多。 但这里有一个大多数量化交易者会忽略的东西:在真实的 Polymarket 订单簿里,马尔可夫假设经常是错的。 比如:一个合约的价格是 $0.60,但你观察到过去一小时里有连续的大额买单在吃掉卖单。这个”连续大额买单”的模式,携带了超越当前价格的信息——可能有人知道了什么你还不知道的事。 再比如:结算事件之前,某一侧的流动性突然变薄。这也是一个信号,但纯马尔可夫模型看不到它,因为马尔可夫模型只看当前价格,不看”价格是怎么到这里的”。 知道什么时候该信任马尔可夫假设(大多数时候),什么时候该推翻它(关键时刻),这就是系统性 edge 在订单簿里存在的地方。 鞅:整个课程里最重要的一个概念 如果你只能从这篇文章里记住一个东西,记住这个。 鞅(Martingale) 是一个随机过程,它的核心性质是: 给定你现在知道的所有信息,你对明天价格的最佳预测,就是今天的价格。 不会更高,也不会更低。没有趋势,没有漂移。一个完全公平的游戏。 公式写出来是:E[X(t+1) | 所有历史信息] = X(t) 为什么这很重要?因为在数学上可以证明:在风险中性的框架下,Polymarket 的价格就是一个鞅。 MIT的课程讲了一个叫可选停止定理(Optional Stopping Theorem) 的东西,它说了一件很残酷的事: 对于一个鞅,不存在任何基于历史信息的”聪明”进出场策略能改变你的期望收益。 翻译成人话:你不可能通过”在合适的时候买入、在合适的时候卖出”来打败一个公平的游戏。所有的技术分析、所有的择时策略,在一个鞅面前,期望收益都是零。 那 edge 从哪来? 不是从择时来的。是从更准确的概率估计来的。 如果市场把一个事件定价在 35%,但你通过更好的信息、更好的模型,知道它的真实概率是 50%——这 15% 的差距,就是你的 edge。这个 edge 不需要你”选对时机”,你只需要在价格低于你认为的真实概率时买入,然后等结算。 市场价格和真实概率之间的差距,是系统性 edge 唯一真正存在的地方。 所以,唯一的实操建议就是,不要花时间研究 K 线图和技术指标。在预测市场里,这些东西的价值接近于零。把你的精力花在信息收集和概率估计上——读新闻、看数据、建模型、校准你的判断。这才是赚钱的地方。 第四章:回归分析——预测市场模型的地基 没有任何一个严肃的预测市场量化模型不用回归。这一章讲的是为什么,以及怎么用对。 回归在干什么 用最简单的话说:回归就是从一堆数据里找规律。 你有一个想预测的东西(合约最终是 YES 还是 NO),你还有一堆可能相关的信号(民调数据、订单流、历史基准率、市场动量、距离结算的时间、相关市场的走势)。回归帮你找出这些信号和结果之间的数学关系。 OLS(普通最小二乘法) 是最基础的回归方法。它的逻辑很直觉:在所有可能的预测公式里,找一个让”预测值和实际值之间的差距”最小的。这里的”差距”用的是差值的平方和——所以叫”最小二乘”。 为什么用平方? 因为有的差距是正的(预测偏高),有的是负的(预测偏低),如果直接加起来会互相抵消。平方之后全变成正数,就能正确衡量总偏差了。 Gauss-Markov 定理:OLS 为什么是”金标准” Gauss-Markov 定理 [4] 说:在三个条件满足的情况下,OLS 是你能找到的最好的线性预测方法。 这三个条件是: 1. 预测误差的平均值是零(你的模型没有系统性偏差) 2. 预测误差的大小是恒定的(不会时大时小) 3. 不同时间点的预测误差之间互不相关 满足这三个条件,OLS 就是最佳线性无偏估计量——在所有不偏不倚的线性方法里,它的误差最小。 问题来了:预测市场天然违反第二个条件 在预测市场里,“误差大小恒定”这个假设几乎不可能成立。 想想看:一个合约还有 30 天才结算,价格在 $0.50 附近,波动很大,预测误差自然也大。但同一个合约只剩 1 天就结算了,价格已经到了 $0.95,结果几乎确定,预测误差接近零。 误差大小随时间剧烈变化。 这在统计学里叫异方差性(heteroscedasticity)——名字很吓人,但意思很简单:误差的”方差”不是恒定的。 这直接导致 Gauss-Markov 定理的保证失效。一个忽略这个问题的模型会怎样? 它会在接近结算时过度自信(以为自己的预测很准,其实只是因为结果快揭晓了),在远离结算时不够自信(以为自己的预测很差,其实只是因为不确定性本来就高)。 解决方案:加权回归 修复方法叫广义最小二乘法(GLS),但你不需要记这个名字。核心思想很简单: 给每个数据点不同的权重。 接近结算的数据点,因为方差小,信息量其实不大,降低权重。远离结算的数据点,因为方差大,包含更多真实信息,提高权重。 这样,模型在合约生命周期的每个阶段,对自己的置信度都是正确校准的。 稳健回归:别让异常值毁掉你的模型 最后一个重要概念:稳健回归。 标准 OLS 有一个弱点——它对异常值非常敏感。一个极端的数据点就能把整条回归线拉歪。 在 Polymarket 上,异常值从哪来?有争议的结算和预言机故障。 比如一个合约因为预言机出了 bug,结算结果跟实际情况不符。这在你的数据里就是一个巨大的异常值。 标准 OLS 会把这个异常值当成”非常重要的信息”,让它严重影响模型。稳健回归则会说:“这个数据点太离谱了,大概率是噪音,我不怎么理它。” 对于跨几百个合约运行的系统化模型,这种处理异常值方式的差异,可能就是稳定盈利和偶尔爆仓之间的区别。 第五章:VaR——“最坏能亏多少”的科学回答 这一讲 MIT 请来了摩根士丹利的实操人员。Roan 说语气立刻变了——不是教授在黑板上推公式,而是一个每天收盘后都要为亏损签字负责的人在说话。 VaR 是什么 VaR(Value at Risk,风险价值)回答一个非常具体的问题: 在正常市场条件下,我明天最多可能亏多少钱? 比如:你的 99% 单日 VaR 是 $4,200。意思是:有 99% 的概率,你明天的亏损不会超过 $4,200。或者反过来说,只有 1% 的概率,你会亏超过这个数。 为什么这很重要? 因为如果你不知道自己最多能亏多少,你就不知道该拿多少钱来交易。所有大型金融机构都用 VaR 来管理风险 [5]——不是因为它完美,而是因为它给了你一个具体的数字,让你可以做决策。 三种算法,各有优劣 1/ 参数法 怎么算:假设收益服从正态分布,用公式直接算。优点是快,一秒出结果。缺点是假设经常是错的。在 Polymarket 上接近结算时完全不能用——收益是”要么赚要么亏”的双峰分布,跟正态分布差了十万八千里。 2/ 蒙特卡洛模拟 怎么算:用电脑随机生成上万种可能的场景,看最差的那些。优点是对各种奇怪的分布都能处理。缺点是算得慢,需要算力。最适合 Polymarket,因为它不要求收益是正态分布的。 3/ 历史模拟 怎么算:直接用过去真实发生过的行情来模拟。优点是不需要任何分布假设,真实发生过的极端情况自动包含在内。缺点是只能模拟历史上出现过的情况。如果你交易的是一个史无前例的事件类型,历史模拟就没有参考数据,会低估风险。 蒙特卡洛模拟怎么做? 简单说:让电脑随机生成 10,000 种”明天可能发生的情况”,对你的每个仓位算出在每种情况下赚多少或亏多少,然后把 10,000 个结果从最差到最好排序。第 100 差的那个(也就是最差的 1%),就是你的 99% VaR。 摩根士丹利的讲师说了一句话,Roan 用大字写在了笔记本上: “最危险的风险,不是你的模型能衡量的风险,而是你的模型根本不知道要去找的风险。” 实操建议: 同时跑两三种 VaR 方法,然后比较结果。如果参数法说你的 VaR 是 $3,000,蒙特卡洛说是 $8,000——这个巨大的分歧本身就是一个红色警报,说明你对收益分布的假设可能正在崩塌。 第六章:GARCH——新闻冲击之后,波动要多久才会平息 Roan 说这是改变他看 Polymarket 价格图方式的一讲。我觉得他没夸张。 波动率聚集:一个你天天看到但可能没注意到的规律 你有没有注意到一个现象:Polymarket 上某个合约,平时价格波动很小,但一旦出了一条大新闻,价格剧烈波动——而且这种剧烈波动不会马上停,它会持续一段时间,然后慢慢平息。 这个现象有个名字:波动率聚集(volatility clustering) [6]。 高波动之后,往往跟着更多高波动。低波动之后,往往跟着更多低波动。 这不是巧合,这是一个在股票、外汇、商品、预测市场里都反复出现的统计规律。 GARCH:把”波动率会怎么变”变成一个公式 普通的时间序列模型假设波动率是恒定的——今天的波动和明天的波动一样大。这显然跟现实不符。 GARCH(1,1) 模型用三个参数就捕捉了波动率聚集: 今天的波动率 = 一个常数 + 昨天的意外冲击有多大 + 昨天的波动率有多高 写成公式:σ²(t) = α₀ + α₁ε²(t-1) + β₁σ²(t-1) 这里面最关键的是 β₁ 这个参数。它控制的是:一次冲击之后,波动率衰减回正常水平的速度。 β₁ 接近 1?波动率会持续很久。一条大新闻出来,市场要好几天才能消化完。 β₁ 接近 0?波动率很快就回归正常。冲击来得快去得也快。 这对做市商意味着什么 如果你在 Polymarket 上做市(就是同时挂买单和卖单,赚中间的价差),你面临一个非常实际的问题: 一条大新闻出来之后,你应该把价差加宽多少?加宽多久?什么时候可以恢复正常报价? 以前你可能凭感觉:“嗯,感觉市场稳定了,收紧价差吧。” 现在你可以用 GARCH 来回答:拟合一个 GARCH(1,1) 模型,看 β₁ 的值。β₁ 高,就多等几个小时再收紧。β₁ 低,可以很快恢复。 怎么操作: Python 的 arch 库(pip install arch)可以很方便地拟合 GARCH 模型。几行代码就能算出 β₁,然后你就知道波动率的”半衰期”——冲击衰减到一半需要多长时间。这比凭感觉靠谱一万倍。 第七章:投资组合理论——以及一个关于”所有人都用同一个策略”的恐怖故事 夏普比率:衡量策略好不好的标尺 夏普比率(Sharpe Ratio) [7] 可能是金融界最常用的一个指标: 夏普比率 = (你的收益 - 无风险收益) / 你的收益的波动率 它衡量的是:你每承担一单位风险,能赚到多少回报。 打个比方:策略 A 一年赚 20%,但波动率是 40%(大起大落)。策略 B 一年赚 10%,但波动率只有 5%(稳如老狗)。 策略 A 的夏普比率:20% / 40% = 0.5 策略 B 的夏普比率:10% / 5% = 2.0 策略 B 虽然赚得少,但夏普比率高得多——它每承担一分风险,赚到的回报是策略 A 的 4 倍。在专业量化的世界里,策略 B 远远优于策略 A。 一般来说,夏普比率 > 1 算不错,> 2 算很好,> 3 就是顶级了。 风险平价:一种更聪明的仓位分配方式 传统方法是按预期收益分配资本——哪个市场你觉得赚钱机会大,就多放钱。 风险平价(Risk Parity) [8] 换了一个思路:按风险贡献来分配。让每个仓位对你总组合风险的贡献相等。 在 Polymarket 上,这意味着什么? 接近结算的合约,短期波动率很高(因为马上就要揭晓结果了,要么 0 要么 1)。远离结算的合约,波动率较低,定价更平稳。 风险平价会自动让你减少接近结算的仓位、增加远离结算的仓位——自动帮你管理了那个最危险的”二元结果风险”。 千禧桥的故事:为什么”和别人一样”是最大的风险 这是整篇文章里我最喜欢的一个故事。 2000 年,伦敦千禧桥开放。成千上万的行人走上桥。然后奇怪的事情发生了:桥开始剧烈摇晃 [9]。 原因是什么?行人为了在摇晃的桥上保持平衡,无意识地开始同步他们的步伐。而同步的步伐又加剧了桥的摇晃。每个人单独来看都在做理性的事(保持平衡),但所有人加在一起,产生了一个危险的集体效应。 同样的事情在 Polymarket 上正在发生。 当足够多的做市商都采用同一套风控逻辑——比如都用 VPIN(成交量同步知情交易概率) [10] 作为撤退信号——一笔大的知情交易就会同时触发所有人撤退。 结果?流动性瞬间归零。价格不连续地跳空。所有人的模型同时失效。 VPIN 是什么? 简单说,它是一个衡量”当前市场里,知情交易者有多活跃”的指标。当 VPIN 升高,说明有人可能掌握了你不知道的信息,做市商就倾向于撤回报价以避免被”割”。问题是,如果所有做市商都用同一个 VPIN 阈值来决定何时撤退,就会出现”踩踏”——所有人同时跑,流动性瞬间消失。 在实际操作上,如果你在做市,给你的撤退阈值加一些随机性。或者用跟主流不同的信号组合。在预测市场里,“和别人不一样”本身就是一种风险管理。当所有人都在用同一个策略的时候,最大的风险不是市场本身,而是策略的同质化。 这里也加入一个小插曲——在做 @insidersdotbot 的时候,经常有人提到的一个问题,就是如果所有人都去跟单同一个钱包,那这个聪明钱钱包是否就会失效。而前段时间更新的跟单过滤器和止盈止损功能,本质上就是增加了随机性(用户会推断出不同的止盈、止损还有过滤方法),从而打破了”所有人同一时间做同一件事”的踩踏效应。千禧桥的故事完美解释了这个设计背后的逻辑。 第八章:因子模型——找到推动一切的那只”看不见的手” 这是 Roan 说他花最长时间才真正理解、但现在用得最多的概念。 核心思想:100 个合约背后,可能只有 3 股力量 因子模型的出发点是一个观察:很多看起来不同的市场,价格经常一起动。 为什么?因为它们背后被同一些”因子”驱动。 用选举周期举例:Polymarket 上可能有几十个跟选举相关的合约——谁赢哪个州、谁赢总统、哪个党拿下参议院……这些合约的价格经常同涨同跌。为什么?因为它们都被同一个底层因子驱动——整体政治风向。 因子模型用数学把这个直觉变成了精确的框架: 每个合约的收益 = 它对各个因子的敏感度 × 各个因子的变动 + 它自己独有的随机波动 两种找因子的方法 方法一:你自己定义因子。 比如”整体政治温度”(所有政治合约的平均变动)、“体育大事件因子”(重大赛事期间所有体育合约的联动)。这些是你根据经验和直觉选出来的。 方法二:让数据告诉你因子是什么。 这就是 PCA(主成分分析) [11]。你把所有合约的历史收益数据扔进去,PCA 会自动找出”解释最多波动的几个方向”。这些方向就是你的因子。 在 Polymarket 的选举周期里,PCA 找出的第一主成分几乎总是”整体政治动量”——一个数字,同时推动几十个市场。 为什么这改变了风险管理的方式 如果 PCA 告诉你,3 个因子解释了你整个持仓 80% 的波动,那你面对的现实是: 你不是在运行 100 个独立仓位。你是在运行 3 个集中的因子敞口,包裹在 100 个合约的外衣下。 机构级的做法是:直接对冲这 3 个因子,而不是逐个管理 100 个仓位。更高效,更诚实,也更安全。 因子模型还能帮你发现一个隐藏的陷阱: 两个表面上完全不相关的合约(比如一个关于某州选举,一个关于某项政策),可能在同一个底层政治因子上有很高的载荷。在你做因子分解之前,你看不到这个联系。但当这个因子受到冲击时,两个仓位会以你完全没有预料到的方式同时亏损。 怎么操作: Python 的 sklearn.decomposition.PCA 可以对你的持仓历史收益做主成分分析。看看前 3 个主成分解释了多少方差。如果超过 70%,你需要认真想想:你的”分散化”是不是真的分散了,还是只是同一个赌注的 100 种伪装。 接下来 以上只覆盖了 MIT 金融数学课程的一部分——Roan 说连 30% 都不到。还有衍生品定价、信用建模、利率理论、高级风险框架等等,他完全没提。 这门课的深度是真的惊人。这是那种人们花 20 万美元学费才能学到的内容,但它就放在 YouTube 上免费看 [1]。大多数人会收藏,然后再也不打开。 如果你是认真想在预测市场上建立系统性优势的,我和 Roan 的建议一样:清出几天时间,打开播放列表,拿上笔和本子,从头看。你花在上面的每一个小时,都会改变你看 Polymarket 上每一个价格的方式。 概念速查表 特征值分解 → 找出”谁在幕后推动一切”。用来发现你的 100 个仓位其实只有 3 个真正的风险来源。 SVD → 更通用的矩阵分解。找出价格变动中真正独立的驱动因素有几个。 对数正态分布 → 对价格的对数建模,而不是价格本身。避免”价格为负”和”涨跌不对称”的问题。 大数定律 → 重复足够多次,平均值趋近期望值。有 edge 就坚持交易,长期一定赚钱。 中心极限定理 → 大量随机事件加总后趋近正态分布。可以用正态分布的工具管理整体组合风险。 √T 规律 → 不确定性跟时间的平方根成正比。给不同到期时间的合约定价差时,用 √天数 调整。 赌徒破产公式 → 先碰到上界还是下界的概率。评估”在赚钱之前先被波动杀死”的风险。 马尔可夫性 → 未来只取决于现在。大多数时候成立,但订单流模式是重要的例外。 鞅 → 最佳预测 = 当前值。不能靠择时赚钱,edge 只来自更准的概率估计。 OLS 回归 → 从数据里找规律的基础方法。用来建模合约结算概率。 异方差性 → 误差大小不恒定。预测市场天然存在,需要用加权回归修正。 VaR → 正常情况下最多亏多少。量化你的持仓在最坏情况下的亏损。 GARCH → 波动率会怎么随时间变化。估计新闻冲击后波动率的衰减速度。 夏普比率 → 每单位风险赚多少。评价你的交易策略好不好。 风险平价 → 按等风险贡献分配资本。自动减少接近结算的高风险仓位。 因子模型 → 用少数因子解释多个市场的联动。发现隐形的风险集中,用因子对冲替代逐个管理。 VPIN → 知情交易者有多活跃。做市商的撤退信号(但要防”踩踏”)。 参考资料 [1] MIT OpenCourseWare, “Topics in Mathematics with Applications in Finance,” Fall 2013. 课程页面 | YouTube 播放列表 [2] S. Ross, “The Recovery Theorem,” The Journal of Finance, 2015. MIT Open Access [3] Investopedia, “Log-Normal Distribution.” 链接 [4] Wikipedia, “Gauss-Markov Theorem.” 链接 [5] Investopedia, “Value at Risk (VaR).” 链接 [6] Investopedia, “GARCH Models.” 链接 [7] Investopedia, “Sharpe Ratio.” 链接 [8] AQR Capital Management, “Understanding Risk Parity.” PDF [9] Belykh et al., “Emergence of the London Millennium Bridge instability without synchronisation,” Nature Communications, 2021. 链接 [10] Krypton Labs, “VPIN: The Coolest Market Metric You’ve Never Heard Of.” 链接 [11] QuestDB, “Principal Component Analysis (PCA) for Portfolio Risk.” 链接

预测市场交易员的数学101

原文作者: Roan (@RohOnChain)
翻译、注释与改写: @MrRyanChi
原文链接:https://x.com/RohOnChain/status/2028489070394171427
序言:为什么你一定要读这一篇文章
在过去半年,不论为了是创立 insiders.bot, 还是在 Polymarket,Predict.fun,和 Opinion Labs 上进行预测市场投资,我都和大量的预测市场交易员有过很深度的交流,自己也在交易上踩过各式各样的坑。
在这个过程中,一个很直观的感受是:在 Polymarket 上真正持续赚钱的人,靠的从来不是”消息灵通”或者”感觉准”。他们靠的是一套对概率、风险和市场微观结构的数学直觉——而这套直觉,是可以学的。
Roan 这篇文章做了一件我在中英文社区都很少见到的事:他把 MIT 金融数学课里的每一个核心概念,拆开来,一个一个对应到 Polymarket 的真实交易场景里。不是”这个理论很重要你去学吧”,而是”这个公式,对应的就是你昨天下单时犯的那个错误”。
我自己是一个数学生,虽然大学的时候就为了做项目,放弃了帝国理工数学系的Offer,直接“弃数从商”了。即便如此,作为打过几次IMO,在AMC也算是名列前茅的前数学生,我觉得这篇文章真的很精妙。
如果你想认真做预测市场,而不只是凭感觉赌大小,这篇值得你花一个下午读完。
考虑到文章非常非常技术性,我和我的agent一起,做了大量改写和添加。数年前,我还在靠补习赚零花钱的时候,就教出过几个IBDP高级数学满分的学生,运用当时的习惯,我会针对一些专业术语以及公式的背景和使用方法进行进一步补充,让它更好理解,对你的实际交易更有帮助。
这篇文章的来历
先说说作者 Roan 是谁。他是一个专注系统设计、高频执行和量化交易系统的后端开发者,日常工作就是研究预测市场在高负载下的真实行为——说白了,就是研究当大量订单同时涌入时,市场到底会怎么反应。
事情的起因是他看到 @GoshawkTrades 发了一篇帖子,说”40 小时的免费课程,顶一个量化交易学位”,列了 MIT、耶鲁、牛津、哥伦比亚四所大学的公开课。
Roan 看完之后做了一个决定:不再把这些课程当”收藏夹里吃灰的东西”。他清了几天时间,拿出笔和本子,从头到尾看完了 MIT 的金融数学课程——YouTube 上免费的 20 多个小时 [1]。不跳、不倍速、不懂就倒回去重看。
他说,看完之后,再看 Polymarket 上的每一个价格、每一笔订单、每一个买卖价差,感觉完全不一样了。
这篇文章就是他的学习笔记。但不是那种”第一讲讲了什么、第二讲讲了什么”的流水账,而是把每个数学概念翻译成了你在 Polymarket 上能直接用的语言。

第一章:线性代数——你以为你分散了风险,其实没有
“线性代数”这四个字,大多数人听到就想跑。
别跑。这一章可能会改变你看自己持仓的方式。
矩阵不只是一张表格
MIT 课程上来就讲了一个很关键的区分:矩阵有两种理解方式。
第一种,你已经很熟了——矩阵就是一张表格。行是日期,列是不同的合约,格子里填的是价格。Excel 里天天见。
第二种,才是真正有用的——矩阵是一个变换器。它能把一组数据从一个”视角”映射到另一个”视角”。
这什么意思?
打个比方。你在 Polymarket 上同时持有 40 个 YES 合约。如果你只用”表格思维”去看,你看到的是:“我在这 40 个市场各买了多少”。
但如果你用”变换思维”去看,你看到的是一个完全不同的东西:当某一条新闻出来的时候,这 40 个仓位会怎么同时动?风险是怎么从一个仓位传导到另一个仓位的?
这就是矩阵思维的威力。同样的数据,换一个看法,你看到的世界完全不同。
特征值和特征向量:找到”幕后推手”
接下来课程引入了一对概念:特征值(eigenvalue) 和 特征向量(eigenvector)。
公式长这样:
Av = λv
先别被公式吓到,我用大白话解释一下。
想象你有一面哈哈镜。你站在镜子前面,镜子会把你的形象”变形”——可能拉宽、可能压扁、可能扭曲。这个”变形”就是矩阵在做的事。
但是,有一些特殊的方向,镜子只会把你拉长或缩短,不会改变方向。这些特殊方向就是特征向量。而拉长或缩短的倍数,就是特征值。
好,这跟交易有什么关系?
关系大了。假设你在选举周期里,对 100 个 Polymarket 合约做了一个相关性分析(就是看它们的价格是不是经常一起涨、一起跌)。然后你对这个相关性矩阵做特征值分解。
你会发现一个让人不安的事实:第一个特征向量(对应最大特征值的那个),几乎总是代表”整体政治情绪”。
什么意思?就是说,一条重磅新闻出来,不是只影响一个合约——它会同时推动几十个合约的价格。这些合约表面上看起来是不同的市场,但它们的价格背后,被同一股力量在驱动。
更扎心的是,你以为你持有 100 个仓位,风险很分散?做完特征值分解你可能会发现,3 个特征向量就解释了 80% 的总波动。你的”分散化”是个幻觉。你的真实风险,集中在 3 个你可能连名字都叫不出来的底层因子上。
用人话说,特征向量本质上是回答一个问题——“我这 100 个仓位,到底是被几股力量在推着走?”如果答案是”3 股”,那你不是在做 100 笔独立的交易,你是在同一个赌注上下了 100 次。想深入了解可以看 MIT 课程第 2 讲 [1]。

SVD:更通用的”照妖镜”
课程还讲了奇异值分解(SVD),公式是 A = UΣVᵀ。
你不需要记这个公式。你只需要知道它能干什么:
把几个月的 Polymarket 合约价格变动数据扔进去,SVD 会告诉你——在你所有的市场里,真正独立的价格驱动因素有几个。
实际结果几乎总是让人意外:你以为有 50 个独立的市场,SVD 告诉你其实只有 5 个独立的驱动力,剩下的都是这 5 个力量的不同组合。
怎么操作: Python 里一行代码 numpy.linalg.svd() 就能算。关键不是算,是理解结果——如果前几个奇异值远大于其他的,说明你的市场远没有你想象的那么”多样化”。
第一章的核心收获
你在 Polymarket 上持有的每一个仓位,都不是独立的。它们是一个整体结构的组成部分。
用数学理解这个结构,是”管理一本账”和”真正看懂一本账”之间的区别。
第二章:概率论——你最熟悉的假设,可能正在悄悄吃掉你的利润
如果第一章讲的是”你的仓位之间有什么隐藏的联系”,第二章讲的是”你对概率的理解,从根上可能就是歪的”。
正态分布:好用,但在预测市场里是错的
正态分布(就是那个钟形曲线),你在任何统计课上都见过。它很优雅,只需要两个数字(均值和标准差)就能完全描述。

但用它来直接建模 Polymarket 的价格,有两个致命问题:
问题一:正态分布允许负数。 但 Polymarket 合约的价格永远不可能低于 0。一个合约要么值 0(NO),要么值 1(YES),中间的价格代表市场认为 YES 的概率。你见过概率是 -5% 的吗?
问题二:它搞不定百分比。 一个合约从 $0.10 涨到 $0.15,涨了 50%。另一个从 $0.80 涨到 $0.85,只涨了 6.25%。但在正态分布的眼里,这两个都是”涨了 $0.05”,一样大。这显然是错的——第一个涨幅是第二个的 8 倍。如果你的模型分不清这个区别,它产出的每一个概率估计都是歪的。
对数正态分布:正确的起点
正确的做法是用对数正态分布 [3]。

听起来吓人,其实很简单。核心思想就一句话:不要直接对价格建模,而是对价格的”对数”建模。
为什么这样更好?因为对数有一个天然的好处——它把乘法变成了加法。
举个例子:一个东西涨 50% 再跌 50%,你觉得回到原点了?没有。100 块涨 50% 变 150,150 跌 50% 变 75。亏了 25 块。涨跌幅是不对称的。
但如果你用对数来算:ln(1.5) ≈ 0.405,ln(0.5) ≈ -0.693。加起来是负的,正确地反映了你亏钱的事实。
对数正态分布天然处理了这种不对称性,而且保证价格永远为正。这就是为什么几乎所有严肃的金融模型都用它,而不是直接用正态分布。
一个容易踩的坑: 对数正态分布里的参数 μ 和 σ,是对数世界里的参数,不是价格世界里的。这听起来像个小细节,但搞混了会让你的模型系统性地偏离——你以为你在估计价格的波动,其实你在估计一个完全不同的东西。
大数定律:为什么”有 edge 就一直打”是对的
大数定律说的是: 如果你重复做同一件事足够多次,平均结果会越来越接近”期望值”。
用扔硬币来理解:扔 10 次,可能 7 次正面 3 次反面,看起来很不均匀。但扔 10000 次,正面的比例会非常接近 50%。
这对 Polymarket 交易者意味着什么?
如果你的模型有真实的 edge——比如说,你判断一个合约的真实概率是 50%,但市场只定价在 35%——那你每次买入都有 15% 的期望利润。
单笔交易可能亏。连续几笔可能都亏。但大数定律告诉你:只要你的 edge 是真的,交易次数足够多,利润一定会来。
这就是为什么”精确估计你的 edge 有多大”比”在某个具体合约上押对”重要一万倍。单笔交易的输赢是噪音,上千笔交易的期望才是信号。
中心极限定理:为什么你的总收益会”变正常”
这个定理的名字听起来很唬人,但它说的事情其实很直觉。
想象这个场景: 你去菜市场买菜。每个摊位的价格都不一样,有的贵有的便宜,分布很不规则。但如果你每天都去买一大堆菜,把每天的总花费记下来,过一个月再看——你会发现,每天的总花费形成了一个漂亮的钟形曲线。
这就是中心极限定理在说的事:不管单个随机事件的分布长什么奇怪的样子,只要你把足够多的随机事件加在一起,总和的分布就会趋近正态分布。
对 Polymarket 交易者来说:你的单笔交易收益分布可能很怪——可能是”要么赚 65%,要么亏 35%“这种双峰分布,完全不是正态的。但当你把几百笔交易的收益加总起来,总收益的分布开始趋近正态。
这意味着什么? 意味着你可以用正态分布的工具(比如标准差、置信区间)来管理你的整体组合风险,即使单笔交易的收益分布一点都不”正态”。
但有个前提:交易次数要够多,而且交易之间要足够独立。如果你的 100 笔交易其实都在赌同一个事件(回想第一章的特征值分解),中心极限定理的”魔法”就不灵了。
第三章:随机过程——价格到底是怎么动的
这是 Roan 说”MIT 课程开始不像在讲数学,而像在直接描述我每天在 Polymarket 上看到的东西”的部分。
先搞清楚一个概念:什么是随机过程
你现在打开 Polymarket,看到某个合约的价格图——一条从左到右的折线。
这条折线,只是无数种可能中的一种。
随机过程描述的不是这一条线,而是所有可能的线的集合。从现在到结算,价格可能走出无数条不同的路径。你看到的那条,只是命运随机选中的一条。随机过程就是那个”命运”——它定义了每条路径出现的概率。
理解了这一点,你看价格图的方式就会变。你不再问”价格会涨还是跌”,而是问”所有可能的路径里,涨的路径占多大比例”。
随机游走和一个被大多数人忽略的规律
最简单的随机过程叫随机游走:每一步要么 +1 要么 -1,各 50% 概率。
关键结论来了:经过 T 步之后,你的位置的不确定性(标准差)跟 √T 成正比。
这什么意思?我用数字说话:
一个 7 天后结算的合约,不确定性是 √7 ≈ 2.65。一个 28 天后结算的合约,不确定性是 √28 ≈ 5.29。
28 天是 7 天的 4 倍,但不确定性只有 7 天的 2 倍,不是 4 倍。

为什么这很重要? 因为如果你在给不同到期时间的合约定价差(spread),而你用的是线性关系(“28 天的价差应该是 7 天的 4 倍”),你就在系统性地错误定价。正确的做法是用平方根关系。
从具体操作上来说,下次你在比较不同到期时间的合约时,用 √(剩余天数) 来调整你的价差,而不是直接按天数等比例放大。这一个改动就能让你的定价比大多数人准确得多。
赌徒破产公式:你会不会在赚钱之前先爆仓
课程讲了一个经典问题:一个随机游走,它先碰到上界 B 还是先碰到下界 -A?
答案很简洁:
P(先碰到 B) = A / (A + B)
这个公式在 Polymarket 上有一个非常直接的应用。
假设你在一个定价 $0.90 的合约上做空(你认为它不会发生)。如果你是对的,你赚 $0.10。如果你是错的,你亏 $0.90。
在结算之前,价格会随机波动。这个公式告诉你:在你最终赚到那 $0.10 之前,价格先反向波动到让你爆仓的概率有多大。
当 A 很小(你的潜在利润很薄)而 B 很大(你的潜在亏损很大)时,你被”震出去”的概率非常高。这就是为什么在极端概率附近交易,即使你的方向判断是对的,也经常亏钱——你扛不到结算就被波动杀死了。

马尔可夫性:价格”没有记忆”……真的吗?
马尔可夫性质说的是:未来只取决于现在,跟过去无关。

用人话说:一个合约现在定价 $0.60,不管它是从 $0.30 涨上来的,还是从 $0.90 跌下来的,未来的走势应该是一样的。因为当前价格已经包含了市场知道的所有信息。
大多数定价模型都建立在这个假设上。它让数学变得简单很多。
但这里有一个大多数量化交易者会忽略的东西:在真实的 Polymarket 订单簿里,马尔可夫假设经常是错的。
比如:一个合约的价格是 $0.60,但你观察到过去一小时里有连续的大额买单在吃掉卖单。这个”连续大额买单”的模式,携带了超越当前价格的信息——可能有人知道了什么你还不知道的事。
再比如:结算事件之前,某一侧的流动性突然变薄。这也是一个信号,但纯马尔可夫模型看不到它,因为马尔可夫模型只看当前价格,不看”价格是怎么到这里的”。
知道什么时候该信任马尔可夫假设(大多数时候),什么时候该推翻它(关键时刻),这就是系统性 edge 在订单簿里存在的地方。
鞅:整个课程里最重要的一个概念
如果你只能从这篇文章里记住一个东西,记住这个。
鞅(Martingale) 是一个随机过程,它的核心性质是:
给定你现在知道的所有信息,你对明天价格的最佳预测,就是今天的价格。
不会更高,也不会更低。没有趋势,没有漂移。一个完全公平的游戏。
公式写出来是:E[X(t+1) | 所有历史信息] = X(t)

为什么这很重要?因为在数学上可以证明:在风险中性的框架下,Polymarket 的价格就是一个鞅。
MIT的课程讲了一个叫可选停止定理(Optional Stopping Theorem) 的东西,它说了一件很残酷的事:
对于一个鞅,不存在任何基于历史信息的”聪明”进出场策略能改变你的期望收益。
翻译成人话:你不可能通过”在合适的时候买入、在合适的时候卖出”来打败一个公平的游戏。所有的技术分析、所有的择时策略,在一个鞅面前,期望收益都是零。
那 edge 从哪来?
不是从择时来的。是从更准确的概率估计来的。
如果市场把一个事件定价在 35%,但你通过更好的信息、更好的模型,知道它的真实概率是 50%——这 15% 的差距,就是你的 edge。这个 edge 不需要你”选对时机”,你只需要在价格低于你认为的真实概率时买入,然后等结算。
市场价格和真实概率之间的差距,是系统性 edge 唯一真正存在的地方。
所以,唯一的实操建议就是,不要花时间研究 K 线图和技术指标。在预测市场里,这些东西的价值接近于零。把你的精力花在信息收集和概率估计上——读新闻、看数据、建模型、校准你的判断。这才是赚钱的地方。
第四章:回归分析——预测市场模型的地基
没有任何一个严肃的预测市场量化模型不用回归。这一章讲的是为什么,以及怎么用对。
回归在干什么
用最简单的话说:回归就是从一堆数据里找规律。
你有一个想预测的东西(合约最终是 YES 还是 NO),你还有一堆可能相关的信号(民调数据、订单流、历史基准率、市场动量、距离结算的时间、相关市场的走势)。回归帮你找出这些信号和结果之间的数学关系。
OLS(普通最小二乘法) 是最基础的回归方法。它的逻辑很直觉:在所有可能的预测公式里,找一个让”预测值和实际值之间的差距”最小的。这里的”差距”用的是差值的平方和——所以叫”最小二乘”。
为什么用平方? 因为有的差距是正的(预测偏高),有的是负的(预测偏低),如果直接加起来会互相抵消。平方之后全变成正数,就能正确衡量总偏差了。
Gauss-Markov 定理:OLS 为什么是”金标准”
Gauss-Markov 定理 [4] 说:在三个条件满足的情况下,OLS 是你能找到的最好的线性预测方法。
这三个条件是:
1. 预测误差的平均值是零(你的模型没有系统性偏差)
2. 预测误差的大小是恒定的(不会时大时小)
3. 不同时间点的预测误差之间互不相关
满足这三个条件,OLS 就是最佳线性无偏估计量——在所有不偏不倚的线性方法里,它的误差最小。

问题来了:预测市场天然违反第二个条件
在预测市场里,“误差大小恒定”这个假设几乎不可能成立。
想想看:一个合约还有 30 天才结算,价格在 $0.50 附近,波动很大,预测误差自然也大。但同一个合约只剩 1 天就结算了,价格已经到了 $0.95,结果几乎确定,预测误差接近零。
误差大小随时间剧烈变化。 这在统计学里叫异方差性(heteroscedasticity)——名字很吓人,但意思很简单:误差的”方差”不是恒定的。
这直接导致 Gauss-Markov 定理的保证失效。一个忽略这个问题的模型会怎样?
它会在接近结算时过度自信(以为自己的预测很准,其实只是因为结果快揭晓了),在远离结算时不够自信(以为自己的预测很差,其实只是因为不确定性本来就高)。

解决方案:加权回归
修复方法叫广义最小二乘法(GLS),但你不需要记这个名字。核心思想很简单:
给每个数据点不同的权重。 接近结算的数据点,因为方差小,信息量其实不大,降低权重。远离结算的数据点,因为方差大,包含更多真实信息,提高权重。

这样,模型在合约生命周期的每个阶段,对自己的置信度都是正确校准的。
稳健回归:别让异常值毁掉你的模型
最后一个重要概念:稳健回归。
标准 OLS 有一个弱点——它对异常值非常敏感。一个极端的数据点就能把整条回归线拉歪。
在 Polymarket 上,异常值从哪来?有争议的结算和预言机故障。 比如一个合约因为预言机出了 bug,结算结果跟实际情况不符。这在你的数据里就是一个巨大的异常值。
标准 OLS 会把这个异常值当成”非常重要的信息”,让它严重影响模型。稳健回归则会说:“这个数据点太离谱了,大概率是噪音,我不怎么理它。”
对于跨几百个合约运行的系统化模型,这种处理异常值方式的差异,可能就是稳定盈利和偶尔爆仓之间的区别。
第五章:VaR——“最坏能亏多少”的科学回答
这一讲 MIT 请来了摩根士丹利的实操人员。Roan 说语气立刻变了——不是教授在黑板上推公式,而是一个每天收盘后都要为亏损签字负责的人在说话。
VaR 是什么
VaR(Value at Risk,风险价值)回答一个非常具体的问题:
在正常市场条件下,我明天最多可能亏多少钱?
比如:你的 99% 单日 VaR 是 $4,200。意思是:有 99% 的概率,你明天的亏损不会超过 $4,200。或者反过来说,只有 1% 的概率,你会亏超过这个数。

为什么这很重要? 因为如果你不知道自己最多能亏多少,你就不知道该拿多少钱来交易。所有大型金融机构都用 VaR 来管理风险 [5]——不是因为它完美,而是因为它给了你一个具体的数字,让你可以做决策。
三种算法,各有优劣
1/ 参数法 怎么算:假设收益服从正态分布,用公式直接算。优点是快,一秒出结果。缺点是假设经常是错的。在 Polymarket 上接近结算时完全不能用——收益是”要么赚要么亏”的双峰分布,跟正态分布差了十万八千里。
2/ 蒙特卡洛模拟 怎么算:用电脑随机生成上万种可能的场景,看最差的那些。优点是对各种奇怪的分布都能处理。缺点是算得慢,需要算力。最适合 Polymarket,因为它不要求收益是正态分布的。
3/ 历史模拟 怎么算:直接用过去真实发生过的行情来模拟。优点是不需要任何分布假设,真实发生过的极端情况自动包含在内。缺点是只能模拟历史上出现过的情况。如果你交易的是一个史无前例的事件类型,历史模拟就没有参考数据,会低估风险。
蒙特卡洛模拟怎么做? 简单说:让电脑随机生成 10,000 种”明天可能发生的情况”,对你的每个仓位算出在每种情况下赚多少或亏多少,然后把 10,000 个结果从最差到最好排序。第 100 差的那个(也就是最差的 1%),就是你的 99% VaR。
摩根士丹利的讲师说了一句话,Roan 用大字写在了笔记本上:
“最危险的风险,不是你的模型能衡量的风险,而是你的模型根本不知道要去找的风险。”
实操建议: 同时跑两三种 VaR 方法,然后比较结果。如果参数法说你的 VaR 是 $3,000,蒙特卡洛说是 $8,000——这个巨大的分歧本身就是一个红色警报,说明你对收益分布的假设可能正在崩塌。
第六章:GARCH——新闻冲击之后,波动要多久才会平息
Roan 说这是改变他看 Polymarket 价格图方式的一讲。我觉得他没夸张。
波动率聚集:一个你天天看到但可能没注意到的规律
你有没有注意到一个现象:Polymarket 上某个合约,平时价格波动很小,但一旦出了一条大新闻,价格剧烈波动——而且这种剧烈波动不会马上停,它会持续一段时间,然后慢慢平息。
这个现象有个名字:波动率聚集(volatility clustering) [6]。

高波动之后,往往跟着更多高波动。低波动之后,往往跟着更多低波动。
这不是巧合,这是一个在股票、外汇、商品、预测市场里都反复出现的统计规律。
GARCH:把”波动率会怎么变”变成一个公式
普通的时间序列模型假设波动率是恒定的——今天的波动和明天的波动一样大。这显然跟现实不符。
GARCH(1,1) 模型用三个参数就捕捉了波动率聚集:
今天的波动率 = 一个常数 + 昨天的意外冲击有多大 + 昨天的波动率有多高
写成公式:σ²(t) = α₀ + α₁ε²(t-1) + β₁σ²(t-1)
这里面最关键的是 β₁ 这个参数。它控制的是:一次冲击之后,波动率衰减回正常水平的速度。
β₁ 接近 1?波动率会持续很久。一条大新闻出来,市场要好几天才能消化完。
β₁ 接近 0?波动率很快就回归正常。冲击来得快去得也快。
这对做市商意味着什么
如果你在 Polymarket 上做市(就是同时挂买单和卖单,赚中间的价差),你面临一个非常实际的问题:
一条大新闻出来之后,你应该把价差加宽多少?加宽多久?什么时候可以恢复正常报价?
以前你可能凭感觉:“嗯,感觉市场稳定了,收紧价差吧。”
现在你可以用 GARCH 来回答:拟合一个 GARCH(1,1) 模型,看 β₁ 的值。β₁ 高,就多等几个小时再收紧。β₁ 低,可以很快恢复。
怎么操作: Python 的 arch 库(pip install arch)可以很方便地拟合 GARCH 模型。几行代码就能算出 β₁,然后你就知道波动率的”半衰期”——冲击衰减到一半需要多长时间。这比凭感觉靠谱一万倍。
第七章:投资组合理论——以及一个关于”所有人都用同一个策略”的恐怖故事
夏普比率:衡量策略好不好的标尺
夏普比率(Sharpe Ratio) [7] 可能是金融界最常用的一个指标:
夏普比率 = (你的收益 - 无风险收益) / 你的收益的波动率
它衡量的是:你每承担一单位风险,能赚到多少回报。
打个比方:策略 A 一年赚 20%,但波动率是 40%(大起大落)。策略 B 一年赚 10%,但波动率只有 5%(稳如老狗)。
策略 A 的夏普比率:20% / 40% = 0.5 策略 B 的夏普比率:10% / 5% = 2.0
策略 B 虽然赚得少,但夏普比率高得多——它每承担一分风险,赚到的回报是策略 A 的 4 倍。在专业量化的世界里,策略 B 远远优于策略 A。
一般来说,夏普比率 > 1 算不错,> 2 算很好,> 3 就是顶级了。
风险平价:一种更聪明的仓位分配方式
传统方法是按预期收益分配资本——哪个市场你觉得赚钱机会大,就多放钱。
风险平价(Risk Parity) [8] 换了一个思路:按风险贡献来分配。让每个仓位对你总组合风险的贡献相等。
在 Polymarket 上,这意味着什么?
接近结算的合约,短期波动率很高(因为马上就要揭晓结果了,要么 0 要么 1)。远离结算的合约,波动率较低,定价更平稳。
风险平价会自动让你减少接近结算的仓位、增加远离结算的仓位——自动帮你管理了那个最危险的”二元结果风险”。
千禧桥的故事:为什么”和别人一样”是最大的风险
这是整篇文章里我最喜欢的一个故事。
2000 年,伦敦千禧桥开放。成千上万的行人走上桥。然后奇怪的事情发生了:桥开始剧烈摇晃 [9]。
原因是什么?行人为了在摇晃的桥上保持平衡,无意识地开始同步他们的步伐。而同步的步伐又加剧了桥的摇晃。每个人单独来看都在做理性的事(保持平衡),但所有人加在一起,产生了一个危险的集体效应。
同样的事情在 Polymarket 上正在发生。
当足够多的做市商都采用同一套风控逻辑——比如都用 VPIN(成交量同步知情交易概率) [10] 作为撤退信号——一笔大的知情交易就会同时触发所有人撤退。
结果?流动性瞬间归零。价格不连续地跳空。所有人的模型同时失效。
VPIN 是什么? 简单说,它是一个衡量”当前市场里,知情交易者有多活跃”的指标。当 VPIN 升高,说明有人可能掌握了你不知道的信息,做市商就倾向于撤回报价以避免被”割”。问题是,如果所有做市商都用同一个 VPIN 阈值来决定何时撤退,就会出现”踩踏”——所有人同时跑,流动性瞬间消失。
在实际操作上,如果你在做市,给你的撤退阈值加一些随机性。或者用跟主流不同的信号组合。在预测市场里,“和别人不一样”本身就是一种风险管理。当所有人都在用同一个策略的时候,最大的风险不是市场本身,而是策略的同质化。

这里也加入一个小插曲——在做 @insidersdotbot 的时候,经常有人提到的一个问题,就是如果所有人都去跟单同一个钱包,那这个聪明钱钱包是否就会失效。而前段时间更新的跟单过滤器和止盈止损功能,本质上就是增加了随机性(用户会推断出不同的止盈、止损还有过滤方法),从而打破了”所有人同一时间做同一件事”的踩踏效应。千禧桥的故事完美解释了这个设计背后的逻辑。
第八章:因子模型——找到推动一切的那只”看不见的手”
这是 Roan 说他花最长时间才真正理解、但现在用得最多的概念。
核心思想:100 个合约背后,可能只有 3 股力量
因子模型的出发点是一个观察:很多看起来不同的市场,价格经常一起动。
为什么?因为它们背后被同一些”因子”驱动。
用选举周期举例:Polymarket 上可能有几十个跟选举相关的合约——谁赢哪个州、谁赢总统、哪个党拿下参议院……这些合约的价格经常同涨同跌。为什么?因为它们都被同一个底层因子驱动——整体政治风向。
因子模型用数学把这个直觉变成了精确的框架:
每个合约的收益 = 它对各个因子的敏感度 × 各个因子的变动 + 它自己独有的随机波动
两种找因子的方法
方法一:你自己定义因子。 比如”整体政治温度”(所有政治合约的平均变动)、“体育大事件因子”(重大赛事期间所有体育合约的联动)。这些是你根据经验和直觉选出来的。
方法二:让数据告诉你因子是什么。 这就是 PCA(主成分分析) [11]。你把所有合约的历史收益数据扔进去,PCA 会自动找出”解释最多波动的几个方向”。这些方向就是你的因子。
在 Polymarket 的选举周期里,PCA 找出的第一主成分几乎总是”整体政治动量”——一个数字,同时推动几十个市场。
为什么这改变了风险管理的方式
如果 PCA 告诉你,3 个因子解释了你整个持仓 80% 的波动,那你面对的现实是:
你不是在运行 100 个独立仓位。你是在运行 3 个集中的因子敞口,包裹在 100 个合约的外衣下。
机构级的做法是:直接对冲这 3 个因子,而不是逐个管理 100 个仓位。更高效,更诚实,也更安全。
因子模型还能帮你发现一个隐藏的陷阱:
两个表面上完全不相关的合约(比如一个关于某州选举,一个关于某项政策),可能在同一个底层政治因子上有很高的载荷。在你做因子分解之前,你看不到这个联系。但当这个因子受到冲击时,两个仓位会以你完全没有预料到的方式同时亏损。

怎么操作: Python 的 sklearn.decomposition.PCA 可以对你的持仓历史收益做主成分分析。看看前 3 个主成分解释了多少方差。如果超过 70%,你需要认真想想:你的”分散化”是不是真的分散了,还是只是同一个赌注的 100 种伪装。
接下来
以上只覆盖了 MIT 金融数学课程的一部分——Roan 说连 30% 都不到。还有衍生品定价、信用建模、利率理论、高级风险框架等等,他完全没提。
这门课的深度是真的惊人。这是那种人们花 20 万美元学费才能学到的内容,但它就放在 YouTube 上免费看 [1]。大多数人会收藏,然后再也不打开。
如果你是认真想在预测市场上建立系统性优势的,我和 Roan 的建议一样:清出几天时间,打开播放列表,拿上笔和本子,从头看。你花在上面的每一个小时,都会改变你看 Polymarket 上每一个价格的方式。
概念速查表
特征值分解 → 找出”谁在幕后推动一切”。用来发现你的 100 个仓位其实只有 3 个真正的风险来源。
SVD → 更通用的矩阵分解。找出价格变动中真正独立的驱动因素有几个。
对数正态分布 → 对价格的对数建模,而不是价格本身。避免”价格为负”和”涨跌不对称”的问题。
大数定律 → 重复足够多次,平均值趋近期望值。有 edge 就坚持交易,长期一定赚钱。
中心极限定理 → 大量随机事件加总后趋近正态分布。可以用正态分布的工具管理整体组合风险。
√T 规律 → 不确定性跟时间的平方根成正比。给不同到期时间的合约定价差时,用 √天数 调整。
赌徒破产公式 → 先碰到上界还是下界的概率。评估”在赚钱之前先被波动杀死”的风险。
马尔可夫性 → 未来只取决于现在。大多数时候成立,但订单流模式是重要的例外。
鞅 → 最佳预测 = 当前值。不能靠择时赚钱,edge 只来自更准的概率估计。
OLS 回归 → 从数据里找规律的基础方法。用来建模合约结算概率。
异方差性 → 误差大小不恒定。预测市场天然存在,需要用加权回归修正。
VaR → 正常情况下最多亏多少。量化你的持仓在最坏情况下的亏损。
GARCH → 波动率会怎么随时间变化。估计新闻冲击后波动率的衰减速度。
夏普比率 → 每单位风险赚多少。评价你的交易策略好不好。
风险平价 → 按等风险贡献分配资本。自动减少接近结算的高风险仓位。
因子模型 → 用少数因子解释多个市场的联动。发现隐形的风险集中,用因子对冲替代逐个管理。
VPIN → 知情交易者有多活跃。做市商的撤退信号(但要防”踩踏”)。
参考资料
[1] MIT OpenCourseWare, “Topics in Mathematics with Applications in Finance,” Fall 2013. 课程页面 | YouTube 播放列表
[2] S. Ross, “The Recovery Theorem,” The Journal of Finance, 2015. MIT Open Access
[3] Investopedia, “Log-Normal Distribution.” 链接
[4] Wikipedia, “Gauss-Markov Theorem.” 链接
[5] Investopedia, “Value at Risk (VaR).” 链接
[6] Investopedia, “GARCH Models.” 链接
[7] Investopedia, “Sharpe Ratio.” 链接
[8] AQR Capital Management, “Understanding Risk Parity.” PDF
[9] Belykh et al., “Emergence of the London Millennium Bridge instability without synchronisation,” Nature Communications, 2021. 链接
[10] Krypton Labs, “VPIN: The Coolest Market Metric You’ve Never Heard Of.” 链接
[11] QuestDB, “Principal Component Analysis (PCA) for Portfolio Risk.” 链接
很荣幸成为了币安投资的Opinion Labs第一批用户!!! 这两天会将具体的使用体验分享给大家!
很荣幸成为了币安投资的Opinion Labs第一批用户!!!

这两天会将具体的使用体验分享给大家!
Članek
我在马斯克母校玩Web3 - 第二期 2025.9 序言 趁着周末,来纽约待了两天一晚,中途没有停过见人,不管是圈内的学生,纽约这边的创始人,还有一些传统行业的朋友都见了一圈。正好有些不错的学习和领悟,这里分享一下。 上一篇靠运气拿到了 @Kalshi 和 @KaitoAI 的高分,再次感谢xdm的支持!接下来几个月,我会更加努力的更新这个系列(当然,我觉得也很有可能是因为我的师父 @gokunocool u转发了,谢谢师父!) 关于纽约的Web3现状: 纽约不愧是纽约,创始人文化非常的重,这次来就见到几个公链项目的Founder或者Founding Member,都是大家耳熟能详的项目。听当地的朋友说,实际上纽约的圈子也并不是很大,而且大家也都互相认识,但是给我的感觉就是含金量很高,不会出现一跑会就全是BD的情况。 很多Web3机构和大项目在纽约都有办公室,但是仍然也需要全球跑,各种参会和见项目。问了几个新认识的朋友,都说虽然常驻纽约,但是实际上每年都有4-6个月的时间在环球旅行。 关于这边的学生在做什么 这次在 0xU 新一届投研会长(另一个Ryan)的介绍下认识了一个Brown的新朋友,稍微聊了一下这边的学生都在做什么。比较有意思的一点在于,大部分Web3的学生参与者,很多都是非金融背景,经济 / 技术背景的更多。 这边也有不少人在研究炒币的策略,比如某美国前三大基金就在研究资金溢出效应,即,是否能将股票市场轮动的逻辑应用到比特币 (比特币 = 高风险资产,市场顶峰阶段可以将资金易到比特币,吃宏观周期的最后一波)。虽然有合理性,但据说目前是没有赚钱的。 参与岗位方面,比起交易所/项目当道的香港,这边也是VC做analyst的岗位更多且更流行,部分PE似乎也在寻找有Web3背景的同学。 比较大的一个叙事也包含代币化股票。这点其实也和上述PE相关联 - 主要就是通过代币化,能否实现未IPO项目的盘前市场。也打听到预测市场实际上已经有很多大机构,包括 Jane Street,已经在研究甚至实行预测市场套利策略。认识了一个刚入学就做基金,AUM过亿的同学,最近也在考虑入局。 这段时间我也在和Daksh研究预测市场,准备做一些工具出来,希望到时候也能给大家带来一些财富效应。 关于 Mass Adaption: 也稍微聊了一下关于 Mass Adaption 当前的进程。绝大多数美国学生目前对Web3的印象,还处于在FTX的阶段。所以,这条路仍然很长久。 我认为这个当中存在一个可以套利的认知差 - 即,大型基金已经开始转向,学生认知尚未普及。接下来一段时间,我相信有传统机构背景+了解金融产业+Web3 Native的同学。会非常非常吃香。 我相信 @bc1qDave 最近应该就没少赚钱。接下来一段时间只会越赚越多,大家可以先抱紧大腿了。 说一个unpopular opinion - 不要All-In Web3。By this,我的意思是,你可以做所有Web3相关的事情,可以把所有精力放在Web3行业上,但是一定要保留对传统行业的学习,且持续性的对所有行业(实体,TradFi等等)进行学习以及祛魅。 关于纽约这边都在做什么: 目前这两天看到的就是L1公链,机构叙事,以及币股叙事偏多。比较有意思的一点就是 - 与过去一年的亚洲市场不同,这边的VC仍然在投,也仍然在赚钱。和朋友聊了一下,感觉最大的原因就是,在VC币,模式,以及技术上,美国仍然在引领行业内的叙事以及创新。 亚洲的基金已经很久没有投资,然而纽约这边不少的VC还是在赚钱。Those who deserve to make money are still profiting。 至于那些帮投资人赚到钱的项目,之后也会持续性的融到资,做到成功的项目。记得一年前和 AC Capital 的郑老板开Space的时候,有提到“不论如何,要让你的金主赚到钱”,这点仍然受用。 关于 0xUClub : 上个礼拜,在学校里面和创始OG 一树老师聊了一会天,有几个关键认知分享一下: 1. 周期只会越来越长,比特币减半的影响已经远远不如机构入场带来的影响。四年周期可能会延长到8-9年的长周期。 2. 接下来,项目方做大的难度会增加,本身有实力,有资源的项目会更加能打。看的精准的重要性远远超过之前。 除此之外,听到了一些创始时的故事,比如传奇Jack对Web3的理解,在0xU创世时,实际上Web3经验并不算多,但是爽子哥学习能力是最快的,也是最能团结所有人的,所以被一致认可推上了第一任主席,再到现在成为Ave的大佬 - 妥妥的主角模版。 还有就是第一代和第三代相比,私域做的非常好。第三代则在公域开始开花。不知道接下来一年能不能更上一层,文体两开花。 关于AI的一些Insight: AI的情况实际上并不乐观。包括被硅谷当成救世主的Cluely,实际上营收还没跑起来。营销本身量很大,但转化有限,产品仍然存在问题。单从投资来说,和大部分一线VC背书的web3公链项目相比,区别并不大。反而说,如果cluely已经是目前的天花板,那其实我对AI融资这件事不是很看好 当然,AI确实有更多的爆款产品。听朋友提到,很多AI圈核心young founder cabal的成员已经实现了稳定的营收,所以对投资本身兴趣也不是很大。 关于Real Estate: 在一个大佬的家里,聊了不少地产的事情。不知道大家感不感兴趣,姑且先简单写写: 1. 香港接下来的房产并不bullish,北部都会区2030年起步,每年供应5w+以上单位,会带来不少抛压 2. 地产以及传统金融借贷行业,在美国这边有很多政府支持的collateralized的无风险套利空间。虽然是辛苦钱,但是确实很赚 3. 深圳南山创业的项目公司应该重点留意香港北部都会区将会带来的红利。 关于个人: 最近见了很多中学的朋友,聊了很多事情。 有个NYC的逆天学弟,准备毕业之后去日本的女子大学当教授。不知道为什么感觉这是一个非常非常非常好的方向。 最近父母准备退休了,所以我自己毕业之后准备环游世界到处工作,毕竟这个圈子都是远程。热烈征集未来室友中。 第一站在考虑镰仓(灌篮高手 / 青春猪头少年取景地)。不过未来的事未来再说,还在看目前的工作创业模式能不能稳定下来。 最后说点无关的城市文化: 1. 纽约地铁确实很破,但不至于危险。凌晨搭地铁没有什么危险人物。听学弟说,之前喝到大醉,半睡着坐地铁都没事。 2. 别住四星酒店。我自己贪方便,住的penn station附近多一家,住了一天312刀,换算大概2000多人民币,没有牙刷牙膏,没有拖鞋,非常小。外观好看,但是没有任何性价比。香港同等价钱能住带阳台客厅的酒店,重庆的话说不定还能带按摩池。 3. 纽约是找不到好的雪茄资源的。买烟也又贵又难抽。 4. 华尔街摸牛蛋蛋要排队半个小时 5. 牛扒虽然贵,但确实是next level。108刀左右的吃的很饱,而且非常香。 最近每天都在学东西。凌晨中国时间开会,中午工作+上课+学习交流。 很期待之后的几个月。LFG兄弟们!

我在马斯克母校玩Web3 - 第二期 2025.9




序言
趁着周末,来纽约待了两天一晚,中途没有停过见人,不管是圈内的学生,纽约这边的创始人,还有一些传统行业的朋友都见了一圈。正好有些不错的学习和领悟,这里分享一下。

上一篇靠运气拿到了 @Kalshi 和 @KaitoAI 的高分,再次感谢xdm的支持!接下来几个月,我会更加努力的更新这个系列(当然,我觉得也很有可能是因为我的师父 @Goku很Cool u转发了,谢谢师父!)

关于纽约的Web3现状:
纽约不愧是纽约,创始人文化非常的重,这次来就见到几个公链项目的Founder或者Founding Member,都是大家耳熟能详的项目。听当地的朋友说,实际上纽约的圈子也并不是很大,而且大家也都互相认识,但是给我的感觉就是含金量很高,不会出现一跑会就全是BD的情况。

很多Web3机构和大项目在纽约都有办公室,但是仍然也需要全球跑,各种参会和见项目。问了几个新认识的朋友,都说虽然常驻纽约,但是实际上每年都有4-6个月的时间在环球旅行。

关于这边的学生在做什么
这次在 0xU 新一届投研会长(另一个Ryan)的介绍下认识了一个Brown的新朋友,稍微聊了一下这边的学生都在做什么。比较有意思的一点在于,大部分Web3的学生参与者,很多都是非金融背景,经济 / 技术背景的更多。

这边也有不少人在研究炒币的策略,比如某美国前三大基金就在研究资金溢出效应,即,是否能将股票市场轮动的逻辑应用到比特币 (比特币 = 高风险资产,市场顶峰阶段可以将资金易到比特币,吃宏观周期的最后一波)。虽然有合理性,但据说目前是没有赚钱的。

参与岗位方面,比起交易所/项目当道的香港,这边也是VC做analyst的岗位更多且更流行,部分PE似乎也在寻找有Web3背景的同学。

比较大的一个叙事也包含代币化股票。这点其实也和上述PE相关联 - 主要就是通过代币化,能否实现未IPO项目的盘前市场。也打听到预测市场实际上已经有很多大机构,包括 Jane Street,已经在研究甚至实行预测市场套利策略。认识了一个刚入学就做基金,AUM过亿的同学,最近也在考虑入局。

这段时间我也在和Daksh研究预测市场,准备做一些工具出来,希望到时候也能给大家带来一些财富效应。

关于 Mass Adaption:
也稍微聊了一下关于 Mass Adaption 当前的进程。绝大多数美国学生目前对Web3的印象,还处于在FTX的阶段。所以,这条路仍然很长久。

我认为这个当中存在一个可以套利的认知差 - 即,大型基金已经开始转向,学生认知尚未普及。接下来一段时间,我相信有传统机构背景+了解金融产业+Web3 Native的同学。会非常非常吃香。

我相信 @bc1qDave 最近应该就没少赚钱。接下来一段时间只会越赚越多,大家可以先抱紧大腿了。

说一个unpopular opinion - 不要All-In Web3。By this,我的意思是,你可以做所有Web3相关的事情,可以把所有精力放在Web3行业上,但是一定要保留对传统行业的学习,且持续性的对所有行业(实体,TradFi等等)进行学习以及祛魅。

关于纽约这边都在做什么:
目前这两天看到的就是L1公链,机构叙事,以及币股叙事偏多。比较有意思的一点就是 - 与过去一年的亚洲市场不同,这边的VC仍然在投,也仍然在赚钱。和朋友聊了一下,感觉最大的原因就是,在VC币,模式,以及技术上,美国仍然在引领行业内的叙事以及创新。

亚洲的基金已经很久没有投资,然而纽约这边不少的VC还是在赚钱。Those who deserve to make money are still profiting。

至于那些帮投资人赚到钱的项目,之后也会持续性的融到资,做到成功的项目。记得一年前和 AC Capital 的郑老板开Space的时候,有提到“不论如何,要让你的金主赚到钱”,这点仍然受用。

关于 0xUClub :
上个礼拜,在学校里面和创始OG 一树老师聊了一会天,有几个关键认知分享一下:

1. 周期只会越来越长,比特币减半的影响已经远远不如机构入场带来的影响。四年周期可能会延长到8-9年的长周期。

2. 接下来,项目方做大的难度会增加,本身有实力,有资源的项目会更加能打。看的精准的重要性远远超过之前。

除此之外,听到了一些创始时的故事,比如传奇Jack对Web3的理解,在0xU创世时,实际上Web3经验并不算多,但是爽子哥学习能力是最快的,也是最能团结所有人的,所以被一致认可推上了第一任主席,再到现在成为Ave的大佬 - 妥妥的主角模版。

还有就是第一代和第三代相比,私域做的非常好。第三代则在公域开始开花。不知道接下来一年能不能更上一层,文体两开花。

关于AI的一些Insight:
AI的情况实际上并不乐观。包括被硅谷当成救世主的Cluely,实际上营收还没跑起来。营销本身量很大,但转化有限,产品仍然存在问题。单从投资来说,和大部分一线VC背书的web3公链项目相比,区别并不大。反而说,如果cluely已经是目前的天花板,那其实我对AI融资这件事不是很看好

当然,AI确实有更多的爆款产品。听朋友提到,很多AI圈核心young founder cabal的成员已经实现了稳定的营收,所以对投资本身兴趣也不是很大。

关于Real Estate:
在一个大佬的家里,聊了不少地产的事情。不知道大家感不感兴趣,姑且先简单写写:

1. 香港接下来的房产并不bullish,北部都会区2030年起步,每年供应5w+以上单位,会带来不少抛压

2. 地产以及传统金融借贷行业,在美国这边有很多政府支持的collateralized的无风险套利空间。虽然是辛苦钱,但是确实很赚

3. 深圳南山创业的项目公司应该重点留意香港北部都会区将会带来的红利。

关于个人:
最近见了很多中学的朋友,聊了很多事情。

有个NYC的逆天学弟,准备毕业之后去日本的女子大学当教授。不知道为什么感觉这是一个非常非常非常好的方向。

最近父母准备退休了,所以我自己毕业之后准备环游世界到处工作,毕竟这个圈子都是远程。热烈征集未来室友中。

第一站在考虑镰仓(灌篮高手 / 青春猪头少年取景地)。不过未来的事未来再说,还在看目前的工作创业模式能不能稳定下来。

最后说点无关的城市文化:

1. 纽约地铁确实很破,但不至于危险。凌晨搭地铁没有什么危险人物。听学弟说,之前喝到大醉,半睡着坐地铁都没事。

2. 别住四星酒店。我自己贪方便,住的penn station附近多一家,住了一天312刀,换算大概2000多人民币,没有牙刷牙膏,没有拖鞋,非常小。外观好看,但是没有任何性价比。香港同等价钱能住带阳台客厅的酒店,重庆的话说不定还能带按摩池。

3. 纽约是找不到好的雪茄资源的。买烟也又贵又难抽。

4. 华尔街摸牛蛋蛋要排队半个小时

5. 牛扒虽然贵,但确实是next level。108刀左右的吃的很饱,而且非常香。

最近每天都在学东西。凌晨中国时间开会,中午工作+上课+学习交流。

很期待之后的几个月。LFG兄弟们!
Članek
我在马斯克母校玩Web3 - 第一期 2025.8 序言: 听到我要来美国读书时,我师父 @gokunocool 立刻跟我说,你写点东西啊!这么多信息差,你要是不写,就太浪费了。 所以,这段时间一直在水贴,也多是因为全身心在感受美国的crypto市场,所以没什么时间好好写东西。 当然,一直在做项目也是一个原因,不过这点之后有机会再elaborate。最近帮忙的几个项目都颇有成色, Real Sigma Labs 之前招的几个成员也都有很多新进展。除此之外,最近投的项目也不错,带着几个兄弟赚了点小钱。 总之,废话不多说,这次我们直接来讲美国的加密市场,以及我来到世界第一的商学院, @Wharton 之后的一些见闻。 关于热点: 如果大家平常有在听英文区的播客的话,应该就会留意到,最近预测市场的东西越来越火了。前段时间, @RealSigmaLabs 新招的北美开发者,也有一些在开发相关的项目。这点我在过去一段时间是切身体会到的 - 很多人开始研究预测市场了,而且,更重要的是,有很多有趣的玩法,包括: 1 - 预测市场套利(如,5% - 10%个点的低概率事件进行押注+杠杆,获得几乎没有任何风险的收益) 2 - 预测市场MM,比如通过Kalshi的MM进行获利 另外一个热点就比较东西通用了,就是DAT的发展 - DAT,合规,以及稳定币接下来的全球化。 这点都是老生常谈的东西,这一篇文章就不再过多赘述。 关于工作: 在香港时,最流行的工作就是在各个项目方或者交易所做BD或者Marketing,而在这边,在各个VC做analyst岗位比较多。比如 @galaxyhq,@artemis 等等。(这么一想, @bc1qDave 确实还是太领先了)。也有不少SF或者硅谷一带的技术实习 - 感觉这里的技术岗位,相比香港多非常多。 不过,有一个共性是跨全球的,就是: 1 - 不看GPA 2 - 上任就要会做事 3 - 自主性 + 能动性 + 热情 = 00后治理职场 关于薪资方面,目前我打听到的年薪大概都在 150K - 200K 一年,这点倒是比香港一带同岗位的薪资要多非常多。 关于00后: 我自己的想法是,开始和 @PennBlockchain 进行接触后,我才真正感觉到了自己来到了常青藤,来到了无数创业者,无数创新者曾经涌现的地方。 如果只是普通上课,感觉大部分人都很优秀,很努力,但是at the same time,没有特别让人感到exciting的人,大部分人的路径,或者对社会本身的认知,实际上都非常有限。 没错,我接触到本地的区块链协会之后,再一次遇到了一个个充满独立的想法,充满野心,以及非常有野心的个体。这点和香港很相似 - 在圈子里面,我能感受到的刺激比别的地方多得多。 当然,我在香港也有很多做房地产,电商,传统VC等等拿到大结果的朋友,但是可能是因为一直在Web3行业的原因,总感觉Web3行业的“奇人”密度高非常多。 来到这里之后,我再度坚定了自己的想法 - 年轻一代是现在Web3最主要的贡献者,也是最有趣的一帮人。在20岁甚至不到20岁,就投身Web3,AI,以及创业的一帮人,永远都是最有主动性,最让人感到心血沸腾的。 关于社团: 我在香港的时候,很享受的一件事情,就是build @0xUClub,做世界最强的区块链俱乐部。 不过,我来到美国之后,就立刻发现,我们有很多需要相互学习的地方。 在 @0xUClub 当联合会长的一年,我觉得我们做的最好的一件事,就是把KOL矩阵做起来了,也把 @0xUClub 的名号在圈子里打响了。这点我认为非常有效的赋能到了我们的成员。 (这里也尤其感谢几位特别活跃的0xU前辈 @hoidya_ @wsjack_eth @0x_KevinZ 的鼎力输出,我老婆 @bc1qDave 的输出 + 管理, @ChingChaLong02 的猛C,以及 @0xBeyondLee @0xPickleCati @MaraCakeHotSale @unlimitedgame_ 等等朋友带来的曝光) 然而, @PennBlockchain 以及 FranklinDAO 有一点我是非常希望 @0xUClub 的下一代主席 @0xJianAn 学习的,那就是与生态之间的联系。 没错,与所有我所接触的华语区链协,以及 @0xUClub 这种更大规模的学生组织不同,Penn的区块链协会获得了 @a16z 的背书,在公链生态有投票权,而且会定期参与黑客松。很多成员也在美国这边的大项目做到了重要的位置。 这点,尤其是公链的参与能力和贡献能力,我认为是全华语区的学生链协应该去争取的。 目前我也申请了成为Penn Blockchain的成员,希望能够进行进一步的跨文化交流学习,构建起新生代区块链跨越文化与地域的桥梁。 这里也特别感谢一下 @issue_wong @TangyMax 提前跟我介绍了情况,做了引路人。 不管怎样,学生是区块链下一代的重要贡献者,所以,我这里也希望能够呼吁各大公链,各大交易所,把更多的机会,交给学生链协的成员。 小结: 不管怎样,来美国的这段时间,真的学了超多东西。 之后会做更多有趣的分享,继续补齐认知差! 记得点关注! 三连!

我在马斯克母校玩Web3 - 第一期 2025.8


序言:

听到我要来美国读书时,我师父 @Goku很Cool 立刻跟我说,你写点东西啊!这么多信息差,你要是不写,就太浪费了。

所以,这段时间一直在水贴,也多是因为全身心在感受美国的crypto市场,所以没什么时间好好写东西。

当然,一直在做项目也是一个原因,不过这点之后有机会再elaborate。最近帮忙的几个项目都颇有成色, Real Sigma Labs 之前招的几个成员也都有很多新进展。除此之外,最近投的项目也不错,带着几个兄弟赚了点小钱。

总之,废话不多说,这次我们直接来讲美国的加密市场,以及我来到世界第一的商学院, @Wharton 之后的一些见闻。

关于热点:

如果大家平常有在听英文区的播客的话,应该就会留意到,最近预测市场的东西越来越火了。前段时间, @RealSigmaLabs 新招的北美开发者,也有一些在开发相关的项目。这点我在过去一段时间是切身体会到的 - 很多人开始研究预测市场了,而且,更重要的是,有很多有趣的玩法,包括:

1 - 预测市场套利(如,5% - 10%个点的低概率事件进行押注+杠杆,获得几乎没有任何风险的收益)

2 - 预测市场MM,比如通过Kalshi的MM进行获利

另外一个热点就比较东西通用了,就是DAT的发展 - DAT,合规,以及稳定币接下来的全球化。

这点都是老生常谈的东西,这一篇文章就不再过多赘述。

关于工作:

在香港时,最流行的工作就是在各个项目方或者交易所做BD或者Marketing,而在这边,在各个VC做analyst岗位比较多。比如 @galaxyhq,@artemis 等等。(这么一想, @bc1qDave 确实还是太领先了)。也有不少SF或者硅谷一带的技术实习 - 感觉这里的技术岗位,相比香港多非常多。

不过,有一个共性是跨全球的,就是:

1 - 不看GPA

2 - 上任就要会做事

3 - 自主性 + 能动性 + 热情 = 00后治理职场

关于薪资方面,目前我打听到的年薪大概都在 150K - 200K 一年,这点倒是比香港一带同岗位的薪资要多非常多。

关于00后:

我自己的想法是,开始和 @PennBlockchain 进行接触后,我才真正感觉到了自己来到了常青藤,来到了无数创业者,无数创新者曾经涌现的地方。

如果只是普通上课,感觉大部分人都很优秀,很努力,但是at the same time,没有特别让人感到exciting的人,大部分人的路径,或者对社会本身的认知,实际上都非常有限。

没错,我接触到本地的区块链协会之后,再一次遇到了一个个充满独立的想法,充满野心,以及非常有野心的个体。这点和香港很相似 - 在圈子里面,我能感受到的刺激比别的地方多得多。

当然,我在香港也有很多做房地产,电商,传统VC等等拿到大结果的朋友,但是可能是因为一直在Web3行业的原因,总感觉Web3行业的“奇人”密度高非常多。

来到这里之后,我再度坚定了自己的想法 - 年轻一代是现在Web3最主要的贡献者,也是最有趣的一帮人。在20岁甚至不到20岁,就投身Web3,AI,以及创业的一帮人,永远都是最有主动性,最让人感到心血沸腾的。

关于社团:

我在香港的时候,很享受的一件事情,就是build @0xUClub,做世界最强的区块链俱乐部。

不过,我来到美国之后,就立刻发现,我们有很多需要相互学习的地方。

在 @0xUClub 当联合会长的一年,我觉得我们做的最好的一件事,就是把KOL矩阵做起来了,也把 @0xUClub 的名号在圈子里打响了。这点我认为非常有效的赋能到了我们的成员。

(这里也尤其感谢几位特别活跃的0xU前辈 @hoidya_ @wsjack_eth @0x_KevinZ 的鼎力输出,我老婆 @bc1qDave 的输出 + 管理, @ChingChaLong02 的猛C,以及 @0xBeyondLee @0xPickleCati @MaraCakeHotSale @unlimitedgame_ 等等朋友带来的曝光)

然而, @PennBlockchain 以及 FranklinDAO 有一点我是非常希望 @0xUClub 的下一代主席 @0xJianAn 学习的,那就是与生态之间的联系。

没错,与所有我所接触的华语区链协,以及 @0xUClub 这种更大规模的学生组织不同,Penn的区块链协会获得了 @a16z 的背书,在公链生态有投票权,而且会定期参与黑客松。很多成员也在美国这边的大项目做到了重要的位置。

这点,尤其是公链的参与能力和贡献能力,我认为是全华语区的学生链协应该去争取的。

目前我也申请了成为Penn Blockchain的成员,希望能够进行进一步的跨文化交流学习,构建起新生代区块链跨越文化与地域的桥梁。

这里也特别感谢一下 @issue_wong @TangyMax 提前跟我介绍了情况,做了引路人。

不管怎样,学生是区块链下一代的重要贡献者,所以,我这里也希望能够呼吁各大公链,各大交易所,把更多的机会,交给学生链协的成员。

小结:

不管怎样,来美国的这段时间,真的学了超多东西。

之后会做更多有趣的分享,继续补齐认知差!

记得点关注! 三连!
Prijavite se, če želite raziskati več vsebin
Pridružite se globalnim kriptouporabnikom na trgu Binance Square
⚡️ Pridobite najnovejše in koristne informacije o kriptovalutah.
💬 Zaupanje največje borze kriptovalut na svetu.
👍 Odkrijte prave vpoglede potrjenih ustvarjalcev.
E-naslov/telefonska številka
Zemljevid spletišča
Nastavitve piškotkov
Pogoji uporabe platforme