DeepSeek为何来自于一个量化公司

Sinya2025年1月31日

目前最热门的话题之一必然是DeepSeek。这家中国公司以不到600万美元的训练成本，就开发出与OpenAI旗下ChatGPT性能接近的AI模型。

DeepSeek的突破完全在我意料之中。这家公司源自中国头部量化交易机构幻方量化，作为另一家量化机构创始人，我深刻理解这类突破为何会诞生于量化机构。

在阿尔法星研究，我们的交易决策完全由自主AI模型驱动。当模型性能提升20%，公司利润就会同步增长20%——这意味着资产负债表上的真金白银。这种反馈机制直接而高效：模型越强，利润越高。训练费用由公司自有资金承担，因此每节省一美元训练成本，都会直接转化为公司利润。与幻方量化类似，阿尔法星研究自身具有强大盈利能力，这使得我们在AI研发中必须精打细算，始终关注技术实效。

OpenAI则呈现截然不同的商业模式。作为尚未盈利的创业公司，其估值（及山姆·奥特曼个人财富）完全取决于资本市场的认可。虽然ChatGPT的性能提升有助于估值，但这种关联链条过于漫长。在训练成本方面，OpenAI甚至存在反向激励——越是豪掷千金采购GPU，越能向投资人证明大模型研发的”必要投入”，从而推高公司估值。这种独特生态催生了令人玩味的现象：OpenAI在训练上的”挥霍”程度，反而成为其估值攀升的推手。

深入剖析可见耐人寻味的角色错位：DeepSeek虽属金融企业，但其利润完全源自技术创新，是真正以技术为本的机构；OpenAI虽冠以科技公司之名，其资金却来自金融估值游戏，本质上更接近金融运作。这种差异在创始人背景中亦可见端倪：DeepSeek CEO梁文峰是幻方量化联合创始人兼技术负责人，而OpenAI创始人山姆·奥特曼则出身Y Combinator创投机构。

量化机构称雄AI研发还另有深层原因。金融市场赋予我们处理”带噪声小数据”的独特能力：在阿尔法星研究，我们面对的是被市场操纵者污染的、仅GB级的金融数据。这种环境倒逼我们专注于模型架构创新，而非盲目堆砌H100显卡和PB级数据。

另一个关键优势来自极速系统构建能力。为实现高频交易的微秒级优势，我们建设了横跨东京、香港、芝加哥、纽约的微波通信网络，确保交易系统全链路延迟低于1毫秒（甚至微秒级）。这种追求极致效率的技术基因，正是媒体报道中DeepSeek绕过CUDA、采用底层编程优化训练效率的根源——这正是量化机构做AI的标准操作范式。

创立阿尔法星研究前，我曾在美国顶尖量化机构城堡证券（Citadel Securities）担任研究工程师，更早则在亚马逊、Meta等科技公司任职。一个有趣的对比是：当我在科技公司工作时，提及职业总会收获赞誉，常有人感谢我为科技进步作贡献；但在城堡证券期间，每次谈及雇主，往往遭遇尴尬沉默，甚至被指为”邪恶对冲基金从业者”。这种认知偏见令人遗憾。正如计算机与互联网最初源自军事需求，最终惠及全人类，我相信以DeepSeek/幻方量化为代表的量化机构，将与软件互联网企业共同推动AI技术革命。阿尔法星研究也将为此持续贡献力量。

关于作者：李新野，阿尔法星研究创始人兼CEO。该公司是位于纽约的AI研究与量化交易机构。与DeepSeek创始人梁文峰相似，李新野同样来自中国广东省。

原载于我的英文博客：https://sinyalee.com/essays/?p=138 。中文翻译由DeepSeek提供。

Sinya

网站 http://sinyalee.com

文章已创建 269

20 个评论在 “DeepSeek为何来自于一个量化公司”

hy说道：

2025年8月4日 10:06

“仅GB级的金融数据”？据我所知，很多市场都可以提供TB级别的有效数据了

回复
人妻说道：

2025年11月3日 15:11

老铁，你太6了：

“为实现高频交易的微秒级优势，我们建设了横跨东京、香港、芝加哥、纽约的微波通信网络，确保交易系统全链路延迟低于1毫秒（甚至微秒级）”

回复
1. SCY说道：
  
  2025年11月17日 22:57
  
  你的名字也很6
  
  回复
fy说道：

2025年11月4日 01:22

梁文峰说过量化交易会把技术流的散户的钱赚走，AI模型的量化交易等于要把基本面分析、消息驱动甚至长线投资的散户的钱也赚走。交易是负和游戏，就像您在书里说的，手握顶级模型、超低延时网络在市场上就是对散户的屠杀，所以被指“邪恶”也是公平的。
或许为了对冲掉这种”邪恶”，幻方一是捐款，二是搞了deepseek，但至少deepseek本身的直接目的不是为了在交易市场里赚钱的。
那从社会上看，量化对社会的积极贡献就在于把财富转移到非常自律、非常聪明的人手中，并且这些人的一部分还有理想主义精神，能够把这些钱用来推动社会进步。

回复
1. daage说道：
  
  2025年11月4日 14:32
  
  看到你的回复，我知道为什么我抄美股亏了20多个点了，想到这里，我突然有点害怕，既然量化公司如此厉害，这不就是更加的形成了社会财富的壁垒，阻止底层人靠股市赚钱吗
  
  回复
  1. 劫色派说道：
    
    2025年11月7日 15:04
    
    是的，普通人越来越韭菜了。
    
    回复
2. 韭菜说道：
  
  2025年11月6日 19:21
  
  不被量化赚走就是被别的机构赚走，本质是自己不懂，如果这样说赚了钱的人邪恶，那大该就是种情绪宣泄吧
  
  回复
CG说道：

2025年11月4日 16:53

我们这几年在做一件事。
一句话讲，金融文本中存在普遍的数值错误，有方法可以及时发现。
这是个赢利点，也许可以和量化机构合作下。

回复
Cosya说道：

2025年11月5日 00:32

這篇文章很好的解釋了我的疑惑，感謝版主！另，現在市面上各家LLM都開始大量堆算力或循環金流也是同樣的道理嗎？

回复
xx说道：

2025年11月5日 10:58

小兄弟，个人从事过微波处理算法研究，纽约到芝加哥，1毫秒不大可能哦。金融数据需要硬编码->微波处理->空口发射+空口(30万公里/秒)+接收机处理->金融数据吐出。点对点收发处理可以压缩到20-50us(最简处理)，传输距离是物理特性，缩减不了。微波一般是中继多跳，时延还会增加的

回复
KJ说道：

2025年11月6日 01:26

当我在科技公司工作时，提及职业总会收获赞誉，常有人感谢我为科技进步作贡献；但在城堡证券期间，每次谈及雇主，往往遭遇尴尬沉默，甚至被指为”邪恶对冲基金从业者”。

Not anymore

回复
allwayes说道：

2025年11月6日 10:55

现在各行各业经常出现跨行碾压，小众行业也有这个现象，我常常也在想是为啥，人浮于事应该也是其中一个原因吧

回复
scofield说道：

2025年11月7日 17:10

既然这样，我们普通散户还有什么出路吗？

回复
1. 汕头第一老实人说道：
  
  2025年11月10日 22:27
  
  1. 买入QQQ，长期持有
  2. 销户，从此不玩股票
  
  回复
新兰永恒说道：

2025年11月10日 10:23

“建设了横跨东京、香港、芝加哥、纽约的微波通信网络，确保交易系统全链路延迟低于1毫秒”；作为一名互联网从业者，很难想象这是怎么做到的，这种横跨国家的专线，时延能做到这么低吗？如果是，衷心地佩服！

回复
logindeny说道：

2025年11月13日 14:42

打不过就加入，看来散户的出路就是加入量化的行列中。散户无论从哪个方面看，无疑都是最弱势的一类，倒也能理解，投资的准入门槛太低，散户本身也没有足够的经验能力对自己的资金负责。

回复
非一说道：

2025年11月15日 21:34

哥，年化收益方便透露吗？今年在A股翻倍从9月开始就吃大回撤，您的量化基金门槛是多少呀？

回复
kyksj说道：

2025年12月3日 12:49

“DeepSeek虽属金融企业，但其利润完全源自技术创新，是真正以技术为本的机构；OpenAI虽冠以科技公司之名，其资金却来自金融估值游戏，本质上更接近金融运作”
真的是醍醐灌顶啊。”Fake it until make it”的初创公司，和真正以市场、以利益为导向的量化机构，差距就在此吧！

回复
XXLBJ说道：

2025年12月13日 21:24

Sinya这篇文章是不是从同名英文博客直接AI翻译来的😂文风和平时不太像啊而且还有股AI味儿

回复
1. Sinya说道：
  
  2025年12月14日 08:12
  
  最下面不是说AI翻译的
  
  回复

Sinya

20 个评论 在 “DeepSeek为何来自于一个量化公司”

发表回复 取消回复

相关文章

20 个评论在 “DeepSeek为何来自于一个量化公司”

发表回复取消回复