参考:
我所见过的梁文锋》,公众号:聪明投资者;
一名程序员眼里中国量化投资的未来》,公众号:橙小巫;
疯狂的幻方:一家隐形AI巨头的大模型之路》公众号:暗涌Waves;
揭秘DeepSeek一个更极致的中国技术理想主义故事》公众号:暗涌Waves;

最近读到几篇文章,有些关于初心的感慨。


绝大多数人认识梁文锋,是从今年初DeepSeek的一鸣惊人,或是之前就知道他是幻方量化基金的创始人,但他最主要的角色其实一直是热爱人工智能的程序员。

求学

梁文锋早年就读的是浙江大学电子工程系人工智能方向,从那时开始他就无比坚信“人工智能一定会改变世界“。

也就是从这颗初心开始,决定了他后面走的每一步。

量化交易

毕业后,他没有像周围人一样去大厂做个程序员,而是躲在成都的廉价出租屋里,不停接受进入诸多场景中尝试的挫败。在2008年最终切入了最复杂场景之一的金融,开始了量化交易之路。这条路不仅能够继续探索热爱的人工智能技术,而且顺便完成了人生第一桶金的积累。

2015年,经历过7年熊市牛市大轮回,以每年超过100%的复合收益率迈入了亿元富豪的队伍。梁文锋认为中国的量化交易将从‘单兵游侠’的时代转向极客汇聚的私募基金时代。他和IT圈的朋友创办了自己的公司,希望能打造一支世界一流的量化私募团队。他们给自己的公司取名‘幻方科技’。

2019年的8月30日,在中国证券报举办的私募金牛奖颁奖典礼上。梁文锋作为量化投资论坛的第一位演讲嘉宾发言。后来这篇演讲的完整实录被幻方整理成了《一名程序员眼里中国量化投资的未来》。他演讲的最后一句话是:“作为对冲基金,我们的使命是,提高中国二级市场的有效性

2021年,成立仅六年的幻方,抵达千亿规模,并被称为“量化四大天王”之一。

而幻方的主要班底里,很多人是做人工智能的。

同时,幻方还很有先见之明地逐步完成了万张显卡的储备。通常认为,1万枚英伟达A100芯片是做自训大模型的算力门槛。

至此,做大模型必然涉及的钱、人、算力,已初步集齐。

我们现在比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。
--by: 梁文锋,from:《疯狂的幻方:一家隐形AI巨头的大模型之路》公众号:暗涌Waves;

大模型

2023年7月17日,梁文锋把下场做大模型的新组织从幻方中独立出来,成立了深度求索。他强调深度求索将专注于做真正人类级别的人工智能。他们的目标,不只是复刻ChatGPT,还要去研究和揭秘通用人工智能(AGI)的更多未知之谜。

以实现AGI为目标,致力于参与到全球创新的AI浪潮里,2024年5月在基于对大模型架构层面的创新中诞生的DeepSeek V2大模型实现了同等性能下推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一,而且发布即开源。一举打破“美国更擅长从0-1的技术创新,而中国更擅长从1-10的应用创新。”的固有成见。

无论API,还是AI,都应该是普惠的、人人可以用得起的东西。
--by: 梁文锋,from:《揭秘DeepSeek一个更极致的中国技术理想主义故事》公众号:暗涌Waves;

截至目前,7家中国大模型创业公司中,它是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做toC应用的公司,也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。


低调的梁文锋至今依旧很少接受采访,每天的工作也基本围绕着“看论文,写代码,参与小组讨论”,完全不像一个老板,更像一个一线研究员。这种简单而专注的态度,一直伴随他坚定地一步步走向自己初心中的最终目标。

用AI改变世界是初心,做量化基金的初心是给研究AI找到的最适合使用场景,顺便一不小心做成了业内前四,千亿规模。DeepSeek更是对于初心追寻的阶段性成果,又一不小心成了AI行业里的鲶鱼,带领全世界大模型企业展开降价,而且成为国家AI战略发展的底座。

即使哪天AGI已经实现,再即使这是经由DeepSeek的努力而率先实现的,我想那时梁文锋也不会志得意满地选择退休去过清闲日子,更不会就此躺平,而是会更加精神抖擞地在AGI的平台上继续立定下一个目标,继续努力用AI改变世界。

标签: none

添加新评论