首页 排行 分类 完本 书单 用户中心
搜书趣 > 都市 > 学霸的征途是星辰大海 > 第518章 和DS的合作 一

学霸的征途是星辰大海 第518章 和DS的合作 一

簡繁轉換
作者:见习人类观察员 分类:都市 更新时间:2026-06-20 22:49:26 来源:源1

第二周的一个上午,四月上旬,天气非常不错。徐辰前往了位于中关村的深度求索北京分公司。

深度求索北京分公司就在融科资讯中心,距离北大东门也就一公里不到。本身放在这边,就是为了吸引北大丶清华丶中科院这一圈密度高到离谱的高校人才。结果徐辰之前一直没意识到它居然这么近,近到石南把车钥匙都掏出来了,徐辰看了眼导航,沉默两秒后提议:要不骑共享单车吧。

于是,两人一人一辆共享单车,沿着北大东门外的路一路骑到了融科资讯中心。

……

把单车停在大厦楼下的专属非机动车划线区,徐辰抬头看了一眼这栋充满现代科技感的建筑。

就在这栋大楼里,藏着如今全球AI领域最炙手可热的超级独角兽。

回望过去的一年多的时间,整个全球AI市场经历了一场史无前例的大洗牌。

而这场十二级大地震的始作俑者,正是徐辰当年顺手用来「刷经验「的那套SLRM(逻辑增强模块)框架。

SLRM横空出世之前,整个AI产业的底层逻辑其实很简单粗暴——

拼算力,拼参数,拼谁家显卡堆得更多。

十万张H100起步,二十万张算入门。低于这个规模,你都不好意思说自己在搞前沿AI研究。

那时候的AI创业公司里,最重要的岗位不是首席科学家,而是首席融资官。因为模型还没训练完,帐上的钱可能先烧没了。

美国那边的资本市场则直接烧成了狂欢。2026年前后,OpenAI丶Anthropic等公司的估值一度接近万亿美元,折合人民币将近七万亿。华尔街最流行的一句话是:

「AI公司不是按照收入估值,而是按照未来人类文明的所有现金流估值。「

翻译成人话就是——反正先吹,吹爆了再说。

只要公司PPT里写上「AGI「,配一张炫酷的神经网络结构图,估值就能自动往上蹿三层楼。

然后SLRM来了。

SLRM引入了极强的符号逻辑推理能力,使模型不再单纯依赖概率预测来「蒙答案「。许多原本必须在云端超大模型上完成的任务,被小模型加逻辑增强模块就能完成得七七八八。

算力需求,出现了断崖式的下滑。

本地化部署随即兴起。企业不再非得把所有数据上传到云端,个人用户也能在自己的终端设备上运行足够强大的智能助手。

原本那些靠垄断算力起家丶靠「云端霸权「撑估值的科技巨头们,这下直接傻了眼。

市场格局瞬间从「几家寡头垄断「变成了「百花齐放,群魔乱舞「。

一句话总结:以前只有巨头玩得起AI,现在稍微有点工程能力的中型企业,也能在垂直场景里搞出像模像样的产品。

这对技术生态当然是好事。

但对那些靠算力护城河支撑着天价估值的美国AI巨头来说,就不那么友好了。

OpenAI和Anthropic在可用性上已经未必胜过全面拥抱新架构的国内企业,如今却仍靠着美股市场强大的金融想像力,死守着3000亿美元(约2万亿人民币)上下的估值。看起来帐面数字依然吓人,可懂行的人都清楚,和2026年**千亿美元的巅峰相比,这已经是腰斩再腰斩。

技术可以输,叙事不能输。

只要还能讲「美国引领AGI未来「的故事,股价就还能硬撑一段。这大概就是美国金融市场最动人的地方——即便皇帝已经没有新衣,只要华尔街的分析师还在卖力鼓掌,这场狂欢就不会轻易落幕。

当然,眼下的格局也并非铁板一块。

华为的LPU(逻辑处理单元)产能依然有限,而SLRM的推理能力对LPU的依赖远比传统GPU深得多。算力的硬体瓶颈,无形中给了美国AI公司一定的喘息机会。总体而言,如今华国在算法层面已经实现了对美国的全面超越,算力上略有差距但整体可控丶且未来可期,数据层面美国公司依然凭藉历史积累保有一定优势。华国AI曾经落后半年到一年的差距,如今已基本追平,并且一旦LPU产能跟上,大概率将彻底完成反超。

而在这场大洗牌中,最早抓住SLRM红利丶被徐辰亲手「点拨「过D-LTMN记忆机制的DeepSeek(深度求索),则借着这股东风一路狂飙,如今已彻底确立了全球AI技术Top1的统治地位。

市值1万亿人民币。

因为走的是开源普惠路线,帐面数字看起来不如美国那几家唬人。

但在真正懂行的人眼里,DS才是当之无愧的无冕之王。

……

一楼大厅里,已经有深度求索的员工等着接人。徐辰刚到,对方便快步迎了上来,态度十分恭敬地把他领进电梯,直接按下了最高层。

电梯门刚打开,梁文锋正好从办公室里出来。

「徐教授。」梁文锋先一步伸出手,笑得很自然,「终于把你等来了。」

「梁总,打扰了。」徐辰和他握了握手。

两人都不是那种喜欢把寒暄拉得很长的人,简单叙了两句近况,梁文锋便顺手带着徐辰在公司里走了一圈,简单地参观了下。

逛完一圈,两人很快回到梁文锋的办公室,门一关,外面的喧嚣就被彻底隔开了。

这次见面,前面的铺垫其实已经够了,真正要谈的只是最关键的细节。

梁文锋给徐辰倒了杯茶,自己在对面坐下,直接切入正题:「你先给我讲讲这套框架现在到哪一步了。」

徐辰也不绕弯,从包里取出笔记本,打开后,把「诸葛」架构的整体思路丶SLRM在灵感模块上的设计,以及目前那版Demo的测试结果,简单而清晰地过了一遍。

从为什么要把Transformer的概率式联想压下去,到为什么要用SLRM去接管高精度推演,再到模型在IMO压轴题上的表现,徐辰都讲得明明白白。讲到最后,他索性把笔记本转过去,让梁文锋看后台记录的几组效果数据。

梁文锋看得很认真。

他没有急着开口,先是把几页日志来回扫了两遍,手指在桌面上轻轻点着,像是在脑子里默算什么。几秒后,他才抬起头,目光里多了几分真正的兴味。

「很漂亮。」他先给了一个极高的评价,语气里没有半点敷衍,「不是那种『堆出来的漂亮』,是底层逻辑真的站得住。」

徐辰笑了笑,没接这个夸奖,只是安静等着他的下文。

梁文锋把笔记本推回给徐辰,身体微微后靠,话锋也跟着一转:「但我得先说句实话,这东西的商业前景,确实不太好。」

徐辰闻言,心里一点也不意外。

这种话术,他之前已经在其他公司那边听过几轮了。梁文锋这话,倒不完全是压价,这确实是事实。来之前他自己在心里也盘算过,这项目要是真铺开,算上高昂的机会成本,前几年非但见不到回头钱,大概率还会是个吞金的无底洞。

因为上百名顶尖工程师,按三百万年薪算都得一年3个亿;再加上稀缺的LPU算力卡,以及为了这个项目必须腾挪掉的其他商业模型的资源,整个成本轻轻松松就会滚到十个亿。

而这些钱砸下去,换来的却很可能只是一个「学术圈叫好丶商业上不赚钱」的产品。毕竟,这世上需要用到这台机器的顶尖数学研究者,满打满算也就那么一小撮人。

所以这事,看起来徐辰技术很牛,但其实在残酷的商业逻辑面前,手握资源的DS才是掌握主动权的那一方。

……

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报