然而,这仅仅只是一张入场券。一年后,这个数字翻了13倍。
大模型公司的竞争,与其说是一场科学竞争,不如说首先是一场残酷的金钱角力。在资本方捂紧口袋的情况下,你要领先对手找到更多的钱,购买更多的卡,抢夺更多的人才。
“它需要人才聚集、资本聚集。”成立于2023年3月1日的大模型公司月之暗面(Moonshot AI)创始人兼CEO杨植麟说。

▲月之暗面创始人杨植麟
过去一年,国产大模型公司似乎处在一种紧迫而逼仄的生存边缘。看上去,他们每个都手握重金。但一方面,他们要把刚融的钱,立马投入极高昂的科研中追赶OpenAI——先是追齐GPT-3.5,没等追上GPT-4,Sora又来了;另一方面,他们要马不停蹄在落地场景上找可能,自我验证你是一家公司、而不是只会吞噬资本金的研究所;这还不够,每个项目不管是上市还是并购,出路更是毫不明朗。
2024年2月19日,国内大模型公司月之暗面已完成新一轮超10亿美金的融资,投资方包括红杉中国、小红书、美团、阿里等,震撼了整个科技界。
这是中国大模型初创公司自ChatGPT出现至今的最大一笔单轮融资。本轮融资后,月之暗面估值已达约25亿美金(约180亿人民币)。这意味着,作为一家成立不到一年的公司,月之暗面已进入国内大模型创业公司第一梯队,成为智谱AI、MiniMax、百川智能、零一万物之外的又一独角兽。
▲月之暗面创始人杨植麟
杨植麟,1993年出生,广东汕头人,曾就读于金山中学。高中时期,没有任何编程基础的杨植麟被选拔进信息学奥林匹克竞赛培训班,之后在全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖,因此获得清华大学保送生资格。然而尽管已经保送,杨植麟在当年高考中还是拿下了667的高分,远超清华大学在广东的录取线。
进入清华大学后,杨植麟延续着“学霸路线”。杨植麟最初被清华大学热能工程系录取,但在大二杨植麟就转专业进入计算机系。
2015年,杨植麟以年级第一的成绩从清华大学毕业,随后前往卡内基梅隆大学语言技术研究所攻读博士学位,只用4年时间就完成了一般6年才能完成的博士课程。
在博士期间,杨植麟成了AI领域的风云人物,他与多位图灵奖得主合作发表过论文,在众多计算机顶级国际会议发表论文20余篇,研究成果累计Google Shcolar(谷歌学术搜索)引用超过17000。其中,杨植麟作为第一作者发表了两项深度学习领域的关键研究成果——Transformer-XL和XLNet,这两篇论文在学术界产生了重要影响。而杨植麟本人的学术引用量自2019年起到现在,已超2万次。
除了学术成就之外,杨植麟还在Meta(美国互联网科技公司)的人工智能研究院和谷歌大脑研究院工作,获得过DREAM9全球癌症预测大赛第一名,阿里巴巴天池大数据竞赛全球第二名。
▲杨植麟与导师Ruslan Salakhutdinov(右)、William Cohen(左)合影
2016年,博士在读的杨植麟首次创业,以联创身份参与创立了循环智能,其旨在运用多种AI技术,为企业打造“销售科技”方案。2021年,循环智能还与华为云合作开发了千亿级NLP大模型盘古大模型。
在ChatGPT爆火后,意识到大模型创业机会到来的杨植麟,决定再次创业。2023年4月,杨植麟等创立北京月之暗面科技有限公司(简称:月之暗面/Moonshot AI),主要致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能,曾主导和参与了国内外多例经典大模型开发,包括Google Bard,google Gemini、盘古和悟道一系列大模型。
资料显示,北京月之暗面科技有限公司成立于2023年4月,法定代表人杨植麟,注册资本100万元,行业所属其他科技推广服务业。公司经营范围包含:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发等。
公司成立后已迅速完成首轮市场融资,获红杉、真格等一线VC的押注,市场估值被曝约在3亿美元。公司拥有明星团队,核心成员多出身清华系,尤其是其主要创始人杨植麟是清华教授唐杰得意门生、清华大学交叉信息研究院助理教授。
公司由杨植麟,周昕宇,吴育昕,张宇韬,汪箴五人共同持股,其中杨植麟为最大股东,持股比例78.96%。
不到31岁的杨植麟,参与制作AI大模型的资历却远超许多同龄人,曾先后参与国外的Google,国内的盘古NLP、悟道等大模型的研发,有些媒体称其为“中国大模型90后第一人”。
2023年6月,科技媒体《The Information》盘点了中国AI初创企业Top5,分别为MiniMax、澜舟科技、智谱AI、光年之外(已被美团收购)以及杨植麟——杨植麟是唯一一位以个人名字入榜的参与者。
2023年10月,月之暗面宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat,一经发布便引起了各方关注。
据悉,Kimi Chat最多支持20万汉字的超长文本输入,是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。反观其他模型,Anthropic的Claude-100k模型仅支持约8万字,而OpenAI的GPT-4-32k更是只支持约2.5万字,这标志着月之暗面在这一重要技术上取得了世界领先水平。
据杨植麟介绍,Kimi Chat具备超长文本处理能力的关键在于:一是能支持高达20万甚至更长的上下文窗口的处理;二是Kimi Chat使用了无损压缩技术。这使得Kimi Chat在处理较长上下文的同时,很好地保证了信息处理的准确性,不管答案出现在开头、中间、结尾,亦或是需要融合不同的文档位置的问题进行回答,都可以给出准确的答案。
“我想有一条更激进、更彻底的路径去打破学术界与工业界的壁垒。”被问及创业的原因时,杨植麟曾这样答道。
在过去,勤奋、刻苦、实干是潮汕人广为人知的创业精神。如今,像杨植麟这样的90后创业者挑起大梁,他们拥有更宽阔的眼界、更快速的步伐,为潮汕人的“创业基因”注入更多创新动能。
杨植麟在国内科技界被称为技术信仰派的代表人物。他认为,AGI是未来10年内最值得做的一件事,AGI的发展不仅是为了短期的产品市场契合,而是要在未来十到二十年内实现对世界的深远改变。
为何能在AI赛道拔得头筹?因为不走寻常路。在创业与学术的双轮驱动下,杨植麟等新一代实干家,展现出了与其他大模型创业公司不同的态度和气质,他与背后团队的自信和野心,以及致力成为“中国人自己的Open AI”的雄心壮志,正书写着中国人工智能的广阔未来。
天下潮商综合编辑
来源:汕头发布、华商韬略、腾讯《潜望》等
【编者声明】
本公众号部分素材来自网络,版权归原作者所有。编者收集整理,旨在与大家分享学习。如您认为某些内容侵犯您的权益,请及时告知,我们核实后将采取相应措施。