据多方消息,最近阿里巴巴领投了AI大模型公司MiniMax的新一轮融资,后者投后估值已经超过25亿美元。
这是阿里巴巴进入2024年之后在大模型领域传出的第二笔投资。此前有诸多报道指出,二月中旬月之暗面完成的那笔8亿美元的B轮融资背后,阿里巴巴也是领投者,甚至几乎可以认为是唯一投资方,月之暗面的估值也在这笔融资后超过23亿美元。
算上这两笔投资,阿里半年内已经官宣了对5家AI大模型公司的投资,分别是智谱AI、百川智能、零一万物、月之暗面和MiniMax。这5家也是目前国内仅有的涉足基础模型层的独角兽公司。
这一切总结起来就是,阿里巴巴正在加速“微软化”。
1月31日,微软发布了2023年最后三个月的财报,季度营收创纪录的达到620亿,总市值迈上3万亿,超越苹果。
其中智能云业务(包括Azure服务)营收为258亿美元,微软投资者关系副总裁布雷特·伊弗森(Brett Iversen)表示,Azure第二财季增长中的6个百分点归因于人工智能,是第一财季3个百分点的两倍。有分析者做过测算,微软云业务收入中与生产力和业务流程分部相关的增长——Office/Microsoft 365商业版、GitHub以及Copilot等等——在最近的四个季度中贡献的云计算收入增速超过40%。
云业务高增速的背后,微软的股价在2023年累计增长了57%。
相反,阿里巴巴同样视之为未来增长支柱的云业务,增速从2019年的84%到去年接近停滞,在中国公有云市场中的份额比2022年萎缩了5.8%。
鲜明的对比背后,原因除了欧美市场有成熟得多的软件市场之外,几乎可以完全归功于OpenAI这一家公司。微软这一季度的财报会上,微软公布了一个惊人数字,目前微软拥有5.3万个Azure AI客户,其中1/3是过去12个月加入的。
而且,在微软的财报之后,有投行做过一个分析,根据美股公司的会计准则,事实上OpenAI使用微软云进行训练给微软带来的收入,并没有在财报里被算作微软的收入。那6%的增长里,直接来自OpenAI的收入,更多是OpenAI在微软云上的推理任务带来的。
未来会如何计算训练模型带来的收入尚属未知,但一方面它一定会一直吊足资本市场的胃口,另一方面,哪怕训练部分今天无法计入收入,由此而产生的推理业务却已经快速给云厂商带来实打实的业绩表现上的优化了。
而对于阿里云来说,这些推理需求来自哪里,就来自这些中国OpenAI候选者们。像微软一样,阿里也要找到自己的OpenAI,而在格局未定的当下,阿里巴巴的投资策略很直接:有钱,我全都要——今天在中国能投资大模型的投资方里,有明确all in AI的自上而下的战略,有充足的历史积累的现金业务贡献的弹药,和一个能承载也能从中获益的云业务的公司,可能只有阿里。
于是进入2024年,基础模型层的第一梯队逐渐清晰,阿里巴巴的投资动作也更加强势。在今年月之暗面和MiniMax的两笔融资中,阿里巴巴均为领投方,这是与此前几笔它参与的投资最不同的地方。
这种转变发生对大模型的关注重心从抽象的模型能力转入应用层落地的时间点上——推理需求和收入贡献的爆发期。
在阿里这种地毯式投资中,算力支付也成了一个常见的方式,这些算力很可能是绑定在模型训练上——模型公司需要在算力紧张之下给自己一些资源上的确定性,而阿里既然暂时无法把训练部分转化为财报里的营收,那不如用来直接抵换投资的资金。同时,这些投资也同时是订单,被投的模型公司带来的推理部分可以立刻体现在与AI相关的云业务增长上。
这也是为接下来更多样的应用层的算力需求增长做准备,阿里要最大限度的占领开发者脚下的土地,所以在对大模型初创公司第一梯队扫货的同时,也宣布把云服务的价格降到了历史最低。
这同样是微软已经体现出来的思路。
纳德拉在去年5月接受采访预测未来世界上会有10亿开发者。微软在大模型领域几场重要的投资布局则在一步步为这句话做铺垫。
对OpenAI的长期投资自不必说,现在Azure已经是OpenAI的独家云服务商,而微软不仅拥有OpenAI技术的优先使用权,也是唯一能够用OpenAI的技术来做商业化的公司。
而与Meta合作,将Llama2引入Azure云计算服务的动作,让微软站到了目前大模型最主流的开源模型生态上游。
近日一纸价值21亿美元的多年协议则让Mistral进入了微软的版图。Mistral对于GDPR和欧盟AI法案的适应性是OpenAI不具备的,而Mistral已经证明了它在小参数模型上的优越性,小参数模型在Agents开发和应用上的优势或许会让它成为当下个人开发者最愿意选择的系列模型。
这也可以解释为什么HuggingFace在去年8月获得了一笔2.35美元的融资,投资方里同时出现了谷歌和AWS——微软作为另一朵欧美市场主流的云厂商就像是被联手挡在门外了。而《福布斯》仍然相信微软未来会收购HuggingFace,哪怕会花费巨大代价,就像Transformer框架出现一年后微软用75亿美元收购了GitHub一样。
而这部分似乎是阿里比微软走的更快的地方,阿里云的通义千问和魔搭社区就是微软寻求的LLaMa、Mistral和HuggingFace。
去年12月,阿里云开源了对标Llama2-72B的模型Qwen-72B,以及一个小模型Qwen-1.8B。加上之前7B和14B两个参数量的开源模型,通义千问是国内少有的全尺寸开源的模型系列。而通义千问也是国内开源的主流大模型中唯一开源了72B级别尺寸的。阿里云推出的大模型开源社区“魔搭”已经吸引了280万开发者,模型下载次数已经超过1亿多次,成为国内体量最大的AI模型社区。