关键词 人工智能
加强基础研究和关键核心技术公关,超前布局重大科技项目,开展新技术新产品新场景大规模应用示范行动。开展“人工智能+”行动,培育未来产业。加强国家战略科技力量建设。 ——中央经济工作会议
谭待 火山引擎总裁
巨头下场厮杀,MaaS(模型即服务)战事进入白热化。作为新入局者,火山引擎给外界最深的印象就是凶猛、降价——2024年5月豆包主力模型将推理输入价格降至“厘时代”,12月火山引擎又让视觉理解模型进入“厘时代”,甚至一度被贴上“价格战”的标签。
火山引擎总裁谭待在接受新京报贝壳财经记者专访中详细解答了两次降价的决策过程,以及是如何通过算法、软硬件和工程的方法将大模型的价格“打下来”,并表示火山引擎从不赔钱换市场,也不通过投资来换市场。他不认同“价格战”的说法,“平台公司就像池塘里的鱼,未来鱼能多大,都取决于池塘多大,我们要想尽量把池塘做大,而不是把别的鱼吃掉。”新京报首席记者 白金蕾 记者 韦英姿
从不赔钱换市场,降价源于技术创新和规模效应
新京报贝壳财经:2024年5月豆包主力模型的推理输入价格降到“厘时代”,12月火山引擎让视觉理解模型进入“厘时代”,是如何将价格打下来的?
谭待:首先要讲为什么要做这件事情,这个是很关键的。大家花这么多的资源去做大模型的训练,是为了更多企业能把模型用起来,用起来之后,才能通过AI(人工智能)帮助更多个人和企业提效,特别是中小企业。这就是为什么我们要做“AI普惠”的工作。
当然对于to B(面向企业的)业务来说,它的商业模式很直接,所以不管再怎么普惠,一定是要做到可持续,不能用亏损换规模。所以我们其实在技术上做了大量优化,既实现了大模型普惠理念,也能让我们的业务做到有毛利。
新京报贝壳财经:5月降价后,百度、阿里、腾讯还有很多创企均跟进了“降价”,是否有考虑到行业其他厂家的跟进?
谭待:他们肯定会跟进的,因为我想大家都有一样的初心,还是希望把大模型做好,赋能更多的企业和开发者。如果大家初心一致,肯定就会走这条路,无非就是我们走得快一点,他们走得慢一点。
给“豆包”打分:谦虚一点打80分
新京报贝壳财经:你曾表示“不急于推出只有30分的大模型,核心是赋能其他人做这件事。”你给这次换新的豆包大模型家族打多少分?
谭待:打80分,谦虚一点。
这次有几个大的更新,第一个,我们推出了视觉理解模型。第二个,我们的语言模型豆包PRO(专业版)也有非常大的提升,特别是在企业生产力相关的办公产品里,比如复杂指令的遵循,综合任务的处理,然后数学逻辑、推理能力等,整体上已经对齐了 GPT-4o(OpenAI发布的语言模型)。最后,我们在很多垂直领域,比如文生图、音乐模型,其实都有进一步的升级。
新京报贝壳财经:最近国内几家大厂的动作比较分化,百度文心一言和阿里通义千问都在深耕大语言模型或者基座大模型,而字节、快手、腾讯等都在做AI(人工智能)生成视频,这是为什么?
谭待:其实我不太能猜测他们的想法,只能说一下我的想法。以终为始地看问题,企业做大模型是为了辅助人去做各种事情,人做事情的时候需要很完整的能力,包括语言、视觉、创作甚至完成更复杂的指令。这就需要模型具备多模态能力,才能端到端帮个人创业者和企业去解决具体的问题,也才能有更高的社会价值和经济价值。
新京报贝壳财经:以豆包大模型的实践来看,Scaling Law(规模化法则)是否还成立?
谭待:Scaling Law是一个普世的概念,在没有大模型的时候,我们做深度学习、机器学习或者推荐广告时,都发现有数据、算力加大,效果提升的情况。回到大模型本身,其实大模型训练有很多阶段,比如Pretraining(预训练)、SFT(监督微调)和RLHF(强化学习)。在不同阶段都有Scaling Law,区别就在于到底在哪个阶段优化模型的性价比最高。
新京报贝壳财经:很多云计算厂商都在投资AI大模型企业,一般是给“一部分投资款+一部分算力”,火山引擎是否有类似的计划?会采取怎样的计划构建生态企业?
谭待:我认为用投资来换收入是一件没有意义的事情。我们也有投资团队,但我们更多是做战略投资,比如说被投企业的能力,是火山引擎整体对外服务比较重要的能力,我们就会进行投资。
新京报贝壳财经:这几年大模型企业经历了怎样的发展?2025年会有哪些趋势?
谭待:我认为这几年乃至未来模型的训练量每年还是会增加的,但把应用做起来也很重要,不然前期投入的资源可能就浪费了,最后应该是应用的市场空间要比训练的市场空间大5倍左右,投入才能算得正。做好应用则需要好的模型、需要AI普惠,这是我们云计算企业要做的事情。所以我觉得2025年更适合去推好的模型,我相信2025年不管是中国还是世界会涌现更多AI应用,不管是to C还是to B的。