大模型在经历了前期的热潮之后,如今逐渐降温,其背后的原因引人深思。
难点方面,盈利难和落地难是大模型面临的主要挑战。强如 OpenAI 也面临“恰饭”难题,其营收难以覆盖成本,且为推出新一代大模型需要更多投入。而国内大模型多数采取 ToC+ToB 的模式,但能产生付费的情况寥寥无几。同时,大模型还存在诸多局限性,如认知偏差、能动性欠缺、泛化性能弱、幻觉等,在数值运算等方面表现不佳,多轮对话时容易“健忘”。
卡点主要体现在数据、算力和成本上。数据方面,大模型需要高质量、大面积且多样的语料投喂,但数据的挖掘、获取涉及多方权益保障等问题,处理敏感信息时的清洗、标注、脱敏工作繁杂。算力方面,如同维持工厂运转的昂贵“燃料”,随着大模型规模扩大,算力需求倍数递增,超越硬件的摩尔定律。成本方面,大模型受限于算力,实际也是受限于高昂的成本。
尽管大模型降温面临诸多问题,但我们也看到其正逐步向产业迈进,尝试扮演浅层的 Agent 角色。比如华为的盘古矿山大模型,覆盖煤矿多个细分场景,用 AI 取代人进行精准监测。
未来,大模型如何突破这些难点、卡点和节点,找到可持续的发展路径,值得持续关注。