小鹏发力720亿参数自驾基模,开启自动驾驶新征程
小鹏聚焦发力720亿参数自驾基模,稳健开启自动驾驶新的征程

在汽车行业步入大模型研发热潮之际,4 月 14 日,小鹏汽车于香港举办 AI 技术分享会,首次公开披露正在研发的 720 亿参数超大规模自动驾驶大模型 ——“小鹏世界基座模型”。未来,小鹏将采用云端蒸馏小模型的方式,把基模部署至车端,为 “AI 汽车” 装上全新 “大脑”,该模型还将为小鹏的 AI 机器人、飞行汽车等赋能。
小鹏汽车自动驾驶负责人李力耘介绍,小鹏基模以大语言模型作为骨干网络,借助海量优质驾驶数据训练,是多模态大模型。它具备视觉理解、链式推理及动作生成能力。经强大的强化学习训练,基座模型持续自我进化,有望逐步发展出超越人类的自动驾驶技术。
为研发基模,小鹏汽车早在去年便着手布局 AI 基础设施,现已建成国内汽车行业首个万卡智算集群,用以支撑基座模型的预训练、后训练、模型蒸馏、车端模型训练等任务。小鹏将这套从云到端的生产流程称作 “云端模型工厂”。目前,小鹏 “云端模型工厂” 算力达 10 EFLOPS,集群运行效率常年维持在 90% 以上,从云到端的全链路迭代周期平均 5 天一次。
早在 2024 年下半年,小鹏汽车就已面向 L4 级别的自动驾驶,研发全新的 “AI 大脑”—— 小鹏世界基座模型。研发团队利用优质自动驾驶训练数据,先后开发出多个尺寸的基座模型,目前正全力推进 720 亿(72B)超大规模参数世界基座模型的研发,其参数量约为主流 VLA 模型的 35 倍。
小鹏世界基座模型的显著优势是具备链式推理能力,在充分理解现实世界的基础上,能像人类一样进行复杂的常识推理,并将推理结果转化为行动,比如输出方向盘、刹车等控制信号,实现与物理世界的交互。未来,在基座模型的赋能下,智能驾驶系统有望从 “模仿人类” 迈向 “超越人类”,最终解决全场景的自动驾驶问题,包括模型从未在训练数据中遇到过的难题。
自设计之初,小鹏汽车就将基模定位为可泛化到多种具身终端的基座模型。李力耘表示:“小鹏世界基座模型是小鹏自动驾驶迈向 L3、L4 的基石,也会成为未来小鹏所有物理 AI 终端的通用模型。” 后续,小鹏世界基座模型将全面赋能小鹏 AI 体系,应用于小鹏汽车的 AI 汽车、AI 机器人、飞行汽车。
为开发小鹏世界基座模型,小鹏汽车打造了 “云端模型工厂”,其 “车间” 涵盖基座模型预训练、后训练、模型蒸馏、车端模型预训练到部署上车的完整生产链路。“云端模型工厂” 采用强化学习、模型蒸馏技术路线,能高效生产 “小身材、大智商” 的端侧模型,甚至可为不同需求的汽车定制专属 “大脑”,让 “千人千面” 的模型研发成为现实。
小鹏汽车自 2024 年开始搭建 AI 基础设施,目前已建立起万卡规模的智能算力集群,是国内汽车行业最大的自动驾驶算力集群。小鹏汽车算力储备达 10EFLOPS,集群利用率常年超 90%,高峰时运行效率可达 98%。
小鹏世界基座模型负责人刘博士介绍,多模态模型训练的瓶颈不仅在于 GPU,数据访问效率也需解决。小鹏汽车自主开发底层数据基础设施,使数据上传规模提升 22 倍、训练中的数据带宽提升 15 倍;通过联合优化 GPU/CPU 以及网络 I/O,最终让模型训练速度提高了 5 倍。目前,小鹏汽车用于训练基座模型的视频数据量高达 2000 万 clips,今年这一数字将增至 2 亿 clips。
依托强大的 AI 基础设施和数据基础设施,小鹏开启全新的基座模型研发范式,从云端模型预训练到车端模型部署,整个 “云端模型工厂” 的迭代周期平均 5 天一次。
在分享会上,小鹏汽车披露了基模研发的三个阶段性成果:验证规模法则在自动驾驶领域持续生效;在后装算力的车端成功实现基模控车;启动 720 亿参数基模训练,搭建针对强化学习的模型训练框架。
规模法则揭示了大模型性能随计算量、训练数据量和参数量提升而增强的规律,被视作 AI 领域的 “摩尔定律”。在大语言模型领域,规模法则已得到充分验证,但自动驾驶基座模型更为复杂,其训练数据包含摄像头信息、导航信息等物理世界的多模态数据,本质上要求模型对物理世界形成认知与理解。此前,利用驾驶数据训练基模,尤其是参数规模扩大到百亿级别后,规模法则是否依旧生效,行业内尚未有充分验证。小鹏团队首次证实了规模法则在自动驾驶领域持续有效。刘博士称:“过去一年,我们开展大量实验,在 10 亿、30 亿、70 亿、720 亿参数的模型上,均看到显著的规模法则效应:参数规模越大,模型能力越强。同样的模型大小,训练数据量越大,模型能力也越强。”
不久前,小鹏汽车将理论转化为实践,在后装算力的车端用小尺寸基模实现了控车。尽管只是早期实车测试,但全新基模已展现出令人惊喜的基础驾车技能。
小鹏汽车去年就已开展强化学习技术研发,以提升基座模型的性能上限。刘博士表示,强化学习能助力模型自我进化,学会处理训练数据中未出现的长尾问题,实现极致安全的自动驾驶。只有足够强大的基座模型,才能被强化学习不断激发能力上限。这也是小鹏汽车选择云端蒸馏路线的原因之一:在云端不计成本地训练出足够聪明且泛化能力强的模型,将其蒸馏到适配车端算力的小尺寸模型上,最终使车端模型性能突破车端算力限制。值得一提的是,强化学习、云端蒸馏等技术方案,在今年备受关注的 DeepSeek 论文中均得到验证。
基模研发是小鹏汽车 “AI 化” 转型的关键一步。即便进入 “大模型时代”,过去 “规则时代” 的领先经验仍在发挥作用。在开发强化学习的奖励模型时,研发团队依据规则经验设计奖励函数,将规则时代的沉淀转化为训练基座模型的生产力。
同时,小鹏汽车已着手开发世界模型,作为 “云端模型工厂” 的重要部分,为基座模型的性能优化提供支持。刘博士介绍,小鹏的世界模型是一种实时建模和反馈系统,能基于动作信号模拟真实环境状态,渲染场景,并生成场景内其他智能体(即交通参与者)的响应,构建闭环反馈网络,助力基座模型不断进化,逐步突破过去 “模仿学习” 的局限。
今年 6 月,小鹏汽车将在计算机视觉国际顶会 CVPR 上,进一步分享小鹏世界基座模型研发和训练成果的更多细节,值得期待。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
责任编辑:乐乘
最新阅读
-
入胜如她,专为网球女性而生 Wilson Intr
世界网球领域领军品牌Wilson威尔胜刚刚度过了自己的110周岁生日。伴随见证现代网球运动发展的深厚底蕴和不断创新进取的基因,又让它作出了“网球运动新景象”的敏锐洞察。WilsonSportswear...
2025-02-06 13:10 -
-
-
-
-
昔日最强机皇宣告终结:鼎盛期苹果也不是对手!
编辑:Wallace小雷搜了一下之前写过的文章,发现原来早在2018年市场上就有消息存传出,三星可能会将旗下的顶级产线GalaxyNote系列“砍掉”,由其他产品取而代之。时间来到2020年前后,眼看...
2022-03-04 10:43 -
智能自动化在能源和公用事业行业的作用
随着世界对清洁、安全、可承受和可持续的电力的迫切需求,各国对于绿色能源的需求和新应用不断增长,从而希望采用可再生能源替代化石能源。能源行业正从监管转向创新,而其客户也从被动消费者转向需求旺盛的买家。以...
2022-03-04 10:42 -
小鹏汽车投资碳化硅半导体领域公司瞻芯电子
企查查APP显示,近日,上海瞻芯电子科技有限公司发生工商变更,新增股东广州小鹏汽车投资咨询合伙企业(有限合伙),同时公司注册资本由4921.88万元人民币增加至5111.46万元人民币。企查查信息显示...
2022-03-04 10:41 -
微软智能云Azure在华的第五个数据中心区域正式启
,微软联合世纪互联正式宣布,自2022年3月1日起,全新的Azure在华数据中心区域将正式启用,客户可以不受限制地对其进行访问。这是微软智能云在中国市场的第五个Azure数据中心区域,由其合作伙伴世纪...
2022-03-04 10:39 -
处理复杂的数据集成,你还在编写脚本吗?
数据并不单独存在于一个数据库、文件系统、数据湖或存储库中。在记录系统中创建的数据必须满足多种业务需求,与其他数据源相集成,然后才能在分析、面向客户的应用程序或内部工作流中使用。例子包括:来自电子商务应...
2022-03-04 10:32