《长安的荔枝》这个故事,讲述了如何克服重重困难,将易腐烂的荔枝及时运送到长安。这个故事与当前“世界模型”领域的发展有着异曲同工之妙。Physical AI(物理AI)所要解决的问题,如同故事中的“鲜荔枝”,而要实现这一目标,需要构建一套包含数据采集、模型研发、硬件部署的系统方案。
李一鸣,一位曾在英伟达任职的研究员,现任清华大学人工智能学院助理教授,他认为“世界模型”并非终点,而仅仅是解决问题的工具。他指出,“世界模型”只是“一匹运送荔枝的马”,其价值在于能否与其他环节协同工作,解决实际问题。
然而,李一鸣回国后发现,国内AI领域正面临着对“世界模型”的普遍焦虑(FOMO)。“世界模型”概念泛滥,视频模型、3D模型、具身大脑等,只要与仿真或物理沾边,都试图归入“世界模型”的范畴,导致该赛道估值泡沫严重。
相比于定义“世界模型”,李一鸣认为更重要的是构建一套能让机器人在各种场景下泛化的系统。为此,他提出的“Physical AI Infra”系统,通过数据和物理双轮驱动,包含两个核心组件:
- 数据管线:旨在将数据采集规模从行业平均的几十万小时提升至百万至千万小时。
- 物理引擎:实现“Real-to-Sim-Real”闭环,即基于真实世界数据构建仿真世界,用于机器人强化学习,最终在真实世界执行任务。
“世界模型”在此系统中扮演着关键角色,既是预训练的目标,也是机器人进行强化学习的仿真环境。该系统能够训练精细操作技能,并跨不同本体和多种应用场景部署,如生产制造、零售服务、酒店运营等。
基于这套技术方案,“厘清智能”公司于2026年4月成立,并在短短两个月内完成了多轮融资。据独家消息,其种子轮融资额高达数亿元,投资方包括顺为资本、红杉中国、高瓴创投等知名基金,以及智元机器人、灵心巧手等产业资本。
“厘清智能”吸引投资的原因在于其独特性。一方面,李一鸣团队在空间感知、多模态推理、自动驾驶及具身智能等领域拥有深厚积累。团队成员大多为清华学生,平均年龄23岁,弥补了国内软硬一体化人才的稀缺。另一方面,公司选择了“重”的技术路线,从数据采集到模型训练、物理引擎,全部自主研发。李一鸣认为,打通所有环节才能确保信息畅通和协同优化。
李一鸣计划在今年年底前发布面向B端场景的世界模型,并于2028年实现解决方案的规模化落地,最终目标是交付一套软硬一体的系统解决方案,跨本体、跨场景解决问题。
李一鸣在采访中阐述了其观点:
Physical AI 公司,不是本体公司,也不是模型公司
- “厘清智能”提供的是一套系统,而非仅仅是“世界模型”。公司以解决实际问题为导向,将数据、模型、硬件、Infra 整合为能在场景中工作的系统。
- 新一代 Physical AI 团队的核心特点是“全栈”,从数据采集设备到模型训练,全部自主研发,以实现规模化数据采集和高效的强化学习平台。
- 未来的具身公司应是“World Model as Service”公司,提供软硬一体的系统解决方案,而非单一的世界模型。
- Physical AI 的人才画像是“软硬一体”,国内对此类人才需求迫切,公司通过内部培养来解决人才短缺问题。
不能只做数据采集,忽视物理规律
- 具身模型的参数量需要达到甚至超过语言模型,才能实现“智能涌现”。
- 人类数据比真机数据更容易规模化,通过与各场景方合作,可快速积累海量数据。
- 仅靠数据采集不足以支撑 Physical AI 泛化到所有场景,物理规律是弥补数据局限性的关键。
- “厘清智能”设计的世界模型方案,通过少量真实数据校准物理规律,可大幅减少机器人学习成本,例如切苹果的练习。
VLA、视频模型、JEPA,都不是“原生世界模型”
- 世界模型负责机器与世界的交互,语言模型负责机器与人的交互。基于LLM的VLM、VLA与物理世界适配性不强,因语言模型是高度离散化的空间。
- 世界模型的训练需要SFT和RL的结合,并依赖于数据和物理Infra。公司自研的可微物理引擎确保了训练过程符合物理约束。
- “原生世界模型”应是全栈打通感知、推理、决策、动作输出,并面向机器与世界交互任务设计的。VLA、JEPA、视频生成模型均非原生世界模型。
- 训练“原生世界模型”的关键在于高效的物理世界tokenization,即将多模态观测压缩为模型可理解的Token序列。
- 构建Physical AI Infra是另一大挑战,需要设计高效的物理引擎来支持机器人进行强化学习。
2028 年会是 Physical AI 规模化落地的 milestone
- 轮臂(带轮子的机械臂)是当前适配多数操作场景的硬件形态,比人形机器人更具实用性。
- 公司前期将与场景方积极合作,优先切入工业、物流、生活服务等B端场景,积累数据和技能,最终服务于C端。
- 最终目标是打造一款通用的Physical AI Infra,如同iOS之于移动应用,实现各类物理操作任务的规模化开发和部署。
- 预计2028年,随着数据采集规模和电机密度的提升,Physical AI将迎来规模化落地的重要节点。

资深球迷
凭借其全面的功能和卓越的赛事覆盖,本平台为您提供无与伦比的观赛体验。
回复