拉斯维加斯(官方认证网站)登录入口·Made in Las Vegas

产品及服务 AI原生赋能平台 智算基础设施 AI算力调度与加速平台 拉斯维加斯DeepSeek版 DC·AI生态创新中心 行业解决方案 汽车 金融 医疗医药 合作伙伴 产品技术伙伴 联盟合作伙伴 拉斯维加斯官网 关于Las Vegas 关于我们 企业文化 ESG 联系我们 拉斯维加斯(官方认证网站)登录入口
2025/11/15
拉斯维加斯游戏官网|相川美沙绪|国内开源VLA最高star一作开讲!具身VLA大

  这也是智一科技在大湾区举办的首届机器人大会ღ◈✿。今年以来ღ◈✿,智一科技旗下智猩猩分别联合智东西ღ◈✿、芯东西已先后成功举办2025中国生成式AI大会ღ◈✿、2025中国AI算力大会ღ◈✿、2025全球AI芯片峰会等大型会议ღ◈✿。

  2025中国具身智能机器人大会(EAIRCon 2025)为期一天ღ◈✿,由主论坛+专题论坛+研讨会+展览区组成ღ◈✿,将以“具身启智 机器觉醒”为主题ღ◈✿,邀请近40位嘉宾带来致辞相川美沙绪ღ◈✿、报告ღ◈✿、演讲和对话ღ◈✿,全方位解构具身智能掀起的新一轮机器人革命ღ◈✿。

  主论坛将于上午在主会场+分会场一拉开帷幕ღ◈✿,将邀请知名学者ღ◈✿、产业领袖ღ◈✿、创业者ღ◈✿、技术大咖和顶级投资人带来分享ღ◈✿,并将进行一场高端对话ღ◈✿。

  具身智能人形机器人专题论坛则将于下午在主会场进行ღ◈✿,将聚焦人形机器人这一具身智能最佳载体及产业链层面的技术产品创新ღ◈✿。

  机器人模仿学习与强化学习研讨会拉斯维加斯游戏官网ღ◈✿、具身世界模型技术研讨会ღ◈✿、具身VLA大模型技术研讨会则会在分会场一ღ◈✿、二进行ღ◈✿,将邀请来自高校ღ◈✿、工业界的研究人员和技术专家带来主题报告和技术分享ღ◈✿。其中ღ◈✿,研讨会主要面向持有闭门专享票ღ◈✿、贵宾通票的观众开放ღ◈✿。

  今天ღ◈✿,将为大家公布具身VLA大模型技术研讨会的完整议程ღ◈✿。已经迫不及待报名的朋友ღ◈✿,可以先扫描下方二维码添加小助手报名啦ღ◈✿!

  短短三年ღ◈✿,从零星探索到主流浪潮ღ◈✿,VLA已经成为连接大模型与具身智能的关键桥梁ღ◈✿,不仅是当下最受关注的具身大模型技术范式ღ◈✿,更被认为是最具潜力的机器人基础大模型技术路线ღ◈✿,有望开启具身智能的GPT时刻ღ◈✿。

  在这一背景下ღ◈✿,2025中国具身智能机器人大会同期的具身VLA大模型技术研讨会将于下午的分会场二进行ღ◈✿,由主题报告和圆桌Panel两个环节组成ღ◈✿。

  上海交通大学长聘教轨助理教授穆尧ღ◈✿,上海人工智能实验室具身智能中心青年研究员曾嘉ღ◈✿,美的AIRC具身基础模型负责人文俊杰ღ◈✿,北京大学计算机学院副研究员兼信息技术高等研究院视觉智能实验室主任王钊ღ◈✿,OpenHelix-Team负责人ღ◈✿、VLA-Adapter一作丁鹏翔ღ◈✿,Alluxio首席架构师傅正佳ღ◈✿,清华大学在读博士ღ◈✿、SimpleVLA-RL一作李昊展等七位知名青年学者与技术专家出席并带来报告ღ◈✿。曾嘉博士也将主持本次研讨会以及圆桌Panelღ◈✿。

  在人工智能迈向真实世界应用的关键节点ღ◈✿,具身智能领域正面临数据稀缺与泛化能力不足的双重困境ღ◈✿。穆尧老师将以《人-数字人-机器人三元一体具身智能》为主题带来报告ღ◈✿,分享一项突破性解决方案——人-数字人-机器人三元一体具身智能架构ღ◈✿,通过充分挖掘互联网海量人类行为数据ღ◈✿、利用先进仿真引擎大规模生成策略合成数据ღ◈✿、并将虚拟学习成果迁移至物理机器人ღ◈✿,实现从专用机器人到通用智能体的质的飞跃ღ◈✿。

  曾嘉博士是上海人工智能实验室具身智能中心操作智能方向负责人ღ◈✿,研究方向为机械臂操作ღ◈✿、视觉-语言-动作大模型ღ◈✿。本次报告的题目为《理解ღ◈✿、想象ღ◈✿、执行一体化的具身操作大模型》ღ◈✿,将重点介绍最新推出的具身操作大模型InternVLA-A1ღ◈✿。该模型在操作任务的成功率显著超越π0ღ◈✿、GR00T N1.5等模型ღ◈✿,尤其在涉及传送带动态抓取ღ◈✿、多机协作的高动态场景表现出很强的适应性ღ◈✿。

  文俊杰老师现担任美的AIRC具身基础模型负责人ღ◈✿。他认为ღ◈✿:让机器人具备多模态大模型通用智能的关键难点在于语言与动作之间的“模态鸿沟”ღ◈✿。本次研讨会将重点探讨VLA模型从“对齐”到“统一”的根本转变ღ◈✿,通过重构模型架构与训练范式ღ◈✿,使模型在同一表示/参数空间中同时学会理解与执行ღ◈✿,进而将思维链式推理用于未知任务求解ღ◈✿。

  具身视觉导航大脑让机器人摆脱遥控器与激光雷达建图ღ◈✿,仅使用视觉摄像头让机器人拥有眼睛一般看懂眼前世界ღ◈✿,进行通行度理解和内容理解从而自主决策导航点ღ◈✿,并结合时空域感知构建短期记忆地图完善路径规划ღ◈✿。曾任职于阿里巴巴达摩院的王钊老师将以《开放世界具身视觉导航大脑》为主题带来报告ღ◈✿。

  丁鹏翔博士的研究主要专注于多构型本体的VLA模型基座模型设计ღ◈✿。他以一作身份发表的VLA-Adapter目前GitHub Star已经达到1.6kღ◈✿,是国内开源VLA中最高的ღ◈✿,也是业内第五个过千Star的工作ღ◈✿。丁鹏翔博士致力于解决VLA模型的加速推理ღ◈✿,数据利用效率以及推动VLA模型真正落地应用效果ღ◈✿。本次报告将围绕《多构型VLA如何破局》展开相川美沙绪ღ◈✿,将探讨如何针对多种机器人形态(如机械臂ღ◈✿、四足机器人ღ◈✿、人形机器人)结合其结构特性ღ◈✿,分别设计和设置不同的VLA基座模型ღ◈✿。

  Alluxio首席架构师傅正佳博士也将在此次研讨会上带来分享ღ◈✿,主题为《构建面向具身智能数据闭环的高性能数据访问平台》ღ◈✿。傅正佳博士加入Alluxio前相川美沙绪ღ◈✿,曾在新加坡科技公司Bigo Technology担任机器学习研发总监ღ◈✿。

  目前ღ◈✿,VLA模型的发展仍受限于数据稀缺与泛化能力不足等问题ღ◈✿。本次报告李昊展博士将解读以一作身份提出的专为VLA模型设计的高效强化学习框架SimpleVLA-RLღ◈✿。该框架基于veRL构建ღ◈✿,引入了VLA专用轨迹采样ღ◈✿、可扩展并行化ღ◈✿、多环境渲染及优化的损失计算方法ღ◈✿。实验表明ღ◈✿,SimpleVLA-RL能缓解数据稀缺问题并大幅增强VLA的泛化能力ღ◈✿,还能使VLA自主发现更高效的策略ღ◈✿。这种 “突破人类演示数据模式” 的现象被定义为 “Pushcut”ღ◈✿。

  内容概要ღ◈✿:在人工智能迈向真实世界应用的关键节点ღ◈✿,具身智能领域正面临数据稀缺与泛化能力不足的双重困境ღ◈✿。本次演讲将分享一项突破性解决方案——人-数字人-机器人三元一体具身智能架构ღ◈✿,通过充分挖掘互联网海量人类行为数据ღ◈✿、利用先进仿真引擎大规模生成策略合成数据拉斯维加斯游戏官网ღ◈✿、并将虚拟学习成果迁移至物理机器人ღ◈✿,实现从专用机器人到通用智能体的质的飞跃ღ◈✿。这一创新范式不仅将具身智能的数据获取成本降低数个量级ღ◈✿,更通过多源数据融合与虚实结合的迁移学习机制ღ◈✿,让AI真正具备跨模态ღ◈✿、跨场景的泛化能力ღ◈✿。演讲将深入阐述三层协同架构的技术细节ღ◈✿、数据驱动的泛化方法论ღ◈✿,以及在快递包裹处理ღ◈✿、柔性分拣ღ◈✿、自动化科学实验等实际场景的验证成果ღ◈✿,探讨具身智能从实验室走向产业应用的可行路径ღ◈✿。

  内容概要ღ◈✿:本报告将介绍上海人工智能实验室具身智能中心最新推出的具身操作大模型InternVLA-A1ღ◈✿。该模型以InternVL3为基座ღ◈✿,基于一个统一的Transformer架构拉斯维加斯游戏官网ღ◈✿,集场景理解ღ◈✿、任务想象与精准执行能力于一体ღ◈✿。其中ღ◈✿,场景理解模块以图像和文本为输入ღ◈✿,用于解析任务指令并理解任务场景ღ◈✿;基于场景理解的解析结果ღ◈✿,任务想象模块通过预测未来图像的形式ღ◈✿,想象执行任务的未来演变ღ◈✿;最终ღ◈✿,动作执行模块在任务想象的指导下ღ◈✿,通过Flow Matching过程输出机器人控制指令ღ◈✿。该模型融合了上海人工智能实验室的虚实混合操作数据集InternData-A1ღ◈✿、上海国地中心实训场数据及互联网多源异构数据进行联合训练ღ◈✿,从多源异构机器人ღ◈✿、多场景数据中获取了广泛ღ◈✿、通用的操作知识ღ◈✿。在物流ღ◈✿、家居ღ◈✿、商超等多场景的真机评测基准上相川美沙绪ღ◈✿,InternVLA-A1显著优于pi0及gr00t n1.5相川美沙绪ღ◈✿,且模型已适配方舟无限ღ◈✿、松灵ღ◈✿、国地青龙人形机器人ღ◈✿、智元Genieღ◈✿、Franka等多款机器人本体ღ◈✿。

  内容概要ღ◈✿:如何让机器人具备多模态大模型的通用智能?关键难点在于语言与动作之间的“模态鸿沟”ღ◈✿:传统的表层对齐往往只在训练分布内表现良好ღ◈✿,一到开放世界便失灵ღ◈✿。为此ღ◈✿,我们推动从“对齐”到“统一”的根本转变ღ◈✿,通过重构模型架构与训练范式ღ◈✿,使模型在同一表示/参数空间中同时学会理解与执行ღ◈✿,进而将思维链式推理用于未知任务求解ღ◈✿。该研究为机器人走向真实应用场景提供了坚实技术支撑ღ◈✿,使其在多变环境下更鲁棒ღ◈✿、更可靠拉斯维加斯游戏官网ღ◈✿。

  内容概要ღ◈✿:开放世界具身视觉导航大脑面向人形机器人ღ◈✿、机器狗ღ◈✿、无人车ღ◈✿、消费级移动设备等各类具身实体提供开放环境中纯视觉自主导航方案ღ◈✿。具身视觉导航大脑让机器人摆脱遥控器与激光雷达建图ღ◈✿,仅使用视觉摄像头让机器人拥有眼睛一般看懂眼前世界ღ◈✿,进行通行度理解和内容理解从而自主决策导航点相川美沙绪ღ◈✿,并结合时空域感知构建短期记忆地图完善路径规划ღ◈✿。技术亮点ღ◈✿:1)纯视觉导航ღ◈✿、无需激光雷达ღ◈✿;2)无需建图ღ◈✿、随时随地可用ღ◈✿;3)适应动态开放世界ღ◈✿,不论室内还是室外ღ◈✿、小区ღ◈✿、道路ღ◈✿、野外等场景ღ◈✿。技术应用场景有面向B端大区域的电子地图导航ღ◈✿,如巡逻ღ◈✿、物流ღ◈✿、清扫机器人和面向C端的主动式/跟随式导航ღ◈✿,如陪伴机器人ღ◈✿。具身视觉导航大脑已应用在江苏某清扫无人车ღ◈✿、深圳某人型机器人ღ◈✿、上海某消费级移动机器人等客户场景ღ◈✿,在公安场景的数字警犬示范应用被《人民日报》ღ◈✿、《浙江日报》等媒体报道ღ◈✿。

  内容概要ღ◈✿:端到端视觉-语言-动作模型旨在实现将数字世界中的通用智能迁移到物理世界ღ◈✿,从而全面提升具身体的智能水平ღ◈✿。本报告将从多模态大模型在空间智能方面的不足切入拉斯维加斯游戏官网拉斯维加斯游戏官网ღ◈✿,结合基础视觉策略网络的推理速度的瓶颈ღ◈✿,探讨如何针对多种机器人形态(如机械臂ღ◈✿、四足机器人ღ◈✿、人形机器人)结合其结构特性ღ◈✿,分别设计和设置不同的VLA基座模型ღ◈✿。该研究为实现新一代智能机器人ღ◈✿、智能家居ღ◈✿、智慧工厂等场景提供关键技术支撑ღ◈✿,加速人机共融智能时代的到来ღ◈✿,推动具身智能技术的创新与应用ღ◈✿。

  内容概要ღ◈✿:大语言模型(LLM)的飞速发展ღ◈✿,为通用人工智能(AGI)的实现带来了希望ღ◈✿。然而ღ◈✿,LLM 本身无法与物理世界进行真实交互ღ◈✿,这一局限正是具身智能(Embodied AI)致力于研究与弥合的关键鸿沟ღ◈✿。在具身智能领域ღ◈✿,若想重现LLM“大数据 + 大模型”的成功路径ღ◈✿,一方面依赖海量交互数据作为VLA基础预训练ღ◈✿,另一方面ღ◈✿,需要克服在物理世界中的交互带来的天然局限ღ◈✿:效率低ღ◈✿、风险高ღ◈✿、难以复现ღ◈✿。因此ღ◈✿,构建一个可规模化扩展(Scalable)的世界模型作为具身智能模型的闭环交互环境ღ◈✿,已成为该领域发展的关键路径ღ◈✿。本次分享将重点介绍地平线在该领域的最新研究进展ღ◈✿,涵盖以下核心模块ღ◈✿:可交互场景重建ღ◈✿、前馈式3D重建ღ◈✿、具身3D生成引擎以及具身视频生成ღ◈✿。

  内容概要ღ◈✿:VLA模型已成为使机器人在真实环境中解决各类复杂操作任务极具前景的新范式ღ◈✿,其发展仍受限于数据稀缺与泛化能力不足等问题ღ◈✿,而强化学习能缓解数据依赖并显著提升模型性能与泛化性ღ◈✿,正受到广泛关注ღ◈✿。本次报告将解读所提出的专为VLA模型设计的高效强化学习框架SimpleVLA-RLღ◈✿,内容主要分为三部分ღ◈✿:首先概述VLA训练范式ღ◈✿,并阐述引入强化学习的必要性ღ◈✿;接着将详解SimpleVLA-RL架构设计ღ◈✿;最后ღ◈✿,展望VLA强化学习领域的未来发展趋势ღ◈✿。

  大会设置了四类电子门票ღ◈✿,分别是论坛观众票ღ◈✿、论坛VIP票ღ◈✿、闭门专享票和贵宾通票ღ◈✿。会场座位分布如下ღ◈✿。

  四类电子门票中ღ◈✿,论坛观众票为免费票ღ◈✿,申请后需经审核通过方可参会ღ◈✿;论坛VIP票ღ◈✿、闭门专享票和贵宾通票均需购买ღ◈✿。各类门票的详细权益可通过文末左下角「阅读原文」ღ◈✿,直达官网进行了解ღ◈✿。

  具身世界模型技术研讨会将于11月19日在分会场二上午进行ღ◈✿,主要向持有闭门专享票ღ◈✿、贵宾通票的观众开放ღ◈✿。

拉斯维加斯游戏官网|相川美沙绪|国内开源VLA最高star一作开讲!具身VLA大
拉斯维加斯(官方认证网站)登录入口·Made in Las Vegas|http://www.quasionwireless.com