口袋机采:让“训练机器人”的能力,触手可及

01-14 06:39
将“数据”转化为真正的生产力。

具身数采正从专业采集场景迈向日常生活


目前具身智能所需的数据,仍局限于实验室和集中式数据采集场景,真实世界里多样的操作与物理交互,难以被全面系统地覆盖。回顾自动驾驶的发展历程,当系统从实验室走向真实道路,数据也从少量、受控的采集,转变为在真实场景中的规模化积累,进而推动模型能力快速提升。


基于这一经验,穹彻智能正式推出口袋机采(RoboPocket)——借助智能手机和App,每位使用者都能成为数据采集的参与者,完成任务并上传数据,实现轻量化、可控且高质量的数据采集,将数据采集拓展到更广泛的真实环境中,让更多人能够参与任务采集。并在轻量化、可控的前提下,持续产出高质量可用数据,为具身智能模型构建更真实、可靠的数据基础。



RoboPocket——让普通人也能采集高质量数据


RoboPocket是每个普通人都能操作的“从口袋取出即可开始采集”的高质量数据采集方案。


轻便易用:高度集成的高质量数采设备

数据采集不再依赖复杂的专业设备,一部手机就能解锁无限的高质量采集。RoboPocket体积轻巧、开箱即用,用户只需用手机轻轻一碰,就能与设备连接开始采集。



图注:开箱与快速启动


这样轻便的数采方案并未牺牲精度。


手机,如iPhone,同时具备RGB相机和深度相机(LiDAR),相比纯视觉SLAM,它采用多传感器融合(视觉、深度、IMU)的方案。在这一技术路线下,采集精度高于纯VSLAM,对比红外定位也无需携带基站,同时保持高度集成。可拆卸、可替换的鱼眼镜头带来超广视野,原生镜头画质出色,能应对强光、弱光等真实场景的挑战。无论在昏暗的房间,还是野外阳光直射的环境,都能保持良好性能。



图注:鱼眼镜头、超广角视野


RoboPocket利用手机的成熟功能完成SLAM定位与建图。相比原版UMI需要手动标定、反复操作,RoboPocket的核心价值之一就是让“建图成为用户无感的事”。



图注:快速建图


实时保障采集质量,RoboPocket更是智能中枢

在具身模型规模化发展的时代,数据质量和数据量同等重要。


传统的UMI式数采方案一直面临着数据质量、便携易用、后处理压力的不可能三角。如果要保证数据质量,通常需要牺牲便捷性,采集设备连接电脑来提升数采现场的质量反馈效率,而这样的方式,注定无法普及到大众;或者需要集成存储和数采的小型设备,将数据处理压力留在采集后,导致采集效率低,数据可用比例不高。


RoboPocket面向大规模、分布式的真实场景采集设计,以集成化形态,通过强化实时交互与质量控制,来破解这一不可能三角。


我们重新定义了具身智能的数据采集模式,将对模型训练的理解融入端侧的智能中枢。Robopocket就像一位时刻在线的人工智能导师,不仅能即时诊断每一帧数据的质量、智能指导采集员调整动作,还能通过实时互动动态评估数据价值,让每一次采集都直接助力模型的关键进化


任务指导:任务采集教程可实时发送到数采人员端,指导数采人员操作。



图注:任务教学指导


实时交互提醒:提示采集者动作过快、超出机器人工作空间,避免无效数据进入后处理环节。



图注:异常速度检测



图注:异常动作监测


多维质量打分:在采集阶段就对数据进行评分,帮助采集员及时修正,并为后处理提供筛选依据。



图注:数据质量闭环监测


基于在采集阶段引入的质量控制机制,RoboPocket能够尽可能提前解决数据质量问题,让后续的数据处理从“大量清洗”转变为“有监督的筛选”。


灵活添加第一人称视角:多设备快速对齐

视角局限是腕部第一视角的固有问题。RoboPocket支持灵活添加第一人称视角,并通过多机快速对齐实现同一空间坐标。这种设计既保留了UMI的“具身一致性”,又补充了场景上下文,确保RoboPocket不仅能采集“可操作性强”的桌面任务数据,也能为更复杂、更丰富的场景提供额外视角和场景信息。



图注:第一人称视角


在多臂采集或协作场景中,让多个设备的时间戳快速对齐并统一坐标系是关键,也是难点。RoboPocket大幅降低了这一环节的难度,通过RoboPocket的快速同步机制,多个手机可共享时间戳与SLAM坐标系,双臂配对也变得非常简单。



图注:双臂快速同步


扩展性出色:用户交互丰富

除了硬件层面的扩展,iOS系统的算力与丰富的UI界面带来更多、更高级的功能交互,使数采员能以更直观的方式获得指导、控制质量,甚至完成采集全流程。


除上述质量把控功能外,RoboPocket还支持实时回放与自动无线上传,可通过语音或按键启动采集。


数据认知、模型技术与数据基础设施


硬件只是起点,真正的核心竞争力在于对有用数据的认知、“模型技术”以及数据管线的构建。


从专业数采场景到普通人的日常生活,穹彻智能持续推动行业对数据的理解与方法论升级:


2023年与上交大卢策吾团队共同发布RH20T大规模具身智能数据集:在预设条件下,实现机器人操作数据的系统化、规模化采集;


2025年发布CoMiner伴随式数据采集系统:机器人走出采集场,进入真实世界,在开放环境中获取更丰富、更复杂的操作数据;


2026年迈出关键一步:把机器人数据采集从特定场所和依赖专业系统,进一步推广到整个社会——让每一个普通人、每一部手机都能成为机器人学习网络中的一个节点,让数据在真实生活中持续产生价值。


在大规模数据采集的背后,是我们凭借强大的数据基础设施和科学的数据管线,覆盖高效任务设计、大规模数据采集、上传、清洗与质量监控,最终服务于模型训练与评估,并反向指导下一轮数据采集。



图注:穹彻具身工具链


而支撑这些数据持续创造价值的核心,正是穹彻智能深耕已久的模型能力。


在最新公开视频的最后,我们展示了:仅使用RoboPocket方案采集的数据,就能训练出支持长程任务、双臂协作、无遥操作、非回放的机器人策略,并在工业相机和机器人系统上自主执行。


这一结果表明,来自RoboPocket这种“人人可及”的数采方式,能够跨越采集终端与部署平台的差异,稳定迁移到工业级感知与执行系统中,验证了穹彻智能在数据采集、数据质量管理、模型训练、模型部署等方面的系统性能力。


 


  • 视频注:机器人自主执行摆放餐具、碰杯、叠毛巾、收拾零食

我们将“数据”转化为真正的生产力:从真实世界中稳定获取可用数据资产,驱动模型快速迭代与成本下降,并将能力以标准化流程交付至药房、酒店等多元化场景,实现规模化落地。


未来,RoboPocket将与高精度力控遥操作、CoMiner伴随式野外采集以及人类操作数据一同,持续完善并夯实穹彻的数据体系,支撑具身模型在真实世界中的不断发展。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com