具身智能系统 / EMBODIED AI SYSTEMS

VLA/VLM 机器人,从仿真数据到真实运行

VLA/VLM Robotics, from simulation data to robot runtime

我构建机器人智能背后的系统栈:多模态感知、策略学习、机器人大小脑架构、Real2Sim 数据闭环,以及可观测的运行时基础设施。

I build the stack behind robot intelligence: multimodal perception, policy learning, robot big brain / small brain architecture, Real2Sim data loops, and observable runtime infrastructure.

Longtao Wu 机器人与具身智能个人风格图

机器人脑图 / ROBOT BRAIN MAP

技术栈总结

感知、策略、仿真数据与运行时基础设施不是分散模块,而是一套持续反馈的机器人智能系统。

Perception, policy, simulation data, and runtime infrastructure are designed as one feedback system.

具身智能技术栈总结图
01

感知 VLM

场景理解、多模态 grounding、物体状态和可供性信号。

Scene understanding, multimodal grounding, object state, affordance signals.

02

策略 VLA

将语言目标映射为可执行机器人动作,并接入评估闭环。

Language goals mapped into executable robot actions and evaluation loops.

03

机器人大小脑

高层认知连接小脑控制、运行反馈、记忆与工具系统。

High-level cognition connected to small-brain control, runtime feedback, and memory.

04

仿真数据

合成场景、Real2Sim 资产、数据集 QA 和 Sim2Real 验证。

Synthetic scenes, Real2Sim assets, dataset QA, and Sim2Real validation.

我的系统性知识总结(gitbook列表)
gopic配置七牛云图床
longtaoLM的使用
CodeGeeXr多语言代码生成模型
grub介绍及使用
ubuntu使用指北
collectd后台监控程序
prometheus的使用
Cobra Tutorial
viper Tutorial
avatar
LongTao
Building robot intelligence across VLA, VLM, simulation data, and embodied AI systems.
Follow Me
本周code时间
图像1
图像2