公司介绍
自变量机器人成立于2023年12月。公司聚焦自研通用具身智能大模型及人形机器人本体,以软硬一体化的路径,实现通用机器人。自变量自研的「Great Wall」具身智能大模型系列的WALL-A,具备自主感知、推理、长程决策交互,世界模型与高精度复杂操作能力,已在多个维度上达到全球领先;同时,自主研发并持续优化适配多模态大模型控制的机器人本体和高自由度灵巧手。

2025年9月,自变量还开源了其自研端到端具身基础模型WALL-OSS,并公开相关训练代码,便于全球开发者们在自有本体上快速微调和实际应用。

目前为字节、美团、阿里云同时投资的唯一家中国具身智能公司。最新一轮对外公开的融资信息是字节等资方投资10亿人民币,目前为独角兽。创始人兼CEO王潜毕业于清华大学,是全球最早在神经网络中引入注意力机制的学者之一。博士期间,王潜在美国顶级机器人实验室参与了多项项robot learning和human-robot interaction的研究,研究方向覆盖了机器人的多个前沿领域。联合创始人兼CTO王昊是北大计算物理博士,学术研究横跨物理、自然语言处理及人工智能等多个领域。
王昊曾担任IDEA研究院大模型团队的算法负责人,期间主导发布了多个业内关注度较高的模型,包括国内首个多模态大模型「太乙」、首批百亿级语言模型「燃灯/二郎神」及千亿级语言模型「姜子牙」。这些模型在开源社区累计获得数百万次下载。公司的核心团队汇聚了来自世界知名人工智能与机器人实验室的专家及海内外顶级高校的学者。软件算法团队具有Robotics Learning(机器人学习)和大模型的双重背景。

招聘岗位总览
- 售前解决方案经理—工业/汽车/物流(北京/深圳/合肥)
对上述岗位感兴趣,或者对VLA、世界模型、强化学习等方向感兴趣的小伙伴,都可以投递简历到:wenlifang@x2robot.com,或扫码添加微信:490618139,备注:姓名+岗位。
扫码添加微信:490618139,备注:姓名+岗位。
薪资待遇
薪资面议,上不封顶,六险一金,待遇极具竞争力,欢迎优秀的人才加入!
招聘岗位详细介绍
一、6D位姿估计算法工程师(深圳、北京)
职位描述:
- 负责视觉的6D位姿估计算法研发与优化,结合RGB/RGB-D输入,实现对机器人手部及操作对象的精确空间定位;
- 研究并实现基于神经渲染的3D感知方法,包括NeRF、3D Gaussian Splatting、Implicit Fields等,并将其与位姿估计深度融合;
- 引入可微渲染(Differentiable Rendering)框架,实现端到端的可学习几何建模与姿态优化;
- 复现并改进前沿模型(FoundationPose, OnePose, Gen6D, ZebraPose, VGGSplat, NeRFStudio等),推动模型的精度、泛化性和实时性提升;
- 搭建高质量的 位姿与3D重建数据采集与标注体系,支持数据驱动的算法优化;
- 对模型进行推理加速(TensorRT/ONNX/CUDA优化)并落地部署至机器人系统。
职位要求:
- 计算机视觉、机器人、人工智能、图形学等相关专业,本科及以上学历;
- 扎实的 多视图几何、位姿估计与三维重建 理论基础;
- 熟悉 深度学习框架(PyTorch/TensorFlow),具备端到端训练与推理经验;
- 基于神经渲染的3D重建/表示学习(如NeRF、3DGS、NeuS、SDF 等)
- 6D Pose Estimation(FoundationPose, OnePose, ZebraPose, Gen6D等)
- Differentiable Rendering(PyTorch3D, Kaolin, Nvdiffrast等)
- 具备良好的编程能力(Python/C++),熟悉视觉算法工程化;
- 能独立完成算法研发、调试、验证与落地,具备科研前瞻性与产品工程思维。
二、手部追踪/位姿算法工程师(深圳、北京)
职位描述:
- 研发基于头戴式双目摄像头的手部跟踪与3D位姿估计算法,实现低延迟、高稳定性的人手姿态感知。
- 设计和优化手部姿态估计模型,实现手部关键点、骨架或6DoF位姿预测,可用于具身智能系统。
- 融合视觉和几何信息(双目、深度或RGB),提升手部位姿估计的精度与鲁棒性。
- 构建和维护手部数据集,设计评测指标,分析模型失效并推动改进。
- 将手部位姿估计成果与应用系统结合,实现可视化、交互或控制功能。
职位要求:
- 扎实的计算机视觉、机器学习或数学基础,具备算法设计与实现能力。
- 具备手部或人体姿态估计、3D位姿回归、手部关键点检测或手部动作理解经验,熟悉VR/AR/XR场景优先。
- 熟悉深度学习模型(CNN/Transformer/RNN/Temporal模型)及训练或推理流程,或具备相关算法迁移能力。
- 熟悉相机标定、坐标系变换及3D几何知识,能够理解手部位姿估计中的空间约束。
- 有VR/AR/XR手势识别、Egocentric/Head-mounted Vision或机器人手部感知经验者优先。
三、定位算法工程师(深圳)
- 学历及工作经验要求:硕士及以上学历(计算机 / 机器人相关专业),3年以上VSLAM算法开发经验
职位描述:
- 主导高精度、鲁棒性强的VSLAM系统开发,解决动态物体干扰、光照变化、纹理稀疏等复杂场景的定位问题。
- 设计多传感器融合方案(Camera/IMU/Lidar/RTK),优化后端图优化、闭环检测及重定位算法。
- 将SLAM算法部署至嵌入式平台(如RK系列),优化计算效率(CUDA 加速、内存管理),确保实时性与资源消耗达标。
- 开发标定工具、调试接口及测试用例,支持算法快速迭代与问题诊断。
职位要求:
- 主导过VSLAM项目落地,熟悉传感器标定(Camera-IMU)、时序同步等工程细节。
- 精通多视图几何、非线性优化(BA/g2o)、概率滤波(EKF / 粒子滤波),熟悉SLAM框架(ORB-SLAM/VINS 等)。
- 熟练使用 OpenCV/Eigen/Ceres,具备 Linux/ROS 开发能力。
- 在自动驾驶、服务机器人等领域有量产项目经验者优先。
四、导航算法工程师(深圳)
- 学历及工作经验要求:本科及以上学历(计算机 / 机器人相关专业),具有机器人成功落地量产经验优先
职位描述:
- 设计简洁高效的导航系统框架,确保对多种任务高效执行;
职位要求:
- 本职位3年以上相关工作经验,机器人、电子、自动化、数学相关专业。熟悉线性代数,概率论,最优化理论,凸优化原理,图搜索理论
五、语义视觉感知算法工程师(深圳)
- 学历及工作经验要求:本科及以上学历(计算机视觉、模式识别、机器学习、电子信息、机器人等相关专业)
职位描述:
- 负责机器人感知模型算法设计和开发工作,室内外场景中的语义目标;
- 负责数据处理与分析,收集、标注相关数据,对数据进行预处理和增强,以提高模型训练效果;
- 深入分析模型性能指标,根据实际情况优化模型结构和训练策略;
- 负责多机器人平台感知模型的持续迭代,联合数据生产和数据挖掘,构建高效的数据闭环系统,实现正向的算法设计实现和逆向的问题快速修复解决的闭环链路;
- 负责机器人移动领域前沿技术研发工作,包括构建语义地图开发工作。
职位要求:
- 本科及以上学历,计算机视觉、模式识别、机器学习、电子信息、机器人等相关专业;
- 熟练掌握常用的深度学习框架(TensorFlow或PyTorch),具备扎实的深度学习理论基础,熟悉卷积神经网络(CNN)、transformer 等常见模型结构;
- 熟悉移动机器人常见任务模型,包括但不限于3D/2D检测、分割、3D/BEV障碍物、图像/点云Occ模型、E2E大模型等;
- 具备较强的问题解决能力和创新思维,能够独立解决复杂的技术问题,具有良好的团队合作精神和沟通能力;
六、双目深度估计工程师(深圳)
- 学历及工作经验要求:硕士及以上学历(计算机科学、人工智能、机器人学、自动化等相关专业背景)
职位描述:
- 负责具身智能领域的多模态导航大模型研发,专注于视觉-语言-行动的融合,实现从多模态感知到规划与控制的端到端决策能力;
- 研究和实现前沿语义导航与长期记忆算法,探索传统 SLAM 语义地图与端到端学习模型的融合策略,提升机器人在复杂环境中的鲁棒性与持续学习能力;
- 研发导航与操作相结合的Agent逻辑,实现机器人在真实动态环境中的目标导向移动与精准交互;
- 负责从视频中学习导航策略,设计导航仿真数据合成流程,并在仿真平台(如Isaac Sim/Lab)中高效完成导航模型的训练与Sim2Real验证;
- 负责导航算法在机器人硬件平台的部署、调试与性能优化,特别是在嵌入式平台上利用 TensorRT 等工具实现模型的实时推理;
- 跟踪多模态导航、具身智能与机器人学习领域的最新研究进展,推动技术创新和应用落地。
职位要求:
- 具有计算机科学、人工智能、机器人学、自动化等相关专业背景,硕士及以上学历;
- 熟练掌握Python/C++编程,精通Pytorch、Jax等至少一种主流深度学习框架;
- 对主流视觉-语言-导航大模型有深入理解,具备语义导航、长期记忆或导航与操作相关领域的项目研发经验;
- 熟悉Transformer、Diffusion Model、Flow-Matching 等主流生成模型架构,并理解其在导航与决策任务中的应用;
- 具备扎实的机器人系统开发经验,精通ROS/ROS2,并有Isaac Sim/Lab 等仿真平台使用和Sim2Real开发经验,熟悉三维数据处理库;
- 具备模型部署和性能优化经验,熟悉TensorRT等推理加速框架,有嵌入式平台或自动驾驶导航模型落地经验者优先;
- 具备大规模分布式训练经验,能够高效处理大规模多模态数据和模型训练;
- 在ACM等程序设计比赛,多模态、机器人或人工智能领域的顶级会议(如CVPR, ICCV, ECCV, ICRA, IROS, CoRL, NeurIPS等)发表论文或在相关竞赛中获奖者优先考虑;
- 具有技术热情、技术信仰以及较强的学习能力和问题解决能力。
七、导航模型算法工程师(深圳)
- 学历及工作经验要求:硕士及以上学历(计算机、人工智能、机器人、自动化等相关专业)
职位描述:
- 负责机器人系统中多模态局部轨迹规划模型的设计与研发,聚焦传感器融合感知与轨迹生成的端到端建模,实现闭环自主决策;
- 深入探索多模态传感器(如RGB-D、激光雷达、IMU等)潜在表征建模方式,提升模型的泛化性与鲁棒性;
- 设计并实现适用于局部路径规划的神经网络架构,研究 Transformer、Diffusion、Flow Matching 等生成式建模在轨迹预测与多样性控制中的应用;
- 主导导航模型的数据全流程开发,包括数据采集、标注、清洗、增强与合成,并构建多目标 Loss 设计、训练与评估体系;
- 推进模型在机器人平台上的高性能部署与推理优化,支持Jetson、Xavier等嵌入式硬件,熟练使用TensorRT、ONNX、CUDA 等工具链实现低延迟部署;
- 跟踪具身智能、多模态导航与机器人学习等领域的最新进展,推动算法成果在复杂实际场景中的工程化落地。
职位要求:
- 计算机、人工智能、机器人、自动化等相关专业硕士及以上学历,具备扎实的数学建模与机器学习基础;
- 熟练掌握Python/C++,精通PyTorch、JAX等至少一种主流深度学习框架,具备良好的工程实践能力与调试习惯;
- 熟悉机器人局部轨迹规划、动态避障与控制策略,有室内外复杂环境下自主导航系统的研发经验;
- 理解并能实操Transformer、Diffusion、Flow Matching 等生成模型在轨迹建模中的实际应用;
- 熟悉ROS/ROS2系统架构,具备机器人系统开发经验,熟练使用 Isaac Sim、Gazebo、Webots等仿真平台并掌握Sim2Real迁移技术;
- 有三维数据处理经验(如点云、深度图、动态占据图),熟悉 Open3D、PCL 等相关库;
- 熟悉模型部署与优化流程,掌握 TensorRT、ONNX、CUDA 等加速工具,有嵌入式平台或自动驾驶应用经验者优先;
- 在CVPR、ICCV、ICRA、IROS、NeurIPS、CoRL 等顶会发表过相关论文或有竞赛获奖经历者优先;
- 具备良好的沟通协作能力与工程项目推动力,能够主导跨团队、跨平台的算法系统设计与落地。
八、标定算法工程师(深圳)
- 学历及工作经验要求:硕士及以上学历(计算机科学、数学或相关专业),2 年以上相关工作经验
职位描述:
- 传感器标定算法开发与优化:研究并开发多传感器(相机、激光雷达、IMU等)的标定算法,实现传感器内外参数的精确标定;针对不同传感器组合和应用场景,设计并实现高效、鲁棒的标定方法;优化标定算法,提高标定精度和效率;
- 标定系统搭建与维护:建立传感器标定系统,包括硬件搭建、软件开发和标定流程设计;维护和更新标定系统,确保系统的稳定性和可靠性;
职位要求:
- 精通C++/Python等编程语言,熟练使用OpenCV、PCL、ROS等开源工具;
- 具备良好的算法设计和实现能力,能够独立完成算法开发、调试和测试;
- 熟悉相机模型、激光雷达原理、IMU工作原理,熟悉非线性优化算法(如LM算法、Bundle Adjustment);
- 熟悉标定工具箱(如Kalibr、Camera Calibration Toolbox for MATLAB)。
九、激光SLAM算法工程师(深圳)
- 学历及工作经验要求:211硕士或以上学历(计算机科学、电子工程、自动化、机器人等相关专业),3年以上SLAM算法开发经验
职位描述:
- 开发用于机器人环境感知的传感器融合算法,整合 Lidar、RGB-D 相机、IMU 等多种传感器数据;
- 编写高效的算法代码,并确保其在嵌入式系统或边缘计算设备上的稳定性和实时性;
- 参与机器人系统整体架构设计,与控制、感知等团队密切合作。
职位要求:
- 计算机科学、电子工程、自动化、机器人等相关专业 211 硕士或以上学历,具备扎实的数学和算法基础;
- 具备3年以上 SLAM算法开发经验,熟悉经典的SLAM算法如GMapping、Cartographer、ORBSLAM等;
- 熟练掌握C++/Python编程,熟悉ROS系统及常用的机器人开发工具;
- 深入理解多传感器数据融合、概率统计、优化理论等技术;
- 有实际机器人项目开发经验,熟悉常见的移动机器人平台;
- 具有较强的问题分析能力和独立解决问题的能力,良好的团队合作精神。
十、视觉SLAM算法工程师(深圳)
- 学历及工作经验要求:硕士及以上学历,3 年以上工作经验(从事机器人、无人机,AR/VR 行业优先)
职位描述:
- 负责基于单目/双目/RGBD等硬件,进行视觉定位模块、三维建图模块的开发;
- 负责视觉SLAM算法优化,提高精度和鲁棒性,包括但不限于 VO/VIO/PnP/BA 等;
职位要求:
- 硕士及以上学历,3年以上工作经验,有从事机器人、无人机,AR/VR 行业优先;
- 有视觉SLAM开发经验,熟悉常见的VSLAM算法,如ORB2/ORB3、SVO、DSO、MonoSLAM,VINS以及RGB-D等,对特征点识别跟踪,姿态防抖动,重定位,闭环检测,词袋模型有实践经验优先;
- 熟练掌握单目视觉、双目视觉、立体(深度)视觉等计算机视觉知识,并有相关开发经验优先;
- 掌握视觉与IMU紧耦合与联合优化,非线性优化和 EKF,相机内外参标定,多传感器融合,场景识别,回环修正,特征点提取匹配/光流,并有相关实际产品开发经验。
十一、3D 视觉算法工程师(深圳)
职位描述:
- 负责机器人实时3D视觉感知系统的算法研发与工程落地,构建高精度、低时延、高鲁棒性的感知能力,支撑机器人导航与操作等核心功能。
- 结合传统3D视觉方法与学习模型(如3D Gaussian Splatting、NeRF、Neural SLAM、深度估计与3D感知网络等),构建高质量三维环境建模与场景理解能力。
- 负责多目视觉、深度相机、激光雷达等多传感器3D感知算法开发,包括深度估计、点云处理、三维重建、3D目标检测与语义理解。
- 参与机器人整体感知系统架构设计,推进感知、定位、建图与规划模块的系统级协同优化。
- 负责感知与建模算法在嵌入式/GPU平台的实时部署与性能优化,满足机器人系统对实时性与资源受限环境的要求。
- 跟踪3D视觉、机器人感知及具身智能领域的前沿技术,持续引入新方法,推动技术创新与产品能力升级。
岗位要求:
- 计算机、自动化、机器人、电子工程、数学等相关专业本科及以上学历,具备扎实的计算机视觉、三维几何、多视图几何、概率统计与最优化基础。
- 熟练掌握C++/Python,具备良好的算法实现能力与工程开发能力,熟悉Linux开发环境。
- 熟悉深度学习框架PyTorch/TensorFlow,具备3DGS、NeRF、Neural SLAM、单目/双目深度估计、3D目标检测、3D语义分割等模型的训练与部署经验。
- 熟悉 ROS/ROS2、Docker及机器人系统开发流程,具备多传感器融合、系统联调与工程部署经验。
- 具备真实机器人项目落地经验、完整感知系统从 0 到 1 构建经验或相关论文发表者优先。
十二、视觉融合算法工程师(深圳)
职位描述:
- 负责多摄像头、多视角图像的拼接与融合算法设计与优化,实现新视角图像生成。
- 研究并实现图像配准、特征匹配、几何校正、图像融合、曝光一致性等核心算法。
- 对不同传感器和摄像头的图像进行标定与对齐,提高拼接精度和实时性能。
- 对复杂场景(低纹理、弱光、动态对象、畸变等)进行图像拼接鲁棒性优化。
- 与视觉感知、SLAM、渲染、系统工程团队紧密合作,将算法集成到实际产品或平台中。
- 研究和应用深度学习方法增强图像拼接效果,如特征提取、图像补全、超分辨率等。
职位要求:
- 本科及以上学历,计算机视觉、图像处理、电子信息、自动化或相关专业。硕士或博士优先。
- 熟悉图像处理与计算机视觉基础,精通OpenCV、CUDA、Python/C++ 开发。
- 熟悉图像配准、特征匹配(SIFT/ORB/SURF/Deep Learning Feature)、光流、投影变换、全景拼接算法。
- 有多摄像头、多视角图像处理经验,熟悉鱼眼、广角、非线性畸变校正方法优先。
- 熟悉深度学习在图像拼接、图像增强、图像补全等应用者优先。
- 良好的数学基础,熟悉几何、矩阵变换、相机模型与标定方法。
- 具备良好的团队协作能力、代码规范意识及算法优化能力。
一键投递简历
🏆点击【阅读原文】可一键投递