LinuxLinux 系统是机器人开发的基础,学习常用命令行操作、文件系统、权限管理、网络配置等,掌握在 WSL 和服务器环境下的开发技巧。通过实际操作解决常见开发与运维问题,提升系统管理与问题排查能力。
深度学习从基础的神经网络到高级网络架构(如 CNN 和 Transformer),掌握深度学习的训练技巧、优化算法和分布式训练方法。通过 PyTorch 深入理解深度学习的原理与实践,完成可复现的深度学习项目。
多模态大模型探索多模态大模型(LLM/VLM)的基本概念和应用,通过 Prompt Engineering 与 Agent 架构等技术,理解如何将视觉、语言与行动结合,解决机器人场景中的任务规划与执行问题,掌握多模态模型的调优与评测方法。
强化学习强化学习是机器人的自进化机制,涵盖基础的马尔可夫决策过程(MDP)、策略优化、值迭代、Q-learning、策略梯度等内容,深入学习离线与在线强化学习技术,掌握基于 RL 的机器人训练与探索方法,能够提升机器人的自主决策与行为稳定性。
世界模型世界模型通过学习环境动态与规划策略,使机器人能够进行自我预测与控制。学习如何利用表征学习与模型预测控制(MPC),实现机器人在复杂环境中的长时序决策与任务规划,为强化学习与机器人控制提供理论与实践支持。
VLA视觉-语言-动作模型(VLA)是机器人的跨模态学习和行为执行能力的核心,学习如何从视觉信息与语言描述中提取动作策略,并通过行为克隆、扩散策略等技术实现机器人任务的自主执行,重点关注模型的Sim2Real转化与机器人部署。