強化學習演算法工程師

中國招商集團
工程-電機/電子/機械
發布於3個月前
HK $23K-35K/月
碩士
3至5年

傳送投遞消息

工作內容翻譯為中文
<p>可以和香港公司主体签署雇佣合约,但必须接受全程深圳办公!!!</p> <p>崗位職責:</p> <p>1.算法研發與最佳化<br>a.設計並實現深度強化學習(DRL)與模仿學習算法,應用於人形機器人運動控制、多任務決策規劃(如步態生成、物體抓取)。<br>b.構建獎金函數(Reward Shaping)與策略網路,最佳化機器人在複雜環境中的自主性與韌性。<br>2.仿真與真實環境驗證<br>a.基於Mujoco、Gazebo、NVIDIA Isaac Sim建立高精度仿真環境,實現算法快速迭代。<br>b.主導Sim2Real技術遷移,解決真實機器人部署中的動力學差異問題。<br>3.跨團隊協作<br>a.與硬體團隊合作,最佳化感測器數據處理(如視覺、力覺)與執行器控制。<br>b.支持大模型团队,探索具身智能与语言/视觉模型的融合应用。<br>4.前沿技術探索<br>a.跟進強化學習領域最新進展(如離線RL、多智能體協同),推動算法在工業、服務等場景落地。</p> <p></p> <p>任職資格:</p> <p>a.計算機科學、自動化、機器人等相關專業碩士及以上學歷。<br>b.熟練掌握DRL算法(PPO、SAC、DQN等)及框架(Stable Baselines、RLlib)。<br>c.精通Python/C++,熟悉PyTorch/TensorFlow,具备ROS/ROS2开发经验。<br>d.熟悉机器人运动学、动力学建模及控制理论(MPC、阻抗控制)。<br>e.有机器人强化学习项目经历,如四足机器人步态控制、机械臂操作任务。<br>f.熟悉仿真工具链与真实机器人部署流程。</p>

語言技能
普通話
技能
系統測試

avatar
avatar
Danni Xiao
中國招商集團 · 人力hr

職位地點

Hong Kong Science Park-馬料水, 沙田

Pak Shek Kok, Hong Kong

暫未獲取職位地圖, 可跳轉至其他地圖應用查看

查看地點

導航


請謹慎注意

申請工作時,請勿提供您的銀行或信用卡資料。

傳送投遞消息

類似工作
查看更多

回覆快

3至5年


不限學歷

$28K-42K/月

Focus on AI and machine learning technologies

Bachelor's or higher degree in Computer Science or related field

Proficiency in Python, Java, C++, or JavaScript

不限經驗


學士

$20K-30K/月

不限經驗


學士

$20K-35K/月

Bgin Chip Limited

  • 近期活躍

回覆快

1至3年


學士

$10K-30K/月

专注于机器人触觉技术

提供签证协助

嵌入式算法开发经验

靈犀未來

  • 近3日活躍