機器學習平台工程師(GPU 叢集)

香港理工大学人工智能高等研究院(PAAI)·教育/研究
7日回覆12位候選人
HK $34K-60K/月
碩士
1-3年经验
可提供香港工作簽證
10.0 小時/天, 5 天/週

傳送投遞消息

工作內容翻譯為中文

職責範圍:

負責以 GPU 叢集為核心的機器學習及人工智能平台之設計、建設與日常運維,支援大規模分散式模型訓練及推理工作負載。參與雲原生 AI 基礎設施架構設計,建設及優化 Kubernetes 平台,負責 GPU 算力之統一排程與管理。深入理解並優化 Kubernetes 排程機制,包括拓撲感知排程、Gang 排程、優先級與搶占策略,以及彈性伸縮能力。透過 CRD、Operator、Webhook 等雲原生擴展技術,實現 AI 工作負載的自動化部署、運行及生命週期管理。

負責 GPU 資源配額管理、使用率監控及效能分析,支援多租戶環境下的算力分配及平台穩定運作;參與分散式系統及高速網絡環境(如 RDMA、NCCL)下之效能瓶頸分析與優化;為研究人員及工程團隊提供穩定而高效的 AI 計算平台支援。

入職要求:

計算機科學、工程或相關學科本科或以上學歷;具備機器學習平台、GPU 叢集或 AI 基礎設施相關實務經驗;熟悉 Kubernetes 核心架構、容器化技術及雲原生生態;了解分散式儲存、分散式訓練與推理框架(如 PyTorch、TensorFlow 等);具備良好 Linux 系統基礎,熟練 Python、Shell,具備 Go 語言開發經驗者優先;具備良好問題分析能力及溝通能力,能於複雜技術環境中獨立工作。


語言技能
廣東話
英文
普通話
技能
信息技術基礎設施

avatar
avatar
HR WU
香港理工大學人工智能高等研究院(PAAI) · HR
近3日活躍

職位地點

香港理工大學-紅磡, 九龍城

紅磡育才道11號

暫未獲取職位地圖, 可跳轉至其他地圖應用查看

查看地點

導航


請謹慎注意

申請工作時,請勿提供您的銀行或信用卡資料。

傳送投遞消息

類似工作

回覆快

3-5年


學士

$20K-40K/月

NOVOS

  • 線上

回覆快

1-3年


高級文憑或副學士

$20K-40K/月

Experience with C# ASP.NET Core and MongoDB

Proficiency in Angular, HTML5, CSS, and Bootstrap

Familiarity with Google Cloud / Microsoft Azure, Kubernetes, and Nginx

Nachthund Limited

  • 今日活躍

不限經驗


學士

$5K-8K/月

參與真實交易場景的多智能體系統開發

無需經驗限制,歡迎實習生及應屆畢業生

酬金與年終花紅福利

回覆快

最新

3-5年


碩士

研究語義理解算法

構建大規模預訓練模型

電腦相關專業碩士及以上

不限經驗


學士

$4K-6K/月

Apply reinforcement learning in real industrial systems

Design agent-environment interaction systems

Background in reinforcement learning, agents, or decision systems

不限經驗


學士

Apply reinforcement learning in real industrial systems

Design agent-environment interaction systems

Background in reinforcement learning, agents, or decision systems

查看更多