<p><strong>崗位職責</strong></p><p>1、參與 Data-Centric 大模型數據閉環建設,打造面向大模型的數據-訓練-評測全鏈路流程;</p><p>2、探索在固定模型與評測條件下,透過資料最佳化提升模型效果,包括資料選擇、合成、增強等;</p><p>3、協作构建訓練數據集,與模型訓練側紧密合作,理解專案需求,構造和準備符合要求的高品質訓練數據集,提升模型性能。</p><p><strong>崗位要求</strong></p><p>1、碩士及以上學歷,至少2年工作經驗,人工智能、電腦、自動化、數學相關專業優先;</p><p>2、擁有紮實的資料結構與算法設計基礎,熟練掌握Python/C++中的一種或多種,熟練掌握Pytorch、Tensorflow等深度學習框架,有大型開源專案經驗優先;</p><p>3、熟悉大模型基礎架構,算法基礎紮實,了解LLM前沿進展、性能評估及其下游應用優先;</p><p>4、有數據處理、合成、CoT增強、SFT、RL等經驗或相關知識者優先。</p>