<p>-崗位職責:</p>
<p>• 模型訓練與最佳化:設計並實現大型語言模型的訓練策略,包括監督微調(SFT)、強化學習(如</p>
<p>GRPO、PPO)等方法,提升模型在 Web3 领域的智能程度。</p>
<p>• 數據處理與生成:建立高品質的訓練數據集,進行數據蒸餾與長短鏈式思考(Long & Short</p>
<p>鏈式思考(Chain of Thought, CoT)數據生成,確保模型具備強大的推理能力。</p>
<p>• 模型架构与评估:探索并应用专家混合(MoE)等先进模型架构,制定模型评估框架和指标,持</p>
<p>續優化模型表現。</p>
<p>• 分布式训练与部署:开发并维护模型的分布式训练方案,确保模型的高效训练和稳定部署。</p>
<p>• 技术前沿探索:跟踪 AI 领域的最新研究动态,如 OpenAiGPT-4.5、DeepSeek-R1 等,推动技</p>
<p>術在實際業務中的創新應用。</p>
<p>-崗位要求:</p>
<p>• 学历背景:计算机科学、人工智能、机器学习或相关领域的学士学位,硕士或博士优先。</p>
<p>技術能力:</p>
<p>• 熟練掌握 Transformer 架構,熟練使用 Transformer Reinforcement Learning(TRL)、</p>
<p>PyTorch 或 TensorFlow 深度学习化学习框架等。</p>
<p>• 具備大型語言模型的微調經驗,熟悉推論導向強化學習(Reasoning-Oriented Reinforcement</p>
<p>學習、RORL)等技術。</p>
<p>• 熟悉分散式訓練框架,具備模型並行、Flash Attention、LoRA 等技術的實戰經驗。</p>
<p>工程能力:</p>
<p>• 精通 Python、Go 等編程語言,具備良好的程式碼風格和軟體工程實戰經驗。</p>
<p>• 熟悉模型服务化技术,如 Triton、vLLM、TGI 等,具备推理优化经验者优先。</p>
<p>科研能力:</p>
<p>• 能夠閱讀並實現前沿論文,撰寫技術報告或部落格。</p>
<p>• 在顶级会议(如 NeurIPS、ICLR、ICML、ACL)有论文发表或开源项目贡献者优先。</p>
<p>軟技能:</p>
<p>• 具備優秀的團隊合作和溝通能力,能夠高效地與跨功能團隊協作。</p>
<p>• 对开源 AI 社区有深入了解,有相关项目贡献者优先</p>