<p>您將參與構建下一代語音大模型的數據基石。在這裡,您的工作不僅是處理數據,更是為人工智慧的「聽覺」和「語言理解」能力奠定基礎。我們期待對語音技術和自然語言處理充滿熱忱的您加入,與我們一起突破技術的邊界。</p><p><strong>您將承擔的關鍵使命:</strong></p><ul><li><p>打造高品質語音數據集:負責海量語音及文字數據的清潔、標注和結構化處理</p></li><li><p>優化數據pipeline:持續改善數據處理流程,提升模型訓練效率</p></li><li><p>數據深度分析:挖掘數據特性,為模型最佳化提供數據洞察</p></li><li><p>跨團隊協同:與算法工程師、產品經理緊密合作,將數據價值最大化</p></li><li><p>技術探索:參與前沿語音技術的預研和數據方案設計</p></li></ul><p><strong>我們期待的您:</strong></p><ul><li><p>對語音技術和NLP領域有強烈興趣,渴望深入AI數據領域</p></li><li><p>具備紮實的Python程式設計能力,熟悉常用資料處理庫(如pandas, numpy等)</p></li><li><p>掌握Linux基礎操作,能在伺服器環境下高效工作</p></li><li><p>具備優秀的問題解決能力和數據敏感度</p></li><li><p>有ASR/TTS相关数据处理经验者优先</p></li></ul>