崗位職責:?1、負責大模型的探索規劃,包括技術研究、戰略規劃、方案設計等;
?2、負責大模型的行業信息調研、客戶需求分析對接,以完成模型自進化為目標設計整體架構,對自有方案和產品提出相應改進建議;
?3、負責大模型開發的全流程管理,包括相關屬性評測、海量訓練數據準備、產品化部署落地及項目成本控制等;
?4、結合業務領域真實問題,研究學習業內領先思路,協助構建行業領先的多模態核心能力。???
?
???任職資格:?
???1、計算機科學、人工智能、機器學習或相關領域,碩士及以上學歷;?
???2、具備優秀的編程能力和經驗,具有扎實的數據結構和算法功底;?
???3、精通TensorFlow、PyTorch、DeepSpeed、Megatron、ColossalAI等深度學習框架,大模型訓練、調優經驗;熟悉常見技術如SFT,P-tuning,?LoRA等;?
???4、閱讀過Transformers源碼,熟悉底層原理,熟悉FlashAttention等框架;?
???加分項:?
???有較強的的中大型項目或個人開源項目經驗;?
???有較強的鉆研精神和自驅力。