|
|
|
|
职位描述 用小程序查看更多 |
|
1、负责客服、销售、收派、运营、办公职能等业务板块大语言模型的应用落地,支持业务目标提升; 2、负责垂域大语言模型的继续预训练、SFT、RLHF等工作,积极跟进AIGC业内应用趋势,包括但不限于RAG、Agent等方向; 3、面向集团各类业务场景,沉淀共性能力,实现大模型技术的标准化与产品化;1、本科以上学历,2年以上工作经验; 2、熟练使用C++/Java/Python,熟悉Pytorch框架; 3、熟悉自然语言处理相关理论,对Transformer为基础的大模型架构有深入理解,熟悉MoE架构,熟悉不同类型任务在大模型的微调范式和评估框架; 4、具有大模型训练及应用开发经验,如语料清洗、预训练、指令微调、强化学习、内容安全等;熟悉megatron,deepspeed,vllm等训练或推理加速框架; 5、具备优秀的沟通能力,学习能力,有强烈的上进心和主动性; 6、在NLP顶级会议上有论文发表者优先,参与过有影响力的开源项目开发者优先。 |
|
|
|
|
|
|