|
|
|
|
职位描述 用小程序查看更多 |
|
岗位职责: 1、对模型进行推理加速优化,包括但不限于模型量化、剪枝、高性能解码、token压缩等,提升模型端侧运行效率,同时降低模型端侧存储需求; 2、与端侧芯片原厂合作,针对特定硬件架构和推理引擎进行模型算力需求压缩优化,以实现最佳性能; 3、跟踪最新的模型压缩、推理加速技术,评估在端侧部署中的可行性和效果,提升产品技术水平和竞争力。
岗位要求: 1、计算机、自动化、计算数学、统计学等相关专业,硕士或硕士以上学历,具备较好的计算机通用算法基础; 2、有大语言模型算力压缩、推理优化经验,或有其它深度学习模型算力压缩经验,如量化、剪枝等; 3、熟悉python/linuxshell等工具及PyTorch等深度学习框架; 4、强烈的责任心和自我驱动能力及良好的沟通能力; 5、在量化、剪枝等模型压缩方向上发表过高水平论文、或获得过相关赛事奖项者优先。 |
|
|
|
|
|
|