某计算机软件技术公司
大模型算法工程师
信息技术
数字技术
广东
3-5年
本科
¥30 - 40K15薪
公司介绍
一家快速发展的AI公司
职位描述
1. 大模型研发与优化:负责大语言模型、通用大模型或垂直领域大模型的训练、调优与迭代,涉及模型结构设计、训练策略优化及性能调优,确保模型效果与工程落地效率。
2. 核心算法攻关:针对大模型应用中的关键技术问题开展算法研究与实验验证,探索新的模型优化方案,提升模型的准确性、鲁棒性与实用性。
3. 训练数据与工程支持:协同数据团队处理大模型训练数据,设计高效的数据采样与增强策略;参与大模型训练工程搭建,包括分布式训练框架的部署、训练流程监控与故障排查,保障训练任务稳定推进。
4. 技术方案输出与落地:将大模型算法成果转化为实际应用方案,为业务团队提供技术支持,输出模型调用接口、部署文档及性能评估报告;跟踪模型在实际场景中的应用效果,迭代优化算法以适配业务需求。
5. 技术趋势跟踪与预研:持续关注大模型领域的前沿技术与学术进展,开展技术预研与可行性验证,为团队技术路线规划与创新方向提供依据。
职位要求
1. 硕士及以上学历,计算机科学、人工智能、数学、统计学等相关专业,1-3年大模型算法研发经验。
2. 精通深度学习核心原理,深入理解Transformer架构及大模型训练流程,熟悉主流大模型的技术细节与应用场景。
3. 熟练使用深度学习框架及大模型训练工具,具备分布式训练、模型并行/数据并行的实践经验。
4. 具备良好的数学基础与编程能力,能独立完成算法实验、代码实现与数据复盘;拥有较强的问题解决能力与团队协作意识,能推动复杂技术项目落地。
咨询顾问
Cassie Lin
Section Manager行业经理
分享