上市AI科技公司
AI工程师
信息技术
科技
南京
3-5年
本科
¥30 - 60K14薪
职位描述
主要职责
设计、实现和优化大规模预训练语言模型(包括模型架构、预训练目标与训练策略)。
负责下游任务(如文本分类、命名实体识别、抽取、阅读理解、生成式问答、对话系统等)的模型微调与评估。
开发高效的训练与推理流水线,优化分布式训练、混合精度、模型并行与推理吞吐与延迟。
架构并实现模型压缩、知识蒸馏、量化与剪枝等工程化方案以适配生产环境。
与产品/工程/数据团队协作,将模型能力落地为可用服务,监控模型性能并持续迭代。
负责模型质量评估、A/B 测试与上线效果分析,保障模型安全性与鲁棒性。
跟踪前沿研究并将有效方法迁移到工程实践中,撰写技术文档与研究/工程报告。
任职要求
学历与经验:计算机、人工智能、语言学或相关专业本科及以上,2–10 年自然语言处理或深度学习领域工作经验。
基础能力:扎实的机器学习与深度学习理论基础,熟练掌握 Transformer、BERT、GPT 系列等主流模型原理与训练技巧。
技术栈:精通 Python;熟练使用 PyTorch 或 TensorFlow;具备分布式训练框架(如 DeepSpeed、Megatron-LM、Horovod、Torch Distributed)与训练优化经验。
工程能力:有大模型预训练、微调、推理优化、模型压缩或知识蒸馏的实际项目经验;熟悉 GPU/TPU 等算力资源调度与性能调优。
自然语言处理:掌握主流 NLP 任务与评估指标,能针对任务设计有效的数据增强、提示工程或微调策略。
系统与部署:了解在线服务化部署(模型服务化、容器化、API 设计)、监控与日志体系优先。
能力素质:良好的问题拆解能力与工程实现能力,具备团队协作与跨部门沟通能力;有独立推动项目落地的经验。
语言能力:中文流利,具备英文技术文献阅读与写作能力。