AI工程师

主要职责设计、实现和优化大规模预训练语言模型（包括模型架构、预训练目标与训练策略）。负责下游任务（如文本分类、命名实体识别、抽取、阅读理解、生成式问答、对话系统等）的模型微调与评估。开发高效的训练与推理流水线，优化分布式训练、混合精度、模型并行与推理吞吐与延迟。架构并实现模型压缩、知识蒸馏、量化与剪枝等工程化方案以适配生产环境。与产品/工程/数据团队协作，将模型能力落地为可用服务，监控模型性能并持续迭代。负责模型质量评估、A/B 测试与上线效果分析，保障模型安全性与鲁棒性。跟踪前沿研究并将有效方法迁移到工程实践中，撰写技术文档与研究/工程报告。任职要求学历与经验：计算机、人工智能、语言学或相关专业本科及以上，2–10 年自然语言处理或深度学习领域工作经验。基础能力：扎实的机器学习与深度学习理论基础，熟练掌握 Transformer、BERT、GPT 系列等主流模型原理与训练技巧。技术栈：精通 Python；熟练使用 PyTorch 或 TensorFlow；具备分布式训练框架（如 DeepSpeed、Megatron-LM、Horovod、Torch Distributed）与训练优化经验。工程能力：有大模型预训练、微调、推理优化、模型压缩或知识蒸馏的实际项目经验；熟悉 GPU/TPU 等算力资源调度与性能调优。自然语言处理：掌握主流 NLP 任务与评估指标，能针对任务设计有效的数据增强、提示工程或微调策略。系统与部署：了解在线服务化部署（模型服务化、容器化、API 设计）、监控与日志体系优先。能力素质：良好的问题拆解能力与工程实现能力，具备团队协作与跨部门沟通能力；有独立推动项目落地的经验。语言能力：中文流利，具备英文技术文献阅读与写作能力。

职位描述

Jade Ye