全球头部科学服务企业
AI Architect
生命科学
科技
上海
10年以上
本科
¥45 - 75K13薪
职位描述
Key Responsibilities
1. AI 技术架构设计(核心)
负责企业级 AI 技术架构的整体规划,包括模型层、数据层、推理层、服务层、平台层
设计大模型私有化部署方案(Qwen、DeepSeek、Llama、Mistral 等)
负责 RAG、Agent、Embedding、向量数据库等核心能力的架构设计
设计高可用、高性能、可扩展的 AI 推理服务架构(vLLM、TensorRT-LLM、SGLang 等)
2. AI 平台建设(LLMOps / MLOps)
负责 AI 平台的规划与落地,包括模型管理、Prompt 管理、特征管理、数据管线
设计模型治理体系:版本管理、灰度发布、评估体系、监控体系
构建企业级 AI 能力中心(AI Platform / AI Hub)
推动 AI 能力的标准化、平台化、组件化
3. 大模型私有化与性能优化
负责大模型的微调、蒸馏、量化、加速
负责 GPU 资源调度、推理加速、成本优化
评估开源模型与商业模型,制定模型选型策略
负责国产 GPU(昇腾、Hygon、PPU 等)适配方案
4. AI 应用落地与业务赋能
与业务团队合作,识别 AI 赋能场景,设计端到端解决方案
主导 AI 产品从 PoC → MVP → 生产化的全流程
负责关键 AI 项目的技术决策、风险评估与交付质量
推动 AI 在业务流程中的规模化应用(客服、财务、供应链、运营、研发等)
5. 技术治理与架构规范
制定 AI 技术规范、架构标准、最佳实践
负责 AI 安全、隐私、合规体系建设
负责跨团队技术沟通与架构评审
指导团队成员成长,推动技术文化建设
职位要求
Requirements(Must Have)
技术能力
5 年以上 AI/ML 研发经验,2 年以上架构经验
精通 LLM、NLP、RAG、Agent、Embedding 技术体系
熟悉主流模型框架:PyTorch、Transformers、DeepSpeed、vLLM、TensorRT
熟悉 GPU、分布式训练、模型加速、模型压缩
熟悉向量数据库(Milvus、PGVector、FAISS)
熟悉 MLOps/LLMOps:Airflow、KubeFlow、Ray、MLflow、Feature Store
熟悉云原生技术:Docker、K8s、Helm、Service Mesh
有大模型私有化部署经验(必须)
架构能力
能独立设计企业级 AI 平台架构
能做技术选型、性能优化、成本优化
能将复杂 AI 技术抽象成可复用的能力组件
能推动跨团队协作与平台化建设
软技能
优秀的沟通能力与跨团队协作能力
强烈的 Owner 意识与自驱力
能在不确定性中推动项目落地
能指导团队成员成长
Preferred Qualifications(加分项)
有大模型微调、RAG、Agent 应用经验
有国产 GPU(昇腾、PPU)适配经验
有 AI 平台从 0 到 1 的建设经验
有数据工程经验(Spark、Flink)
有开源贡献或技术社区影响力
有大型集团企业的 AI 落地经验
分享