AI Architect

Key Responsibilities 1. AI 技术架构设计（核心）负责企业级 AI 技术架构的整体规划，包括模型层、数据层、推理层、服务层、平台层设计大模型私有化部署方案（Qwen、DeepSeek、Llama、Mistral 等）负责 RAG、Agent、Embedding、向量数据库等核心能力的架构设计设计高可用、高性能、可扩展的 AI 推理服务架构（vLLM、TensorRT-LLM、SGLang 等） 2. AI 平台建设（LLMOps / MLOps）负责 AI 平台的规划与落地，包括模型管理、Prompt 管理、特征管理、数据管线设计模型治理体系：版本管理、灰度发布、评估体系、监控体系构建企业级 AI 能力中心（AI Platform / AI Hub）推动 AI 能力的标准化、平台化、组件化 3. 大模型私有化与性能优化负责大模型的微调、蒸馏、量化、加速负责 GPU 资源调度、推理加速、成本优化评估开源模型与商业模型，制定模型选型策略负责国产 GPU（昇腾、Hygon、PPU 等）适配方案 4. AI 应用落地与业务赋能与业务团队合作，识别 AI 赋能场景，设计端到端解决方案主导 AI 产品从 PoC → MVP → 生产化的全流程负责关键 AI 项目的技术决策、风险评估与交付质量推动 AI 在业务流程中的规模化应用（客服、财务、供应链、运营、研发等） 5. 技术治理与架构规范制定 AI 技术规范、架构标准、最佳实践负责 AI 安全、隐私、合规体系建设负责跨团队技术沟通与架构评审指导团队成员成长，推动技术文化建设

Requirements（Must Have）技术能力 5 年以上 AI/ML 研发经验，2 年以上架构经验精通 LLM、NLP、RAG、Agent、Embedding 技术体系熟悉主流模型框架：PyTorch、Transformers、DeepSpeed、vLLM、TensorRT 熟悉 GPU、分布式训练、模型加速、模型压缩熟悉向量数据库（Milvus、PGVector、FAISS）熟悉 MLOps/LLMOps：Airflow、KubeFlow、Ray、MLflow、Feature Store 熟悉云原生技术：Docker、K8s、Helm、Service Mesh 有大模型私有化部署经验（必须）架构能力能独立设计企业级 AI 平台架构能做技术选型、性能优化、成本优化能将复杂 AI 技术抽象成可复用的能力组件能推动跨团队协作与平台化建设软技能优秀的沟通能力与跨团队协作能力强烈的 Owner 意识与自驱力能在不确定性中推动项目落地能指导团队成员成长 Preferred Qualifications（加分项）有大模型微调、RAG、Agent 应用经验有国产 GPU（昇腾、PPU）适配经验有 AI 平台从 0 到 1 的建设经验有数据工程经验（Spark、Flink）有开源贡献或技术社区影响力有大型集团企业的 AI 落地经验

职位描述

职位要求