某新锐大模型公司2月前

大模型工程师

IT软件

人工智能

上海

面议

2月前

职位描述

模型开发与优化：负责多模态大模型（如文本、图像、语音等模态融合）的设计、开发和优化工作，提升模型在多模态任务中的性能和效率。参与多模态数据预处理、特征提取和融合策略的研究与实现，确保数据质量与模型训练的有效性。技术研发与创新：深入研究多模态生成领域的前沿技术，包括但不限于生成对抗网络（GAN）、变分自编码器（VAE）、Transformer架构等在多模态任务中的应用，探索新的技术方向和解决方案。推动多模态生成技术在实际业务场景中的落地应用，如智能创作、虚拟现实、增强现实等领域，为产品创新提供技术支持。系统架构设计：参与多模态生成系统的架构设计与开发，确保系统的可扩展性、稳定性和高效性，支持大规模数据处理和模型推理。优化模多态生成系统的计算资源管理，合理分配GPU/CPU资源，提升系统运行效率。项目协作与支持：与数据科学家、算法工程师、产品团队等紧密合作，理解业务需求，将多模态生成技术与产品功能相结合，为项目提供技术解决方案。参与多模态生成项目的全流程管理，从需求分析、模型开发到上线部署，确保项目按时高质量完成。知识分享与团队建设：定期组织技术分享会，向团队成员介绍多模态生成领域的最新研究成果和技术趋势，促进团队技术能力提升。参与团队的技术培训和指导工作，帮助新成员快速熟悉多模态生成技术栈，提升团队整体技术水平。四、任职要求教育背景：计算机科学、人工智能、机器学习、数学等相关专业本科及以上学历。专业技能：精通Python编程语言，熟悉常用深度学习框架（如TensorFlow、PyTorch等），具备扎实的编程能力和算法基础。熟悉多模态数据处理技术，包括图像处理（如OpenCV）、自然语言处理（如NLTK、spaCy）和语音处理（如Librosa）等工具和库。深入理解生成式模型（如GAN、VAE、Diffusion Models）和Transformer架构在多模态任务中的应用，具备相关项目开发经验。了解多模态数据融合技术，包括特征级、决策级和像素级融合方法，能够根据业务需求设计合理的融合策略。项目经验：具备至少2年以上多模态生成相关项目经验，参与过从模型设计到系统部署的全流程项目开发。在多模态生成领域有成功落地的项目案例，如智能创作工具、虚拟形象生成、多模态推荐系统等。其他要求：具备良好的团队协作精神和沟通能力，能够与不同背景的团队成员有效合作。具有较强的学习能力和问题解决能力，能够快速掌握新技术并应用于实际项目中。具备良好的英语读写能力，能够阅读和理解英文技术文档和论文。