某新锐大模型公司2月前
大模型工程师
IT软件
人工智能
上海
面议
2月前职位描述
模型开发与优化:
负责多模态大模型(如文本、图像、语音等模态融合)的设计、开发和优化工作,提升模型在多模态任务中的性能和效率。
参与多模态数据预处理、特征提取和融合策略的研究与实现,确保数据质量与模型训练的有效性。
技术研发与创新:
深入研究多模态生成领域的前沿技术,包括但不限于生成对抗网络(GAN)、变分自编码器(VAE)、Transformer架构等在多模态任务中的应用,探索新的技术方向和解决方案。
推动多模态生成技术在实际业务场景中的落地应用,如智能创作、虚拟现实、增强现实等领域,为产品创新提供技术支持。
系统架构设计:
参与多模态生成系统的架构设计与开发,确保系统的可扩展性、稳定性和高效性,支持大规模数据处理和模型推理。
优化模多态生成系统的计算资源管理,合理分配GPU/CPU资源,提升系统运行效率。
项目协作与支持:
与数据科学家、算法工程师、产品团队等紧密合作,理解业务需求,将多模态生成技术与产品功能相结合,为项目提供技术解决方案。
参与多模态生成项目的全流程管理,从需求分析、模型开发到上线部署,确保项目按时高质量完成。
知识分享与团队建设:
定期组织技术分享会,向团队成员介绍多模态生成领域的最新研究成果和技术趋势,促进团队技术能力提升。
参与团队的技术培训和指导工作,帮助新成员快速熟悉多模态生成技术栈,提升团队整体技术水平。
四、任职要求
教育背景:
计算机科学、人工智能、机器学习、数学等相关专业本科及以上学历。
专业技能:
精通Python编程语言,熟悉常用深度学习框架(如TensorFlow、PyTorch等),具备扎实的编程能力和算法基础。
熟悉多模态数据处理技术,包括图像处理(如OpenCV)、自然语言处理(如NLTK、spaCy)和语音处理(如Librosa)等工具和库。
深入理解生成式模型(如GAN、VAE、Diffusion Models)和Transformer架构在多模态任务中的应用,具备相关项目开发经验。
了解多模态数据融合技术,包括特征级、决策级和像素级融合方法,能够根据业务需求设计合理的融合策略。
项目经验:
具备至少2年以上多模态生成相关项目经验,参与过从模型设计到系统部署的全流程项目开发。
在多模态生成领域有成功落地的项目案例,如智能创作工具、虚拟形象生成、多模态推荐系统等。
其他要求:
具备良好的团队协作精神和沟通能力,能够与不同背景的团队成员有效合作。
具有较强的学习能力和问题解决能力,能够快速掌握新技术并应用于实际项目中。
具备良好的英语读写能力,能够阅读和理解英文技术文档和论文。
分享