<返回

多模态内容生成研究实习生

实习岗位

概述

2050研究院诚邀热情且具有前瞻性的小伙伴加入我们位于新加坡的天工2050研究实验室。作为研发团队的新成员,这是一个将理论付诸实践、同顶尖研究人员学习并为研发突破性技术的绝佳机会。

主要职责

  • 在多模态内容生成(用于生成图像/音频/视频等的扩散模型)和内容理解(用于理解图像/视频/音频等的多模态大语言模型)方面进行前沿研究,确保研究成果发表在有影响力的会议和期刊上。

  • 在专家导师的指导下,识别并解决多模态内容生成/理解中的复杂问题。

  • 开发算法、洞察或数据集,解决高级研究目标的关键方面。

  • 利用并贡献于多模态内容生成/理解的尖端工具和方法,并将这些进展应用于产品开发。

理想经验

  • 能全职实习至少6个月。

  • 计算机科学或相关 STEM 学科的在籍博士生,专注于图像/视频/音频生成(扩散模型等)或内容理解(LLM,多模态大语言模型等)。

  • 在顶级会议或期刊(如 NeurIPS、ICLR、CVPR、ICCV、ECCV、ICML 或同等)上有研究发表,表现出卓越的研究能力。

  • 具备生成模型的扎实理解,或图像生成专业知识的申请者将优先被考虑。

  • 具有(多模态)大语言模型的扎实知识,具备大语言模型预训练经验者优先。

  • 在深度学习框架(如 PyTorch 和 TensorFlow)中表现出熟练的编码技能。

申请方式

请将最新履历表和Cover Letter发送至 [email protected]。我们致力于促进多样性,欢迎所有背景的候选人申请。加入天工 2050 研究实验室,共同塑造 AGI 的未来。