One Shot, One Talk:单张图片生成全身可动虚拟人像技术
One Shot, One Talk简介 “One Shot, One Talk”是一种创新技术,能够从单张图片中创建出全身可动、表情丰富的虚拟人像。这项技术通过结合姿势引导的图像到视频...
O1-CODER:能够生成代码并使用测试用例进行标准化测试
O1-CODER简介 O1-CODER是北京交通大学计算机科学与技术学院的一个研究团队开发的项目,旨在通过结合强化学习和蒙特卡洛树搜索技术,复现OpenAI的O1模型在编程...
CausVid:麻省理工学院和Adobe联合推出的视频生成模型
CausVid简介 CausVid是由麻省理工学院(MIT)和Adobe研究院共同开发的先进视频生成模型,它通过将双向扩散模型转换为因果模型,显著降低了视频生成的延迟,并...
MIDI:能够从单张图片生成具有多个3D实例的完整场景
MIDI简介 MIDI是一种创新的3D场景生成框架,它通过扩展预训练的图像到3D对象生成模型到多实例扩散模型,并引入多实例注意力机制,能够从单张图片中同时生成多...
LUMINET:一种创新的室内场景重照明框架
LUMINET简介 LUMINET是一种创新的室内场景重照明框架,由UvA-Bosch Delta Lab和BCAI-Bosch团队联合开发。该技术能够将复杂的照明条件从一个目标图像转移到源...
OSDFace:上海交通大学推出的一次性面部恢复扩散模型
OSDFace简介 OSDFace是由上海交通大学与vivo移动通信有限公司联合开发团队提出的一种创新的一次性扩散模型,用于面部图像恢复。该模型通过视觉表示嵌入器(VR...
TRELLIS:微软联合清华大学等高校推出的高效3D生成模型
TRELLIS简介 TRELLIS是一种创新的3D生成模型,由清华大学、中国科学技术大学和微软研究院的联合研究团队开发。该模型以其Structured LATent(SLAT)表示为核...
NitroFusion:通过动态对抗训练框架实现高保真图像生成
NitroFusion简介 NitroFusion是由英国萨里大学CVSSP实验室的SketchX团队与NetMind.AI共同开发的一种创新单步扩散模型,它通过动态对抗训练框架实现了高保真度...
GenCast:谷歌DeepMind团队推出的中长期天气预报模型
GenCast简介 GenCast是由Google DeepMind团队开发的一种先进的中长期天气预报模型,它采用机器学习技术,能够在短短8分钟内生成15天的全球天气预报。与传统的...
Motion Prompting:通过使用运动轨迹来控制视频内容的生成
Motion Prompting简介 Motion Prompting是一种创新的视频生成技术,由Google DeepMind的研究团队开发。该技术通过使用运动轨迹来控制视频内容的生成,相较于...