One Shot, One Talk:单张图片生成全身可动虚拟人像技术

One Shot, One Talk简介 “One Shot, One Talk”是一种创新技术,能够从单张图片中创建出全身可动、表情丰富的虚拟人像。这项技术通过结合姿势引导的图像到视频...

O1-CODER:能够生成代码并使用测试用例进行标准化测试

O1-CODER简介 O1-CODER是北京交通大学计算机科学与技术学院的一个研究团队开发的项目,旨在通过结合强化学习和蒙特卡洛树搜索技术,复现OpenAI的O1模型在编程...

CausVid:麻省理工学院和Adobe联合推出的视频生成模型

CausVid简介 CausVid是由麻省理工学院(MIT)和Adobe研究院共同开发的先进视频生成模型,它通过将双向扩散模型转换为因果模型,显著降低了视频生成的延迟,并...

MIDI:能够从单张图片生成具有多个3D实例的完整场景

MIDI简介 MIDI是一种创新的3D场景生成框架,它通过扩展预训练的图像到3D对象生成模型到多实例扩散模型,并引入多实例注意力机制,能够从单张图片中同时生成多...

LUMINET:一种创新的室内场景重照明框架

LUMINET简介 LUMINET是一种创新的室内场景重照明框架,由UvA-Bosch Delta Lab和BCAI-Bosch团队联合开发。该技术能够将复杂的照明条件从一个目标图像转移到源...

OSDFace:上海交通大学推出的一次性面部恢复扩散模型

OSDFace简介 OSDFace是由上海交通大学与vivo移动通信有限公司联合开发团队提出的一种创新的一次性扩散模型,用于面部图像恢复。该模型通过视觉表示嵌入器(VR...

TRELLIS:微软联合清华大学等高校推出的高效3D生成模型

TRELLIS简介 TRELLIS是一种创新的3D生成模型,由清华大学、中国科学技术大学和微软研究院的联合研究团队开发。该模型以其Structured LATent(SLAT)表示为核...

NitroFusion:通过动态对抗训练框架实现高保真图像生成

NitroFusion简介 NitroFusion是由英国萨里大学CVSSP实验室的SketchX团队与NetMind.AI共同开发的一种创新单步扩散模型,它通过动态对抗训练框架实现了高保真度...

GenCast:谷歌DeepMind团队推出的中长期天气预报模型

GenCast简介 GenCast是由Google DeepMind团队开发的一种先进的中长期天气预报模型,它采用机器学习技术,能够在短短8分钟内生成15天的全球天气预报。与传统的...

Motion Prompting:通过使用运动轨迹来控制视频内容的生成

Motion Prompting简介 Motion Prompting是一种创新的视频生成技术,由Google DeepMind的研究团队开发。该技术通过使用运动轨迹来控制视频内容的生成,相较于...
1 84 85 86 87 88 217