DimensionX:利用单个图像生成高质量的3D和4D场景

DimensionX简介 DimensionX是由香港科技大学和清华大学的研究团队开发的一个创新框架,它能够利用单个图像通过可控的视频扩散技术生成高质量的3D和4D场景。该...

TableGPT2:浙大推出的专为表格数据处理而生的多模态模型

TableGPT2简介 TableGPT2是由浙江大学创新研究院的团队开发的一款前沿大型多模态模型,它通过精心设计的表格编码器和持续的预训练策略,显著提升了处理表格数...

GenXD:新加坡国立大学&微软推出的多视角3D和4D场景生成模型

GenXD简介 GenXD是由新加坡国立大学和微软公司的研究团队联合开发的一个统一模型,它能够从任意数量的条件图像中高效生成高质量的3D和4D场景。该模型利用日常...

AlphaFold 3:极大地提高了生物分子复合体结构预测的准确性

AlphaFold 3简介 AlphaFold 3是由Google DeepMind推出的一款人工智能模型,它极大地提高了生物分子复合体结构预测的准确性。该模型采用了扩散架构,能够预测...

URAvatar:能够从单台手机扫描中创建具有真实感的头部化身

URAvatar简介 URAvatar是由Meta开发的一种创新技术,它允许从单台手机扫描创建高度逼真的可重光照头部化身。这些化身能够在各种光照环境中实时动画和重光照,...

LucidFusion:从单张或多张未定位的2D图像生成高分辨率的3D对象

LucidFusion简介 LucidFusion是由香港科技大学推出的一种先进的3D内容生成技术。这项技术能够从任意未定位的多视图图像中生成高分辨率的3D高斯,通过利用相对...

ReCapture:为已有的视频内容生成具有全新相机轨迹的版本

ReCapture简介 ReCapture是由Google的研究团队开发的一种创新视频处理技术,它能够让用户为已有的视频内容生成具有全新相机轨迹的版本。这项技术通过掩码视频...

Fashion-VDM:谷歌联合华盛顿大学推出的视频虚拟试穿技术

Fashion-VDM简介 Fashion-VDM是由Google Research和华盛顿大学的研究团队共同开发的一种先进的视频扩散模型,用于虚拟试穿技术。该模型能够将给定的服装图像...

AdaCache:提高视频扩散变换器在生成视频时的推理速度

AdaCache简介 AdaCache是由Meta AI和石溪大学联合开发的一种创新方法,旨在加速视频扩散变换器(DiTs)的视频生成过程。这种方法无需额外训练,通过智能缓存...

IC-LoRA:阿里通义团队推出的一种创新图像生成框架

IC-LoRA简介 IC-LoRA(In-Context LoRA)是由阿里通义团队推出的一种创新图像生成框架,旨在通过简化的流程和最小的调整,激活扩散变换器(DiTs)的内在上下...
1 89 90 91 92 93 214