AI论文

GGHead:生成高分辨率且几何一致的3D人头模型

GGHead简介 GGHead是由德国慕尼黑工业大学推出的一种先进的3D生成对抗网络(3D GAN),它采用3D高斯散射技术,能够从大量的2D图像中快速学习并生成高分辨率且...

I2VEdit:南洋理工和商汤科技联合推出的一款视频编辑框架

I2VEdit简介 I2VEdit是由南洋理工大学和商汤科技研究院共同开发的一种创新视频编辑框架。该框架利用图像到视频的扩散模型,实现了以第一帧图像编辑为引导的全...

DualGS:打造沉浸式以人为中心的立体视频

DualGS简介 DualGS是由上海科技大学与NeuDim数字技术(上海)有限公司联合研发的一种体积视频技术。该技术通过创新的双高斯表示法,分别捕捉人体的运动和外观...

WonderWorld :交互式地生成连贯且多样化的3D虚拟环境

WonderWorld 简介 WonderWorld是由斯坦福大学和麻省理工学院的联合推出的一款创新性3D场景生成框架。该框架允许用户通过单张图片和文本提示,交互式地生成并...

Click2Mask:允许用户在图像的特定区域添加、修改或删除内容

Click2Mask简介 Click2Mask 是由耶路撒冷希伯来大学的研究团队开发的一种创新图像编辑方法,它通过用户仅提供一个参考点和内容描述,便能自动生成动态遮罩并...

IFAdapter:能够精确控制生成的图像中每个对象的位置和特征

IFAdapter简介 IFAdapter是由新加坡国立大学和腾讯联合开发的一种创新技术,旨在提升基于文本的图像生成模型在处理多个实例时的精确度和特征细节。该技术通过...

Draw an Audio:将无声视频转换成包含日常音效的音频

Draw an Audio简介 Draw an Audio是由中国科学院自动化研究所和美团公司的研究团队共同开发的一种创新的视频到音频合成技术。该技术通过先进的遮罩注意力模块...

Loopy:字节&浙大推出的音频驱动视频生成模型

Loopy简介 Loopy是由字节跳动公司和浙江大学的研究团队共同开发的一种先进的音频驱动视频生成模型。该模型采用端到端的设计,专注于利用长期运动依赖性来提高...

DiffUHaul:无需额外训练即可实现图像中对象的无缝拖动

DiffUHaul简介 DiffUHaul是由NVIDIA Research、耶路撒冷希伯来大学、特拉维夫大学和Reichman大学共同研发的一项创新技术。这项技术通过利用局部文本到图像模...

InterTrack:能够从单目RGB视频中跟踪人体与物体的互动

InterTrack简介 InterTrack是由德国图宾根大学、图宾根人工智能中心以及马克斯·普朗克信息学研究所的研究人员开发的一种先进的跟踪技术。这项技术能够从单目R...
1 2