2.应用工具相关

IFAdapter:能够精确控制生成的图像中每个对象的位置和特征

IFAdapter简介 IFAdapter是由新加坡国立大学和腾讯联合开发的一种创新技术,旨在提升基于文本的图像生成模型在处理多个实例时的精确度和特征细节。该技术通过...

GameGen-O:腾讯等推出的生成开放世界视频游戏的DiT模型

GameGen-O 简介 GameGen-O 是由香港科技大学、中国科技大学以及腾讯共同开发的先进扩散变换器模型,专门设计用于生成开放世界视频游戏。它模拟游戏引擎特性,...

PyVideoTrans:将视频从一种语言翻译成另一种语言

PyVideoTrans简介 PyVideoTrans是一款开源的视频翻译工具,它能够将视频从一种语言翻译成另一种语言,同时生成并添加相应的字幕和配音。它利用了更快的whisper...

Draw an Audio:将无声视频转换成包含日常音效的音频

Draw an Audio简介 Draw an Audio是由中国科学院自动化研究所和美团公司的研究团队共同开发的一种创新的视频到音频合成技术。该技术通过先进的遮罩注意力模块...

FilmPortrait:生成色彩风格较为低饱和度的日系胶片风格

FilmPortrait简介 FilmPortrait 是一个基于FLUX.1-dev 上微调的 LoRA 模型,专注于探索和复现胶片摄影的独特质感。这个模型以较低的饱和度和典型的日式胶片色...

AppFlowy:一个开源的笔记和任务管理工具

AppFlowy简介 AppFlowy 是一个开源的笔记和任务管理工具,它提供了类似于 Notion 的功能,但更加注重隐私保护和自托管能力。它允许用户在自己的服务器上运行...

Concept Sliders:实现对图像生成中属性的精确控制 如年龄、风格、表情等

Concept Sliders简介 Concept Sliders是由东北大学和麻省理工学院CSAIL的研究人员开发的一种创新方法,它通过在扩散模型中引入低秩参数方向,实现了对图像生...

Deepfake Defenders:识别和防范Deepfake技术生成的伪造图像和视频

Deepfake Defenders简介 ​Deepfake Defenders是一款由中国科学院推出的开源AI模型,专注于识别和防范Deepfake技术生成的伪造图像和视频。​该模型通过深度学习...

LinFusion :新加坡国立大学推出的一种新型的图像生成模型

LinFusion 简介 LinFusion是由新加坡国立大学推出的一种新型的图像生成模型,该模型通过引入线性注意力机制,显著减少了生成高分辨率图像的时间和内存复杂度...

ViewCrafter:利用视频扩散模型合成高保真新视角视频

ViewCrafter简介 ViewCrafter 是由北京大学和鹏城实验室的研究团队开发的一种创新方法,它结合了视频扩散模型和点云表示技术,用于从单个或稀疏图像合成高保...
1 2 3 14