2.应用工具相关

Fooocus:一个免费且开源的文本到图像生成工具,类似SD和MJ

Fooocus简介 Fooocus是一款集创新与便捷于一身的开源AI图像生成工具,它重新构建了Stable Diffusion和Midjourney等现有模型的设计,基于Gradio框架开发。这款...

SpeechGPT:复旦大学等推出的跨模态对话模型

SpeechGPT简介 SpeechGPT 是由复旦大学计算机科学学院和智能信息处理上海重点实验室的研究团队开发的一项创新技术。这项技术突破了传统大型语言模型的局限,...

GaussianEditor:使用高斯溅射实现快速且可控的 3D 编辑

GaussianEditor 简介 GaussianEditor是由南洋理工大学S-Lab和计算机科学与工程学院,以及清华大学计算机科学与技术系的联合研究团队开发的一种创新3D编辑算法...

Bark: Suno AI 推出的一个开源文本到音频模型

Bark简介 Bark 是由 Suno AI 推出的一个开源文本到音频模型,它基于转换器架构,能够生成逼真的多语言语音以及其他类型的音频,包括音乐、背景噪音和简单的音...

Stable Video 4D:Stability AI最新推出的用于动态多角度视频生成的 AI 模型

Stable Video 4D简介 Stable Video 4D 是由 Stability AI 推出的一款人工智能视频生成模型。它通过先进的算法,能够将单一视频输入转化为八个不同视角下的多...

CLAY:用于创建高质量 3D 资产的可控大规模生成模型

CLAY简介 CLAY是由上海科技大学和Deemos Technology Co., Ltd.的联合研究团队开发的一款创新的大规模3D生成模型,旨在将人类的想象力轻松转化为精细的三维数...

SadTalker:单张静态人脸图像和音频输入,生成逼真且风格化的3D动态谈话视频

SadTalker简介 SadTalker是由西安交通大学、腾讯AI实验室和蚂蚁集团的联合研究团队开发的一项先进技术。这项技术能够利用单张静态人脸图像和音频输入,生成逼...

Roop:一款开源的AI视频换脸工具

Roop简介 Roop是一款开源的AI视频换脸工具,它通过先进的面部检测和生成对抗网络技术,允许用户无需复杂训练即可实现一键换脸。用户只需上传目标面部图片,Ro...

ProPainter:南洋理工大学推出的AI视频修复技术

ProPainter简介 ProPainter是一种先进的视频修复技术,由新加坡南洋理工大学S-Lab的研究团队开发。这项技术专注于视频修复中的填充任务,能够填补视频中的缺...

MagicPose:基于扩散模型的2D人体姿态与表情重定向

MagicPose简介 MagicPose是由美国南加州大学与字节跳动公司联合开发的创新模型,它利用基于扩散的机制,实现了对2D人物姿态和面部表情的精准重定向。这项技术...
1 12 13 14 15