2.应用工具相关

CLASI:腾讯开发的一种先进的同声传译系统

CLASI简介 CLASI是由腾讯研究团队开发的一种先进的同声传译系统,旨在通过利用大型语言模型(LLM)实现与人类口译员相媲美的翻译质量和流畅度。CLASI采用了创...

Open-Sora-Plan:致力于复现OpenAI的文本转视频模型Sora

Open-Sora-Plan简介 Open-Sora Plan是由北京大学-兔展AIGC联合实验室发起的一个开源项目,致力于复现OpenAI的文本到视频模型Sora。该项目通过社区协作,不断...

Fooocus:一个免费且开源的文本到图像生成工具,类似SD和MJ

Fooocus简介 Fooocus是一款集创新与便捷于一身的开源AI图像生成工具,它重新构建了Stable Diffusion和Midjourney等现有模型的设计,基于Gradio框架开发。这款...

SpeechGPT:复旦大学等推出的跨模态对话模型

SpeechGPT简介 SpeechGPT 是由复旦大学计算机科学学院和智能信息处理上海重点实验室的研究团队开发的一项创新技术。这项技术突破了传统大型语言模型的局限,...

GaussianEditor:使用高斯溅射实现快速且可控的 3D 编辑

GaussianEditor 简介 GaussianEditor是由南洋理工大学S-Lab和计算机科学与工程学院,以及清华大学计算机科学与技术系的联合研究团队开发的一种创新3D编辑算法...

Bark: Suno AI 推出的一个开源文本到音频模型

Bark简介 Bark 是由 Suno AI 推出的一个开源文本到音频模型,它基于转换器架构,能够生成逼真的多语言语音以及其他类型的音频,包括音乐、背景噪音和简单的音...

Stable Video 4D:Stability AI最新推出的用于动态多角度视频生成的 AI 模型

Stable Video 4D简介 Stable Video 4D 是由 Stability AI 推出的一款人工智能视频生成模型。它通过先进的算法,能够将单一视频输入转化为八个不同视角下的多...

CLAY:用于创建高质量 3D 资产的可控大规模生成模型

CLAY简介 CLAY是由上海科技大学和Deemos Technology Co., Ltd.的联合研究团队开发的一款创新的大规模3D生成模型,旨在将人类的想象力轻松转化为精细的三维数...

SadTalker:单张静态人脸图像和音频输入,生成逼真且风格化的3D动态谈话视频

SadTalker简介 SadTalker是由西安交通大学、腾讯AI实验室和蚂蚁集团的联合研究团队开发的一项先进技术。这项技术能够利用单张静态人脸图像和音频输入,生成逼...

Roop:一款开源的AI视频换脸工具

Roop简介 Roop是一款开源的AI视频换脸工具,它通过先进的面部检测和生成对抗网络技术,允许用户无需复杂训练即可实现一键换脸。用户只需上传目标面部图片,Ro...
1 22 23 24 25