Edify 3D:根据输入的文本提示生成相应的3D数字资产

Edify 3D简介 Edify 3D 是 NVIDIA 推出的 3D 资产生成解决方案,能够根据文本提示或参考图像快速生成高质量、细节丰富的 3D 模型。这项技术结合了扩散模型和 ...

SongCreator:由清华大学推出的基于歌词的全能歌曲生成模型

SongCreator简介 SongCreator是由清华大学深圳国际研究生院的一个团队开发的一款先进的歌曲生成模型,它能够根据歌词创作出包含声乐和伴奏的完整歌曲。该系统...

DynaSaur:Adobe研究团队推出的新型LLM代理框架

DynaSaur简介 DynaSaur是由Adobe Research团队开发的一种新型大型语言模型(LLM)代理框架,它突破了传统LLM代理系统的限制,能够动态创建和组合动作以在线方...

Takin AudioLLM:喜马拉雅推出的零样本语音生成模型

Takin AudioLLM简介 Takin AudioLLM是由喜马拉雅的Everest团队开发的一款先进的零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing三个模型,专为...

AutoTrain:Hugging Face推出的开源无代码工具/库

AutoTrain简介 AutoTrain是由Hugging Face开发的开源无代码工具/库,旨在简化不同任务的模型训练过程,包括大型语言模型微调、文本和图像分类等。它支持Huggi...

CAMPHOR:斯坦福大学和苹果联合推出的小型语言模型多代理框架

CAMPHOR简介 CAMPHOR是由斯坦福大学和苹果公司联合开发的一种创新的在设备上运行的小型语言模型多代理框架。它专门设计用于处理多用户输入,并在本地进行高阶...

ACE:阿里通义实验室推出的全能型图像生成和编辑模型

ACE简介 ACE是由阿里通义实验室开发的一款全能型图像生成和编辑模型,它基于扩散变换器技术,能够理解和执行通过自然语言指令提出的复杂图像编辑任务。ACE通...

ViewExtrapolator:能够在训练视图范围之外生成新的视角图像

ViewExtrapolator简介 ViewExtrapolator是由南洋理工大学和UCAS-Terminus AI实验室联合开发的一种创新方法,它通过利用稳定视频扩散(Stable Video Diffusion...

OpenScholar:辅助科学家整合科学文献的检索大型语言模型

OpenScholar简介 OpenScholar是由华盛顿大学、艾伦人工智能研究所、伊利诺伊大学厄巴纳-香槟分校、卡内基梅隆大学、北卡罗来纳大学教堂山分校和斯坦福大学联...

OneDiffusion:能够实现图像合成和理解的双向任务

OneDiffusion简介 OneDiffusion是由AI2团队开发的一款多功能大规模扩散模型,它能够实现图像合成和理解的双向任务,覆盖文本到图像的生成、条件图像生成、图...
1 87 88 89 90 91 217