2.应用工具相关

MagicArticulate:自动为静态3D模型生成骨架

MagicArticulate 简介 MagicArticulate 是由南洋理工大学、字节跳动以及新加坡资讯通信研究所联合开发的创新框架,旨在将静态3D模型自动转换为支持动画的可关...

TANGLED:从任意风格和视角的图像中生成3D发丝

TANGLED简介 TANGLED是由上海科技大学和Deemos Technology联合开发的一种创新的3D发型生成方法。该方法通过多视图线稿条件下的扩散模型框架,能够从任意风格...

Llasa:香港科技大学等推出的语音合成模型

Llasa简介 Llasa是由香港科技大学、西北工业大学、北京科技大学、中国科学技术大学、香港中文大学、香港浸会大学、罗切斯特大学、上海摩拜信息技术有限公司等...

Indic Parler-TTS:Hugging Face等推出的多语言文本到语音模型

Indic Parler-TTS简介 Indic Parler-TTS 是一款由 Hugging Face 和 AI4Bharat 团队合作开发的多语言文本到语音(TTS)模型。它支持包括英语在内的 21 种印度...

AvatarGO:输入文本直接生成可动画化的4D人类与物体交互场景

AvatarGO简介 AvatarGO是由南洋理工大学S-Lab、上海人工智能实验室和香港大学联合开发的创新框架,旨在通过文本输入直接生成可动画化的4D人类与物体交互场景...

AgentSociety:清华大学推出的大型社会模拟器

AgentSociety简介 AgentSociety是由清华大学电子工程系、经济研究所、公共政策与管理学院联合开发的大型社会模拟器。该平台结合了大型语言模型(LLM)驱动的...

SigLIP 2:谷歌推出的多语言视觉-语言编码器

SigLIP 2简介 SigLIP 2是由Google DeepMind团队开发的一种新型多语言视觉-语言编码器。它在SigLIP的基础上进行了多项改进,通过结合基于标题的预训练、自监督...

Sitcom-Crafter:北航等推出的3D人类运动生成系统

Sitcom-Crafter简介 Sitcom-Crafter 是由来自北航、香港中文大学(深圳)、悉尼科技大学、挪威北极大学和中山大学的研究团队共同开发的一个人类运动生成系统...

ComfyUI-Copilot:阿里推出的基于ComfyUI框架的AI智能助手

ComfyUI-Copilot简介 ComfyUI-Copilot是由阿里巴巴国际数字商务团队(Alibaba International Digital Commerce)开发的一款基于ComfyUI框架的AI智能助手。它...

FlexTok:苹果公司等推出的新型图像编码技术

FlexTok简介 FlexTok是由Apple公司和瑞士联邦理工学院洛桑分校(EPFL)的研究团队共同开发的一种创新图像编码技术。它能够将二维图像重新采样为灵活长度的一...
1 14 15 16 17 18 77