2.应用工具相关
SigStyle:吉林大学等推出的新型签名风格迁移框架
SigStyle简介 SigStyle是由吉林大学人工智能学院、计算机科学与技术学院,南京大学智能科学与技术学院以及Adobe公司联合开发的一种新型签名风格迁移框架。该...
DeepEP:DeepSeek开源的专家并行通信库
DeepEP简介 DeepEP是由DeepSeek团队开发的一款高效专家并行通信库,专为混合专家模型(Mixture-of-Experts, MoE)和专家并行(EP)任务设计。它通过优化的全...
MagicArticulate:自动为静态3D模型生成骨架
MagicArticulate 简介 MagicArticulate 是由南洋理工大学、字节跳动以及新加坡资讯通信研究所联合开发的创新框架,旨在将静态3D模型自动转换为支持动画的可关...
TANGLED:从任意风格和视角的图像中生成3D发丝
TANGLED简介 TANGLED是由上海科技大学和Deemos Technology联合开发的一种创新的3D发型生成方法。该方法通过多视图线稿条件下的扩散模型框架,能够从任意风格...
Llasa:香港科技大学等推出的语音合成模型
Llasa简介 Llasa是由香港科技大学、西北工业大学、北京科技大学、中国科学技术大学、香港中文大学、香港浸会大学、罗切斯特大学、上海摩拜信息技术有限公司等...
Indic Parler-TTS:Hugging Face等推出的多语言文本到语音模型
Indic Parler-TTS简介 Indic Parler-TTS 是一款由 Hugging Face 和 AI4Bharat 团队合作开发的多语言文本到语音(TTS)模型。它支持包括英语在内的 21 种印度...
AvatarGO:输入文本直接生成可动画化的4D人类与物体交互场景
AvatarGO简介 AvatarGO是由南洋理工大学S-Lab、上海人工智能实验室和香港大学联合开发的创新框架,旨在通过文本输入直接生成可动画化的4D人类与物体交互场景...
AgentSociety:清华大学推出的大型社会模拟器
AgentSociety简介 AgentSociety是由清华大学电子工程系、经济研究所、公共政策与管理学院联合开发的大型社会模拟器。该平台结合了大型语言模型(LLM)驱动的...
SigLIP 2:谷歌推出的多语言视觉-语言编码器
SigLIP 2简介 SigLIP 2是由Google DeepMind团队开发的一种新型多语言视觉-语言编码器。它在SigLIP的基础上进行了多项改进,通过结合基于标题的预训练、自监督...
Sitcom-Crafter:北航等推出的3D人类运动生成系统
Sitcom-Crafter简介 Sitcom-Crafter 是由来自北航、香港中文大学(深圳)、悉尼科技大学、挪威北极大学和中山大学的研究团队共同开发的一个人类运动生成系统...