2.应用工具相关 | 第 30 页

MoMask：新型的文本驱动3D人类动作生成框架

MoMask简介 MoMask是一种新型的文本驱动3D人类动作生成框架，通过层次化的量化方案和双向变换器实现高质量的动作合成。它采用残差量化技术将动作分解为多层离...

2-6.应用工具3D

5个月前

UltraMem简介 UltraMem是由字节跳动豆包大模型团队开发的一种新型超稀疏记忆网络架构。它通过引入大规模超稀疏记忆层，显著降低了Transformer模型在推理过程...

2-5.应用工具其他

5个月前

HUGWBC简介 HUGWBC是由上海交通大学和上海人工智能实验室联合开发的人形机器人全身控制器。该控制器旨在实现人形机器人的精细运动控制和多功能性，通过扩展的...

2-5.应用工具其他

5个月前

PDF to Podcast简介 “PDF to Podcast”是由NVIDIA AI Blueprint团队开发的一项创新应用，旨在将PDF文档高效转换为音频内容，生成引人入胜的播客。它基于NVIDIA...

2-4.应用工具音频

5个月前

InternVideo2.5简介 InternVideo2.5是由上海人工智能实验室、南京大学和中国科学院深圳先进技术研究院联合开发的新型视频多模态大模型。该模型专注于通过长且...

2-3.应用工具视频

5个月前

Lumina-Video简介 Lumina-Video 是由 Alpha-VLLM 团队开发的一个专注于视频生成的开源项目。它旨在通过文本提示生成高质量的视频内容，支持文本到视频以及文...

2-3.应用工具视频

5个月前

Satori简介 Satori是由麻省理工学院、新加坡科技与设计大学、哈佛大学、IBM研究实验室以及马萨诸塞大学阿默斯特分校的研究团队共同开发的一种新型大型语言模...

2-5.应用工具其他

5个月前

Goku简介 Goku是由香港大学和字节跳动公司联合开发的先进图像和视频生成模型。它利用改进的流（rectified flow）Transformer架构，通过精心设计的数据处理流...

2-2.应用工具图像

5个月前

LLaVA-Med简介 LLaVA-Med是由微软推出的一款针对生物医学领域的大型语言和视觉助手。该团队通过创新的方法，利用PubMed Central的海量生物医学图像-标题数据...

2-5.应用工具其他

5个月前

InspireMusic简介 InspireMusic 是由阿里巴巴通义实验室开发的开源音乐生成框架，旨在通过人工智能技术赋能音乐创作。它基于自回归 Transformer 和音频标...

2-4.应用工具音频

5个月前