2.应用工具相关
PaddleSpeech:百度飞桨团队开源的全功能语音处理工具包
PaddleSpeech简介 PaddleSpeech是由百度飞桨团队开发的一个开源的、全功能的语音处理工具包。它旨在通过提供易于使用的命令行界面和简洁的代码结构,降低语音...
ChatAnyone:阿里通义推出的实时肖像视频生成框架
ChatAnyone简介 ChatAnyone是由阿里巴巴集团通义实验室开发的一种新型实时肖像视频生成框架。它通过分层运动扩散模型和混合控制融合生成模型,能够根据输入的...
RoboBrain:该模型专为机器人操作任务设计
RoboBrain简介 RoboBrain是由北京大学计算机学院多媒体信息处理国家重点实验室、北京人工智能研究院、中国科学院自动化研究所、中国科学院信息工程研究所、香...
LeX-Art:满足用户对于图像质量和视觉效果的高要求
LeX-Art简介 LeX-Art是一个致力于提升文本到图像合成质量的综合性研究项目。它通过数据驱动的方法,构建了LeX-10K这一包含10,000张高分辨率、高质量文本图像...
ModelEngine:华为开源的全流程 AI 开发工具链
ModelEngine 简介 ModelEngine 是由华为开发团队推出的开源全流程 AI 开发工具链。它为开发者提供从模型设计、训练、优化到部署的全生命周期支持,涵盖计算机...
Bolt3D:谷歌联合牛津大学等推出的3D场景生成模型
Bolt3D简介 Bolt3D是由Google Research、VGG – University of Oxford以及Google DeepMind联合开发的3D场景生成模型。它能够在几秒钟内从一张或多张输入图像直...
Piece it Together:高效地生成完整且连贯的概念设计
Piece it Together简介 Piece it Together(PiT)是由特拉维夫大学和Bria AI联合开发的一种创新的生成框架,旨在帮助视觉设计师和艺术家从部分视觉组件出发,...
FirePlace:将新的3D对象放置到复杂的现有3D场景中
FirePlace简介 FirePlace是由斯坦福大学和谷歌DeepMind的推出的将新的3D对象放置到复杂的现有3D场景中的创新框架。该框架通过结合多模态大型语言模型(MLLMs...
TaoAvatar:阿里推出的实时生成逼真全身动态3D虚拟形象的系统
TaoAvatar简介 TaoAvatar是由阿里巴巴集团开发的实时生成逼真全身动态3D虚拟形象的系统。该系统基于3D高斯点绘(3DGS)技术,结合个性化的人体参数化模板和轻...
DeepMesh:清华联合南洋理工大学等推出的3D网格生成框架
DeepMesh简介 DeepMesh是由清华大学、南洋理工大学和圣书科技的研究团队共同开发的一种创新的3D网格生成框架,旨在通过结合自回归方法和强化学习技术高效生成...