3.AI大模型数据库
ControlNeXt:高效可控的图像与视频生成方法
ControlNeXt简介 ControlNeXt是由CUHK和SmartMore的开发团队提出的一种先进方法,专为图像和视频生成提供强大且高效的可控性。这种方法通过简化的架构和创新...
Grok-2:马斯克xAI公司推出的新一代AI模型
Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型,它是Grok-1.5的显著进步版本,具有在聊天、编码和推理方面的前沿能力。同时,公司还推出了Grok-2的小...
Falcon Mamba 7B:TII 推出的首个通用Mamba开源大模型
Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型,它采用了创新的 Mamba 状态空间语言模型架构,有效...
LLaVA-OneVision:字节等推出的开源大型多模态模型
LLaVA-OneVision简介 LLaVA-OneVision 是由字节跳动、南洋理工大学、香港中文大学和香港科技大学的专家团队共同研发的一系列先进大型多模态模型。这些模型通...
Cradle:使AI Agent像人一样通过控制键盘鼠标来完成计算机任务
Cradle简介 Cradle是由北京人工智能研究院(BAAI)、新加坡南洋理工大学和北京大学计算机学院的联合研究团队开发的一款新型智能代理框架。该框架旨在通过模拟...
Data-Juicer :阿里推出的一站式大型语言模型(LLMs)数据处理系统
Data-Juicer简介 Data-Juicer 是由阿里推出的一款一站式大型语言模型(LLMs)数据处理系统。它通过提供超过50个内置操作符,支持用户灵活地组合和扩展,以生...
VITA:腾讯等推出的开源多模态大型语言模型
VITA简介 VITA是由腾讯优图实验室联合南京大学、厦门大学以及中国科学院自动化研究所的研究人员共同开发的开源多模态大型语言模型。它集成了对视频、图像、文...
CharacterFactory:大连理工推出的能创建具有一致身份特征角色的框架
CharacterFactory简介 CharacterFactory是由中国大连理工大学的研究团队开发的一项创新技术,它是一个利用生成对抗网络(GANs)和扩散模型来创建具有一致身份...
ReSyncer:可以实现音视频唇型同步、说话风格迁移和换脸
ReSyncer简介 ReSyncer是由清华大学BNRist实验室与百度公司共同开发的先进框架,它通过创新性地重新配置基于风格的生成器,并融合3D人脸动态预测技术,实现了...
HumanVid:为人类图像动画提供训练资料的大型高质量数据集
HumanVid简介 HumanVid 是由香港中文大学和上海人工智能实验室联合开发的大型高质量数据集,旨在为人类图像动画提供训练资料。该数据集通过结合精心挑选的现...