3.AI大模型数据库
Nemotron-70B-Instruct:英伟达开源的大语言模型
Nemotron-70B-Instruct简介 Nemotron-70B-Instruct 是英伟达开原的一款高性能大型语言模型,专注于提升自然语言处理的质量和效率。基于先进的变换器架构,该...
Yi-Lightning:零一万物最新推出的高性能语言模型
Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型,采用了混合专家模型架构(Mixture of Experts, MoE),结合了动态Top-P路由机制和混合...
DisEnvisioner:根据用户提供的视觉提示和文本指令生成个性化的图像
DisEnvisioner简介 DisEnvisioner是由香港科技大学(广州)和诺亚方舟实验室联合开发的一种创新图像生成模型,它通过分离和丰富视觉提示中的主体本质特征,有...
Meissonic:开源可商用的非自回归文本到图像生成模型
Meissonic简介 Meissonic是由Skywork AI团队开发的一款先进的文本到图像生成模型,它通过创新的非自回归遮蔽图像建模(MIM)技术,实现了与业界领先的扩散模...
SANA:能够生成高达4096×4096分辨率的图像
SANA简介 SANA是由NVIDIA、麻省理工学院和清华大学的联合研究团队开发的一种高效的文本到图像生成框架,它能够快速生成高达4096×4096分辨率的高清晰度图像。...
Loong:香港大学与字节跳动联合推出的一款长视频生成模型
Loong简介 Loong是由香港大学与字节跳动公司联合开发的一款新型的长视频生成模型,它能够生成内容连贯、动态丰富的分钟级长视频。该模型通过将文本和视频标记...
MM1.5:苹果公司推出的多模态大型语言模型
MM1.5简介 MM1.5是苹果公司推出的多模态大型语言模型,旨在提升模型在文本丰富的图像理解、视觉指代和定位以及多图像推理方面的能力。该模型包括不同规模的版...
F5-TTS:上海交通大学推出的非自回归文本到语音模型
F5-TTS简介 F5-TTS是由上海交通大学的研究团队开发的一种非自回归文本到语音模型,它采用了基于流匹配的扩散变换器技术。该系统通过简化的设计,无需复杂的时...
Aria:Rhymes AI推出的开源多模态原生混合专家模型
Aria简介 Aria 是由Rhymes AI团队推出的一款开源的多模态原生混合专家(Mixture-of-Experts)模型。它专为整合和理解来自多种模态的真实世界信息而设计,能够...
Pyramid Flow:北大和快手联合推出的新型视频生成模型
Pyramid Flow简介 Pyramid Flow是一种创新的视频生成模型,由北京大学和快手科技的开发团队联合研发。该框架通过引入空间和时间金字塔的概念,优化了视频生成...