3.AI大模型数据库
MUMU:一款创新的多模态图像生成模型
MUMU简介 MUMU是由Sutter Hill Ventures的研究团队开发的一款创新的多模态图像生成模型,它能够通过结合文本和图像输入生成新的图像。该模型通过自举方法构建...
源2.0-M32:浪潮信息推出推出的双语混合专家(MoE)语言模型
源2.0-M32简介 源2.0-M32是由浪潮信息推出推出的先进双语混合专家(MoE)语言模型,采用具有32个专家的架构,其中每次激活2个专家。该模型引入了创新的'Atten...
TrackGo:一种灵活高效的可控视频生成方法
TrackGo简介 TrackGo是由北京航空航天大学和AISphere Tech的联合研究团队开发的一种创新视频生成方法。这项技术允许用户通过自由形式的遮罩和箭头来指定目标...
Imagine Yourself:无需为特定对象微调的个性化图像生成 AI 模型
Imagine Yourself简介 Imagine Yourself 是Meta公司推出的个性化AI图像生成模型。它通过先进的合成配对数据和并行注意力架构,无需对用户进行单独调整即可创...
Still-Moving:Google DeepMind 团队开发的一种创新视频生成框架
Still-Moving简介 Still-Moving 是由 Google DeepMind 团队开发的一种创新视频生成框架,它允许在无需定制视频数据的情况下,对文本到视频(T2V)模型进行个...
DeepSeek-Prover-V1.5:一个拥有70亿参数的开源数学大模型
DeepSeek-Prover-V1.5简介 DeepSeek-Prover-V1.5 是一个开源的数学大模型,拥有70亿参数。专为 Lean 4 中的定理证明而设计。它通过结合强化学习和蒙特卡洛树...
xGen-MM:Salesforce推出的一款开源多模态AI模型
xGen-MM简介 xGen-MM(原BLIP-3)是由Salesforce推出的一款开源的大型多模态模型(LMMs)。这些模型基于精心策划的数据集,采用统一的训练方法和优化的模型架...
Phi-3.5:微软最新推出的系列AI模型,包含三个模型
Phi-3.5简介 Phi-3.5是微软最新推出的系列AI模型,Phi-3.5系列包括三个模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,分别...
Seed-ASR:可识别不同语言、方言、口音的AI语音识别模型
Seed-ASR简介 Seed-ASR是由字节跳动的Seed团队开发的一款基于大型语言模型(LLM)的语音识别模型。它通过结合超过2亿参数的音频编码器和具有数十亿参数的专家...
TurboEdit:可通过文本提示来实时指导图像的编辑
TurboEdit简介 TurboEdit是由Adobe Research开发的一项创新技术,它通过引入基于编码器的迭代反演技术和条件化处理,实现了对图像的精确反演和解耦图像编辑。...