AI项目合集

Half_illustration:基于 Flux.1 的 LoRA 模型,能够将写实和插画元素融合在一起

Half_illustration简介 Half_illustration 是一个基于 Flux.1 的 LoRA 模型,它能够将写实和插画元素融合在一起,创造出独特的视觉效果。这种模型可以生成包...

Imagine Yourself:无需为特定对象微调的个性化图像生成 AI 模型

Imagine Yourself简介 Imagine Yourself 是Meta公司推出的个性化AI图像生成模型。它通过先进的合成配对数据和并行注意力架构,无需对用户进行单独调整即可创...

Still-Moving:Google DeepMind 团队开发的一种创新视频生成框架

Still-Moving简介 Still-Moving 是由 Google DeepMind 团队开发的一种创新视频生成框架,它允许在无需定制视频数据的情况下,对文本到视频(T2V)模型进行个...

LongVILA:提升长视频理解的多模态视觉语言模型

LongVILA简介 LongVILA是由英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校的联合研究团队开发的一种先进的多模态视觉语言模型。它专为长视频理解而设计,通...

CrewAI:用于协调角色扮演、自主 AI 代理的框架。

CrewAI简介 CrewAI是一个开源框架,它通过促进AI代理之间的协作智能,使它们能够像专业团队一样协同工作,共同完成复杂任务。这个框架支持角色定制、任务动态...

DeepSeek-Prover-V1.5:一个拥有70亿参数的开源数学大模型

DeepSeek-Prover-V1.5简介 DeepSeek-Prover-V1.5 是一个开源的数学大模型,拥有70亿参数。专为 Lean 4 中的定理证明而设计。它通过结合强化学习和蒙特卡洛树...

xGen-MM:Salesforce推出的一款开源多模态AI模型

xGen-MM简介 xGen-MM(原BLIP-3)是由Salesforce推出的一款开源的大型多模态模型(LMMs)。这些模型基于精心策划的数据集,采用统一的训练方法和优化的模型架...

Phi-3.5:微软最新推出的系列AI模型,包含三个模型

Phi-3.5简介 Phi-3.5是微软最新推出的系列AI模型,Phi-3.5系列包括三个模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,分别...

DistriFusion:显著减少使用扩散模型生成高分辨率图像所需的时间

DistriFusion简介 DistriFusion是由MIT、普林斯顿大学、Lepton AI和NVIDIA的联合研究团队开发的一种创新算法,旨在通过在多个GPU上实现分布式并行推理,显著...

Seed-ASR:可识别不同语言、方言、口音的AI语音识别模型

Seed-ASR简介 Seed-ASR是由字节跳动的Seed团队开发的一款基于大型语言模型(LLM)的语音识别模型。它通过结合超过2亿参数的音频编码器和具有数十亿参数的专家...
1 11 12 13 14 15 39