3.AI大模型数据库

MinT:Snap与多伦多大学团队推出的视频生成模型

MinT简介 MinT(Mind the Time)是由Snap与多伦多大学团队推出的视频生成模型,它能够根据文本提示和预定的时间戳生成具有精确时间控制的视频序列。通过创新...

ILLUME:华为诺亚方舟实验室推出的多模态模型

ILLUME简介 ILLUME是由华为诺亚方舟实验室开发的一款创新的统一多模态大型语言模型(MLLM),它通过集成多模态理解和生成能力,能够在单一的大型语言模型框架...

YuLan-Mini:中国人民大学推出的具有2.42亿参数的轻量级语言模型

YuLan-Mini简介 YuLan-Mini是由中国人民大学高瓴人工智能学院开发的一个具有2.42亿参数的轻量级语言模型。该模型以其数据高效和训练稳定性而著称,能够在相对...

The Language of Motion:李飞飞团队推出的多模态语言模型

The Language of Motion简介 'The Language of Motion'是由斯坦福大学李飞飞团队开发的一项创新研究,旨在通过一个多模态语言模型框架来统一和理解人类的口头...

Apollo:Meta和斯坦福大学联合推出的大型多模态模型

Apollo简介 Apollo是Meta GenAI与斯坦福大学合作开发的一系列先进的大型多模态模型(LMMs),旨在深入探索和提升视频理解能力。该模型家族通过系统性研究,优...

Ruyi:图森未来推出的图生视频大模型

Ruyi简介 Ruyi是图森未来推出的图生视频大模型,基于DiT架构,拥有约71亿参数,支持多分辨率、多时长视频生成。它能够根据用户控制的起始帧和结束帧定制视频...

Megrez-3B-Omni:无问芯穹开源的全球首个端侧全模态理解模型

Megrez-3B-Omni 简介 Megrez-3B-Omni 是无问芯穹开源的全球首个端侧全模态理解模型,它能够处理图像、音频和文本等多种数据类型,具有30亿参数,推理速度快,...

Veo 2:谷歌 DeepMind 推出的最新版 AI 视频生成模型

Veo 2 简介 Veo 2 是谷歌 DeepMind 推出的最新版 AI 视频生成模型,它能够生成高达 4K 分辨率的视频,支持长达 2 分钟的视频片段。Veo 2 通过深度学习技术,...

Lyra:香港中文大学等推出的多模态语言模型

Lyra简介 Lyra是由香港中文大学、SmartMore和香港科技大学的联合研究团队开发的一款高效且以语音为中心的多模态大型语言模型框架。该框架通过先进的语音理解...

Phi-4:微软推出的14亿参数的大型语言模型

Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型,它通过专注于数据质量的训练方法,在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...
1 2 3 20