3.AI大模型数据库
MoCha:Meta等推出的端到端对话角色视频生成模型
MoCha简介 MoCha是由Meta和滑铁卢大学联合开发的端到端对话角色视频生成模型。它仅需语音和文本输入,无需额外辅助条件,即可生成电影级的多角色对话动画。Mo...
HSMR:从单张图像中恢复具有生物力学精确骨骼的人体模型
HSMR简介 HSMR(Human Skeleton and Mesh Recovery)是一种创新的3D人体重建方法,能够从单张图像中恢复具有生物力学精确骨骼的人体模型。它基于SKEL模型,结...
SECOND ME:心识宇宙推出的的AI原生记忆系统
SECOND ME简介 SECOND ME是由Mindverse【心识宇宙】推出的的AI原生记忆系统,旨在通过大型语言模型(LLM)技术重新定义个人记忆管理。它作为一个智能的、持久...
MegaTTS 3:字节跳动开源的文本到语音模型
MegaTTS 3简介 MegaTTS 3是由字节跳动开源的高效文本到语音(TTS)模型。它以轻量级和高效性为特点,参数量仅0.45亿,却能实现超高音质的语音克隆,支持中文...
GAIA-2:Wayve团队开发的可控多视角生成式世界模型
GAIA-2简介 GAIA-2是由Wayve团队开发的可控多视角生成式世界模型,专为自动驾驶领域设计。该模型通过其创新的架构和训练方法,能够生成高分辨率、时空一致的...
TxGemma:谷歌推出的专为治疗性药物开发设计的通用模型
TxGemma简介 TxGemma是由谷歌开发的高效通用大型语言模型(LLM)套件,专为治疗性药物开发设计。该模型套件包含2B、9B和27B参数的模型,基于Gemma-2微调而成...
Qwen2.5-Omni:阿里开源的端到端全模态大模型
Qwen2.5-Omni简介 Qwen2.5-Omni是由阿里开源的端到端全模态大模型,能够处理文本、图像、音频和视频等多种模态输入,并以流式方式同时生成文本和自然语音响应...
Cosmos-Reason1:NVIDIA推出的系列多模态大型语言模型
Cosmos-Reason1简介 Cosmos-Reason1是由NVIDIA开发的一系列多模态大型语言模型,专注于理解和推理物理世界。该模型通过长链推理过程生成自然语言中的体现决策...
Qwen2.5-VL-32B:阿里开源的最新多模态模型
Qwen2.5-VL-32B简介 Qwen2.5-VL-32B 是由阿里巴巴团队开发的最新多模态模型,参数规模为为32B。该模型在视觉语言理解和生成方面表现出色,能够处理图像描述、...
Fin-R1:通过强化学习驱动的金融推理大模型
Fin-R1简介 Fin-R1是由上海财经大学、复旦大学和财跃星辰团队联合开发的一款专为金融推理设计的大型语言模型。该模型通过强化学习提升推理能力,有效解决了金...