3.AI大模型数据库
TxGemma:谷歌推出的专为治疗性药物开发设计的通用模型
TxGemma简介 TxGemma是由谷歌开发的高效通用大型语言模型(LLM)套件,专为治疗性药物开发设计。该模型套件包含2B、9B和27B参数的模型,基于Gemma-2微调而成...
Qwen2.5-Omni:阿里开源的端到端全模态大模型
Qwen2.5-Omni简介 Qwen2.5-Omni是由阿里开源的端到端全模态大模型,能够处理文本、图像、音频和视频等多种模态输入,并以流式方式同时生成文本和自然语音响应...
Cosmos-Reason1:NVIDIA推出的系列多模态大型语言模型
Cosmos-Reason1简介 Cosmos-Reason1是由NVIDIA开发的一系列多模态大型语言模型,专注于理解和推理物理世界。该模型通过长链推理过程生成自然语言中的体现决策...
Qwen2.5-VL-32B:阿里开源的最新多模态模型
Qwen2.5-VL-32B简介 Qwen2.5-VL-32B 是由阿里巴巴团队开发的最新多模态模型,参数规模为为32B。该模型在视觉语言理解和生成方面表现出色,能够处理图像描述、...
Fin-R1:通过强化学习驱动的金融推理大模型
Fin-R1简介 Fin-R1是由上海财经大学、复旦大学和财跃星辰团队联合开发的一款专为金融推理设计的大型语言模型。该模型通过强化学习提升推理能力,有效解决了金...
Reka Flash 3:RekaAI 开源的通用推理模型
Reka Flash 3 简介 Reka Flash 3 是由 RekaAI 团队开发的一款 21B 参数的通用推理模型。该模型从零开始训练,结合了合成数据集和公共数据集进行监督微调,并...
Step-Video-TI2V:阶跃星辰推出的图像到视频生成模型
Step-Video-TI2V简介 Step-Video-TI2V是由阶跃星辰开发的文本驱动图像到视频生成模型。该模型基于300亿参数的Step-Video-T2V进行预训练,通过引入图像条件和...
EXAONE Deep:专注于推理任务的语言模型
EXAONE Deep简介 EXAONE Deep是由LG AI Research开发的一系列专注于推理任务的先进语言模型。该团队通过使用监督微调(SFT)、直接偏好优化(DPO)和在线强化...
InternVL:OpenGVLab等推出的多模态大模型
InternVL简介 InternVL是由上海人工智能实验室(OpenGVLab)联合南京大学、香港大学、香港中文大学、清华大学、中国科学技术大学和商汤科技等机构共同开发的...
OLMo 2 32B:Allen Institute for AI推出的大型语言模型
OLMo 2 32B简介 OLMo 2 32B 是由 Allen Institute for AI (Ai2) 开发的大型语言模型,是 OLMo 2 系列中规模最大且性能最强的模型。它拥有 320 亿参数,经过 6...