1.大模型相关

Qwen2-Math:阿里通义团队推出的的数学专用AI模型

Qwen2-Math简介 Qwen2-Math是阿里巴巴通义团队开发的一款先进的数学解决方案模型,它通过专门化的预训练和精细调整,显著提升了解决包括代数、几何、概率在内...

MiniCPM-V 2.6:面壁智能推出的MiniCPM-V 系列中最新、功能最强大的模型。

MiniCPM-V 2.6简介 MiniCPM-V 2.6 是由面壁智能开发的端侧多模态大型语言模型,是 MiniCPM-V 系列中最新、功能最强大的模型。该模型基于 SigLip-400M 和 Qwen...

谷歌发布全新“开放式”人工智能模型,重点关注安全

Gemma 2系列新成员 谷歌DeepMind于2024年8月1日宣布发布了Gemma 2系列的新成员,其中包括20亿参数的小模型Gemma 2B。这个新模型在大模型竞技场LMSYS Chatbot ...

SAM 2 :Meta AI 推出的能在图片和视频中实时分割对象的模型

SAM 2简介 2024年7月29日,Meta公司发布了Meta Segment Anything Model 2(SAM 2),这是首个支持视频和图像中实时可提示对象分割的统一模型,实现了最先进的...

Mistral Large 2:Mistral AI 推出的最新一代大语言模型

Mistral Large 2简介 Mistral Large 2 是由法国人工智能初创公司 Mistral AI 开发的最新一代大型语言模型。它拥有 1230 亿参数,支持 128k 的上下文窗口,能...

NeuralGCM:谷歌发布的最新天气预报AI 模型

NeuralGCM简介 NeuralGCM是由Google Research团队开发的一种创新的神经通用循环模型,它突破了传统气象预报和气候模拟的局限。这一模型通过将深度学习技术与...

Llama 3.1:Meta 推出迄今为止最大、最好的开源 AI 模型

Llama3.1简介 Llama 3.1 是 Meta 发布的一系列大型多语言语言模型,包含 8B、70B 和 405B 参数的版本。这些模型不仅支持预训练和指令调整,还具备更长的上下...

DCLM-7B:苹果公司联合研究团队推出的70亿参数开源小模型

DCLM-7B简介 苹果公司作为 DataComp-LM(DCLM)项目的研究机构之一,在 Hugging Face 上发布了 DCLM-7B 开源模型。该模型具有70亿参数,基于Common Crawl数据...

浦语灵笔IXC-2.5:支持长上下文输入和输出的多功能大视觉语言模型

浦语灵笔IXC-2.5简介 浦语灵笔IXC-2.5是由上海人工智能实验室联合香港中文大学、商汤科技集团和清华大学共同开发的一款多功能大型视觉语言模型。它具有长上下...
1 3 4 5