1-2.大模型&国外
Phi-3.5:微软最新推出的系列AI模型,包含三个模型
Phi-3.5简介 Phi-3.5是微软最新推出的系列AI模型,Phi-3.5系列包括三个模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,分别...
Llama-3.1-Minitron:英伟达推出的仅4B参数的小型语言模型
Llama-3.1-Minitron简介 Llama-3.1-Minitron是由英伟达公司利用先进的剪枝和知识蒸馏技术,从Llama 3.1 8B模型中提炼而成的4B参数小型语言模型。它在保持与更...
Grok-2:马斯克xAI公司推出的新一代AI模型
Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型,它是Grok-1.5的显著进步版本,具有在聊天、编码和推理方面的前沿能力。同时,公司还推出了Grok-2的小...
Falcon Mamba 7B:TII 推出的首个通用Mamba开源大模型
Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型,它采用了创新的 Mamba 状态空间语言模型架构,有效...
EXAONE 3.0:LG AI Research开发的7.8B参数指令调整型语言模型
EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型,具有7.8亿参数的指令调优能力,专门设计以提升双语环境下的表现,尤其在韩语上表现卓...
谷歌发布全新“开放式”人工智能模型,重点关注安全
Gemma 2系列新成员 谷歌DeepMind于2024年8月1日宣布发布了Gemma 2系列的新成员,其中包括20亿参数的小模型Gemma 2B。这个新模型在大模型竞技场LMSYS Chatbot ...
SAM 2 :Meta AI 推出的能在图片和视频中实时分割对象的模型
SAM 2简介 2024年7月29日,Meta公司发布了Meta Segment Anything Model 2(SAM 2),这是首个支持视频和图像中实时可提示对象分割的统一模型,实现了最先进的...
Mistral Large 2:Mistral AI 推出的最新一代大语言模型
Mistral Large 2简介 Mistral Large 2 是由法国人工智能初创公司 Mistral AI 开发的最新一代大型语言模型。它拥有 1230 亿参数,支持 128k 的上下文窗口,能...
Llama 3.1:Meta 推出迄今为止最大、最好的开源 AI 模型
Llama3.1简介 Llama 3.1 是 Meta 发布的一系列大型多语言语言模型,包含 8B、70B 和 405B 参数的版本。这些模型不仅支持预训练和指令调整,还具备更长的上下...
DCLM-7B:苹果公司联合研究团队推出的70亿参数开源小模型
DCLM-7B简介 苹果公司作为 DataComp-LM(DCLM)项目的研究机构之一,在 Hugging Face 上发布了 DCLM-7B 开源模型。该模型具有70亿参数,基于Common Crawl数据...