3-1.大语言模型
山海大模型:云知声正式推出的多模态大模型
山海大模型简介 山海大模型是云知声推出的多模态人工智能大模型,这是一款集语音交互、情感感知、音色切换和视觉场景理解于一体的先进人工智能系统。能够实时...
源2.0-M32:浪潮信息推出推出的双语混合专家(MoE)语言模型
源2.0-M32简介 源2.0-M32是由浪潮信息推出推出的先进双语混合专家(MoE)语言模型,采用具有32个专家的架构,其中每次激活2个专家。该模型引入了创新的'Atten...
DeepSeek-Prover-V1.5:一个拥有70亿参数的开源数学大模型
DeepSeek-Prover-V1.5简介 DeepSeek-Prover-V1.5 是一个开源的数学大模型,拥有70亿参数。专为 Lean 4 中的定理证明而设计。它通过结合强化学习和蒙特卡洛树...
xGen-MM:Salesforce推出的一款开源多模态AI模型
xGen-MM简介 xGen-MM(原BLIP-3)是由Salesforce推出的一款开源的大型多模态模型(LMMs)。这些模型基于精心策划的数据集,采用统一的训练方法和优化的模型架...
Phi-3.5:微软最新推出的系列AI模型,包含三个模型
Phi-3.5简介 Phi-3.5是微软最新推出的系列AI模型,Phi-3.5系列包括三个模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,分别...
Llama-3.1-Minitron:英伟达推出的仅4B参数的小型语言模型
Llama-3.1-Minitron简介 Llama-3.1-Minitron是由英伟达公司利用先进的剪枝和知识蒸馏技术,从Llama 3.1 8B模型中提炼而成的4B参数小型语言模型。它在保持与更...
LongWriter:将现有模型的文本生成能力扩展到超过10,000字
LongWriter项目简介 LongWriter是由清华大学与智谱AI联合开发的一项创新技术,旨在突破当前大型语言模型(LLMs)在生成长文本方面的限制。通过引入AgentWrite...
书生·浦语2.5:上海人工智能实验室推出的最新版AI大模型
书生·浦语2.5简介 书生·浦语2.5(InternLM2.5)是由上海人工智能实验室推出的最新版AI大模型。它以其超长的文本窗口支持高达一百万词元,以及在开源模型中领...
Grok-2:马斯克xAI公司推出的新一代AI模型
Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型,它是Grok-1.5的显著进步版本,具有在聊天、编码和推理方面的前沿能力。同时,公司还推出了Grok-2的小...
Falcon Mamba 7B:TII 推出的首个通用Mamba开源大模型
Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型,它采用了创新的 Mamba 状态空间语言模型架构,有效...