3-1.大语言模型

xGen-MM:Salesforce推出的一款开源多模态AI模型

xGen-MM简介 xGen-MM(原BLIP-3)是由Salesforce推出的一款开源的大型多模态模型(LMMs)。这些模型基于精心策划的数据集,采用统一的训练方法和优化的模型架...

Phi-3.5:微软最新推出的系列AI模型,包含三个模型

Phi-3.5简介 Phi-3.5是微软最新推出的系列AI模型,Phi-3.5系列包括三个模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,分别...

Llama-3.1-Minitron:英伟达推出的仅4B参数的小型语言模型

Llama-3.1-Minitron简介 Llama-3.1-Minitron是由英伟达公司利用先进的剪枝和知识蒸馏技术,从Llama 3.1 8B模型中提炼而成的4B参数小型语言模型。它在保持与更...

LongWriter:将现有模型的文本生成能力扩展到超过10,000字

LongWriter项目简介 LongWriter是由清华大学与智谱AI联合开发的一项创新技术,旨在突破当前大型语言模型(LLMs)在生成长文本方面的限制。通过引入AgentWrite...

书生·浦语2.5:上海人工智能实验室推出的最新版AI大模型

书生·浦语2.5简介 书生·浦语2.5(InternLM2.5)是由上海人工智能实验室推出的最新版AI大模型。它以其超长的文本窗口支持高达一百万词元,以及在开源模型中领...

Grok-2:马斯克xAI公司推出的新一代AI模型

Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型,它是Grok-1.5的显著进步版本,具有在聊天、编码和推理方面的前沿能力。同时,公司还推出了Grok-2的小...

Falcon Mamba 7B:TII 推出的首个通用Mamba开源大模型

Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型,它采用了创新的 Mamba 状态空间语言模型架构,有效...

LLaVA-OneVision:字节等推出的开源大型多模态模型

LLaVA-OneVision简介 LLaVA-OneVision 是由字节跳动、南洋理工大学、香港中文大学和香港科技大学的专家团队共同研发的一系列先进大型多模态模型。这些模型通...

Data-Juicer :阿里推出的一站式大型语言模型(LLMs)数据处理系统

Data-Juicer简介 Data-Juicer 是由阿里推出的一款一站式大型语言模型(LLMs)数据处理系统。它通过提供超过50个内置操作符,支持用户灵活地组合和扩展,以生...

VITA:腾讯等推出的开源多模态大型语言模型

VITA简介 VITA是由腾讯优图实验室联合南京大学、厦门大学以及中国科学院自动化研究所的研究人员共同开发的开源多模态大型语言模型。它集成了对视频、图像、文...
1 3 4 5 6