3-1.大语言模型

LLaVA-OneVision:字节等推出的开源大型多模态模型

LLaVA-OneVision简介 LLaVA-OneVision 是由字节跳动、南洋理工大学、香港中文大学和香港科技大学的专家团队共同研发的一系列先进大型多模态模型。这些模型通...

Data-Juicer :阿里推出的一站式大型语言模型(LLMs)数据处理系统

Data-Juicer简介 Data-Juicer 是由阿里推出的一款一站式大型语言模型(LLMs)数据处理系统。它通过提供超过50个内置操作符,支持用户灵活地组合和扩展,以生...

VITA:腾讯等推出的开源多模态大型语言模型

VITA简介 VITA是由腾讯优图实验室联合南京大学、厦门大学以及中国科学院自动化研究所的研究人员共同开发的开源多模态大型语言模型。它集成了对视频、图像、文...

EXAONE 3.0:LG AI Research开发的7.8B参数指令调整型语言模型

EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型,具有7.8亿参数的指令调优能力,专门设计以提升双语环境下的表现,尤其在韩语上表现卓...

LSLM:具备边听边说能力的语音模型,实现实时的双向交流

LSLM简介 LSLM(Listening-while-Speaking Language Model)是由上海交通大学人工智能教育部重点实验室X-LANCE实验室与字节跳动公司联合开发的创新性端到端模...

Qwen2-Math:阿里通义团队推出的的数学专用AI模型

Qwen2-Math简介 Qwen2-Math是阿里巴巴通义团队开发的一款先进的数学解决方案模型,它通过专门化的预训练和精细调整,显著提升了解决包括代数、几何、概率在内...

MiniCPM-V 2.6:面壁智能推出的MiniCPM-V 系列中最新、功能最强大的模型。

MiniCPM-V 2.6简介 MiniCPM-V 2.6 是由面壁智能开发的端侧多模态大型语言模型,是 MiniCPM-V 系列中最新、功能最强大的模型。该模型基于 SigLip-400M 和 Qwen...

谷歌发布全新“开放式”人工智能模型,重点关注安全

Gemma 2系列新成员 谷歌DeepMind于2024年8月1日宣布发布了Gemma 2系列的新成员,其中包括20亿参数的小模型Gemma 2B。这个新模型在大模型竞技场LMSYS Chatbot ...

Mistral Large 2:Mistral AI 推出的最新一代大语言模型

Mistral Large 2简介 Mistral Large 2 是由法国人工智能初创公司 Mistral AI 开发的最新一代大型语言模型。它拥有 1230 亿参数,支持 128k 的上下文窗口,能...

Llama 3.1:Meta 推出迄今为止最大、最好的开源 AI 模型

Llama3.1简介 Llama 3.1 是 Meta 发布的一系列大型多语言语言模型,包含 8B、70B 和 405B 参数的版本。这些模型不仅支持预训练和指令调整,还具备更长的上下...
1 2 3 4 5