3-9.其他模型
EXAONE Deep:专注于推理任务的语言模型
EXAONE Deep简介 EXAONE Deep是由LG AI Research开发的一系列专注于推理任务的先进语言模型。该团队通过使用监督微调(SFT)、直接偏好优化(DPO)和在线强化...
Claude 3.7 Max:Cursor推出的为复杂代码任务设计的 AI 模型
Claude 3.7 Max 简介 Claude 3.7 Max 是由 Cursor 团队开发的最新人工智能模型,基于强大的 Claude 3.7 核心架构。它专为处理复杂任务和大规模代码编辑而设计...
Block Diffusion:支持生成任意长度的文本序列
Block Diffusion简介 Block Diffusion 是由 Cornell Tech 和 Stanford University 等机构的研究团队开发的一种新型语言模型。它结合了自回归模型和扩散模型的...
MedRAG:南洋理工大学等推出的医疗诊断辅助模型
MedRAG简介 MedRAG是由南洋理工大学LILY研究中心联合新加坡武吉巴督医院共同开发的医疗诊断辅助模型。它通过结合检索增强型生成(RAG)技术和知识图谱(KG)...
GO-1:智元机器人团队开发的通用具身基座大模型
GO-1简介 智元机器人最新推出了Genie Operator-1(GO-1),这是一款创新的通用体化基础模型。GO-1基于Vision-Language-Latent-Action(ViLLA)框架,融合了视...
MindLLM:耶鲁、剑桥等高校联合推出 的医疗行业 AI 模型
MindLLM简介 MindLLM是由耶鲁大学、达特茅斯学院和剑桥大学的研究团队共同开发的一种新型多功能模型,旨在将功能性磁共振成像(fMRI)信号解码为文本。该模型...
Evo 2:斯坦福大学等推出的一款生物基础模型
Evo 2简介 Evo 2是由Arc Institute和斯坦福大学联合开发团队推出的一款生物基础模型,专为跨所有生命领域的基因组建模与设计而开发。该模型基于9.3万亿个DNA...
DINO-X:IDEA研究院推出的一款通用视觉大模型
DINO-X简介 DINO-X是由IDEA研究院开发的一款先进的通用视觉大模型,它在开放世界对象检测和理解方面具有卓越的性能。该模型采用Transformer编码器-解码器架构...
TIME-MOE:采用混合专家(MoE)架构的时间序列预测模型
TIME-MOE简介 TIME-MOE是一种创新的大规模时间序列预测模型,采用混合专家(MoE)架构,通过激活模型中只有一部分网络来提高计算效率,同时保持模型的高容量。...
GRIN-MoE:微软开源的混合模型 在编码和数学任务中表现出色
GRIN-MoE简介 GRIN-MoE(GRadient-INformed MoE)是由微软公司的研发团队开发的一种创新的深度学习模型。该模型通过引入稀疏梯度估计和精巧的模型并行策略,...