AI开源项目 | 第 41 页

Qwen2-Math：阿里通义团队推出的的数学专用AI模型

Qwen2-Math简介 Qwen2-Math是阿里巴巴通义团队开发的一款先进的数学解决方案模型，它通过专门化的预训练和精细调整，显著提升了解决包括代数、几何、概率在内...

1-1.大模型&国内

5个月前

SAM-Graph简介 SAM-Graph是一种创新的3D实例分割方法，由浙江大学、北京师范大学、蚂蚁集团和深圳大学的联合研究团队开发。该方法通过结合3D几何信息和多视图...

2-2.应用工具图像

5个月前

EmoTalk3D项目简介 EmoTalk3D 是由南京大学新型软件技术国家重点实验室联合复旦大学和华为诺亚方舟实验室共同开发的一项先进技术。这项技术通过一个创新的‘Sp...

2-3.应用工具视频

5个月前

MiniCPM-V 2.6简介 MiniCPM-V 2.6 是由面壁智能开发的端侧多模态大型语言模型，是 MiniCPM-V 系列中最新、功能最强大的模型。该模型基于 SigLip-400M 和 Qwen...

1-1.大模型&国内

5个月前

Lumina-mGPT简介 Lumina-mGPT是由上海人工智能实验室和香港中文大学的联合研究团队开发的一款先进的多模态自回归模型。它通过多模态生成预训练（mGPT），利用...

2-2.应用工具图像

5个月前

whisper-medusa简介 Whisper-Medusa是由aiOla推出的开源AI语音识别模型，它结合了OpenAI的Whisper模型和aiOla的技术，实现了超过50%的加速而不影响识别的准确...

2-4.应用工具音频

5个月前

Miner U简介 MinerU是由OpenDataLab团队开发的开源智能数据提取工具，它专门针对复杂PDF文档设计，能够高效地将文档中的文本、图片、公式和表格等内容转换成...

2-1.应用工具文本

5个月前

Tora简介 Tora是由阿里巴巴集团开发的一款创新的视频生成框架，它融合了轨迹导向的扩散变换器技术，能够根据文本、图像和轨迹条件生成高质量视频。这一突破性...

2-3.应用工具视频

5个月前

Clapper项目简介 Clapper是一个开源的AI故事可视化工具，旨在将剧本解释并渲染成分镜头、视频、语音、声音和音乐。它目前处于早期开发阶段，由Julian Bilcke...

2-3.应用工具视频

5个月前

VectorVein简介 VectorVein 是一个开源的无代码AI工作流工具，它允许用户通过简单的拖拽操作来构建智能工作流，而无需编程知识。这个工具支持多种应用场景，...

2-5.应用工具其他

5个月前