AI开源项目 | 第 3 页

OpenMath-Nemotron：NVIDIA推出的数学推理模型

OpenMath-Nemotron项目简介 OpenMath-Nemotron是由NVIDIA团队开发的一系列先进的数学推理模型，专为解决复杂数学问题而设计。这些模型基于大规模数据集OpenMa...

2-5.应用工具其他

2个月前

Step1X-Edit项目简介 Step1X-Edit是由阶跃星辰开源的图像编辑模型，旨在缩小开源与闭源图像编辑模型之间的性能差距。该模型结合了多媒体大型语言模型（MLLM）...

3-2.图片生成模型

2个月前

Vidi项目简介 Vidi是由字节跳动公司智能创作团队开发的大型多模态模型，专注于视频理解和编辑（VUE）。它通过处理视觉、音频和文本等多种模态输入，实现对长...

2-3.应用工具视频

2个月前

LiveCC项目简介 LiveCC是由新加坡国立大学Show Lab和字节跳动联合开发的新型视频大语言模型（Video LLM）。该模型通过大规模的流式语音转录（ASR）数据进行训...

3-3.视频生成模型

2个月前

Phantom-Wan项目简介 Phantom-Wan是由字节跳动开发的视频生成框架，专注于从参考图像中提取主题元素并根据文本指令生成主题一致的视频。它通过跨模态对齐技术...

2-3.应用工具视频

2个月前

LAM项目简介 LAM（Large Avatar Model）是由阿里巴巴集团通义实验室开发的一种创新的高斯头像生成技术，它可以从单张图像生成可动画化的高斯头像。LAM的核心...

2-2.应用工具图像

2个月前

Eagle 2.5项目简介 Eagle 2.5是由NVIDIA开发的前沿视觉-语言模型系列，专注于长文本多模态学习。该模型旨在解决长视频理解和高分辨率图像理解中的挑战，通过...

2-1.应用工具文本

2个月前

Skywork R1V2项目简介 Skywork R1V2是由Skywork AI团队开发的下一代多模态推理模型。该模型在前代Skywork R1V的基础上进行了重大改进，引入了混合强化学习范...

3-9.其他模型

2个月前

WriteHERE项目简介 WriteHERE是Jürgen Schmidhuber开源的AI长文写作框架。。它通过异构递归规划框架，将检索、推理和写作三种任务类型动态整合，实现类似人类...

2-1.应用工具文本

2个月前

UFO²项目简介 UFO² 是由微软公司联合浙江大学伊利诺伊大学厄巴纳香槟校区联合学院、南京大学、北京大学等高校的研究团队共同开发的一款面向Windows桌面的多智...

2-5.应用工具其他

2个月前