3.AI大模型数据库 | 第 2 页

Phi-4：微软推出的14亿参数的大型语言模型

Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型，它通过专注于数据质量的训练方法，在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...

3-1.大语言模型

3周前

POINTS1.5简介 POINTS1.5是由腾讯微信推出的多模态大模型，旨在提升对现实世界应用的处理能力。该模型在POINTS1.0的基础上进行了重大创新，包括采用NaViT风格...

3-5.多模态模型

3周前

Maya简介 Maya是一个开源的多语言多模态视觉语言模型，旨在提升机器对低资源语言和多样文化背景的理解能力。它基于LLaVA框架，提供了一个包含八种语言的558,0...

3-5.多模态模型

3周前

STIV简介 STIV是一种新型的可扩展文本和图像条件视频生成框架，由苹果和加州大学洛杉矶分校的研究团队共同开发。该框架通过整合图像条件和文本条件，能够同时...

3-3.视频生成模型

3周前

CausVid简介 CausVid是由麻省理工学院（MIT）和Adobe研究院共同开发的先进视频生成模型，它通过将双向扩散模型转换为因果模型，显著降低了视频生成的延迟，并...

3-3.视频生成模型

4周前

TRELLIS简介 TRELLIS是一种创新的3D生成模型，由清华大学、中国科学技术大学和微软研究院的联合研究团队开发。该模型以其Structured LATent（SLAT）表示为核...

2-6.应用工具3D

4周前

NitroFusion简介 NitroFusion是由英国萨里大学CVSSP实验室的SketchX团队与NetMind.AI共同开发的一种创新单步扩散模型，它通过动态对抗训练框架实现了高保真度...

3-2.图片生成模型

4周前

SANA简介 SANA是由NVIDIA、MIT和清华大学的联合研究团队开发的一款文本到图像的生成框架，它能够高效地生成高达4096×4096分辨率的高清晰度图像。SANA通过深度...

3-2.图片生成模型

1个月前

Diffusion Self-Distillation简介 Diffusion Self-Distillation是一种创新的零样本定制化图像生成方法，由斯坦福大学的研究团队开发。该技术利用预训练的文本...

3-2.图片生成模型

1个月前

SongCreator简介 SongCreator是由清华大学深圳国际研究生院的一个团队开发的一款先进的歌曲生成模型，它能够根据歌词创作出包含声乐和伴奏的完整歌曲。该系统...

3-4.音乐生成模型

1个月前