3.AI大模型数据库
Phi-4:微软推出的14亿参数的大型语言模型
Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型,它通过专注于数据质量的训练方法,在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...
POINTS1.5:腾讯微信推出的多模态大模型
POINTS1.5简介 POINTS1.5是由腾讯微信推出的多模态大模型,旨在提升对现实世界应用的处理能力。该模型在POINTS1.0的基础上进行了重大创新,包括采用NaViT风格...
Maya:能够处理和理解八种不同语言的图像和文本数据
Maya简介 Maya是一个开源的多语言多模态视觉语言模型,旨在提升机器对低资源语言和多样文化背景的理解能力。它基于LLaVA框架,提供了一个包含八种语言的558,0...
STIV:苹果推出的可扩展文本和图像条件视频生成框架
STIV简介 STIV是一种新型的可扩展文本和图像条件视频生成框架,由苹果和加州大学洛杉矶分校的研究团队共同开发。该框架通过整合图像条件和文本条件,能够同时...
CausVid:麻省理工学院和Adobe联合推出的视频生成模型
CausVid简介 CausVid是由麻省理工学院(MIT)和Adobe研究院共同开发的先进视频生成模型,它通过将双向扩散模型转换为因果模型,显著降低了视频生成的延迟,并...
TRELLIS:微软联合清华大学等高校推出的高效3D生成模型
TRELLIS简介 TRELLIS是一种创新的3D生成模型,由清华大学、中国科学技术大学和微软研究院的联合研究团队开发。该模型以其Structured LATent(SLAT)表示为核...
NitroFusion:通过动态对抗训练框架实现高保真图像生成
NitroFusion简介 NitroFusion是由英国萨里大学CVSSP实验室的SketchX团队与NetMind.AI共同开发的一种创新单步扩散模型,它通过动态对抗训练框架实现了高保真度...
SANA:英伟达联合清华大学等推出的文本到图像的生成框架
SANA简介 SANA是由NVIDIA、MIT和清华大学的联合研究团队开发的一款文本到图像的生成框架,它能够高效地生成高达4096×4096分辨率的高清晰度图像。SANA通过深度...
Diffusion Self-Distillation:零样本定制化图像生成方法
Diffusion Self-Distillation简介 Diffusion Self-Distillation是一种创新的零样本定制化图像生成方法,由斯坦福大学的研究团队开发。该技术利用预训练的文本...
SongCreator:由清华大学推出的基于歌词的全能歌曲生成模型
SongCreator简介 SongCreator是由清华大学深圳国际研究生院的一个团队开发的一款先进的歌曲生成模型,它能够根据歌词创作出包含声乐和伴奏的完整歌曲。该系统...