3.AI大模型数据库 | 第 22 页

StreamingT2V：从文本生成一致、动态且可扩展的长视频

StreamingT2V简介 StreamingT2V是由Picsart AI Research团队开发的一项创新技术，它通过先进的自回归方法，能够将文本描述转换成具有丰富动态效果和时间连贯...

2-3.应用工具视频

7个月前

EAGLE简介 EAGLE是由NVIDIA研究院主导开发的多模态大型语言模型（MLLM），它通过混合多种视觉编码器来提升对复杂视觉信息的解读能力。该模型在减少视觉幻觉和...

3-5.多模态模型

7个月前

ancient_text_generation_LLM简介 'ancient_text_generation_LLM'是一个现代文转古文的模型。该模型利用荀子基座大模型，并通过'文言文-现代文'的平行语料库...

2-1.应用工具文本

7个月前

CSGO简介 CSGO是由南京理工大学推出的一种创新的文本到图像生成模型，它在图像风格迁移领域取得了显著进展。该模型通过一个精心设计的数据构建管道，生成并自...

2-2.应用工具图像

7个月前

GenWarp简介 GenWarp 是由 Sony AI 团队开发的一种创新的图像生成框架，它能够从单个图像生成具有语义保持的新视角图像。该框架通过结合自注意力和交叉视角注...

3-2.图片生成模型

7个月前

CustomCrafter简介 CustomCrafter 是由浙江大学和腾讯联合开发的一款创新视频生成框架。它能够根据文本提示和主题参考图像生成高质量视频，同时保留运动生成...

2-3.应用工具视频

7个月前

CogView-3-Plus简介 CogView-3-Plus是智谱AI推出的一款先进的AI文生图模型，采用创新的Transformer架构，优化了扩散模型的噪声规划，以生成高质量图像。它在...

1-1.大模型&国内

7个月前

GLM-4V-Plus简介 GLM-4V-Plus是智谱AI推出的一款先进的图像和视频理解模型，它具备出众的图像识别能力和基于时间序列分析的视频理解技术。该模型通过深度学习...

1-1.大模型&国内

7个月前

GLM-4-Plus简介 GLM-4-Plus是智谱AI最新推出的旗舰大模型，它在语言理解和长文本处理方面实现了显著的性能提升。采用先进的PPO技术，GLM-4-Plus在推理和指令...

1-1.大模型&国内

7个月前

Qwen2-VL简介 Qwen2-VL是阿里巴巴达摩院最新推出的视觉语言模型，具备卓越的图像和视频理解能力。它能够处理不同分辨率和长宽比的图片，理解长达20分钟的视频...

1-1.大模型&国内

7个月前