3.AI大模型数据库

StreamingT2V:从文本生成一致、动态且可扩展的长视频

StreamingT2V简介 StreamingT2V是由Picsart AI Research团队开发的一项创新技术,它通过先进的自回归方法,能够将文本描述转换成具有丰富动态效果和时间连贯...

EAGLE:NVIDIA研究院主导开发的多模态大型语言模型

EAGLE简介 EAGLE是由NVIDIA研究院主导开发的多模态大型语言模型(MLLM),它通过混合多种视觉编码器来提升对复杂视觉信息的解读能力。该模型在减少视觉幻觉和...

ancient_text_generation_LLM:输入现代汉语句子,生成古汉语风格的句子

ancient_text_generation_LLM简介 'ancient_text_generation_LLM'是一个现代文转古文的模型。该模型利用荀子基座大模型,并通过'文言文-现代文'的平行语料库...

CSGO:可以通过文本提示和风格图像来生成具有相似风格的图像

CSGO简介 CSGO是由南京理工大学推出的一种创新的文本到图像生成模型,它在图像风格迁移领域取得了显著进展。该模型通过一个精心设计的数据构建管道,生成并自...

GenWarp:能够从单个图像生成具有语义保持的新视角图像

GenWarp简介 GenWarp 是由 Sony AI 团队开发的一种创新的图像生成框架,它能够从单个图像生成具有语义保持的新视角图像。该框架通过结合自注意力和交叉视角注...

CustomCrafter :浙江大学和腾讯联合开发的一款创新视频生成框架

CustomCrafter简介 CustomCrafter 是由浙江大学和腾讯联合开发的一款创新视频生成框架。它能够根据文本提示和主题参考图像生成高质量视频,同时保留运动生成...

CogView-3-Plus:智谱AI推出的文生图模型

CogView-3-Plus简介 CogView-3-Plus是智谱AI推出的一款先进的AI文生图模型,采用创新的Transformer架构,优化了扩散模型的噪声规划,以生成高质量图像。它在...

GLM-4V-Plus:智谱AI推出的图像和视频理解模型

GLM-4V-Plus简介 GLM-4V-Plus是智谱AI推出的一款先进的图像和视频理解模型,它具备出众的图像识别能力和基于时间序列分析的视频理解技术。该模型通过深度学习...

GLM-4-Plus:智谱AI推出的高智能旗舰大模型

GLM-4-Plus简介 GLM-4-Plus是智谱AI最新推出的旗舰大模型,它在语言理解和长文本处理方面实现了显著的性能提升。采用先进的PPO技术,GLM-4-Plus在推理和指令...

Qwen2-VL:阿里巴巴达摩院最新推出的视觉语言模型

Qwen2-VL简介 Qwen2-VL是阿里巴巴达摩院最新推出的视觉语言模型,具备卓越的图像和视频理解能力。它能够处理不同分辨率和长宽比的图片,理解长达20分钟的视频...
1 20 21 22 23 24 29