AI项目合集 | 第 16 页

Imagen 3：谷歌推出的文本到图像生成模型，现已通过ImageFX向公众开放

Imagen 3简介 Imagen 3是Google DeepMind开发的一款文本到图像的生成模型，它通过深度学习技术，能够根据用户输入的文本描述生成高质量的图像。该模型支持多...

AI项目合集

1个月前

WiseFlow简介 WiseFlow 是一个开源的智能信息挖掘工具，专门设计用于在海量信息中高效地挖掘和整理数据。它利用先进的自然语言处理技术和大型语言模型，能够...

2-1.应用工具文本

1个月前

EAFormer简介 EAFormer是一种先进的场景文本分割技术，由复旦大学的智能信息处理研究团队开发。这项技术通过利用边缘感知变换器（Edge-Aware Transformers）...

2-1.应用工具文本

1个月前

ReSyncer简介 ReSyncer是由清华大学BNRist实验室与百度公司共同开发的先进框架，它通过创新性地重新配置基于风格的生成器，并融合3D人脸动态预测技术，实现了...

2-3.应用工具视频

1个月前

HumanVid简介 HumanVid 是由香港中文大学和上海人工智能实验室联合开发的大型高质量数据集，旨在为人类图像动画提供训练资料。该数据集通过结合精心挑选的现...

3-9.其他模型

1个月前

UniBench简介 UniBench 是由 Meta、Univ Gustave Eiffel、CNRS 和 LIGM 联合开发的一项创新工具，旨在为视觉-语言模型（VLM）提供一个统一的评估平台。它集成...

2-5.应用工具其他

1个月前

Agents简介 Agents是由AIWaves开发的一种先进的语言代理框架，它通过结合大型语言模型（LLMs）的强大计算能力和复杂的提示技术，使得这些代理能够自主解决现...

2-5.应用工具其他

1个月前

VideoDoodles简介 VideoDoodles 是一项创新的视频编辑技术，它通过先进的3D场景重建和自定义追踪算法，使用户能够在视频中轻松添加手绘动画。这些动画不仅能...

2-3.应用工具视频

1个月前

ExAvatar简介 ExAvatar是由DGIST和Meta公司的Codec Avatars Lab开发团队创造的3D数字形象生成模型。它通过结合全身参数化网格模型（SMPL-X）和3D高斯Splattin...

AI项目合集

1个月前

Tailor简介 Tailor是一款免费开源的视频编辑工具，它集成了先进的人工智能技术，提供视频剪辑、生成和优化三大功能。用户可以轻松实现人脸和语音的精准剪辑，...

2-3.应用工具视频

1个月前