2.应用工具相关

Seedream 2.0:字节跳动推出的中英双语图像生成基础模型

Seedream 2.0简介 Seedream 2.0 是由字节跳动 Seed Vision 团队开发的先进中英双语图像生成基础模型。该模型针对现有图像生成模型的局限性进行了优化,解决了...

VACE:阿里通义推出的的视频生成与编辑框架

VACE简介 VACE(Video All-in-One Creation and Editing)是由阿里巴巴集团通义实验室开发的视频生成与编辑框架。它基于扩散变换器(Diffusion Transformer)...

GAUSSIANANYTHING:南洋理工大学等推出的3D 生成框架

GAUSSIANANYTHING简介 GAUSSIANANYTHING 是由南洋理工大学 S-Lab、上海人工智能实验室和北京大学联合开发的新型 3D 生成框架。该框架通过创新的点云结构化潜...

MM-StoryAgent:融合多种模态生成沉浸式的有声故事书视频

MM-StoryAgent简介 MM-StoryAgent是由X-PLUG团队开发的多智能体框架,旨在通过融合文本、图像、音频等多种模态生成沉浸式的有声故事书视频。该框架利用大语言...

MeshPad:交互式3D网格生成与编辑工具

MeshPad简介 MeshPad是一种创新的交互式3D网格生成与编辑工具,它通过简单的2D草图输入实现复杂艺术设计的3D建模。用户只需绘制或修改草图,MeshPad就能快速...

VideoPainter:香港中文大学等推出的视频修复和编辑框架

VideoPainter简介 VideoPainter是由香港中文大学、腾讯ARC实验室、东京大学和澳门大学联合开发的一种新型视频修复和编辑框架。它通过高效的双分支架构和轻量...

Nanobrowser:通过多智能体系统实现复杂的网页任务

Nanobrowser简介 Nanobrowser 是一款开源的 Chrome 扩展工具,专注于 AI 驱动的网页自动化。它通过多智能体系统实现复杂的网页任务,用户可以利用自己的 LLM ...

START:阿里联合中科大推出的长链推理语言模型

START简介 START(Self-Taught Reasoner with Tools)是由中国科学技术大学和阿里巴巴集团联合开发的一种新型长链推理语言模型。它通过整合外部工具(尤其是P...

IMAGPose:南京理工大学推出的姿态引导的人物图像生成框架

IMAGPose简介 IMAGPose是由南京理工大学团队提出的一种姿态引导的人物图像生成框架,旨在解决现有方法在多目标图像生成和多视角源图像生成方面的局限性。该框...

LanPaint:专为 Stable Diffusion 模型设计的高质量图像修复工具

LanPaint简介 LanPaint 是一款专为 Stable Diffusion 模型设计的高质量图像修复工具,无需额外训练即可实现精准的图像修复。它通过多轮迭代推理,优化修复效...
1 15 16 17 18 19 85