2.应用工具相关

Distill Any Depth:知识蒸馏框架的单目深度估计方法

Distill Any Depth简介 “Distill Any Depth”是由浙江工业大学、西湖大学AGI实验室、兰州大学和南洋理工大学联合开发的一种新型单目深度估计方法。该方法通过...

GaussianCity:南洋理工大学推出的3D城市生成框架

GaussianCity简介 GaussianCity是由南洋理工大学S-Lab团队开发的一种创新的3D城市生成框架,专门用于高效生成无边界(unbounded)的3D城市场景。该框架基于3D...

Asyncflow v1.0:Podcastle 推出的AI 文本转语音模型

Asyncflow v1.0 简介 Asyncflow v1.0 是由播客平台 Podcastle 开发团队推出的一款 AI 文本转语音模型。该模型支持超过 450 种语音选项,涵盖多种语言、性别和...

Probly:结合了电子表格功能与 Python 数据分析能力

Probly简介 Probly 是一款结合了电子表格功能与 Python 数据分析能力的 AI 驱动工具。它通过交互式电子表格支持公式计算,同时利用 WebAssembly 在浏览器中运...

Fractal Generative Models:谷歌等推出的分形图像生成模型

Fractal Generative Models 简介 Fractal Generative Models 是由 MIT CSAIL 和 Google DeepMind 联合开发的一种新型图像生成模型,它通过递归调用原子生成模...

Spark-TTS:支持中文和英文的高质量语音合成

Spark-TTS简介 Spark-TTS 是一款基于大型语言模型(LLM)的高效文本到语音(TTS)系统。它以简洁高效的设计理念为核心,完全依赖于强大的 Qwen2.5 模型,无需...

WhisperChain:能够将用户说话的内容即时转换为文字

WhisperChain简介 WhisperChain 是一款结合了语音识别与人工智能技术的高效语音转文字工具。它利用 Whisper.cpp 实现实时语音转录,并通过 LangChain 对生成...

Story-Flicks:一键生成高清故事短视频

Story-Flicks简介 “Story-Flicks”是一个基于AI大模型一键生成高清故事短视频的开源项目。用户只需输入一个故事主题,系统便会自动结合文本生成、图像生成、音...

LuminaBrush:通过交互式方式为图像添加逼真的光照效果

LuminaBrush简介 LuminaBrush 是一个创新的光照绘制工具,旨在通过交互式方式为图像添加逼真的光照效果。它采用两阶段框架:首先将图像转换为“均匀光照”外观...

SepLLM:华为等推出的加速大语言模型的高效框架

SepLLM简介 SepLLM是由华为诺亚方舟实验室、香港大学、KAUST卓越生成人工智能中心和马普智能系统研究所共同开发的一种高效语言模型框架。该框架通过将文本段...
1 12 13 14 15 16 79