2.应用工具相关

IndexTTS:B 站推出的零样本文本转语音系统

IndexTTS简介 IndexTTS是由哔哩哔哩人工智能平台部开发的一款工业级可控且高效的零样本文本到语音(TTS)系统。该系统基于大型语言模型(LLM),结合了XTTS和...

VideoGrain:悉尼科技大学等推出的视频编辑框架

VideoGrain简介 VideoGrain是由悉尼科技大学ReLER实验室和浙江大学ReLER实验室联合开发的一种创新的多粒度视频编辑框架。该技术通过调节时空注意力机制,实现...

AgentRefine:北京邮电大学联合美团推出的新型智能体微调框架

AgentRefine 简介 AgentRefine 是由北京邮电大学和美团联合开发的一种新型智能体微调框架,旨在通过自我修正机制提升基于大型语言模型(LLM)的智能体在多样...

SurveyX:中国人民大学等推出的自动化学术综述生成系统

SurveyX简介 SurveyX是由中国人民大学、东北大学和悉尼大学等机构的研究团队共同开发的自动化学术综述生成系统。该系统利用大型语言模型(LLMs)的强大能力,...

PhotoDoodle:上海交通大学等推出的艺术化图像编辑框架

PhotoDoodle简介 PhotoDoodle是由新加坡国立大学、上海交通大学、北京邮电大学、字节跳动以及Tiamat团队共同开发的一种新型艺术化图像编辑框架。该框架旨在通...

FacePoke:轻松实现头部的动态移动效果

FacePoke 简介 FacePoke 是一款基于深度学习技术的实时头部变换应用,用户可以通过导入肖像照片并点击屏幕,轻松实现头部的动态移动效果。它基于 LivePortrai...

BFS-Prover:字节豆包等推出的自动定理证明系统

BFS-Prover简介 BFS-Prover是由字节豆包和斯坦福大学合作开发的自动定理证明系统。该系统基于Best-First Tree Search(BFS)算法,结合大型语言模型(LLM)的...

CorrDiff:生成高分辨率的天气预测数据

CorrDiff简介 CorrDiff(Residual Corrective Diffusion Modeling)是由NVIDIA公司和台湾中央气象局合作开发的一种新型扩散模型,旨在将全球天气数据从粗分辨...

VideoFusion:一站式短视频拼接与优化工具

VideoFusion简介 VideoFusion 是一站式短视频拼接与优化工具。它以无依赖、点击即用的设计理念,为用户提供高效便捷的视频处理体验。软件具备自动去除黑边、...

OctoTools:斯坦福大学开源的智能体框架

OctoTools简介 OctoTools是由斯坦福大学团队开源的智能体框架,旨在通过可扩展的工具集解决复杂推理任务。它引入了标准化的工具卡(Tool Cards)来封装工具功...
1 20 21 22 23 24 85