AI开源项目 | 第 34 页

ComfyUI-AdvancedLivePortrait ：将编辑好的面部表情插入视频序列中

ComfyUI-AdvancedLivePortrait 简介 ComfyUI-AdvancedLivePortrait 是一款高效的面部动画编辑工具，它允许用户在照片中编辑面部表情，并将这些表情实时插入视...

2-3.应用工具视频

4个月前

Yi-Coder简介 Yi-Coder是由零一万物推出的一系列AI编程助手模型，包含1.5B和9B参数两个版本，专为高效推理和灵活训练设计。这些模型在预训练了2.4万亿高质量...

1-1.大模型&国内

4个月前

RB-Modulation简介 RB-Modulation是一种创新的图像生成技术，由Google的研究团队开发，它通过随机最优控制方法实现了扩散模型的训练自由个性化。这种方法允许...

2-2.应用工具图像

4个月前

Speech To Speech简介 Speech-to-Speech 是由 Hugging Face 组织开发的一个开源项目，旨在构建一个模块化的语音到语音转换系统。该项目利用先进的人工智能技...

2-4.应用工具音频

4个月前

Mini-Omni简介 Mini-Omni 是由清华大学推出的一款多模态大型语言模型，它具备实时语音交互的能力，能够直接处理音频输入并即时输出语音，实现流畅的对话体验...

3-5.多模态模型

4个月前

VideoGameBunny简介 VideoGameBunny是一个专为理解视频游戏图像而设计的多模态模型，基于Bunny模型并采用LLaVA风格架构。它通过分析来自413款游戏的185,259张...

2-5.应用工具其他

4个月前

LanceDB 简介 Lancedb是一个为人工智能应用设计的无服务器向量数据库，专注于提供开发者友好的体验。它旨在轻松地为大型语言模型（LLM）应用添加长期记忆功能...

2-5.应用工具其他

4个月前

Melty简介 Melty 是一个创新的开源AI编程助手，旨在通过智能协作和代码生成来强化开发流程。它能够洞察开发者的工作模式，并适应其个人风格，从而辅助编写高...

2-5.应用工具其他

4个月前

NanoFlow 简介 NanoFlow是由华盛顿大学和密歇根大学的研究团队开发的一种新型服务框架，旨在通过设备内并行性显著提高大型语言模型（LLM）的服务吞吐量。该框...

2-5.应用工具其他

4个月前

HivisionIDPhotos简介 HivisionIDPhotos是一个开源的AI证件照制作工具，旨在通过轻量级算法快速生成符合标准的证件照片。它利用最新的人工智能技术，简化了证...

2-2.应用工具图像

4个月前