AI开源项目
ComfyUI-AdvancedLivePortrait :将编辑好的面部表情插入视频序列中
ComfyUI-AdvancedLivePortrait 简介 ComfyUI-AdvancedLivePortrait 是一款高效的面部动画编辑工具,它允许用户在照片中编辑面部表情,并将这些表情实时插入视...
Yi-Coder:零一万物推出的一系列AI编程助手模型 支持52种编程语言
Yi-Coder简介 Yi-Coder是由零一万物推出的一系列AI编程助手模型,包含1.5B和9B参数两个版本,专为高效推理和灵活训练设计。这些模型在预训练了2.4万亿高质量...
RB-Modulation:根据参考风格图像和文本提示,生成具有特定艺术风格的图像
RB-Modulation简介 RB-Modulation是一种创新的图像生成技术,由Google的研究团队开发,它通过随机最优控制方法实现了扩散模型的训练自由个性化。这种方法允许...
Speech To Speech:HuggingFace推出的语音模型 可以实现低延迟语音对话
Speech To Speech简介 Speech-to-Speech 是由 Hugging Face 组织开发的一个开源项目,旨在构建一个模块化的语音到语音转换系统。该项目利用先进的人工智能技...
Mini-Omni:清华大学开源的多模态大型语言模型,可以边听、边说边思考
Mini-Omni简介 Mini-Omni 是由清华大学推出的一款多模态大型语言模型,它具备实时语音交互的能力,能够直接处理音频输入并即时输出语音,实现流畅的对话体验...
VideoGameBunny:专为理解视频游戏图像而设计的多模态模型
VideoGameBunny简介 VideoGameBunny是一个专为理解视频游戏图像而设计的多模态模型,基于Bunny模型并采用LLaVA风格架构。它通过分析来自413款游戏的185,259张...
LanceDB :专为人工智能应用设计的无服务器向量数据库
LanceDB 简介 Lancedb是一个为人工智能应用设计的无服务器向量数据库,专注于提供开发者友好的体验。它旨在轻松地为大型语言模型(LLM)应用添加长期记忆功能...
Melty:能够洞察开发者的工作模式,辅助编写高质量的代码
Melty简介 Melty 是一个创新的开源AI编程助手,旨在通过智能协作和代码生成来强化开发流程。它能够洞察开发者的工作模式,并适应其个人风格,从而辅助编写高...
NanoFlow :通过设备内并行性提高大型语言模型的服务吞吐量
NanoFlow 简介 NanoFlow是由华盛顿大学和密歇根大学的研究团队开发的一种新型服务框架,旨在通过设备内并行性显著提高大型语言模型(LLM)的服务吞吐量。该框...
HivisionIDPhotos:一个开源的AI证件照制作工具
HivisionIDPhotos简介 HivisionIDPhotos是一个开源的AI证件照制作工具,旨在通过轻量级算法快速生成符合标准的证件照片。它利用最新的人工智能技术,简化了证...