AI项目合集

Gemma 2:Google 最新发布的开源大语言模型

Gemma 2简介 Gemma 2是Google最新发布的开源大型语言模型,包含90亿和270亿参数的版本,均提供基础和指令调优变体。基于DeepMind的Gemini技术,Gemma 2具有81...

Real-time Voice AI Agent:世界上最快的语音聊天机器人

Real-time Voice AI Agent简介 Real-time Voice AI Agent是由CerebriumAI团队开发的一个创新的语音交互项目。它是一个能够通过语音接收用户查询,并在大约500...

CriticGPT:OpenAI 推出的GPT代码错误检测模型

CriticGPT简介 CriticGPT是一个OpenAI发布的基于GPT-4的先进模型,专门设计来审查和批评ChatGPT生成的代码输出,以识别和指出其中的错误。通过强化学习从人类...

Alter3:接入 GPT-4 的机器人,用文本命令即可转换为机器人动作

Alter3简介 Alter3是由东京大学一般系统科学系和Alternative Machine Inc.联合开发的先进人形机器人。这款机器人集成了强大的GPT-4大型语言模型,能够理解和...

Image Conductor:交互式视频合成的精度控制

Image Conductor简介 Image Conductor是由北京大学与腾讯PCG ARC Lab联合开发的创新视频合成技术。这项技术突破了传统视频制作的限制,允许用户通过单张图片...

Wav2Lip:实现对任意身份人物在动态、非受限视频中的口型同步

Wav2Lip简介 Wav2Lip是由印度海得拉巴国际信息技术研究所(IIIT Hyderabad)的研究团队开发的一项先进技术。这项技术通过深度学习模型,能够实现对任意身份人...

Roop:一款开源的AI视频换脸工具

Roop简介 Roop是一款开源的AI视频换脸工具,它通过先进的面部检测和生成对抗网络技术,允许用户无需复杂训练即可实现一键换脸。用户只需上传目标面部图片,Ro...

ProPainter:南洋理工大学推出的AI视频修复技术

ProPainter简介 ProPainter是一种先进的视频修复技术,由新加坡南洋理工大学S-Lab的研究团队开发。这项技术专注于视频修复中的填充任务,能够填补视频中的缺...

Lobe Chat:现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架

Lobe Chat简介 Lobe Chat 是一个开源的现代设计聊天框架,支持多种 AI 语言模型,如 OpenAI、Claude 3 和 Gemini 等。它具备多模态功能,包括视觉识别和文本...

Streamer-Sales:自动化直播卖货与客户互动的AI大模型

Streamer-Sales项目简介 Streamer-Sales是一个创新的AI卖货主播大模型,专为提升商品销售设计。它通过深度理解商品特性,以生动精准的语言为商品打造解说词,...
1 23 24 25 26 27 38