AI项目合集

EmoLLM:一款开源的心理健康大模型

EmoLLM简介 EmoLLM是由一群来自不同大学的学者和研究人员共同开发的心理健康大模型,旨在通过先进的人工智能技术,提供全面的心理辅导和支持。该模型通过理解...

Mem0:一个为LLMs提供智能、自我改进的记忆层的工具

Mem0简介 Mem0是一个先进的人工智能记忆层技术,专为大型语言模型设计,以增强其个性化和上下文感知能力。它通过跨用户会话、交互和不同AI代理之间的信息保留...

Goldfish:能够处理任意长度的视频与高效检索

Goldfish简介 Goldfish是由沙特国王科技大学的研究团队开发的一种先进的视频理解方法,旨在克服现有模型在处理长视频时遇到的噪声、冗余以及内存和计算限制。...

TCAN:从视频中提取人物的姿态动作并将其应用到静态图片上

TCAN简介 TCAN是由韩国高等科学技术院(KAIST)的研究团队开发的一种先进的人类图像动画技术。这项技术利用扩散模型,通过姿势引导生成具有时间一致性的视频...

Chameleon :能够处理和生成图像与文本混合的内容

Chameleon简介 Chameleon是由Meta旗下的FAIR(Facebook AI Research)团队开发的一款前沿的多模态基础模型。它能够理解和生成以任意顺序排列的图像和文本,通...

Mistral NeMo:Mistral AI与英伟达合作推出的一款具有120亿参数的大型语言模型

Mistral NeMo模型简介 Mistral NeMo是由Mistral AI与NVIDIA合作推出的一款具有120亿参数的大型语言模型,它以高达128k tokens的上下文窗口和出色的推理、世界...

YouTube-SL-25:大规模、开放领域的多语言手语并行语料库

YouTube-SL-25简介 YouTube-SL-25 是由 Google 和 DeepMind 的研究团队开发的一项开创性项目,它是一个大规模、多语种、开放领域的手语视频平行语料库。该语...

Cohere Toolkit:帮助开发者快速构建和部署 AI 应用程序

Cohere Toolkit简介 Cohere Toolkit 是一个由 Cohere 提供的开源工具集,专门设计用于快速构建和部署检索增强生成(RAG)应用程序。这个工具集包含一系列预构...

UltraPixel:能够在单一模型内生成多种分辨率的高质量图像

UltraPixel简介 UltraPixel是由香港科技大学(广州)、华为诺亚方舟实验室和马克斯·普朗克研究所的研究团队共同开发的一种先进的超高分辨率图像合成技术。该...

Qwen2-Audio:阿里推出的一种先进的大规模音频语言模型

Qwen2-Audio简介 Qwen2-Audio 是由阿里巴巴集团的 Qwen 团队开发的一种先进的大规模音频语言模型。它能够处理各种音频信号输入,并根据语音指令进行音频分析...
1 19 20 21 22 23 38