AI项目合集

LTM-2-mini :Magic推出的支持1亿上下文窗口的AI模型

LTM-2-mini 简介 LTM-2-mini 是 Magic 公司推出的一款先进的 AI 语言模型,它具有处理高达1亿token上下文窗口的能力,这相当于约1000万行代码或750本英文小说...

STranslate:一款即开即用、即用即走的翻译、OCR工具

STranslate简介 STranslate是由开发者ZGGSONG在GitHub上开发的一款多功能翻译和OCR工具。它采用WPF技术开发,具备即开即用、即用即走的特点,为用户提供了便...

OmniRe:用于城市场景侦察和模拟的系统级 3DGS 框架

OmniRe简介 OmniRe是由上海交通大学、Technion、多伦多大学、斯坦福大学、NVIDIA Research和南加州大学联合开发的一个创新系统级3DGS框架。该框架专注于从设...

Kotaemon:一个基于 RAG 的开源工具,用于与你的文档进行聊天

Kotaemon简介 Kotaemon是一个由Cinnamon开发的开源工具,基于先进的Retrieval-Augmented Generation(RAG)技术,旨在通过聊天方式与您的文档进行互动。这个...

ChatTTS-Forge:提供易于使用WebUI和接入各种TTS API服务的开源项目

ChatTTS-Forge简介 ChatTTS-Forge 是一个基于 TTS 生成模型开发的项目,它构建了一个功能全面的API服务器和一个基于Gradio的用户友好型Web界面。这个项目通过...

OmniCorpus:迄今为止最大的多模态数据集

OmniCorpus简介 OmniCorpus 是由上海人工智能实验室领衔,联合哈尔滨工业大学、南京大学、复旦大学、香港中文大学、商汤科技研究院、清华大学等机构共同开发...

StreamingT2V:从文本生成一致、动态且可扩展的长视频

StreamingT2V简介 StreamingT2V是由Picsart AI Research团队开发的一项创新技术,它通过先进的自回归方法,能够将文本描述转换成具有丰富动态效果和时间连贯...

EAGLE:NVIDIA研究院主导开发的多模态大型语言模型

EAGLE简介 EAGLE是由NVIDIA研究院主导开发的多模态大型语言模型(MLLM),它通过混合多种视觉编码器来提升对复杂视觉信息的解读能力。该模型在减少视觉幻觉和...

InterTrack:能够从单目RGB视频中跟踪人体与物体的互动

InterTrack简介 InterTrack是由德国图宾根大学、图宾根人工智能中心以及马克斯·普朗克信息学研究所的研究人员开发的一种先进的跟踪技术。这项技术能够从单目R...

ancient_text_generation_LLM:输入现代汉语句子,生成古汉语风格的句子

ancient_text_generation_LLM简介 'ancient_text_generation_LLM'是一个现代文转古文的模型。该模型利用荀子基座大模型,并通过'文言文-现代文'的平行语料库...
1 6 7 8 9 10 39