2.应用工具相关
PIKE-RAG:微软亚洲研究院推出的检索增强型生成框架
PIKE-RAG简介 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是由微软亚洲研究院开发的检索增强型生成框架,旨在解决传统RAG系统在...
TIGER:清华大学等推出的新型轻量级语音分离模型
TIGER简介 TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction network)是由清华大学计算机系、清华-IDG/麦戈文脑科学研究院以及北京脑...
Long-VITA:腾讯联合南大、厦大等开源的长文本多模态模型
Long-VITA简介 Long-VITA是由腾讯优图实验室、南京大学和厦门大学联合开发的开源长文本多模态模型。该模型专注于提升视觉-语言模型在长文本和长视频理解方面...
CustomVideoX:中科大等推出的零样本个性化视频生成框架
CustomVideoX简介 CustomVideoX是由中国科学技术大学、浙江大学和香港科技大学(广州)联合开发的创新框架,旨在实现零样本个性化视频生成。该框架基于视频扩...
ENEL:新型无编码器架构的3D大型多模态模型
ENEL简介 ENEL是由西北工业大学、上海人工智能实验室、香港中文大学和清华大学的研究团队共同开发的一种新型无编码器架构的三维大型多模态模型(3D LMM)。该...
BAG:用于自动生成与人体对齐的3D可穿戴资产
BAG简介 BAG(Body-Aligned 3D Wearable Asset Generation)是由腾讯联合香港中文大学(深圳)和澳大利亚国立大学共同开发的一种创新方法,用于自动生成与人...
通古大模型:专注于古籍理解和处理的大语言模型
通古大模型简介 通古大模型是由华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)开发的一款专注于古籍理解和处理的大语言模型。该模型基于Baichuan2-7B...
We0:面向开发人员和产品经理的AI代码编辑器
We0简介 We0是一款面向开发人员和产品经理的AI代码编辑器,旨在通过智能化手段提升开发效率和代码质量。它支持基于浏览器的调试功能,内置WebContainer环境,...
WebLI100B:谷歌推出的超大规模视觉语言预训练数据集
WebLI100B简介 WebLI100B是由Google DeepMind团队开发的一个超大规模视觉语言预训练数据集,包含1000亿个图像-文本对。它是迄今为止最大的视觉语言数据集之一...
Goedel-Prover:清华等推出的自动化形式证明生成语言模型
Goedel-Prover简介 Goedel-Prover是由普林斯顿大学语言与智能实验室联合清华大学、亚马逊、Meta FAIR等机构共同开发的开源大型语言模型(LLM)。该模型专注于...