AI项目合集

H2O-Danube3:手机不联网也能用的本地模型

H2O Danube3项目简介 H2O-Danube3是由H2O.ai开发团队推出的一系列高效能小型语言模型,包括4B和500M两个参数规模的版本。这些模型经过三阶段的高质量网络数据...

Magic Insert:将图片无缝地融入到风格截然不同的目标图片中

Magic Insert简介 Magic Insert是由Google的研究团队开发的一项创新技术,它实现了一种风格感知的拖放功能,允许用户将图片中的主体无缝地融入到风格截然不同...

FlashAttention-3:提升Transformer架构注意力机制的计算效率与精度

FlashAttention-3简介 FlashAttention-3是由Colfax Research开发团队提出的一种创新算法,旨在显著提升Transformer架构中的核心组件——注意力机制的计算速度和...

OpenDiLoCo:一个全球分布式低通信AI训练的开源框架

OpenDiLoCo简介 OpenDiLoCo是由Prime Intellect, Inc.团队开发的开源框架,旨在实现全球分布式的低通信训练方法。该框架通过Hivemind库提供了一种可扩展的去...

SEED-Story:保持角色一致性,完成故事配图与文字的多模态模型

SEED-Story项目简介 SEED-Story是由香港科技大学(广州)与腾讯PCG的ARC实验室联合开发的创新性多模态长篇故事生成方法。该方法利用多模态大型语言模型(MLLM...

MiraData: 腾讯&港中大开源的大规模高质量视频数据集

MiraData简介 MiraData是由腾讯和香港中文大学的研究团队共同开发的大型视频数据集。该数据集以其长时视频和结构化字幕而著称,专门为生成具有高运动强度和一...

AuraFlow 0.1 :一款新兴的开源绘画模型,和SD一样基于DiT架构

AuraFlow 0.1简介 AuraFlow 0.1 是一款新兴的开源绘画模型,采用先进的 DiT (Diffusion Transformer) 架构,拥有 5.6B 参数规模。该模型由创新科技团队开发,...

Comic Translate:自动翻译多种语言漫画

Comic Translate简介 Comic Translate是一个功能强大的桌面应用程序,专为全球漫画爱好者设计。它能够自动翻译包括图像、PDF、Epub、CBR和CBZ等格式在内的多...

UltraEdit:能够响应自然语言指令 实现精准的图像编辑

UltraEdit简介 UltraEdit是由北京大学、BIGAI、加州大学洛杉矶分校和伊利诺伊大学香槟分校的联合研究团队开发的一项突破性图像编辑技术。该技术基于一个大规...

RodinHD:利用扩散模型生成高保真 3D 头像

RodinHD项目简介 RodinHD是由中国科学技术大学、清华大学以及微软亚洲研究院的联合研究团队开发的一种先进的3D头像生成技术。这项技术利用扩散模型从单张人像...
1 20 21 22 23 24 38