AI开源项目
StereoCrafter:将单一视角的2D视频转换为沉浸式的立体3D视频
StereoCrafter简介 StereoCrafter是由腾讯AI实验室和ARC实验室联合开发的一种创新框架,它能够将单一视角的2D视频转换为沉浸式的立体3D视频,以满足日益增长...
YuLan-Mini:中国人民大学推出的具有2.42亿参数的轻量级语言模型
YuLan-Mini简介 YuLan-Mini是由中国人民大学高瓴人工智能学院开发的一个具有2.42亿参数的轻量级语言模型。该模型以其数据高效和训练稳定性而著称,能够在相对...
VidTok:将视频内容编码成紧凑的潜在标记
VidTok简介 VidTok是由微软研究院、上海交通大学和北京大学联合开发的一个多功能、开源视频分词器,它通过将视频内容编码成紧凑的潜在标记来提高视频生成和理...
DynamicControl:腾讯等推出的多条件自适应文本到图像生成框架
DynamicControl简介 DynamicControl是由腾讯联合南洋理工、浙大等研究机构推出的一种创新框架,旨在提升文本到图像生成任务中的条件控制能力。该框架通过动态...
Infinity:字节跳动推出的高分辨率图像合成模型
Infinity简介 Infinity是由字节跳动公司开发的一种先进的比特视觉自回归模型,它能够根据语言指令生成高分辨率、逼真的图像。该模型通过采用无限词汇量的标记...
3DHM:用单张图片和目标3D动作序列来动画化人物
3DHM简介 3DHM是由加州大学伯克利分校的研究团队开发的一种创新的基于扩散模型的框架,它能够利用单张图片和目标3D动作序列来动画化人物。这种方法通过学习人...
FinRobot:专为金融应用设计的开源A Agent平台
FinRobot简介 FinRobot是一个创新的开源AI Agent平台,专为金融应用设计,以大型语言模型(LLMs)为核心,提供金融专业分析工具。该平台通过其四层架构——金融...
DepthLab:专门设计用于从单一图像中生成完整的3D场景
DepthLab简介 DepthLab是由香港大学、香港科技大学、蚂蚁集团、阿尔托大学和同一实验室联合开发的一款先进的深度修复模型。该模型专门设计用于从单一图像中生...
DRT-o1:微信AI团队推出的长链条思考神经机器翻译模型
DRT-o1简介 DRT-o1是由微信人工智能团队开发的神经机器翻译模型,旨在通过长链条思考(CoT)来提升翻译质量,特别是在处理包含比喻和隐喻的文学作品时。该模...
IDOL:从单张图片快速创建高分辨率的3D人物模型
IDOL简介 IDOL是一个创新的前馈单图像人物重建框架,能够快速、高保真地从单张图片中创建出逼真的3D全身人物化身。它利用一个大规模的多视图数据集HuGe100K,...