AI项目合集
Concept Sliders:实现对图像生成中属性的精确控制 如年龄、风格、表情等
Concept Sliders简介 Concept Sliders是由东北大学和麻省理工学院CSAIL的研究人员开发的一种创新方法,它通过在扩散模型中引入低秩参数方向,实现了对图像生...
丰语 :顺丰推出的物流行业垂直领域大语言模型
丰语简介 顺丰科技在2024年9月8日的深圳国际人工智能展上发布了名为“丰语”的物流行业垂直领域大语言模型。这个模型专门针对物流行业的特定需求进行了优化,以...
Deepfake Defenders:识别和防范Deepfake技术生成的伪造图像和视频
Deepfake Defenders简介 Deepfake Defenders是一款由中国科学院推出的开源AI模型,专注于识别和防范Deepfake技术生成的伪造图像和视频。该模型通过深度学习...
LinFusion :新加坡国立大学推出的一种新型的图像生成模型
LinFusion 简介 LinFusion是由新加坡国立大学推出的一种新型的图像生成模型,该模型通过引入线性注意力机制,显著减少了生成高分辨率图像的时间和内存复杂度...
ViewCrafter:利用视频扩散模型合成高保真新视角视频
ViewCrafter简介 ViewCrafter 是由北京大学和鹏城实验室的研究团队开发的一种创新方法,它结合了视频扩散模型和点云表示技术,用于从单个或稀疏图像合成高保...
Composio:一款开源的 AI 智能体开发辅助工具
Composio简介 Composio 是一款开源的 AI 智能体开发辅助工具,旨在为开发者提供强大的工具和集成支持。它支持超过100种集成工具,简化了 AI 助手的开发和部...
DeepSeek-V2.5:深度求索新推出的融合通用与代码能力的AI开源模型
DeepSeek-V2.5简介 DeepSeek-V2.5 是 DeepSeek-V2-Chat 与 DeepSeek-Coder-V2-Instruct 的升级版本。新模型融合了这两个版本的通用能力和编码能力,还更好地...
svd_keyframe_interpolation:输入首帧和尾帧,生成连贯的视频
svd_keyframe_interpolation简介 svd_keyframe_interpolation是一种先进的图像到视频的生成技术,由华盛顿大学的研究团队开发。该技术能够通过预训练的大规模...
Flux Gym :用于训练 FLUX LoRA 的 Web 界面 最低只需要12G显存
Flux Gym简介 Flux Gym是一个为训练FLUX LoRA模型设计的简单Web UI工具,支持低VRAM配置(如12GB、16GB、20GB),特别适合资源有限的用户。它结合了AI-Toolki...
RapidLayoutRecover :将扫描的书页、PDF页面等文档图像转换成可编辑的格式
RapidLayoutRecover 简介 RapidLayoutRecover 是一款先进的文档图像处理工具,专门设计用于将扫描的书页、PDF页面等文档图像还原为可编辑的Word或TXT文本格式...