AI项目合集

RapidLayoutRecover :将扫描的书页、PDF页面等文档图像转换成可编辑的格式

RapidLayoutRecover 简介 RapidLayoutRecover 是一款先进的文档图像处理工具,专门设计用于将扫描的书页、PDF页面等文档图像还原为可编辑的Word或TXT文本格式...

Reflection 70B:AI写作公司HyperWrite推出的开源AI大模型

Reflection 70B简介 Reflection 70B是由AI写作公司HyperWrite推出的开源AI大模型,它基于Meta的开源Llama 3.1-70B Instruct模型,并采用了一种创新的自我纠错...

FluxMusic:昆仑推出的一款文本到音乐生成模型

FluxMusic简介 FluxMusic是由昆仑推出的一款创新的文本到音乐生成模型,它基于扩散修正流变换器技术构建,能够在潜在的变分自编码器空间中将文本描述转换为音...

Loopy:字节&浙大推出的音频驱动视频生成模型

Loopy简介 Loopy是由字节跳动公司和浙江大学的研究团队共同开发的一种先进的音频驱动视频生成模型。该模型采用端到端的设计,专注于利用长期运动依赖性来提高...

MiniCPM 3.0 :面壁智能最新发布的端侧 AI 模型

MiniCPM 3.0 简介 MiniCPM 3.0 是面壁智能最新发布的端侧 AI 模型,它以 4B 参数的规模实现了对 GPT-3.5 的性能超越。这款模型在自然语言处理、知识掌握、编...

MoneyPrinterPlus:一键批量生成各类短视频 并自动发布到多个平台

MoneyPrinterPlus简介 MoneyPrinterPlus 是一款利用 AI 大模型技术自动生成短视频的工具,它能够一键批量生成各类短视频,自动混剪视频,并且支持将视频自动...

DiffUHaul:无需额外训练即可实现图像中对象的无缝拖动

DiffUHaul简介 DiffUHaul是由NVIDIA Research、耶路撒冷希伯来大学、特拉维夫大学和Reichman大学共同研发的一项创新技术。这项技术通过利用局部文本到图像模...

ComfyUI-AdvancedLivePortrait :将编辑好的面部表情插入视频序列中

ComfyUI-AdvancedLivePortrait 简介 ComfyUI-AdvancedLivePortrait 是一款高效的面部动画编辑工具,它允许用户在照片中编辑面部表情,并将这些表情实时插入视...

Yi-Coder:零一万物推出的一系列AI编程助手模型 支持52种编程语言

Yi-Coder简介 Yi-Coder是由零一万物推出的一系列AI编程助手模型,包含1.5B和9B参数两个版本,专为高效推理和灵活训练设计。这些模型在预训练了2.4万亿高质量...

RB-Modulation:根据参考风格图像和文本提示,生成具有特定艺术风格的图像

RB-Modulation简介 RB-Modulation是一种创新的图像生成技术,由Google的研究团队开发,它通过随机最优控制方法实现了扩散模型的训练自由个性化。这种方法允许...
1 2 3 34