AI项目合集 | 柒柒AI导航

新RapidLayoutRecover ：将扫描的书页、PDF页面等文档图像转换成可编辑的格式

RapidLayoutRecover 简介 RapidLayoutRecover 是一款先进的文档图像处理工具，专门设计用于将扫描的书页、PDF页面等文档图像还原为可编辑的Word或TXT文本格式...

2-1.应用工具文本

19分钟前

Reflection 70B简介 Reflection 70B是由AI写作公司HyperWrite推出的开源AI大模型，它基于Meta的开源Llama 3.1-70B Instruct模型，并采用了一种创新的自我纠错...

1-2.大模型&国外

33分钟前

FluxMusic简介 FluxMusic是由昆仑推出的一款创新的文本到音乐生成模型，它基于扩散修正流变换器技术构建，能够在潜在的变分自编码器空间中将文本描述转换为音...

3-4.音乐生成模型

23小时前

Loopy简介 Loopy是由字节跳动公司和浙江大学的研究团队共同开发的一种先进的音频驱动视频生成模型。该模型采用端到端的设计，专注于利用长期运动依赖性来提高...

2-3.应用工具视频

23小时前

MiniCPM 3.0 简介 MiniCPM 3.0 是面壁智能最新发布的端侧 AI 模型，它以 4B 参数的规模实现了对 GPT-3.5 的性能超越。这款模型在自然语言处理、知识掌握、编...

1-1.大模型&国内

23小时前

MoneyPrinterPlus简介 MoneyPrinterPlus 是一款利用 AI 大模型技术自动生成短视频的工具，它能够一键批量生成各类短视频，自动混剪视频，并且支持将视频自动...

2-3.应用工具视频

2天前

DiffUHaul简介 DiffUHaul是由NVIDIA Research、耶路撒冷希伯来大学、特拉维夫大学和Reichman大学共同研发的一项创新技术。这项技术通过利用局部文本到图像模...

2-2.应用工具图像

2天前

ComfyUI-AdvancedLivePortrait 简介 ComfyUI-AdvancedLivePortrait 是一款高效的面部动画编辑工具，它允许用户在照片中编辑面部表情，并将这些表情实时插入视...

2-3.应用工具视频

2天前

Yi-Coder简介 Yi-Coder是由零一万物推出的一系列AI编程助手模型，包含1.5B和9B参数两个版本，专为高效推理和灵活训练设计。这些模型在预训练了2.4万亿高质量...

1-1.大模型&国内

2天前

RB-Modulation简介 RB-Modulation是一种创新的图像生成技术，由Google的研究团队开发，它通过随机最优控制方法实现了扩散模型的训练自由个性化。这种方法允许...

2-2.应用工具图像

3天前