3.AI大模型数据库 | 第 16 页

Buzz：一个开源的离线音频转录和翻译工具

Buzz简介 Buzz是一个开源的离线音频转录和翻译工具，由OpenAI的Whisper模型提供技术支持。它允许用户在个人电脑上自动将音频文件转换成文字，同时支持多语言...

2-4.应用工具音频

5个月前

Linly-Dubbing简介 Linly-Dubbing 是一个开源的AI视频工具，它支持视频的配音、翻译和对口型功能。这个工具能够自动将视频内容翻译成多种语言，并生成相应的...

2-3.应用工具视频

5个月前

书生·浦语2.5简介书生·浦语2.5（InternLM2.5）是由上海人工智能实验室推出的最新版AI大模型。它以其超长的文本窗口支持高达一百万词元，以及在开源模型中领...

1-1.大模型&国内

5个月前

IP Adapter Instruct项目简介 IPAdapter-Instruct是由Unity Technologies的研究团队开发的一种先进的图像生成模型。它通过结合自然图像条件和“Instruct”提示...

2-2.应用工具图像

5个月前

HeadGAP项目简介 HeadGAP是一种创新的3D头像生成技术，由字节跳动公司和上海科技大学的联合研究团队开发。这项技术能够通过极少的图像输入，甚至是单张图片，...

2-6.应用工具3D

5个月前

UniPortrait简介 UniPortrait 是由阿里巴巴集团智能计算研究所开发的一项创新技术，它是一个统一的框架，用于个性化定制单个人和多个人的图像，同时保持高度...

2-2.应用工具图像

5个月前

ControlNeXt简介 ControlNeXt是由CUHK和SmartMore的开发团队提出的一种先进方法，专为图像和视频生成提供强大且高效的可控性。这种方法通过简化的架构和创新...

2-2.应用工具图像

5个月前

Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型，它是Grok-1.5的显著进步版本，具有在聊天、编码和推理方面的前沿能力。同时，公司还推出了Grok-2的小...

1-2.大模型&国外

5个月前

Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型，它采用了创新的 Mamba 状态空间语言模型架构，有效...

1-2.大模型&国外

5个月前

LLaVA-OneVision简介 LLaVA-OneVision 是由字节跳动、南洋理工大学、香港中文大学和香港科技大学的专家团队共同研发的一系列先进大型多模态模型。这些模型通...

3-1.大语言模型

5个月前