3.AI大模型数据库
Buzz:一个开源的离线音频转录和翻译工具
Buzz简介 Buzz是一个开源的离线音频转录和翻译工具,由OpenAI的Whisper模型提供技术支持。它允许用户在个人电脑上自动将音频文件转换成文字,同时支持多语言...
Linly-Dubbing:智能视频多语言AI配音/翻译工具
Linly-Dubbing简介 Linly-Dubbing 是一个开源的AI视频工具,它支持视频的配音、翻译和对口型功能。这个工具能够自动将视频内容翻译成多种语言,并生成相应的...
书生·浦语2.5:上海人工智能实验室推出的最新版AI大模型
书生·浦语2.5简介 书生·浦语2.5(InternLM2.5)是由上海人工智能实验室推出的最新版AI大模型。它以其超长的文本窗口支持高达一百万词元,以及在开源模型中领...
IP Adapter Instruct:通过文本指令来精确控制图像生成的细节和风格
IP Adapter Instruct项目简介 IPAdapter-Instruct是由Unity Technologies的研究团队开发的一种先进的图像生成模型。它通过结合自然图像条件和“Instruct”提示...
HeadGAP:可用几张甚至一张图像来创建逼真的可动画 3D 头部头像
HeadGAP项目简介 HeadGAP是一种创新的3D头像生成技术,由字节跳动公司和上海科技大学的联合研究团队开发。这项技术能够通过极少的图像输入,甚至是单张图片,...
UniPortrait:阿里推出的支持多角色身份一致性的创新框架
UniPortrait简介 UniPortrait 是由阿里巴巴集团智能计算研究所开发的一项创新技术,它是一个统一的框架,用于个性化定制单个人和多个人的图像,同时保持高度...
ControlNeXt:高效可控的图像与视频生成方法
ControlNeXt简介 ControlNeXt是由CUHK和SmartMore的开发团队提出的一种先进方法,专为图像和视频生成提供强大且高效的可控性。这种方法通过简化的架构和创新...
Grok-2:马斯克xAI公司推出的新一代AI模型
Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型,它是Grok-1.5的显著进步版本,具有在聊天、编码和推理方面的前沿能力。同时,公司还推出了Grok-2的小...
Falcon Mamba 7B:TII 推出的首个通用Mamba开源大模型
Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型,它采用了创新的 Mamba 状态空间语言模型架构,有效...
LLaVA-OneVision:字节等推出的开源大型多模态模型
LLaVA-OneVision简介 LLaVA-OneVision 是由字节跳动、南洋理工大学、香港中文大学和香港科技大学的专家团队共同研发的一系列先进大型多模态模型。这些模型通...