SnapGen:移动设备上的高效文本到图像生成模型

SnapGen简介 SnapGen是由Snap Inc.的研究团队开发的一款高分辨率文本到图像模型,专为移动设备优化,以高效的架构和训练方法实现在手机上快速生成高质量图像...

谷歌推出视频模型Veo 2、更新 Imagen 3、Whisk新工具

谷歌在12月16日发布了其最新版的视频生成模型Veo 2,但目前没有正式上线。更新了Imagen 3模型,这是其最高质量的文本到图像模型,能够生成细节丰富、照片级真...

DisPose:提高可控人类图像动画的质量和一致性

DisPose简介 DisPose是由北京大学、中国科学技术大学、清华大学和香港科技大学的联合研究团队开发的一种创新插件式引导模块,旨在提高可控人类图像动画的质量...

Lyra:香港中文大学等推出的多模态语言模型

Lyra简介 Lyra是由香港中文大学、SmartMore和香港科技大学的联合研究团队开发的一款高效且以语音为中心的多模态大型语言模型框架。该框架通过先进的语音理解...

Video Seal:Meta 推出的开源视频水印框架

Video Seal简介 Video Seal是由Meta FAIR团队开发的一款先进的开源视频水印框架,旨在应对数字媒体和AI生成内容领域中的版权保护和内容审核挑战。该框架通过...

SwiftEdit:通过简单的文本提示 快速实现对图像的编辑和修改

SwiftEdit简介 SwiftEdit是由VinAI Research团队开发的一种革命性的文本引导图像编辑工具,它通过创新的一步扩散模型技术,能够在短短0.23秒内实现快速且高质...

Phi-4:微软推出的14亿参数的大型语言模型

Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型,它通过专注于数据质量的训练方法,在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...

Meta Motivo:Meta推出的无监督强化学习控制数字智能体

Meta Motivo简介 Meta Motivo是由Meta公司的研究团队开发的一款先进的人工智能模型,旨在通过无监督强化学习方法控制数字智能体的动作。该模型能够模拟人类行...

POINTS1.5:腾讯微信推出的多模态大模型

POINTS1.5简介 POINTS1.5是由腾讯微信推出的多模态大模型,旨在提升对现实世界应用的处理能力。该模型在POINTS1.0的基础上进行了重大创新,包括采用NaViT风格...

StyleMaster:快手联合香港科技大学开发的视频风格化技术

StyleMaster简介 StyleMaster是由香港科技大学与快手科技联合开发的一项先进的视频风格化技术。该技术通过创新的风格提取模块和模型幻觉生成的配对图像数据集...
1 82 83 84 85 86 217