博客 | 第 84 页 | 柒柒AI导航

SnapGen：移动设备上的高效文本到图像生成模型

SnapGen简介 SnapGen是由Snap Inc.的研究团队开发的一款高分辨率文本到图像模型，专为移动设备优化，以高效的架构和训练方法实现在手机上快速生成高质量图像...

2-2.应用工具图像

7个月前

谷歌在12月16日发布了其最新版的视频生成模型Veo 2，但目前没有正式上线。更新了Imagen 3模型，这是其最高质量的文本到图像模型，能够生成细节丰富、照片级真...

AI新发布/功能更新

7个月前

DisPose简介 DisPose是由北京大学、中国科学技术大学、清华大学和香港科技大学的联合研究团队开发的一种创新插件式引导模块，旨在提高可控人类图像动画的质量...

2-2.应用工具图像

7个月前

Lyra简介 Lyra是由香港中文大学、SmartMore和香港科技大学的联合研究团队开发的一款高效且以语音为中心的多模态大型语言模型框架。该框架通过先进的语音理解...

3-5.多模态模型

7个月前

Video Seal简介 Video Seal是由Meta FAIR团队开发的一款先进的开源视频水印框架，旨在应对数字媒体和AI生成内容领域中的版权保护和内容审核挑战。该框架通过...

2-3.应用工具视频

7个月前

SwiftEdit简介 SwiftEdit是由VinAI Research团队开发的一种革命性的文本引导图像编辑工具，它通过创新的一步扩散模型技术，能够在短短0.23秒内实现快速且高质...

2-2.应用工具图像

7个月前

Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型，它通过专注于数据质量的训练方法，在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...

3-1.大语言模型

7个月前

Meta Motivo简介 Meta Motivo是由Meta公司的研究团队开发的一款先进的人工智能模型，旨在通过无监督强化学习方法控制数字智能体的动作。该模型能够模拟人类行...

2-5.应用工具其他

7个月前

POINTS1.5简介 POINTS1.5是由腾讯微信推出的多模态大模型，旨在提升对现实世界应用的处理能力。该模型在POINTS1.0的基础上进行了重大创新，包括采用NaViT风格...

3-5.多模态模型

7个月前

StyleMaster简介 StyleMaster是由香港科技大学与快手科技联合开发的一项先进的视频风格化技术。该技术通过创新的风格提取模块和模型幻觉生成的配对图像数据集...

2-3.应用工具视频

7个月前