SHMT:能够将一种化妆风格从参考图像转移到源图像上
SHMT简介 SHMT(Self-supervised Hierarchical Makeup Transfer)是一种先进的自监督化妆转移技术,由武汉理工大学与阿里巴巴集团联合研发。该技术通过利用潜...
AnyDressing:字节联合清华大学推出的多服装虚拟试穿技术
AnyDressing简介 AnyDressing是由字节跳动与清华大学联合开发的一种创新的多服装虚拟试穿技术,它通过利用潜在扩散模型,可以根据任意服装组合和个性化文本提...
OpenHands:通过编写代码、执行命令行操作和浏览互联网来与世界互动的AI代理
OpenHands简介 OpenHands是一个开放的平台,旨在帮助开发者创建能够通过编写代码、执行命令行操作和浏览互联网来与世界互动的AI代理。它提供了一个灵活的事件...
VideoAnydoor:香港大学联合阿里达摩院等推出的视频对象插入框架
VideoAnydoor简介 VideoAnydoor是由香港大学和阿里巴巴达摩院等机构联合开发的一个先进视频对象插入框架,它能够在视频中以高保真度插入给定对象,并实现精确...
PersonaMagic:根据文本提示生成与文本描述相匹配的人脸图像
PersonaMagic简介 PersonaMagic是由中国海洋大学、上海交通大学、新加坡管理大学、哈尔滨工业大学(深圳)和华南理工大学的研究团队共同开发的一种高保真度人...
InstructMove:东京大学联合Adobe推出的指令式图像编辑模型
InstructMove简介 InstructMove是由东京大学和Adobe联合推出的一种创新的指令式图像编辑模型。该模型通过分析视频帧对和利用多模态大型语言模型(MLLMs)生成...
TAAE:Stability AI推出的神经音频编解码模型
TAAE简介 TAAE是由Stability AI推出一种新型的神经音频编解码模型,它利用基于Transformer的架构和有限标量量化(FSQ)技术,在极低的比特率下实现高质量的语...
CODEELO:阿里Qwen团队推出的评估LLMs编码能力的基准测试
CODEELO简介 CODEELO是由阿里巴巴的Qwen团队开发的一个创新的竞赛级代码生成基准测试,旨在通过严格的评估方法衡量大型语言模型(LLMs)的高级编码能力。该基...
RLCM:快速从文本提示生成高质量图像 显著减少推理时间
RLCM简介 RLCM是由康奈尔大学计算机科学系的团队开发的一种新型强化学习框架,旨在通过直接优化奖励函数来微调一致性模型,实现快速的文本到图像的生成。该框...
LLM2LLM:提升大型语言模型在特定任务上的性能
LLM2LLM简介 LLM2LLM是一种创新的、迭代的数据增强策略,由加州大学伯克利分校的研究团队开发。该策略通过利用一个教师型大型语言模型(LLM)来增强小型种子...