2.应用工具相关
Light-R1:360智脑开源的专注于数学领域的语言模型
Light-R1简介 Light-R1 是由 360智脑开源的一款专注于数学领域的语言模型。该模型通过课程式微调(Curriculum SFT)和基于偏好优化(DPO)的方法,从无长链推...
Chat2SVG:香港城市大学等推出的矢量图形生成框架
Chat2SVG简介 Chat2SVG 是由香港城市大学和莫纳什大学联合开发的一种创新的矢量图形生成框架。它结合了大型语言模型(LLMs)和图像扩散模型的优势,能够根据...
PodAgent:小红书联合微软等推出的播客生成框架
PodAgent简介 PodAgent是由香港中文大学、微软和小红书公司联合开发的播客生成框架。它通过创新的Host-Guest-Writer多智能体协作系统生成深度对话内容,结合...
X-Dancer:从单张静态图像生成与音乐同步的全身舞蹈视频
X-Dancer简介 X-Dancer是由字节联合加州大学圣地亚哥分校和南加州大学推出的创新框架,旨在从单张静态图像生成与音乐同步的全身舞蹈视频。该框架结合了自回归...
Kiss3DGen:香港科技大学等推出的3D生成框架
Kiss3DGen简介 Kiss3DGen是由香港科技大学(广州)和香港科技大学的研究团队联合广州趣丸网络科技有限公司共同开发的一种高效3D生成框架。该框架通过将预训练...
AVD2:增强自动驾驶系统对复杂交通事故场景的理解能力
AVD2简介 AVD2(Accident Video Diffusion for Accident Video Description)是由清华大学人工智能产业研究院(AIR)联合香港科技大学、吉林大学、南京理工大...
TheoremExplainAgent:将复杂的定理和概念转化为易于理解的视频内容
TheoremExplainAgent简介 TheoremExplainAgent是由加拿大滑铁卢大学、Votee AI以及Vector Institute联合开发的多模态定理解释系统。该系统通过结合文本和视觉...
DiffBrush:北京邮电大学等推出的图像生成与编辑框架
DiffBrush简介 DiffBrush是由北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学的研究团队共同开发的一种创新的图像生成与编辑框架。它基于预训...
TrendPublish:通过智能化手段简化内容创作与分发流程
TrendPublish简介 TrendPublish 是一个基于 AI 的趋势发现和内容发布系统,旨在通过智能化手段简化内容创作与分发流程。它支持多源数据采集,可从 Twitter/X...
DREAM ENGINE:根据语言描述和多张参考图像生成高质量的图像
DREAM ENGINE简介 DREAM ENGINE是由北京大学、阿里巴巴集团、华盛顿大学、北京理工大学和Binance Labs联合开发的创新图像生成框架。该框架通过结合大型多模态...