博客 | 第 80 页 | 柒柒AI导航

DRT-o1：微信AI团队推出的长链条思考神经机器翻译模型

DRT-o1简介 DRT-o1是由微信人工智能团队开发的神经机器翻译模型，旨在通过长链条思考（CoT）来提升翻译质量，特别是在处理包含比喻和隐喻的文学作品时。该模...

2-5.应用工具其他

7个月前

WiS简介 WiS（Who is Spy?）平台是由阿里巴巴的淘宝和天猫团队开发的一款创新工具，旨在通过基于游戏的分析方法，增强对基于大型语言模型（LLMs）的多智能体...

2-5.应用工具其他

7个月前

Video Prediction Policy简介 Video Prediction Policy (VPP) 是由清华大学工业智能与系统研究所（IIIS）和加州大学伯克利分校联合开发的一种先进的机器人策...

2-5.应用工具其他

7个月前

MegaSaM简介 MegaSaM是由Google DeepMind联合加州大学伯克利分校和密歇根大学的研究团队开发的一种先进系统，它能够从非正式的动态场景单目视频中准确、快速...

2-3.应用工具视频

7个月前

DreamOmni简介 DreamOmni 是由字节跳动、香港中文大学和香港科技大学联合推出的一款图像生成和编辑模型。该模型通过统一框架整合了文本到图像（T2I）生成和多...

2-2.应用工具图像

7个月前

IDOL简介 IDOL是一个创新的前馈单图像人物重建框架，能够快速、高保真地从单张图片中创建出逼真的3D全身人物化身。它利用一个大规模的多视图数据集HuGe100K，...

2-6.应用工具3D

7个月前

VisionFM简介 VisionFM是一个多模态多任务视觉基础模型，专为综合眼科人工智能设计。它通过预训练3.4百万张覆盖广泛眼科疾病、模态和人群的图像，展现出超越...

2-5.应用工具其他

7个月前

VSI-Bench简介 VSI-Bench是由李飞飞、纽约大学、耶鲁大学和斯坦福大学的研究团队共同开发的一项新颖的视频基础视觉空间智能基准测试。该基准测试包含超过5000...

2-5.应用工具其他

7个月前

HelloMeme简介 HelloMeme是一种文本到图像扩散模型，专注于生成具有高度细节和真实感的表情包视频。它通过优化2D特征图相关的注意力机制，提升了模型在处理夸...

2-2.应用工具图像

7个月前

InvSR简介 InvSR是一种创新的图像超分辨率技术，由南洋理工大学S-Lab的团队开发。这项技术基于扩散反转原理，通过预测最优噪声图来初始化采样过程，从而利用...

2-2.应用工具图像

7个月前