HeyGen推出交互式AI化身功能,实现多会议并行参与
HeyGen公司推出了一项名为Interactive Avatar的新功能,它允许用户创建并发送AI驱动的数字版自己参加Zoom会议和其他实时互动。这项技术的应用可能会改变人们...
Anthropic公司为Claude AI进行了重大更新
Anthropic公司为Claude AI进行了重大更新,推出了iOS和Android应用的新版本,并首次发布了iPad应用。这次更新带来了全新的外观和增强的功能,使用户能够更个...
TANGO:生成与目标语音同步的全身手势视频
TANGO简介 TANGO是由东京大学与CyberAgent AI Lab联合推出的开源框架,旨在通过运动图检索方法生成与目标语音同步的共语手势视频。该框架通过层次化的音频-运...
Hallo2:复旦大学、百度和南京大学联合推出的人像图像动画化模型
Hallo2简介 Hallo2是由复旦大学、百度公司和南京大学的研究团队共同开发的最新人像图像动画化模型。该模型能够在保持4K高分辨率的同时,生成长达数十分钟的音...
Ministral 3B/8B:Ministral AI推出的两款新型AI模型
Ministral 3B/8B简介 Ministral 3B和 8B是Ministral AI推出的两款新型AI模型,旨在提升边缘计算和设备端的智能能力。这些模型支持高达128,000个token的上下文...
Nemotron-70B-Instruct:英伟达开源的大语言模型
Nemotron-70B-Instruct简介 Nemotron-70B-Instruct 是英伟达开原的一款高性能大型语言模型,专注于提升自然语言处理的质量和效率。基于先进的变换器架构,该...
AutoCut:一款基于AI的智能视频剪辑工具
AutoCut简介 AutoCut是一款基于AI的智能视频剪辑工具,旨在提升视频编辑效率。它能够自动生成字幕,并将时间标签与文本内容智能匹配,用户只需简单编辑生成的...
Pika 1.5 再次更新,添加更多 AI 视频特效
Pika 1.5版本带来了一系列新的AI视频特效,这些特效被称为'Pikaffects'。新增的特效包括崩溃(crumble)、溶解(dissolve)、放气(deflate)和ta-da特效。这...
FunASR:阿里巴巴达摩院开源的语音识别工具包
FunASR简介 FunASR是由阿里巴巴达摩院开源的语音识别工具包,它致力于连接学术研究与工业应用。这个工具包不仅提供了语音识别(ASR)、语音活动检测(VAD)、...
Yi-Lightning:零一万物最新推出的高性能语言模型
Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型,采用了混合专家模型架构(Mixture of Experts, MoE),结合了动态Top-P路由机制和混合...