Qodo 筹集 4000 万美元 A 轮融资,为企业提供质量第一的代码生成和测试
Qodo,之前称为CodiumAI的初创公司,宣布完成了4000万美元的A轮融资,由Susa Ventures和Square Peg领投。Qodo不仅仅是一个AI代码生成工具,它还专注于生成测...
JoyHallo:京东推出的的一款数字人模型
JoyHallo简介 JoyHallo是由京东推出的的一款数字人模型,专为普通话视频生成设计。该模型通过采用中国版的wav2vec2音频特征嵌入技术和创新的半解耦结构,有效...
Open NotebookLM :将 PDF 文件转化为播客的开源工具
Open NotebookLM 简介 Open NotebookLM 是一个创新的开源工具,能够将 PDF 文档转换成个性化的音频播客。它利用了 Llama 3.1 和 meloTTS 等先进的开源人工智...
CogView3:智谱AI推出的文本到图像生成模型
CogView3简介 CogView3是智谱AI推出的文本到图像生成模型,它采用了名为“接力扩散”的先进技术。这一模型通过先创建低分辨率图像,然后利用超分辨率生成高清晰...
快手可灵AI全面开放API服务,推出“对口型”功能、“创意圈”社区
快手可灵AI在2024年9月30日进行了第十次重大更新,这次更新引入了两个核心功能:“对口型”和AI创作社区“创意圈”。“对口型”功能允许用户上传自己的配音或歌唱音...
Screenpipe:能够全天候记录用户的屏幕活动和音频输入
Screenpipe简介 Screenpipe是一款创新的开源软件,它通过24小时不间断地记录用户的屏幕和音频活动,结合AI技术,为用户提供个性化智能服务。它的核心优势在于...
GGHead:生成高分辨率且几何一致的3D人头模型
GGHead简介 GGHead是由德国慕尼黑工业大学推出的一种先进的3D生成对抗网络(3D GAN),它采用3D高斯散射技术,能够从大量的2D图像中快速学习并生成高分辨率且...
GraphReasoning:能将大量科学文献转化为结构化的知识图谱
GraphReasoning简介 GraphReasoning是一种利用生成性人工智能和知识图谱来加速科学发现的方法。它通过将大量科学论文转换成知识图谱,然后对这些图谱进行深入...
I2VEdit:南洋理工和商汤科技联合推出的一款视频编辑框架
I2VEdit简介 I2VEdit是由南洋理工大学和商汤科技研究院共同开发的一种创新视频编辑框架。该框架利用图像到视频的扩散模型,实现了以第一帧图像编辑为引导的全...
SafeEar:浙江与清华联合推出的音频深度伪造检测框架
SafeEar简介 SafeEar是由浙江大学与清华大学联合开发团队提出的一种创新音频深度伪造检测框架。该框架能够在不侵犯语音内容隐私的前提下,有效识别出深度伪造...