CogVLM2:智谱AI推出的新一代多模态大模型

CogVLM2简介 CogVLM2是由智谱AI推出的创新多模态大模型,它集成了50亿参数的视觉编码器和70亿参数的视觉专家模块,实现了视觉与语言理解的显著性能提升。该模...

ZeST:将一个图像中的材质直接迁移到另一个图像上

ZeST项目介绍 ZeST是一种基于深度学习的图像处理技术,专注于实现零样本下的材质迁移。它通过使用扩散适配器从示例图像中提取材质的隐含表示,并利用预训练的...

AI PPT生成初创公司【Gamma】获1200万美元A轮融资

AI PPT生成初创公司Gamma近日获得了1200万美元的A轮融资。本轮融资由Accel Partners领投,融资资金将用于进一步推进产品研发、扩大市场覆盖等方面。Gamma是一...

AI深度学习和技术问题解决商【weka.io】获1.4亿美元E轮融资

近日,weka.io获得了1.4亿美元的E轮融资。本轮融资由多家投资方共同参与,包括Valor、Generation Investment Management、英伟达NVIDIA、Atreides Management...

人工智能视觉服务商【Voxel51】获3000万美元B轮融资

Voxel51是一家人工智能视觉服务商,专注于提供开源和商业软件,帮助团队构建数据集和计算机视觉模型,为机器学习和人工智能应用提供动力。该公司的开源产品Fi...

Veo:谷歌推出的一款视频生成模型

Veo简介 Veo是由谷歌推出的一款视频生成模型,它通过先进的技术能够根据文本提示生成1080p高分辨率、时长超过一分钟的视频。该模型支持广泛的电影和视觉风格...

临床人工智能服务商【SmarterDx】获5000万美元B轮融资

近日,SmarterDx获得了5000万美元的B轮融资。这是一家临床人工智能服务商,致力于使用临床人工智能来解决卫生系统中的收入完整性差距问题,防止收入泄漏并确...

对话式人工智能语音助手【Poly AI】完成5000万美元C轮融资

英国的人工智能初创公司PolyAI确实完成了5000万美元的C轮融资。这轮融资得到了多家知名投资方的参与,包括Hedosophia、英伟达公司旗下的投资部门NVentures、Z...

混元-DiT:首个中英双语DiT架构的文本到图像生成模型

混元DiT项目介绍 混元DiT(Hunyuan-DiT)是由腾讯混元团队开发的先进文本到图像生成模型,它利用多分辨率扩散Transformer技术,实现了对中英文文本的细粒度理...

GPT-4o:OpenAI最新发布的多模态人工智能模型

GPT-4o简介 GPT-4o是由OpenAI最新发布的一款多模态人工智能模型,GPT-4o中的“o”代表“Omni”,意为全能。它能够高效地处理和生成文本、音频和图像。这款模型在...
1 200 201 202 203 204 217