ZP
智谱AIGLM-4V
多模态视觉理解、图像分析
参数量未公开披露上下文窗口未公开披露知识截止日期未公开披露
功能介绍
GLM-4V 在 GLM 体系上扩展多模态视觉理解与图像分析能力,可在文本指令之外解读视觉输入。
适用于图表与截图解读、视觉问答,以及在同一轮交互中混合文档与图像的工作流。
GLM-4V 表明:多模态视觉分析可在务实成本下落地,进一步印证相对较低成本的模型同样能够在视觉密集型任务上达到高性能。
适用场景
数据分析图像生成内容写作
多模态视觉理解、图像分析
GLM-4V 在 GLM 体系上扩展多模态视觉理解与图像分析能力,可在文本指令之外解读视觉输入。
适用于图表与截图解读、视觉问答,以及在同一轮交互中混合文档与图像的工作流。
GLM-4V 表明:多模态视觉分析可在务实成本下落地,进一步印证相对较低成本的模型同样能够在视觉密集型任务上达到高性能。