新浪科技讯 1月16日上午消息,智谱联合华为开源新一代图像生成模型GLM-Image,宣布基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程。
据悉,该模型开源不到24小时即冲上全球知名AI开源社区Hugging Face榜单的全球第一。不同于开源常用的LDM方案,GLM-Image采用了创新的“自回归+扩散解码器”混合架构,兼顾全局指令理解与局部细节刻画,克服了海报、PPT、科普图等知识密集型场景生成难题,尤其擅长汉字生成任务,向探索以Nano Banana Pro为代表的“知识+推理”的认知型生成模型迈出了重要一步。
从训练过程看,GLM-Image实现了基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架的全流程训练及推理适配,实际训练性能足以达到相应计算设备的汇报性能上限,验证了在国产全栈算力底座上训练前沿模型的可行性。
本文标题: 智谱联合华为开源图像生成模型GLM-Image,24小时登顶Hugging Face榜单