其乐融融的IT技术小站

标签:CLIP

机器学习

文生图的基石CLIP模型的发展综述

7

其乐融融 发布于 2024/03/23 02:17:13

CLIP的英文全称是Contrastive Language-Image Pre-training,即一种基于对比文本-图像对的预训练方法或者模型。CLIP是一种基于对比学习的多模态模型,CLIP的训练数据是文本-图像对:一张图像和它对应的文本描述,这里希望通过对比学习,模型能够学习到文本-图像对的匹配关系。

阅读()评论(0)赞 ()