采样步骤可适当增加
发布时间:2025-06-24 16:44:20 作者:北方职教升学中心 阅读量:390
图中的FID score 、 具体来说, FID \operatorname{FID}。和协方差矩阵。∣。。 首先用 Inception network提取真实数据和生成数据的特征向量, , μ 2 \mu_2。 μ 1 \mu_1。C。 C。 q。q。
CFG Scale 超参数,用于调整生成图片和提示词的相关性。)。 μ。值越大(接近1,评估越高。∣。Clip score 计算图像与提示词之间的相关性,越大越好。p。采样步骤可适当增加,2。和。μ。。p。
值越低,生成的数据与真实数据分布越相似。协方差矩阵分别表示两种分布的特征向量。∣。最后, μ q \mu_q。,q。Clip score 和 cfg-scales 什么意思?f;FID score。C。增加此值会使图像更接近您的提示,Σ。。。T r \mathrm{Tr}。但过高会使图像颜色过饱和,过高在一定程度上降低了图像质量。+C。−。2。。
stable-diffusion 在仓库中c;是这样评价模型的。将文本和图像输入OpenAI;Contrastive Language-Image Pre-training)模型转换为特征向量,然后计算它们之间的余弦相似性。2。(。p。然后计算这两个特征向量集的平均值。 p。||_2。。(。q。2。 Σ 1 \Sigma_1。q。+Tr。 FID。∣。当CLIP Score高时,图像-文本之间的相关性更高。。 μ。 FID \operatorname{FID}。。表示生成图像的分布,μ p \mu_p。 Tr。 ∣∣。
Evaluations with different classifier-free guidance scales (1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0) and 50 PLMS sampling steps show the relative improvements of the checkpoints,
对应这张图。1。
总结。p。。
表示欧几里得的范数。 C q C_q。表示矩阵的迹运算,∣ ∣ ⋅ ∣ ∣ 2 。FID。
CFG Scale Classifier Free Guidance Scale 缩写,代表提示词的相关性。FID。μ。和。
FID score 计算生成的图像与原始图像的距离,越小越好。
CFG Scale。。1。计算上述公式。
其中,p p。。⋅。。
Clip Score是指CLIP(,。μ。2。
值。q。。FID。−。两个分布越相似,2。 C。
FID(Fréchet Inception Distance ) score 用于评估生成图像质量的测量标准,特别用于评估模型生成图片的性能,计算公式如下所示a;
F I D ( p , q ) = ∣ ∣ μ p − μ q ∣ ∣ 2 2 + T r ( C p + C q − 2 C p C q ) \mathrm{FID}(p, q) = ||\mu_p - \mu_q||_2^2 + \mathrm{Tr}(C_p + C_q - 2\sqrt{C_pC_q})。这里是原始论文点。分别表示两个分布的特征向量的平均值,C p C_p。
Clip score。∣∣。表示真实图像的分布,q q。p。)。μ。=∣∣。p。CLIP Score评估自然语言和图像之间的匹配度和相关性。 FID \operatorname{FID}。。C。以抵消图像质量的劣化。 。Σ。, Σ 2 \Sigma_2。。一般5~15之间最好,7,9,12是三个常见的设置值。q。