因为$$KL = -ELBO + p_\theta(z|x_i)$$ 则有 $$KL + ELBO = p_\theta(z|x_i)$$ 其中$p_\theta(z|x_i)$为一个常量 因此最大化ELBO实际上就是最小化$KL$散度