文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式
樱花在线视频免费观看电视剧阿里云虽未独立上市,但阿里持续公布云计算业务财务数据,阿里财年三季度即2024年四季度财报显示,阿里云实现营收317.42亿元,调整后EBITA增长33%至31.38亿元,派欧云招股书中同样没有提及同维度数据。近年来,无论是从政策宣示还是实际做法来说,伊朗一直强调要和平利用核能,并且上世纪70年代就加入了联合国的《不扩散核武器条约》。2015年伊核协议签署,协议给伊朗保留了进行铀浓缩的能力,但是铀原料一旦产出就立即运走、送往第三方,也就不会有从60%提炼到90%,乃至后续的核试验、武器化等过程。到目前为止,应该说2015年伊核协议依然是解决伊朗核问题的最理想方案:它既保留了伊朗的核开发(即和平利用核能)权利,也提供了透明的可监督机制,确保伊朗不会生产出核武器。樱花在线视频免费观看电视剧日本MV与欧美MV的区别“而且国米不可能同时失去恰尔汗奥卢和弗拉泰西,国米可能会做一些阵容调整,但不可能全卖掉。否则对于刚上任的新教练来说,执教一支完全陌生的球队将非常困难。”恰尔汗奥卢已经受伤有一段时间,他在本月初已经因伤未能出战土耳其国家队的比赛。在目前的世俱杯中,他也尚未能够出场。
20250818 💫 樱花在线视频免费观看电视剧瓦伦西亚向马卡电台透露,阿森纳已经向瓦伦西亚俱乐部的中后卫莫斯克拉发出了正式报价,但遭到瓦伦西亚拒绝,因为报价低于2000万欧。九十九夜xbox360在全球纯电动SUV市场中,特斯拉Model Y长期位列全球新能源汽车销量冠军。近年来中国自主汽车品牌强势崛起,特斯拉Model Y在中国市场正面临着前所未有的竞争压力,但其市场地位依然很难撼动。
📸 刘德浩记者 连瑞禄 摄
20250818 🍒 樱花在线视频免费观看电视剧人才也是胜科纳米打造半导体第三方分析检测生态的重要一环。据了解,胜科纳米与新加坡科技设计大学联合推出科技与设计理学硕士(集成电路设计、失效分析与可靠性分析)硕士项目,培育新一代半导体领域实战型紧缺人才,第一批学生已于2024年9月正式入学,第二届学员正在招生中。免费网站在线观看人数在哪软件眼下,阿斯塔纳市区多条公交干线都有中国纯电动客车的身影。近日,本报记者走进阿斯塔纳,坐上公交车,听这里的人讲述中国与中亚合作带来的绿色出行改变。
📸 张士冲记者 朱宏兵 摄
🛏️ 从过往的惯用手法来看,特朗普无疑擅长三件事:用破产保护化解危机、用公关与媒体修复形象、用品牌授权持续变现。但这一次,特朗普用 1.14 亿美元现金,一次性还清了全部贷款。http://www.17c.com.gov.cn