免费视频高清修复清晰软件(视频格式转换大师破解版)

图像超分辨率技术指的是根据低分辨率图像生成高分辨率图像的过程,该技术希望根据已有的图像信息重构出缺失的图像细节。视频超分辨率技术则更加复杂,不仅需要生成细节丰富的一帧帧图像,还要保持图像之间的连贯性。在一篇名为「TemporallyCo

图像超分辨率技术指的是根据低分辨率图像生成高分辨率图像的过程,该技术希望根据已有的图像信息重构出缺失的图像细节。视频超分辨率技术则更加复杂,不仅需要生成细节丰富的一帧帧图像,还要保持图像之间的连贯性。

在一篇名为「Temporally Coherent GANs for Video Super-Resolution (TecoGAN)」的论文中,来自慕尼黑工业大学的研究人员提出了一种用于实现视频超分辨率的新型 GAN——TecoGAN。

此前,已经有开发者利用 ESRGAN 这种视频超分辨率模型重制了很多单机游戏,包括经典的重返德军总部、马克思·佩恩和上古卷轴 III:晨风等等。重制的高清版游戏在画质上有很好的效果,而且还保留了原始纹理的美感与风格。

以下三幅动图的右半部分是用 TecoGAN 生成的,说不定用它来重制单机游戏会有更惊人的效果。该方法能够生成精细的细节,较长的生成视频序列也不会影响其时间连贯度。

图中,动物皮的网格结构、蜥蜴的图案和蜘蛛背部的斑点无不彰显该方法的效果。该方法中的时空判别器在引导生成器网络输出连贯细节方面居功至伟。

免费视频高清修复清晰软件(视频格式转换大师破解版)
免费视频高清修复清晰软件(视频格式转换大师破解版)

这个视频超分辨率 GAN 牛在哪里?

自然图像超分辨率是图像和视频处理领域的一大经典难题。对于单一图像超分辨率(SISR),基于深度学习的方法可以达到当前最佳的峰值信噪比(PSNR),而基于 GAN 的架构在感知质量方面实现了重大改进。

在视频超分辨率(VSR)任务中,现有的方法主要使用标准损失函数,如均方差损失,而不是对抗损失函数。类似地,对结果的评估仍然聚焦于基于向量范数的指标,如 PSNR 和结构相似性(Structural Similarity,SSIM)指标。与 SISR 相比,VSR 的主要难点在于如何获取清晰的结果,且不会出现不自然的伪影。基于均方差损失,近期的 VSR 任务使用来自低分辨率输入的多个帧 [13],或重用之前生成的结果 [28] 来改进时间连贯度。

尽管对抗训练可以改善单个图像的视觉质量,但它并不常用于视频。在视频序列案例中,我们不仅要研究任意的自然细节,还要研究可以稳定形式基于较长图像序列生成的细节。

该研究首次提出了一种对抗和循环训练方法,以监督空间高频细节和时间关系。在没有真值动态的情况下,时空对抗损失和循环结构可使该模型生成照片级真实度的细节,同时使帧与帧之间的生成结构保持连贯。研究者还发现了一种使用对抗损失的循环架构可能会出现的新型模型崩溃,并提出了一种双向损失函数用于移除对应的伪影。

该研究的核心贡献包括:

  • 提出首个时空判别器,以获得逼真和连贯的视频超分辨率;
  • 提出新型 Ping-Pong 损失,以解决循环伪影;
  • 从空间细节和时间连贯度方面进行详细的评估;
  • 提出新型评估指标,基于动态估计和感知距离来量化时间连贯度。

论文:Temporally Coherent GANs for Video Super-Resolution (TecoGAN)

免费视频高清修复清晰软件(视频格式转换大师破解版)

论文链接:
https://arxiv.org/pdf/1811.09393.pdf

摘要:对抗训练在单图像超分辨率任务中非常成功,因为它可以获得逼真、高度细致的输出结果。因此,当前最优的视频超分辨率方法仍然支持较简单的范数(如 L2)作为对抗损失函数。直接向量范数作损失函数求平均的本质可以轻松带来时间流畅度和连贯度,但生成图像缺乏空间细节。该研究提出了一种用于视频超分辨率的对抗训练方法,可以使分辨率具备时间连贯度,同时不会损失空间细节。

该研究聚焦于新型损失的形成,并基于已构建的生成器框架展示了其性能。研究者证明时间对抗学习是获得照片级真实度和时间连贯细节的关键。除了时空判别器以外,研究者还提出新型损失函数 Ping-Pong,该函数可以有效移除循环网络中的时间伪影,且不会降低视觉质量。之前的研究并未解决量化视频超分辨率任务中时间连贯度的问题。该研究提出了一组指标来评估准确率和随时间变化的视觉质量。用户调研结果与这些指标判断的结果一致。总之,该方法优于之前的研究,它能够得到更加细节化的图像,同时时间变化更加自然。

模型方法

该研究提出的 VSR 架构包含三个组件:循环生成器、流估计网络和时空判别器。生成器 G 基于低分辨率输入循环地生成高分辨率视频帧。流估计网络 F 学习帧与帧之间的动态补偿,以帮助生成器和时空判别器 D_s,t。

训练过程中,生成器和流估计器一起训练,以欺骗时空判别器 D_s,t。该判别器是核心组件,因为它既考虑空间因素又考虑时间因素,并对存在不现实的时间不连贯性的结果进行惩罚。这样,就需要 G 来生成与之前帧连续的高频细节。训练完成后,D_s,t 的额外复杂度不会有什么影响,除非需要 G 和 F 的训练模型来推断新的超分辨率视频输出。免费视频高清修复清晰软件(视频格式转换大师破解版)

图1免费视频高清修复清晰软件(视频格式转换大师破解版)

图 2

图 2:具备动态补偿(motion compensation)的循环生成器。

该研究提出的判别器结构如图 3 所示。它接收了两组输入:真值和生成结果。免费视频高清修复清晰软件(视频格式转换大师破解版)

图 3

图 3:时空判别器的输入。

损失函数

为了移除不想要的细节长期漂移,研究者提出一种新型损失函数「Ping-Pong」(PP) 损失。免费视频高清修复清晰软件(视频格式转换大师破解版)

图 4

图 4:a)不使用 PP 损失训练出的结果。b)使用 PP 损失训练出的结果。后者成功移除了漂移伪影(drifting artifact)。

如图 4b 所示,PP 损失成功移除了漂移伪影,同时保留了适当的高频细节。此外,这种损失结构可以有效增加训练数据集的规模,是一种有用的数据增强方式。

该研究使用具备 ping-pong ordering 的扩展序列来训练网络,如图 5 所示。即最终附加了逆转版本,该版本将两个「leg」的生成输出保持一致。PP 损失的公式如下所示:

免费视频高清修复清晰软件(视频格式转换大师破解版)

免费视频高清修复清晰软件(视频格式转换大师破解版)

图 5

图 5:使用该研究提出的 Ping-Pong 损失,g_t 和

免费视频高清修复清晰软件(视频格式转换大师破解版)

之间的 L_2 距离得到最小化,以移除漂移伪影、改进时间连贯度。

实验结果

研究者通过控制变量研究说明了 L_(G,F) 中单个损失项的效果。免费视频高清修复清晰软件(视频格式转换大师破解版)

图 6

图 6:树叶场景对比。对抗模型(ENet、DsOnly、DsDt、DsDtPP、

免费视频高清修复清晰软件(视频格式转换大师破解版)

和 TecoGAN)比使用 L_2 损失训练的方法(FRVSR 和 DUF)具备更好的视觉效果。右图「temporal profiles」中,DsDt、DsDtPP 和 TecoGAN 在时间连续性上显著优于 ENet 和 DsOnly。本文提出的判别器网络的时间信息成功抑制了这些伪影

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 55@qq.com 举报,一经查实,本站将立刻删除。转转请注明出处:https://www.szhjjp.com/n/59796.html

(0)
nan
上一篇 2021-12-09
下一篇 2021-12-09

相关推荐

  • 苹果8plus进刷机模式方法(苹果8进入dfu模式教程)

    iPhoneX发售之后,什么问题都迎刃而解了。比如面部识别准确吗?没有home键能习惯吗?那你知道iPhoneX怎么进DFU模式吗?DFU模式一般是手机出现系统级问题(比如白苹果)或者降级的时候才使用,很多人都不知道DFU模式。不管是什么

    2021-11-12
    0
  • 表格误保存还原方法(excel保存后如何恢复)

    刚编辑好的Excel文档一不小心没有保存,然后就将它关闭了,这时我们该如何恢复呢?这个一不小心一般指电脑突然死机等非人为正常操作导致的文档未保存就被关闭了,当我们再次打开刚刚那个被关闭的文档时,我们会悲催地发现我们刚刚编辑的内容已经不存在

    2021-11-29 创业分享
    0
  • 张丞相好草书文言文翻译及注释(张丞相好草书文言文翻译)

    原文张丞相①好草书而不工②,当日流辈③皆讥笑之,丞相自若也。一日得句,索笔疾书,满纸龙蛇飞动。使其侄录之,当波险处④,侄罔然⑤而止,执所书问曰:“此何字?”丞相熟视⑥久之,亦自不识,诟⑦其侄曰:“胡⑧不早来问?致吾忘之。”注释张丞

    2021-11-22 创业分享
    0
  • 产品营销推广的方法大全(产品营销推广怎样做?)

    我有一位朋友,他们推出了一个新型的母婴电商平台,经过了缜密的调研、刻苦的研发,终于新产品要上市了,他们寄希望这个产品是改变市场格局、引领消费者生活的新物种。但是产品上市后,当初的雄心壮志受到了消费者无情的打压。大凡经过了几次新产品推广的,

    2021-12-03
    0
  • 头条号赚钱太难了(今日头条1w点击量收入)

    新手做自媒体最大的问题就是拍着拍着就不知道拍什么了,没有灵感,没有素材来源,不知道如何选题,如果你有这样的烦恼,那你按我接下来说的这4种方法去做,每天都会有源源不断的素材。不要说每天发一个,你每天发三个都发不完,有的朋友睡觉也在想拍什么

    2021-11-23 创业分享
    0
  • 零基础初学者学习编程语言(自学编程入门自学教程)

    程序员需要掌握一门语言还是多门语言?对于这个问题,大众说是对的,老太太说是对的。技术更新太快,掌握一门编程语言不容易,怎么敢说自己精通多门语言?然而,当你精通一门语言时,涉猎其他语言是无害的。这也有利于编程思想。每种设计语言都有自

    2021-12-03 创业分享
    0

发表回复

登录后才能评论