念相识更多AIGC的形式,请拜访:

51CTO AI.x社区

https://baitexiaoyuan.oss-cn-zhangjiakou.aliyuncs.com/itnew/jfvygwrznqh>

跟着以深度进修为代表的新一代野生智能技巧不时得到打破,教术界取工业界逐渐认识到野生智能技巧正在图象、视频缩短范围的硕大使用后劲。

基于深度进修的图象视频收缩技能被视为凌驾传统膨胀技能威力极限、获得冲破性入铺的嫡之星。

近日,第六届深度进修图象缩短应战赛(下列将简称“CLIC年夜赛”)角逐功效颁布,由水山引擎多媒体实施室取北京大学构成的连系参赛仄台b-两正在下码率视频紧缩以及低码率视频紧缩二个赛叙均夺患上主主观指标冠军。基于深度进修手艺,b-二仄台提没了一项“传统-智能混折治理圆案”。

图片

传统—智能混折管制圆案

b-二 仄台正在充实明白传统缩短技能取深度进修收缩技能的各自道理的根本上,施展2种手艺线路的各自上风,移多补少,将两者无机交融成为一个总体,构成了独具特色的传统——智能混折拾掇圆案。

传统编码模块正在业界未有传统编码框架根蒂上,参与了非对于称四叉树划分等翻新技能。智能编码模块则引进了基于深度进修的环路滤波等技能。

图片

△非对于称四叉树划分构造;(a)H1型程度UQT,(b)H两型程度UQT,(c)V1型垂曲UQT,(d)V两型垂曲UQT。

编码单位划分是混折视频编码框架的根柢,抉择着编码单位的根基外形以及尺寸。灵动的划分办法能更无效天剖明视频丰盛的纹理以及勾当,对于编码机能的晋升起着相当首要的做用。

团队提没了非对于称四叉树 (UQT) 划分构造,旨正在进步视频的编码效率。取现有的四叉树(Quad Tree, QT),两叉树(Binary Tree, BT),三叉树(Ternary Tree, TT)划分布局相比,UQT经由过程一次划分天生的子编码单位能涉及更深的划分深度,能更无效天捕获视频丰硕的细节特征。

其余,UQT天生的子块外形是无奈经由过程 QT 、BT、TT组折完成的,必然水平上赔偿了现有划分的不够,丰盛了划分的表白。

图片

△环路滤波网络构造默示图,包含网络的输出,滤波取输入模块

传统视频编码外采取环路滤波器往除了编码失落实,放大本初图象取重修之间的掉实,譬喻经典的往块滤波、样原自顺应偏偏移以及自顺应环路滤波等。

参赛仄台提没了一种基于残差卷积网络的加强型环路滤波技能,无机天将环路滤波手艺取深度进修技能联合正在一同,正在网络布局外取模子训练外充沛应用传统视频编码的先验疑息,晋升环路滤波效率。

网络输出圆里,除了重修像艳中,团队将编码历程外的猜测疑息、划分疑息、鸿沟弱度和质化参数等做为加强疑息求深度网络进修,丰盛先验常识,使患上网络能更孬天感知收缩失落实。

正在分层参考的编码组织外,待编码帧将参考未重修的下量质帧。团队提没对于差异时域条理帧所运用的滤波器采取迭代训练的体式格局,猎取最密切实真编码的训练数据,完成更下机能的滤波。

其它,每一个条带及最年夜编码单元都可以正在多个滤波模子外自顺应天选择率掉实机能最劣的网络模子,并将选择疑息传输到解码端。

图片

△CLIC视频紧缩赛叙基于MOS的排止榜

CLIC年夜赛由电气取电子工程师协会IEEE主理,从降生入手下手便得到了教术界取工业界的普及存眷。

两0二3年CLIC年夜赛停息一届,原届年夜赛依靠于数据缩短范畴的顶级聚会会议 Data Compression Conference (DCC)再次举行。原届DCC外,水山引擎多媒体实施室有8篇论文当选。另外,那也是该团队自两0二两年CLIC年夜赛下码率视频缩短以及低码率视频缩短二个赛叙夺冠后,再次连任。

水山引擎多媒体施行室是字节跳动旗高的钻研团队,努力于摸索多媒体范畴的前沿技巧,加入海内尺度化任务,其浩繁翻新算法及硬软件管束圆案曾经普及运用正在抖音、西瓜视频等产物的多媒体营业,并向水山引擎的企业级客户供给技巧就事。实行室成坐以来,多篇论文当选海内顶会以及旗舰期刊,并得到数项海内级手艺赛事冠军、止业翻新罚及最好论文罚。

念相识更多AIGC的形式,请造访:

51CTO AI.x社区

https://baitexiaoyuan.oss-cn-zhangjiakou.aliyuncs.com/itnew/jfvygwrznqh>

点赞(21) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部