视频技术科研路 不忘初心砥砺行

栏目:娱乐资讯  时间:2023-05-07
手机版

  ——记山东大学控制科学与工程学院元辉教授

  进入21世纪以来,我国的通信技术开始步入飞速发展的时代,从2G到5G,从电脑上网到智能手机的普及,多媒体的发展经历了文字—图片—视频的发展路径,现在,视频占互联网流量接近80%。随着5G技术的成熟及沉浸式媒体的发展,视觉媒体占比更是持续增长,信号的采集、编码、传输、显示等关键技术的发展对于视觉媒体的应用尤为重要。

  山东大学控制科学与工程学院元辉教授,一直从事三维视觉媒体的高效编码、智能处理、可靠传输等研究工作,在图像/视频/沉浸式媒体/大数据的高效压缩、智能处理,尤其是3D视频的编码与处理等方面取得了一系列研究成果,并在企业实际应用中取得了良好的经济效益,为更快实现科技强国梦贡献自己的科研力量。

  踏上科研路 创新结硕果

  法国作家阿纳托尔·法朗士曾说过“好奇心造就科学家和诗人”,兴趣正是人生最好的老师,人只要对某件事有兴趣,就能有斗志有激情学习,而对于元辉来说,他的梦想就是做科研,用科技改变人类的生活。2011年3月获得西安电子科技大学博士学位,2011年4月加入山东大学,此后便对多媒体通信、视频编解码与处理展开了研究。

  元辉主要研究三维视觉媒体的编码、处理和传输。三维视觉媒体作为自动驾驶、AR/VR等应用的核心数据,从业以来,始终脚踏实地、勤奋科研,同时,又以开拓创新的精神在科研上攻坚克难,取得了多项研究成果。

  作为项目负责人,元辉主持科研课题20余项,其中国家级项目5项。此外,他还向国际、国内标准化组织(MPEG、AVS)提出30余项提案,5项技术被MPEG国际标准采纳,促进了科研的发展。截至目前,元辉发表论文100余篇,其中SCI收录60余篇,并发明了“一种应用于2个视点视频编码的视点间比特分配方法”“一种应用于三维视频系统的虚拟视图质量估计方法”等多项专利。

  元辉提出了基于模型的纹理视频与深度图联合码率分配算法,首次确定了虚拟视图的均方差与纹理视频和深度图的编码参数之间的解析关系;他提出的算法只要经过简单计算就能实现最优的纹理视频与深度图的码率分配,这使计算复杂度大大降低。

  元辉提出了虚拟视图质量的维纳滤波方法,证明了虚拟视图中的编码失真表现为零均值的平稳白噪声,提出采用维纳滤波器消除虚拟视图中的编码噪声和一种可行的3DV广播系统结构,从而得到最终的虚拟视图。元辉提出应用于深度图编码的拉格朗日因子计算方法及失真度准则和基于深度图绝对编码误差的4阶多项式模型,根据该模型提出面向虚拟视图的拉格朗日乘数子,在深度图的率失真优化编码方面得到有效的应用。元辉还提出了基于运动模型的纹理视频编码—运动向量预测技术。该理论成果提高了3DV的压缩性能和解码端3DV的质量。

  在应用成果转化方面,元辉为某公司开发了全自动2D视频到3D视频的转换算法,并获得应用 (相关芯片出货量超200万片);开发了基于双目立体视频的实时公交客流统计算法,在某公司获得应用;2019年为东营盛源电器科技有限公司开发多路实时视频转码服务器,凭借该技术获得第九届中国创新创业大赛(山东赛区)优胜企业并晋级全国总决赛。

  科研报社会 未来更美好

  图像视频编码研究视觉信号在率失真准则下的最优表示,是可视媒体计算、存储、传输的核心,已成为数字媒体通信、公共安防等国家重大应用的共性基础,也是工信部、国家广播电视总局、中央广播电视总台联合印发的《超高清视频产业发展行动计划》中提出的核心任务之一。

  据元辉介绍,传统单目视频无法体验到真实的三维场景,而三维视频则可以为用户提供“身临其境”的视觉感知,是虚拟/增强现实的内容基础之一,数年来一直是人们追求的体验目标,也是科学界、工业界的研究热点。三维视频一般采用多视点色度和深度视频表示,用户可依据观看视角,采用虚拟视点合成技术构建任意视点的视频,由于虚拟视点视频质量较低,严重限制了三维视频的应用。在国际标准组织 MPEG(运动图像专家组)确定的三维视频编码工具范围内,如何突破虚拟视图质量的限制,揭示三维视频特有的率失真特性,解决三维视频的率失真优化编码问题,大幅度提高三维视频的编码效率,是长期困扰国内外学术届的难题。

  在国家自然科学基金委和山东省自然科学基金委等项目的支持下,元辉带领项目组开展“三维视频处理与通信关键技术研究”,历经长期深入的研究,揭示了三维视频的率失真特性,实现了虚拟视点视频的失真建模,开辟了三维视频优化编码的理论途径,对三维视频编码理论与方法作出了创造性贡献,促进了相关学科(图像处理、广播与电视工程技术、信息论、计算机图像处理)领域的发展。

  首先,元辉发现了虚拟视点视频的失真与色度、深度视频的均方编码误差(MSE)之间的关系,建立了三维视频的虚拟视图失真模型,首次用解析方法实现了色度、深度视频的最优化联合码率分配。相关成果被国际、国内多位著名学者、IEEE Fellow 大篇幅引用评述以及实验比较。他发现了虚拟视点视频失真与深度视频绝对编码误差(MAE)之间的关系,明确由编码导致的虚拟视图噪声(失真)表现为零均值的白噪声,并确定深度图率失真优化编码方法以及虚拟视图质量增强与估计方法。相关成果被国际、国内多位著名学者、IEEE Fellow、以及院士引用评述,并作为“基准方法”进行分析与比较。

  

  针对变焦运动物体特有的运动模型以及刚性运动物体的同构运动属性,元辉提出率失真最优的变焦运动补偿预测方法和 H.264/AVC 到 H.265/HEVC 视频编码标准的快速转换方法,有效提升了三维视频的编码效率。

  因在三维视频编码方面的卓越贡献,元辉2012 年入选人社部第二届“香江学者”计划;2016 年获得山东省自然科学杰出青年基金的资助以及山东省教育厅颁发的山东省高校优秀科研成果奖一等奖;2017 年被遴选为 IEEE 高级会员;2019年入选欧盟地平线2020 (Horizon 2020)“居里学者”计划,并赴英国De Montfort University从事研究工作。2020年7月,元辉获得IEEE ICME2020杰出领域主席奖(Outstanding Area Chair Award);2020年12月入选山东省“泰山学者”青年专家。

  元辉表示,对视觉媒体进行高效、规范的编码表示是需要解决的核心问题,国际标准制定过程中的缺位,严重制约着我国的视觉媒体产业的发展。视觉媒体编码基础理论、标准技术的研究是突破相关技术产业发展瓶颈、走向世界的必由之路。希望越来越多的科研人员走进该领域,也希望在该领域培养更多的优秀人才,为科技进步、社会发展作出应有的贡献。

  拥有一颗纯粹专注的内心,元辉深知只有沉下心来享受探索的过程,才能在科研的道路上走得更远,翻越科研道路上的一座座山丘。科研路漫漫,唯有砥砺行,元辉会继续在三维视觉媒体的编码、处理和传输方面研发更多更好的成果,并实现相关成果转化,解决一些能够满足行业(自动驾驶、VR/AR等)应用需求的基本科学问题,为国家和社会尽一份绵薄之力。

  原标题:《视频技术科研路 不忘初心砥砺行》

上一篇:男人一让你伤心就想放手?往这6点先找找为啥
下一篇:原创聊聊电影中打破“爱的诅咒”的人生哲理《真爱之吻》♀

最近更新娱乐资讯