月之影面_第四十四章 超级视频压缩 首页

字体:      护眼 关灯

上一页 目录 下一章

   第四十四章 超级视频压缩 (第2/2页)

间模型,才能解释神经网络内部的压缩机制”。

    王一男正有一搭没一搭的想着呢,“哔哔”的蜂鸣声又响了起来,看了看时间,解压缩的时间还不到十秒,这也是正常的,任何压缩算法理论上都会比解压缩算法耗费时间。

    不过这个时间的比例也超乎王一男的意料,因为按照H264或者H265的经验来看,压缩所需要的计算能力至少是解压缩的十倍以上,也就是说,在同样的硬件下,如果是和H264、H265类似的算法,解压缩的时间应该在两秒左右。

    “看来哥德尔系统的压缩算法跟现有体系完全不同,不过,在这个领域跟围棋一样,机器也已经远远超过人了,至少,人设想的最好算法比神经网络差了五倍以上”,

    “只不过,人类永远也无法理解哥德尔系统的算法啊”,王一男感慨了一番,

    “理解不了没关系,能复制就行了,我真的是个天才,居然想到功能复制这一招,就是不知道米歌的狗狗让不让人去复制一把”。

    高兴归高兴,王一男还是没忘记最后一步,他让哥德尔系统按照每秒三十帧的速度在屏幕上回放解压缩出来的图像序列,王一男抽几段看了一会,至少rou眼看不出来跟原始的片源有什么差别。

    不过光主观感受没用,还是需要数据说话,王一男运行了一个开源的PSNR评价程序,也就是对原始图像和压缩/解压缩之后的图像,比较峰值信噪比,但是让王一男意外的事情发生了,

    峰值信噪比的差异非常大,也就说是,评价程序认为前后两幅图像的差异非常大,甚至比H265降低一倍码率之后压缩成H264的差异还要大。

    但是这和王一男的主观感受是完全相反的,王一男也看过降低一半码率的H264视频,那整个画面的质量下降非常明显,什么模糊、毛刺都出现了,但是现在的视频流,王一男感觉不到图像有任何生硬的地方。

    问题出在哪里呢,应该说,王一男对自己的眼力还是有很强信心的,要知道,当年看波多女士的片子,王一男可是连码率500K还是码率550K压制都能分的出来。

    看起来,问题只可能出在PSNR算法了,因为图像主观上如果有一些结构的小变化,或者整体的位移等等,是不会影响视频的整体主观感觉的,但是PSNR看起来,误差就非常大了。

    王一男立刻查阅了相关文献,果然,网上对PSNR算法的吐槽声一片,在开源的机器视觉网站,王一男找到了最新的复小波结构相似性指标算法,从多方文献来看,这应该是和主观性评测符合的最好的机器视觉检测指标了。

    王一男下载了最新的复小波结构相似性指标算法代码,重新对解压缩之后的图像序列进行了评估,

    结果也不出预料,整体的差异性指标非常低,甚至可以忽略,这和王一男的主观感觉也是一致的。

    王一男跑到洗手间,用冷水好好冲了把脸,才让激动的情绪稍微平复了一些,在1M的ADSL线路上观看1080P的高清视频,或者,在普通的10M,20M家用光纤宽带条件下,观看立体加上全景三百六十度的实时直播,这意味着什么?

    这不仅仅是视频压缩技术的突破,甚至有可能带来整个视频娱乐行业的变革!

    现在只剩下唯一的一个问题了,编译神经网络到LLVM的IR代码是不是可行,还有,LLVM的IR代码所生成的X86或者ARM指令,能达到什么样的性能水平?

    达到哥德尔系统这样的程度就不用想了,如果达到实时解压缩,就是解压缩的速度跟得上网络传输的速度,那就不得了了,

    如果不小心达到实时压缩,就是压缩的速度跟得上实际画面的速度,那就是不得了的平方了!

    王一男好好睡了一觉,然后把自己收拾整齐,去找周慧吃了顿大餐,嗯,据说盘古八星的自助餐不错,还能看到我大帝都的景色,虽然王一男对太阳国的料理不怎么感兴趣,还是去美美的吃了一顿。

    接下来,王一男再次开始了闭关,算法的性能得到证实之后,动力也完全不一样了,神经网络编译系统,这种大杀器,想想都让人兴奋。

    编译出来的代码,能运行起来吗?

    庞大的神经网络,能够压缩到普通PC或者手机的存储器里面吗?

    运行起来的代码,效率足够吗,能达到实时解压缩,还是实时压缩呢?

    或者,所有想法都太乐观,压根慢的像蜗牛一样?

加入书签 我的书架

上一页 目录 下一章