首页 / 一种应用于H.264编码的亮度4×4块帧内预测模式快速选择方法

一种应用于H.264编码的亮度4×4块帧内预测模式快速选择方法失效专利 发明

技术领域

[0001] 本发明涉及一种帧内预测模式快速选择方法。

相关背景技术

[0002] 由于受到存储空间和传输带宽的限制,视频文件在进行存储和传输之前需要进行压缩编码。随时多媒体技术的发展,对于视频压缩编码算法的压缩效率要求也越来越高。H.264作为一种高性能的视频编码技术,由于其优越的视频压缩比率,使得该技术在数字视频通讯领域得到迅速的发展和应用。相比于MPEG-2和MPEG-4技术,H.264技术可以在同等图像质量下大大缩减传输和存储过程中的数据量,从而减少传输带宽和存储空间。
[0003] H.264通过帧内预测消除视频序列的帧内冗余,在进行帧内预测时H.264使用相邻像素预测当前块的像素,得到预测块,再对预测块和当前块的差值进行编码。H.264在进行视频序列的亮度分量预测时,使用4×4块和16×16块两种预测方式,其中4×4块包含9种预测模式,16×16块包含4种预测模式。为了提高压缩效率,H.264在进行帧内预测时,结合率失真优化代价函数,遍历所有的预测模式,从中选取最优的预测模式。这在提高编码压缩效率的同时,也使得编码的复杂度和运算量大幅度提高,增加了进行编码所需要的时间,限制了其在实时编码领域的应用。

具体实施方式

[0029] 具体实施方式一、一种应用于H.264编码的亮度4×4块帧内预测模式快速选择方法,它由以下步骤实现:
[0030] 步骤一、计算4×4块帧中9种预测模式的重要值,根据获得的9种预测模式的重要值生成9种预测模式的直方图;
[0031] 步骤二、在步骤一获得的9种预测模式的直方图中选取幅值最大的三种预测模式Mx、My和Mz,并将该三种预测模式的幅值标记为hist_Mx、hist_My和hist_Mz;其中(hist_Mx大于或等于hist_My;hist_My大于或等于hist_Mz);
[0032] 步骤三、判断幅值hist_Mx是否小于预设一号门限值,如果判断结果是为是,则执行步骤三一;如果判断结果为否,则执行步骤三二;如果判断结果否,则执行步骤三二;
[0033] 步骤三一、则采用H.264中的模式选择方法遍历4×4块帧内所有的预测模式,并结束4×4块帧内预测模式快速选择;
[0034] 步骤三二、计算步骤二中选取的三种预测模式的幅值的差值diff1和diff2,并执行步骤四;所述diff1=hist_Mx-hist_My;diff2=hist_My-hist_Mz;
[0035] 步骤四、判断步骤三二中的差值diff1是否大于预设二号门限值,如果判断结果为是,则选取预测模式Mx作为候选模式,完成4×4块帧内预测模式快速选择;如果判断结果为否,则执行步骤五;
[0036] 步骤五、判断步骤三二中的差值diff2是否大于预设二号门限值,如果判断结果为是,则选取预测模式Mx和预测模式My作为候选模式,完成4×4块帧内预测模式快速选择;如果判断结果为否,则选取预测模式Mx、预测模式My和预测模式Mz作为候选预测模式,完成4×4块帧内预测模式快速选择。
[0037] 步骤一中计算4×4块帧中9种预测模式的重要值的方法是:
[0038] 步骤一一、在4×4块帧中的每种预测模式中,采用相邻相素的加权和的方式对每个像素进行预测,获得每种预测模式的预测值;当前像素的预测值通过公式:
[0039] Y=(C1×P1+C2×P2+C3×P3+C4)/C5 (1)
[0040] 获得;
[0041] 步骤一二、在每种预测模式下,将当前像素和其相邻的预测像素值相加,获得每种预测模式的加权系数,即:
[0042] SumM0=4*A+4*B+4*C+4*D (2)
[0043] SumM1=4*I+4*J+4*K+4*L (3)
[0044] SumM2=2*(A+B+C+D+I+J+K+L) (4)
[0045]
[0046]
[0047]
[0048]
[0049]
[0050]
[0051] 步骤一三、选择步骤一二获得的九个加权系数中的较大的三个权值系数作为4×4块帧中9种预测模式的重要值。
[0052] 其中,各个预测模式的方向如图2所示;4×4块和相邻像素的关系如图1所示。
[0053] 为了方便观察,将上式各加权系数乘以4得到如表1所示的各预测模式下各相邻像素在预测块中的加权系数值。
[0054] 表1:
[0055]
[0056]
[0057] 表1中A至X为图1中的相邻像素值,M1至M8为图2中的预测模式。由表1可知在不同预测模式下,各相邻像素在整个预测块中具有不同的权值系数,并且某些权值比较大,这些具有较大权值系数的像素决定了整个预测块的预测值,而具有较小权值系数的像素对预测块的影响较小。
[0058] 例如在模式M6中相邻像素I,J,K和X的权值分别为16,15,14和9,而A,B,C和L权值为5,3,1和3。因此整个预测块的值主要是由I,J,K和X这四个相邻像素决定的。并且在真实的自然场景中,除某些物体边界外,空间上相邻像素大多数具有较相近的值。因此,可以得出如果M6作为最佳预测模式的话,其当前块中的大部分像素应该分布在相邻像素I,J,K和X附近。为了进一步简化,用(I+X)/2和(J+K)/2代替I,J,K和X。将(I+X)/2和(J+K)/2定义为M6预测模式的重要值,即如果M6作为最佳预测模式,则当前块的大多数像素应该分布在其重要值附近。其余预测模式的重要值如表2所示。
[0059] 表2:
[0060]预测模式 重要值
M0 A,B,C,D
M1 I,J,K,L
M2 (A+B+C+D+I+J+K+J)/8
M3 (C+D)/2, (E+F)/2
M4 (M+A)/2, (I+J)/2,
M5 (A+M)/2, (B+C)/2
M6 (I+M)/2, (J+K)/2
M7 (B+C)/2, (D+E)/2
M8 (J+K)/2, L
[0061]
[0062] 使用直方图描述上述当前像素和重要值的分布特性,各预测模式基于当前像素分布的直方图计算方法如公式(11)所示:
[0063] For(j=0;j<=15;j++){
[0064] If(|pixelj-significant valueMi|≤12)
[0065] histogram(Mi)=histogram(Mi)+1;} (11)[0066] 上式中Mi为预测模式,其中i=0,1,2...8;pixelj为当前像素值,significant valueMi为表2中各预测模式的重要值。图4为一个4×4块各预测模式的直方图,图中模式M1和M8具有较大的幅值,说明当前像素在模式M1和M8时较多的分布在其重要值附近,因此预测模式M1和M8最有可能成为最佳预测模式,据此将M1和M8作为候选模式计算率失真代价函数,跳过其他的6种预测模式。

当前第1页 第1页 第2页 第3页
相关技术
应用编码相关技术
快速选择相关技术
王进祥发明人的其他相关专利技术