本申请是申请号为201580014981.8、申请日为2015年3月20日、发明名称为“用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置”的发明专利申请的分案申请。
本发明涉及一种用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置。
背景技术:
高阶高保真立体声(hoa)提供了表示三维声音的可能性。其他已知的技术是波场合成(wfs)或基于通道的方法(比如22.2)。然而,与基于通道的方法相反,hoa表示提供了独立于特定扩音器设置的优点。然而,该灵活性是以hoa表示在特定扩音器设置上的回放需要解码处理为代价的。与所需扩音器的数量通常非常大的wfs方法相比,hoa也可以被渲染到仅由少量扩音器组成的设置。hoa的进一步的优点是,相同的表示也可以被没有任何修正地用于对于耳机的双耳渲染。
hoa是基于通过截断球谐函数(sh)展开得出的复谐波平面波振幅的所谓空间密度的表示。每个展开系数是角频率的函数,其可以等同地用时域函数表示。因此,不失一般性地,整个hoa声场表示实际上可以被假定为由o个时域函数组成,其中,o表示展开系数的数量。在下面,这些时域函数将被等同地称为hoa系数序列或hoa通道。通常,使用球坐标系,在球坐标系中,x轴指向前向的位置,y轴指向左边,z轴指向顶部。空间x=(r,θ,φ)t中的位置用半径r>0(即,到坐标原点的距离)、从极轴z测量的倾角θ∈[0,π]、以及在x-y平面中从x轴逆时针测量的方位角φ∈[0,2π[表示。此外,(·)t表示转置。
下面提供hoa编码的更详细的描述。
用
这里,cs表示声音的速度,k表示通过
其中,展开系数
假定各个系数
这些时域函数可以通过
c(k):=[c((kb 1)ts)c((kb 2)ts)...c((kb b)ts)],
其中,ts表示采样周期。帧c(k)本身于是可以如下地表示为其各个行ci(k),i=1,...,0的复合(composition):
其中,ci(k)表示高保真立体声系数序列的位置索引为i的帧。hoa表示的空间分辨率随着展开的最大阶次n增长而改进。不幸的是,展开系数的数量o随着阶次n二次方地增长,具体为o=(n 1)2.。例如,典型的使用阶次n=4的hoa表示需要o=25个hoa(展开)系数。根据这些考虑,给定期望的单通道采样速率fs和每个采样的位数nb,用于传输hoa表示的总位速率由o·fs·nb确定。因此,每个采样利用nb=16个位、以fs=48khz的采样速率传输阶次n=4的hoa表示导致19.2mbits/s的位速率,该位速率对于许多实际的应用(例如流传输)是非常高的。因此,hoa表示的压缩是非常希望的。
以前,hoa声场表示的压缩在欧洲专利申请ep2743922a、ep2665208a和ep2800401a中被提出过。这些方法的共同之处是,它们执行声场分析,并且将给定的hoa表示分解为方向分量和残差环境分量。
最终的压缩的表示被假定为一方面,包括若干个由方向信号的感知编码得到的量化信号以及环境hoa分量的相关系数序列。另一方面,它被假定为包括与量化信号相关的附加副信息,该副信息对于从hoa表示的压缩版本重构hoa表示是必需的。
此外,类似的方法在iso/iecjtc1/sc29/wg11n14264(workingdraft1-hoatextofmpeg-h3daudio,2014年1月,sanjose)中有描述,其中,方向分量扩展为所谓的主导声音分量。作为方向分量,主导声音分量被假定为部分地用方向信号(即,具有对应方向的单耳信号,这些单耳信号被假定为从该方向传到收听者)、连同用于从方向信号预测原始hoa表示的各部分的一些预测参数来表示。
另外,主导声音分量被假设为用所谓的基于矢量的信号来表示,基于矢量的信号意指具有对应矢量的单耳信号,该矢量限定基于矢量的信号的方向分布。已知的压缩的hoa表示由i个量化的单耳信号和某些附加的副信息构成,其中,这些i个量化的单耳信号中的固定数量omin个单耳信号表示环境hoa分量camb(k-2).的前omin个系数序列的空间变换版本。其余的i-omin个信号的类型在连续的帧之间可以有所变化,并且可以是方向的、基于矢量的、空的、或者表示环境hoa分量camb(k-2)的附加系数序列。
用于压缩具有hoa系数序列的输入时间帧(c(k))的hoa信号表示的已知方法包括对输入时间帧进行空间hoa编码、随后进行感知编码和源编码。如图1a)所示的空间hoa编码包括在方向和矢量估计模块101中执行hoa信号的方向和矢量估计处理,其中,包括关于方向信号的第一元组集合
如图1b)所示,感知编码和源编码包括:对增益修正的输送信号zi(k-2)进行感知编码,其中,感知编码的输送信号
技术实现要素:
提议的hoa压缩方法的一个缺点是它提供整体式的(即,不可缩放的)压缩的hoa表示。然而,对于某些应用,比如广播或互联网流传输,可取的是能够将压缩的表示划分为低质量基本层(bl)和高质量增强层(el)。基本层被假设为提供hoa表示的低质量压缩版本,该版本可以被独立于增强层进行解码。这样的bl对传输误差通常应是高度鲁棒的,并且应被以低数据速率传输以便即使在不良传输状况下也保证解压缩的hoa表示的某个最低质量。el包含改进解压缩的hoa表示的质量的附加信息。
本发明提供一种用于修改现有的hoa压缩方法以便能够提供包括(低质量)基本层和(高质量)增强层的压缩表示的解决方案。此外,本发明提供一种用于修改现有的hoa解压缩方法以便能够对根据本发明压缩的至少包括低质量基本层的压缩表示进行解码的解决方案。
一个改进涉及获得自含的(低质量)基本层。根据本发明,被假设为包含环境hoa分量camb(k-2)的(不失一般性的)前omin个系数序列的空间变换版本的omin个通道被用作基本层。选择前omin个通道形成基本层的优点是它们的时不变类型。然而,照惯例,各个信号缺少声音场景必需的任何主导声音分量。这从环境hoa分量camb(k-1)的常规计算也是清楚的,环境hoa分量camb(k-1)的常规计算是通过根据下式从原始hoa表示c(k-1)减去主导声音hoa表示cps(k-1)来进行的:
camb(k-1)=c(k-1)-cps(k-1)(1)
因此,本发明的一个改进涉及这样的主导声音分量的添加。根据本发明,该问题的解决方案是将低空间分辨率的主导声音分量包括到基本层中。为了这个目的,通过根据本发明的空间hoa编码器中的hoa分解处理输出的环境hoa分量camb(k-1)被其修正版本取代。修正的环境hoa分量将原始hoa分量的系数序列包括在被假设总是以空间变换形式传输的前omin个系数序列中。hoa分解处理的这个改进可以被看作使hoa压缩在分层模式(例如双层模式)下工作的初始操作。该模式提供例如两个位流、或者可以被划分为基本层和增强层的单个位流。使用或者不使用该模式是由总位流的访问单元中的模式指示位(例如,单个位)来信号告知的。
在一个实施例中,基本层位流
用于压缩具有高阶高保真立体声(hoa)系数序列的时间帧的hoa信号表示的方法在权利要求1中公开。用于压缩具有高阶高保真立体声(hoa)系数序列的时间帧的hoa信号表示的装置在权利要求3中公开。
用于解压缩具有高阶高保真立体声(hoa)系数序列的时间帧的hoa信号表示的方法在权利要求2中公开。用于解压缩具有高阶高保真立体声(hoa)系数序列的时间帧的hoa信号表示的装置在权利要求4中公开。
具有使计算机执行用于压缩具有高阶高保真立体声(hoa)系数序列的时间帧的hoa信号表示的方法的可执行指令的非暂时性计算机可读存储介质在权利要求5中公开。
具有使计算机执行用于解压缩具有高阶高保真立体声(hoa)系数序列的时间帧的hoa信号表示的方法的可执行指令的非暂时性计算机可读存储介质在权利要求6中公开。
本发明的有利的实施例在从属权利要求、下面的描述和附图中公开。
附图说明
参照附图描述本发明的示例性实施例,附图在以下图中示出了:
图1hoa压缩器的常规架构的结构;
图2hoa解压缩器的常规架构的结构;
图3根据本发明的一个实施例的hoa压缩器的空间hoa编码和感知编码部分的架构的结构;
图4根据本发明的一个实施例的hoa压缩器的源编码器部分的架构的结构;
图5根据本发明的一个实施例的hoa解压缩器的感知解码和源解码部分的架构的结构;
图6根据本发明的一个实施例的hoa解压缩器的空间hoa解码部分的架构的结构;
图7从环境hoa信号到修正的环境hoa信号的帧变换;
图8用于压缩hoa信号的方法的流程图;
图9用于解压缩压缩的hoa信号的方法的流程图;以及
图10根据本发明的一个实施例的hoa解压缩器的空间hoa解码部分的架构的各部分的细节。
具体实施方式
为了更易于理解,下面概括了图1和图2中的现有技术的解决方案。
图1示出了hoa压缩器的常规架构的结构。在[4]中描述的方法中,方向分量扩展为所谓的主导声音分量。作为方向分量,主导声音分量被假定为部分地用方向信号(指的是具有对应方向的单耳信号,这些单耳信号被假定为从该方向传到收听者)、连同用于从方向信号预测原始hoa表示的各部分的一些预测参数来表示。另外,主导声音分量被假设为用所谓的基于矢量的信号来表示,基于矢量的信号意指具有对应矢量的单耳信号,该矢量限定了基于矢量的信号的方向分布。[4]中提议的hoa压缩器的总体架构在图1中示出。它可以被再分为图1a中描绘的空间hoa编码部分与图1b中描绘的感知和源编码部分。空间hoa编码器提供第一压缩hoa表示,该第一压缩hoa表示由i个信号连同描述如何创建其hoa表示的副信息构成。在感知和副信息源编码器中,对所提及的i个信号进行感知编码,并且对副信息进行源编码,之后对该两个编码的表示进行复用。
照惯例,空间编码如下工作。
在第一步中,原始hoa表示的第k帧c(k)输入到方向和矢量估计处理模块,该模块提供元组集合
通过使用这两个元组集合
在环境分量修正处理模块中,根据目标分配矢量va,t(k-1)提供的信息修正环境hoa分量的帧camb(k-1)。特别地,确定环境hoa分量的哪些系数序列将在给定的i个通道中传输,这尤其取决于关于哪些通道是可用的、但尚未被主导声音信号占据的信息(该信息包含在目标分配矢量va,t(k-1)中)。另外,如果被选系数序列的索引在连续的帧之间变化,则系数序列的淡入或淡出被执行。
此外,假定环境hoa分量camb(k-2)的前omin个系数序列总是被选择被进行感知编码并且被传输,其中,omin=(nmin 1)2,nmin≤n通常是比原始hoa表示的阶次小的阶次。为了使这些hoa系数序列去相关,提出了将它们变换为从一些预定义方向ωmin,d,d=1,...,omin传来的方向信号(即,一般平面波函数)。连同修正的环境hoa分量cm,a(k-1)一起,时间预测的修正的环境hoa分量cp,m,a(k-1)被计算以供以后用在增益控制处理模块中以便允许有合理的前瞻。
关于环境oha分量的修正的信息与所有可能的类型的信号对于可用通道的分配直接相关。关于分配的最终信息包含在最终的分配矢量va(k-2)中。为了计算该矢量,利用目标分配矢量va,t(k-1)中所包含的信息。
通道分配使用分配矢量va(k-2)提供的信息将xps(k-2)中所包含的和cm,a(k-2)中所包含的适当信号分配给i个可用通道,得到信号yi(k-2),i=1,...,i。此外,xps(k-1)中所包含的和cp,amb(k-1)中所包含的适当信号也被分配给i个可用通道,得到预测信号yp,i(k-2),i=1,...,i。信号yi(k-2),i=1,...,i中的每个最后均被增益控制进行处理,其中,信号增益被平滑地修正以实现适合于感知编码器的值范围。预测信号帧yp,i(k-2),i=1,...,i允许有一种前瞻以便避免连续的块之间的严重的增益变化。增益修正被假定在空间解码器中通过增益控制副信息被恢复,增益控制副信息由指数ei(k-2)和异常标志βi(k-2),i=1,...,i构成。
图2示出了如[4]中提出的hoa解压缩器的常规架构的结构。照惯例,hoa解压缩由hoa压缩器组件的对应物构成,这些对应物显然按相反次序布置。它可以被再分为图2a)中描绘的感知和源解码部分与图2b)中描绘的空间hoa解码部分。
在感知和副信息源解码器中,位流首先被解复用为i个信号的感知编码的表示以及编码的副信息,该副信息描述如何创建其hoa表示。相继地,执行所述i个信号的感知解码和副信息的解码。然后,空间hoa解码器从所述i个信号和副信息创建重构的hoa表示。
照惯例,空间hoa解码如下工作。
在空间hoa解码器中,感知解码的信号
所有的i个增益校正的信号帧
在主导声音合成中,使用元组集合
在环境合成中,使用环境hoa分量的在第k帧中起作用的系数序列的索引集合
从以上hoa压缩和解压缩方法的粗略描述已经变得清楚的是,压缩的表示由i个量化的单耳信号和某些附加的副信息构成。这些i个量化的单耳信号中的固定数量omin个单耳信号表示环境hoa分量camb(k-2)的前omin个系数序列的空间变换版本。其余的i-omin个信号的类型可在连续的帧之间变化,是方向的、基于矢量的、空的、或者表示环境hoa分量camb(k-2)的附加系数序列。照其原样来看,压缩的hoa表示意在于是整体式的。具体地说,一个问题是如何将所描述的表示划分为低质量基本层和增强层。
根据公开的本发明,低质量基本层的候选是包含环境hoa分量camb(k-2)的前omin个系数序列的空间变换版本的omin个通道。使这些(不失一般性地,前)omin个通道成为形成低质量基本层的良好选择的是它们的时不变类型。然而,相应的信号缺少声音场景必需的任何主导声音分量。这从环境hoa分量camb(k-1)的常规计算也可以看出,环境hoa分量camb(k-1)的常规计算是通过根据下式从原始hoa表示c(k-1)减去主导声音hoa表示cps(k-1)来进行的:
camb(k-1)=c(k-1)-cps(k-1)(1)
该问题的解决方案是将低空间分辨率的主导声音分量包括到基本层中。
下面描述提出的对于hoa压缩的修改。
图3示出了根据本发明的一个实施例的hoa压缩器的空间hoa编码和感知编码部分的架构的结构。为了还将低空间分辨率的主导声音分量包括基本层中,通过空间hoa编码器(参见图1a)中的hoa分解处理输出的环境hoa分量camb(k-1)被修正版本取代:
该修正版本的元素由下式给出:
换句话说,被假设总是被以空间变换形式传输的环境hoa分量的前omin个系数序列被原始hoa分量的系数序列取代。空间hoa编码器的其他处理模块可以保持不变。
重要的是注意到,hoa分解处理的这个变化可以被看作使hoa压缩在所谓的“双层”或“两层”模式下工作的初始操作。该模式提供了可以被划分为低质量基本层和增强层的位流。使用或者不使用该模式是由总位流的访问单元中的单个位以信号告知的。
提供用于基本层和增强层的位流的位流复用的可能的随后的修正在下面进一步描述的图3和4中示出。
基本层位流
在图3和图4中,示出了用于压缩hoa信号的装置,所述hoa信号是具有hoa系数序列的输入时间帧(c(k))的输入hoa表示。所述装置包括用于输入时间帧的空间hoa编码以及随后的感知编码的空间hoa编码和感知编码部分(该部分在图3中示出)以及用于源编码的源编码器部分(该部分在图4中示出)。空间hoa编码和感知编码部分包括方向和矢量估计模块301、hoa分解模块303、环境分量修正模块304、通道分配模块305以及多个增益控制模块306。
方向和矢量估计模块301适于执行hoa信号的方向和矢量估计处理,其中,包括关于方向信号的第一元组集合
hoa分解模块303适于将hoa系数序列的每个输入时间帧分解为多个主导声音信号xps(k-1)的帧和环境hoa分量
环境分量修正模块304适于根据目标分配矢量va,t(k-1)提供的信息修正环境hoa分量camb(k-1),其中,确定环境hoa分量camb(k-1)的哪些系数序列将在给定数量i个通道中传输,这取决于有多少个通道被主导声音信号占据,并且其中,修正的环境hoa分量cm,a(k-2)和时间预测的修正的环境hoa分量cp,m,a(k-1)被获得,并且其中,最终的分配矢量va(k-2)从目标分配矢量va,t(k-1)中的信息获得。
通道分配模块305适于使用最终的分配矢量va(k-2)提供的信息将从分解获得的主导声音信号xps(k-1)、所确定的修正的环境hoa分量cm,a(k-2)和时间预测的修正的环境hoa分量cp,m,a(k-1)的系数序列分配给给定数量i个通道,其中,输送信号yi(k-2),i=1,...,i和预测的输送信号yp,i(k-2),i=1,...,i被获得。
所述多个增益控制模块306适于对输送信号yi(k-2)和预测的输送信号yp,i(k-2)执行增益控制(805),其中,增益修正的输送信号zi(k-2)、指数ei(k-2)和异常标志βi(k-2)被获得。
图4示出了根据本发明的一个实施例的hoa压缩器的源编码器部分的架构的结构。如图4所示的源编码器部分包括感知编码器310、具有两个编码器320、330(即,基本层副信息源编码器320和增强层副信息编码器330)的副信息源编码器模块、以及两个复用器340、350(即,基本层位流复用器340和增强层位流复用器350)。副信息源编码器可以在单个副信息源编码器模块中。
感知编码器310适于对所述增益修正的输送信号zi(k-2)进行感知编码806,其中,感知编码的输送信号
副信息源编码器320、330适于对副信息进行编码,副信息包括所述指数ei(k-2)和异常标志βi(k-2)、所述第一元组集合
复用器340、350适于将感知编码的输送信号
其余的i-omin个感知编码的输送信号
在一个实施例中,用于编码的装置进一步包括适于选择模式的模式选择器,模式由模式指示lmfe指示,是分层模式和非分层模式之一。在非分层模式下,环境hoa分量
下面描述提出的hoa解压缩的修改。
在分层模式下,在hoa解压缩处通过适当地修正hoa复合来考虑hoa压缩中的环境hoa分量camb(k-1)的修正。
在hoa解压缩器中,根据图5执行基本层位流和增强层位流的解复用和解码。基本层位流
具体地说,重构的hoa表示
被其修正版本取代:
修正版本的元素由下式给出:
这意味着主导声音hoa分量没有被添加到前omin个系数序列的环境hoa分量,因为它已经被包括在其中。hoa空间解码器的所有的其他的处理模块保持不变。
在下面,简要地考虑仅存在低质量基本层位流
该位流首先被解复用并且被解码以提供重构的信号
在下一个步骤中,在空间hoa解码器中,前omin个逆增益控制处理模块提供增益校正的信号帧
图5和图6示出了根据本发明的一个实施例的hoa解压缩器的架构的结构。所述装置包括如图5所示的感知解码和源解码部分、如图6所示的空间hoa解码部分、以及适于检测分层模式指示lmfd的模式检测器,分层模式指示lmfd指示压缩的hoa信号包括压缩的基本层位流
图5示出了根据本发明的一个实施例的hoa解压缩器的感知解码和源解码部分的架构的结构。感知解码和源解码部分包括第一解复用器510、第二解复用器520、基本层感知解码器540和增强层感知解码器550、基本层副信息源解码器530和增强层副信息源解码器560。
第一解复用器510适于对压缩的基本层位流
基本层感知解码器540和增强层感知解码器550适于对感知编码的输送信号
基本层副信息源解码器530适于对第一编码的副信息
增强层副信息源解码器560适于对第二编码的副信息
图6示出了根据本发明的一个实施例的hoa解压器的空间hoa解码部分的架构的结构。空间hoa解码部分包括多个逆增益控制单元604、通道再分配模块605、主导声音合成模块606、环境合成模块607、hoa复合模块608。
多个逆增益控制单元604适于执行逆增益控制,其中,所述第一感知解码的输送信号
通道再分配模块605适于将第一和第二增益校正的信号帧
此外,通道再分配模块605适于产生修正的环境hoa分量的在第k帧中起作用的系数序列的第一索引集合
主导声音合成模块606适于从所述主导声音信号
环境合成模块607适于从修正的环境hoa分量
如果分层模式指示lmfd指示具有至少两个层的分层模式,则环境hoa分量在其omin个最低位置(即,具有最低索引的那些位置)包括解压缩的hoa分量
另一方面,如果分层模式指示lmfd指示单层模式,则不包括解压缩的hoa信号
hoa复合模块608适于将主导声音分量的hoa表示与环境hoa分量
如果分层模式指示lmfd指示具有至少两个层的分层模式,则只有最高的i-omin个系数通道通过主导hoa声音分量
图7示出了从环境hoa信号到修正的环境hoa信号的帧变换。
图8示出了用于压缩hoa信号的方法的流程图。
用于压缩高阶高保真立体声(hoa)信号(该信号是具有hoa系数序列的输入时间帧c(k)的、阶次为n的输入hoa表示)的方法800包括输入时间帧的空间hoa编码以及随后的感知编码和源编码。
空间hoa编码包括以下步骤:
在方向和矢量估计模块301中执行hoa信号的方向和矢量估计处理801,其中,包括关于方向信号的第一元组集合
在hoa分解模块303中将hoa系数序列的每个输入时间帧分解802为多个主导声音信号xps(k-1)的帧和环境hoa分量camb(k-1)的帧,其中,主导声音信号xps(k-1)包括所述方向声音信号和所述基于矢量的声音信号,并且其中,环境hoa分量
在环境分量修正模块304中根据目标分配矢量va,t(k-1)提供的信息修正802环境hoa分量camb(k-1),其中,确定环境hoa分量camb(k-1)的哪些系数序列将在给定数量i个通道中传输,这取决于有多少个通道被主导声音信号占据,并且其中,修正的环境hoa分量cm,a(k-2)和时间预测的修正的环境hoa分量cp,m,a(k-1)被获得,并且其中,最终的分配矢量va(k-2)从目标分配矢量va,t(k-1)中的信息获得;
在通道分配模块105中使用最终的分配矢量va(k-2)提供的信息将从分解获得的主导声音信号xps(k-1)、以及修正的环境hoa分量cm,a(k-2)和时间预测的修正的环境hoa分量cp,m,a(k-1)的确定的系数序列分配给804给定数量i个通道,其中,输送信号yi(k-2),i=1,...,i和预测的输送信号yp,i(k-2),i=1,...,i被获得;
以及在多个增益控制模块306中对输送信号yi(k-2)和预测的输送信号yp,i(k-2)执行增益控制805,其中,增益修正的输送信号zi(k-2)、指数ei(k-2)和异常标志βi(k-2)被获得。
感知编码和源编码包括以下步骤:
在感知编码器310中对所述增益修正的输送信号zi(k-2)进行感知编码806,其中,感知编码的输送信号
在一个或多个副信息源编码器320、330中对副信息进行编码807,副信息包括所述指数ei(k-2)和异常标志βi(k-2)、所述第一元组集合
对感知编码的输送信号
在分解步骤802中获得的环境hoa分量
前omin个指数ei(k-2),i=1,...,omin和异常标志βi=(k-2),i=1,...,omin在基本层副信息源编码器320中被编码,其中,编码的基本层副信息
前omin个感知编码的输送信号
其余的i-omin个指数ei(k-2),i=omin 1,...,i和异常标志βi(k-2),i=omin 1,...,i、所述第一元组集合
其余的i-omin个感知编码的输送信号
如上所述,信号表示分层模式的使用的模式指示被添加811。该模式指示由指示插入模块或复用器添加。
在一个实施例中,所述方法进一步包括将基本层位流
在一个实施例中,所述主导方向估计取决于能量占主导的hoa分量的方向功率分布。
在一个实施例中,在修正环境hoa分量中,如果被选hoa系数序列的hoa序列索引在连续的帧之间变化,则系数序列的淡入和淡出被执行。
在一个实施例中,在修正环境hoa分量中,环境hoa分量camb(k-1)的部分去相关被执行。
在一个实施例中,第一元组集合
图9示出了用于解压缩压缩的hoa信号的方法的流程图。在本发明的这个实施例中,用于解压缩压缩的hoa信号的方法900包括获得hoa系数序列的输出时间帧
感知解码和源解码包括以下步骤:
对压缩的基本层位流
对压缩的增强层位流
对感知编码的输送信号
在基本层副信息源解码器530中对第一编码的副信息
在增强层副信息源解码器560中对第二编码的副信息
空间hoa解码包括以下步骤:
执行910逆增益控制,其中,所述第一感知解码的输送信号
在通道再分配模块605中将第一和第二增益校正的信号帧
在通道再分配模块605中产生修正的环境hoa分量的在第k帧中起作用的系数序列的第一索引集合
在主导声音合成模块606中,从所述主导声音信号
在环境合成模块607中,从修正的环境hoa分量
在hoa复合模块608中将主导hoa声音分量
如果分层模式指示lmfd指示具有至少两个层的分层模式,则只有最高的i-omin个系数通道通过主导hoa声音分量
环境hoa分量的取决于分层模式指示lmfd的配置如下:
如果分层模式指示lmfd指示具有至少两个层的分层模式,则环境hoa分量在其omin个最低位置包括解压缩的hoa信号
另一方面,如果分层模式指示lmfd指示单层模式,则环境hoa分量是主导声音分量
在一个实施例中,压缩的hoa信号表示在复用的位流中,用于解压缩压缩的hoa信号的方法进一步包括对压缩的hoa信号表示进行解复用的初始步骤,其中,所述压缩的基本层位流
图10示出了根据本发明的一个实施例的hoa解压器的空间hoa解码部分的架构的各部分的细节。
有利地,例如,如果没有el被接收到,或者如果bl质量足够,则可以仅对bl进行解码。对于这种情况下,el的信号在解码器处可以被设置为零。于是,在通道再分配模块605中将第一和第二增益校正的信号帧
用于hoa压缩的原始(即,整体式的、不可缩放的、非分层的)模式对于不需要低质量基本层位流的应用、例如对于基于文件的压缩可能仍然是有用的。对环境hoa分量camb(其是原始hoa表示和方向hoa表示之间的差值)的空间变换的前omin个系数序列、而不是原始hoa分量c的空间变换的系数序列进行感知编码的主要优点是,在前一种情况下,将被感知编码的所有信号之间的互相关性降低。信号zi,i=1,...,i之间的任何互相关性可以引起空间解码处理期间感知编码噪声的建设性叠加,同时无噪声的hoa系数序列在叠加时被取消。这种现象被称为感知噪声揭露。
在分层模式下,在信号zi,i=1,...,omin中的每个之间、还有在信号zi,i=1,...,omin和zi,i=omin 1,...,i之间存在高互相关性,因为环境hoa分量
虽然已经示出、描述并指出了应用于本发明的优选实施例的、本发明的基本的新颖的特征,但是将理解的是,在不脱离本发明的精神的情况下,本领域技术人员可以在所描述的装置和方法中、在所公开的设备的形式和细节上以及在它们的操作中做出各种省略、替换和改变。明确的意图是,以基本上相同的方式执行基本上相同的功能以实现相同结果的那些元件的所有组合都在本发明的范围内。从所描述的一个实施例对于另一个描述的实施例的元件的替换也被充分预期和设想。
将理解的是,已经纯粹以举例的方式描述了本发明,并且在不脱离本发明的范围的情况下,可以进行细节的修改。
在描述以及(在适当的情况下)权利要求和附图中公开的每个特征可以独立地提供或者按任何适当的组合提供。特征在适当的情况下可以用硬件、软件或两者的组合来实现。连接可以在适用的情况下可以实现为无线连接或有线(不一定是直接的或专用的)连接。
在权利要求中出现的标号仅仅是例示说明,不应当限制权利要求的范围。
引用的参考文献
[1]ep12306569.0
[2]ep12305537.8(作为ep2665208a发布)
[3]ep133005558.2
[4]iso/iecjtc1/sc29/wg11n14264.workingdraft1-hoatextofmpeg-h3daudio,2014年1月
1.一种对声音或声场的压缩的高阶高保真立体声(hoa)表示进行解码的方法,所述方法包括:
接收包含压缩的hoa表示的位流;
基于存在多个层的确定从所述位流解码所述压缩的hoa表示,以获得解码的hoa表示的序列,
其中,所述解码的hoa表示的序列的第一子集仅基于对应的环境hoa分量被确定,
其中,所述解码的hoa表示的序列的第二子集基于对应的环境hoa分量和对应的主导声音分量被确定,
其中,对于帧k,解码的hoa表示的序列至少部分地由下式表示:
其中,
其中,所述多个层的指示在所述位流中以信号告知,并且其中,所述多个层包括能够相互独立地解码的基本层和至少一个增强层,并且
其中,所述第一子集基于1≤n≤omin被确定,并且所述第二子集基于omin 1≤n≤o被确定,其中,o指示通道的总数,并且omin指示1和o之间的数。
2.根据权利要求1所述的方法,进一步基于不存在多个层的确定而确定存在单个层,并且基于单个层的确定,对于帧k基于对应的主导hoa声音分量
3.一种对声音或声场的压缩的高阶高保真立体声(hoa)表示进行解码的装置,所述装置包括:
接收器,用于接收包含压缩的hoa表示的位流;
音频解码器,用于基于存在多个层的确定从所述位流解码所述压缩的hoa表示,以获得解码的hoa表示的序列,
其中,所述解码的hoa表示的序列的第一子集仅基于对应的环境hoa分量被确定,
其中,所述解码的hoa表示的序列的第二子集基于对应的环境hoa分量和对应的主导声音分量被确定,
其中,对于帧k,解码的hoa表示的序列至少部分地由下式表示:
其中,
其中,所述第一子集基于1≤n≤omin被确定,并且所述第二子集基于omin 1≤n≤o被确定,其中,o指示通道的总数,并且omin指示1和o之间的数。
4.根据权利要求3所述的装置,其中,所述音频解码器进一步配置为基于不存在多个层的确定而确定存在单个层,并且基于单个层的确定,基于对应的主导hoa声音分量
5.一种包含有指令的非暂时性计算机可读存储介质,所述指令在被处理器执行时实行对声音或声场的压缩的高阶高保真立体声(hoa)表示进行解码的方法,所述方法包括:
接收包含压缩的hoa表示的位流;
基于存在多个层的确定从所述位流解码所述压缩的hoa表示,以获得解码的hoa表示的序列,
其中,所述解码的hoa表示的序列的第一子集仅基于对应的环境hoa分量被确定,
其中,所述解码的hoa表示的序列的第二子集基于对应的环境hoa分量和对应的主导声音分量被确定,
其中,对于帧k,解码的hoa表示的序列至少部分地由下式表示:
其中,
其中,所述多个层的指示在所述位流中以信号告知,并且其中,所述多个层包括能够相互独立地解码的基本层和至少一个增强层,并且
其中,所述第一子集基于1≤n≤omin被确定,并且所述第二子集基于omin 1≤n≤o被确定,其中,o指示通道的总数,并且omin指示1和o之间的数。
技术总结