CN104270552A

CN104270552A - 一种声像播放方法及装置

Info

Publication number: CN104270552A
Application number: CN201410438159.1A
Authority: CN
Inventors: 李欣欣; 陈旭
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-08-29
Filing date: 2014-08-29
Publication date: 2015-01-07
Also published as: CN106576132A; US20160065791A1; KR20160119218A; WO2016029806A1

Abstract

本发明实施例公开了一种声像播放方法及装置，涉及多媒体领域，能重现与影像对应的任意个数声像的原有立体效果。具体方案为：获取影像位置信息，其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息用于表示其自身对应的影像在第一帧图像中的空间位置；根据所述影像位置信息，获取声道信息集，其中，所述声道信息集包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集与所述影像位置信息对应；按照所述声道信息集播放声像，所述声像与所述影像对应。本发明的实施例用于声像播放。

Description

一种声像播放方法及装置

技术领域

本发明涉及多媒体领域，尤其涉及一种声像播放方法及装置。

背景技术

随着人们的生活水平不断提高，播放影音文件的需求也随之增大，于是出现了形形色色的声像播放装置。声像播放装置的主要作用之一就是播放影音文件中的声像。以电视这种声像播放装置为例，为了播放影音文件的声像，传统的电视，多数在屏幕底部安置两个扬声器；部分将扬声器安置在屏幕两侧。其中，在屏幕底部安置两个扬声器的电视，当屏幕越来越大的时候，观众会明显感觉声音来自屏幕下方中心处，造成与影像相对应的声像的原有立体效果减弱。而扬声器安装在两侧和底部的电视，立体声定位是一维的，仅能有效分辨左右，分辨上下能力较弱，在越来越普及的大屏电视上这个缺点愈发明显。

针对传统声像播放装置容易造成与影像相对应的声像的原有立体效果减弱的缺点，产生了一些技术方案，其中有一种，是在显示器周围布置使用导轨的滑动式扬声器，根据显示器画面主音源位置控制扬声器移动。实现了播放声像的扬声器的位置与显示器图像中主音源的位置较准确的对应，较真实地再现了与影像相对应的声像的原有立体效果。然而，使用导轨根据影像位置移动扬声器，造成声像播放装置结构复杂,对构件灵活性和材料耐久度要求较高,成本高,可行性低。

另一种技术方案，根据从音频信息中解析出的主音源的声像位置信息，对显示平面上下左右的扬声器的发声进行控制，重现了与影像相对应的声像的原有立体效果。然而，关于音频信息携带声像位置信息这一技术,并无通用标准，同时也不是所有的音频信息中都携带声像位置信息，不适用于所有的影音文件的播放。并且本方案仅能对单独一个声像播放，无法同时对多个声像播放，所以本方案能够重现与影像相对应的声像的原有立体效果的应用场景更加有限。

现有技术方案，或者需要以复杂的机械结构和技术方案重现与影像相对应的声像的原有立体效果的；或者需要音频信息携带声像位置信息，并且只能重现单声像的立体效果；均不利于技术的推广。

发明内容

本发明的实施例提供一种声像播放方法及装置，即无需复杂的机械结构和技术方案，也无需音频信息携带声像位置信息，便能重现与影像对应的任意个数声像的原有立体效果，有利于技术的推广。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，提供一种声像播放方法，包括：

获取影像位置信息，其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息用于表示其自身对应的影像在第一帧图像中的空间位置；

根据所述影像位置信息，获取声道信息集，其中，所述声道信息集包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集与所述影像位置信息对应；

按照所述声道信息集播放声像，所述声像与所述影像对应。

结合第一方面，在第一种可能的实现方式中，获取影像位置信息之前，所述方法还包括：

获取所述第一帧图像的第一帧图像数据；

获取影像位置信息，具体包括：

根据所述第一帧图像数据，从所述第一帧图像中识别出所述影像位置信息。

结合第一方面或第一种可能的实现方式，在第二种可能的实现方式中，按照所述声道信息集播放声像之前，所述方法还包括：

获取声像的声像数据；

按照所述声道信息集播放声像，具体包括：

根据所述声像数据，按照所述声道信息集播放所述声像。

结合第一方面和第二种可能的实现方式，在第三种可能的实现方式中，获取声像的声像数据之前，所述方法还包括：

获取第一帧音频的第一帧音频数据，所述第一帧音频对应所述第一帧图像；

获取声像的声像数据，具体包括：

从所述第一帧音频数据中识别出所述声像的声像数据。

结合第一方面和第二种或第三种可能的实现方式，在第四种可能的实现方式中，所述第一帧图像中包含至少两个影像，所述至少两个影像包含第一影像和第二影像，其中，所述第一影像对应第一声像，所述第二影像对应第二声像；

按照所述声道信息集播放声像，具体包括：

按照所述第一声道信息集播放所述第一声像；

按照所述第二声道信息集播放所述第二声像。

结合第一方面和第四种可能的实现方式，在第五种可能的实现方式中，所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息，所述第一影像位置信息对应第一声道信息集，所述第二影像位置信息对应第二声道信息集；

按照所述声道信息集播放声像，具体包括：

根据所述第一声道信息集与所述第二声道信息集获取重合声道信息集，其中，所述重合声道信息集中的声道信息被所述第一声道信息集和所述第二声道信息集同时包含；

按照所述重合声道信息集，根据预设规则播放第一声像和第二声像。

结合第一方面和第五种可能的实现方式，在第六种可能的实现方式中，按照所述重合声道信息集，根据预设规则播放第一声像和第二声像之前，所述方法还包括：

获取第一声像数据和第二声像数据，所述第一声像数据对应第一声像，所述第二声像数据对应第二声像；

混合第一声像数据和第二声像数据，获得重合声像数据；

按照所述重合声道信息集，根据预设规则播放第一声像和第二声像，具体包括：

按照所述重合声道信息集，根据重合声像数据播放第一声像和第二声像。

结合第一方面和第四种至第六种可能的实现方式中的任一种，在第七种可能的实现方式中，按照所述第一声道信息集播放所述第一声像之前，所述方法还包括：

根据所述第一声道信息集与所述第二声道信息集获取第一区别声道信息集，其中，所述第一区别声道信息集中的声道信息被所述第一声道信息集中包含，而不被所述第二声道信息集中包含；

按照所述第一声道信息集播放所述第一声像，具体包括：

按照所述第一区别声道信息集播放所述第一声像。

结合第一方面或第一种至第七种可能的实现方式中的任一种，在第八种可能的实现方式中，所述方法应用于声像播放装置，所述声像播放装置包含至少一个扬声器，所述至少一个扬声器中的每个扬声器对应所述至少一个声道中的一个声道；

按照所述声道信息集播放声像，具体包括：

按照所述声道信息集，驱动所述至少一个扬声器播放声像。

第二方面，提供一种声像播放装置，包括：

获取单元，用于获取影像位置信息，其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息用于表示其自身对应的影像在第一帧图像中的空间位置；

信道单元，用于根据所述获取单元获取的所述影像位置信息，获取声道信息集，其中，所述声道信息集包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集与所述影像位置信息对应；

播放单元，用于按照所述信道单元获取的所述声道信息集播放声像，所述声像与所述影像对应。

结合第二方面，在第一种可能的实现方式中，所述获取单元，还用于获取第一帧图像的第一帧图像数据；

所述获取单元，用于获取影像位置信息，具体包括：

所述获取单元，用于根据所述获取自身获取的所述第一帧图像数据，从所述第一帧图像中识别出所述影像位置信息。

结合第二方面或第一种可能的实现方式，在第二种可能的实现方式中，所述获取单元，还用于获取声像的声像数据；

所述播放单元，用于按照所述信道单元获取的所述声道信息集播放声像，具体包括：

所述播放单元，用于根据所述获取单元获取的所述声像数据，按照所述声道信息集播放所述声像。

结合第二方面和第二种可能的实现方式，在第三种可能的实现方式中，所述获取单元，还用于获取第一帧音频的第一帧音频数据，所述第一帧音频对应第一帧图像；

所述获取单元，还用于获取声像的声像数据，具体包括：

所述获取单元，用于从所述获取单元自身获取的所述第一帧音频数据中识别出所述声像的声像数据。

结合第二方面和第二种或第三种可能的实现方式，在第四种可能的实现方式中，所述第一帧图像中包含至少两个影像，所述至少两个影像包含第一影像和第二影像，其中，所述第一影像对应第一声像，所述第二影像对应第二声像；

所述播放单元，用于按照所述获取单元获取的所述声道信息集播放声像，具体包括：

所述播放单元，具体用于按照所述获取单元获取的所述第一声道信息集播放所述第一声像；

所述播放单元，还具体用于按照所述获取单元获取的所述第二声道信息集播放所述第二声像。

结合第二方面和第四种可能的实现方式，在第五种可能的实现方式中，所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息，所述第一影像位置信息对应第一声道信息集，所述第二影像位置信息对应第二声道信息集；

所述播放单元，包括：

重合信道子单元，用于根据所述信道单元获取的所述第一声道信息集与所述第二声道信息集获取重合声道信息集，其中，所述重合声道信息集中的声道信息被所述第一声道信息集和所述第二声道信息集同时包含；

重合播放子单元，用于按照所述重合信道子单元获取的所述重合声道信息集，根据预设规则播放第一声像和第二声像。

结合第二方面和第五种可能的实现方式，在第六种可能的实现方式中，所述播放单元，还包括：

获取子单元，用于获取第一声像数据和第二声像数据，所述第一声像数据对应第一声像，所述第二声像数据对应第二声像；

混合子单元，用于混合所述获取子单元获取的第一声像数据和第二声像数据，获得重合声像数据；

所述重合播放子单元，具体用于按照所述重合信道子单元获取的重合声道信息集，根据所述混合子单元获取的重合声像数据播放第一声像和第二声像。

结合第二方面和第四种至第六种可能的实现方式中的任一种，在第七种可能的实现方式中，所述播放单元，还包括：

区别信道子单元，用于根据所述第一声道信息集与所述第二声道信息集获取第一区别声道信息集，其中，所述至少一个第一声道信息包含所述第一区别声道信息集，所述至少一个第二声道信息不包含所述第一区别声道信息集中的任意一个第一区别声道信息；

区别播放子单元，用于按照所述区别信道子单元获取的所述第一区别声道信息集播放所述第一声像。

结合第二方面或第一种至第七种可能的实现方式中的任一种，在第八种可能的实现方式中，所述声像播放装置还包含至少一个扬声器，所述至少一个扬声器中的每个扬声器对应所述至少一个声道中的一个声道；

所述播放单元，用于按照所述信道单元获取的所述声道信息集，驱动所述至少一个扬声器播放声像。

本发明实施例提供的声像播放方法及装置，能获取影像位置信息，并根据所述影像位置信息，按照预设规则获取声道信息集，并按照所述声道信息集播放声像；其中，所述影像位置信息用于表示其自身对应的影像在第一帧图像中的空间位置，所述声道信息集包含至少一个声道信息，所述声道信息对应一个声道，所述声像与所述影像对应。这样的方案简单，无需复杂的机械结构和技术方案，并且可以通过获取影像位置信息的方式来获取声道信息集，于是能使用通用的声道方式来播放声像，也就可以在无需音频信息携带声像位置信息的情况下，重现与影像对应的任意个数声像的原有立体效果，可用于播放任意影音文件，所以本发明有利于技术的推广。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的实施例提供的一种声像播放方法的流程示意图；

图2为本发明的又一实施例提供的一种声像播放方法的流程示意图；

图3为本发明的又一实施例提供的一种声像播放方法的解说示意图；

图4为本发明的实施例提供的一种声像播放装置的结构示意图；

图5为本发明的实施例提供的另一种声像播放装置的结构示意图；

图6为本发明的实施例提供的再一种声像播放装置的结构示意图；

图7为本发明的实施例提供的又一种声像播放装置的结构示意图；

图8为本发明的实施例提供的另有一种声像播放装置的结构示意图；

图9为本发明的又一实施例提供的一种声像播放装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了便于清楚描述本发明实施例的技术方案，在本发明的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。

本发明实施例中使用的影像、声像、音频、图像的具体含义可以如下所示：1、影像，为某一种物体的像，例如人的像、动物的像、汽车的像；2、声像，为包含了立体效果的声音，这种声音体现出的效果可以看做是一种“声画面”；3、音频，是声音的一种专业化称谓，在多媒体领域，多与视频类似，以帧为单位承载声音数据；4、图像，在本发明中为具有人为设定的固定边界的色彩体现形式，可以是视频文件中的某一帧视频画面。

本发明实施例提供一种声像播放方法，可以用于多媒体领域，具体可以用于声像播放，参照图1所示，可以包括以下步骤：

101、获取影像位置信息。

其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息可以用于表示其自身对应的影像在第一帧图像中的空间位置。

具体的，所述影像位置信息可以是从待处理图像中识别获得，也可以是从存储的影像位置信息中获得，获取到的影像位置信息可以是多个影像的。

102、根据所述影像位置信息，按照预设规则获取声道信息集。

可选的，还可包含如下步骤：

103、按照所述声道信息集播放声像。

其中，所述声道信息集可以包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集对应所述影像位置信息，所述声像与所述影像对应。

具体的，在本发明实施例应用于装置上时，可以是应用本实施例提供的方法的装置自身按照所述声道信息集来播放对应的声像，也可以是将所述声道信息集传送给专门播放声像的外设，以获取并发送所述至少一个声道信息集来控制所述至少一个声像的播放。

这样做的好处是，无需音频信息中携带声像位置信息，由上可知，音频信息携带声像位置信息并无一个通用标准。并可以根据获取到的声道信息，结合目前很成熟的声道技术来实现声像的立体效果重现，无需复杂度结构和技术方案。

本发明实施例提供的声像播放方法，能获取影像位置信息，并根据所述影像位置信息，按照预设规则获取声道信息集，以便按照所述声道信息集播放声像；其中，所述影像位置信息可以用于表示其自身对应的影像在第一帧图像中的空间位置，所述声道信息集可以包含至少一个声道信息，所述声道信息对应一个声道，所述声像与所述影像对应。这样的方案简单，无需复杂的机械结构和技术方案，并且可以通过获取影像位置信息的方式来获取声道信息集，于是能使用通用的声道方式来播放声像，也就可以在无需音频信息携带声像位置信息的情况下，重现与影像对应的任意个数声像的原有立体效果，可以用于播放任意影音文件，所以本发明有利于技术的推广。

在本发明上述实施例提供的声像播放方法的基础上，本发明实施例提供一种声像播放方法，可以用于多媒体领域，具体可以用于声像播放，参照图2所示，可以包括以下步骤：

201、获取第一帧图像的第一帧图像数据。

其中，所述第一帧图像可以是待处理影音文件中的任一帧视频图像。

202、根据所述第一帧图像数据，从所述第一帧图像中识别出所述影像位置信息。

具体的，可以是如下方法：获取至少一个影像特征信息，所述至少一个影像特征信息中的每个影像特征信息对应所述至少一个影像中的一个影像。其中，所述至少一个影像可以包括第一影像，所述至少一个影像还可以包括第二影像。根据所述第一帧图像数据和所述至少一个影像特征信息，获取影像位置信息。

本步为“获取影像位置信息”的具体实现方式之一。

其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息可以用于表示其自身对应的影像在所述第一帧图像中的空间位置，所述第一帧图像中可以包含至少两个影像，包括第一影像和第二影像；所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息。

具体的，参照图3所示，例如，图3中有显示器屏幕(阴影部分)，屏幕中的影像(左下的猫和右上的老鼠)，及其周围的扬声器，所述步骤202实现过程可以是如下方式：

例如，设图中左下方的影像为第一影像，右上方的影像为第二影像。

通过图像模式识别技术，识别出至少一个影像的影像位置信息。目前业内有多种图像模式识别技术，常见的有颜色视觉特性与颜色相似性度量、基于脉冲噪声检测的图像检测技术、基于BP(BackPropagation，反向传播)神经网络的图像模糊分类技术，这些图像模式识别技术都可以结合至少一个影像特征信息来对至少一个影像进行识别，从而得到至少一个影像位置信息。

通过图像模式识别技术，可以实时自动识别当前图像中多个影像块的位置简化处理，此时，所述至少一个影像位置信息中的每个影像位置信息均可用矩形坐标描述，例如：(X0,Y0)表示左上角坐标、(X1,Y1)表示右下角坐标。其中，X0、Y0、X1、Y1对应的坐标值，可以是在第一帧图像中的像素坐标值，也可以灵活设定，例如可以根据对应的扬声器等来设定坐标值，一个坐标值对应一定的像素坐标值范围。

如图所示：第一影像的第一影像位置信息(X0,Y0,X1,Y1),第二影像的第二影像位置信息(X0,Y0,X1,Y1)。

当然，也可以使用其他方式的影像位置信息来表述所述影像在第一帧图像中的空间位置。

可选的，在识别出影像位置信息之后,为了提高处理性能，若连续多帧图像中同一影像块的特征变动较小,仅有位置移动的变化，则可以通过运动图像检测技术快速识别影像块的位置信息。运动图像检测技术也有多种成熟的实现方案，常见的有基于帧差法的运动图像检测、基于背景建模技术的运动图像检测。

这样做的好处是，可以获得每个被识别出的影像对应的影像位置信息，有利于后续对与影像相对应的声像的立体效果的重现。

在本步获取了所述影像位置信息之后：

203、根据所述影像位置信息，获取声道信息集。

其中，所述声道信息集可以包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集对应所述影像位置信息，所述声像对应所述影像。

这样做的好处是，可以根据获取到的声道信息，结合目前很成熟的声道技术来实现声像的立体效果重现，无需复杂度结构和技术方案。

其中，所述第一影像对应第一声像，所述第二影像对应第二声像，所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息，所述第一影像位置信息对应第一声道信息集，所述第二影像位置信息对应第二声道信息集。

具体的实现方式，可以参照图3所示：

例如，从所述第一帧图像中获取到的所述第一影像的第一影像位置信息(X0,Y0,X1,Y1)，可以得到第一声像需要对应的空间，可以依此计算得出需要发声的扬声器单元所对应的声道，以便控制扬声器发声。

此时，可将上下两边的扬声器对应的坐标作为横坐标参考(0-N)，将左右两侧的扬声器对应的坐标作为纵坐标参考(0-M)；第一影像位置信息表明的空间(X0,Y0,X1,Y1)，如图3所述；因此，为了重现第一声像的立体效果，可能需要上下两边与(X0-X1)位置对应的扬声器发声；也可能需要左右两边与(Y0-Y1)位置对应的扬声器发声。

那么，此时就根据第一影像位置信息来生成第一声道信息集，所述第一声道信息集包含至少一个第一声道信息，所述至少一个第一声道信息中每个第一声道信息各自对应一个声道，这些和第一声道信息对应的声道与需要发声的扬声器相对应。

以上所述，仅为计算声道信息集的一种方案，具体可以根据实际情况调整影像位置信息与声道、声道信息、声道信息集的对应计算关系，以利于达到符合环境需求的立体声，从而重现所述声像的立体效果。

204、获取第一帧音频的第一帧音频数据。

其中，所述第一帧音频对应所述第一帧图像；

205、从所述第一帧音频数据中识别出所述声像的声像数据。

具体的，可以是如下方法：获取至少一个声像特征信息。其中，所述至少一个声像特征信息中的每个声像特征信息对应所述至少一个声像中的一个声像；根据所述第一帧音频数据和所述至少一个声像特征信息，获取至少一个声像数据。其中，所述至少一个声像数据中的每个声像数据对应所述至少一个声像特征信息中的一个声像特征信息。

具体的，可以通过声像特征识别，来识别出来发声声像的具体类型；例如使用声纹识别技术这一成熟的来对声像进行识别。之后，可以根据识别出来的声像类型，与通过影像特征识别出对应影像的具体图像类型相匹配，获得声像与影像的对应关系；或者，两者的匹配关系可以提前设定，例如：设定为所述至少一个影像特征信息中的每个影像特征信息与所述至少一个声像特征信息中的每个影像特征信息一一相对应。

关于所述步骤204、步骤205，可以看为下述步:A01的一种具体实施方式：

A01、获取声像的声像数据；

其中，所述至少一个声像数据中的每个声像数据对应所述至少一个声像中的一个声像。

具体的，在声像数据没有在音频信息中预先区分时，可以执行所述步骤204-205，如果所述至少一个声像数据已预先区分，则可以直接执行所述步骤A01。

这里需要注意的是，所述步骤201-203之间有先后顺序，所述步骤204、205之间有先后顺序，然而所述步骤201-203和所述步骤204、205这两个步骤组之间并没有先后顺序。

206、根据所述声像数据，按照所述声道信息集播放声像。

需要说明的是，本发明实施例提供的方法应用于设备、装置时，一方面，可以是应用本方法的设备、装置自身通过获取、存储、解析解码声像数据，自行来播放声像，此时执行上述步骤。

另一方面，所述至少一个声像中的每个声像对应的具体声像数据可以通过外设来存储、解析播放，按照所述声道信息集播放声像这一步，只需要按照所述至少一个声道信息控制外设播放所述影像对应的声像即可。

此时，可选的，可以无需经过上述步骤204-206而直接执行步骤B01：

B01、按照所述声道信息集播放声像。

具体的，关于本发明实施例中的上述步骤中“按照所述声道信息集播放声像”的具体实现方式，可以包含以下几种方式，其中的各种实现方式可以单独存在，也可并存：

第一种实现方式：

所述至少一个影像可以包括第一影像，所述第一影像位置信息可以包括第一影像位置信息，所述至少一个声像可以包括第一声像，所述至少一个声道信息集可以包括第一声道信息集，所述第一声道信息集可以包含至少一个第一声道信息，所述第一影像对应第一影像位置信息、第一声像和第一声道信息集；

此时，按照所述声道信息集播放声像，具体可以包括下述步骤C01：

C01：按照所述第一声道信息集播放所述第一声像。

具体的，结合本发明实施例的前述步骤，可知本步具体可以是：根据第一声像数据，按照所述第一声道信息集播放所述第一声像；

其中，所述第一声像数据包含于所述至少一个声像数据中，并且，所述第一声像数据对应所述第一声像。

第二种实现方式：可以与第一种实现方式并存。

所述至少一个影像还可以包括第二影像，所述第一影像位置信息还可以包括第二影像位置信息，所述至少一个声像还可以包括第二声像，所述至少一个声道信息集还可以包括第二声道信息集，所述第二声道信息集可以包含至少一个第二声道信息，所述第二影像对应第二影像位置信息、第二声像和第二声道信息集；

此时，按照所述声道信息集播放声像，还可以包括下述步骤C02：

C02：按照所述第二声道信息集播放所述第二声像。

具体的，结合本发明实施例的前述步骤，可知本步具体可以是：根据第二声像数据，按照所述第二声道信息集播放所述第二声像；

其中，所述第二声像数据包含于所述至少一个声像数据中，并且，所述第二声像数据对应所述第二声像。

由上可知，本发明实施例中的第一种实现方式和第二种实现方式，均可适用于单个声像的播放，而两者结合时可实现对两个声像的同时播放，本发明实施例只是对本方法的举例，实际中，第一、第二并不固定，经过本发明实施例中的所述第一种和第二种实现方式的结合，可以使本方法能够实现对任意个数的声像进行同时播放。

第三种实现方式：这种实现方式是建立在本实施例中的上述第一种和第二种实现方式结合的基础上的。

此时，按照所述声道信息集播放声像，还可以包括下述步骤C031和C032：

C031：根据所述第一声道信息集与所述第二声道信息集获取重合声道信息集；

其中，所述重合声道信息集中的声道信息被所述第一声道信息集和所述第二声道信息集同时包含；

C032：按照所述重合声道信息集，根据预设规则播放第一声像和第二声像。

具体的，结合本发明实施例的前述步骤，可知本步具体可以是：根据第一声像数据和第二声像数据，按照所述重合声道信息集，根据预设规则播放第一声像和第二声像。

具体的，所述第三种实现方式可以应用于所述第一声道信息集和所述第二声道信息集中包含有至少一个相同的声道信息时。

对于所述第三种实现方式，进一步的，在所述步骤C032之前，所述方法还可以包括如下步骤：

获取第一声像数据和第二声像数据，所述第一声像数据对应第一声像，所述第二声像数据对应第二声像。混合第一声像数据和第二声像数据，获得重合声像数据。此时，所述步骤C032的实现方式，具体可以包括：按照所述重合声道信息集，根据重合声像数据播放第一声像和第二声像。

此时，可选的，所述步骤C032的实现方式还可以包括：所述重合声道信息集对应的声道中，一半播放第一声像，另一半播放第二声像；或者所述重合声道信息集中每个重合声道信息对应的声道不播放第一声像和第二声像。

这里需要说明的是，对于无对应影像的声像，例如未检测到影像位置信息时，可以将所述声像作为背景声发出，或者根据在此之前最后一次在屏幕的发声位置，获取所述声像对应的影像位置信息。

对于以上几种实现方式及各种实现方式的组合实现方式，在按照所述第一声道信息集播放所述第一声像之前，还可以包括如下步骤：根据所述第一声道信息集与所述第二声道信息集获取第一区别声道信息集，其中，所述第一区别声道信息集中的声道信息被所述第一声道信息集中包含，而不被所述第二声道信息集中包含；此时，按照所述第一声道信息集播放所述第一声像，具体可以包括：按照所述第一区别声道信息集播放所述第一声像。

可选的，同样参照图3所示，图中圆圈表示扬声器，所述方法可以应用于声像播放装置，所述声像播放装置可以包含至少一个扬声器，所述至少一个扬声器中的每个扬声器对应所述至少一个声道中的一个声道；此时，按照所述声道信息集播放声像，具体可以包括：按照所述声道信息集，驱动所述至少一个扬声器播放声像。

当然，本方法也可应用于结合了其他结构的扬声器的声像播放装置，因为本方法可以结合现有的声道技术实现声像的播放，因此具有广泛的适用性。

具体的，可以是将播放源输入的音频数据使用I2S(Inter—ICSound，集成电路内置音频)总线，发给对应的功放，驱动扬声器发声。至少一个扬声器组成的扬声器阵列，可以使用常见的定向扬声器，使得声音向屏幕正前方发出，提高听众的听觉定位精度/能力。也可以使用普通扬声器。数字功放，用于接受多路I2S信号，可驱动扬声器。

实际运用中，所述声像播放装置可以是电视、大荧幕等，也可以是其他影音声像播放装置，因此包含至少一个扬声器的扬声器阵列结合本发明实施例提供的声像播放方法，能够有效地重现声像原有的立体效果。

本发明实施例提供的声像播放方法，不仅能根据至少一个影像特征信息从第一帧图像中获取影像位置信息，并根据所述影像位置信息，按照预设规则获取声道信息集，也就可以在无需音频信息携带声像位置信息的情况下，从任意影音文件中识别出用于重现声像立体效果的数据，以便重现与影像对应的任意个数声像的原有立体效果；还可以根据至少一个声像特征信息从与第一帧图像对应的第一帧音频中获取至少一个声像数据，从而根据所述至少一个声像数据按照所述声道信息集播放声像。所以方案简单，能使用通用的声道方式来播放声像，无需复杂的机械结构和技术方案，有利于技术的推广。

参照图4所示，本发明实施例提供一种声像播放装置，可以应用于多媒体领域，具体可以结合本发明上述实施例中提供的声像播放方法使用，具体包括以下内容：

获取单元401，用于获取影像位置信息，其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息用于表示其自身对应的影像在第一帧图像中的空间位置；

信道单元402，用于根据所述获取单元401获取的所述影像位置信息，获取声道信息集，其中，所述声道信息集包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集与所述影像位置信息对应；

可选的，参照图5所示，所述声像播放装置，还包括：

播放单元403，用于按照所述信道单元402获取的所述声道信息集播放声像，所述声像与所述影像对应。

可选的，所述获取单元401，还用于获取第一帧图像的第一帧图像数据；

所述获取单元401，用于获取影像位置信息，具体包括：

所述获取单元401，用于根据所述获取自身获取的所述第一帧图像数据，从所述第一帧图像中识别出所述影像位置信息。

可选的，所述获取单元401，还用于获取声像的声像数据；

所述播放单元403，用于按照所述信道单元402获取的所述声道信息集播放声像，具体包括：

所述播放单元403，用于根据所述获取单元401获取的所述声像数据，按照所述声道信息集播放所述声像。

进一步可选的，所述获取单元401，还用于获取第一帧音频的第一帧音频数据，所述第一帧音频对应第一帧图像；

所述获取单元401，还用于获取声像的声像数据，具体包括：

所述获取单元401，用于从所述获取单元401自身获取的所述第一帧音频数据中识别出所述声像的声像数据。

进一步可选的，所述第一帧图像中包含至少两个影像，所述至少两个影像包含第一影像和第二影像，其中，所述第一影像对应第一声像，所述第二影像对应第二声像；

所述播放单元403，用于按照所述获取单元401获取的所述声道信息集播放声像，具体包括：

所述播放单元403，具体用于按照所述获取单元401获取的所述第一声道信息集播放所述第一声像；

所述播放单元403，还具体用于按照所述获取单元401获取的所述第二声道信息集播放所述第二声像。

更进一步可选的，所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息，所述第一影像位置信息对应第一声道信息集，所述第二影像位置信息对应第二声道信息集；

在图5的基础上，参照图6所示，所述播放单元403，包括：

重合信道子单元4031，用于根据所述信道单元402获取的所述第一声道信息集与所述第二声道信息集获取重合声道信息集，其中，所述重合声道信息集中的声道信息被所述第一声道信息集和所述第二声道信息集同时包含；

重合播放子单元4032，用于按照所述重合信道子单元4031获取的所述重合声道信息集，根据预设规则播放第一声像和第二声像。

再进一步可选的，在图6的基础上，参照图7所示，所述播放单元403，还包括：

获取子单元4033，用于获取第一声像数据和第二声像数据，所述第一声像数据对应第一声像，所述第二声像数据对应第二声像；

混合子单元4034，用于混合所述获取子单元4033获取的第一声像数据和第二声像数据，获得重合声像数据；

所述重合播放子单元4032，具体用于按照所述重合信道子单元4031获取的重合声道信息集，根据所述混合子单元4034获取的重合声像数据播放第一声像和第二声像。

可选的，在图5的基础上，参照图8所示，所述播放单元403，还包括：

区别信道子单元4035，用于根据所述第一声道信息集与所述第二声道信息集获取第一区别声道信息集，其中，所述至少一个第一声道信息包含所述第一区别声道信息集，所述至少一个第二声道信息不包含所述第一区别声道信息集中的任意一个第一区别声道信息；

区别播放子单元4036，用于按照所述区别信道子单元4035获取的所述第一区别声道信息集播放所述第一声像。

可选的，所述声像播放装置还包含至少一个扬声器，所述至少一个扬声器中的每个扬声器对应所述至少一个声道中的一个声道；

所述播放单元403，用于按照所述信道单元402获取的所述声道信息集，驱动所述至少一个扬声器播放声像。

本发明实施例提供的声像播放装置，能获取影像位置信息，并根据所述影像位置信息，按照预设规则获取声道信息集，以便按照所述声道信息集播放声像；其中，所述影像位置信息可以用于表示其自身对应的影像在第一帧图像中的空间位置，所述声道信息集可以包含至少一个声道信息，所述声道信息对应一个声道，所述声像与所述影像对应。这样的方案简单，无需复杂的机械结构和技术方案，并且可以通过获取影像位置信息的方式来获取声道信息集，于是能使用通用的声道方式来播放声像，也就可以在无需音频信息携带声像位置信息的情况下，重现与影像对应的任意个数声像的原有立体效果，可以用于播放任意影音文件，所以本发明有利于技术的推广。

本发明的实施例提供一种声像播放装置，可以应用于多媒体领域，具体可以结合本发明上述实施例提供的声像播放方法进行使用，参照图9所示，该声像播放装置可以嵌入或本身就是微处理计算机，比如：通用计算机、客户定制机、手机终端或平板机等便携设备，该声像播放装置901可以包括：至少一个数据接口9011、处理器9012、存储器9013和总线9014，该至少一个数据接口9011、处理器9012和存储器9013通过总线9014连接并完成相互间的通信。

该总线9014可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(Peripheral Component，外部设备互连)总线或EISA(Extended Industry Standard Architecture，扩展工业标准体系结构)总线等。该总线9014可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。其中：

存储器9013可以用于存储可执行程序代码，该程序代码可以包括计算机操作指令。存储器9013可能可以包括高速RAM存储器，也可能还可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

处理器9012可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application SpecificIntegrated Circuit，简称为ASIC)，或者是被配置成实施本发明实施例的一个或多个集成电路。

其中，所述数据接口9011，用于获取影像位置信息，其中，所述影像位置信息对应至少一个影像中的一个影像，所述影像位置信息用于表示其自身对应的影像在第一帧图像中的空间位置；

所述处理器9012，用于根据所述数据接口9011获取的所述影像位置信息，获取声道信息集，其中，所述声道信息集包含至少一个声道信息，所述至少一个声道信息中的每个声道信息对应至少一个声道中的一个声道，所述声道信息集与所述影像位置信息对应；

可选的，所述处理器9012，还用于按照所述处理器9012获取的所述声道信息集播放声像，所述声像与所述影像对应。

可选的，所述数据接口9011，还用于获取第一帧图像的第一帧图像数据；

所述数据接口9011，用于获取影像位置信息，具体包括：

所述数据接口9011，用于根据所述获取自身获取的所述第一帧图像数据，从所述第一帧图像中识别出所述影像位置信息。

可选的，所述数据接口9011，还用于获取声像的声像数据；

所述处理器9012，用于按照所述处理器9012获取的所述声道信息集播放声像，具体包括：

所述处理器9012，用于根据所述数据接口9011获取的所述声像数据，按照所述声道信息集播放所述声像。

进一步可选的，所述数据接口9011，还用于获取第一帧音频的第一帧音频数据，所述第一帧音频对应第一帧图像；

所述数据接口9011，还用于获取声像的声像数据，具体包括：

所述数据接口9011，用于从所述数据接口9011自身获取的所述第一帧音频数据中识别出所述声像的声像数据。

所述处理器9012，用于按照所述数据接口9011获取的所述声道信息集播放声像，具体包括：

所述处理器9012，具体用于按照所述数据接口9011获取的所述第一声道信息集播放所述第一声像；

所述处理器9012，还具体用于按照所述数据接口9011获取的所述第二声道信息集播放所述第二声像。

所述处理器9012，还用于根据所述处理器9012获取的所述第一声道信息集与所述第二声道信息集获取重合声道信息集，其中，所述重合声道信息集中的声道信息被所述第一声道信息集和所述第二声道信息集同时包含；

所述处理器9012，还用于按照所述处理器9012获取的所述重合声道信息集，根据预设规则播放第一声像和第二声像。

在进一步可选的，所述处理器9012，还用于获取第一声像数据和第二声像数据，所述第一声像数据对应第一声像，所述第二声像数据对应第二声像；

所述处理器9012，还用于混合所述处理器9012获取的第一声像数据和第二声像数据，获得重合声像数据；

所述处理器9012，具体还用于按照所述处理器9012获取的重合声道信息集，根据所述处理器9012获取的重合声像数据播放第一声像和第二声像。

可选的，所述处理器9012，还用于根据所述第一声道信息集与所述第二声道信息集获取第一区别声道信息集，其中，所述至少一个第一声道信息包含所述第一区别声道信息集，所述至少一个第二声道信息不包含所述第一区别声道信息集中的任意一个第一区别声道信息；

所述处理器9012，还用于按照所述处理器9012获取的所述第一区别声道信息集播放所述第一声像。

所述处理器9012，用于按照所述处理器9012获取的所述声道信息集，驱动所述至少一个扬声器播放声像。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可以用硬件实现，或固件实现，或它们的组合方式来实现。当使用软件实现时，可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质可以包括计算机存储介质和通信介质，其中通信介质可以包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于：计算机可读介质可以包括RAM(Random Access Memory，随机存储器)、ROM(ReadOnly Memory，只读内存)、EEPROM(Electrically ErasableProgrammable Read Only Memory，电可擦可编程只读存储器)、CD-ROM(Compact Disc Read Only Memory，即只读光盘)或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够可以用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外，任何连接可以适当的成为计算机可读介质。例如，如果软件是使用同轴电缆、光纤光缆、双绞线、DSL(DigitalSubscriber Line，数字用户专线)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的，那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术可以包括在所属介质的定影中。如本发明所使用的，盘和碟可以包括CD(Compact Disc，压缩光碟)、激光碟、光碟、DVD碟(DigitalVersatile Disc，数字通用光)、软盘和蓝光光碟，其中盘通常磁性的复制数据，而碟则用激光来光学的复制数据。上面的组合也应当可以包括在计算机可读介质的保护范围之内。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种声像播放方法，其特征在于，包括：

按照所述声道信息集播放声像，所述声像与所述影像对应。

2.根据权利要求1所述的方法，其特征在于，获取影像位置信息之前，所述方法还包括：

获取所述第一帧图像的第一帧图像数据；

获取影像位置信息，具体包括：

3.根据权利要求1或2所述的方法，其特征在于，按照所述声道信息集播放声像之前，所述方法还包括：

获取声像的声像数据；

按照所述声道信息集播放声像，具体包括：

根据所述声像数据，按照所述声道信息集播放所述声像。

4.根据权利要求3所述的方法，其特征在于，获取声像的声像数据之前，所述方法还包括：

获取声像的声像数据，具体包括：

从所述第一帧音频数据中识别出所述声像的声像数据。

5.根据权利要求3或4所述的方法，其特征在于，所述第一帧图像中包含至少两个影像，所述至少两个影像包含第一影像和第二影像，其中，所述第一影像对应第一声像，所述第二影像对应第二声像；

按照所述声道信息集播放声像，具体包括：

按照所述第一声道信息集播放所述第一声像；

按照所述第二声道信息集播放所述第二声像。

6.根据权利要求5所述的方法，其特征在于，所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息，所述第一影像位置信息对应第一声道信息集，所述第二影像位置信息对应第二声道信息集；

按照所述声道信息集播放声像，具体包括：

7.根据权利要求6所述的方法，其特征在于，按照所述重合声道信息集，根据预设规则播放第一声像和第二声像之前，所述方法还包括：

混合第一声像数据和第二声像数据，获得重合声像数据；

8.根据权利要求5-7任一项所述的方法，其特征在于，按照所述第一声道信息集播放所述第一声像之前，所述方法还包括：

按照所述第一声道信息集播放所述第一声像，具体包括：

按照所述第一区别声道信息集播放所述第一声像。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述方法应用于声像播放装置，所述声像播放装置包含至少一个扬声器，所述至少一个扬声器中的每个扬声器对应所述至少一个声道中的一个声道；

按照所述声道信息集播放声像，具体包括：

按照所述声道信息集，驱动所述至少一个扬声器播放声像。

10.一种声像播放装置，其特征在于，包括：

11.根据权利要求10所述的装置，其特征在于，所述获取单元，还用于获取第一帧图像的第一帧图像数据；

所述获取单元，用于获取影像位置信息，具体包括：

12.根据权利要求10或11所述的装置，其特征在于，所述获取单元，还用于获取声像的声像数据；

13.根据权利要求12所述的装置，其特征在于，所述获取单元，还用于获取第一帧音频的第一帧音频数据，所述第一帧音频对应第一帧图像；

所述获取单元，还用于获取声像的声像数据，具体包括：

14.根据权利要求12或13所述的装置，其特征在于，所述第一帧图像中包含至少两个影像，所述至少两个影像包含第一影像和第二影像，其中，所述第一影像对应第一声像，所述第二影像对应第二声像；

15.根据权利要求14所述的装置，其特征在于，所述第一影像对应第一影像位置信息，所述第二影像对应第二影像位置信息，所述第一影像位置信息对应第一声道信息集，所述第二影像位置信息对应第二声道信息集；

所述播放单元，包括：

16.根据权利要求15所述的装置，其特征在于，所述播放单元，还包括：

17.根据权利要求14-16任一项所述的装置，其特征在于，所述播放单元，还包括：

18.根据权利要求10-17任一项所述的装置，其特征在于，所述声像播放装置还包含至少一个扬声器，所述至少一个扬声器中的每个扬声器对应所述至少一个声道中的一个声道；