CN112533056B - 一种显示设备及声音再现方法 - Google Patents

一种显示设备及声音再现方法 Download PDF

Info

Publication number
CN112533056B
CN112533056B CN201910877973.6A CN201910877973A CN112533056B CN 112533056 B CN112533056 B CN 112533056B CN 201910877973 A CN201910877973 A CN 201910877973A CN 112533056 B CN112533056 B CN 112533056B
Authority
CN
China
Prior art keywords
audio data
multimedia
chat
audio
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910877973.6A
Other languages
English (en)
Other versions
CN112533056A (zh
Inventor
齐消消
陈俊宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN201910877973.6A priority Critical patent/CN112533056B/zh
Publication of CN112533056A publication Critical patent/CN112533056A/zh
Application granted granted Critical
Publication of CN112533056B publication Critical patent/CN112533056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4781Games
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本申请实施例示出一种显示设备及声音再现方法,尤其适用于一种社交电视。本申请实施例示出的技术方案,当同时有聊天音频数据和多媒体音频数据输入显示设备时,显示设备将多媒体音频数据的编码格式转为聊天音频数据的编码格式,进而将两种编码格式的音频数据转化为同一种编码格式的音频数据,进而避免了有两种不同编码格式的音频同时播放而导致的一种音频数据无法正常播放问题的出现。

Description

一种显示设备及声音再现方法
技术领域
本申请实施例涉及显示技术。更具体地讲,涉及一种显示设备及声音再现方法。
背景技术
当前,由于显示设备可以为用户提供诸如音频、视频、图片等的播放画面,受到用户的广泛关注。随着大数据与人工智能的发展,用户对显示设备的功能需求与日俱增。例如,用户想要播放显示画面的同时,与朋友进行视频聊天;或者,当用户在游戏场景中,实时与游戏队友聊天;或者,用户在教育类应用程序中,在学习当前画面内容的同时,实时与家长/老师进行远程音视频互动等“边看边聊”的需求。
基于用户上述“边看边聊” 的需求,可以在显示设备上安装一摄像头,通过摄像头采集用户的聊天视频,以满足用户在观看视频的同时可以进行视频聊天。
在实际应用的过程中,视频聊天时输出的声音为PCM(Pulse Code Modulation,脉冲编码调制格式)编码格式的音频数据,而同时播放的片源的声音为杜比或AAC(Advanced Audio Coding,高级音频编码)编码格式的音频数据。在“边看边聊”的应用场景下,显示设备同时接收两种编码格式的音频数据,但是,显示设备在芯片底层处理时是无法同时识别并处理两种不同的音频编码格式的音频数据,在两种功能同时进行时,其中一种编码格式的音频数据无法播放出来。
发明内容
基于上述技术问题,本申请的目的在于提供一种声音再现方法及显示设备。
本申请实施例第一方面示出一种显示设备,包括:
声音再现器,被配置为再现声音信号;
第一芯片,所述第一芯片包括第一音频处理器,所述第一音频处理器还被配置为,通过输入接口接收音频数据,所述音频数据包括多媒体音频数据和聊天音频数据;
若所述聊天音频数据的编码格式和所述多媒体音频数据的编码格式不同,将所述多媒体音频数据的编码格式进行转换生成转换后的多媒体音频数据;
混音所述转换后的多媒体音频数据和所述聊天音频数据,生成第三音频数据;
第二芯片,所述第二芯片包括第二音频处理器,所述第二音频处理器被配置为,接收来自于所述第一音频处理器输出的第三音频数据,将所述第三音频数据输出到所述声音再现器。
本申请实施例第二方面示出一种声音再现方法,所述方法应用于显示设备,所述显示设备包括:声音再现器,第一芯片和第二芯片;
第一芯片,通过输入接口接收音频数据,所述音频数据包括多媒体音频数据和聊天音频数据;
若所述聊天音频数据的编码格式和所述多媒体音频数据的编码格式不同,将所述多媒体音频数据的编码格式进行转换生成转换后的多媒体音频数据;
混音所述转换后的多媒体音频数据和所述聊天音频数据,生成第三音频数据;
第二芯片,接收第三音频数据,将所述第三音频数据输出到所述声音再现器。
由以上技术方案可知,本申请实施例示出一种显示设备及声音再现方法。同时有聊天音频数据和多媒体音频数据输入显示设备时,显示设备将多媒体音频数据的编码格式转为聊天音频数据的编码格式,将两种编码格式的音频数据转化为同一种编码格式的音频数据,进而避免了有两种不同编码格式的音频同时播放而导致的一种音频数据无法正常播放问题的出现。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图;
图2中示例性示出了根据实施例中控制装置100的硬件配置框图;
图3中示例性示出了根据实施例中显示设备200的硬件配置框图;
图4中示例性示出了根据图3显示设备200的硬件架构框图;
图5中示例性示出了根据实施例中显示设备200的功能配置示意图;
图6a中示例性示出了根据实施例中显示设备200中软件配置示意图;
图6b中示例性示出了根据实施例中显示设备200中应用程序的配置示意图;
图7中示例性示出了根据实施例中显示设备200中用户界面的示意图;
图8为根据一优选实施例示出的一种显示设备的结构框图;
图9为根据一优选实施例示出的一种声音再现方法的流程图。
具体实施方式
为使本申请示例性实施例的目的、技术方案和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
为便于用户使用,显示设备上通常会设置各种外部装置接口,以便于连接不同的外设设备或线缆以实现相应的功能。而在显示设备的接口上连接有高清晰度的摄像头时,如果显示设备的硬件系统没有接收源码的高像素摄像头的硬件接口,那么就会导致无法将摄像头接收到的数据呈现到显示设备的显示屏上。
并且,受制于硬件结构,传统显示设备的硬件系统仅支持一路硬解码资源,且通常最大仅能支持4K分辨率的视频解码,因此当要实现边观看网络电视边进行视频聊天时,为了不降低网络视频画面清晰度,就需要使用硬解码资源(通常是硬件系统中的GPU)对网络视频进行解码,而在此情况下,只能采取由硬件系统中的通用处理器(例如CPU)对视频进行软解码的方式处理视频聊天画面。
采用软解码处理视频聊天画面,会大大增加CPU的数据处理负担,当CPU的数据处理负担过重时,可能会出现画面卡顿或者不流畅的问题。进一步的,受制于CPU的数据处理能力,当采用CPU软解码处理视频聊天画面时,通常无法实现多路视频通话,当用户想要再同一聊天场景同时与多个其他用户进行视频聊天时,会出现接入受阻的情况。
基于上述各方面的考虑,为克服上述缺陷,本申请公开了一种双硬件系统架构,以实现多路视频聊天数据(至少一路本地视频)。
下面首先结合附图对本申请所涉及的概念进行说明。在此需要指出的是,以下对各个概念的说明,仅为了使本申请的内容更加容易理解,并不表示对本申请保护范围的限定。
本申请各实施例中使用的术语“模块”,可以是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
本申请各实施例中使用的术语“遥控器”,是指电子设备(如本申请中公开的显示设备)的一个组件,该组件通常可在较短的距离范围内无线控制电子设备。该组件一般可以使用红外线和/或射频(RF)信号和/或蓝牙与电子设备连接,也可以包括WiFi、无线USB、蓝牙、动作传感器等功能模块。例如:手持式触摸遥控器,是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。
本申请各实施例中使用的术语“手势”,是指用户通过一种手型的变化或手部运动等动作,用于表达预期想法、动作、目的/或结果的用户行为。
本申请各实施例中使用的术语“硬件系统”,可以是指由集成电路(IntegratedCircuit,IC)、印刷电路板(Printed circuit board,PCB)等机械、光、电、磁器件构成的具有计算、控制、存储、输入和输出功能的实体部件。在本申请各个实施例中,硬件系统通常也会被称为主板(motherboard)或芯片。
图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图。如图1所示,用户可通过控制装置100来操作显示设备200。
其中,控制装置100可以是遥控器100A,其可与显示设备200之间通过红外协议通信、蓝牙协议通信、紫蜂(ZigBee)协议通信或其他短距离通信方式进行通信,用于通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等输入用户指令,来控制显示设备200。如:用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令,来实现控制显示设备200的功能。
控制装置100也可以是智能设备,如移动终端100B、平板电脑、计算机、笔记本电脑等,其可以通过本地网(LAN,Local Area Network)、广域网(WAN,Wide Area Network)、无线局域网((WLAN,Wireless Local Area Network)或其他网络与显示设备200之间通信,并通过与显示设备200相应的应用程序实现对显示设备200的控制。例如,使用在智能设备上运行的应用程序控制显示设备200。该应用程序可以在与智能设备关联的屏幕上通过直观的用户界面(UI,User Interface)为用户提供各种控制。
示例的,移动终端100B与显示设备200均可安装软件应用,从而可通过网络通信协议实现二者之间的连接通信,进而实现一对一控制操作的和数据通信的目的。如:可以使移动终端100B与显示设备200建立控制指令协议,将遥控控制键盘同步到移动终端100B上,通过控制移动终端100B上用户界面,实现控制显示设备200的功能;也可以将移动终端100B上显示的音视频内容传输到显示设备200上,实现同步显示功能。
如图1所示,显示设备200还可与服务器300通过多种通信方式进行数据通信。在本申请各个实施例中,可允许显示设备200通过局域网、无线局域网或其他网络与服务器300进行通信连接。服务器300可以向显示设备200提供各种内容和互动。
示例的,显示设备200通过发送和接收信息,以及电子节目指南(EPG,ElectronicProgram Guide)互动,接收软件程序更新,或访问远程储存的数字媒体库。服务器300可以是一组,也可以是多组,可以是一类或多类服务器。通过服务器300提供视频点播和广告服务等其他网络服务内容。
显示设备200,一方面讲,可以是液晶显示器、OLED(Organic Light EmittingDiode)显示器、投影显示设备;另一方面讲,显示设备被可以是智能电视或显示器和机顶盒组成的显示系统。具体显示设备类型,尺寸大小和分辨率等不作限定,本领技术人员可以理解的是,显示设备200可以根据需要做性能和配置上的一些改变。
显示设备200除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能。示例的包括,网络电视、智能电视、互联网协议电视(IPTV)等。在一些实施例中,显示设备可以不具备广播接收电视功能。
如图1所述,显示设备上可以连接或设置有摄像头,用于将摄像头拍摄到的画面呈现在本显示设备或其他显示设备的显示界面上,以实现用户之间的交互聊天。具体的,摄像头拍摄到的画面可在显示设备上全屏显示、半屏显示、或者显示任意可选区域。
作为一种可选的连接方式,摄像头通过连接板与显示器后壳连接,固定安装在显示器后壳的上侧中部,作为可安装的方式,可以固定安装在显示器后壳的任意位置,能保证其图像采集区域不被后壳遮挡即可,例如,图像采集区域与显示设备的显示朝向相同。
作为另一种可选的连接方式,摄像头通过连接板或者其他可想到的连接器可升降的与显示后壳连接,连接器上安装有升降马达,当用户要使用摄像头或者有应用程序要使用摄像头时,再升出显示器之上,当不需要使用摄像头时,其可内嵌到后壳之后,以达到保护摄像头免受损坏。
作为一种实施例,本申请所采用的摄像头可以为1600万像素,以达到超高清显示目的。在实际使用中,也可采用比1600万像素更高或更低的摄像头。
当显示设备上安装有摄像头以后,显示设备不同应用场景所显示的内容可得到多种不同方式的融合,从而达到传统显示设备无法实现的功能。
示例性的,用户可以在边观看视频节目的同时,与至少一位其他用户进行视频聊天。视频节目的呈现可作为背景画面,视频聊天的窗口显示在背景画面之上。形象的,可以称该功能为“边看边聊”。
可选的,在“边看边聊”的场景中,在观看直播视频或网络视频的同时,跨终端的进行至少一路的视频聊天。
另一示例中,用户可以在边进入教育应用学习的同时,与至少一位其他用户进行视频聊天。例如,学生在学习教育应用程序中内容的同时,可实现与老师的远程互动。形象的,可以称该功能为“边学边聊”。
另一示例中,用户在玩纸牌游戏时,与进入游戏的玩家进行视频聊天。例如,玩家在进入游戏应用参与游戏时,可实现与其他玩家的远程互动。形象的,可以称该功能为“边看边玩”。
可选的,游戏场景与视频画面进行融合,将视频画面中人像进行抠图,显示在游戏画面中,提升用户体验。
可选的,在体感类游戏中(如打球类、拳击类、跑步类、跳舞类等),通过摄像头获取人体姿势和动作,肢体检测和追踪、人体骨骼关键点数据的检测,再与游戏中动画进行融合,实现如体育、舞蹈等场景的游戏。
另一示例中,用户可以在K歌应用中,与至少一位其他用户进行视频和语音的交互。形象的,可以称该功能为“边看边唱”。可选的,当至少一位用户在聊天场景进入该应用时,可多个用户共同完成一首歌的录制。
另一个示例中,用户可在本地打开摄像头获取图片和视频,形象的,可以称该功能为“照镜子”。
在另一些示例中,还可以再增加更多功能或减少上述功能。本申请对该显示设备的功能不作具体限定。
图2中示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示,控制装置100包括控制器110、通信器130、用户输入/输出接口140、存储器190、供电电源180。
控制装置100被配置为可控制所述显示设备200,以及可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起到用户与显示设备200之间交互中介作用。如:用户通过操作控制装置100上频道加减键,显示设备200响应频道加减的操作。
在一些实施例中,控制装置100可是一种智能设备。如:控制装置100可根据用户需求安装控制显示设备200的各种应用。
在一些实施例中,如图1所示,移动终端100B或其他智能电子设备,可在安装操控显示设备200的应用之后,起到控制装置100类似功能。如:用户可以通过安装应用,在移动终端100B或其他智能电子设备上可提供的图形用户界面的各种功能键或虚拟按钮,以实现控制装置100实体按键的功能。
控制器110包括处理器112、RAM113和ROM114、通信接口以及通信总线。控制器110用于控制控制装置100的运行和操作,以及内部各部件之间通信协作以及外部和内部的数据处理功能。
通信器130在控制器110的控制下,实现与显示设备200之间控制信号和数据信号的通信。如:将接收到的用户输入信号发送至显示设备200上。通信器130可包括WIFI模块131、蓝牙模块132、NFC模块133等通信模块中至少一种。
用户输入/输出接口140,其中,输入接口包括麦克风141、触摸板142、传感器143、按键144等输入接口中至少一者。如:用户可以通过语音、触摸、手势、按压等动作实现用户指令输入功能,输入接口通过将接收的模拟信号转换为数字信号,以及数字信号转换为相应指令信号,发送至显示设备200。
输出接口包括将接收的用户指令发送至显示设备200的接口。在一些实施例中,可以是红外接口,也可以是射频接口。如:红外信号接口时,需要将用户输入指令按照红外控制协议转化为红外控制信号,经红外发送模块进行发送至显示设备200。再如:射频信号接口时,需将用户输入指令转化为数字信号,然后按照射频控制信号调制协议进行调制后,由射频发送端子发送至显示设备200。
在一些实施例中,控制装置100包括通信器130和输出接口中至少一者。控制装置100中配置通信器130,如:WIFI、蓝牙、NFC等模块,可将用户输入指令通过WIFI协议、或蓝牙协议、或NFC协议编码,发送至显示设备200.
存储器190,用于在控制器110的控制下存储驱动和控制控制装置100的各种运行程序、数据和应用。存储器190,可以存储用户输入的各类控制信号指令。
供电电源180,用于在控制器110的控制下为控制装置100各元件提供运行电力支持。可以电池及相关控制电路。
图3中示例性示出了根据示例性实施例中显示设备200中硬件系统的硬件配置框图。
在采用双硬件系统架构时,硬件系统的机构关系可以图3所示。为便于表述以下将双硬件系统架构中的一个硬件系统称为第一硬件系统或A系统、A芯片,并将另一个硬件系统称为第二硬件系统或N系统、N芯片。A芯片包含A芯片的控制器及通过各类接口与A芯片的控制器相连的各类模块,N芯片则包含N芯片的控制器及通过各类接口与N芯片的控制器相连的各类模块。A芯片及N芯片中可以各自安装有相对独立的操作系统,A芯片的操作系统和N芯片的操作系统可以通过通信协议相互通信,示例性的:A芯片的操作系统的framework层和N芯片的操作系统的framework层可以进行通信进行命令和数据的传输,从而使显示设备200中存在两个在独立但又存在相互关联的子系统。
如图3所示,A芯片与N芯片之间可以通过多个不同类型的接口实现连接、通信及供电。A芯片与N芯片之间接口的接口类型可以包括通用输入输出接口(General-purposeinput/output,GPIO)、USB接口、HDMI接口、UART接口等。A芯片与N芯片之间可以使用这些接口中的一个或多个进行通信或电力传输。例如图3所示,在双硬件系统架构下,可以由外接的电源(power)为N芯片供电,而A芯片则可以不由外接电源,而由N芯片供电。
除用于与N芯片进行连接的接口之外,A芯片还可以包含用于连接其他设备或组件的接口,例如图3中所示的用于连接摄像头(Camera)的MIPI接口,蓝牙接口等。
类似的,除用于与N芯片进行连接的接口之外,N芯片还可以包含用于连接显示屏TCON(Timer Control Register)的VBY接口,用于连接功率放大器(Amplifier,AMP)及扬声器(Speaker)的i2S接口;以及IR/Key接口,USB接口,Wifi接口,蓝牙接口,HDMI接口,Tuner接口等。
下面结合图4对本申请双硬件系统架构进行进一步的说明。需要说明的是图4仅仅是对本申请双硬件系统架构的一个示例性说明,并不表示对本申请的限定。在实际应用中,两个硬件系统均可根据需要包含更多或更少的硬件或接口。
图4中示例性示出了根据图3显示设备200的硬件架构框图。如图4所示,显示设备200的硬件系统可以包括A芯片和N芯片,以及通过各类接口与A芯片或N芯片相连接的模块。
N芯片可以包括调谐解调器220、通信器230、外部装置接口250、控制器210、存储器290、聊天输入接口、视频处理器260-1、显示器280、音频输出接口270、供电电源。在其他实施例中N芯片也可以包括更多或更少的模块。
其中,调谐解调器220,用于对通过有线或无线方式接收广播电视信号,进行放大、混频和谐振等调制解调处理,从而从多个无线或有线广播电视信号中解调出用户所选择电视频道的频率中所携带的音视频信号,以及附加信息(例如EPG数据信号)。根据电视信号广播制式不同,调谐解调器220的信号途径可以有很多种,诸如:地面广播、有线广播、卫星广播或互联网广播等;以及根据调制类型不同,所述信号的调整方式可以数字调制方式,也可以模拟调制方式;以及根据接收电视信号种类不同,调谐解调器220可以解调模拟信号和/或数字信号。
调谐解调器220,还用于根据用户选择,以及由控制器210控制,响应用户选择的电视频道频率以及该频率所携带的电视信号。
在其他一些示例性实施例中,调谐解调器220也可在外置设备中,如外置机顶盒等。这样,机顶盒通过调制解调后输出电视音视频信号,经过外部装置接口250输入至显示设备200中。
通信器230是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如: 通信器230可以包括WIFI模块231,蓝牙通信协议模块232,有线以太网通信协议模块233,及红外通信协议模块等其他网络通信协议模块或近场通信协议模块。
显示设备200可以通过通信器230与外部控制设备或内容提供设备之间建立控制信号和数据信号的连接。例如,通信器可根据控制器的控制接收遥控器100的控制信号。
外部装置接口250,是提供N芯片控制器210和A芯片及外部其他设备间数据传输的组件。外部装置接口可按照有线/无线方式与诸如机顶盒、游戏装置、笔记本电脑等的外部设备连接,可接收外部设备的诸如视频信号(例如运动图像)、音频信号(例如音乐)、附加信息(例如EPG)等数据。
其中,外部装置接口250可以包括:高清多媒体接口(HDMI)端子也称之为HDMI251、复合视频消隐同步(CVBS)端子也称之为AV252、模拟或数字分量端子也称之为分量253、通用串行总线(USB)端子254、红绿蓝(RGB)端子(图中未示出)等任一个或多个。本申请不对外部装置接口的数量和类型进行限制。
控制器210,通过运行存储在存储器290上的各种软件控制程序(如操作系统和/或各种应用程序),来控制显示设备200的工作和响应用户的操作。
如图4所示,控制器210包括只读存储器RAM213、随机存取存储器ROM214、图形处理器216、CPU处理器212、通信接口218、以及通信总线。其中,RAM213和ROM214以及图形处理器216、CPU处理器212、通信接口218通过总线相连接。
ROM213,用于存储各种系统启动的指令。如在收到开机信号时,显示设备200电源开始启动,CPU处理器212运行ROM中系统启动指令,将存储在存储器290的操作系统拷贝至RAM214中,以开始运行启动操作系统。当操作系统启动完成后,CPU处理器212再将存储器290中各种应用程序拷贝至RAM214中,然后,开始运行启动各种应用程序。
图形处理器216,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等。包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象。以及包括渲染器,产生基于运算器得到的各种对象,进行渲染的结果显示在显示器280上。
CPU处理器212,用于执行存储在存储器290中操作系统和应用程序指令。以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。
在一些示例性实施例中,CPU处理器212,可以包括多个处理器。所述多个处理器中可包括一个主处理器以及多个或一个子处理器。主处理器,用于在预加电模式中执行显示设备200一些操作,和/或在正常模式下显示画面的操作。多个或一个子处理器,用于执行在待机模式等状态下的一种操作。
通信接口,可包括第一接口218-1到第n接口218-n。这些接口可以是经由网络被连接到外部设备的网络接口。
控制器210可以控制显示设备200的整体操作。例如: 响应于接收到用于选择在显示器280上显示UI对象的用户命令,控制器210便可以执行与由用户命令选择的对象有关的操作。
其中,所述对象可以是可选对象中的任何一个,例如超链接或图标。与所选择的对象有关操作,例如:显示连接到超链接页面、文档、图像等操作,或者执行与图标相对应程序的操作。用于选择UI对象用户命令,可以是通过连接到显示设备200的各种输入装置(例如,鼠标、键盘、触摸板等)输入命令或者与由用户说出语音相对应的语音命令。
存储器290,包括存储用于驱动和控制显示设备200的各种软件模块。如:存储器290中存储的各种软件模块,包括:基础模块、检测模块、通信模块、显示控制模块、浏览器模块2912-1、和各种服务模块等。
其中,基础模块是用于显示设备200中各个硬件之间信号通信、并向上层模块发送处理和控制信号的底层软件模块。检测模块是用于从各种传感器或聊天输入接口中收集各种信息,并进行数模转换以及分析管理的管理模块。
例如:语音识别模块中包括语音解析模块和语音指令数据库模块。显示控制模块是用于控制显示器280进行显示图像内容的模块,可以用于播放多媒体图像内容和UI界面等信息。通信模块,是用于与外部设备之间进行控制和数据通信的模块。浏览器模块2912-1,是用于执行浏览服务器之间数据通信的模块。服务模块,是用于提供各种服务以及各类应用程序在内的模块。
同时,存储器290还用于存储接收外部数据和用户数据、各种用户界面中各个项目的图像以及焦点对象的视觉效果图等。
聊天输入接口,用于将用户的输入信号发送给控制器210,或者,将从控制器输出的信号传送给用户。示例性的,控制装置(例如移动终端或遥控器)可将用户输入的诸如电源开关信号、频道选择信号、音量调节信号等输入信号发送至聊天输入接口,再由聊天输入接口转送至控制器;或者,控制装置可接收经控制器处理从聊天输入接口输出的音频、视频或数据等输出信号,并且显示接收的输出信号或将接收的输出信号输出为音频或振动形式。
在一些实施例中,用户可在显示器280上显示的图形用户界面(GUI)输入用户命令,则聊天输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则聊天输入接口通过传感器识别出声音或手势,来接收用户输入命令。
视频处理器260-1,用于接收视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频数据处理,可得到直接在显示器280上显示或播放的视频信号。
示例的,视频处理器260-1,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。
其中,解复用模块,用于对输入音视频数据流进行解复用处理,如输入MPEG-2,则解复用模块进行解复用成视频信号和音频信号等。
视频解码模块,用于对解复用后的视频信号进行处理,包括解码和缩放处理等。
图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频画面进行叠加混合处理,以生成可供显示的图像信号。
帧率转换模块,用于对输入视频的帧率进行转换,如将输入的24Hz、25Hz、30Hz、60Hz视频的帧率转换为60Hz、120Hz或240Hz的帧率,其中,输入帧率可以与源视频流有关,输出帧率可以与显示器的更新率有关。输入有通常的格式采用如插帧方式实现。
显示格式化模块,用于将帧率转换模块输出的信号,改变为符合诸如显示器显示格式的信号,如将帧率转换模块输出的信号进行格式转换以输出RGB数据信号。
显示器280,用于接收源自视频处理器260-1输入的图像信号,进行显示视频内容和图像以及菜单操控界面。显示器280包括用于呈现画面的显示器组件以及驱动图像显示的驱动组件。显示视频内容,可以来自调谐解调器220接收的广播信号中的视频,也可以来自通信器或外部设备接口输入的视频内容。显示器280,同时显示显示设备200中产生且用于控制显示设备200的用户操控界面UI。
以及,根据显示器280类型不同,还包括用于驱动显示的驱动组件。或者,倘若显示器280为一种投影显示器,还可以包括一种投影装置和投影屏幕。
得到可以在扬声器272中播放的音频信号。
音频输出接口270,用于在控制器210的控制下音频输出接口可包括扬声器272,或输出至外接设备的发生装置的外接音响输出端子274,如:外接音响端子或耳机输出端子等。
在其他一些示例性实施例中,视频处理器260-1可以包括一个或多个芯片组成。
以及,在其他一些示例性实施例中,视频处理器260-1,可以为单独的芯片,也可以与控制器210一起集成在一个或多个芯片中。
供电电源,用于在控制器210控制下,将外部电源输入的电力为显示设备200提供电源供电支持。供电电源可以包括安装显示设备200内部的内置电源电路,也可以是安装在显示设备200外部的电源,如在显示设备200中提供外接电源的电源接口。
与N芯片相类似,如图4所示,A芯片可以包括控制器310、通信器330、检测器340、存储器390。在某些实施例中还可以包括聊天输入接口、视频处理器、音频处理器、显示器、音频输出接口。在某些实施例中,也可以存在独立为A芯片供电的供电电源。
通信器330是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如: 通信器330可以包括WIFI模块331,蓝牙通信协议模块332,有线以太网通信协议模块333,及红外通信协议模块等其他网络通信协议模块或近场通信协议模块。
A芯片的通信器330和N芯片的通信器230也有相互交互。例如,N芯片硬件系统内的WiFi模块231用于连接外部网络,与外部服务器等产生网络通信。A芯片硬件系统内的WiFi模块331用于连接至N芯片的WiFi模块231,而不与外界网络等产生直接连接,A芯片通过N芯片连接外部网络。因此,对于用户而言,一个如上述实施例中的显示设备至对外显示一个WiFi账号。
检测器340,是显示设备A芯片用于采集外部环境或与外部交互的信号的组件。检测器340可以包括光接收器342,用于采集环境光线强度的传感器,可以通过采集环境光来自适应显示参数变化等;还可以包括图像采集器341,如相机、摄像头等,可以用于采集外部环境场景,以及用于采集用户的属性或与用户交互手势,可以自适应变化显示参数,也可以识别用户手势,以实现与用户之间互动的功能。
外部装置接口350,提供控制器310与N芯片或外部其他设备间数据传输的组件。外部装置接口可按照有线/无线方式与诸如机顶盒、游戏装置、笔记本电脑等的外部设备连接。
视频处理器360-1,用于处理相关视频信号。
音频处理器360-2,用于处理相关音频信号
控制器310,通过运行存储在存储器390上的各种软件控制程序(如用安装的第三方应用等),以及与N芯片的交互,来控制显示设备200的工作和响应用户的操作。
如图4所示,控制器310包括只读存储器ROM313、随机存取存储器RAM314、图形处理器316、CPU处理器312、通信接口318、以及通信总线。其中,ROM313和RAM314以及图形处理器316、CPU处理器312、通信接口318通过总线相连接。
ROM313,用于存储各种系统启动的指令。CPU处理器312运行ROM中系统启动指令,将存储在存储器390的操作系统拷贝至RAM314中,以开始运行启动操作系统。当操作系统启动完成后,CPU处理器312再将存储器390中各种应用程序拷贝至RAM314中,然后,开始运行启动各种应用程序。
CPU处理器312,用于执行存储在存储器390中操作系统和应用程序指令,和与N芯片进行通信、信号、数据、指令等传输与交互,以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。
通信接口318为多个。这些接口可以是经由网络被连接到外部设备的网络接口,也可以是经由网络被连接到N芯片的网络接口。
音频处理器360-2,用于接收音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等音频数据处理。
控制器310可以控制显示设备200的整体操作。例如: 响应于接收到用于选择在显示器280上显示UI对象的用户命令,控制器210便可以执行与由用户命令选择的对象有关的操作。
图形处理器316,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等。包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象。以及包括渲染器,产生基于运算器得到的各种对象,进行渲染的结果显示在显示器280上。
A芯片的图形处理器316与N芯片的图形处理器216均能产生各种图形对象。区别性的,若应用1安装于A芯片,应用2安装在N芯片,当用户在应用1的界面,且在应用1内进行用户输入的指令时,由A芯片图形处理器316产生图形对象。当用户在应用2的界面,且在应用2内进行用户输入的指令时,由N芯片的图形处理器216产生图形对象。
图5中示例性示出了根据示例性实施例中显示设备的功能配置示意图。
如图5所示,A芯片的存储器390和N芯片的存储器290分别用于存储操作系统、应用程序、内容和用户数据等,在A芯片的控制器310和N芯片的控制器210的控制下执行驱动显示设备200的系统运行以及响应用户的各种操作。A芯片的存储器390和N芯片的存储器290可以包括易失性和/或非易失性存储器。
对于N芯片,存储器290,具体用于存储驱动显示设备200中控制器210的运行程序,以及存储显示设备200内置各种应用程序,以及用户从外部设备下载的各种应用程序、以及与应用程序相关的各种图形用户界面,以及与图形用户界面相关的各种对象,用户数据信息,以及各种支持应用程序的内部数据。存储器290用于存储操作系统(OS)内核 、中间件和应用等系统软件,以及存储输入的视频数据和音频数据、及其他用户数据。
存储器290,具体用于存储视频处理器260-1、显示器280、通信器230、调谐解调器220、输入/输出接口等驱动程序和相关数据。
在一些实施例中,存储器290可以存储软件和/或程序,用于表示操作系统(OS)的软件程序包括,例如:内核、中间件、应用编程接口(API)和/或应用程序。示例性的,内核可控制或管理系统资源,或其它程序所实施的功能(如所述中间件、API或应用程序),以及内核可以提供接口,以允许中间件和API,或应用访问控制器,以实现控制或管理系统资源。
示例的,存储器290,包括广播接收模块2901、频道控制模块2902、音量控制模块2903、图像控制模块2904、显示控制模块2905、第一音频控制模块2906、外部指令识别模块2907、通信控制模块2908、光接收模块、电力控制模块2910、操作系统2911、以及其他应用程序2912、浏览器模块2912-1等等。控制器210通过运行存储器290中各种软件程序,来执行诸如:广播电视信号接收解调功能、电视频道选择控制功能、音量选择控制功能、图像控制功能、显示控制功能、音频控制功能、外部指令识别功能、通信控制功能、光信号接收功能、电力控制功能、支持各种功能的软件操控平台、以及浏览器功能等各类功能。
存储器390,包括存储用于驱动和控制显示设备200的各种软件模块。如:存储器390中存储的各种软件模块,包括:基础模块、检测模块、通信模块、显示控制模块、浏览器模块3913、和各种服务模块等。由于存储器390与存储器290的功能比较相似,相关之处参见存储器290即可,在此就不再赘述。
示例的,存储器390,包括图像控制模块3904、第二音频控制模块3906、外部指令识别模块3907、通信控制模块3908、光接收模块3909、操作系统3911、以及其他应用程序3912、浏览器模块3913等等。控制器210通过运行存储器290中各种软件程序,来执行诸如:图像控制功能、显示控制功能、音频控制功能、外部指令识别功能、通信控制功能、光信号接收功能、电力控制功能、支持各种功能的软件操控平台、以及浏览器功能等各类功能。
区别性的,N芯片的外部指令识别模块2907和A芯片的外部指令识别模块3907可识别不同的指令。
示例性的,由于摄像头等图像接收设备与A芯片连接,因此,A芯片的外部指令识别模块3907可包括图形识别模块3907-1,图形识别模块3907-1内存储有图形数据库,摄像头接收到外界的图形指令时,与图形数据库中的指令进行对应关系,以对显示设备作出指令控制。而由于语音接收设备以及遥控器与N芯片连接,因此,N芯片的外部指令识别模块2907可包括语音识别模块2907-2,语音识别模块2907-2内存储有语音数据库,语音接收设备等接收到外界的语音指令或时,与语音数据库中的指令进行对应关系,以对显示设备作出指令控制。同样的,遥控器等控制装置100与N芯片连接,由按键指令识别模块2907-3与控制装置100进行指令交互。
图6a中示例性示出了根据示例性实施例中显示设备200中软件系统的配置框图。
对N芯片,如图6a中所示,操作系统2911,包括用于处理各种基础系统服务和用于实施硬件相关任务的执行操作软件,充当应用程序和硬件组件之间完成数据处理的媒介。
一些实施例中,部分操作系统内核可以包含一系列软件,用以管理显示设备硬件资源,并为其他程序或软件代码提供服务。
其他一些实施例中,部分操作系统内核可包含一个或多个设备驱动器,设备驱动器可以是操作系统中的一组软件代码,帮助操作或控制显示设备关联的设备或硬件。驱动器可以包含操作视频、音频和/或其他多媒体组件的代码。示例的,包括显示器、摄像头、Flash、WiFi和音频驱动器。
其中,可访问性模块2911-1,用于修改或访问应用程序,以实现应用程序的可访问性和对其显示内容的可操作性。
通信模块2911-2,用于经由相关通信接口和通信网络与其他外设的连接。
用户界面模块2911-3,用于提供显示用户界面的对象,以供各应用程序访问,可实现用户可操作性。
控制应用程序2911-4,用于控制进程管理,包括运行时间应用程序等。
事件传输系统2914,可在操作系统2911内或应用程序2912中实现。一些实施例中,一方面在在操作系统2911内实现,同时在应用程序2912中实现,用于监听各种用户输入事件,将根据各种事件指代响应各类事件或子事件的识别结果,而实施一组或多组预定义的操作的处理程序。
其中,事件监听模块2914-1,用于监听聊天输入接口输入事件或子事件。
事件识别模块2914-2,用于对各种聊天输入接口输入各类事件的定义,识别出各种事件或子事件,且将其传输给处理用以执行其相应一组或多组的处理程序。
其中,事件或子事件,是指显示设备200中一个或多个传感器检测的输入,以及外界控制设备(如控制装置100等)的输入。如:语音输入各种子事件,手势识别的手势输入子事件,以及控制装置的遥控按键指令输入的子事件等。示例的,遥控器中一个或多个子事件包括多种形式,包括但不限于按键按上/下/左右/、确定键、按键按住等中一个或组合。以及非实体按键的操作,如移动、按住、释放等操作。
界面布局管理模块2913,直接或间接接收来自于事件传输系统2914监听到各用户输入事件或子事件,用于更新用户界面的布局,包括但不限于界面中各控件或子控件的位置,以及容器的大小或位置、层级等与界面布局相关各种执行操作。
由于A芯片的操作系统3911与N芯片的操作系统2911的功能比较相似,相关之处参见操作系统2911即可,在此就不再赘述。
如图6b中所示,显示设备的应用程序层包含可在显示设备200执行的各种应用程序。
N芯片的应用程序层2912可包含但不限于一个或多个应用程序,如:视频点播应用程序、应用程序中心、游戏应用等。A芯片的应用程序层3912可包含但不限于一个或多个应用程序,如:直播电视应用程序、媒体中心应用程序等。需要说明的是,A芯片和N芯片上分别包含什么应用程序是根据操作系统和其他设计确定的,本发明无需对A芯片和N芯片上所包含的应用程序做具体的限定和划分。
直播电视应用程序,可以通过不同的信号源提供直播电视。例如,直播电视应用程可以使用来自有线电视、无线广播、卫星服务或其他类型的直播电视服务的输入提供电视信号。以及,直播电视应用程序可在显示设备200上显示直播电视信号的视频。
视频点播应用程序,可以提供来自不同存储源的视频。不同于直播电视应用程序,视频点播提供来自某些存储源的视频显示。例如,视频点播可以来自云存储的服务器端、来自包含已存视频节目的本地硬盘储存器。
媒体中心应用程序,可以提供各种多媒体内容播放的应用程序。例如,媒体中心,可以为不同于直播电视或视频点播,用户可通过多媒体中心应用程序访问各种图像或音频所提供服务。
应用程序中心,可以提供储存各种应用程序。应用程序可以是一种游戏、应用程序,或某些和计算机系统或其他设备相关但可以在显示设备中运行的其他应用程序。应用程序中心可从不同来源获得这些应用程序,将它们储存在本地储存器中,然后在显示设备200上可运行。
图7中示例性示出了根据示例性实施例中显示设备200中用户界面的示意图。如图7所示,用户界面包括多个视图显示区,示例的,第一视图显示区201和播放画面202,其中,播放画面包括布局一个或多个不同项目。以及用户界面中还包括指示项目被选择的选择器,可通过用户输入而移动选择器的位置,以改变选择不同的项目。
需要说明的是,多个视图显示区可以呈现不同层级的显示画面。如,第一视图显示区可呈现视频聊天项目内容,第二视图显示区可呈现应用层项目内容(如,网页视频、VOD展示、应用程序画面等)。
可选的,不同视图显示区的呈现存在优先级区别,优先级不同的视图显示区之间,视图显示区的显示优先级不同。如,系统层的优先级高于应用层的优先级,当用户在应用层使用获取选择器和画面切换时,不遮挡系统层的视图显示区的画面展示;以及,根据用户的选择使应用层的视图显示区的大小和位置发生变化时,系统层的视图显示区的大小和位置不受影响。
基于用户上述“边看边聊” 的需求,可以在显示设备上安装一摄像头和麦克风,通过摄像头和麦克风采集用户的聊天视频,以满足用户在观看视频的同时可以进行视频聊天。在实际应用的过程中,视频聊天时输出的声音为PCM(Pulse Code Modulation, 脉冲编码调制格式)编码格式的音频数据,而同时播放的片源的声音为杜比或DTS(DigitalTheater System,数字化影院系统编码)编码格式的音频数据。在“边看边聊”的应用场景下,显示设备同时接收两种编码格式的音频数据,但是,显示设备在芯片底层处理时是无法同时识别并处理两种不同的音频编码格式的音频数据,在两种功能同时进行时,其中一种编码格式的音频数据无法播放出来。
基于上述技术问题,本申请示出第一方面示出一种显示设备,具体的,可以参阅图8,显示设备包括:声音再现器301,第一芯片302,所述第一芯片302包括第一音频处理器302-1,第二芯片303,所述第二芯片303包括第二音频处理器303-1。
其中,声音再现器301,被配置为再现声音信号;
所述第一芯片302包括第一音频处理器302-1,所述第一音频处理器302-1还被配置为,通过输入接口302-2接收音频数据,所述音频数据包括多媒体音频数据和聊天音频数据;若所述聊天音频数据的编码格式和所述多媒体音频数据的编码格式不同,将所述多媒体音频数据的编码格式进行转换生成转换后的多媒体音频数据;混音所述转换后的多媒体音频数据和所述聊天音频数据,生成第三音频数据。
其中,为了描述方便,图4和图5中第一芯片310与图8中的第一芯片302对应,图4和图5中第二芯片210与图8 中的303对应,图4中扬声器272与图8中的声音再现器301对应。以下不再指出。
在本申请实施例示出的技术方案中,根据应用场景区分音频数据。举例说明:本申请实施例示出的音频数据可以划分为聊天音频数据和多媒体音频数据,其中,所述聊天音频数据为麦克风采集的聊天语音的模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的生成音频数据。相应的聊天音频数据的编码格式为PCM(Pulse Code Modulation, 脉冲编码调制格式)。在本申请实施例示出的技术方案中,PCM编码格式也称之为第一编码格式。
多媒体音频数据为来源于网络或本地存储的音频数据。通常多媒体音频数据更加注重音频的保真度和数据的体积的大小,通常,小体积的音频数据传输速率更快。由于PCM编码方式的音频数据体积较大,同时PCM编码格式的音频数据在编码的过程中会产生失真,因此,PCM编码方式不适用于多媒体音频数据。因此在本申请实施例示出的技术方案中多媒体音频数据采用的编码方式为非PCM编码方式,相应的媒体音频数据编码格式为非PCM编码格式。在本申请实施例示出的技术方案中非PCM编码格式可以为:DTS编码格式或杜比编码格式等编码格式。
由于,本申请实施例示出的技术方案适用于“边看边聊”的应用场景。在“边看边聊”的应用场景下显示设备接收的两路音频数据分别为多媒体音频数据和聊天音频数据。相应的聊天音频数据为PCM编码格式的音频数据,多媒体音频数据为非PCM编码格式的音频数据,在实际播放的过程中两路音频数据不能被同时播放。基于上述问题,本申请示出的方案采用的方式为首先解码非PCM编码格式的多媒体音频数据,然后将解码后的多媒体音频数据按照PCM编码规则进行编码,最后将两路PCM编码格式的音频数据混合,进而实现将两种编码格式的音频数据转化为同一种编码格式的音频数据,保证两路音频数据可以被同时播放。
下面对音频数据的处理过程作以详细的说明。
在本申请实施例示出的显示设备的应用过程中,多媒体音频数据和聊天音频数据可以同时传输至输入接口,也可以先后传输至聊天输入接口。
通常,在本申请实施例示出的显示设备设置有两个输入接口302-2,其中一个输入接口302-2为用于接收聊天音频数据的聊天输入接口302-2a,另一个为用于接收多媒体音频数据的多媒体输入接口302-2b;其中,每个输入接口302-2被配置有标识值,所述标识值包括第一标识值,其中,第一标识值用于标识相应的输入接口有音频数据正在传输。
当显示设备监测到一个输入接口302-2存在音频数据正在传输时,所述第一音频处理器302-1通过读取另一输入接口302-2的标识值以确定另一输入接口302-2是否存在音频数据正在传输。举例说明,响应于所述聊天输入接口302-2a有聊天音频数据输入,第一音频处理器302-1还被配置为,读取所述多媒体输入接口302-2b的标识值;响应于所述多媒体输入接口302-2b的标识值为第一标识值,第一音频处理器302-1获知此时有多媒体音频数据正在播放。此应用场景可以称之为“先看后聊”应用场景。或响应于所述多媒体输入接口302-2b中有多媒体音频数据输入,所述第一音频处理器302-1读取所述聊天输入接口302-2a的标识值,响应于所述聊天输入接口302-2a的标识值为第一标识值,第一音频处理器302-1获知此时有聊天音频数据正在播放。此应用场景可以称之为“先聊后看”应用场景。
对于“先看后聊”的应用场景,后接收的音频数据为视频聊天产生的聊天音频数据,相应的在先接收的音频数据为多媒体音频数据。
首先,第一音频处理器302-1解码多媒体音频数据。
具体的解码过程为:第一音频处理器302-1获取多媒体音频数据对应的编码格式,依据所述多媒体音视频数据的编码格式选择对应的终端应用程序解码,最终生成解码后的多媒体音频数据。
可选择的,为了减小显示设备的数据数据处理量,本申请实施例示出的技术方案可以对多媒体音频数据中未播放的数据采取解码的操作。具体的,所述解码过程也可以为:记录多媒体音频数据的播放节点,解码播放节点到播放结点对应的多媒体音频数据。其中,所述播放节点为多媒体音频数据当前播放的时间节点,所述播放结点为多媒体音频数据的播放总时长。举例说明,多媒体音频数据的播放结点为4min,当播放节点为2min时,用户启动聊天功能,相应的,显示设备接收聊天音频数据。此时,显示设备接解码2min-4min对应的多媒体音频数据,生成解码后的多媒体音频数据。在本申请实施例示出的技术方案中,播放节点和播放结点都是一个相对值,为与多媒体音频数据播放起点的相对值。具体的,一个多媒体音频数据10点20起播,10点25对应的播放节点为5分钟。
然后,根据第一编码格式的编码规则,编码所述解码后的多媒体音频数据,生成转换后的多媒体音频数据;
具体的编码过程为:将解码后的多媒体音频数据多媒体音频数据每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的生成转换后的多媒体音频数据。
最后,混音处理后的所述多媒体音频数据和所述聊天音频数据,生成第三音频数据。
混音,混音可以采用最简便的线性累加的方法进行累加。具体的,处理后的所述多媒体音频数据为A1.PCM和聊天音频数据A2.PCM,将这两个文件转换混合并生成A1+A2.PCM。
在混音之前可以预先判断处理后的所述多媒体音频数据和所述聊天音频数据是否具有相同的采样率、帧长、位深、声道数。如果处理后的所述多媒体音频数据和所述聊天音频数据对应的采样率、帧长、位深、声道数任意一项存在差异,则预先处理两个音频数据,使其具有相同的采样率、帧长、位深、声道数。这样把两个音频数据的格式、采样率、帧长、位深和声道数对齐了以后,便可以将两个音频数据混合。
值得注意的是,在对多媒体音频数据进行格式转换的过程中,聊天音频数据持续传输给第二芯片303,以此同时多媒体音频数据停止输出。在多媒体音频数据的编码格式转换完成后,混音处理后的所述多媒体音频数据和所述聊天音频数据,生成第三音频数据,将第三音频数据传输给第二芯片。
本申请实施例输出的显示设备通过第一音频处理器302-1将多媒体音频数据的解码,编码处理,将两种编码格式的音频数据转化为同一种编码格式的音频数据,进而保证两路音频数据可以被同时播放。
对于“先聊后看”的应用场景,先接收的音频数据为视频聊天产生的聊天音频数据,相应的后接收的音频数据为多媒体音频数据。
第一音频处理器302-1首先,直接将接收到的多媒体音频数据,进行解码。具体的解码过程可以参阅上述“先看后聊”的应用场景在此由于篇幅有限便不详细说明。
然后,根据第一编码格式的编码规则,编码所述解码后的多媒体音频数据,生成转换后的多媒体音频数据;具体的编码过程可以参阅上述“先看后聊”的应用场景在此由于篇幅有限便不详细说明。
最后,混音处理后的所述多媒体音频数据和所述聊天音频数据,生成第三音频数据。具体的混音过程可以参阅上述“先看后聊”的应用场景在此由于篇幅有限便不详细说明。
值得注意的是,在对多媒体音频数据进行格式转换的过程中,聊天音频数据持续的传输给第二芯片303,在多媒体音频数据的编码格式转换完成后,混音处理后的所述多媒体音频数据和所述聊天音频数据,生成第三音频数据,将第三音频数据传输给第二芯片303。
本申请实施例输出的显示设备通过第一音频处理器302-1多媒体音频数据的解码,编码处理,将两种编码格式的音频数据转化为同一种编码格式的音频数据,进而保证两路音频数据可以被同时播放。
第二芯片303,所述第二芯片303包括第二音频处理器303-1,所述第二音频处理器303-1被配置为,接收来自于所述第一音频处理器302-1输出的第三音频数据,将所述第三音频数据输出到所述声音再现器301。
综上,本申请实施例第一方面示出一种显示设备,当同时有聊天音频数据和多媒体音频数据输入显示设备时,显示设备将多媒体音频数据的编码格式转为聊天音频数据的编码格式,将两种编码格式的音频数据转化为同一种编码格式的音频数据,进而避免了有两种不同编码格式的音频同时播放而导致的一种音频数据无法正常播放问题的出现。
下面结合具体的应用场景对本方案作以详细的说明。其中显示设备的结构可以参阅图8 。
场景1-1:在场景1-1用户在10点20通过显示设备观看多媒体视频,第一芯片302通过多媒体输入接口302-2b接收多媒体音频数据,并将所述多媒体音频数据,发送至第二音频处理器303-1。第二音频处理器303-1实时的将所述多媒体音频数据传输至声音再现器进行播放。
当显示设备通过多媒体输入接口302-2b接收多媒体音频数据时,显示设备将多媒体输入接口302-2b对应的状态位由0标记为1,多媒体输入接口302-2b对应的状态位为1时,对应信息为多媒体输入接口302-2b正在传输多媒体音频数据。
在10点25时,用户通过显示设备进行视频聊天,此时用户通过遥控器触发摄像头和麦克风 。麦克风将接收到的语音,将语音编码成PCM编码格式的聊天音频数据。此时,第一音频处理器302-1通过多媒体输入接口302-2b对应的状态位为1,获知此时存在多媒体音频数据正在传输。此时第一音频处理器302-1首先解码多媒体音频数据,然后,按照PCM编码规则重新编码多媒体音频数据,最后,将重新编码的多媒体音频数据与聊天音频数据混音。
值得注意的是,第一音频处理器302-1监测到聊天输入接口302-2a中聊天音频数据输入时,所述第一音频处理器302-1停止向所述第二音频处理器303-1输出多媒体音频数据,同时记录所述多媒体音频数据的播放节点5分钟,在本实施例中,多媒体音频数据时长为15分钟,15分钟为多媒体音频数据的播放结点。
第一音频处理器302-1将【5分钟-15分钟】对应的多媒体音频数据的编码格式转换为PCM编码格式,生成转换后的多媒体音频数据;同时在所述多媒体音频数据进行格式转换过程中,第一音频处理器302-1持续输出聊天音频数据至第二音频处理器303-1。
在【5分钟-15分钟】对应的多媒体音频数据全部转化为转换后的多媒体音频数据,混音所述转换后的多媒体音频数据和所述聊天音频数据,生成所述第三音频数据。
在上述过程中,由于两种编码格式的音频数据转化为同一种编码格式的音频数据,进而保证两路音频数据可以被同时播放。
场景1-2:在场景1-2用户在10点20通过显示设备进行视频聊天,此时用户通过遥控器触发摄像头和麦克风 。麦克风将接收到的语音,将语音编码成PCM编码格式的聊天音频数据。第一芯片302通过聊天输入接口302-2a接收聊天音频数据,并将所述聊天音频数据,发送至第二音频处理器303-1。第二音频处理器303-1实时的将所述聊天音频数据传输至声音再现器进行播放。
当显示设备通过聊天输入接口302-2a接收聊天音频数据时,显示设备将聊天输入接口302-2a对应的状态位由0标记为1,聊天输入接口302-2a对应的状态位为1时,对应信息为聊天输入接口302-2a正在播传输聊天音频数据。
在10点25时,用户通过显示设备观看视频时,第一音频处理器302-1通过多媒体输入接口302-2b接收多媒体音频数据。同时,第一音频处理器302-1通过聊天输入接口302-2a对应的状态位为1,获知此时存在聊天音频数据传输。此时第一音频处理器302-1首先解码多媒体音频数据,然后,按照PCM编码规则重新编码多媒体音频数据,最后,将重新编码的多媒体音频数据与聊天音频数据混音。
第一音频处理器302-1将多媒体音频数据的编码格式转换为PCM编码格式,生成转换后的多媒体音频数据;同时在所述多媒体音频数据进行格式转换过程中,第一音频处理器302-1持续输出聊天音频数据至第二音频处理器303-1。在多媒体音频数据全部转化为转换后的多媒体音频数据,混音所述转换后的多媒体音频数据和所述聊天音频数据,生成所述第三音频数据。
由于两种编码格式的音频数据转化为同一种编码格式的音频数据,进而保证两路音频数据可以被同时播放。
本申请实施例第二方面示出一种声音再现方法,请参阅图9,所述方法应用于显示设备,所述显示设备包括:声音再现器,第一芯片和第二芯片;所述方法包括以下的步骤:
第一芯片,S101通过输入接口接收音频数据,所述音频数据包括多媒体音频数据和聊天音频数据;
若所述聊天音频数据的编码格式和所述多媒体音频数据的编码格式不同,S102将所述多媒体音频数据的编码格式进行转换生成转换后的多媒体音频数据;
S103混音所述转换后的多媒体音频数据和所述聊天音频数据,生成第三音频数据;
第二芯片S104 接收第三音频数据,将所述第三音频数据输出到所述声音再现器。
应当理解,本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (8)

1.一种显示设备,其特征在于,包括:
音频输出接口,被配置为再现声音信号;
第一音频处理器,被配置为:
通过输入接口接收音频数据,所述音频数据包括多媒体音频数据和聊天音频数据;所述第一音频处理器同时接收所述多媒体音频数据和所述聊天音频数据,或者先后接收所述多媒体音频数据和所述聊天音频数据;
当接收到的所述聊天音频数据的编码格式和所述多媒体音频数据的编码格式不同时,将非PCM编码格式的所述多媒体音频数据解码,按照PCM编码规则对解码后的多媒体音频数据进行编码,以使所述多媒体音频数据的编码格式进行转换生成转换后的PCM编码格式多媒体音频数据;
同时在所述多媒体音频数据进行格式转换过程中,所述第一音频处理器持续向第二音频处理器输出所述聊天音频数据,且停止向第二音频处理器输出多媒体音频数据;
在所述多媒体音频数据全部转化为转换后的多媒体音频数据时,混音所述转换后的PCM编码格式多媒体音频数据和所述PCM编码格式聊天音频数据得到第三音频数据;
第二音频处理器,被配置为,接收来自于所述第一音频处理器输出的所述第三音频数据,将所述第三音频数据输出到所述音频输出接口。
2.根据权利要求1所述的显示设备,其特征在于,所述输入接口被配置有标识值,所述标识值包括第一标识值,所述第一标识值用于标识相应的输入接口有音频数据正在传输;其中,所述输入接口包括:聊天输入接口和多媒体输入接口;
响应于所述聊天输入接口有聊天音频数据输入,所述第一音频处理器还被配置为,读取所述多媒体输入接口的标识值;
响应于所述多媒体输入接口的标识值为第一标识值,所述第一音频处理器还被配置为,将通过所述多媒体输入接口输入的多媒体音频数据的编码格式进行转换,生成转换后的多媒体音频数据。
3.根据权利要求1所述的显示设备,其特征在于,所述编码过程为:将解码后的多媒体音频数据多媒体音频数据每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的生成转换后的多媒体音频数据。
4.根据权利要求2所述的显示设备,其特征在于,
响应于所述聊天输入接口中聊天音频数据输入,所述第一音频处理器还被配置为,停止向所述第二音频处理器输出所述多媒体音频数据,同时记录所述多媒体音频数据的播放节点;其中,所述播放节点为聊天音频数据输入时,多媒体音频数据播放时长;
将播放节点到播放结点对应的多媒体音频数据的格式转换为第一编码格式,生成转换后的多媒体音频数据,所述播放结点为多媒体音频数据的时长;
同时在所述多媒体数据进行格式转换过程中,响应于所述聊天输入接口有聊天音频数据输入,所述第一音频处理器还被配置为,持续输出所述聊天音频数据;
在所述将播放节点到播放结点对应的多媒体音频数据全部转化为转换后的多媒体音频数据时,混音所述转换后的多媒体音频数据和所述聊天音频数据,生成所述第三音频数据。
5.根据权利要求1所述的显示设备,其特征在于,所述输入接口被配置有标识值,所述标识值包括第一标识值,所述第一标识值用于标识相应的输入接口有音频数据正在传输;所述输入接口包括:聊天输入接口和多媒体输入接口;
响应于所述多媒体输入接口中有多媒体音频数据输入,所述第一音频处理器还被配置为,读取所述聊天输入接口的标识值;
响应于所述聊天输入接口的标识值为第一标识值,所述第一音频处理器还被配置为,将所述多媒体音频数据编码格式进行转换,生成转换后的多媒体音频数据。
6.根据权利要求1所述的显示设备,其特征在于,所述混音采用线性累加的方法进行累加。
7.根据权利要求1所述的显示设备,其特征在于,在混音之前,所述第一音频处理器判断处理后的所述多媒体音频数据和所述聊天音频数据是否具有相同的采样率、帧长、位深、声道数;
当处理后的所述多媒体音频数据和所述聊天音频数据对应的采样率、帧长、位深、声道数任意一项存在差异时,预先处理两个音频数据,使其具有相同的采样率、帧长、位深、声道数。
8.一种声音再现方法,其特征在于,所述方法应用于显示设备,所述显示设备包括:音频输出接口,第一音频处理器和第二音频处理器;
所述第一音频处理器通过输入接口接收音频数据,所述音频数据包括多媒体音频数据和聊天音频数据;所述第一音频处理器同时接收所述多媒体音频数据和所述聊天音频数据,或者先后接收所述多媒体音频数据和所述聊天音频数据;
当接收到的所述聊天音频数据的编码格式和所述多媒体音频数据的编码格式不同时,所述第一音频处理器将非PCM编码格式的所述多媒体音频数据解码,按照PCM编码规则对解码后的多媒体音频数据进行编码,以使所述多媒体音频数据的编码格式进行转换生成转换后的PCM编码格式多媒体音频数据;
同时在所述多媒体数据进行格式转换过程中,所述第一音频处理器持续向第二音频处理器输出所述聊天音频数据,且停止向第二音频处理器输出多媒体音频数据;
在所述多媒体音频数据全部转化为转换后的多媒体音频数据时,所述第一音频处理器混音所述转换后的PCM编码格式多媒体音频数据和所述PCM编码格式聊天音频数据得到第三音频数据;
所述第二音频处理器接收来自于所述第一音频处理器输出的所述第三音频数据,将所述第三音频数据输出到所述音频输出接口。
CN201910877973.6A 2019-09-17 2019-09-17 一种显示设备及声音再现方法 Active CN112533056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910877973.6A CN112533056B (zh) 2019-09-17 2019-09-17 一种显示设备及声音再现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910877973.6A CN112533056B (zh) 2019-09-17 2019-09-17 一种显示设备及声音再现方法

Publications (2)

Publication Number Publication Date
CN112533056A CN112533056A (zh) 2021-03-19
CN112533056B true CN112533056B (zh) 2022-10-28

Family

ID=74974798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910877973.6A Active CN112533056B (zh) 2019-09-17 2019-09-17 一种显示设备及声音再现方法

Country Status (1)

Country Link
CN (1) CN112533056B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113038193B (zh) * 2021-03-24 2023-08-11 Vidaa美国公司 一种自动修复音视频不同步的方法及显示设备
CN114710475B (zh) * 2022-04-11 2024-03-15 三星电子(中国)研发中心 流媒体音频融合方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0965305A (ja) * 1995-08-18 1997-03-07 Hitachi Ltd テレビ装置
CN1622582A (zh) * 2003-11-24 2005-06-01 乐金电子(惠州)有限公司 具备电话通信功能的音频系统及其控制方法
GB0608621D0 (en) * 2006-01-03 2006-06-14 Avermedia Tech Inc Digital media mixer and method thereof
CN1859566A (zh) * 2006-01-18 2006-11-08 华为技术有限公司 一种用于可视电话视频音频信号传输的装置及方法
CN1878289A (zh) * 2005-06-10 2006-12-13 中国移动通信集团公司 在发送音视频文件中叠加语音的方法
JP2010283705A (ja) * 2009-06-08 2010-12-16 Hitachi Ltd データ伝送装置、およびデータ伝送方法
CN102625150A (zh) * 2012-03-16 2012-08-01 中国科学院计算技术研究所 一种媒体播放系统和方法
CN106648534A (zh) * 2016-12-26 2017-05-10 三星电子(中国)研发中心 一种对互斥的音频实现同时播放的方法
CN109559763A (zh) * 2017-09-26 2019-04-02 华为技术有限公司 一种实时数字音频信号混音的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158764A (zh) * 2011-05-27 2011-08-17 冠捷显示科技(厦门)有限公司 一种电视节目播放及视频通话可同时进行的电视机及其实现方法
CN102568513B (zh) * 2011-12-28 2015-05-20 北京三星通信技术研究有限公司 一种音频数据处理方法和交互方法
CN102638722A (zh) * 2012-03-23 2012-08-15 深圳创维-Rgb电子有限公司 智能电视机双模解码方法和装置
CN105657485A (zh) * 2015-08-21 2016-06-08 乐视致新电子科技(天津)有限公司 一种音视频播放设备
CN205212923U (zh) * 2015-11-02 2016-05-04 上海唐舜电信科技有限公司 可重构网络媒体话机终端
CN105872834A (zh) * 2015-12-15 2016-08-17 乐视致新电子科技(天津)有限公司 双画面下的音量自动调节方法、装置及智能设备
CN108446092B (zh) * 2018-03-06 2021-10-08 京东方科技集团股份有限公司 音频输出方法、音频输出装置、设备及存储介质
CN109451329B (zh) * 2019-01-16 2021-01-29 广州市千钧网络科技有限公司 混音处理方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0965305A (ja) * 1995-08-18 1997-03-07 Hitachi Ltd テレビ装置
CN1622582A (zh) * 2003-11-24 2005-06-01 乐金电子(惠州)有限公司 具备电话通信功能的音频系统及其控制方法
CN1878289A (zh) * 2005-06-10 2006-12-13 中国移动通信集团公司 在发送音视频文件中叠加语音的方法
GB0608621D0 (en) * 2006-01-03 2006-06-14 Avermedia Tech Inc Digital media mixer and method thereof
CN1859566A (zh) * 2006-01-18 2006-11-08 华为技术有限公司 一种用于可视电话视频音频信号传输的装置及方法
JP2010283705A (ja) * 2009-06-08 2010-12-16 Hitachi Ltd データ伝送装置、およびデータ伝送方法
CN102625150A (zh) * 2012-03-16 2012-08-01 中国科学院计算技术研究所 一种媒体播放系统和方法
CN106648534A (zh) * 2016-12-26 2017-05-10 三星电子(中国)研发中心 一种对互斥的音频实现同时播放的方法
CN109559763A (zh) * 2017-09-26 2019-04-02 华为技术有限公司 一种实时数字音频信号混音的方法及装置

Also Published As

Publication number Publication date
CN112533056A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN112073797B (zh) 一种音量调节方法及显示设备
CN112073662A (zh) 一种显示设备
CN112399263A (zh) 一种互动方法、显示设备及移动终端
CN112399243A (zh) 一种播放方法及显示设备
CN112533056B (zh) 一种显示设备及声音再现方法
CN112528051B (zh) 一种演唱作品的发布方法、显示设备及服务器
CN112995733B (zh) 一种显示设备、设备发现方法及存储介质
CN112463267A (zh) 在显示设备屏幕上呈现屏保信息的方法及显示设备
CN112073666B (zh) 一种显示设备的电源控制方法及显示设备
CN112073789B (zh) 一种声音处理法及显示设备
CN113727163B (zh) 一种显示设备
CN112073777B (zh) 一种语音交互方法及显示设备
CN112073776B (zh) 语音控制方法及显示设备
CN112802440B (zh) 一种显示设备及声音低延迟处理方法
CN112073773A (zh) 一种屏幕互动方法、装置及显示设备
CN112073803A (zh) 一种声音再现方法及显示设备
CN112073808A (zh) 一种色彩空间切换方法及显示装置
CN112071338A (zh) 一种录音控制方法、装置和显示设备
CN112399223B (zh) 一种改善莫尔条纹现象的方法及显示设备
CN112073772B (zh) 基于双系统的按键无缝传递方法及显示设备
CN112995113B (zh) 一种显示设备、端口控制方法及存储介质
CN112738576B (zh) 一种显示设备及声音低延迟处理方法
CN112073779B (zh) 显示设备及按键传递的容错方法
CN112911353B (zh) 一种显示设备、端口调度方法及存储介质
CN112073811B (zh) 一种文件传输调度方法及显示设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant