CN110099295B - 电视机语音控制方法、装置、设备及存储介质 - Google Patents

电视机语音控制方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110099295B
CN110099295B CN201910464835.5A CN201910464835A CN110099295B CN 110099295 B CN110099295 B CN 110099295B CN 201910464835 A CN201910464835 A CN 201910464835A CN 110099295 B CN110099295 B CN 110099295B
Authority
CN
China
Prior art keywords
voice
vocabulary library
voice information
television
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910464835.5A
Other languages
English (en)
Other versions
CN110099295A (zh
Inventor
尹志朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Skyworth RGB Electronics Co Ltd
Original Assignee
Shenzhen Skyworth RGB Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Skyworth RGB Electronics Co Ltd filed Critical Shenzhen Skyworth RGB Electronics Co Ltd
Priority to CN201910464835.5A priority Critical patent/CN110099295B/zh
Publication of CN110099295A publication Critical patent/CN110099295A/zh
Application granted granted Critical
Publication of CN110099295B publication Critical patent/CN110099295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种电视机语音控制方法、装置、设备及存储介质,该方法包括:获取用于控制电视机的语音信息;确定本地词汇库是否存在所述语音信息对应的语音素材;如果是,则基于本地词汇库识别所述语音信息以生成控制指令;如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;控制电视机执行所述控制指令。解决了现有技术的电视机语音控制方法的准确率较低的问题,达到了提高电视机语音控制准确率的技术效果。

Description

电视机语音控制方法、装置、设备及存储介质
技术领域
本发明实施例涉及电视机控制领域,尤其涉及一种电视机语音控制方法、装置、设备及存储介质。
背景技术
随着人们对生活品质要求的提高,集成有语音控制装置的电视机受到了越来越多用户的青睐。为了迎合用户的需求,越来越多的电视集成有语音控制装置,但目前电视机的语音控制装置普遍存在语音控制准确率较低的问题,即经常出现语音控制失效的情况,究其原因是电视机无法识别用户说出的语音信息,从而无法执行该语音信息对应的控制命令。
综上,有必要提供一种电视机语音控制方法以调高电视机语音控制方法的准确性。
发明内容
本发明实施例提供了一种电视机语音控制方法、装置、设备及存储介质,解决了现有技术的电视机语音控制方法的准确率较低的问题。
第一方面,本发明实施例提供了一种电视机语音控制方法,包括:
获取用于控制电视机的语音信息;
确定本地词汇库是否存在所述语音信息对应的语音素材;
如果是,则基于本地词汇库识别所述语音信息以生成控制指令;
如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制电视机执行所述控制指令。
进一步,所述如果否,则在线通过云词汇库识别所述语音信息以生成控制指令之后,还包括:
如果在线云词汇库不存在所述语音信息对应的语音素材,则输出手动遥控信息,以使用户手动遥控电视机;
将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库。
进一步,还包括:基于预设时间间隔,从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库。
进一步,所述将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库之后,还包括:
根据本地词汇库和云词汇库中的语音素材,基于深度学习建立语音信息与控制指令之间的对应关系。
进一步,所述预设分类至少包括方言分类和娱乐类型分类中的一种,其中娱乐类型分类包括电视剧、综艺、美食和体育。
第二方面,本发明实施例还提供了一种电视机语音控制装置,包括:
获取模块,用于获取用于控制电视机的语音信息;
语音素材确定模块,用于确定本地词汇库是否存在所述语音信息对应的语音素材;
本地识别模块,用于在本地词汇库存在所述语音信息对应的语音素材时,基于本地词汇库识别所述语音信息以生成控制指令;
在线识别模块,用于在本地词汇库不存在所述语音信息对应的语音素材时,在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制模块,用于控制电视机执行所述控制指令。
进一步,还包括提示模块;所述提示模块用于在线云服务器不存在所述语音信息对应的语音素材时输出手动遥控信息,以使用户手动遥控电视机;同时将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库。
进一步,还包括更新模块;所述更新模块用于基于预设时间间隔从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的电视机语音控制方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的电视机语音控制方法。
本发明实施例提供的电视机语音控制方法的技术方案,包括获取用于控制电视机的语音信息;确定本地词汇库是否存在语音信息对应的语音素材;如果是,则基于本地词汇库识别语音信息以生成控制指令,具有较高的语音识别速度,从而具有较高的语音控制速度;如果否,则在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新,通过云词汇库进行补充语音识别,有助于提高语音识别的准确率,进而提高语音控制的准确率,通过云词汇库对本地词汇库进行更新可以丰富本地词汇库的语音素材;控制电视机执行控制指令已完成语音控制以完成语音控制。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的电视机语音控制方法的流程图;
图2是本发明实施例二提供的电视机语音控制装置的结构框图;
图3是本发明实施例二提供的又一电视机语音控制装置的结构框图;
图4是本发明实施例三提供的设备的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1是本发明实施例一提供的电视机语音控制方法的流程图。本实施例的技术方案适用于集成有语音控制装置的电视机、机顶盒和OTT盒子的情况。该方法可以由本发明实施例提供的电视机语音控制装置来执行,该装置可以采用软件和/或硬件的方式实现,并配置在处理器中应用。该方法具体包括如下步骤:
S101、获取用于控制电视机的语音信息。
对于集成有语音控制装置的电视机、机顶盒或OTT盒子来说,如果用户要通过语音控制电视机,则只要对着语音控制装置的麦克风说出用于控制电视机的语音信息,语音控制装置即可通过麦克风接收该语音信息。
优选地,语音控制装置在不使用时通常处于休眠状态,以节省其所配置对象的内存和耗电量。比如,如果语音控制装置集成在电视机上,则控制语音控制装置在不进行语音控制时处于休眠状态,则有助于减少电视机的运行内存的使用率。当语音控制装置接收到语音信息后,则自动被唤醒以对所接收的语音信息进行调整;而当完成语音信息的控制之后,则在闲置预设时间之后自动进入休眠状态。
S102、确定本地词汇库是否存在语音信息对应的语音素材,如果是则执行S103,如果否则执行S104。
语音控制装置接收到语音信息之后,通常需要先判断本地词汇库是否存在该语音信息对应的语音素材,然后根据判断结果确定使用哪个词汇库进行语音识别,并根据语音识别结果进行语音控制。
S103、基于本地词汇库识别语音信息以生成控制指令。
如果本地词汇库包含该语音信息所对应的语音素材,则基于本地词汇库对该语音信息进行识别,并根据识别结果生成控制指令。基于本地词汇库识别语音信息具有较高的语音识别速度,而且不会占用网络资源。
S104、在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新。
如果本地词汇库不包含该语音信息所对应的语音素材,则基于云词汇库对该语音信息进行识别,并根据识别结果生成控制指令。在本地词汇库没有某个语音信息对应的语音素材时,通过云词汇库对该语音进行语音识别,相当于通过云词汇库对本地词汇库进行补充语音识别以完成语音识别,进而完成语音控制。
可以理解的是,对于同一用户,其观影偏好以及其语音为普通话还是方言通常比较固定,因此其所使用的用于控制电视机的语音信息也比较固定。基于此,为了提高后期语音信息识别和语音控制的速度,本实施例还基于云词汇库对本地词汇库进行更新,以将该语音信息对应的语音素材添加至本地词汇库,那么后期可以直接基于本地词汇库对该语音信息进行语音识别,无需基于云词汇库对该语音信息进行识别。
其中,本实施例可以在本地词汇库不存在所要识别语音信息的语音素材,而云词汇库存在该语音信息的语音素材并完成该语音信息识别的情况下,基于云词汇库对本地词汇库进行更新,当然,也可以基于预设时间间隔基于云词汇库对本地词汇库进行更新。
对于基于预设时间间隔根据云词汇库对本地词汇库进行更新。可以理解的是,如果词汇库中的语音素材越多,则语音识别的成功率就越大。为了提高语音识别的准确率,进而提高语音控制的准确率,本实施例的语音控制装置还从网络获取包含热门词汇的语音素材,并将所获取的语音素材添加至云词汇库,以及将本地词汇库的语音素材添加至云词汇库。然后控制云词汇库基于预设分类对其中的语音素材进行分类,并将分类后的语音素材发送至本地词汇库以更新本地词汇库,从而使本地词汇库的语音素材可以紧跟时代潮流。
其中,预设分类至少包括方言分类和娱乐分类中的一种,其中娱乐分类包括电视剧、综艺、美食和体育。
可以理解的是,随着电视剧节目、电影、综艺节目和网络热词汇等的不断涌现,如果云词汇库没有及时获取相关的语音素材,则可能出现基于云词汇库也无法识别语音信息的情形,此时语音控制装置优选输出手动遥控信息,以提示用户通过遥控器手动遥控电视机。在手动遥控完电视机之后,语音控制装置优选将该语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库,以增加本地词汇库的语音素材。从而可以大大提高基于本地词汇库完成语音信息识别和语音控制的概率和准确率。
为了提高语音识别的准确率,进而提高语音控制的准确率,本实施例还基根据本地词汇库和云词汇库的语音素材,基于深度学习建立语音信息和控制指令之间的对应关系,从而提高语音信息识别和语音控制的准确率。
S105、控制电视机执行控制指令已完成语音控制。
基于语音信息确定了控制指令之后,则控制电视机执行该控制指令,从而完成语音控制电视机的操作。
本发明实施例提供的电视机语音控制方法的技术方案,包括获取用于控制电视机的语音信息;确定本地词汇库是否存在语音信息对应的语音素材;如果是,则基于本地词汇库识别语音信息以生成控制指令,具有较高的语音识别速度,从而具有较高的语音控制速度;如果否,则在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新,通过云词汇库进行补充语音识别,有助于提高语音识别的准确率,进而提高语音控制的准确率,通过云词汇库对本地词汇库进行更新可以丰富本地词汇库的语音素材;控制电视机执行控制指令已完成语音控制以完成语音控制。
实施例二
图2是本发明实施例二提供的电视机语音控制装置的结构框图。该装置用于执行上述任意实施例所提供的电视机语音控制方法,该控制装置可选为软件或硬件实现。该装置包括:
获取模块11,用于获取用于控制电视机的语音信息;
语音素材确定模块12,用于确定本地词汇库是否存在语音信息对应的语音素材;
本地识别模块13,用于在本地词汇库存在语音信息对应的语音素材时,基于本地词汇库识别语音信息以生成控制指令;
在线识别模块14,用于在本地词汇库不存在语音信息对应的语音素材时,在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新;
控制模块15,用于控制电视机执行控制指令已完成语音控制。
如图3所示,该装置还包括提示模块16,该提示模块用于在线云服务器不存在语音信息对应的语音素材时输出手动遥控信息,以使用户手动遥控电视机;同时将语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库。
该装置还包括更新模块17,该更新模块用于从网络获取包含热门词汇的语音素材并将语音素材添加至云词汇库;以及将本地词汇库的语音素材定期同步至云词汇库,以使云词汇库将当前的词汇基于预设分类发送至本地词汇库以更新本地词汇库。
本发明实施例提供的电视机语音控制装置的技术方案,通过获取模块获取用于控制电视机的语音信息;通过语音素材确定模块确定本地词汇库是否存在语音信息对应的语音素材;在本地词汇库存在语音信息对应的语音素材时,通过本地识别模块基于本地词汇库识别语音信息以生成控制指令,具有较高的语音识别速度,从而具有较高的语音控制速度;在本地词汇库不存在语音信息对应的语音素材时,通过在线识别模块在线基于云词汇库识别语音信息以生成控制指令,以及基于云词汇库对所述本地词汇库进行更新,通过云词汇库进行补充语音识别,有助于提高语音识别的准确率,进而提高语音控制的准确率,通过云词汇库对本地词汇库进行更新可以丰富本地词汇库的语音素材;通过控制模块控制电视机执行控制指令已完成语音控制以完成语音控制。
本发明实施例所提供的电视机语音控制装置可执行本发明任意实施例所提供的电视机语音控制方法,具备执行方法相应的功能模块和有益效果。
实施例三
图4为本发明实施例提供的设备的结构示意图,如图4所示,该设备包括处理器201、存储器202、输入装置203以及输出装置204;设备中处理器201的数量可以是一个或多个,图4中以一个处理器201为例;设备中的处理器201、存储器202、输入装置203以及输出装置204可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器202作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的电视机语音控制方法对应的程序指令/模块(例如,获取模块11、语音素材确定模块12、本地识别模块13、在线识别模块14以及控制模块15)。处理器201通过运行存储在存储器202中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的电视机语音控制方法。
存储器202可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器202可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器202可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置203可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。
输出装置204可包括显示屏等显示设备,例如,用户终端的显示屏。
实施例四
本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种电视机语音控制方法,该方法包括:
获取用于控制电视机的语音信息;
确定本地词汇库是否存在所述语音信息对应的语音素材;
如果是,则基于本地词汇库识别所述语音信息以生成控制指令;
如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制电视机执行所述控制指令。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的电视机语音控制方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(RandomAccess Memory,简称RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的电视机语音控制方法。
值得注意的是,上述电视机语音控制装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (5)

1.一种电视机语音控制方法,其特征在于,包括:
获取用于控制电视机的语音信息;
确定本地词汇库是否存在所述语音信息对应的语音素材;
如果是,则基于本地词汇库识别所述语音信息以生成控制指令;
如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制电视机执行所述控制指令;
所述如果否,则在线通过云词汇库识别所述语音信息以生成控制指令之后,还包括:
如果在线云词汇库不存在所述语音信息对应的语音素材,则输出手动遥控信息,以使用户手动遥控电视机;
将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库;
基于预设时间间隔,从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库;
根据本地词汇库和云词汇库中的语音素材,基于深度学习建立语音信息与控制指令之间的对应关系;
语音控制装置在不使用时处于休眠状态,当接收到语音信息后,则自动被唤醒以对所接收的语音信息进行调整;而当完成语音信息的控制之后,则在闲置预设时间之后自动进入休眠状态。
2.根据权利要求1所述的方法,其特征在于,所述预设分类至少包括方言分类和娱乐类型分类中的一种,其中娱乐类型分类包括电视剧、综艺、美食和体育。
3.一种电视机语音控制装置,其特征在于,包括:
获取模块,用于获取用于控制电视机的语音信息;
语音素材确定模块,用于确定本地词汇库是否存在所述语音信息对应的语音素材;
本地识别模块,用于在本地词汇库存在所述语音信息对应的语音素材时,基于本地词汇库识别所述语音信息以生成控制指令;
在线识别模块,用于在本地词汇库不存在所述语音信息对应的语音素材时,在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制模块,用于控制电视机执行所述控制指令;
提示模块,用于在线云服务器不存在所述语音信息对应的语音素材时输出手动遥控信息,以使用户手动遥控电视机;同时将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库;
更新模块,用于基于预设时间间隔从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库;
根据本地词汇库和云词汇库中的语音素材,基于深度学习建立语音信息与控制指令之间的对应关系;
语音控制装置在不使用时处于休眠状态,当接收到语音信息后,则自动被唤醒以对所接收的语音信息进行调整;而当完成语音信息的控制之后,则在闲置预设时间之后自动进入休眠状态。
4.一种电子设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-2中任一所述的电视机语音控制方法。
5.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-2中任一所述的电视机语音控制方法。
CN201910464835.5A 2019-05-30 2019-05-30 电视机语音控制方法、装置、设备及存储介质 Active CN110099295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910464835.5A CN110099295B (zh) 2019-05-30 2019-05-30 电视机语音控制方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910464835.5A CN110099295B (zh) 2019-05-30 2019-05-30 电视机语音控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110099295A CN110099295A (zh) 2019-08-06
CN110099295B true CN110099295B (zh) 2022-04-12

Family

ID=67449642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910464835.5A Active CN110099295B (zh) 2019-05-30 2019-05-30 电视机语音控制方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110099295B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110602556A (zh) * 2019-09-20 2019-12-20 深圳创维-Rgb电子有限公司 播放方法、云端服务器及存储介质
CN111327935B (zh) * 2020-03-02 2021-12-24 彩迅工业(深圳)有限公司 一种基于人工智能电视机的信息交互平台
CN111933139A (zh) * 2020-08-20 2020-11-13 成都启英泰伦科技有限公司 一种离在线语音识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050221771A1 (en) * 2004-04-06 2005-10-06 Nec Corporation Receiving and sending method of mobile TV phone and mobile TV phone terminal
CN102945672A (zh) * 2012-09-29 2013-02-27 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
CN204613722U (zh) * 2015-05-12 2015-09-02 杭州晟元芯片技术有限公司 一种可语音控制的智能云家居生活系统
CN109471678A (zh) * 2018-11-07 2019-03-15 苏州思必驰信息科技有限公司 基于图像识别的语音中控方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050221771A1 (en) * 2004-04-06 2005-10-06 Nec Corporation Receiving and sending method of mobile TV phone and mobile TV phone terminal
CN102945672A (zh) * 2012-09-29 2013-02-27 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
CN204613722U (zh) * 2015-05-12 2015-09-02 杭州晟元芯片技术有限公司 一种可语音控制的智能云家居生活系统
CN109471678A (zh) * 2018-11-07 2019-03-15 苏州思必驰信息科技有限公司 基于图像识别的语音中控方法及装置

Also Published As

Publication number Publication date
CN110099295A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
CN110099295B (zh) 电视机语音控制方法、装置、设备及存储介质
US9520133B2 (en) Display apparatus and method for controlling the display apparatus
US20230300398A1 (en) Server and method for controlling server
CN106098063B (zh) 一种语音控制方法、终端设备和服务器
EP3190512B1 (en) Display device and operating method therefor
KR101289081B1 (ko) 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법
US20170169817A1 (en) Extending the period of voice recognition
CN109474843B (zh) 语音操控终端的方法、客户端、服务器
CN106941619A (zh) 基于人工智能的节目提醒方法、装置以及系统
CN103491411A (zh) 基于语言推荐频道的方法及其装置
CN109377979B (zh) 更新欢迎语的方法和系统
CN109325180B (zh) 文章摘要推送方法、装置、终端设备、服务器及存储介质
CN111462744A (zh) 一种语音交互方法、装置、电子设备及存储介质
CN112185369A (zh) 一种基于语音控制的音量调节方法、装置、设备和介质
US10923113B1 (en) Speechlet recommendation based on updating a confidence value
US20170061962A1 (en) Smart playback method for tv programs and associated control device
US20240070171A1 (en) Systems and methods for predicting where conversations are heading and identifying associated content
CN110782886A (zh) 语音处理的系统、方法、电视、设备和介质
CN113468351A (zh) 一种智能设备及图像处理方法
US11942089B2 (en) Electronic apparatus for recognizing voice and method of controlling the same
CN113703621A (zh) 语音交互方法、存储介质及设备
US20240177214A1 (en) Computing device and operating method thereof
US20240096329A1 (en) Qa tv-making millions of characters alive
US20220406308A1 (en) Electronic apparatus and method of controlling the same
KR102091006B1 (ko) 디스플레이 장치 및 그의 제어 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant