CN109273001A - 一种语音播报方法、装置、计算装置和存储介质 - Google Patents
一种语音播报方法、装置、计算装置和存储介质 Download PDFInfo
- Publication number
- CN109273001A CN109273001A CN201811248166.XA CN201811248166A CN109273001A CN 109273001 A CN109273001 A CN 109273001A CN 201811248166 A CN201811248166 A CN 201811248166A CN 109273001 A CN109273001 A CN 109273001A
- Authority
- CN
- China
- Prior art keywords
- casting
- scene
- sound
- strategy
- sound equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003860 storage Methods 0.000 title abstract description 15
- 238000005266 casting Methods 0.000 claims abstract description 220
- 238000004378 air conditioning Methods 0.000 claims description 39
- 238000012986 modification Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 abstract description 13
- 230000008451 emotion Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 241001137251 Corvidae Species 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 241001503991 Consolida Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 101100010343 Drosophila melanogaster lobo gene Proteins 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/50—Control or safety arrangements characterised by user interfaces or communication
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/50—Control or safety arrangements characterised by user interfaces or communication
- F24F11/52—Indication arrangements, e.g. displays
- F24F11/526—Indication arrangements, e.g. displays giving audible indications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/62—Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
- F24F11/63—Electronic processing
- F24F11/64—Electronic processing using pre-stored data
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B3/00—Audible signalling systems; Audible personal calling systems
- G08B3/10—Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Electromagnetism (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种语音播报方法、装置、计算装置和存储介质,涉及智能交互技术领域,用以解决在语音播报中交互不自然、没有情感以及不智能的问题。该语音播报方法包括:接收用户语音并对所述用户语音进行语义解析,得到用户语义;根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;将确定的播报场景的标识发送给服务器;接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。这样,通过实现在不同场景下进行不同的交互,可以让语音播报更自然,更有情感以及更加智能。
Description
技术领域
本申请涉及智能交互技术领域,尤其涉及一种语音播报方法、装置、计算装置和存储介质。
背景技术
在智能交互系统中,语音是实现人工智能和人类交互的主要方式。所以语音交互系统不仅要有足够聪明的大脑,也需要有足够的表达能力。
在现有技术中,采用传统单一语音播报方式,使得语音播报交互不自然,没有情感以及不智能。
发明内容
本申请实施例提供一种语音播报的方法、装置、计算装置和存储介质,通过采用多个音响、多种音色语音组成的语音交互系统,使得空调可以在语音交互时,通过使用多种音色的语音和不同方位的多个音响,实现在不同场景下进行不同的交互。这样,可以让语音播报更自然,更有情感以及更加智能。
第一方面,本申请实施例提供一种语音播报的方法,该方法包括:
接收用户语音并对所述用户语音进行语义解析,得到用户语义;
根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
将确定的播报场景的标识发送给服务器;
接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
第二方面,本申请实施例提供一种语音播报的方法,该方法包括:
接收空调发送的播报场景的标识;
根据所述标识确定与所述标识对应的播报策略;
将所述播报策略发送给空调。
第三方面,本申请实施例提供一种语音播报的装置,该方法包括:
接收语音模块,用于接收用户语音并对所述用户语音进行语义解析,得到用户语义;
确定播报场景模块,用于根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
发送标识模块,用于将确定的播报场景的标识发送给服务器;
接收播报策略模块,用于接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
执行模块,用于执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
第四方面,本申请实施例提供一种语音播报的装置,该方法包括:
接收标识模块,用于接收空调发送的播报场景的标识;
确定播报策略模块,用于根据所述标识确定与所述标识对应的播报策略;
发送播报策略模块,用于将所述播报策略发送给空调。
第五方面,本申请实施例提供一种空调,该空调包括处理器、存储器、收发机和音响,其中,收发机在处理器的控制下接收和发送数据,存储器中保存有预设的程序,处理器读取存储器中的程序,按照该程序执行以下过程:
通过收发机接收用户语音并对所述用户语音进行语义解析,得到用户语义;
通过处理器根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
通过收发机将确定的播报场景的标识发送给服务器;
通过收发机接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
通过音响执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
第六方面,本申请实施例提供一种服务器,该服务器包括处理器、存储器和收发机,其中,收发机在处理器的控制下接收和发送数据,存储器中保存有预设的程序,处理器读取存储器中的程序,按照该程序执行以下过程:
通过收发机接收空调发送的播报场景的标识;
通过处理器根据所述标识确定与所述标识对应的播报策略;
通过收发机将所述播报策略发送给空调。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中的应用场景的示意图;
图2为本申请实施例中语音播报方法的流程示意图;
图3为本申请实施例中空调结构示意图;
图4为本申请实施例中播报场景示意图;
图5为本申请实施例中语音播报方法的流程示意图;
图6为本申请实施例中故事场景下的工作流程示意图;
图7为本申请实施例中语音播报结构示意图;
图8为本申请实施例中语音播报结构示意图;
图9为本申请实施例中提供的另一种语音播报结构示意图;
图10为本申请实施例中提供的另一种语音播报结构示意图;
图11为根据本申请实施方式的计算装置的结构示意图。
具体实施方式
为了可以使语音播报更自然,以及更有情感,使用户代入感更强,本申请实施例中提供一种语音播报方法及装置。为了更好的理解本申请实施例提供的技术方案,这里对该方案的基本原理做一下简单说明:
根据接收到的用户语音,确定用户需要的播报场景。并根据确定的播报场景向服务器获取该场景下的播报策略,通过播报策略控制指定音响需要播放的内容以及所使用的播报声音,实现在不同场景下进行不同的交互。
如图1所示,其为通过本申请实施例提供的方案来完成语音播报的场景示意图。该场景中包括用户10的智能终端11、空调12和服务器13。
空调12通过接收到用户10的语音确定播报场景,并将播报场景的发送给服务器13,服务器13将播报策略发送给空调12,空调12根据播报策略利用不同方位的多个音响,实现在不同场景下进行不同的交互。
用户10还可以通过智能终端11向服务器13发送修改播报策略中播报声音的指令,服务器13根据指令对播报声音进行修改并保存,然后向智能终端11发送修改成功的信息。
其中,智能终端11可以为手机、平板电脑等能够进行音频处理的设备;智能终端11、空调12与服务器13通过无线网络连接。
下面结合参照附图对本申请实施例提供的一种语音播报方法作进一步说明。图2为语音播报方法的流程示意图,包括以下步骤:
步骤201:接收用户语音并对所述用户语音进行语义解析,得到用户语义。
步骤202:根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景。
步骤203:将确定的播报场景的标识发送给服务器。
步骤204:接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音。
步骤205:执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
其中,播报声音为系统预存的声音,可包括:方言、英文、普通女声、普通男声、小孩女声、小孩男声、浑厚男声、优雅女声等。
播报音响的数量可以为多个,例如可为3个。如图3所示,主音响在空调出风口下面正中方向,左音响和右音响成对称放置在主音响两侧。
在一个实施例中,播报音响的数量也可为多个,主音响在空调出风口下面正中方向,其余音响成对称放置在主音响两侧,具体放置位置可根据空调设计放置。
在本申请实施例中,通过使用多种音色的语音和不同方位的多个音响,实现在不同场景下进行不同的交互。这样,可以让语音播报更自然,更有情感以及更加智能。
上面介绍了空调在不同场景下可以进行不同的交互,下面对具体的播报场景下的交互进行进一步的说明。播报场景如图4所示,可包括:故事场景、问答场景、提醒场景、音乐场景、广播场景、诗词场景、翻译场景及天气场景。其中,问答场景包括:翻译场景和天气场景。
例如,当确定播报场景为故事场景时,则步骤205,具体包括:执行所述播报策略,控制与故事角色对应的指定播报音响采用与故事角色对应的播报声音播报该故事角色的内容。
其中,确定故事场景可以通过用户的语音输入。如“格力空调,我要听大灰狼的故事”。这个时候我们根据语音识别和语义解析判断用户的需求,并进入故事场景。
这样,在故事场景下,对已做处理的故事内容进行多音响分角色播报,可以读出具有不同层次感,角色感,故事感,情景感,提高用户的体验,同时不易产生听觉疲劳。对于年龄太小而理解能力欠缺的小孩子的而言,通过采取分角色朗读,能够有效地帮助他们代入故事情节领悟作品内涵,促进身体和心理健康发展。
在一个实施例中,用户只说了“我要听故事”,空调就会根据系统预设的故事进行播报。
在另一个实施例中,用户说了“我要听《寒号鸟》的故事”,则空调就会播报《寒号鸟》。根据服务器发送的播报策略,“寒号鸟”说话内容由左音响小孩男声播放;“喜鹊”说话内容由右音响小孩女声播放;“讲述者”负责内容(非说话内容和非主角说话内容)由主音响浑厚男声播放。
当确定播报场景为以下任一场景:问答场景、提醒场景及诗词场景时,则步骤205,具体包括:
执行所述播报策略,控制主音响采用与确定的场景对应的预设声音与用户进行交互。
这样,通过指定声音与用户进行交互而不是使用机器人语言,可以提高用户的体验。
在一个实施例中,“您有什么吩咐?”、“已为您打开空调”、“已调到25度”、“即将为您播放《小幸运》”等与用户交互的话由主音响采用普通女声进行播报。其中,播报策略只选择播报音响与播报声音。
其中,在问答场景下可以按照具体的场景配置对应的声音。例如,在翻译场景中,由主音响采用普通男声进行播报;在天气场景中,由主音响采用普通女声进行播报。
在一个实施例中,“今天是中秋节哦,主人记得买月饼吃”“主人今天是你的生日,祝你生日快乐”“今天有课程,请不要迟到”等节假日、特殊日子、备忘录提醒功能,由主音响采用优雅女声进行播报。
在一个实施例中,在诗词场景中,由主音响采用普通男声进行播报。
在一个实施例中,可以根据用户的声音选择由什么音响进行交互。例如:如果用户为小孩的声音,则选择使用温柔女声进行交互。
当确定播报场景为音乐场景或广播场景时,则步骤205,具体包括:
执行所述播报策略,控制预设数量的音响通过播放策略中各自指定的音量,采用音频原声进行立体声播放。
这样,通过三个音响控制左右声道,进行立体环绕播放,可以使用户具有身临其境的感觉,提高用户的体验。
上述说明是从空调侧的角度来阐述本方案的,下面通过具体实施例对前述服务器侧的语音播报的方法做进一步说明。具体的,图5为该方法的流程示意图。包括以下步骤:
步骤501:接收空调发送的播报场景的标识。
步骤502:根据所述标识确定与所述标识对应的播报策略。
步骤503:将所述播报策略发送给空调。
在本申请实施例中,通过服务器制定的播报策略,实现在不同场景下进行不同的交互。这样,可以让语音播报更自然,更有情感以及更加智能。
在一个实施例中,服务器接收到故事场景的标识,通过预先确定的播报策略发送给空调。其中,播报策略包括确定的故事角色、为故事角色分配的音响和声音音色以及每个故事角色的故事内容和播报的时间点。
服务器预先对所有的故事本文进行处理,得到每个故事对应的播报策略;当用户需要听某一个故事时,就会将该故事对应的播报策略发送给空调,减少了服务器的处理时间。
如图6所示,为故事场景下的工作流程图,具体可实施为步骤A1-A4:
步骤A1:服务器预先根据故事文本中的角色数量、各角色定位及各角色内容确定播报策略。
步骤A2:用户通过语音向空调输入故事需求。
步骤A3:空调从服务器获取故事文本及播报策略。
步骤A4:空调多音响根据播报策略播报。
在另一个实施例中,服务器接收到故事场景的标识,且用户想听《寒号鸟》的故事,则播报策略为:确定角色数量为3,一号角色为“寒号鸟”,二号角色为“喜鹊”,三号角色为“讲述者”。“寒号鸟”说话内容由左音响小孩男声播放;“喜鹊”说话内容由右音响小孩女声播放;“讲述者”负责内容(非说话内容和非主角说话内容)由主音响浑厚男声播放。播报策略内容如表1所示。
表1播报策略内容
除此之外,若服务器接收到问答场景的标识,则确定播报策略为由主音响采用普通女声进行播报。
若服务器接收到音乐场景的标识,则确定播报策略为采用三个音响控制左右声道,进行立体环绕播放。
上述播报策略中的播报声音都是系统预设的,除此之外,还可以通过智能终端对播报声音进行修改,具体可实施为步骤B1-B3:
步骤B1:接收智能终端发送的修改播报策略中播报声音的指令。
步骤B2:根据所述指令对所述播报声音进行修改并保存。
步骤B3:向智能终端发送修改成功的信息。
这样,通过智能终端修改自己想要的声音进行播报,可以提高用户体验。
基于相同的发明构思,本申请实施例还提供一种语音播报装置,如图7所示,为该装置的结构示意图,包括:
接收语音模块701,用于接收用户语音并对所述用户语音进行语义解析,得到用户语义;
确定播报场景模块702,用于根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
发送标识模块703,用于将确定的播报场景的标识发送给服务器;
接收播报策略模块704,用于接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
执行模块705,用于执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
进一步的,若确定播报场景为故事场景;则执行模块705具体包括:
第一执行播报策略单元,用于执行所述播报策略,控制与故事角色对应的指定播报音响采用与故事角色对应的播报声音播报该故事角色的内容。
进一步的,若确定播报场景为问答场景;则执行模块705具体包括:
第二执行播报策略单元,用于执行所述播报策略,控制主音响采用指定声音与用户进行问答。
进一步的,若确定播报场景为音乐场景;则执行模块705具体包括:
第三执行播报策略单元,用于执行所述播报策略,控制预设数量的音响通过播放策略中各自指定的音量,采用音乐原声进行立体声播放。
基于相同的发明构思,本申请实施例还提供一种语音播报的装置。如图8所示,该装置包括:
接收标识模块801,用于接收空调发送的播报场景的标识;
确定播报策略模块802,用于根据所述标识确定与所述标识对应的播报策略;
发送播报策略模块803,用于将所述播报策略发送给空调。
进一步的,所述装置还包括:
接收指令模块,用于接收智能终端发送的修改播报策略中播报声音的指令;
修改模块,用于根据所述指令对所述播报声音进行修改并保存;
发送信息模块,用于向智能终端发送修改成功的信息。
基于同一发明构思,本发明实施例提供了一种空调,该空调的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图9所示,该空调要包括处理器901、存储器902、收发机903和音响904,处理器901、存储器902、收发机903和音响904通过总线架构连接,总线架构可以包括任意数量的互联的总线和桥,具体由处理器901代表的一个或多个处理器和存储器902代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机903可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。其中,收发机903在处理器901的控制下接收和发送数据,存储器902中保存有预设的程序,处理器901读取存储器902中的程序,按照该程序执行以下过程:
通过收发机903接收用户语音并对所述用户语音进行语义解析,得到用户语义;
通过处理器902根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
通过收发机903将确定的播报场景的标识发送给服务器;
通过收发机903接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
通过音响904执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
可能的实施方式中,音响904还用于:
若确定播报场景为故事场景,则执行所述播报策略,控制与故事角色对应的指定播报音响采用与故事角色对应的播报声音播报该故事角色的内容。
可能的实施方式中,音响904还用于:
若确定播报场景为问答场景,执行所述播报策略,控制主音响采用指定声音与用户进行问答。
可能的实施方式中,音响904还用于:
若确定播报场景为音乐场景,执行所述播报策略,控制预设数量的音响通过播放策略中各自指定的音量,采用音乐原声进行立体声播放。
基于同一发明构思,本发明实施例提供一种服务器,该服务器的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图10所示,该服务器主要包括:处理器1001、存储器1002和收发机1003,处理器1001、存储器1002和收发机1003之间通过总线架构连接,总线架构可以包括任意数量的互联的总线和桥,具体由处理器1001代表的一个或多个处理器和存储器1002代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机1003可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。其中,收发机1003在处理器的控制下接收和发送数据,存储器1002中保存有预设的程序,处理器1001读取存储器1002中的程序,按照该程序执行以下过程:
通过收发机1003接收空调发送的播报场景的标识;
通过处理器1001根据所述标识确定与所述标识对应的播报策略;
通过收发机1003将所述播报策略发送给空调。
可能的实施方式中,收发机1003还用于:
接收智能终端发送的修改播报策略中播报声音的指令;
通过处理器1001根据所述指令对所述播报声音进行修改并保存;
向智能终端发送修改成功的信息。
在介绍了本申请示例性实施方式的语音播报的方法及装置之后,接下来,介绍根据本申请的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的实施例,计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的语音播报方法中的步骤201-205。
下面参照图11来描述根据本申请的这种实施方式的计算装置110。图11显示的计算装置110仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。该计算装置例如可以是手机、平板电脑等。
如图11所示,计算装置110以通用计算装置的形式表现。计算装置110的组件可以包括但不限于:上述至少一个处理器111、上述至少一个存储器112、连接不同系统组件(包括存储器112和处理器111)的总线113。
总线113表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器112可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1121和/或高速缓存存储器1122,还可以进一步包括只读存储器(ROM)1123。
存储器112还可以包括具有一组(至少一个)程序模块1124的程序/实用工具1125,这样的程序模块1124包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置110也可以与一个或多个外部设备114(例如指向设备等)通信,还可与一个或者多个使得用户能与计算装置110交互的设备通信,和/或与使得该计算装置110能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等)通信。这种通信可以通过输入/输出(I/O)接口115进行。并且,计算装置110还可以通过网络适配器116与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器116通过总线113与用于计算装置110的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置110使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的语音播报方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的语音播报的方法中的步骤,执行如图2中所示的步骤201-205。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请实施方式的语音播报方法可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种语音播报方法,其特征在于,应用于空调,所述方法包括:
接收用户语音并对所述用户语音进行语义解析,得到用户语义;
根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
将确定的播报场景的标识发送给服务器;
接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
2.如权利要求1所述的方法,其特征在于,若确定播报场景为故事场景;则执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容,具体包括:
执行所述播报策略,控制与故事角色对应的指定播报音响采用与故事角色对应的播报声音播报该故事角色的内容。
3.如权利要求1所述的方法,其特征在于,若确定播报场景为以下任一场景:问答场景、提醒场景及诗词场景;则执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容,具体包括:
执行所述播报策略,控制主音响采用与确定的场景对应的预设声音与用户进行交互。
4.如权利要求1所述的方法,其特征在于,若确定播报场景为音乐场景或广播场景;则执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容,具体包括:
执行所述播报策略,控制预设数量的音响通过播放策略中各自指定的音量,采用音频原声进行立体声播放。
5.一种语音播报方法,其特征在于,应用于服务器,所述方法包括:
接收空调发送的播报场景的标识;
根据所述标识确定与所述标识对应的播报策略;
将所述播报策略发送给空调。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
接收智能终端发送的修改播报策略中播报声音的指令;
根据所述指令对所述播报声音进行修改并保存;
向智能终端发送修改成功的信息。
7.一种语音播报装置,其特征在于,应用于空调,所述装置包括:
接收语音模块,用于接收用户语音并对所述用户语音进行语义解析,得到用户语义;
确定播报场景模块,用于根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
发送标识模块,用于将确定的播报场景的标识发送给服务器;
接收播报策略模块,用于接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
执行模块,用于执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
8.一种空调,其特征在于,该空调包括处理器、存储器、收发机和音响,其中,收发机在处理器的控制下接收和发送数据,存储器中保存有预设的程序,处理器读取存储器中的程序,按照该程序执行以下过程:
通过收发机接收用户语音并对所述用户语音进行语义解析,得到用户语义;
通过处理器根据预置的语义与播放场景的对应关系,确定所述用户语义对应的播报场景;
通过收发机将确定的播报场景的标识发送给服务器;
通过收发机接收所述服务器发送的播报策略;所述播报策略包括:指定播报音响、该指定播报音响播报的内容以及对应的播报声音;
通过音响执行所述播报策略,控制所述指定播报音响采用对应的播报声音播报内容。
9.一种计算机可读介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1-6中任一权利要求所述的方法。
10.一种计算装置,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-6中任一权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811248166.XA CN109273001B (zh) | 2018-10-25 | 2018-10-25 | 一种语音播报方法、装置、计算装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811248166.XA CN109273001B (zh) | 2018-10-25 | 2018-10-25 | 一种语音播报方法、装置、计算装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109273001A true CN109273001A (zh) | 2019-01-25 |
CN109273001B CN109273001B (zh) | 2021-06-18 |
Family
ID=65195118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811248166.XA Active CN109273001B (zh) | 2018-10-25 | 2018-10-25 | 一种语音播报方法、装置、计算装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109273001B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569376A (zh) * | 2019-09-18 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 一种信息处理方法及装置、电子设备、存储介质 |
CN111124121A (zh) * | 2019-12-24 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 语音交互信息处理方法、装置、存储介质和计算机设备 |
CN111128123A (zh) * | 2019-07-12 | 2020-05-08 | 深圳云知声信息技术有限公司 | 一种基于方言识别与普通话识别的交互方法 |
CN111221494A (zh) * | 2019-12-26 | 2020-06-02 | 深圳市优必选科技股份有限公司 | 数据处理方法及装置、音频播报方法及装置 |
CN111259125A (zh) * | 2020-01-14 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 语音播报的方法和装置、智能音箱、电子设备、存储介质 |
CN111367490A (zh) * | 2020-02-28 | 2020-07-03 | 广州华多网络科技有限公司 | 语音播放方法、装置及电子设备 |
CN111415642A (zh) * | 2020-03-31 | 2020-07-14 | 广东美的制冷设备有限公司 | 用电设备的语音播报方法、装置、空调器和存储介质 |
CN111696516A (zh) * | 2020-05-28 | 2020-09-22 | 闫钊杰 | 一种多角色智能音箱伴侣系统 |
CN112071313A (zh) * | 2020-07-22 | 2020-12-11 | 特斯联科技集团有限公司 | 语音播报的方法、装置、电子设备及介质 |
CN112148246A (zh) * | 2019-06-26 | 2020-12-29 | 珠海格力电器股份有限公司 | 基于声音库的智能家电的交互方法 |
CN112269864A (zh) * | 2020-10-15 | 2021-01-26 | 北京百度网讯科技有限公司 | 生成播报语音的方法、装置、设备和计算机存储介质 |
CN113299273A (zh) * | 2021-05-20 | 2021-08-24 | 广州小鹏智慧充电科技有限公司 | 语音数据合成方法、终端设备以及计算机可读存储介质 |
CN113709291A (zh) * | 2021-08-06 | 2021-11-26 | 北京三快在线科技有限公司 | 音频处理方法、装置、电子设备及可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003006208A (ja) * | 2001-06-20 | 2003-01-10 | Daikin Ind Ltd | 音声記録装置および方法、音声再生装置および方法、音声記録再生システムおよび方法 |
CN102814045A (zh) * | 2012-08-28 | 2012-12-12 | 廖明忠 | 合唱玩具系统及合唱玩具演奏方法 |
CN106057205A (zh) * | 2016-05-06 | 2016-10-26 | 北京云迹科技有限公司 | 一种智能机器人自动语音交互方法 |
CN106502620A (zh) * | 2016-10-26 | 2017-03-15 | 宇龙计算机通信科技(深圳)有限公司 | 多媒体文件的多终端协同播放方法和终端 |
CN106648524A (zh) * | 2016-09-30 | 2017-05-10 | 四川九洲电器集团有限责任公司 | 一种音频播放方法及音频播放设备 |
CN107146622A (zh) * | 2017-06-16 | 2017-09-08 | 合肥美的智能科技有限公司 | 冰箱、语音交互系统、方法、计算机设备、可读存储介质 |
CN107995360A (zh) * | 2017-11-27 | 2018-05-04 | 广东欧珀移动通信有限公司 | 通话处理方法及相关产品 |
CN108053696A (zh) * | 2018-01-04 | 2018-05-18 | 广州阿里巴巴文学信息技术有限公司 | 一种根据阅读内容进行声音播放的方法、装置和终端设备 |
CN108091321A (zh) * | 2017-11-06 | 2018-05-29 | 芋头科技(杭州)有限公司 | 一种语音合成方法 |
CN108597509A (zh) * | 2018-03-30 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 智能语音交互实现方法、装置、计算机设备及存储介质 |
-
2018
- 2018-10-25 CN CN201811248166.XA patent/CN109273001B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003006208A (ja) * | 2001-06-20 | 2003-01-10 | Daikin Ind Ltd | 音声記録装置および方法、音声再生装置および方法、音声記録再生システムおよび方法 |
CN102814045A (zh) * | 2012-08-28 | 2012-12-12 | 廖明忠 | 合唱玩具系统及合唱玩具演奏方法 |
CN106057205A (zh) * | 2016-05-06 | 2016-10-26 | 北京云迹科技有限公司 | 一种智能机器人自动语音交互方法 |
CN106648524A (zh) * | 2016-09-30 | 2017-05-10 | 四川九洲电器集团有限责任公司 | 一种音频播放方法及音频播放设备 |
CN106502620A (zh) * | 2016-10-26 | 2017-03-15 | 宇龙计算机通信科技(深圳)有限公司 | 多媒体文件的多终端协同播放方法和终端 |
CN107146622A (zh) * | 2017-06-16 | 2017-09-08 | 合肥美的智能科技有限公司 | 冰箱、语音交互系统、方法、计算机设备、可读存储介质 |
CN108091321A (zh) * | 2017-11-06 | 2018-05-29 | 芋头科技(杭州)有限公司 | 一种语音合成方法 |
CN107995360A (zh) * | 2017-11-27 | 2018-05-04 | 广东欧珀移动通信有限公司 | 通话处理方法及相关产品 |
CN108053696A (zh) * | 2018-01-04 | 2018-05-18 | 广州阿里巴巴文学信息技术有限公司 | 一种根据阅读内容进行声音播放的方法、装置和终端设备 |
CN108597509A (zh) * | 2018-03-30 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 智能语音交互实现方法、装置、计算机设备及存储介质 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148246A (zh) * | 2019-06-26 | 2020-12-29 | 珠海格力电器股份有限公司 | 基于声音库的智能家电的交互方法 |
CN112148246B (zh) * | 2019-06-26 | 2022-02-22 | 珠海格力电器股份有限公司 | 基于声音库的智能家电的交互方法 |
CN111128123A (zh) * | 2019-07-12 | 2020-05-08 | 深圳云知声信息技术有限公司 | 一种基于方言识别与普通话识别的交互方法 |
CN110569376A (zh) * | 2019-09-18 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 一种信息处理方法及装置、电子设备、存储介质 |
CN111124121A (zh) * | 2019-12-24 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 语音交互信息处理方法、装置、存储介质和计算机设备 |
CN111221494A (zh) * | 2019-12-26 | 2020-06-02 | 深圳市优必选科技股份有限公司 | 数据处理方法及装置、音频播报方法及装置 |
CN111221494B (zh) * | 2019-12-26 | 2023-12-29 | 深圳市优必选科技股份有限公司 | 数据处理方法及装置、音频播报方法及装置 |
CN111259125A (zh) * | 2020-01-14 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 语音播报的方法和装置、智能音箱、电子设备、存储介质 |
CN111259125B (zh) * | 2020-01-14 | 2023-08-29 | 百度在线网络技术(北京)有限公司 | 语音播报的方法和装置、智能音箱、电子设备、存储介质 |
CN111367490A (zh) * | 2020-02-28 | 2020-07-03 | 广州华多网络科技有限公司 | 语音播放方法、装置及电子设备 |
CN111367490B (zh) * | 2020-02-28 | 2024-04-09 | 广州华多网络科技有限公司 | 语音播放方法、装置及电子设备 |
CN111415642A (zh) * | 2020-03-31 | 2020-07-14 | 广东美的制冷设备有限公司 | 用电设备的语音播报方法、装置、空调器和存储介质 |
CN111696516A (zh) * | 2020-05-28 | 2020-09-22 | 闫钊杰 | 一种多角色智能音箱伴侣系统 |
CN111696516B (zh) * | 2020-05-28 | 2023-06-20 | 闫钊杰 | 一种多角色智能音箱伴侣系统 |
CN112071313A (zh) * | 2020-07-22 | 2020-12-11 | 特斯联科技集团有限公司 | 语音播报的方法、装置、电子设备及介质 |
CN112269864A (zh) * | 2020-10-15 | 2021-01-26 | 北京百度网讯科技有限公司 | 生成播报语音的方法、装置、设备和计算机存储介质 |
CN112269864B (zh) * | 2020-10-15 | 2023-06-23 | 北京百度网讯科技有限公司 | 生成播报语音的方法、装置、设备和计算机存储介质 |
CN113299273B (zh) * | 2021-05-20 | 2024-03-08 | 广州小鹏汽车科技有限公司 | 语音数据合成方法、终端设备以及计算机可读存储介质 |
CN113299273A (zh) * | 2021-05-20 | 2021-08-24 | 广州小鹏智慧充电科技有限公司 | 语音数据合成方法、终端设备以及计算机可读存储介质 |
CN113709291A (zh) * | 2021-08-06 | 2021-11-26 | 北京三快在线科技有限公司 | 音频处理方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109273001B (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109273001A (zh) | 一种语音播报方法、装置、计算装置和存储介质 | |
McCarthy | Sound systems: design and optimization: modern techniques and tools for sound system design and alignment | |
US20220286781A1 (en) | Method and apparatus for listening scene construction and storage medium | |
CN106328126A (zh) | 远场语音识别处理方法及装置 | |
CN108597509A (zh) | 智能语音交互实现方法、装置、计算机设备及存储介质 | |
CN109637548A (zh) | 基于声纹识别的语音交互方法及装置 | |
CN110245254A (zh) | 汽车氛围灯的控制方法、装置、可读存储介质及电子设备 | |
CN113127609A (zh) | 语音控制方法、装置、服务器、终端设备及存储介质 | |
CN109147802A (zh) | 一种播放语速调节方法及装置 | |
CN108055617A (zh) | 一种麦克风的唤醒方法、装置、终端设备及存储介质 | |
CN110347848A (zh) | 一种演示文稿管理方法及装置 | |
CN106686431A (zh) | 一种音频文件的合成方法和设备 | |
CN106201425A (zh) | 一种智能终端音频输出的方法及装置 | |
CN109671429A (zh) | 语音交互方法及设备 | |
CN114242025A (zh) | 一种伴奏的生成方法、设备及存储介质 | |
CN109508166B (zh) | 音频播放方法、装置、设备及存储介质 | |
CN111161734A (zh) | 基于指定场景的语音交互方法及装置 | |
JP6196839B2 (ja) | 通信デュエット時における音声等の切換処理に特徴を有する通信カラオケシステム | |
CN108491473A (zh) | 一种音频文件的播放方法、装置、电子设备及介质 | |
CN109413663A (zh) | 一种信息处理方法和设备 | |
CN110381097A (zh) | 一种语音分享音频的方法、系统及车载终端 | |
CN108664890A (zh) | 一种矛盾协调方法、装置、机器人及存储介质 | |
Thomas | Library-podcast intersections | |
JP2009212852A (ja) | 情報処理装置、情報処理システムならびに情報処理装置の制御方法 | |
Birdsall et al. | Of sound mind: Mental distress and sound in twentieth-century media culture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |