CN111091827A - 语音导览方法及装置、终端和计算机可读存储介质 - Google Patents

语音导览方法及装置、终端和计算机可读存储介质 Download PDF

Info

Publication number
CN111091827A
CN111091827A CN201911353544.5A CN201911353544A CN111091827A CN 111091827 A CN111091827 A CN 111091827A CN 201911353544 A CN201911353544 A CN 201911353544A CN 111091827 A CN111091827 A CN 111091827A
Authority
CN
China
Prior art keywords
navigation
voice
terminal
information
navigation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911353544.5A
Other languages
English (en)
Other versions
CN111091827B (zh
Inventor
徐超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201911353544.5A priority Critical patent/CN111091827B/zh
Publication of CN111091827A publication Critical patent/CN111091827A/zh
Application granted granted Critical
Publication of CN111091827B publication Critical patent/CN111091827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Navigation (AREA)

Abstract

本发明公开了一种语音导览方法及装置、终端和计算机可读存储介质,该方法包括:实时采集第一语音信息;判断所述第一语音信息是否包括第一导览唤醒指令;在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述第二终端发送第一导览信息请求;接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;按照预定播报方式播报所述第一导览信息。通过本发明的技术方案,降低了第一终端的复杂程度,使得语音导览在导览设备上消耗的设备成本和维护成本均大幅度降低。

Description

语音导览方法及装置、终端和计算机可读存储介质
技术领域
本发明涉及终端技术领域,尤其涉及一种语音导览方法及装置、终端和计算机可读存储介质。
背景技术
在游览景点过程中,景区内往往会提供室内导览设备等,供游客使用。
然而,由于景区中的景点数量往往繁多,大型的室内导览设备的设备成本和维护成本就相应很高,且大型的室内导览设备由于其位置固定、数量少,无法供给大量游客同时使用。
因此,如何为游客游览景区提供有效便利,成为目前亟待解决的技术问题。
发明内容
本发明提供一种语音导览方法及装置、终端和计算机可读存储介质,针对相关技术中导览设备无法满足游客游览景区的实际需求的技术问题,可提供一种便携式的导览设备,以满足游客游览景区的实际需求。
本发明第一方面提供一种语音导览方法,用于未接入外部网络的第一终端,所述第一终端与接入外部网络中的第二终端交互,该方法包括:实时采集第一语音信息;判断所述第一语音信息是否包括第一导览唤醒指令;在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述第二终端发送第一导览信息请求;接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;按照预定播报方式播报所述第一导览信息。
在本发明上述实施例中,可选地,所述判断所述第一语音信息是否包括第一导览唤醒指令的步骤,具体包括:通过语音识别方式获取所述第一语音信息的关键字;判断预定导览唤醒指令集合中是否具有与所述关键字相匹配的预定关键字,其中,在所述预定导览唤醒指令集合中具有与所述关键字相匹配的所述预定关键字的情况下,将所述关键字确定为所述第一语音信息所包括的所述第一导览唤醒指令。
在本发明上述实施例中,可选地,还包括:接收所述第二终端基于云服务获取的唤醒指令更新信息;按照所述唤醒指令更新信息,更新所述预定导览唤醒指令集合。
在本发明上述实施例中,可选地,还包括:在所述按照预定播报方式播报所述第一导览信息的过程中,实时采集第二语音信息;判断所述第二语音信息是否包括第二导览唤醒指令;在所述第二语音信息包括所述第二导览唤醒指令的情况下,向所述第二终端发送第二导览信息请求;中断正在播报的所述第一导览信息,并播报所述第二导览信息请求对应的第二导览信息。
在本发明上述实施例中,可选地,在所述判断所述第一语音信息是否包括第一导览唤醒指令的步骤之前,还包括:对采集到的所述第一语音信息进行语音增强处理和语音降噪处理;在所述判断所述第二语音信息是否包括第二导览唤醒指令的步骤之前,还包括:对采集到的所述第二语音信息进行语音增强处理和语音降噪处理。
本发明第二方面提供一种语音导览方法,用于接入外部网络的第二终端,所述第二终端与未接入外部网络的第一终端交互,该方法包括:接收所述第一终端的第一导览信息请求;基于所述第一导览信息请求,从云服务获取对应的第一导览信息;将所述第一导览信息发送至所述第一终端。
在本发明上述实施例中,可选地,还包括:检测是否接收到所述云服务的针对所述第一导览信息的唤醒指令更新信息;在检测到所述唤醒指令更新信息的情况下,将所述唤醒指令更新信息发送至所述第一终端。
本发明第三方面提供一种语音导览装置,用于未接入外部网络的第一终端,所述第一终端与接入外部网络中的第二终端交互,所述语音导览装置包括:第一语音信息采集单元,用于实时采集第一语音信息;第一语音信息判断单元,用于判断所述第一语音信息是否包括第一导览唤醒指令;第一导览信息请求发送单元,用于在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述第二终端发送第一导览信息请求;第一导览信息接收单元,用于接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;第一导览信息播报单元,用于按照预定播报方式播报所述第一导览信息。
在本发明上述实施例中,可选地,所述第一语音信息判断单元用于:通过语音识别方式获取所述第一语音信息的关键字;判断预定导览唤醒指令集合中是否具有与所述关键字相匹配的预定关键字,其中,在所述预定导览唤醒指令集合中具有与所述关键字相匹配的所述预定关键字的情况下,将所述关键字确定为所述第一语音信息所包括的所述第一导览唤醒指令。
在本发明上述实施例中,可选地,还包括:更新信息接收单元,用于接收所述第二终端基于云服务获取的唤醒指令更新信息;指令集合更新单元,用于按照所述唤醒指令更新信息,更新所述预定导览唤醒指令集合。
在本发明上述实施例中,可选地,还包括:第二语音信息采集单元,用于在所述按照预定播报方式播报所述第一导览信息的过程中,实时采集第二语音信息;第二语音信息判断单元,用于判断所述第二语音信息是否包括第二导览唤醒指令;第二导览信息请求发送单元,用于在所述第二语音信息包括所述第二导览唤醒指令的情况下,向所述第二终端发送第二导览信息请求;第一导览信息终端单元,用于中断正在播报的所述第一导览信息;第二导览信息播报单元,用于播报所述第二导览信息请求对应的第二导览信息。
在本发明上述实施例中,可选地,还包括:语音处理单元,用于在所述第一语音信息判断单元判断所述第一语音信息是否包括第一导览唤醒指令之前,对采集到的所述第一语音信息进行语音增强处理和语音降噪处理,以及在所述第二语音信息判断单元判断所述第二语音信息是否包括第二导览唤醒指令之前,对采集到的所述第二语音信息进行语音增强处理和语音降噪处理。
本发明第四方面提供一种语音导览装置,用于接入外部网络的第二终端,所述第二终端与未接入外部网络的第一终端交互,所述语音导览装置包括:导览信息请求接收单元,用于接收所述第一终端的第一导览信息请求;导览信息获取单元,用于基于所述第一导览信息请求,从云服务获取对应的第一导览信息;导览信息发送单元,用于将所述第一导览信息发送至所述第一终端。
在本发明上述实施例中,可选地,还包括:更新信息检测单元,用于检测是否接收到所述云服务的针对所述第一导览信息的唤醒指令更新信息;更新信息发送单元,用于在检测到所述唤醒指令更新信息的情况下,将所述唤醒指令更新信息发送至所述第一终端。
本发明第五方面提供一种终端,所述终端未接入外部网络,与接入外部网络中的第二终端交互,所述终端包括:语音采集模块,用于实时采集第一语音信息;语音处理模块,用于对所述语音采集模块采集到的所述第一语音信息进行语音增强处理和语音降噪处理;控制器,用于判断经所述语音增强处理和所述语音降噪处理后的所述第一语音信息是否包括第一导览唤醒指令,其中,在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述通信模块发送通信指令;通信模块,用于基于所述通信指令向所述第二终端发送第一导览信息请求,以及用于接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;播报模块,用于按照预定播报方式播报所述通信模块接收到的所述第一导览信息。
本发明第六方面提供一种终端,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述第一方面和第二方面中任一项所述的方法。
本发明第六方面提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述第二方面中任一项所述的方法流程。
本发明的技术方案,针对相关技术中导览设备无法满足游客游览景区的实际需求的技术问题,可提供一种便携式的导览设备(下称第一终端)。第一终端未接入外部网络,且可与接入外部网络中的第二终端交互,第二终端包括但不限于游客所携带的手机、平板、可穿戴设备等具有热点、蓝牙等外部设备接入功能的电子设备。
第一终端实时采集第一语音信息,并判断所述第一语音信息是否包括第一导览唤醒指令,其中,第一终端采集的语音信息可能是游客发出的导览唤醒指令,也可能不是,因此,需要对第一语音信息进行语音识别,识别出第一语音信息中是否包括有效的第一导览唤醒指令。
在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述第二终端发送第一导览信息请求。其中,第一终端虽未接入外部网络,但可通过第二终端的热点、蓝牙等功能与第二终端交互。
第一终端将第一导览信息请求发送至第二终端后,第二终端即可通过访问云服务,在云服务获取该第一导览信息请求所请求的第一导览信息。
接着,第二终端将第一导览信息反馈至第一终端,第一终端即可按照预定播报方式播报所述第一导览信息,其中,预定播报方式包括但不限于语音播报、视频播报、文字展示等。
在上述技术方案中,第一终端无需花费存储空间存储任何导览信息,也无需花费系统资源与外部网络交互,而是只需根据游客的实时语音向第二终端请求单次的导览信息进行播报即可。这样,降低了第一终端的复杂程度,第一终端即可获得低成本、便于维护的优势,使得语音导览在导览设备上消耗的设备成本和维护成本均大幅度降低。
并且,本技术方案在借助游客的第二终端降低了语音导览成本的基础上,通过与第二终端的实时交互,增加了语音导览的实时性和便利性,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了根据本发明的一个实施例的语音导览方法的流程图;
图2示出了根据本发明的另一个实施例的语音导览方法的流程图;
图3示出了根据本发明的再一个实施例的语音导览方法的流程图;
图4示出了根据本发明的一个实施例的语音导览装置的框图;
图5示出了根据本发明的另一个实施例的语音导览装置的框图;
图6示出了根据本发明的一个实施例的终端的结构图;
图7示出了根据本发明的另一个实施例的终端的框图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了根据本发明的一个实施例的语音导览方法的流程图。
如图1所示,根据本发明的一个实施例的语音导览方法用于未接入外部网络的第一终端,第一终端与接入外部网络中的第二终端交互,其中,第一终端是便携式的导览设备,未接入外部网络,且可与接入外部网络中的第二终端交互,第二终端包括但不限于游客所携带的手机、平板、可穿戴设备等具有热点、蓝牙等外部设备接入功能的电子设备。
则该方法包括:
步骤102,实时采集第一语音信息。
在本发明的一种实现方式中,可直接将第一语音信息送入步骤104。
在本发明的另一种实现方式中,可对采集到的第一语音信息进行语音增强处理和语音降噪处理,以提升第一语音信息的语音质量,便于增强对其进行语音识别时的准确性和可靠性。
步骤104,判断第一语音信息是否包括第一导览唤醒指令。
第一终端实时采集第一语音信息后,判断第一语音信息是否包括第一导览唤醒指令,其中,第一终端采集的语音信息可能是游客发出的导览唤醒指令,也可能不是,因此,需要对第一语音信息进行语音识别,识别出第一语音信息中是否包括有效的第一导览唤醒指令。
具体来说,第一终端可通过语音识别方式获取第一语音信息的关键字,关键字的数量可以为一个或多个,关键字的内容为第一语音信息中跟在指定词后的词。比如,设置指定词为“播报”,当第一语音信息为“请播报皇陵的历史”,则第一终端可识别关键词“皇陵”和/或“皇陵的历史”。
接下来,第一终端判断预定导览唤醒指令集合中是否具有与关键字相匹配的预定关键字。预定导览唤醒指令集合包括大量预定关键字,每个预定关键字均在云服务内对应有一条或多条导览信息,因此,若预定导览唤醒指令集合中具有与关键字相匹配的预定关键字,说明该关键字在云服务内对应有有效的导览信息,反之,说明该关键字在云服务内不具有有效的导览信息。
因此,在预定导览唤醒指令集合中具有与关键字相匹配的预定关键字的情况下,第一终端确定通过该关键字可以向云服务获取到有效的导览信息,即可将关键字确定为第一语音信息所包括的第一导览唤醒指令。
步骤106,在第一语音信息包括第一导览唤醒指令的情况下,向第二终端发送第一导览信息请求。
在第一语音信息包括第一导览唤醒指令的情况下,向第二终端发送第一导览信息请求。其中,第一终端虽未接入外部网络,但可通过第二终端的热点、蓝牙等功能与第二终端交互。
步骤108,接收第二终端基于第一导览信息请求从云服务获取的第一导览信息。
第一终端将第一导览信息请求发送至第二终端后,第二终端即可通过访问云服务,在云服务获取该第一导览信息请求所请求的第一导览信息。
接着,第二终端将第一导览信息反馈至第一终端。
步骤110,按照预定播报方式播报第一导览信息。
第一终端即可按照预定播报方式播报第一导览信息,其中,预定播报方式包括但不限于语音播报、视频播报、文字展示等。
在上述技术方案中,第一终端无需花费存储空间存储任何导览信息,也无需花费系统资源与外部网络交互,而是只需根据游客的实时语音向第二终端请求单次的导览信息进行播报即可。这样,降低了第一终端的复杂程度,第一终端即可获得低成本、便于维护的优势,使得语音导览在导览设备上消耗的设备成本和维护成本均大幅度降低。
并且,本技术方案在借助游客的第二终端降低了语音导览成本的基础上,通过与第二终端的实时交互,增加了语音导览的实时性和便利性,提升了用户体验。
在本发明的一种实现方式中,还包括:第一终端接收第二终端基于云服务获取的唤醒指令更新信息;按照唤醒指令更新信息,更新预定导览唤醒指令集合。
也就是说,第二终端可从云服务接收到唤醒指令更新信息,并将唤醒指令更新信息发送至第一终端,第一终端根据该唤醒指令更新信息更新自身的预定导览唤醒指令集合。
其中,由于第一终端无需存储导览信息本身,只需要存储预定导览唤醒指令集合,以大大降低存储成本和成本。进一步地,由于无需存储导览信息本身,也就无需对大量导览信息进行更新。
若在云服务对已有的导览信息进行修改等更新,则对于第一终端来讲,其预定关键词不变,只通过该预定关键词即可获得更新后的导览信息。
若在云服务新增导览信息,则对于第一终端来讲,只需要在预定导览唤醒指令集合中新增该新增导览信息对应的预定关键词即可,从而使得便携式导览设备的更新简单高效。
图2示出了根据本发明的另一个实施例的语音导览方法的流程图。
如图2所示,根据本发明的另一个实施例的语音导览方法包括:
步骤202,在按照预定播报方式播报第一导览信息的过程中,实时采集第二语音信息。
在第一终端播报第一导览信息的过程中,游客可随时发出新的第二语音信息,该第二语音信息可能为无关语音,也可能为新的第二导览唤醒指令。
步骤204,判断第二语音信息是否包括第二导览唤醒指令。
步骤206,在第二语音信息包括第二导览唤醒指令的情况下,向第二终端发送第二导览信息请求。
通过语音识别方式识别第二语音信息中的关键字,若该关键字属于预定导览唤醒指令集合中的预定关键字,则说明第二语音信息包括有效的第二导览唤醒指令,故可向第二终端请求第二导览唤醒指令对应的导览信息。
步骤208,中断正在播报的第一导览信息,并播报第二导览信息请求对应的第二导览信息。
第二终端向云服务请求第二导览唤醒指令对应的第二导览信息,并将该第二导览信息发送至第一终端,第一终端即可中断正在播报的第一导览信息,直接播报第二导览信息。
在以上技术方案中,游客可随时通过新的语音指令打断正在播报的内容,获得新的播报内容,增加了语音导览的可控性和便利性,方便了游客的使用。
图3示出了根据本发明的再一个实施例的语音导览方法的流程图。
如图3所示,根据本发明的再一个实施例的语音导览方法,用于接入外部网络的第二终端,第二终端与未接入外部网络的第一终端交互,该方法包括:
步骤302,接收第一终端的第一导览信息请求。
在第一语音信息包括第一导览唤醒指令的情况下,向第二终端发送第一导览信息请求。其中,第一终端虽未接入外部网络,但可通过第二终端的热点、蓝牙等功能与第二终端交互。
步骤304,基于第一导览信息请求,从云服务获取对应的第一导览信息。
步骤306,将第一导览信息发送至第一终端。
第一终端将第一导览信息请求发送至第二终端后,第二终端即可通过访问云服务,在云服务获取该第一导览信息请求所请求的第一导览信息。接着,第二终端将第一导览信息反馈至第一终端,第一终端即可按照预定播报方式播报第一导览信息,其中,预定播报方式包括但不限于语音播报、视频播报、文字展示等。
在上述技术方案中,第一终端无需花费存储空间存储任何导览信息,也无需花费系统资源与外部网络交互,而是只需根据游客的实时语音向第二终端请求单次的导览信息进行播报即可。这样,降低了第一终端的复杂程度,第一终端即可获得低成本、便于维护的优势,使得语音导览在导览设备上消耗的设备成本和维护成本均大幅度降低。
并且,本技术方案在借助游客的第二终端降低了语音导览成本的基础上,通过与第二终端的实时交互,增加了语音导览的实时性和便利性,提升了用户体验。
在本发明的一种实现方式中,还包括:第二终端检测是否接收到云服务的针对第一导览信息的唤醒指令更新信息;在检测到唤醒指令更新信息的情况下,将唤醒指令更新信息发送至第一终端。
第二终端可从云服务接收到唤醒指令更新信息,并将唤醒指令更新信息发送至第一终端,第一终端根据该唤醒指令更新信息更新自身的预定导览唤醒指令集合。其中,由于第一终端无需存储导览信息本身,只需要存储预定导览唤醒指令集合,以大大降低存储成本和成本。进一步地,由于无需存储导览信息本身,也就无需对大量导览信息进行更新。
若在云服务对已有的导览信息进行修改等更新,则对于第一终端来讲,其预定关键词不变,只通过该预定关键词即可获得更新后的导览信息。若在云服务新增导览信息,则对于第一终端来讲,只需要在预定导览唤醒指令集合中新增该新增导览信息对应的预定关键词即可,从而使得便携式导览设备的更新简单高效。
图4示出了根据本发明的一个实施例的语音导览装置的框图。
如图4所示,根据本发明的一个实施例的语音导览装置400用于未接入外部网络的第一终端,第一终端与接入外部网络中的第二终端交互,包括:第一语音信息采集单元402,用于实时采集第一语音信息;第一语音信息判断单元404,用于判断第一语音信息是否包括第一导览唤醒指令;第一导览信息请求发送单元406,用于在第一语音信息包括第一导览唤醒指令的情况下,向第二终端发送第一导览信息请求;第一导览信息接收单元408,用于接收第二终端基于第一导览信息请求从云服务获取的第一导览信息;第一导览信息播报单元410,用于按照预定播报方式播报第一导览信息。
在本发明上述实施例中,可选地,第一语音信息判断单元404用于:通过语音识别方式获取第一语音信息的关键字;判断预定导览唤醒指令集合中是否具有与关键字相匹配的预定关键字,其中,在预定导览唤醒指令集合中具有与关键字相匹配的预定关键字的情况下,将关键字确定为第一语音信息所包括的第一导览唤醒指令。
在本发明上述实施例中,可选地,还包括:更新信息接收单元,用于接收第二终端基于云服务获取的唤醒指令更新信息;指令集合更新单元,用于按照唤醒指令更新信息,更新预定导览唤醒指令集合。
在本发明上述实施例中,可选地,还包括:第二语音信息采集单元,用于在按照预定播报方式播报第一导览信息的过程中,实时采集第二语音信息;第二语音信息判断单元,用于判断第二语音信息是否包括第二导览唤醒指令;第二导览信息请求发送单元,用于在第二语音信息包括第二导览唤醒指令的情况下,向第二终端发送第二导览信息请求;第一导览信息终端单元,用于中断正在播报的第一导览信息;第二导览信息播报单元,用于播报第二导览信息请求对应的第二导览信息。
在本发明上述实施例中,可选地,还包括:语音处理单元,用于在第一语音信息判断单元404判断第一语音信息是否包括第一导览唤醒指令之前,对采集到的第一语音信息进行语音增强处理和语音降噪处理,以及在第二语音信息判断单元判断第二语音信息是否包括第二导览唤醒指令之前,对采集到的第二语音信息进行语音增强处理和语音降噪处理。
该语音导览装置400使用图1和图2示出的实施例中任一项的方案,因此,具有上述所有技术效果,在此不再赘述。
图5示出了根据本发明的另一个实施例的语音导览装置的框图。
如图5所示,根据本发明的另一个实施例的语音导览装置500用于接入外部网络的第二终端,第二终端与未接入外部网络的第一终端交互,包括:导览信息请求接收单元502,用于接收第一终端的第一导览信息请求;导览信息获取单元504,用于基于第一导览信息请求,从云服务获取对应的第一导览信息;导览信息发送单元506,用于将第一导览信息发送至第一终端。
在本发明上述实施例中,可选地,还包括:更新信息检测单元,用于检测是否接收到云服务的针对第一导览信息的唤醒指令更新信息;更新信息发送单元,用于在检测到唤醒指令更新信息的情况下,将唤醒指令更新信息发送至第一终端。
该语音导览装置500使用图3示出的实施例中任一项的方案,因此,具有上述所有技术效果,在此不再赘述。
图6示出了根据本发明的一个实施例的终端的结构图。
如图6所示,根据本发明的一个实施例的终端600未接入外部网络,与接入外部网络中的第二终端交互,包括:
语音采集模块602,用于实时采集第一语音信息,并将采集到的第一语音信息发送至控制器606。
语音采集模块602包括但不限于麦克风阵列及其相关周围的电路。麦克风阵列包括数字麦克风和模拟麦克风等,数字麦克风配有供电电路,模拟麦克风配有AD转换芯片,将模拟麦克风的模拟信号转化为处理器可处理的数字信号。
语音处理模块604,用于对语音采集模块602采集到的第一语音信息进行语音增强处理和语音降噪处理。
控制器606将第一语音信息分配给语音处理模块604处理,语音处理模块604可实现语音交互,实现语音的前端信号处理以及语音的唤醒与识别功能。
由于语音信号处理是具有计算密集以及流处理的特点,因此,语音处理模块604通常选择DSP作为其核心,以DSP作为中央处理器(即控制器606)的协处理器去处理繁重的语音计算,能够平衡功耗。
控制器606,用于判断经语音增强处理和语音降噪处理后的第一语音信息是否包括第一导览唤醒指令,其中,在第一语音信息包括第一导览唤醒指令的情况下,向通信模块608发送通信指令。
其中,可选择MCU作为该模块的核心组件,控制器606还包括能让MCU运行起来的最小系统,即包含运行起来所必须的时钟源、分压电源、电容电感电路等。该控制器606主要是协调各个模块的正常工作运转,如语音数据的传递、各类功能的逻辑处理等。
通信模块608,用于基于通信指令向第二终端发送第一导览信息请求,以及用于接收第二终端基于第一导览信息请求从云服务获取的第一导览信息。
该模块主要是为了更好地解决设备联网的问题,便携式的语音导览终端可通过游客手机的热点等方式访问云服务。
播报模块610,用于按照预定播报方式播报通信模块接收到的第一导览信息。
播报模块610通过耳机或者喇叭等播放器放音,播报模块610具有DA转换芯片以及功放等组件,用于将数字信号转换为模拟信号。
另外,在图6中未示出的是,终端600还可包括电源管理模块和存储模块。
电源管理模块主要是负责整个设备各模块的电压分配,如控制器606的电压、语音采集模块602的供电电压、通信模块608的电压等,因为各个模块所需的电压不同,因此,电源管理模块通过电压分压芯片为各个模块分配电压。。
存储模块用于缓存接收到的导览信息,并可在导览信息被播报完毕后,删除该导览信息,以释放内存。
图7示出了根据本发明的另一个实施例的终端的框图。
如图7所示,本发明的一个实施例的终端700,包括至少一个存储器702;以及,与至少一个存储器702通信连接的处理器704;其中,存储器存储有可被至少一个处理器704执行的指令,指令被设置为用于执行上述图3实施例中任一项所述的方案。因此,该终端700具有和图3实施例中任一项相同的技术效果,在此不再赘述。
本发明实施例的终端以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
另外,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述图1至图3实施例中任一项所述的方法流程。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,降低了第一终端的复杂程度,使得语音导览在导览设备上消耗的设备成本和维护成本均大幅度降低。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种语音导览方法,其特征在于,用于未接入外部网络的第一终端,所述第一终端与接入外部网络中的第二终端交互,该方法包括:
实时采集第一语音信息;
判断所述第一语音信息是否包括第一导览唤醒指令;
在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述第二终端发送第一导览信息请求;
接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;
按照预定播报方式播报所述第一导览信息。
2.根据权利要求1所述的语音导览方法,其特征在于,所述判断所述第一语音信息是否包括第一导览唤醒指令的步骤,具体包括:
通过语音识别方式获取所述第一语音信息的关键字;
判断预定导览唤醒指令集合中是否具有与所述关键字相匹配的预定关键字,其中,在所述预定导览唤醒指令集合中具有与所述关键字相匹配的所述预定关键字的情况下,将所述关键字确定为所述第一语音信息所包括的所述第一导览唤醒指令。
3.根据权利要求2所述的语音导览方法,其特征在于,还包括:
接收所述第二终端基于云服务获取的唤醒指令更新信息;
按照所述唤醒指令更新信息,更新所述预定导览唤醒指令集合。
4.根据权利要求1至3中任一项所述的语音导览方法,其特征在于,还包括:
在所述按照预定播报方式播报所述第一导览信息的过程中,实时采集第二语音信息;
判断所述第二语音信息是否包括第二导览唤醒指令;
在所述第二语音信息包括所述第二导览唤醒指令的情况下,向所述第二终端发送第二导览信息请求;
中断正在播报的所述第一导览信息,并播报所述第二导览信息请求对应的第二导览信息。
5.一种语音导览方法,其特征在于,用于接入外部网络的第二终端,所述第二终端与未接入外部网络的第一终端交互,该方法包括:
接收所述第一终端的第一导览信息请求;
基于所述第一导览信息请求,从云服务获取对应的第一导览信息;
将所述第一导览信息发送至所述第一终端。
6.根据权利要求5所述的语音导览方法,其特征在于,还包括:
检测是否接收到所述云服务的针对所述第一导览信息的唤醒指令更新信息;
在检测到所述唤醒指令更新信息的情况下,将所述唤醒指令更新信息发送至所述第一终端。
7.一种语音导览装置,其特征在于,用于未接入外部网络的第一终端,所述第一终端与接入外部网络中的第二终端交互,所述语音导览装置包括:
第一语音信息采集单元,用于实时采集第一语音信息;
第一语音信息判断单元,用于判断所述第一语音信息是否包括第一导览唤醒指令;
第一导览信息请求发送单元,用于在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述第二终端发送第一导览信息请求;
第一导览信息接收单元,用于接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;
第一导览信息播报单元,用于按照预定播报方式播报所述第一导览信息。
8.一种语音导览装置,其特征在于,用于接入外部网络的第二终端,所述第二终端与未接入外部网络的第一终端交互,所述语音导览装置包括:
导览信息请求接收单元,用于接收所述第一终端的第一导览信息请求;
导览信息获取单元,用于基于所述第一导览信息请求,从云服务获取对应的第一导览信息;
导览信息发送单元,用于将所述第一导览信息发送至所述第一终端。
9.一种终端,其特征在于,所述终端未接入外部网络,与接入外部网络中的第二终端交互,所述终端包括:
语音采集模块,用于实时采集第一语音信息;
语音处理模块,用于对所述语音采集模块采集到的所述第一语音信息进行语音增强处理和语音降噪处理;
控制器,用于判断经所述语音增强处理和所述语音降噪处理后的所述第一语音信息是否包括第一导览唤醒指令,其中,在所述第一语音信息包括所述第一导览唤醒指令的情况下,向所述通信模块发送通信指令;
通信模块,用于基于所述通信指令向所述第二终端发送第一导览信息请求,以及用于接收所述第二终端基于所述第一导览信息请求从云服务获取的第一导览信息;
播报模块,用于按照预定播报方式播报所述通信模块接收到的所述第一导览信息。
10.一种终端,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求5或6所述的方法。
11.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至6中任一项所述的方法流程。
CN201911353544.5A 2019-12-25 2019-12-25 语音导览方法及装置、终端和计算机可读存储介质 Active CN111091827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911353544.5A CN111091827B (zh) 2019-12-25 2019-12-25 语音导览方法及装置、终端和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911353544.5A CN111091827B (zh) 2019-12-25 2019-12-25 语音导览方法及装置、终端和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111091827A true CN111091827A (zh) 2020-05-01
CN111091827B CN111091827B (zh) 2022-12-06

Family

ID=70398380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911353544.5A Active CN111091827B (zh) 2019-12-25 2019-12-25 语音导览方法及装置、终端和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111091827B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112786053A (zh) * 2021-01-08 2021-05-11 上海动听网络科技有限公司 基于智慧公共服务的听力辅助方法、存储介质以及电子装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107171687A (zh) * 2017-06-29 2017-09-15 深圳双猴科技有限公司 一种导游设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107171687A (zh) * 2017-06-29 2017-09-15 深圳双猴科技有限公司 一种导游设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112786053A (zh) * 2021-01-08 2021-05-11 上海动听网络科技有限公司 基于智慧公共服务的听力辅助方法、存储介质以及电子装置
CN112786053B (zh) * 2021-01-08 2021-10-12 上海动听网络科技有限公司 基于智慧公共服务的听力辅助方法、存储介质以及电子装置

Also Published As

Publication number Publication date
CN111091827B (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
CN107172477B (zh) 投票方法及装置
CN105979312B (zh) 一种信息分享方法及装置
CN106786962B (zh) 充电控制方法、装置及终端
CN110633067B (zh) 一种音效参数的调节方法及移动终端
CN104581221A (zh) 视频直播的方法和装置
CN107507628B (zh) 唱歌评分方法、装置及终端
KR20170129197A (ko) 메시지 업데이팅 방법, 장치 및 단말
CN107025120B (zh) 软件升级处理方法、装置和终端
CN107645682B (zh) 进行直播的方法和系统
CN109672775B (zh) 调节唤醒灵敏度的方法、装置及终端
CN109243488B (zh) 音频检测方法、装置及存储介质
CN107766455B (zh) 歌词接龙方法、装置和计算机可读存储介质
CN108536480B (zh) 输入法配置方法及相关产品
CN110392298A (zh) 一种音量调节方法、装置、设备及介质
US20150343306A1 (en) Supplemental Computing Devices For Game Consoles
CN112230877A (zh) 一种语音操作方法、装置、存储介质及电子设备
CN110718212A (zh) 语音唤醒方法、装置及系统、终端和计算机可读存储介质
CN112189344A (zh) 一种从音视频文件中选择音轨的方法及装置
CN112269842A (zh) 一种信息处理方法、装置、存储介质及计算机设备
CN111091827B (zh) 语音导览方法及装置、终端和计算机可读存储介质
CN109389977B (zh) 一种语音交互方法及装置
CN105550316A (zh) 音频列表的推送方法及装置
CN107452361A (zh) 歌曲分句方法及装置
CN110347578B (zh) 一种应用的测试方法、装置及存储介质
CN113220262A (zh) 一种多应用程序的音频数据分发方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 215024 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215024 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

GR01 Patent grant
GR01 Patent grant