CN110797023A - 一种语音速记方法及设备 - Google Patents

一种语音速记方法及设备 Download PDF

Info

Publication number
CN110797023A
CN110797023A CN201911070799.0A CN201911070799A CN110797023A CN 110797023 A CN110797023 A CN 110797023A CN 201911070799 A CN201911070799 A CN 201911070799A CN 110797023 A CN110797023 A CN 110797023A
Authority
CN
China
Prior art keywords
voice
information
shorthand
recognition result
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911070799.0A
Other languages
English (en)
Inventor
刘德深
罗照军
牛嘉斌
林士翔
岳聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mobvoi Information Technology Co Ltd
Chumen Wenwen Information Technology Co Ltd
Original Assignee
Mobvoi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mobvoi Information Technology Co Ltd filed Critical Mobvoi Information Technology Co Ltd
Priority to CN201911070799.0A priority Critical patent/CN110797023A/zh
Publication of CN110797023A publication Critical patent/CN110797023A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种语音速记方法及设备,首先监听语音信息;当监听到包括特定唤醒词的语音信息时,激活语音速记应用;进一步通过所述语音速记应用对目标信号进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;再利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。

Description

一种语音速记方法及设备
技术领域
本发明涉及语音识别技术,尤其涉及一种语音速记方法及设备。
背景技术
近几年来,随着智能设备的兴起,语音交互已经成为其中必不可少的部分。对于用户最常用的语音提醒或语音备忘录功能,往往需要用户在进行提醒或备忘设置时进行准确的语音表达,才能实现对提醒或备忘事件的准确记录和提醒。如提醒内容较丰富时,现有技术很难准确还原用户想要提醒的事件。而且,在用户是老人、孩子等特定身份用户时,无法满足对特定用户语音提醒的个性化需求。
发明内容
本发明实施例为了解决当前语音提醒或语音备忘录功能所存在的以上缺陷,创造性地提供一种语音速记方法及设备。
根据本发明的第一方面,提供一种语音速记方法,该方法包括:监听语音信息;当监听到包括特定唤醒词的语音信息时,激活语音速记应用;通过所述语音速记应用对目标信号进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
根据本发明一实施方式,所述语音识别结果为所述目标语音信息属于快速查询的指令语音类型;相应的,利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作,包括:识别所述目标语音信息中的查询信息;在与所述特定唤醒词对应的数据库中查询与所述查询信息匹配的备忘提醒信息;反馈所述备忘提醒信息。
根据本发明一实施方式,所述语音识别结果为所述目标语音信息属于快速记录的指令语音类型;相应的,利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作,包括:对所述目标语音信息进行记录,以形成备忘提醒信息;将所形成的备忘提醒信息存储至与所述特定唤醒词对应的数据库。
根据本发明一实施方式,对所述目标语音信息进行记录,以形成备忘提醒信息,包括:将所述目标语音信息记录为事件对象;检测所述事件对象中所包括的事件因素信息,并将所述事件对象和所包括的事件因素信息对应存储,以形成备忘提醒信息。
根据本发明一实施方式,所述事件对象为多个;相应的,检测所述事件对象中所包括的事件因素信息,并将所述事件对象和所包括的事件因素信息对应存储,包括:分别检测所述多个事件对象中每个事件对象中所包括的事件因素信息,并分别将所述每个事件对象与所包括的事件因素信息对应存储。
根据本发明一实施方式,所述方法还包括:若所述事件因素信息中存在时间信息,则生成与所形成的备忘提醒信息对应的主动语音提醒事项。
根据本发明一实施方式,所述方法应用于多个智能设备;所述多个智能设备之间与所述特定唤醒词对应的数据库中的备忘提醒信息自动同步。
根据本发明一实施方式,所述方法应用于智能耳机和与所述智能耳机相连接的智能设备,其中,通过所述智能耳机中的唤醒词检测装置来监听语音信息;当所述智能耳机中的唤醒词检测装置监听到包括特定唤醒词的语音信息时,激活所述智能设备中的语音速记应用,以通过所述语音速记应用对目标语音信息进行语音识别,得到语音识别结果,所述目标语音信息为监听到所述特定唤醒词之后连续输入的语音信息;并利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
根据本发明的第二方面,又提供一种语音速记设备,所述设备包括:语音监听模块,用于监听语音信息;触发模块,用于当监听到包括特定唤醒词的语音信息时,触发激活语音速记应用;处理模块,用于通过所述语音速记应用对目标语音信息进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;还用于利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
根据本发明一实施方式,所述语音识别结果为所述目标语音信息属于快速查询的指令语音类型;相应的,所述处理模块具体用于,识别所述目标语音信息中的查询信息;在与所述特定唤醒词对应的数据库中查询与所述查询信息匹配的备忘提醒信息;反馈所述备忘提醒信息。
根据本发明一实施方式,所述语音识别结果为所述目标语音信息属于快速记录的指令语音类型;相应的,所述处理模块具体用于,对所述目标语音信息进行记录,以形成备忘提醒信息;将所形成的备忘提醒信息存储至与所述特定唤醒词对应的数据库。
根据本发明一实施方式,所述处理模块具体用于,将所述目标语音信息记录为事件对象;检测所述事件对象中所包括的事件因素信息,并将所述事件对象和所包括的事件因素信息对应存储,以形成备忘提醒信息。
根据本发明一实施方式,所述事件对象为多个;相应的,所述处理模块具体用于,分别检测所述多个事件对象中每个事件对象中所包括的事件因素信息,并分别将所述每个事件对象与所包括的事件因素信息对应存储。
根据本发明一实施方式,所述处理模块还用于,若所述事件因素信息中存在时间信息,则生成与所形成的备忘提醒信息对应的主动语音提醒事项。
根据本发明一实施方式,所述设备为智能耳机、智能音箱或其他智能设备的任意组合。
本发明实施例语音速记方法及设备,首先监听语音信息;当监听到包括特定唤醒词的语音信息时,激活语音速记应用;进一步通过所述语音速记应用对目标信号进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;再利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。如此,通过在智能设备上设置的与特定唤醒词匹配的语音速记应用,以及对应的特定数据库,使得在检测到包括特定唤醒词的语音信息后,即可实时激活语音速记应用,以利用特定数据库实现语音信息的快速记录或快速查询,从而高效准确的还原用户想要提醒的事件。同时,由于特定唤醒词的设置,使得用户只需用自然语言表达事件内容即可,从而大大方便了老人和孩子使用,得以满足对特定用户语音提醒的个性化需求。
需要理解的是,本发明的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本发明实施例语音速记方法的实现流程示意图一;
图2示出了本发明实施例语音速记方法的实现流程示意图二;
图3示出了本发明实施例语音速记方法的实现流程示意图三;
图4示出了本发明实施例语音速记设备的组成结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为使本发明更加透彻和完整,并能够将本发明的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
图1示出了本发明实施例语音速记方法的实现流程示意图一;参考图1,本发明实施例语音速记方法包括:操作101,监听语音信息;操作102,当监听到包括特定唤醒词的语音信息时,激活语音速记应用;操作103,通过所述语音速记应用对目标信号进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;操作104,利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
在操作101,在智能设备上电后,语音监听模块立即进入激活状态,并对周围声音信号进行监测。由于预先设置了特定唤醒词,如“小问秘书”,故语音监听模块会监听是否收到包括该特定唤醒词的语音信息。
这里,该特定唤醒词为用户预先在智能设备上设定或者为系统设定的一个单词或多个单词,例如可以是“小问秘书”。具体的,该唤醒词是不可拆分的,是连续的。例如,若智能设备通过语音监听模块监听到包括“小问,你好,秘书”的语音信息,则语音监听模块并未监听到包括特定唤醒词的语音信息。
在操作102~104,当监听到包括特定唤醒词的语音信息时,智能设备会触发激活语音速记应用,语音速记应用会对监听到的用户所输入的语音信息进行语音识别、及对识别结果进行速记等操作。
这里,需要说明的是,本发明实施例特定唤醒词“小问秘书”与一般唤醒词效果不同。举例来说,通过“嗨小问”唤醒智能设备进行语音对话时,实际上是用户和连接了网络的虚拟语音助手之间进行交互。这样,由于需要通过检索网络获取网络信息,故反应时间会比较慢,用户体验差。而本发明特定唤醒词“小问秘书”会直接激活与其匹配的语音速记应用以及对应的特定数据库,即直接唤醒“小问秘书”功能所查询的是“小问秘书”功能所使用的特定数据库。
当然,与特定唤醒词对应的数据库既可以包括“小问秘书”记录功能所记录在本地的信息,也可以包括智能设备的语音备忘录或其他备忘信息,但不包括检索用户网络端的信息,因此可以保证通过“小问秘书”来查询提醒或备忘信息的速度,而且同样支持连续语音的直接查询,从而能够高效准确的还原用户想要提醒的事件。
其中,在操作103~104,语音识别结果可以为目标语音信息属于快速查询的指令语音类型,还可以为语音识别结果为所述目标语音信息属于快速记录的指令语音类型。
具体地,当语音识别结果为目标语音信息属于快速查询的指令语音类型时,利用与特定唤醒词对应的数据库执行与语音识别结果对应的速记操作,包括:识别目标语音信息中的查询信息;在与特定唤醒词对应的数据库中查询与查询信息匹配的备忘提醒信息;反馈所述备忘提醒信息。当语音识别结果为目标语音信息属于快速记录的指令语音类型时,利用与特定唤醒词对应的数据库执行与语音识别结果对应的速记操作,包括:对目标语音信息进行记录,以形成备忘提醒信息;将所形成的备忘提醒信息存储至与特定唤醒词对应的数据库。
本发明实施例语音速记方法,首先监听语音信息;当监听到包括特定唤醒词的语音信息时,激活语音速记应用;进一步通过所述语音速记应用对目标信号进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;再利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。如此,通过在智能设备上设置的与特定唤醒词匹配的语音速记应用,以及对应的特定数据库,使得在检测到包括特定唤醒词的语音信息后,即可实时激活语音速记应用,以利用特定数据库实现语音信息的快速记录或快速查询,从而高效准确的还原用户想要提醒的事件。同时,由于特定唤醒词的设置,使得用户只需用自然语言表达事件内容即可,从而大大方便了老人和孩子使用,得以满足对特定用户语音提醒的个性化需求。
图2示出了本发明实施例语音速记方法的实现流程示意图二;参考图2,本发明实施例语音速记方法包括:操作201,监听语音信息;操作202,当监听到包括特定唤醒词的语音信息时,激活语音速记应用;操作203,通过语音速记应用对目标信号进行语音识别,得到目标语音信息属于快速查询的指令语音类型的语音识别结果;操作204,识别目标语音信息中的查询信息;操作205,在与特定唤醒词对应的数据库中查询与查询信息匹配的备忘提醒信息;操作206,反馈备忘提醒信息。
具体地,本发明实施例操作201~203的具体实现流程与图1所示实施例的操作101~103相类似,这里不再赘述。
需要说明的是,本发明实施例特定唤醒词“小问秘书”与一般唤醒词效果不同。举例来说,通过“嗨小问”唤醒智能设备进行语音对话时,实际上是用户和连接了网络的虚拟语音助手之间进行交互。这样,由于需要通过检索网络获取网络信息,故反应时间会比较慢,用户体验差。而本发明特定唤醒词“小问秘书”会直接激活与其匹配的语音速记应用以及对应的特定数据库,即直接唤醒“小问秘书”功能所查询的是“小问秘书”功能所使用的特定数据库。
当然,与特定唤醒词对应的数据库既可以包括“小问秘书”记录功能所记录在本地的信息,也可以包括智能设备的语音备忘录或其他备忘信息,但不包括检索用户网络端的信息,因此可以保证通过“小问秘书”来查询提醒或备忘信息的速度,而且同样支持连续语音的直接查询,从而能够高效准确的还原用户想要提醒的事件。
在应用实例中,操作204,在属于快速查询的指令语音类型的目标语音信息中获取到查询信息如下:“小问秘书”“我的房间号是多少”;“小问秘书”“我的车停在哪里”;“小问秘书”“我的会议时间是何时”。这样,在操作205~206,可以从特定数据库中查询到对应的房间号XXX,车停在BBB及会议时间为下午12:00的备忘提醒信息,并反馈该备忘提醒信息至用户。
根据本发明一实施方式,所述方法应用于多个智能设备;所述多个智能设备之间与所述特定唤醒词对应的数据库中的备忘提醒信息自动同步。这样,如果用户选择关联智能设备之间的提醒、备忘信息同步,则智能设备(如智能手机、用户电脑、手机)之间的备忘信息将在连接网络时自动同步,以方便用户获得全面准确的提醒信息。
图3示出了本发明实施例语音速记方法的实现流程示意图三;参考图3,本发明实施例语音速记方法包括:操作301,监听语音信息;操作302,当监听到包括特定唤醒词的语音信息时,激活语音速记应用;操作303,通过语音速记应用对目标信号进行语音识别,得到目标语音信息属于快速记录的指令语音类型的语音识别结果;操作304,对目标语音信息进行记录,以形成备忘提醒信息;操作305,将所形成的备忘提醒信息存储至与特定唤醒词对应的数据库。
具体地,本发明实施例操作301~303的具体实现流程与图1所示实施例的操作101~103相类似,这里不再赘述。
在操作304,首先将所述目标语音信息记录为事件对象;进一步检测所述事件对象中所包括的事件因素信息,并将所述事件对象和所包括的事件因素信息对应存储,以形成备忘提醒信息。其中,事件因素信息可以包括时间信息,地点信息,人物信息及任务信息等。
具体地,在语音监听过程中,在监听到特定唤醒词“小问秘书”后,立即监听并记录其后的语音信息,并将该语音信息记录为一个事件对象,同时对该段语音信息中是否有时间、地点、人物信息进行检测,在检测到有时间、地点、任务信息时,将其与事件对象进行对应存储,形成可能的提醒项或备忘事项。当然,在此过程中并不需要用户说出“帮我设置某某提醒”、“提醒我几点做某事”等具体设置提醒命令的信息。同时由于提前对关键词进行了提取,因此查询和响应速度更快。
根据本发明一实施方式,在语音监听过程中,在监听到特定唤醒词“小问秘书”后,立即监听并记录其后的语音信息。若用户说出一长段语音信息,则该一长段语音信息中可以包含多个;相应的,检测事件对象中所包括的事件因素信息,并将事件对象和所包括的事件因素信息对应存储,包括:分别检测所述多个事件对象中每个事件对象中所包括的事件因素信息,并分别将所述每个事件对象与所包括的事件因素信息对应存储。即通过“小问秘书”对应的语音速记应用对这些事件对象信息逐一进行上述的处理和记录,记录后的信息都将用于用户以“小问秘书”开头的语音查询命令。
根据本发明一实施方式,所述方法还包括:若所述事件因素信息中存在时间信息,则生成与所形成的备忘提醒信息对应的主动语音提醒事项。即默认对于存在时间信息(如开始时间)的事件对象,“小问秘书”将在事件开始前定时对用户进行语音提醒。
可选的,提醒间隔可以通过自然语言来完成设置。例如,用户可以说:“小问秘书”“在会议开始前的半小时提醒我”(效果:所有会议类提醒提前半小时提醒)。用户也可以说:“小问秘书”“下午3点会议在开始前半小时提醒我”(效果:仅当天下午3点会议提前半小时提醒)。上述区别,主要在于事件对象的参数是否有具体限定,如果检测到有限定,则对限定后的事件对象进行设置,如果没有具体限定,则需要对所有符合要求的事件对象进行设置。
根据本发明一实施方式,所述方法应用于智能耳机和与所述智能耳机相连接的智能设备,其中,通过所述智能耳机中的唤醒词检测装置来监听语音信息;当所述智能耳机中的唤醒词检测装置监听到包括特定唤醒词的语音信息时,激活所述智能设备中的语音速记应用,以通过所述语音速记应用对目标语音信息进行语音识别,得到语音识别结果,所述目标语音信息为监听到所述特定唤醒词之后连续输入的语音信息;并利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
在实际应用中,由于智能耳机资源相当有限,对语音的识别和存储功能无法在耳机中完成,而是在与耳机相连接的智能设备中(如智能手机、智能手表、智能音箱、车载智能后视镜等),因此在耳机用户说出“小问秘书”时实际是唤醒了与其相连接的智能设备的“小问秘书”功能。
基于上文所述语音速记方法,本发明实施例还提供一种语音速记设备,如图4所示,该设备40包括:语音监听模块401,用于监听语音信息;触发模块402,用于当监听到包括特定唤醒词的语音信息时,触发激活语音速记应用;处理模块403,用于通过语音速记应用对目标语音信息进行语音识别,得到语音识别结果,目标语音信息为从监听到特定唤醒词开始连续输入的语音信息;还用于利用与特定唤醒词对应的数据库执行与语音识别结果对应的速记操作。
根据本发明一实施方式,语音识别结果为目标语音信息属于快速查询的指令语音类型;相应的,处理模块403具体用于,识别目标语音信息中的查询信息;在与特定唤醒词对应的数据库中查询与查询信息匹配的备忘提醒信息;反馈所述备忘提醒信息。
根据本发明一实施方式,语音识别结果为目标语音信息属于快速记录的指令语音类型;相应的,处理模块403具体用于,对目标语音信息进行记录,以形成备忘提醒信息;将所形成的备忘提醒信息存储至与特定唤醒词对应的数据库。
根据本发明一实施方式,处理模块403具体用于,将目标语音信息记录为事件对象;检测事件对象中所包括的事件因素信息,并将事件对象和所包括的事件因素信息对应存储,以形成备忘提醒信息。
根据本发明一实施方式,事件对象为多个;相应的,处理模块403具体用于,分别检测多个事件对象中每个事件对象中所包括的事件因素信息,并分别将每个事件对象与所包括的事件因素信息对应存储。
根据本发明一实施方式,处理模块403还用于,若事件因素信息中存在时间信息,则生成与所形成的备忘提醒信息对应的主动语音提醒事项。
根据本发明一实施方式,设备40可以为智能耳机、智能音箱或其他智能设备的任意组合。
同样,基于如上文所述语音速记方法,本发明实施例又提供一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器至少执行如下所述的操作步骤:操作101,监听语音信息;操作102,当监听到包括特定唤醒词的语音信息时,激活语音速记应用;操作103,通过所述语音速记应用对目标信号进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;操作104,利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
这里需要指出的是:以上针对语音速记设备及计算机存储介质实施例的描述,与前述图1至3所示的方法实施例的描述是类似的,具有同前述图1至3所示的方法实施例相似的有益效果,因此不做赘述。对于本发明语音速记设备实施例中未披露的技术细节,请参照本发明前述图1至3所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种语音速记方法,其特征在于,所述方法包括:
监听语音信息;
当监听到包括特定唤醒词的语音信息时,激活语音速记应用;
通过所述语音速记应用对目标语音信息进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;
利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
2.根据权利要求1所述的方法,其特征在于,所述语音识别结果为所述目标语音信息属于快速查询的指令语音类型;
相应的,利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作,包括:
识别所述目标语音信息中的查询信息;
在与所述特定唤醒词对应的数据库中查询与所述查询信息匹配的备忘提醒信息;
反馈所述备忘提醒信息。
3.根据权利要求1所述的方法,其特征在于,所述语音识别结果为所述目标语音信息属于快速记录的指令语音类型;
相应的,利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作,包括:
对所述目标语音信息进行记录,以形成备忘提醒信息;
将所形成的备忘提醒信息存储至与所述特定唤醒词对应的数据库。
4.根据权利要求3所述的方法,其特征在于,对所述目标语音信息进行记录,以形成备忘提醒信息,包括:
将所述目标语音信息记录为事件对象;
检测所述事件对象中所包括的事件因素信息,并将所述事件对象和所包括的事件因素信息对应存储,以形成备忘提醒信息。
5.根据权利要求4所述的方法,其特征在于,所述事件对象为多个;
相应的,检测所述事件对象中所包括的事件因素信息,并将所述事件对象和所包括的事件因素信息对应存储,包括:
分别检测所述多个事件对象中每个事件对象中所包括的事件因素信息,并分别将所述每个事件对象与所包括的事件因素信息对应存储。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述事件因素信息中存在时间信息,则生成与所形成的备忘提醒信息对应的主动语音提醒事项。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法应用于多个的智能设备;所述多个智能设备之间与所述特定唤醒词对应的数据库中的备忘提醒信息自动同步。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述方法应用于智能耳机和与所述智能耳机相连接的智能设备,其中,
通过所述智能耳机中的唤醒词检测装置来监听语音信息;
当所述智能耳机中的唤醒词检测装置监听到包括特定唤醒词的语音信息时,激活所述智能设备中的语音速记应用,以通过所述语音速记应用对目标语音信息进行语音识别,得到语音识别结果,所述目标语音信息为监听到所述特定唤醒词之后连续输入的语音信息;并利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
9.一种语音速记设备,其特征在于,所述设备包括:
语音监听模块,用于监听语音信息;
触发模块,用于当监听到包括特定唤醒词的语音信息时,触发激活语音速记应用;
处理模块,用于通过所述语音速记应用对目标语音信息进行语音识别,得到语音识别结果,所述目标语音信息为从监听到所述特定唤醒词开始连续输入的语音信息;还用于利用与所述特定唤醒词对应的数据库执行与所述语音识别结果对应的速记操作。
10.根据权利要求9所述的设备,其特征在于,所述设备为智能耳机、智能音箱或其他智能设备的任意组合。
CN201911070799.0A 2019-11-05 2019-11-05 一种语音速记方法及设备 Pending CN110797023A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911070799.0A CN110797023A (zh) 2019-11-05 2019-11-05 一种语音速记方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911070799.0A CN110797023A (zh) 2019-11-05 2019-11-05 一种语音速记方法及设备

Publications (1)

Publication Number Publication Date
CN110797023A true CN110797023A (zh) 2020-02-14

Family

ID=69442799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911070799.0A Pending CN110797023A (zh) 2019-11-05 2019-11-05 一种语音速记方法及设备

Country Status (1)

Country Link
CN (1) CN110797023A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038630A (zh) * 2014-05-28 2014-09-10 小米科技有限责任公司 语音处理方法及装置
CN106327151A (zh) * 2016-08-15 2017-01-11 捷开通讯(深圳)有限公司 一种基于语音识别的记事方法和记事系统
CN107038220A (zh) * 2017-03-20 2017-08-11 北京光年无限科技有限公司 用于生成备忘录的方法、智能机器人及系统
CN107146611A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音响应方法、装置及智能设备
CN107886944A (zh) * 2017-11-16 2018-04-06 出门问问信息科技有限公司 一种语音识别方法、装置、设备及存储介质
CN108958846A (zh) * 2018-09-27 2018-12-07 出门问问信息科技有限公司 一种记事本事项的创建方法及装置
CN109658070A (zh) * 2018-12-26 2019-04-19 深圳创维数字技术有限公司 备忘事件的备忘提醒方法、终端及存储介质
CN109947906A (zh) * 2017-09-11 2019-06-28 慧利众科技股份有限公司 智能语音交互式电子备忘录及其操作方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038630A (zh) * 2014-05-28 2014-09-10 小米科技有限责任公司 语音处理方法及装置
CN106327151A (zh) * 2016-08-15 2017-01-11 捷开通讯(深圳)有限公司 一种基于语音识别的记事方法和记事系统
CN107038220A (zh) * 2017-03-20 2017-08-11 北京光年无限科技有限公司 用于生成备忘录的方法、智能机器人及系统
CN107146611A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音响应方法、装置及智能设备
CN109947906A (zh) * 2017-09-11 2019-06-28 慧利众科技股份有限公司 智能语音交互式电子备忘录及其操作方法
CN107886944A (zh) * 2017-11-16 2018-04-06 出门问问信息科技有限公司 一种语音识别方法、装置、设备及存储介质
CN108958846A (zh) * 2018-09-27 2018-12-07 出门问问信息科技有限公司 一种记事本事项的创建方法及装置
CN109658070A (zh) * 2018-12-26 2019-04-19 深圳创维数字技术有限公司 备忘事件的备忘提醒方法、终端及存储介质

Similar Documents

Publication Publication Date Title
KR102419513B1 (ko) 캡처된 이미지들과 관련된 메타 데이터 저장
JP7322076B2 (ja) 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード
JP7247271B2 (ja) 非要請型コンテンツの人間対コンピュータダイアログ内へのプロアクティブな組込み
US10319375B2 (en) Audio message extraction
EP3611724A1 (en) Voice response method and device, and smart device
US9167368B2 (en) Event notification on a mobile device using binaural sounds
CN110214351A (zh) 记录的媒体热词触发抑制
CN110472941B (zh) 基于通知消息的日程创建方法和装置、终端、存储介质
CN104969289A (zh) 数字助理的语音触发器
CN106663245A (zh) 社交提醒
CN108604178A (zh) 个性化和场境化的音频简报
CN107481719A (zh) 个人助理模块的非确定性任务发起
CN107408238B (zh) 从音频数据和计算机操作上下文自动捕获信息
CN103888581A (zh) 一种通信终端及其记录通话信息的方法
CN111917629A (zh) 消息提醒方法、装置及电子设备
CN106960667B (zh) 位置提醒方法、装置和系统
CN104144250A (zh) 一种终端上对事件进行提醒的方法及装置
CN111370004A (zh) 人机交互方法、语音处理方法及设备
WO2016145855A1 (zh) 事件提醒方法及装置
CN102857638B (zh) 一种移动终端的消息提醒方法及系统
CN110797023A (zh) 一种语音速记方法及设备
CN111739529A (zh) 一种交互方法、装置、耳机和服务器
CA2799045C (en) Event notification on a mobile device using binaural sounds
US10997975B2 (en) Enhanced vehicle key
CN110741619A (zh) 一种显示备注信息的方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214

RJ01 Rejection of invention patent application after publication