CN113096662A - 信息撷取装置及其语音控制方法 - Google Patents

信息撷取装置及其语音控制方法 Download PDF

Info

Publication number
CN113096662A
CN113096662A CN202110523043.8A CN202110523043A CN113096662A CN 113096662 A CN113096662 A CN 113096662A CN 202110523043 A CN202110523043 A CN 202110523043A CN 113096662 A CN113096662 A CN 113096662A
Authority
CN
China
Prior art keywords
voice
instruction
signal
data
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110523043.8A
Other languages
English (en)
Inventor
陈明泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitac Computer Kunshan Co Ltd
Getac Technology Corp
Original Assignee
Mitac Computer Kunshan Co Ltd
Getac Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitac Computer Kunshan Co Ltd, Getac Technology Corp filed Critical Mitac Computer Kunshan Co Ltd
Priority to CN202110523043.8A priority Critical patent/CN113096662A/zh
Publication of CN113096662A publication Critical patent/CN113096662A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种信息撷取装置及其语音控制方法,信息撷取装置的语音控制方法包括:接收声音信号、比对声音信号与至少一枪声资料、进行声音信号的语音辨识以得到实际语音内容、根据实际语音内容确认至少一指令语音内容、当实际语音内容对应于任一指令语音内容时,取得对应指令语音内容的操作指令,以致使信息撷取装置响应操作指令进行对应操作指令的动作,以及当声音信号与任一枪声资料相符时,输出启动录制指令,以致使信息撷取装置响应启动录制指令进行影音录制。从而通过枪声启动影音录制并且语音辨识声音信号以得到实际语音内容,进而取得对应的操作指令,并通过操作指令来执行对应操作指令的动作,以及时进行信息撷取。

Description

信息撷取装置及其语音控制方法
本申请是分案申请,原申请号为201810766554.0,申请日为2018年7月13日,发明名称为“信息撷取装置及其语音控制方法”。
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种信息撷取装置及其语音控制方法。
背景技术
警护人员在执行警务工作时,为了搜集证据往往需要进行录音录影,以保全相关的证据。因此,警护人员在出勤时可通过配戴信息撷取装置来撷取周遭环境影像、声音等媒体资料以协助执行警务工作,且信息撷取装置所记录的媒体资料还可记录事件发生之时的现场情况,用以提供日后举证、厘清责任之用。
目前,在使用上,使用者须通过操作信息撷取装置上的启动开关,开启携带式信息撷取装置进行撷取环境资料。然而,若是突遇紧急情况,使用者往往没时间手动启动撷取,抑或启动时已错失撷取关键情况的影像和/或声音的时间点。
发明内容
本发明实施例提供了一种信息撷取装置及其语音控制方法,以即时进行信息撷取。
第一方面,本发明实施例提供了一种信息撷取装置的语音控制方法,其包含:接收声音信号、比对声音信号与至少一枪声资料、进行声音信号的语音辨识以得到实际语音内容、根据实际语音内容确认至少一指令语音内容、于实际语音内容对应于任一指令语音内容时,取得对应指令语音内容的操作指令,以致使信息撷取装置响应操作指令进行对应操作指令的动作,以及于声音信号与任一枪声资料相符时,输出启动录制指令,以致使信息撷取装置响应启动录制指令进行影音录制。
可选的,方法还包括:根据一声纹资料确认声音信号;当声音信号与声纹资料相符时,进行声音信号的语音辨识的步骤;当声音信号与声纹资料不相符且声音信号与任一枪声资料不相符时,不进行声音信号的语音辨识的步骤且舍弃声音信号。
可选的,操作指令包括启动录制指令。
可选的,操作指令包括一结束录制指令。
可选的,操作指令包括一分类指令。
第二方面,本发明实施例提供了一种信息撷取装置,包含麦克风、语音辨识单元、影音录制单元以及控制单元。麦克风接收声音信号。语音辨识单元耦接麦克风,并根据至少一枪声资料确认声音信号,进行声音信号的语音辨识以得到实际语音内容。影音录制单元进行影音录制以撷取一环境资料。控制单元耦接语音辨识单元以及影音录制单元,于实际语音内容对应于指令语音内容时,取得对应指令语音内容的操作指令并响应操作指令进行对应操作指令的动作,以及于声音信号与任一枪声资料相符时,输出启动录制指令并响应启动录制指令启动影音录制单元。
可选的,语音辨识单元还根据一声纹资料确认声音信号,其中,当声音信号与声纹资料相符时,语音辨识单元进行声音信号的语音辨识的步骤,以及当声音信号与声纹资料不相符时,语音辨识单元不进行声音信号的语音辨识。
可选的,声音信号与声调资料不相符且声音信号与任一枪声资料不相符时,语音辨识单元舍弃声音信号。
综上所述,本发明实施例的信息撷取装置及其语音控制方法,能通过枪声启动影音录制并且语音辨识声音信号以得到实际语音内容,进而取得对应的操作指令,并且因应操作指令来执行对应操作指令的动作。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明一实施例的信息撷取装置的电路方框图;
图2为本发明一实施例的信息撷取装置的语音控制方法的流程图;
图3为本发明另一实施例的信息撷取装置的电路方框图;
图4为本发明另一实施例的信息撷取装置的语音控制方法的流程图;
图5为本发明另一实施例的信息撷取装置的语音控制方法的流程图;
图6为本发明又一实施例的信息撷取装置的语音控制方法的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、软件实现、硬件实现等等。
图1为本发明一实施例的信息撷取装置的电路方框图。图2为本发明一实施例的信息撷取装置的语音控制方法的流程图。请参阅图1及图2,信息撷取装置100包括麦克风110、语音辨识单元120、影音录制单元130及控制单元140。麦克风110与语音辨识单元120耦接,语音辨识单元120及影音录制单元130都与控制单元140耦接。
如图2所示,本实施方式中的信息撷取装置的语音控制方法包括:
步骤S01,接收一声音信号。
具体的说,本实施方式中的麦克风110接收环境声音。麦克风110中还包括信号处理电路,但在图1中未对信号处理电路进行绘出,麦克风中所包含的信号处理电路能够将环境声音生成对应的一声音信号,从而实现通过麦克风接收一声音信号。并且麦克风原始所接收的环境声音的形式具体可以为物理声波,而通过信号处理电路转换后的声音信号的形式具体可以为数位信号。
其中,接收环境声音指对周遭环境的声音进行收音,环境声音可以是信息撷取装置100周遭的人、动物或物体所发出的声音以及枪声等。例如,物体所发出的声音具体可以是行经的车辆及/或其喇叭声;周遭的人所发出的声音具体可以是路人呼喊声等,当然,本实施方式中仅是举例说明,而并不对环境声音的具体内容进行限定。
步骤S03,比对声音信号与至少一枪声资料,进行声音信号的语音辨识以得到一实际语音内容。
具体的说,本实施方式中的语音辨识单元120接收来自麦克风110的声音信号后,语音辨识单元120一方面会比对声音信号与至少一枪声资料,以确认声音信号是否与任一枪声资料相符。另一方面,语音辨识单元120还会对声音信号进行语音辨识,以得到实际语音内容。
需要说明的是,本实施方式中信息撷取装置还包括储存模块150,如图3所示为另一实施例的信息撷取装置的电路方框图,并且储存模块150耦接控制单元140。在储存模块150中储存有一个声音模型资料库,并且声音模型资料库包括至少一或是多个枪声资料以及至少一或是多个语音资料。其中,枪声资料为各种类型的手枪击发的声响信号,语音资料为字、词与句子等构成的多组字串的词汇集及其发音。
其中,语音辨识单元120通过将所接收的声音信号与储存模块150中的声音模型资料库的枪声资料进行分析比对,以确认声音信号是否与任一枪声资料相符。换言之,语音辨识单元120分析声音信号以撷取声音信号的至少一特征,并且将声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征比对,以确认声音信号是否与任一枪声资料相符。并且在进行特征对比时,当声音信号的特征与枪声资料的信号特征的重合度超过预设阈值时,则说明相符,否则,说明不相符。预设阈值可以设置为80%,即特征重合度超过80%则说明相符,当然,本实施方式中仅是举例说明,而并不对预设阈值的具体数值进行限定。
值得一提的是,语音辨识单元120通过将声音信号与储存模块150中的声音模型资料库的语音信号进行分析比对,以确认声音信号是否与任一枪声资料相符。换言之,语音辨识单元120分析声音信号以撷取声音信号的至少一特征,并且将声音信号的特征与声音模型资料库的语音资料进行识别或比对以选取或判断声音信号的文字内容,从而取得符合声音信号的特征的实际语音内容。此过程中涉及到了语音识别的相关技术,由于关于语音识别的具体工作原理并不是本申请的重点,因此本实施方式中不再进行赘述。
需要说明的是,本实施方式中的语音辨识单元120可以同时进行声音信号的语音辨识,以及声音信号与枪声资料的比对。
步骤S05,根据实际语音内容确认至少一指令语音内容。
具体的说,控制单元140接收来自语音辨识单元120所分析的实际语音内容并根据实际语音内容确认至少一指令语音内容。在储存模块150中还包含一查询表,在图3中未对控制单元中的查询表进行绘制,而在查询表中包含实际语音内容与指令语音内容之间的对应关系。在执行过程中控制单元140根据所获取的实际语音内容通过在查询表中进行遍历,以确认与实际语音内容所匹配的至少一指令语音内容。
需要说明的是,对应于任一指令语音内容的实际语音内容可以与指令语音内容完全相同,例如是,实际语音内容为「启动录制指令」,而指令语音内容为「启动录制」;或者,对应于任一指令语音内容的实际语音内容可以与指令语音内容有一定比例以上的内容相同。例如是,实际语音内容为「启动」,而指令语音内容为「启动录制」;或者,对应于任一指令语音内容的实际语音内容可包括相同于指令语音内容的内容及不同于指令语音内容的其他内容(例如环境音内容),例如是,实际语音内容为「启动录制」以及不同于指令语音内容的环境音内容,而指令语音内容为「启动录制」。当然,本实施方式中仅是以上述三种情况进行的举例说明,而并不对实际语音内容与指令语音内容的具体匹配规则进行限定。
步骤S07,当实际语音内容对应于任一指令语音内容时,取得对应指令语音内容的操作指令,以致使信息撷取装置响应操作指令进行对应操作指令的动作。
其中,当实际语音内容对应于任一指令语音内容,也即实际语音内容可以完全对应于指令语音内容或是对应于指令语音内容及其他非指令语音内容(例如是环境音内容)时,控制单元140根据实际语音内容所对应的指令语音内容而取得对应指令语音内容的操作指令,以致使信息撷取装置100响应操作指令进行对应操作指令的动作。
可选的,操作指令可以包括启动录制指令。
可选的,操作指令可以包括一结束录制指令。
可选的,操作指令可以包括一分类指令。
需要说明的是,在查询表中不仅包含实际语音内容与指令语音内容之间的对应关系,同时还包括指令语音内容与操作指令的对应关系,因此控制单元140当根据实际语音内容从查找表中找到对应的指令语音内容后,控制单元140还可以进一步从查找表中对应找到的指令语音内容的操作指令。
步骤S09,当声音信号与任一枪声资料相符时,输出启动录制指令,以致使信息撷取装置响应启动录制指令进行影音录制。
具体的说,当声音信号与任一枪声资料相符时,也即步骤S03中当语音辨识单元120比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征后,确认声音信号与任一枪声资料相符时,语音辨识单元120将比对声音信号与任一枪声资料相符的结果传输至控制单元140,以使控制单元140输出启动录制指令,进而致使信息撷取装置100的响应启动录制指令进行影音录制。
其中,信息撷取装置响应启动录制指令进行影音录制时,具体是控制单元140响应启动录制指令控制影音录制单元130进行影音录制以撷取环境资料,即对周遭环境的影像及/或声音,例如是行经的车辆及/或其喇叭声、路人及/或其呼喊声、或者是手枪的影像及其发出的声音等进行录制。
需要说明的是,当声音信号与任一枪声资料不相符时,也即未有枪声时,控制单元140仅致使信息撷取装置100响应操作指令进行对应操作指令的动作,即仅执行步骤S01至步骤S07,而不再执行步骤S09中的因应枪声而响应启动录制指令的操作。
如图4所示,为另一实施例的信息撷取装置的语音控制方法的流程图,本实施例中语音辨识单元120可以先执行步骤S03a,比对声音信号与至少一枪声资料,再执行步骤S03b进行声音信号的语音辨识以得到实际语音内容。即语音辨识单元所执行的两个操作动作是独立分别执行的,而对于其它操作步骤与上述实施例图2的内容相同,本实施方式中不再进行赘述。
需注意的是,虽然前述依序描述各步骤,但此顺序并非本发明的限制,本领域技术人员应可了解在合理情况下部分步骤的执行顺序可同时进行或先后对调。
图5为本发明另一实施例的信息撷取装置的语音控制方法的流程图。如图5所示,本实施例相对于图4所对应的实施例来说,在执行步骤S03b之前,增加了步骤S03c,控制单元140还可以根据一声纹资料确认声音信号。其中,步骤S05、步骤S07、及步骤S09与前述大致相同。
步骤S01,接收声音信号。
步骤S03a,比对声音信号与至少一枪声资料。
步骤S03c,根据一声纹资料确认声音信号。
具体的说,语音辨识单元120分析声音信号以生成一输入声谱图,并且将输入声谱图的特征与一声纹资料的预设声谱图的特征进行识别或比对以进行使用者的身份识别验证,从而识别是否是使用者本人发出的语音。
其中,使用者可以通过麦克风110预先录制各操作指令,以设定关联于使用者的对应各操作指令的预设声谱图。其中,在信息撷取装置100的储存模块150中储存有声纹资料,而声纹资料指对应各操作指令的预设声谱图。另外,声纹资料也可以是由一位或多位使用者所预先录制的对应各操作指令的预设声谱图。
步骤S04,确认声音信号是否符合枪声资料,以及确认声音信号是否符合声纹资料。确定声纹资料相符时执行步骤S03b,在确定枪声资料相符时执行步骤S09,在确定上述两者都不相符时执行步骤S03d。
步骤S03b,进行声音信号的语音辨识以得到实际语音内容。
其中,当声音信号与声纹资料相符,也即输入声谱图的特征与声纹资料的预设声谱图的特征相符时,控制单元140才进行声音信号的语音辨识以得到实际语音内容。并且,信息撷取装置100可接续执行步骤S05至步骤S07。
步骤S05,根据实际语音内容确认至少一指令语音内容。
步骤S07,当实际语音内容对应于任一指令语音内容时,取得对应指令语音内容的操作指令,以致使信息撷取装置响应操作指令进行对应操作指令的动作。
需要说明的是,操作指令可以为「启动录制指令」、「结束录制指令」、「分类指令」的其中任一种;在另一些实施例中,操作指令也可以为「回复尚可录影的时数指令」、「储存档案并拨放提示音指令」、「回复剩余容量指令」、及「回复解析度指令」等。操作指令的种类仅作为示例,并非对本发明的限制,本领域技术人员应可了解在合理情况下操作指令可以示程式设定而新增或变动。
步骤S09,输出启动录制指令,以致使信息撷取装置响应启动录制指令进行影音录制。
其中,当声音信号与枪声资料相符时,语音辨识单元120将比对声音信号与任一枪声资料相符的结果传输至控制单元140,以使控制单元140输出启动录制指令,进而致使信息撷取装置100响应启动录制指令进行影音录制。
步骤S03d,不进行声音信号的语音辨识且舍弃声音信号。
其中,当声音信号与声纹资料不相符且声音信号与任一枪声资料不相符时,也即输入声谱图的特征与声纹资料的预设声谱图的特征不相符且并未有枪声时,控制单元140不进行声音信号的语音辨识且舍弃声音信号。
需要说明的是,针对另外一种情况,即当声音信号与声纹资料相符且声音信号与任一枪声资料相符时,控制单元140接续执行步骤S03b、步骤S05、步骤S07至步骤S09。图6为本发明又一实施例的信息撷取装置的语音控制方法的流程图。在一实施例中,请一并参阅图1及图6,下面分情况分别进行举例说明。
第一种情况,录制开始阶段环境声音包括使用者所说语音但未包含枪声:当使用者对麦克风110说「Camera start recording」且环境声音并未包括枪声时,麦克风110会接收到一声音信号(步骤S01)并将接收到的声音信号提供给语音辨识单元120。语音辨识单元120比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征,以确认声音信号是否与任一枪声资料相符(步骤S03a)。并且,语音辨识单元120对声音信号进行语音辨识以得到实际语音内容为「Camera start recording」(步骤S03b)。控制单元140根据语音辨识结果所得到的「Camera start recording」的实际语音内容依序确认查找表中记录的指令语音内容(步骤S05),以找出与实际语音内容对应的指令语音内容。当找到对应的此指令语音内容时,控制单元140也可从查找表得到对应此指令语音内容的「启动录制指令」的操作指令,控制单元140响应启动录制指令(也即响应操作指令)控制影音录制单元130进行影音录制以撷取环境资料(也即进行对应操作指令的动作)(步骤S07)。于此,即便于步骤S03a中控制单元140比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征后确认于声音信号未与任一枪声资料相符,控制单元140仍响应启动录制指令(也即响应操作指令)控制影音录制单元130进行影音录制以撷取环境资料(也即进行对应操作指令的动作)(步骤S07)。于另一实施例中,当对麦克风110接受到枪声及使用者说「Camera start recording」时,表示控制单元140接收到对应实际语音内容的启动录制指令以及对应枪声的启动录制指令。于此,控制单元140响应先接收到的启动录制指令,并舍弃后接收到的启动录制指令(也即不再执行后接收到的启动录制指令)。
第二种情况,环境声音包括枪声但未包含使用者所说声音:
当麦克风110接收环境声音且环境声音包括枪声且未包括使用者所说声音,麦克风110会接收到一声音信号(步骤S01)并将接收到的声音信号提供给语音辨识单元120。语音辨识单元120比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征(步骤S03a),以确认于声音信号是否与任一枪声资料相符。并且,语音辨识单元120会对声音信号进行语音辨识(步骤S03b)。于步骤S03a中,控制单元140比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征后确认于声音信号与任一枪声资料相符,控制单元140输出启动录制指令,以致使信息撷取装置100的控制单元140响应启动录制指令控制影音录制单元130进行影音录制以撷取一环境资料(步骤S09)。
第三种情况,录制结束阶段环境声音包括使用者所说声音但未包含枪声:
当麦克风110再次接收环境声音且环境声音包括使用者所说的「Camerarecording end」且未包括枪声时,麦克风110会接收到一声音信号(步骤S01)并将接收到的声音信号提供给语音辨识单元120。语音辨识单元120比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征(步骤S03a),以确认声音信号是否与任一枪声资料相符。并且,语音辨识单元120对声音信号进行语音辨识(步骤S03b)以得到实际语音内容为「Camera recording end」。控制单元140根据语音辨识结果所得到的「Camerarecording end」的实际语音内容依序确认查找表中记录的指令语音内容(步骤S05),以找出与实际语音内容对应的指令语音内容。当找到对应的此指令语音内容时,控制单元140也可从查找表得到对应此指令语音内容的「结束录制指令」的操作指令,控制单元140响应结束录制指令(也即响应操作指令)控制影音录制单元130结束影音录制以生成环境资料(也即进行对应操作指令的动作)(步骤S07)。
第四种情况,环境声音同时包括枪声和使用者所说声音:
当麦克风110接收环境声音且环境声音包括枪声以及使用者所说的「事件1」时,麦克风110会接收到一声音信号(步骤S01)并将接收到的声音信号提供给语音辨识单元120。语音辨识单元120比对声音信号的特征与声音模型资料库的资料的至少一或是多个枪声资料的信号特征,以确认于声音信号是否与任一枪声资料相符(步骤S03a)。并且,语音辨识单元120会对声音信号进行语音辨识,以得到实际语音内容为「事件1」(步骤S03b)。控制单元140根据语音辨识结果所得到的「事件1」的实际语音内容依序确认查找表中记录的指令语音内容(步骤S05),以找出与实际语音内容对应的指令语音内容。当找到对应的此指令语音内容时,控制单元140也可从查找表得到对应此指令语音内容的「分类指令」的操作指令,控制单元140响应「分类指令」的操作指令(也即响应操作指令)将此影音档案命名为「事件1」(步骤S07)。当声音信号与任一枪声资料相符时,控制单元140输出启动录制指令,以致使信息撷取装置100的控制单元140响应启动录制指令控制影音录制单元130进行影音录制以撷取一环境资料(步骤S09)。于其他实施例中,控制单元140可以在枪声启动影音录制或是语音启动影音录制(使用者对麦克风110说「Camera start recording」)的步骤之前或之后而响应「分类指令」的操作指令。
在一些实施例中,影音录制单元130可由摄像镜头及影像处理单元实现。在一实施例中,影像处理单元可为一影像信号处理晶片(Image Signal Processor,ISP)。另一实施例中,影像处理单元与控制模块130以同一晶片实现,但在此并不对其限制。
在一些实施例中,控制单元140可由一个或多个处理元件实现。各处理元件可以是微处理器、微控制器、数位信号处理器、中央处理器、可编程逻辑控制器、状态器或任何基于操作指令操作信号的类比和/或数位装置,但在此并不对其限制。
在一些实施例中,储存模块150可由一个或多个储存元件所实现。于此,储存元件可以是例如记忆体或暂存器等,但在此并不对其限制。
在一些实施例中,信息撷取装置100可为一随身摄像装置,例如:安装在帽体或衣服上的密录器、穿戴式摄影机、可携式随身搜证录影机、微型摄影机等。在一些实施例中,信息撷取装置100可为一固定式摄像装置,例如:安装在车辆上的行车记录器。
综上所述,本发明实施例的信息撷取装置及其语音控制方法,能通过枪声启动影音录制并且语音辨识声音信号以得到实际语音内容,进而取得对应的操作指令,并且因应操作指令来执行对应操作指令的动作。
虽然本发明的技术内容已经以较佳实施例揭露如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神所作些许的更动与润饰,皆应涵盖于本发明的范畴内,因此本发明的保护范围当视权利要求范围为准。

Claims (11)

1.一种信息撷取装置的语音控制方法,其特征在于,包括:
接收一声音信号;
比对该声音信号与至少一枪声资料;
进行该声音信号的语音辨识以得到一实际语音内容;
根据该实际语音内容确认至少一指令语音内容;
当该实际语音内容对应于任一该指令语音内容时,取得对应该指令语音内容的一操作指令,以致使该信息撷取装置响应该操作指令进行对应该操作指令的动作;
当该声音信号与任一该枪声资料相符时,输出一启动录制指令,以致使该信息撷取装置响应该启动录制指令进行影音录制。
2.如权利要求1所述的信息撷取装置的语音控制方法,其特征在于,还包括:
根据一声纹资料确认该声音信号;
当该声音信号与该声纹资料相符时,进行该声音信号的该语音辨识的步骤;
当该声音信号与该声纹资料不相符且该声音信号与任一该枪声资料不相符时,不进行该声音信号的该语音辨识的步骤且舍弃该声音信号。
3.如权利要求1所述的信息撷取装置的语音控制方法,其特征在于,该操作指令包括该启动录制指令。
4.如权利要求1所述的信息撷取装置的语音控制方法,其特征在于,该操作指令包括一结束录制指令。
5.如权利要求1所述的信息撷取装置的语音控制方法,其特征在于,该操作指令包括一分类指令。
6.一种信息撷取装置,其特征在于,包括:
一麦克风,接收一声音信号;
一语音辨识单元,耦接该麦克风,根据至少一枪声资料确认该声音信号,进行该声音信号的语音辨识以得到一实际语音内容;
一影音录制单元,用以进行影音录制以撷取一环境资料;
一控制单元,耦接该语音辨识单元以及该影音录制单元,当该实际语音内容对应于一指令语音内容时,取得对应该指令语音内容的一操作指令并响应该操作指令进行对应该操作指令的动作,以及当该声音信号与任一该枪声资料相符时,输出一启动录制指令并响应该启动录制指令启动该影音录制单元。
7.如权利要求6所述的信息撷取装置,其特征在于,该语音辨识单元还根据一声纹资料确认该声音信号,其中,当该声音信号与该声纹资料相符时,该语音辨识单元进行该声音信号的该语音辨识的步骤,以及当该声音信号与该声纹资料不相符时,该语音辨识单元不进行该声音信号的该语音辨识。
8.如权利要求7所述的信息撷取装置,其特征在于,于该声音信号与该声调资料不相符且该声音信号与任一该枪声资料不相符时,该语音辨识单元舍弃该声音信号。
9.如权利要求6所述的信息撷取装置,其特征在于,该操作指令包括该启动录制指令。
10.如权利要求6所述的信息撷取装置,其特征在于,该操作指令包括一结束录制指令。
11.如权利要求6所述的信息撷取装置,其特征在于,该操作指令包括一分类指令。
CN202110523043.8A 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法 Pending CN113096662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110523043.8A CN113096662A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810766554.0A CN110718214A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法
CN202110523043.8A CN113096662A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201810766554.0A Division CN110718214A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法

Publications (1)

Publication Number Publication Date
CN113096662A true CN113096662A (zh) 2021-07-09

Family

ID=69208415

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110523043.8A Pending CN113096662A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法
CN201810766554.0A Withdrawn CN110718214A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201810766554.0A Withdrawn CN110718214A (zh) 2018-07-13 2018-07-13 信息撷取装置及其语音控制方法

Country Status (1)

Country Link
CN (2) CN113096662A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763521A (zh) * 2013-12-31 2014-04-30 南宁市公安局 一种车载视频监控方法
US20170019580A1 (en) * 2015-07-16 2017-01-19 Gopro, Inc. Camera Peripheral Device for Supplemental Audio Capture and Remote Control of Camera
CN108182944A (zh) * 2018-01-18 2018-06-19 吴波 控制智能终端的方法、装置及智能终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763521A (zh) * 2013-12-31 2014-04-30 南宁市公安局 一种车载视频监控方法
US20170019580A1 (en) * 2015-07-16 2017-01-19 Gopro, Inc. Camera Peripheral Device for Supplemental Audio Capture and Remote Control of Camera
CN108182944A (zh) * 2018-01-18 2018-06-19 吴波 控制智能终端的方法、装置及智能终端

Also Published As

Publication number Publication date
CN110718214A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
US20240038218A1 (en) Speech model personalization via ambient context harvesting
US8564681B2 (en) Method, apparatus, and computer-readable storage medium for capturing an image in response to a sound
US20230396868A1 (en) Speaker-dependent voice-activated camera system
CN112037791B (zh) 会议纪要转录方法、设备和存储介质
US20070200912A1 (en) Method and device for enhancing accuracy of voice control with image characteristic
KR20070118038A (ko) 정보처리 장치 및 정보처리 방법과 컴퓨터·프로그램
WO2005094437A2 (en) System and method for automatically cataloguing data by utilizing speech recognition procedures
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
CN107945806B (zh) 基于声音特征的用户识别方法及装置
DE112018007847B4 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
CN110826637A (zh) 情绪识别方法、系统及计算机可读存储介质
JP2010109898A (ja) 撮影制御装置、撮影制御方法及びプログラム
CN107277368A (zh) 一种用于智能设备的拍摄方法及拍摄装置
US20170270923A1 (en) Voice processing device and voice processing method
CN111739506A (zh) 一种应答方法、终端及存储介质
KR20190119521A (ko) 전자 장치 및 그 동작 방법
EP3506258B1 (en) Information capturing device and voice control method
JP3838159B2 (ja) 音声認識対話装置およびプログラム
JP5320913B2 (ja) 撮像装置およびキーワード作成プログラム
CN113126951A (zh) 音频播放方法、装置、计算机可读存储介质及电子设备
CN113096662A (zh) 信息撷取装置及其语音控制方法
US20210166685A1 (en) Speech processing apparatus and speech processing method
CN111429882A (zh) 播放语音的方法、装置及电子设备
CN113096661A (zh) 信息撷取装置及其语音控制方法
JP5495612B2 (ja) カメラ制御装置及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination