CN109192202B - 语音安全识别方法、装置、计算机设备及存储介质 - Google Patents
语音安全识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109192202B CN109192202B CN201811106066.3A CN201811106066A CN109192202B CN 109192202 B CN109192202 B CN 109192202B CN 201811106066 A CN201811106066 A CN 201811106066A CN 109192202 B CN109192202 B CN 109192202B
- Authority
- CN
- China
- Prior art keywords
- text information
- voice
- text
- rule
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 141
- 238000000605 extraction Methods 0.000 claims abstract description 82
- 238000004458 analytical method Methods 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims description 40
- 238000012549 training Methods 0.000 claims description 40
- 230000011218 segmentation Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000013507 mapping Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/02—Alarms for ensuring the safety of persons
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- Alarm Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了语音安全识别方法、装置、计算机设备及存储介质。该方法包括:根据预设的语音识别规则对用户所输入的语音信息进行转换以得到文字信息;根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;若文字信息不包含预设关键字,根据特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以判断该文字信息是否安全。本发明基于语义解析技术,通过语音信息对用户的安全状况进行精确识别,大幅提高了用户的安全性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种语音安全识别方法、装置、计算机设备及存储介质。
背景技术
在某些情况下,用户无法输入文字信息或拨打电话报警,需通过对用户所输入的较隐晦的语音信息进行识别,并在识别出用户遇到危险时进行报警。例如,互联网约车的驾驶员或乘客会因偶发事件遇到危险,在汽车驾驶员或者乘客遇到危险的情况下及时通过语音信息进行报警十分重要。然而现有的技术方法无法通过较为隐晦的语音信息对当前用户的安全状况进行准确识别,由于现有技术方法存在的缺陷导致报警信息发送不及时对驾驶员或乘客造成伤害。因而现有技术方法中存在无法准确、高效地通过语音信息对用户的安全状况进行识别的问题。
发明内容
本发明实施例提供了一种语音安全识别方法、装置、计算机设备及存储介质,旨在解决现有技术中存在无法准确、高效地通过语音信息对用户的安全状况进行识别的问题。
第一方面,本发明实施例提供了一种语音安全识别方法,其包括:
若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息;
根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;
若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;
根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果。
第二方面,本发明实施例提供了一种语音安全识别装置,其包括:
语音信息转换单元,用于若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息;
关键字匹配单元,用于根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;
特征向量提取单元,用于若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;
风险判断单元,用于根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的语音安全识别方法。
第四方面,本发明实施例还提供了一种存储介质,其中所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的语音安全识别方法。
本发明实施例提供了一种语音安全识别方法、装置、计算机设备及存储介质。通过对用户所输入的语音信息进行转换得到文字信息,对文字信息的特征向量平均值进行提取并对文字信息是否安全进行判断,若判断文字信息不安全生成报警信息并发送,能够通过语音信息对用户的安全状况进行精确识别,大幅提高了用户的安全性。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音安全识别方法的流程示意图;
图2为本发明实施例提供的语音安全识别方法的子流程示意图;
图3为本发明实施例提供的语音安全识别方法的另一子流程示意图;
图4为本发明实施例提供的语音安全识别方法的另一子流程示意图;
图5为本发明实施例提供的语音安全识别方法的另一子流程示意图;
图6为本发明实施例提供的语音安全识别装置的示意性框图;
图7为本发明实施例提供的语音安全识别装置的子单元示意性框图;
图8为本发明实施例提供的语音安全识别装置的另一子单元示意性框图;
图9为本发明实施例提供的语音安全识别装置的另一子单元示意性框图;
图10为本发明实施例提供的语音安全识别装置的另一子单元示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的语音安全识别方法的流程示意图。该语音安全识别方法应用于用户终端中,该方法通过安装于用户终端中的应用软件进行执行,用户终端即是用于执行语音安全识别方法以对所接收的语音信息进行安全识别的终端设备,其中,用户终端是具有接入互联网功能的终端设备,例如手机、平板电脑、笔记本电脑、车载电话等。
如图1所示,该方法包括步骤S101~S104。
S101、若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息。
若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行识别,以将语音信息转换为文字信息。用户终端通过声音传感器实时采集用户输入用户终端的语音信息,以对用户所输入的语音信息进行识别。其中,用户终端为具有语音采集功能的终端设备,例如手机、平板电脑、车载电话等,具体的,语音安全识别方法可通过安装于用户终端中独立的一款应用软件进行执行,或作为安装于用户终端中其他应用软件(如即时通讯软件、网约车软件)中所附加的一个软件功能模块进行执行。声音传感器为用户终端中所包含的用于对语音信息进行采集的装置,例如麦克风。语音识别规则即是用于对用户所输入的语音信息进行识别的规则信息。语音识别规则包括声学模型、语音特征词典及语义解析模型。
在一实施例中,如图2所示,步骤S101包括子步骤S1011、S1012和S1013。
S1011、根据语音识别规则中的声学模型对所述语音信息进行切分以得到语音信息中所包含的多个音素。
根据语音识别规则中的声学模型对所述语音信息进行切分,即可得到该语音信息中所包含的多个音素。语音信息也即是用户通过发声所说的一句话,具体的,用户终端所接收到的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将语音信息与声学模型中所有的音素进行匹配,即可对语音信息中单个字符的音素进行切分,通过切分最终得到该语音信息中所包含的多个音素。
S1012、根据语音识别规则中的语音特征词典对所得到的音素进行匹配,以将所有音素转换为拼音信息。
根据语音识别规则中的语音特征词典对所得到的音素进行匹配,即可将所有音素转换为拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,以实现将语音信息中所包含的所有音素转换为拼音信息。
S1013、根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析,以实现将拼音信息转换为文字信息。语义解析模型中包含拼音信息与文字信息之间所对应的映射关系,通过语义解析模型中所包含的映射关系即可对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
例如,拼音“qi、che”在语义解析模型中所对应的文字信息为“汽车”。
S102、根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果。
根据预设的关键字信息对所得到的文字信息进行匹配,得到的匹配结果为文字信息是否包含预设关键字。其中,预设关键字包括多个用于对用户所输入的语音信息进行风险识别的关键字,通过预设关键字对文字信息进行匹配,即可对与文字信息相对应的语音信息进行风险识别。
用户在遇到危险时,可直接说出具有直接威胁性的词语,通过与预设关键字进行匹配以进行报警。例如,预设关键字为“抢劫、救命、报警”,某一段文字信息为“救命啊,我要报警”,该文字信息中包含“救命”、“报警”,则匹配结果为该文字信息中包含预设关键字。
步骤S102之后还包括:若匹配结果为文字信息包含预设关键字,生成报警信息并进行发送。
若匹配结果为文字信息包含预设关键字,则用户终端立即采集当前定位信息,根据当前定位信息生成报警信息,并将所生成的报警信息发送至预先与用户终端建立网络连接的网络报警系统,网络报警系统的管理员通过接收报警信息即可获取用户当前位置并及时出警。
S103、若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值。
根据预设的特征提取规则对文字信息进行特征提取,以得到文字信息的特征向量平均值。其中,预设的特征提取规则即是用于对文字信息的特征向量平均值进行提取的规则信息,文字信息的特征向量平均值即是用于对文字信息中所包含的特征进行量化的向量值。其中,预设的特征提取规则包括分词规则、向量提取规则及平均值计算公式。
在大部分情况下,为了拖延时间,用户无法说出具有直接威胁性的词语,此时用户可说出具有间接性威胁的词语,通过预设的特征提取规则对用户所输入的具有间接性威胁的词语进行分析并报警。
在一实施例中,如图3所示,步骤S103包括子步骤S1031、S1032和S1033。
S1031、根据特征提取规则中的分词规则对文字信息进行分词处理以得到包含单个字符的文本词汇表。
根据特征提取规则中的分词规则对文字信息进行分词处理,以得到包含单个字符的文本词汇表。分词规则即是用于将文字信息进行分词以得到单个字符的规则信息,文本词汇表即是对文字信息进行分词处理后所得到的包含该文字信息中所有字符的数据表。
例如,某一段文字信息为“这里有危险”,则通过分词规则对该文字信息进行分词处理所得到的文本词汇表为X={这、里、有、危、险}。
S1032、根据特征提取规则中的向量提取规则对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量。
根据特征提取规则中的向量提取规则,对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量。向量提取规则即是用于对文文本词汇表中每一个字符的特征向量进行提取的规则信息,特征向量即是文本词汇表中中单个字符所包含的多维向量信息。
具体的,向量提取规则中包括字符特征提取规则、词性特征提取规则。字符特征提取规则中包括多个词汇表,每一个词汇表中包含多个预设的字符;词性特征提取规则中包含多个词性特征表,每一个词性特征表中包含多个预设的词性特征。
例如,所得到的某一个文本词汇表为X={这、里、有、危、险},字符特征提取规则中的某一个词汇表为W1={我、这、里、有、好、危、险、胁、迫},词性特征提取规则中的某一个词性特征表为D1={动词、名词、形容词、谓词}。则将该文本词汇表中每一个字符与上述词汇表和词性特征表进行匹配后,所得到的字符“危”的特征向量中包含两个维度W1(危)={0、0、0、0、0、1、0、0、0},D1(危)={0、1、1、0};字符“险”的特征向量中包含两个维度W1(险)={0、0、0、0、0、0、1、0、0},D1(险)={0、1、0、0}。
S1033、根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值。
根据特征提取规则中的平均值计算公司对所述文本词汇表中所有字符的特征向量进行计算,即可得到该文本词汇表相对应的文字信息的特征向量平均值。其中,平均值计算公式即是用于对文本词汇表中所有字符的特征向量进行计算的公式,文字信息的特征向量平均值即是用于对文字信息中所包含的特征进行量化的向量值,通过平均值计算公式即可计算得到与该文本词汇表相对应的文字信息的特征向量平均值。
例如,字符“这”的特征向量中包含两个维度W1(这)={0、1、0、0、0、0、0、0、0},D1(这)={0、0、0、1};字符“里”的特征向量中包含两个维度W1(里)={0、0、1、0、0、0、0、0、0},D1(里)={1、1、0、0};字符“有”的特征向量中包含两个维度W1(有)={0、0、0、1、0、0、0、0、0},D1(有)={1、0、1、1};字符“危”的特征向量中包含两个维度W1(危)={0、0、0、0、0、1、0、0、0},D1(危)={0、1、1、0};字符“险”的特征向量中包含两个维度W1(险)={0、0、0、0、0、0、1、0、0},D1(险)={0、1、0、0};则该文本词汇表相对应的文字信息的特征向量平均值中包含两个维度W1Z={0、0.2、0.2、0.2、0、0.2、0.2、0、0},D1Z={0.4、0.6、0.4、0.4}。
S104、根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果。
根据预设的风险判断规则对所得到的文字信息的特征向量平均值判断,即可得到该文字信息是否安全的判断结果。其中风险判断规则即是用于对文字信息的特征向量平均值进行风险判断的规则信息,风险判断规则中包括风险评分模型以及风险阈值。
在一实施例中,如图4所示,步骤S104包括子步骤S1041和S1042。
S1041、根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值。
根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值。其中,风险评分模型即是用于对所得到的特征向量平均值进行评分的模型,文字信息的评分值即是用于反映文字信息中风险高低的评分,评分值的区间为0≤F≤1,其中,F为文字信息的评分值。若评分值中分数较高,则文字信息的风险较高;若评分值中分数较低,则文字信息的风险较低。
分析评分模型中包含输入节点和输出节点以及N个中间节点,输入节点与N个中间节点相连接,输出节点与N个中间节点相连接,输入节点与N个中间节点之间包含N个输入计算公式,N个中间节点与输出节点之间包含一个输出计算公式。其中,输入节点为文字信息的特征向量平均值,可分别通过N个输入计算公式计算得到与输入节点相连接的N个中间节点的值,第一个输入计算公式可表示为C1=W1×X1+B1,其中,C1为第一个中间节点的计算值,X1为文字信息的特征向量平均值,W1和B1为第一中间节点与输入节点之间的第一输入计算公式中所预设的参数值,通过N个输入计算公式即可计算得到与输入节点相连接的N个中间节点的值;通过输出计算公式计算得到与N个中间节点相连接的输出节点的值,其中输出计算公式为F=A1×C1+A2×C2+……AN×CN+D1,其中,F为输出节点的值,C1为第一个中间节点的计算值,A1为输出计算公式中与第一中间节点对应的预设参数值,D1为输出计算公式中所预设的参数值。
S1042、根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,以得到该文字信息是否安全的判断结果。
根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,若文字信息的评分值大于风险阈值,则得到该文字信息不安全的判断结果;若文字信息的评分值不大于风险阈值,则得到该文字信息安全的判断结果。
例如,预设的风险阈值为0.5,某一文字信息的评分值为0.7,则得到的判断结果为该文字信息不安全。
在一实施例中,如图5所示,步骤S1041之前还包括步骤S1040。
S1040、通过预设的训练参数对风险评分模型进行训练以得到训练后的风险评分模型。
通过预设的训练参数对风险评分模型进行训练,以得到训练后的风险评分模型。在进行训练之前,风险评分模型中所有公式的参数均为随机值。其中,预设的训练参数中包含调整阈值、参数调整规则、多个训练文字信息以及训练文字信息对应的风险评分。
具体的训练过程为,根据预设的特征提取规则对训练文字信息提取以得到训练文字信息的特征向量平均值,根据风险评分模型对所得到的训练文字信息的特征向量平均值进行评分以得到该训练文字信息的评分值,对该训练文字的评分值与风险评分的差值是否大于调整阈值进行判断,若该训练文字的评分值与风险评分的差值大于调整阈值,则按照参数调整规则对风险评分模型中所有公式的参数进行调整;若该训练文字的评分值与风险评分的差值不大于调整阈值,则不对风险评分模型中公式的参数进行调整。
例如,预设的调整阈值为0.05,参数调整规则为放大调整、调整幅度为2.5%,若训练文字的评分值与风险评分的差值大于调整阈值0.05,则根据参数调整规则对风险评分模型中所有公式的参数值进行放大调整,放大调整的幅度为2.5%,也即是将公式的参数值×1.025以得到调整后新的参数值。
若文字信息安全不安全,则用户终端立即采集当前定位信息,根据当前定位信息生成报警信息,并将所生成的报警信息发送至预先与用户终端建立网络连接的网络报警系统,网络报警系统的管理员通过接收报警信息即可获取用户当前位置并及时出警。
通过对用户所输入的语音信息进行转换得到文字信息,对文字信息的特征向量平均值进行提取并对文字信息是否安全进行判断,若判断文字信息不安全则生成报警信息并发送,能够通过语音信息对用户的安全状况进行精确识别,大幅提高了用户的安全性。
本发明实施例还提供一种语音安全识别装置,该语音安全识别装置用于执行前述语音安全识别方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的语音安全识别装置的示意性框图。该语音安全识别装置100可以配置于用户终端中。
如图6所示,语音安全识别装置100包括语音信息转换单元101、关键字匹配单元102、特征向量提取单元103和风险判断单元104。
语音信息转换单元101,用于若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息。
若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行识别,以将语音信息转换为文字信息。用户终端通过声音传感器实时采集用户输入用户终端的语音信息,以对用户所输入的语音信息进行识别。其中,用户终端为具有语音采集功能的终端设备,例如手机、平板电脑、车载电话等,具体的,语音安全识别方法可通过安装于用户终端中独立的一款应用软件进行执行,或作为安装于用户终端中其他应用软件(如即时通讯软件、网约车软件)中所附加的一个软件功能模块进行执行。声音传感器为用户终端中所包含的用于对语音信息进行采集的装置,例如麦克风。语音识别规则即是用于对用户所输入的语音信息进行识别的规则信息。语音识别规则包括声学模型、语音特征词典及语义解析模型。
其他发明实施例中,如图7所示,所述语音信息转换单元101包括子单元:音素获取单元1011、音素匹配单元1012、语义解析单元1013。
音素获取单元1011,用于根据语音识别规则中的声学模型对所述语音信息进行切分以得到语音信息中所包含的多个音素。
根据语音识别规则中的声学模型对所述语音信息进行切分,即可得到该语音信息中所包含的多个音素。语音信息也即是用户通过发声所说的一句话,具体的,用户终端所接收到的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将语音信息与声学模型中所有的音素进行匹配,即可对语音信息中单个字符的音素进行切分,通过切分最终得到该语音信息中所包含的多个音素。
音素匹配单元1012,用于根据语音识别规则中的语音特征词典对所得到的音素进行匹配,以将所有音素转换为拼音信息。
根据语音识别规则中的语音特征词典对所得到的音素进行匹配,即可将所有音素转换为拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,以实现将语音信息中所包含的所有音素转换为拼音信息。
语义解析单元1013,用于根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析,以实现将拼音信息转换为文字信息。语义解析模型中包含拼音信息与文字信息之间所对应的映射关系,通过语义解析模型中所包含的映射关系即可对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
关键字匹配单元102,用于根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果。
根据预设的关键字信息对所得到的文字信息进行匹配,得到的匹配结果为文字信息是否包含预设关键字。其中,预设关键字包括多个用于对用户所输入的语音信息进行风险识别的关键字,通过预设关键字对文字信息进行匹配,即可对与文字信息相对应的语音信息进行风险识别。
语音安全识别装置100还包括子单元:报警信息发送单元。
报警信息发送单元,用于若匹配结果为文字信息包含预设关键字,生成报警信息并进行发送。
若匹配结果为文字信息包含预设关键字,则用户终端立即采集当前定位信息,根据当前定位信息生成报警信息,并将所生成的报警信息发送至预先与用户终端建立网络连接的网络报警系统,网络报警系统的管理员通过接收报警信息即可获取用户当前位置并及时出警。
特征向量提取单元103,用于若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值。
根据预设的特征提取规则对文字信息进行特征提取,以得到文字信息的特征向量平均值。其中,预设的特征提取规则即是用于对文字信息的特征向量平均值进行提取的规则信息,文字信息的特征向量平均值即是用于对文字信息中所包含的特征进行量化的向量值。其中,预设的特征提取规则包括分词规则、向量提取规则及平均值计算公式。
在大部分情况下,为了拖延时间,用户无法说出具有直接威胁性的词语,此时用户可说出具有间接性威胁的词语,通过预设的特征提取规则对用户所输入的具有间接性威胁的词语进行分析并报警。
其他发明实施例中,如图8所示,所述特征向量提取单元103包括子单元:分词处理单元1031、字符特征向量获取单元1032和特征向量平均值计算单元1033。
分词处理单元1031,用于根据特征提取规则中的分词规则对文字信息进行分词处理以得到包含单个字符的文本词汇表。
根据特征提取规则中的分词规则对文字信息进行分词处理,以得到包含单个字符的文本词汇表。分词规则即是用于将文字信息进行分词以得到单个字符的规则信息,文本词汇表即是对文字信息进行分词处理后所得到的包含该文字信息中所有字符的数据表。
字符特征向量获取单元1032,用于根据特征提取规则中的向量提取规则对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量。
根据特征提取规则中的向量提取规则,对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量。向量提取规则即是用于对文文本词汇表中每一个字符的特征向量进行提取的规则信息,特征向量即是文本词汇表中中单个字符所包含的多维向量信息。
具体的,向量提取规则中包括字符特征提取规则、词性特征提取规则。字符特征提取规则中包括多个词汇表,每一个词汇表中包含多个预设的字符;词性特征提取规则中包含多个词性特征表,每一个词性特征表中包含多个预设的词性特征。
特征向量平均值计算单元1033,用于根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值。
根据特征提取规则中的平均值计算公司对所述文本词汇表中所有字符的特征向量进行计算,即可得到该文本词汇表相对应的文字信息的特征向量平均值。其中,平均值计算公式即是用于对文本词汇表中所有字符的特征向量进行计算的公式,文字信息的特征向量平均值即是用于对文字信息中所包含的特征进行量化的向量值,通过平均值计算公式即可计算得到与该文本词汇表相对应的文字信息的特征向量平均值。
风险判断单元104,用于根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果。
根据预设的风险判断规则对所得到的文字信息的特征向量平均值判断,即可得到该文字信息是否安全的判断结果。其中风险判断规则即是用于对文字信息的特征向量平均值进行风险判断的规则信息,风险判断规则中包括风险评分模型以及风险阈值。
其他发明实施例中,如图9所示,所述风险判断单元104包括子单元:评分单元1041和安全风险判断单元1042。
评分单元1041,用于根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值。
根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值。其中,风险评分模型即是用于对所得到的特征向量平均值进行评分的模型,文字信息的评分值即是用于反映文字信息中风险高低的评分,评分值的区间为0≤F≤1,其中,F为文字信息的评分值。若评分值中分数较高,则文字信息的风险较高;若评分值中分数较低,则文字信息的风险较低。
分析评分模型中包含输入节点和输出节点以及N个中间节点,输入节点与N个中间节点相连接,输出节点与N个中间节点相连接,输入节点与N个中间节点之间包含N个输入计算公式,N个中间节点与输出节点之间包含一个输出计算公式。其中,输入节点为文字信息的特征向量平均值,可分别通过N个输入计算公式计算得到与输入节点相连接的N个中间节点的值,第一个输入计算公式可表示为C1=W1×X1+B1,其中,C1为第一个中间节点的计算值,X1为文字信息的特征向量平均值,W1和B1为第一中间节点与输入节点之间的第一输入计算公式中所预设的参数值,通过N个输入计算公式即可计算得到与输入节点相连接的N个中间节点的值;通过输出计算公式计算得到与N个中间节点相连接的输出节点的值,其中输出计算公式为F=A1×C1+A2×C2+……AN×CN+D1,其中,F为输出节点的值,C1为第一个中间节点的计算值,A1为输出计算公式中与第一中间节点对应的预设参数值,D1为输出计算公式中所预设的参数值。
安全风险判断单元1042,用于根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,以得到该文字信息是否安全的判断结果。
根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,若文字信息的评分值大于风险阈值,则得到该文字信息不安全的判断结果;若文字信息的评分值不大于风险阈值,则得到该文字信息安全的判断结果。
其他发明实施例中,如图10所示,所述风险判断单元104还包括子单元:模型训练单元1040。
模型训练单元1040,用于通过预设的训练参数对风险评分模型进行训练以得到训练后的风险评分模型。
通过预设的训练参数对风险评分模型进行训练,以得到训练后的风险评分模型。在进行训练之前,风险评分模型中所有公式的参数均为随机值。其中,预设的训练参数中包含调整阈值、参数调整规则、多个训练文字信息以及训练文字信息对应的风险评分。
具体的训练过程为,根据预设的特征提取规则对训练文字信息提取以得到训练文字信息的特征向量平均值,根据风险评分模型对所得到的训练文字信息的特征向量平均值进行评分以得到该训练文字信息的评分值,对该训练文字的评分值与风险评分的差值是否大于调整阈值进行判断,若该训练文字的评分值与风险评分的差值大于调整阈值,则按照参数调整规则对风险评分模型中所有公式的参数进行调整;若该训练文字的评分值与风险评分的差值不大于调整阈值,则不对风险评分模型中公式的参数进行调整。
若文字信息安全不安全,则用户终端立即采集当前定位信息,根据当前定位信息生成报警信息,并将所生成的报警信息发送至预先与用户终端建立网络连接的网络报警系统,网络报警系统的管理员通过接收报警信息即可获取用户当前位置并及时出警。
通过对用户所输入的语音信息进行转换得到文字信息,对文字信息的特征向量平均值进行提取并对文字信息是否安全进行判断,若判断文字信息不安全则生成报警信息并发送,能够通过语音信息对用户的安全状况进行精确识别,大幅提高了用户的安全性。
上述语音安全识别装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行语音安全识别方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行语音安全识别方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息;根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果。
在一实施例中,处理器502在执行若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息的步骤时,执行如下操作:根据语音识别规则中的声学模型对所述语音信息进行切分以得到语音信息中所包含的多个音素;根据语音识别规则中的语音特征词典对所得到的音素进行匹配,以将所有音素转换为拼音信息;根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
在一实施例中,处理器502在执行若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值的步骤时,执行如下操作:根据特征提取规则中的分词规则对文字信息进行分词处理以得到包含单个字符的文本词汇表;根据特征提取规则中的向量提取规则对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量;根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值。
在一实施例中,处理器502在执行根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果的步骤时,执行如下操作:根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值;根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,以得到该文字信息是否安全的判断结果。
在一实施例中,处理器502在执行根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值的步骤之前,还执行如下操作:通过预设的训练参数对风险评分模型进行训练以得到训练后的风险评分模型。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供存储介质。该存储介质可以为非易失性的计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息;根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果。
在一实施例中,所述若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息的步骤,包括:根据语音识别规则中的声学模型对所述语音信息进行切分以得到语音信息中所包含的多个音素;根据语音识别规则中的语音特征词典对所得到的音素进行匹配,以将所有音素转换为拼音信息;根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
在一实施例中,所述若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值的步骤,包括:根据特征提取规则中的分词规则对文字信息进行分词处理以得到包含单个字符的文本词汇表;根据特征提取规则中的向量提取规则对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量;根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值。
在一实施例中,所述根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果的步骤,包括:根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值;根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,以得到该文字信息是否安全的判断结果。
在一实施例中,所述根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值的步骤之前,还包括:通过预设的训练参数对风险评分模型进行训练以得到训练后的风险评分模型。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种语音安全识别方法,其特征在于,包括:
若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息;
根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;
若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;
根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果;
所述根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值,包括:
根据特征提取规则中的分词规则对文字信息进行分词处理以得到包含单个字符的文本词汇表;
根据特征提取规则中的向量提取规则对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量;
根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值;
所述根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值,包括:所述根据所述平均值计算公式对所述文本词汇表中所有字符在各维度的特征向量的多位数值分别按位进行平均计算,得到对应的特征向量平均值;其中,各所述维度的特征向量中均对应包含多位数值。
2.根据权利要求1所述的语音安全识别方法,其特征在于,所述根据预设的语音识别规则对所述语音信息进行转换以得到文字信息,包括:
根据语音识别规则中的声学模型对所述语音信息进行切分以得到语音信息中所包含的多个音素;
根据语音识别规则中的语音特征词典对所得到的音素进行匹配,以将所有音素转换为拼音信息;
根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
3.根据权利要求1所述的语音安全识别方法,其特征在于,所述根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果,包括:
根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值;
根据风险判断规则中的风险阈值对所得到的文字信息的评分值进行判断,以得到该文字信息是否安全的判断结果。
4.根据权利要求3所述的语音安全识别方法,其特征在于,所述根据风险判断规则中的风险评分模型对所得到的文字信息的特征向量平均值进行评分以得到该文字信息的评分值之前,还包括:
通过预设的训练参数对风险评分模型进行训练以得到训练后的风险评分模型。
5.一种语音安全识别装置,其特征在于,包括:
语音信息转换单元,用于若接收到用户所输入的语音信息,根据预设的语音识别规则对所述语音信息进行转换以得到文字信息;
关键字匹配单元,用于根据预设关键字对所得到的文字信息进行匹配以得到该文字信息中是否包含预设关键字的匹配结果;
特征向量提取单元,用于若匹配结果为文字信息不包含预设关键字,根据预设的特征提取规则对文字信息进行提取以得到文字信息的特征向量平均值;
风险判断单元,用于根据预设的风险判断规则对所得到的文字信息的特征向量平均值进行判断以得到该文字信息是否安全的判断结果;
所述特征向量提取单元,包括:
分词处理单元,用于根据特征提取规则中的分词规则对文字信息进行分词处理以得到包含单个字符的文本词汇表;
字符特征向量获取单元,用于根据特征提取规则中的向量提取规则对所述文本词汇表中所包含的单个字符进行特征提取以得到该文本词汇表中所有字符的特征向量;
特征向量平均值计算单元,用于根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值;
所述根据特征提取规则中的平均值计算公式对所述文本词汇表中所有字符的特征向量进行计算以得到与该文本词汇表相对应的文字信息的特征向量平均值,包括:所述根据所述平均值计算公式对所述文本词汇表中所有字符在各维度的特征向量的多位数值分别按位进行平均计算,得到对应的特征向量平均值;其中,各所述维度的特征向量中均对应包含多位数值。
6.根据权利要求5所述的语音安全识别装置,其特征在于,所述语音信息转换单元,包括:
音素获取单元,用于根据语音识别规则中的声学模型对所述语音信息进行切分以得到语音信息中所包含的多个音素;
音素匹配单元,用于根据语音识别规则中的语音特征词典对所得到的音素进行匹配,以将所有音素转换为拼音信息;
语义解析单元,用于根据语音识别规则中的语义解析模型对所得到的拼音信息进行语义解析以将拼音信息转换为文字信息。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的语音安全识别方法。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至4任一项所述的语音安全识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811106066.3A CN109192202B (zh) | 2018-09-21 | 2018-09-21 | 语音安全识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811106066.3A CN109192202B (zh) | 2018-09-21 | 2018-09-21 | 语音安全识别方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109192202A CN109192202A (zh) | 2019-01-11 |
CN109192202B true CN109192202B (zh) | 2023-05-16 |
Family
ID=64909185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811106066.3A Active CN109192202B (zh) | 2018-09-21 | 2018-09-21 | 语音安全识别方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109192202B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462739A (zh) * | 2019-01-21 | 2020-07-28 | 杭州海康威视数字技术股份有限公司 | 抢单方法及装置 |
CN109741761B (zh) * | 2019-03-13 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 声音处理方法和装置 |
CN110147981A (zh) * | 2019-04-12 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 基于文本分析的合同风险审核方法、装置及终端设备 |
CN111865752A (zh) * | 2019-04-23 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 文本处理装置、方法、电子设备及计算机可读存储介质 |
CN111192572A (zh) * | 2019-12-31 | 2020-05-22 | 斑马网络技术有限公司 | 语义识别的方法、装置及系统 |
CN111951560B (zh) * | 2020-08-30 | 2022-02-08 | 北京嘀嘀无限科技发展有限公司 | 服务异常检测方法、训练服务异常检测模型的方法和训练声音模型的方法 |
CN112183079A (zh) * | 2020-09-07 | 2021-01-05 | 绿瘦健康产业集团有限公司 | 一种语音监测方法、装置、介质及终端设备 |
CN112562652B (zh) * | 2020-12-02 | 2024-01-19 | 湖南翰坤实业有限公司 | 一种基于Untiy引擎的语音处理方法及系统 |
CN112669820B (zh) * | 2020-12-16 | 2023-08-04 | 平安科技(深圳)有限公司 | 基于语音识别的考试作弊识别方法、装置及计算机设备 |
CN113064963B (zh) * | 2021-03-19 | 2024-07-19 | 北京沃东天骏信息技术有限公司 | 一种内容风险控制方法和装置 |
CN113409776B (zh) * | 2021-06-30 | 2024-06-07 | 南京领行科技股份有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN113256936A (zh) * | 2021-07-07 | 2021-08-13 | 常州分音塔科技有限公司 | 基于声音事件的报警方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100592385C (zh) * | 2004-08-06 | 2010-02-24 | 摩托罗拉公司 | 用于对多语言的姓名进行语音识别的方法和系统 |
JP2008071211A (ja) * | 2006-09-15 | 2008-03-27 | Hitachi Ltd | 音声による危険感知通報装置 |
JP6183841B2 (ja) * | 2013-09-17 | 2017-08-23 | 株式会社日本総合研究所 | Ngワードの兆候を把握するコールセンタ用語管理システム及びその方法 |
CA2900168A1 (en) * | 2015-08-12 | 2017-02-12 | Sean Zhou | A method for autonomously personal safety monitoring in automobile vehicles |
US10276187B2 (en) * | 2016-10-19 | 2019-04-30 | Ford Global Technologies, Llc | Vehicle ambient audio classification via neural network machine learning |
CN107451119A (zh) * | 2017-07-26 | 2017-12-08 | 上海智臻智能网络科技股份有限公司 | 基于语音交互的语义识别方法及装置、存储介质、计算机设备 |
CN107645607A (zh) * | 2017-10-12 | 2018-01-30 | 上海展扬通信技术有限公司 | 一种用于声控报警的计算机可读存储介质及移动终端 |
-
2018
- 2018-09-21 CN CN201811106066.3A patent/CN109192202B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109192202A (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109192202B (zh) | 语音安全识别方法、装置、计算机设备及存储介质 | |
US11227611B2 (en) | Determining hotword suitability | |
US10635750B1 (en) | Classification of offensive words | |
CN107665705B (zh) | 语音关键词识别方法、装置、设备及计算机可读存储介质 | |
EP3407349B1 (en) | Multiple recognizer speech recognition | |
US8204748B2 (en) | System and method for providing a textual representation of an audio message to a mobile device | |
US9483582B2 (en) | Identification and verification of factual assertions in natural language | |
KR102081495B1 (ko) | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 | |
JP5496863B2 (ja) | 感情推定装置、その方法、プログラム及びその記録媒体 | |
US11024298B2 (en) | Methods and apparatus for speech recognition using a garbage model | |
CN110277088B (zh) | 智能语音识别方法、装置及计算机可读存储介质 | |
US11900927B2 (en) | Cybersecurity for sensitive-information utterances in interactive voice sessions using risk profiles | |
US11170763B2 (en) | Voice interaction system, its processing method, and program therefor | |
US10866948B2 (en) | Address book management apparatus using speech recognition, vehicle, system and method thereof | |
JP6233867B2 (ja) | 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム | |
KR102392992B1 (ko) | 음성 인식 기능을 활성화시키는 호출 명령어 설정에 관한 사용자 인터페이싱 장치 및 방법 | |
Kurian et al. | Perceptual Linear Predictive Cepstral Coefficient for Malayalam Isolated Digit Recognition | |
JP2003323191A (ja) | 音声対応インターネットホームページのアクセスシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |