CN108133706B - 语义识别方法及装置 - Google Patents
语义识别方法及装置 Download PDFInfo
- Publication number
- CN108133706B CN108133706B CN201711397017.5A CN201711397017A CN108133706B CN 108133706 B CN108133706 B CN 108133706B CN 201711397017 A CN201711397017 A CN 201711397017A CN 108133706 B CN108133706 B CN 108133706B
- Authority
- CN
- China
- Prior art keywords
- voice
- semantic
- preset
- word
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012544 monitoring process Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种语义识别方法及装置,包括获取待识别的语音信息;识别所述语音信息中的每个单字语音的时长;将每个所述单字语音的时长与第一预设值进行对比;根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;根据单字语音的时长识别每个单字语音,便于区分语音信息中的数字、字母以及符号,增加识别准确度。
Description
技术领域
本发明涉及语音识别技术领域,特别涉及一种语义识别方法及装置。
背景技术
语音识别的应用越来越广泛,不仅在语音输入法领域得到使用,在翻译机、人工智能等应用上也日益广泛。中文汉字不算声调有400多个发音,同音不同字的情况大量存在。通常文字的内容识别可根据词语组合或上下文的意思来推理联想以提高准确率,但当识别毫无规律的数字、符号、字母时误识别率较高,常常需要人工纠错,而在无显示屏和无键盘输入装置时比较难以进行纠错操作,将会降低语音识别的准确率和识别效率。
发明内容
本发明的主要目的为提供一种语义识别方法及装置,提升语义识别准确率。
本发明提出一种语义识别方法,包括以下步骤:
获取待识别的语音信息;
识别所述语音信息中的每个单字语音的时长;
将每个所述单字语音的时长与第一预设值进行对比;
根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。
进一步地,所述对比结果为所述单字语音的时长小于所述第一预设值,所述预设语义数据库则为汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;
所述对比结果为所述单字语音的时长不小于所述第一预设值,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
进一步地,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤之后包括:
监听所述单字语音对应的语义是否匹配成功;
若不成功,则在所述汉字语义库中匹配所述单字语音对应的语义。
进一步地,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤之后包括:
监测所述单字语音对应匹配的语义的数量;
若所述单字语音对应的语义为多个,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
若是,则分析所述词语的意思;
从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
进一步地,分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语的步骤包括:
将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;
分析预设的词语数据库中是否有与所述两个语义相同的预设词语;
若有,则将所述两个语义判定为词语。
本发明还提供了一种语义识别装置,包括:
获取单元,用于获取待识别的语音信息;
第一识别单元,用于识别所述语音信息中的每个单字语音的时长;
对比单元,用于将每个所述单字语音的时长与第一预设值进行对比;
第二识别单元,用于根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。
进一步地,所述对比结果为所述单字语音的时长小于所述第一预设值,所述预设语义数据库则为汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;
所述对比结果为所述单字语音的时长不小于所述第一预设值,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
进一步地,还包括:
第一监听单元,用于监听所述单字语音对应的语义是否匹配成功;
匹配单元,用于所述单字语音对应的语义匹配不成功时,则在所述汉字语义库中匹配所述单字语音对应的语义。
进一步地,还包括:
第一监测单元,用于监测所述单字语音对应匹配的语义的数量;
第一分析单元,用于所述单字语音对应的语义为多个时,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
第二分析单元,用于若组合后为词语,则分析所述词语的意思;
选择单元,用于从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
进一步地,所述第一分析单元包括:
组合子单元,用于将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;
分析子单元,用于分析预设的词语数据库中是否有与所述两个语义相同的预设词语;
判定子单元,用于预设的词语数据库中具有与所述两个语义相同的预设词语,则将所述两个语义判定为词语。
本发明中提供的语义识别方法及装置,具有以下有益效果:
本发明中提供的语义识别方法及装置,获取待识别的语音信息;识别所述语音信息中的每个单字语音的时长;将每个所述单字语音的时长与第一预设值进行对比;根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;根据单字语音的时长识别每个单字语音,便于区分语音信息中的数字、字母以及符号,增加识别准确度。
附图说明
图1是本发明一实施例中的语义识别方法步骤示意图;
图2是本发明另一实施例中的语义识别方法步骤示意图;
图3是本发明又一实施例中的语义识别方法步骤示意图;
图4是本发明一实施例中的语义识别装置结构示意图;
图5是本发明另一实施例中的语义识别装置结构框图;
图6是本发明又一实施例中的语义识别装置结构框图;
图7是本发明一实施例中的第一分析单元结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”“上述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件、单元、模块和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、单元、模块、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
参照图1,为本发明一实施例中语音识别方法的步骤示意图。
本发明一实施例中提出一种语音识别方法,包括以下步骤:
步骤S1,获取待识别的语音信息;
步骤S2,识别所述语音信息中的每个单字语音的时长;
步骤S3,将每个所述单字语音的时长与第一预设值进行对比;
步骤S4,根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。
在对语音信息进行语义识别时,通常会遇到混淆识别的情况,例如,语音“Yi”可能识别为汉字“一”,也可能识别为数字“1”,还可能识别为字母“E”,因此,发音相同时,容易识别不清楚,降低识别准确率。本实施例中提供一种语义识别方法,其针对于符合预设规则的语音信息进行识别。符合预设规则的语音信息指的是拉长尾音的方式来代表数字、字母、符号以便于区别于其它汉字。通常汉字语音的时长为0.2-0.4s(秒),将数字、字母、符号的发音延长至1s时,则可以将数字、字母、符号明显区别于汉字。数字、字母、符号中容易混淆的发音中,还可以采用在其前面或者后面添加汉字语音发音来进行区别,例如添加数字、大写、小写的汉字发音等。本实施例中的语义识别方法通过上述步骤可可准确识别出语音信息对应的语义。
具体地,获取到待识别的语音信息时,识别出其中每一个单字语音的时长(即发音时长),设定一个第一预设值(可以是0.4s),当发音时长比该第一预设值短时,则判断其为汉字的发音,当发音时长不小于该第一预设值时,则判断其可能为数字、字母或符号的发音。优选地,第一预设值还可以为1s。
将单字语音的时长与第一预设值对比之后,则可以根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。针对不同类型发音,采用不同的识别方式,便于准确识别出每一个单字语音,提升语义识别的准确率,以及提升识别速度。
在本实施例中,预设语义数据库可以是汉字语义库以及特征字符的语义库,对比结果为所述单字语音的时长小于所述第一预设值时,所述预设语义数据库则为所述汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;所述对比结果为所述单字语音的时长不小于所述第一预设值时,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
参照图2,在另一实施例中,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤S4之后包括:
步骤S5,监听所述单字语音对应的语义是否匹配成功;
步骤S6,若不成功,则在所述汉字语义库中匹配所述单字语音对应的语义。
若在特征字符的语义库中匹配不出所述单字语音,判断为误识别,进而在汉字语义库中识别该单字语音。
参照图3,在又一实施例中,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤S4之后包括:
步骤S5a,监测所述单字语音对应匹配的语义的数量;
步骤S6a,若所述单字语音对应的语义为多个,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
步骤S7,若是,则分析所述词语的意思;
步骤S8,从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
在本实施例中,若在特征字符的语义库中匹配所述单字语音对应的语义数量为多个,例如单字语音“Yi”,其可能是数字“1”,也可能是字母“E”或“e”,容易混淆,识别不清楚。因此,本实施例中,判断该单字语音音“Yi”之前或者紧跟在后的两个单字语音对应的两个语义在组合后是否为词语,若是,则分析所述词语的意思,关联性识别所述单字语音。例如,单字语音之前或之后的两个单字语音对应的语义为汉字“大写”,根据其意思则该单字语音“Yi”为对应的语义选择字母“E”;若两个单字语音对应的语义为汉字“小写”,根据其意思则该单字语音发音“Yi”对应的语义选择字母“e”。若该发音“Yi”之前或者紧跟在后的两个单字语音对应的语义不是“大写”或“小写,则判定该单字语音“Yi”对应的语义选择数字“1”。
具体地,上述分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语的步骤,具体包括:
将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;分析预设的词语数据库中是否有与所述两个语义相同的预设词语;若有,则将所述两个语义判定为词语;若没有,则判定两个单字语音对应的两个语义在组合后不是词语。
综上所述,为本发明实施例中提供的语义识别方法,获取待识别的语音信息;识别所述语音信息中的每个单字语音的时长;将每个所述单字语音的时长与第一预设值进行对比;根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;根据单字语音的时长识别每个单字语音,便于区分语音信息中的数字、字母以及符号,增加识别准确度;有效地解决无显示屏、无键盘设备的数字、字母、符号的语义输入识别问题,特别是设置各类密码,且语义识别方法简单、识别率高、识别速度快。
参照图4,本发明一实施例中还提供了一种语义识别装置,包括:
获取单元10,用于获取待识别的语音信息,所述语音信息为符合预设规则的语音信息;
第一识别单元20,用于识别所述语音信息中的每个单字语音的时长;
对比单元30,用于将每个所述单字语音的时长与第一预设值进行对比;
第二识别单元40,用于根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。
在对语音信息进行语义识别时,通常会遇到混淆识别的情况,例如,语音“Yi”可能识别为汉字“一”,也可能识别为数字“1”,还可能识别为字母“E”,因此,发音相同时,容易识别不清楚,降低识别准确率。本实施例中提供一种语义识别装置,其针对于符合预设规则的语音信息进行识别。符合预设规则的语音信息指的是拉长尾音的方式来代表数字、字母、符号以便于区别于其它汉字。通常汉字语音的时长为0.2-0.4s(秒),将数字、字母、符号的发音延长至1s时,则可以将数字、字母、符号明显区别于汉字。数字、字母、符号中容易混淆的发音中,还可以采用在其前面或者后面添加汉字语音发音来进行区别,例如添加数字、大写、小写的汉字发音等。本实施例中的语音识别装置通过上述模块可准确识别出语音信息对应的语义。
具体地,获取单元10获取到待识别的语音信息时,第一识别单元20识别出其中每一个单字语音的时长(即发音时长),设定一个第一预设值(可以是0.4s),对比单元30将每个所述单字语音的发音时长与第一预设值进行对比;当发音时长比该第一预设值短时,则判断其为汉字的发音,当发音时长不小于该第一预设值时,则判断其可能为数字、字母或符号的发音。优选地,第一预设值还可以为1s。
对比单元30将单字语音的时长与第一预设值对比之后,第二识别单元40则可以根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。针对不同类型发音,采用不同的识别方式,便于准确识别出每一个单字语音,提升语义识别的准确率,以及提升识别速度。
在一实施例中,设置有汉字语音库以及特征字符的语音库,第二识别单元40匹配单字语音的语义时,若对比单元30的对比结果为所述单字语音的时长小于所述第一预设值,所述预设语义数据库则为汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;
若对比单元30的对比结果为所述单字语音的时长不小于所述第一预设值,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
参照图5,在另一实施例中,所述语义识别装置还包括:
第一监听单元50,用于监听所述单字语音对应的语义是否匹配成功;
匹配单元60,用于所述单字语音对应的语义匹配不成功时,则在所述汉字语义库中匹配所述单字语音对应的语义。
若在特征字符的语义库中匹配不出所述单字语音,判断为误识别,进而在汉字语义库中识别该单字语音。
参照图6,在又一实施例中,所述语义识别装置还包括:
第一监测单元50a,用于监测所述单字语音对应匹配的语义的数量;
第一分析单元60a,用于所述单字语音对应的语义为多个时,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
第二分析单元70,用于若组合后为词语,则分析所述词语的意思;
选择单元80,用于从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
在本实施例中,若第一监测单元50a监听在特征字符的语义库中匹配所述单字语音对应的语义数量为多个,例如单字语音“Yi”,其可能是数字“1”,也可能是字母“E”或“e”,容易混淆,识别不清楚。因此,本实施例中,第一监测单元50a监听所述单字语音对应匹配的语义的数量,当所述单字语音对应的语义为多个时,第一分析单元60a则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;若是,第二分析单元70则分析所述词语的意思,选择单元80再从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。例如,第一分析单元60a分析两个单字语音对应的语义为汉字“大写”,第二分析单元70可分析其汉字“大写”的意思,选择单元80则根据“大写”的意思选择选择对应的语义字母“E”;若第一分析单元60a分析两个单字语音对应的语义为汉字“小写”,第二分析单元70可分析其汉字“小写”的意思,选择单元80则根据“小写”的意思选择选择对应的语义字母“e”。若第二分析单元70分析两个单字语音对应的语义意思不是汉字“大写”或“小写的语义,选择单元80则选择该单字语音“Yi”对应的语义选择数字“1”。
参照图7,所述第一分析单元60a包括:
组合子单元601,用于将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;
分析子单元602,用于分析预设的词语数据库中是否有与所述两个语义相同的预设词语;
判定子单元603,用于预设的词语数据库中具有与所述两个语义相同的预设词语,则将所述两个语义判定为词语。若没有,则判定两个单字语音对应的两个语义在组合后不是词语。
综上所述,为本发明实施例中提供的的语义识别方法及装置,获取待识别的语音信息;识别所述语音信息中的每个单字语音的时长;将每个所述单字语音的时长与第一预设值进行对比;根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;根据单字语音的时长识别每个单字语音,便于区分语音信息中的数字、字母以及符号,增加识别准确度。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种语义识别方法,其特征在于,包括以下步骤:
获取待识别的语音信息;
识别所述语音信息中的每个单字语音的时长;
将每个所述单字语音的时长与第一预设值进行对比;
根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;
所述对比结果为所述单字语音的时长小于所述第一预设值时,所述预设语义数据库则为汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;
所述对比结果为所述单字语音的时长不小于所述第一预设值时,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
2.根据权利要求1所述的语义识别方法,其特征在于,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤之后包括:
监听所述单字语音对应的语义是否匹配成功;
若不成功,则在所述汉字语义库中匹配所述单字语音对应的语义。
3.根据权利要求1所述的语义识别方法,其特征在于,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤之后包括:
监测所述单字语音对应匹配的语义的数量;
若所述单字语音对应的语义为多个,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
若是,则分析所述词语的意思;
从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
4.根据权利要求3所述的语义识别方法,其特征在于,分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语的步骤包括:
将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;
分析预设的词语数据库中是否有与所述两个语义相同的预设词语;
若有,则将所述两个语义判定为词语。
5.一种语义识别装置,其特征在于,包括:
获取单元,用于获取待识别的语音信息;
第一识别单元,用于识别所述语音信息中的每个单字语音的时长;
对比单元,用于将每个所述单字语音的时长与第一预设值进行对比;
第二识别单元,用于根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;
所述对比结果为所述单字语音的时长小于所述第一预设值,所述预设语义数据库则为汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;
所述对比结果为所述单字语音的时长不小于所述第一预设值,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
6.根据权利要求5所述的语义识别装置,其特征在于,还包括:
第一监听单元,用于监听所述单字语音对应的语义是否匹配成功;
匹配单元,用于所述单字语音对应的语义匹配不成功时,则在所述汉字语义库中匹配所述单字语音对应的语义。
7.根据权利要求5所述的语义识别装置,其特征在于,还包括:
第一监测单元,用于监测所述单字语音对应匹配的语义的数量;
第一分析单元,用于所述单字语音对应的语义为多个时,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
第二分析单元,用于若组合后为词语,则分析所述词语的意思;
选择单元,用于从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
8.根据权利要求7所述的语义识别装置,其特征在于,所述第一分析单元包括:
组合子单元,用于将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;
分析子单元,用于分析预设的词语数据库中是否有与所述两个语义相同的预设词语;
判定子单元,用于预设的词语数据库中具有与所述两个语义相同的预设词语,则将所述两个语义判定为词语。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711397017.5A CN108133706B (zh) | 2017-12-21 | 2017-12-21 | 语义识别方法及装置 |
PCT/CN2018/072008 WO2019119553A1 (zh) | 2017-12-21 | 2018-01-09 | 语义识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711397017.5A CN108133706B (zh) | 2017-12-21 | 2017-12-21 | 语义识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108133706A CN108133706A (zh) | 2018-06-08 |
CN108133706B true CN108133706B (zh) | 2020-10-27 |
Family
ID=62391316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711397017.5A Active CN108133706B (zh) | 2017-12-21 | 2017-12-21 | 语义识别方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108133706B (zh) |
WO (1) | WO2019119553A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133706B (zh) * | 2017-12-21 | 2020-10-27 | 深圳市沃特沃德股份有限公司 | 语义识别方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114487A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
CN101436404A (zh) * | 2007-11-16 | 2009-05-20 | 鹏智科技(深圳)有限公司 | 可会话的类生物装置及其会话方法 |
CN101794576A (zh) * | 2010-02-02 | 2010-08-04 | 重庆大学 | 一种脏话检测助手及其使用方法 |
CN102027338A (zh) * | 2008-05-14 | 2011-04-20 | 日东纺音响工程株式会社 | 信号判定方法、信号判定装置、程序、信号判定系统 |
CN107423275A (zh) * | 2017-06-27 | 2017-12-01 | 北京小度信息科技有限公司 | 订单信息生成方法及装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1137449C (zh) * | 1997-09-19 | 2004-02-04 | 国际商业机器公司 | 在中文语音识别系统中识别字母/数字串的方法 |
US7966177B2 (en) * | 2001-08-13 | 2011-06-21 | Hans Geiger | Method and device for recognising a phonetic sound sequence or character sequence |
US7689404B2 (en) * | 2004-02-24 | 2010-03-30 | Arkady Khasin | Method of multilingual speech recognition by reduction to single-language recognizer engine components |
CN1674092B (zh) * | 2004-03-26 | 2010-06-09 | 松下电器产业株式会社 | 连续数字识别的声韵母跨词建模、解码方法及系统 |
CN100514446C (zh) * | 2004-09-16 | 2009-07-15 | 北京中科信利技术有限公司 | 一种基于语音识别及语音分析的发音评估方法 |
CN1889171B (zh) * | 2005-06-29 | 2010-09-01 | 诺基亚(中国)投资有限公司 | 用于识别字符/字符串的语音识别方法和系统 |
US20090326945A1 (en) * | 2008-06-26 | 2009-12-31 | Nokia Corporation | Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system |
CN201323053Y (zh) * | 2008-12-02 | 2009-10-07 | 无敌科技(西安)有限公司 | 自动分割单字语音信号的装置 |
CN102237088B (zh) * | 2011-06-17 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音识别多信息文本获取装置及方法 |
CN103559880B (zh) * | 2013-11-08 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 语音输入系统和方法 |
CN103943109A (zh) * | 2014-04-28 | 2014-07-23 | 深圳如果技术有限公司 | 一种将语音转换为文字的方法及装置 |
CN105741832B (zh) * | 2016-01-27 | 2020-01-07 | 广东外语外贸大学 | 一种基于深度学习的口语评测方法和系统 |
CN107305768B (zh) * | 2016-04-20 | 2020-06-12 | 上海交通大学 | 语音交互中的易错字校准方法 |
CN107195300B (zh) * | 2017-05-15 | 2019-03-19 | 珠海格力电器股份有限公司 | 语音控制方法和系统 |
CN108133706B (zh) * | 2017-12-21 | 2020-10-27 | 深圳市沃特沃德股份有限公司 | 语义识别方法及装置 |
-
2017
- 2017-12-21 CN CN201711397017.5A patent/CN108133706B/zh active Active
-
2018
- 2018-01-09 WO PCT/CN2018/072008 patent/WO2019119553A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114487A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
CN101436404A (zh) * | 2007-11-16 | 2009-05-20 | 鹏智科技(深圳)有限公司 | 可会话的类生物装置及其会话方法 |
CN102027338A (zh) * | 2008-05-14 | 2011-04-20 | 日东纺音响工程株式会社 | 信号判定方法、信号判定装置、程序、信号判定系统 |
CN101794576A (zh) * | 2010-02-02 | 2010-08-04 | 重庆大学 | 一种脏话检测助手及其使用方法 |
CN107423275A (zh) * | 2017-06-27 | 2017-12-01 | 北京小度信息科技有限公司 | 订单信息生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108133706A (zh) | 2018-06-08 |
WO2019119553A1 (zh) | 2019-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102015068B1 (ko) | 프리-필터 분류를 사용한 필기 인식 향상 | |
US6487532B1 (en) | Apparatus and method for distinguishing similar-sounding utterances speech recognition | |
US10242296B2 (en) | Method and device for realizing chinese character input based on uncertainty information | |
CN107305541A (zh) | 语音识别文本分段方法及装置 | |
CN108766444B (zh) | 用户身份验证方法、服务器及存储介质 | |
CN107748784B (zh) | 一种通过自然语言实现结构化数据搜索的方法 | |
JP2006190006A5 (zh) | ||
CN110738997B (zh) | 一种信息修正方法、装置、电子设备及存储介质 | |
US7769592B2 (en) | Automatic selection of a disambiguation data field for a speech interface | |
US8219386B2 (en) | Arabic poetry meter identification system and method | |
CN105227557A (zh) | 一种帐号处理方法及装置 | |
CN108133706B (zh) | 语义识别方法及装置 | |
CN111354340B (zh) | 数据标注准确度验证方法、装置、电子设备及存储介质 | |
JPH11194793A (ja) | 音声ワープロ | |
CN111144118A (zh) | 口语化文本中命名实体的识别方法、系统、设备和介质 | |
US9978368B2 (en) | Information providing system | |
CN112908333B (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN115881108A (zh) | 语音识别方法、装置、设备及存储介质 | |
CN111310457A (zh) | 词语搭配不当识别方法、装置、电子设备和存储介质 | |
WO2013035293A1 (ja) | 音声認識装置 | |
CN113658609B (zh) | 关键字匹配信息的确定方法、装置、电子设备和介质 | |
JPH07302306A (ja) | 文字入力装置 | |
US20230082325A1 (en) | Utterance end detection apparatus, control method, and non-transitory storage medium | |
JP2001109740A (ja) | 中国語文書作成装置及び中国語文書作成方法 | |
CN116776867A (zh) | 中文相似音别字校正方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210903 Address after: 518000 201, No.26, yifenghua Innovation Industrial Park, Xinshi community, Dalang street, Longhua District, Shenzhen City, Guangdong Province Patentee after: Shenzhen waterward Information Co.,Ltd. Address before: 518000 B, 503, 602, digital city building, garden city, 1079 Shekou Road, Shekou, Nanshan District, Shenzhen, Guangdong. Patentee before: SHENZHEN WATER WORLD Co.,Ltd. |
|
TR01 | Transfer of patent right |