CN108446278B - 一种基于自然语言的语义理解系统及方法 - Google Patents
一种基于自然语言的语义理解系统及方法 Download PDFInfo
- Publication number
- CN108446278B CN108446278B CN201810780622.9A CN201810780622A CN108446278B CN 108446278 B CN108446278 B CN 108446278B CN 201810780622 A CN201810780622 A CN 201810780622A CN 108446278 B CN108446278 B CN 108446278B
- Authority
- CN
- China
- Prior art keywords
- information
- module
- text information
- instruction
- semantic understanding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 238000012937 correction Methods 0.000 claims description 14
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及信息技术领域,尤其涉及一种基于自然语言的语义理解系统,包括:采集模块;第一转换模块,与采集模块连接,以将自然语音信息转换为文字信息;判断模块,与第一转换模块连接,以判断文字信息属于垂直领域还是通用领域;第一指令识别模块,与判断模块连接,以对判断为属于通用领域的文字信息进行指令识别,形成第一指令;第二转换模块,与判断模块连接,以将判断为属于垂直领域的文字信息转换为标准拼音信息;第二指令识别模块,与第二转换模块连接,以对标准拼音信息进行指令识别,形成第二指令;执行模块;以及一种基于自然语言的语义理解方法;能够使得机器人的语义理解的精确性高,用户体验佳。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种基于自然语言的语义理解系统及方法。
背景技术
目前,随着自然语言处理技术的发展,通用领域的语言识别和语义处理的正确率都已经达到了可以商用的水准,但在一些特有领域,识别正确率和理解正确率都非常低,比如医学、智慧家居控制等垂直领域。同时由于同音字问题或说话口音问题,对于各个地域的人识别率也会存在很大不同。
这一现象导致目前机器人应用行业和场景有限,要么就做普通的迎宾、闲聊,要么就干脆不带语言处理能力,极大地妨碍了机器人在各领域的发展。从目前市场上来看,不具有语言处理功能的服务类机器人无法得到市场的认可,容易被市场淘汰。
发明内容
针对上述问题,本发明提出了一种基于自然语言的语义理解系统,其中,包括:
采集模块,用于采集自然语音信息;
第一转换模块,与所述采集模块连接,以将所述自然语音信息转换为文字信息;
判断模块,与所述第一转换模块连接,以判断所述文字信息属于垂直领域还是通用领域;
第一指令识别模块,与所述判断模块连接,以对判断为属于所述通用领域的所述文字信息进行指令识别,形成第一指令;
第二转换模块,与所述判断模块连接,以将判断为属于所述垂直领域的所述文字信息转换为标准拼音信息;
第二指令识别模块,与所述第二转换模块连接,以对所述标准拼音信息进行指令识别,形成第二指令;
执行模块,分别连接所述第一指令识别模块和所述第二指令识别模块,用于执行所述第一指令和/或所述第二指令。
上述的语义理解系统,其中,所述判断模块中存在一关键词库;
所述判断模块根据所述文字信息中是否存在包含在所述关键词库中的关键词,判断所述文字信息属于一垂直领域还是一通用领域;
存在则属于所述垂直领域;不存在则属于所述通用领域。
上述的语义理解系统,其中,所述第二转换模块中包括依次连接的一拼音转换单元和一模糊匹配单元;
所述拼音转换单元用于将所述文字信息转换为初始拼音信息;
所述模糊匹配单元用于对所述初始拼音信息进行模糊匹配,得到所述标准拼音信息。
上述的语义理解系统,其中,所述模糊匹配单元进行的所述模糊匹配采用的规则是:近似声母校正和/或前后鼻音校正。
上述的语义理解系统,其中,所述采集模块为话筒。
一种基于自然语言的语义理解方法,其中,提供一预设指令库;包括:
步骤S1,实时采集自然语音信息;
步骤S2,将采集到的所述自然语音信息转换为文字信息;
步骤S3,判断所述文字信息属于垂直领域还是通用领域;
若属于所述通用领域,则转向步骤S4;若属于所述垂直领域,则转向步骤S5;
步骤S4,对判断为属于所述通用领域的所述文字信息进行指令识别,形成第一指令并转向步骤S6;
步骤S5,将判断为属于所述垂直领域的所述文字信息转换为标准拼音信息,并对所述标准拼音信息进行指令识别,形成第二指令并转向步骤S6;
步骤S6,执行所述第一指令和/或所述第二指令后结束。
上述的语义理解方法,其中,还包括:提供一关键词库;
所述步骤S3具体为:根据所述文字信息中是否存在包含在所述关键词库中的关键词,判断所述文字信息属于一垂直领域还是一通用领域;
存在则属于所述垂直领域;不存在则属于所述通用领域。
上述的语义理解方法,其中,所述步骤S5中具体包括:
步骤S51,将所述文字信息转换为所述初始拼音信息;
步骤S52,对所述初始拼音信息进行模糊匹配,得到所述标准拼音信息;
步骤S53,对所述标准拼音信息进行指令识别,形成所述第二指令并转向步骤S6。
上述的语义理解方法,其中,所述步骤S52中,进行的所述模糊匹配采用的规则是:近似声母校正和/或前后鼻音校正。
上述的语义理解方法,其中,所述步骤S1中,采用话筒实时采集所述自然语音信息。
有益效果:本发明提出的一种基于自然语言的语义理解系统,能够使得机器人的语义理解的精确性高,用户体验佳。
附图说明
图1为本发明一实施例中基于自然语言的语义理解系统的结构原理图;
图2为本发明一实施例中第二转换模块的结构原理图;
图3为本发明一实施例中基于自然语言的语义理解方法的步骤流程图。
具体实施方式
下面结合附图和实施例对本发明进行进一步说明。
实施例一
在一个较佳的实施例中,如图1所示,提出了一种基于自然语言的语义理解系统,其中,可以包括:
采集模块10,用于采集自然语音信息;
第一转换模块20,与采集模块10连接,以将自然语音信息转换为文字信息;
判断模块30,与第一转换模块20连接,以判断文字信息属于垂直领域还是通用领域;
第一指令识别模块40,与判断模块30连接,以对判断为属于通用领域的文字信息进行指令识别,形成第一指令;
第二转换模块50,与判断模块30连接,以将判断为属于垂直领域的文字信息转换为标准拼音信息;
第二指令识别模块60,与第二转换模块50连接,以对标准拼音信息进行指令识别,形成第二指令;
执行模块70,分别连接第一指令识别模块40和第二指令识别模块60,用于执行第一指令和/或第二指令。
上述技术方案中,由于将语音信息转换为文字信息已经是本领域能够实现的准确度较高的惯用技术手段了,因此在这个基础上,通过一词典库或一对照表将文字信息转换为标准拼音信息,则可以对标准拼音信息进行处理,从而解决例如汉语中同音字或口音等问题,从而使得语音识别更为准确。
上述技术方案中,标准拼音信息可以是标准汉语拼音信息,例如包括声母子信息和韵母子信息等;标准拼音信息还可以是其他语言的标音或拼音信息;上述的各个模块可以使用在一机器人中。
在一个较佳的实施例中,判断模块中可以存在一关键词库;
判断模块30可以根据文字信息中是否存在包含在关键词库中的关键词,判断文字信息属于一垂直领域还是一通用领域;
存在则属于垂直领域;不存在则属于通用领域。
上述技术方案中,垂直领域可以是医学领域或智慧家居控制领域等,通用领域则可以是较为常用的文字领域;判断模块30的判断机制具体可以是将文字信息在一垂直领域判断数据库中进行查找,若查找匹配则判断该文字信息属于垂直领域,否则属于通用领域;除此以外,也可以采用其他判断方法,例如通过预设垂直场景判断是否属于垂直领域等。
如图2所示,在一个较佳的实施例中,第二转换模块50中包括依次连接的一拼音转换单元51和一模糊匹配单元52;
拼音转换单元51用于将文字信息转换为初始拼音信息;
模糊匹配单元52用于对初始拼音信息进行模糊匹配,得到标准拼音信息。
上述实施例中,优选地,模糊匹配单元52进行的模糊匹配采用的规则是:近似声母校正和/或前后鼻音校正等。
上述技术方案中,近似声母校正例如可以是声母f和声母h的混淆的校正等。
在一个较佳的实施例中,采集模块10可以为话筒。
实施例二
如图3所示,在一个较佳的实施例中,还提出了一种基于自然语言的语义理解方法,其中,包括提供一预设指令库;还可以包括:
步骤S1,实时采集自然语音信息;
步骤S2,将采集到的自然语音信息转换为文字信息;
步骤S3,判断文字信息属于垂直领域还是通用领域;
若属于通用领域,则转向步骤S4;若属于垂直领域,则转向步骤S5;
步骤S4,对判断为属于通用领域的文字信息进行指令识别,形成第一指令并转向步骤S6;
步骤S5,将判断为属于垂直领域的文字信息转换为标准拼音信息,并对标准拼音信息进行指令识别,形成第二指令并转向步骤S6;
步骤S6,执行第一指令和/或第二指令后结束。
上述技术方案中,各个步骤均可以通过实施例一中的各个模块完成;可以,通过一词典库或一对照表将文字信息转换为标准拼音信息,则可以对标准拼音信息进行处理,从而解决例如汉语中同音字或口音等问题,从而使得语音识别更为准确;上述的语义理解方法可以应用于一机器人。
在一个较佳的实施例中,还可以包括:提供一关键词库;
步骤S3具体为:根据文字信息中是否存在包含在关键词库中的关键词,判断文字信息属于一垂直领域还是一通用领域;
存在则属于垂直领域;不存在则属于通用领域。
在一个较佳的实施例中,步骤S5中具体可以包括:
步骤S51,将文字信息转换为初始拼音信息;
步骤S52,对初始拼音信息进行模糊匹配,得到标准拼音信息;
步骤S53,对标准拼音信息进行指令识别,形成第二指令并转向步骤S6。
上述实施例中,优选地,步骤S52中,进行的模糊匹配采用的规则是:近似声母校正和/或前后鼻音校正。
在一个较佳的实施例中,步骤S1中,可以采用话筒实时采集自然语音信息。
综上所述,本发明提出的一种基于自然语言的语义理解系统,包括:采集模块,用于采集自然语音信息;第一转换模块,与采集模块连接,以将自然语音信息转换为文字信息;判断模块,与第一转换模块连接,以判断文字信息属于垂直领域还是通用领域;第一指令识别模块,与判断模块连接,以对判断为属于通用领域的文字信息进行指令识别,形成第一指令;第二转换模块,与判断模块连接,以将判断为属于垂直领域的文字信息转换为标准拼音信息;第二指令识别模块,与第二转换模块连接,以对标准拼音信息进行指令识别,形成第二指令;执行模块,分别连接第一指令识别模块和第二指令识别模块,用于执行第一指令和/或第二指令;以及一种基于自然语言的语义理解方法;能够使得机器人的语义理解的精确性高,用户体验佳。
通过说明和附图,给出了具体实施方式的特定结构的典型实施例,基于本发明精神,还可作其他的转换。尽管上述发明提出了现有的较佳实施例,然而,这些内容并不作为局限。
对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。
Claims (8)
1.一种基于自然语言的语义理解系统,其特征在于,包括:
采集模块,用于采集自然语音信息;
第一转换模块,与所述采集模块连接,以将所述自然语音信息转换为文字信息;
判断模块,与所述第一转换模块连接,以判断所述文字信息属于垂直领域还是通用领域;
第一指令识别模块,与所述判断模块连接,以对判断为属于所述通用领域的所述文字信息进行指令识别,形成第一指令;
第二转换模块,与所述判断模块连接,以将判断为属于所述垂直领域的所述文字信息转换为标准拼音信息;
第二指令识别模块,与所述第二转换模块连接,以对所述标准拼音信息进行指令识别,形成第二指令;
执行模块,分别连接所述第一指令识别模块和所述第二指令识别模块,用于执行所述第一指令和/或所述第二指令;
所述判断模块中存在一关键词库;
所述判断模块根据所述文字信息中是否存在包含在所述关键词库中的关键词,判断所述文字信息属于一垂直领域还是一通用领域;
存在则属于所述垂直领域;不存在则属于所述通用领域。
2.根据权利要求1所述的语义理解系统,其特征在于,所述第二转换模块中包括依次连接的一拼音转换单元和一模糊匹配单元;
所述拼音转换单元用于将所述文字信息转换为初始拼音信息;
所述模糊匹配单元用于对所述初始拼音信息进行模糊匹配,得到所述标准拼音信息。
3.根据权利要求2所述的语义理解系统,其特征在于,所述模糊匹配单元进行的所述模糊匹配采用的规则是:近似声母校正和/或前后鼻音校正。
4.根据权利要求1所述的语义理解系统,其特征在于,所述采集模块为话筒。
5.一种基于自然语言的语义理解方法,其特征在于,提供一预设指令库;包括:
步骤S1,实时采集自然语音信息;
步骤S2,将采集到的所述自然语音信息转换为文字信息;
步骤S3,判断所述文字信息属于垂直领域还是通用领域;
若属于所述通用领域,则转向步骤S4;若属于所述垂直领域,则转向步骤S5;
步骤S4,对判断为属于所述通用领域的所述文字信息进行指令识别,形成第一指令并转向步骤S6;
步骤S5,将判断为属于所述垂直领域的所述文字信息转换为标准拼音信息,并对所述标准拼音信息进行指令识别,形成第二指令并转向步骤S6;
步骤S6,执行所述第一指令和/或所述第二指令后结束;
还提供一关键词库;
所述步骤S3具体为:根据所述文字信息中是否存在包含在所述关键词库中的关键词,判断所述文字信息属于一垂直领域还是一通用领域;
存在则属于所述垂直领域;不存在则属于所述通用领域。
6.根据权利要求5所述的语义理解方法,其特征在于,所述步骤S5中具体包括:
步骤S51,将所述文字信息转换为初始拼音信息;
步骤S52,对所述初始拼音信息进行模糊匹配,得到所述标准拼音信息;
步骤S53,对所述标准拼音信息进行指令识别,形成所述第二指令并转向步骤S6。
7.根据权利要求6所述的语义理解方法,其特征在于,所述步骤S52中,进行的所述模糊匹配采用的规则是:近似声母校正和/或前后鼻音校正。
8.根据权利要求5所述的语义理解方法,其特征在于,所述步骤S1中,采用话筒实时采集所述自然语音信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810780622.9A CN108446278B (zh) | 2018-07-17 | 2018-07-17 | 一种基于自然语言的语义理解系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810780622.9A CN108446278B (zh) | 2018-07-17 | 2018-07-17 | 一种基于自然语言的语义理解系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108446278A CN108446278A (zh) | 2018-08-24 |
CN108446278B true CN108446278B (zh) | 2018-11-06 |
Family
ID=63207035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810780622.9A Active CN108446278B (zh) | 2018-07-17 | 2018-07-17 | 一种基于自然语言的语义理解系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108446278B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178081B (zh) * | 2018-11-09 | 2023-07-21 | 中移(杭州)信息技术有限公司 | 语义识别的方法、服务器、电子设备及计算机存储介质 |
CN110767227A (zh) * | 2019-12-30 | 2020-02-07 | 浙江互灵科技有限公司 | 用于单灯控制的语音识别系统及方法 |
CN111104803B (zh) * | 2019-12-31 | 2024-02-13 | 科大讯飞股份有限公司 | 语义理解处理方法、装置、设备及可读存储介质 |
CN111192572A (zh) * | 2019-12-31 | 2020-05-22 | 斑马网络技术有限公司 | 语义识别的方法、装置及系统 |
CN112259182B (zh) * | 2020-11-05 | 2023-08-11 | 中国联合网络通信集团有限公司 | 一种电子病历的生成方法和装置 |
CN113569577B (zh) * | 2021-06-07 | 2024-04-05 | 北京微智信业科技有限公司 | 一种基于自然语言语义分析的文本识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106933561A (zh) * | 2015-12-31 | 2017-07-07 | 北京搜狗科技发展有限公司 | 语音输入方法和终端设备 |
TWI612472B (zh) * | 2016-12-01 | 2018-01-21 | 財團法人資訊工業策進會 | 指令轉換方法與系統以及非暫態電腦可讀取記錄媒體 |
-
2018
- 2018-07-17 CN CN201810780622.9A patent/CN108446278B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108446278A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446278B (zh) | 一种基于自然语言的语义理解系统及方法 | |
US10977452B2 (en) | Multi-lingual virtual personal assistant | |
US11393476B2 (en) | Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface | |
CN109255113B (zh) | 智能校对系统 | |
US11830485B2 (en) | Multiple speech processing system with synthesized speech styles | |
US9129591B2 (en) | Recognizing speech in multiple languages | |
CN106503646B (zh) | 多模态情感辨识系统及方法 | |
US9613621B2 (en) | Speech recognition method and electronic apparatus | |
CN116547746A (zh) | 针对多个用户的对话管理 | |
CN103578467B (zh) | 声学模型的建立方法、语音辨识方法及其电子装置 | |
US9275635B1 (en) | Recognizing different versions of a language | |
CN105404621B (zh) | 一种用于盲人读取汉字的方法及系统 | |
US11093110B1 (en) | Messaging feedback mechanism | |
CN103578464A (zh) | 语言模型的建立方法、语音辨识方法及电子装置 | |
JP2015026057A (ja) | インタラクティブキャラクター基盤の外国語学習装置及び方法 | |
Sitaram et al. | Speech synthesis of code-mixed text | |
Li et al. | Towards zero-shot learning for automatic phonemic transcription | |
KR102372069B1 (ko) | 언어학습을 위한 양국어 자유 대화 시스템 및 방법 | |
CN110517668B (zh) | 一种中英文混合语音识别系统及方法 | |
US10614170B2 (en) | Method of translating speech signal and electronic device employing the same | |
CN102970618A (zh) | 基于音节识别的视频点播方法 | |
CN105895076B (zh) | 一种语音合成方法及系统 | |
US11817079B1 (en) | GAN-based speech synthesis model and training method | |
CN104424942A (zh) | 一种提高文字语音输入准确率的方法 | |
JP2004271895A (ja) | 複数言語音声認識システムおよび発音学習システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |