CN108446278B

CN108446278B - 一种基于自然语言的语义理解系统及方法

Info

Publication number: CN108446278B
Application number: CN201810780622.9A
Authority: CN
Inventors: 陈向键
Original assignee: Wei Lai Eph Intelligent Robot Technology (shanghai) Co Ltd
Current assignee: Wei Lai Eph Intelligent Robot Technology (shanghai) Co Ltd
Priority date: 2018-07-17
Filing date: 2018-07-17
Publication date: 2018-11-06
Anticipated expiration: 2038-07-17
Also published as: CN108446278A

Abstract

本发明涉及信息技术领域，尤其涉及一种基于自然语言的语义理解系统，包括：采集模块；第一转换模块，与采集模块连接，以将自然语音信息转换为文字信息；判断模块，与第一转换模块连接，以判断文字信息属于垂直领域还是通用领域；第一指令识别模块，与判断模块连接，以对判断为属于通用领域的文字信息进行指令识别，形成第一指令；第二转换模块，与判断模块连接，以将判断为属于垂直领域的文字信息转换为标准拼音信息；第二指令识别模块，与第二转换模块连接，以对标准拼音信息进行指令识别，形成第二指令；执行模块；以及一种基于自然语言的语义理解方法；能够使得机器人的语义理解的精确性高，用户体验佳。

Description

一种基于自然语言的语义理解系统及方法

技术领域

本发明涉及信息技术领域，尤其涉及一种基于自然语言的语义理解系统及方法。

背景技术

目前，随着自然语言处理技术的发展，通用领域的语言识别和语义处理的正确率都已经达到了可以商用的水准，但在一些特有领域，识别正确率和理解正确率都非常低，比如医学、智慧家居控制等垂直领域。同时由于同音字问题或说话口音问题，对于各个地域的人识别率也会存在很大不同。

这一现象导致目前机器人应用行业和场景有限，要么就做普通的迎宾、闲聊，要么就干脆不带语言处理能力，极大地妨碍了机器人在各领域的发展。从目前市场上来看，不具有语言处理功能的服务类机器人无法得到市场的认可，容易被市场淘汰。

发明内容

针对上述问题，本发明提出了一种基于自然语言的语义理解系统，其中，包括：

采集模块，用于采集自然语音信息；

第一转换模块，与所述采集模块连接，以将所述自然语音信息转换为文字信息；

判断模块，与所述第一转换模块连接，以判断所述文字信息属于垂直领域还是通用领域；

第一指令识别模块，与所述判断模块连接，以对判断为属于所述通用领域的所述文字信息进行指令识别，形成第一指令；

第二转换模块，与所述判断模块连接，以将判断为属于所述垂直领域的所述文字信息转换为标准拼音信息；

第二指令识别模块，与所述第二转换模块连接，以对所述标准拼音信息进行指令识别，形成第二指令；

执行模块，分别连接所述第一指令识别模块和所述第二指令识别模块，用于执行所述第一指令和/或所述第二指令。

上述的语义理解系统，其中，所述判断模块中存在一关键词库；

所述判断模块根据所述文字信息中是否存在包含在所述关键词库中的关键词，判断所述文字信息属于一垂直领域还是一通用领域；

存在则属于所述垂直领域；不存在则属于所述通用领域。

上述的语义理解系统，其中，所述第二转换模块中包括依次连接的一拼音转换单元和一模糊匹配单元；

所述拼音转换单元用于将所述文字信息转换为初始拼音信息；

所述模糊匹配单元用于对所述初始拼音信息进行模糊匹配，得到所述标准拼音信息。

上述的语义理解系统，其中，所述模糊匹配单元进行的所述模糊匹配采用的规则是：近似声母校正和/或前后鼻音校正。

上述的语义理解系统，其中，所述采集模块为话筒。

一种基于自然语言的语义理解方法，其中，提供一预设指令库；包括：

步骤S1，实时采集自然语音信息；

步骤S2，将采集到的所述自然语音信息转换为文字信息；

步骤S3，判断所述文字信息属于垂直领域还是通用领域；

若属于所述通用领域，则转向步骤S4；若属于所述垂直领域，则转向步骤S5；

步骤S4，对判断为属于所述通用领域的所述文字信息进行指令识别，形成第一指令并转向步骤S6；

步骤S5，将判断为属于所述垂直领域的所述文字信息转换为标准拼音信息，并对所述标准拼音信息进行指令识别，形成第二指令并转向步骤S6；

步骤S6，执行所述第一指令和/或所述第二指令后结束。

上述的语义理解方法，其中，还包括：提供一关键词库；

所述步骤S3具体为：根据所述文字信息中是否存在包含在所述关键词库中的关键词，判断所述文字信息属于一垂直领域还是一通用领域；

存在则属于所述垂直领域；不存在则属于所述通用领域。

上述的语义理解方法，其中，所述步骤S5中具体包括：

步骤S51，将所述文字信息转换为所述初始拼音信息；

步骤S52，对所述初始拼音信息进行模糊匹配，得到所述标准拼音信息；

步骤S53，对所述标准拼音信息进行指令识别，形成所述第二指令并转向步骤S6。

上述的语义理解方法，其中，所述步骤S52中，进行的所述模糊匹配采用的规则是：近似声母校正和/或前后鼻音校正。

上述的语义理解方法，其中，所述步骤S1中，采用话筒实时采集所述自然语音信息。

有益效果：本发明提出的一种基于自然语言的语义理解系统，能够使得机器人的语义理解的精确性高，用户体验佳。

附图说明

图1为本发明一实施例中基于自然语言的语义理解系统的结构原理图；

图2为本发明一实施例中第二转换模块的结构原理图；

图3为本发明一实施例中基于自然语言的语义理解方法的步骤流程图。

具体实施方式

下面结合附图和实施例对本发明进行进一步说明。

实施例一

在一个较佳的实施例中，如图1所示，提出了一种基于自然语言的语义理解系统，其中，可以包括：

采集模块10，用于采集自然语音信息；

第一转换模块20，与采集模块10连接，以将自然语音信息转换为文字信息；

判断模块30，与第一转换模块20连接，以判断文字信息属于垂直领域还是通用领域；

第一指令识别模块40，与判断模块30连接，以对判断为属于通用领域的文字信息进行指令识别，形成第一指令；

第二转换模块50，与判断模块30连接，以将判断为属于垂直领域的文字信息转换为标准拼音信息；

第二指令识别模块60，与第二转换模块50连接，以对标准拼音信息进行指令识别，形成第二指令；

执行模块70，分别连接第一指令识别模块40和第二指令识别模块60，用于执行第一指令和/或第二指令。

上述技术方案中，由于将语音信息转换为文字信息已经是本领域能够实现的准确度较高的惯用技术手段了，因此在这个基础上，通过一词典库或一对照表将文字信息转换为标准拼音信息，则可以对标准拼音信息进行处理，从而解决例如汉语中同音字或口音等问题，从而使得语音识别更为准确。

上述技术方案中，标准拼音信息可以是标准汉语拼音信息，例如包括声母子信息和韵母子信息等；标准拼音信息还可以是其他语言的标音或拼音信息；上述的各个模块可以使用在一机器人中。

在一个较佳的实施例中，判断模块中可以存在一关键词库；

判断模块30可以根据文字信息中是否存在包含在关键词库中的关键词，判断文字信息属于一垂直领域还是一通用领域；

存在则属于垂直领域；不存在则属于通用领域。

上述技术方案中，垂直领域可以是医学领域或智慧家居控制领域等，通用领域则可以是较为常用的文字领域；判断模块30的判断机制具体可以是将文字信息在一垂直领域判断数据库中进行查找，若查找匹配则判断该文字信息属于垂直领域，否则属于通用领域；除此以外，也可以采用其他判断方法，例如通过预设垂直场景判断是否属于垂直领域等。

如图2所示，在一个较佳的实施例中，第二转换模块50中包括依次连接的一拼音转换单元51和一模糊匹配单元52；

拼音转换单元51用于将文字信息转换为初始拼音信息；

模糊匹配单元52用于对初始拼音信息进行模糊匹配，得到标准拼音信息。

上述实施例中，优选地，模糊匹配单元52进行的模糊匹配采用的规则是：近似声母校正和/或前后鼻音校正等。

上述技术方案中，近似声母校正例如可以是声母f和声母h的混淆的校正等。

在一个较佳的实施例中，采集模块10可以为话筒。

实施例二

如图3所示，在一个较佳的实施例中，还提出了一种基于自然语言的语义理解方法，其中，包括提供一预设指令库；还可以包括：

步骤S1，实时采集自然语音信息；

步骤S2，将采集到的自然语音信息转换为文字信息；

步骤S3，判断文字信息属于垂直领域还是通用领域；

若属于通用领域，则转向步骤S4；若属于垂直领域，则转向步骤S5；

步骤S4，对判断为属于通用领域的文字信息进行指令识别，形成第一指令并转向步骤S6；

步骤S5，将判断为属于垂直领域的文字信息转换为标准拼音信息，并对标准拼音信息进行指令识别，形成第二指令并转向步骤S6；

步骤S6，执行第一指令和/或第二指令后结束。

上述技术方案中，各个步骤均可以通过实施例一中的各个模块完成；可以，通过一词典库或一对照表将文字信息转换为标准拼音信息，则可以对标准拼音信息进行处理，从而解决例如汉语中同音字或口音等问题，从而使得语音识别更为准确；上述的语义理解方法可以应用于一机器人。

在一个较佳的实施例中，还可以包括：提供一关键词库；

步骤S3具体为：根据文字信息中是否存在包含在关键词库中的关键词，判断文字信息属于一垂直领域还是一通用领域；

存在则属于垂直领域；不存在则属于通用领域。

在一个较佳的实施例中，步骤S5中具体可以包括：

步骤S51，将文字信息转换为初始拼音信息；

步骤S52，对初始拼音信息进行模糊匹配，得到标准拼音信息；

步骤S53，对标准拼音信息进行指令识别，形成第二指令并转向步骤S6。

上述实施例中，优选地，步骤S52中，进行的模糊匹配采用的规则是：近似声母校正和/或前后鼻音校正。

在一个较佳的实施例中，步骤S1中，可以采用话筒实时采集自然语音信息。

综上所述，本发明提出的一种基于自然语言的语义理解系统，包括：采集模块，用于采集自然语音信息；第一转换模块，与采集模块连接，以将自然语音信息转换为文字信息；判断模块，与第一转换模块连接，以判断文字信息属于垂直领域还是通用领域；第一指令识别模块，与判断模块连接，以对判断为属于通用领域的文字信息进行指令识别，形成第一指令；第二转换模块，与判断模块连接，以将判断为属于垂直领域的文字信息转换为标准拼音信息；第二指令识别模块，与第二转换模块连接，以对标准拼音信息进行指令识别，形成第二指令；执行模块，分别连接第一指令识别模块和第二指令识别模块，用于执行第一指令和/或第二指令；以及一种基于自然语言的语义理解方法；能够使得机器人的语义理解的精确性高，用户体验佳。

通过说明和附图，给出了具体实施方式的特定结构的典型实施例，基于本发明精神，还可作其他的转换。尽管上述发明提出了现有的较佳实施例，然而，这些内容并不作为局限。

对于本领域的技术人员而言，阅读上述说明后，各种变化和修正无疑将显而易见。因此，所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容，都应认为仍属本发明的意图和范围内。

Claims

1.一种基于自然语言的语义理解系统，其特征在于，包括：

采集模块，用于采集自然语音信息；

执行模块，分别连接所述第一指令识别模块和所述第二指令识别模块，用于执行所述第一指令和/或所述第二指令；

所述判断模块中存在一关键词库；

存在则属于所述垂直领域；不存在则属于所述通用领域。

2.根据权利要求1所述的语义理解系统，其特征在于，所述第二转换模块中包括依次连接的一拼音转换单元和一模糊匹配单元；

3.根据权利要求2所述的语义理解系统，其特征在于，所述模糊匹配单元进行的所述模糊匹配采用的规则是：近似声母校正和/或前后鼻音校正。

4.根据权利要求1所述的语义理解系统，其特征在于，所述采集模块为话筒。

5.一种基于自然语言的语义理解方法，其特征在于，提供一预设指令库；包括：

步骤S1，实时采集自然语音信息；

步骤S2，将采集到的所述自然语音信息转换为文字信息；

步骤S3，判断所述文字信息属于垂直领域还是通用领域；

步骤S6，执行所述第一指令和/或所述第二指令后结束；

还提供一关键词库；

存在则属于所述垂直领域；不存在则属于所述通用领域。

6.根据权利要求5所述的语义理解方法，其特征在于，所述步骤S5中具体包括：

步骤S51，将所述文字信息转换为初始拼音信息；

7.根据权利要求6所述的语义理解方法，其特征在于，所述步骤S52中，进行的所述模糊匹配采用的规则是：近似声母校正和/或前后鼻音校正。

8.根据权利要求5所述的语义理解方法，其特征在于，所述步骤S1中，采用话筒实时采集所述自然语音信息。