CN111414760B - 自然语言处理方法及相关设备、系统和存储装置 - Google Patents
自然语言处理方法及相关设备、系统和存储装置 Download PDFInfo
- Publication number
- CN111414760B CN111414760B CN201811553507.4A CN201811553507A CN111414760B CN 111414760 B CN111414760 B CN 111414760B CN 201811553507 A CN201811553507 A CN 201811553507A CN 111414760 B CN111414760 B CN 111414760B
- Authority
- CN
- China
- Prior art keywords
- natural language
- processed
- processing system
- language
- language processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000003058 natural language processing Methods 0.000 title claims abstract description 45
- 230000008569 process Effects 0.000 claims abstract description 28
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种自然语言处理方法及相关设备、系统和存储装置。其中,所述方法包括:处理设备获取待处理自然语言;判断所述待处理自然语言属于设定领域的内容还是通用领域的内容;基于判断结果对应选择所述设定领域关联的第一语言处理系统或所述通用领域关联的第二语言处理系统,以对所述待处理自然语言进行处理。上述方案,能够实现通用领域和设定领域自然语言处理,且提高对设定领域自然语言的处理准确率。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种自然语言处理方法及相关设备、系统和存储装置。
背景技术
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,能够实现人机之间的自然语言通信。目前,设备进行自然语言的交互,普遍都是依赖大平台提供的自然语言处理方案,实现对用户输入的自然语言的语义理解,并可将自身意图采用自然语言表达出来。
但是,为保证能够为各种领域用户服务,现有的自然语言处理方案的大平台都是针对通用领域的自然语言处理,例如,现有的自然语言处理方案的大平台分门别类很多通用技能,如天气、股票、音乐、故事等,可基于划分的通用技能对自然语言进行处理。这种大而全的自然语言处理平台通常不会在某一领域进行专门深入的配置,以实现针对某一设定领域的自然语言理解。例如,对于某一款空调,其专门设置一种特别模式—ECO模式。对于通用领域的大平台,当用户输入“请帮我打开空调的ECO模式”时,其并不能依赖其通用领域数据理解出该ECO模式是什么意思,进而无法准确使空调执行ECO模式。
发明内容
本申请主要解决的技术问题是提供一种自然语言处理方法及相关设备、系统和存储装置,能够实现通用领域和设定领域自然语言处理,且提高对设定领域自然语言的处理准确率。
为了解决上述问题,本申请第一方面提供了一种自然语言处理方法,包括:处理设备获取待处理自然语言;判断所述待处理自然语言属于设定领域的内容还是通用领域的内容;基于判断结果对应选择所述设定领域关联的第一语言处理系统或所述通用领域关联的第二语言处理系统,以对所述待处理自然语言进行处理。
为了解决上述问题,本申请第二方面提供了一种处理设备,包括相互耦接的存储器和处理器;其中,所述处理器用于执行所述存储器存储的程序指令实现上述的方法。
为了解决上述问题,本申请第三方面提供了一种自然语言处理系统,包括智能家居设备和处理设备,其中,所述智能家居设备用于获得用户输入的待处理自然语言,并将所述待处理自然语言发送给所述处理设备;所述处理设备为上述的处理设备,以对所述待处理自然语言进行处理。
为了解决上述问题,本申请第四方面提供了一种存储装置,存储有处理器可运行的程序指令,所述程序指令用于执行上述的方法。
上述方案中,通过判断待处理自然语言属于设定领域或是通用领域的内容,并基于判断结果选择设定领域关联的第一语言处理系统或通用领域关联的第二语言处理系统对待处理自然语言进行处理,故既可对通用领域自然语言进行处理,也可对设定领域自然语言进行处理,且相比于采用通用领域的语言处理系统,采用专门针对该设定领域的第一语言处理系统进行自然语言处理,能够提高对设定领域自然语言的处理准确率。
附图说明
图1是本申请自然语言处理方法一实施例的流程示意图;
图2是本申请自然语言处理方法另一实施例中步骤S130包含的流程示意图;
图3是本申请自然语言处理方法再一实施例的流程示意图;
图4是本申请自然语言处理方法一应用系统实施例的结构示意图;
图5是本申请处理设备一实施例的结构示意图;
图6是本申请存储装置一实施例的结构示意图;
图7是本申请自然语言处理系统一实施例的结构示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请自然语言处理方法一实施例的流程示意图。本实施例中,该方法由处理设备执行,该处理设备可以为具有处理能力且有自然语言处理需求的任意设备,例如服务器、智能家居设备等。具体地,该方法包括以下步骤:
S110:获取待处理自然语言。
具体地,处理设备可通过人机交互电路直接获得用户输入的待处理自然语言,或者可通过其通信电路接收来自其他设备的待处理自然语言。其中,该获取的待处理自然语言可以为语音类型、文本类型等。在一应用场景中,处理设备为与智能家居设备连接的远程服务器,其接收智能家居设备发送的待处理自然语言,待处理自然语言可以是智能家居设备通过其麦克风进行语音采集得到的语音数据(即语音类型的待处理自然语言)、也可以是智能家居设备通过其人机交互界面获得的文本数据(即文本类型的待处理自然语言)。
S120:判断待处理自然语言属于设定领域的内容还是通用领域的内容。
本实施例中,处理设备针对属于设定领域或者通用领域的自然语言,采用相应的处理系统进行处理。其中,设定领域,也可称为垂直领域,指预先设定的具有一定行业背景的领域,例如该设定领域为家电领域,或者进一步为家电的空调领域、微波炉领域等。通用领域是相对垂直领域而言,其并不仅针对某一行业领域,而是涉及多行业领域或者多行业领域可通用的。
具体地,处理设备对经S110获得的待处理自然语言进行分析以确定待处理自然语言涉及的内容是属于设定领域还是通用领域。在一应用场景中,本S120可具体包括:利用预设分类模型对所述待处理自然语言进行分析,并基于分析结果确定所述待处理自然语言属于设定领域的内容还是通用领域的内容。例如,处理设备预存有利用深度学习等算法建立的分类模型,将获取的待处理自然语言输入至该分类模型进行处理,得到待处理自然语言属于设定领域和通用领域的可能性结果,该可能性结果可以包括待处理自然语言属于相应领域时的执行度和/或得分。处理设备分别将得到的属于设定领域和通用领域的可能性结果与预设阈值进行比较,将对应的可能性结果大于该预设阈值的领域确定为待处理自然语言所属的领域。
在一实施例中,该处理设备是通过对待处理自然语言对应的文本数据进行分析,来确定待处理自然语言属于设定领域还是通用领域的。故,当经S110获取的待自然语言为语音类型(即S110获取的是语音数据)时,处理设备可在执行S120之前,先将待自然语言从语音类型转换成文本类型,以得到待自然语言对应的文本数据,然后在对该文本数据进行分析以确定待处理自然语言所属领域。其中,该语音转换成文本的步骤可由处理设备内的自动语音识别(Automatic Speech Recognition,ASR)模块实现,或者发送给其他设备的ASR模块实现后再将转换后的文本数据返给该处理设备。该ASR模块用于将语音数据转换成计算机能识别的符号序列——文本。
S130:基于判断结果对应选择设定领域关联的第一语言处理系统或通用领域关联的第二语言处理系统,以对待处理自然语言进行处理。
本实施例中,预先配置与设定领域关联的第一语言处理系统和与通用领域关联的第二语言处理系统。该第一语言处理系统是专门用于对该设定领域的自然语言进行处理的,是预先对该设定领域的相关词汇和参数进行学习形成的能够对设定领域的自然语言进行语义理解并准确做出响应的平台,可通过基于设定领域的数据及领域知识来不断改进该第一语言处理系统对自然语言处理的准确度和速率。该第二语言处理系统是针对通用领域的自然语言进行处理的,能够对不同领域的常规自然语言进行语义理解并做出相应。
具体地,处理设备在判断待处理自然语言属于设定领域的内容的情况下,响应于该判断结果而选择第一语言处理系统对待处理自然语言进行处理;处理设备在判断待处理自然语言属于通用领域的内容的情况下,响应于该判断结果而选择述第二语言处理系统对待处理自然语言进行处理。
可以理解的是,本文所述的第一语言处理系统和第二语言处理系统为两个独立的语言处理系统,可以设置在不同设备中或者为同一设备中的两个不同处理电路。在一实施例中,第一语言处理系统和第二语言处理系统设在不同设备中。进一步地,第一语言处理系统设备可以设在该处理设备中,第二语言处理系统设在独立与处理设备的其他设备,此时,所述响应于所述待处理自然语言属于通用领域的内容,选择所述第二语言处理系统对所述待处理自然语言进行处理,可具体包括:响应于待处理自然语言属于通用领域的内容,处理设备将待处理自然语言发送给第二语言处理系统,以选择第二语言处理系统对待处理自然语言进行处理。例如,该处理设备为与智能家居设备连接的第一远程服务器,第一语言处理系统配置在该第一远程服务器中,第二语言处理系统配置在与第二远程服务器连接的第二远程服务器中,智能家居设备采集到用户输入的待处理自然语言后,将待处理自然语言发送给第一远程服务器,以由第一远程服务器判断待处理自然语言属于设定领域还是通用领域的内容,若属于设定领域,则将待处理自然语言输入至该第一语言处理系统进行自然语言处理;若属于通用领域,则将待处理自然语言发送给第二远程服务器,以由第二语言处理系统进行自然语言处理。
本实施例中,通过判断待处理自然语言属于设定领域或是通用领域的内容,并基于判断结果选择设定领域关联的第一语言处理系统或通用领域关联的第二语言处理系统对待处理自然语言进行处理,故既可对通用领域自然语言进行处理,也可对设定领域自然语言进行处理,且相比于采用通用领域的语言处理系统,采用专门针对该设定领域的第一语言处理系统进行自然语言处理,能够提高对设定领域自然语言的处理准确率。另外,通用领域的第二语言处理系统一般是由第三方提供,本实施例将设定领域的自然语言交与独立的第一语言处理系统进行处理,故关于该设定领域的相关数据均仅需提供给该第一语言处理系统,无需提供给通用领域的第二语言处理系统,可避免设定领域的敏感数据通过通用领域的第三方泄露,保证信息安全。而且,若第三方提供的通用领域的第二语言处理系统出现问题,也可直接更换的新第二语言处理系统,无需考虑提供设定领域的相关数据而重新构建新第二语言处理系统,如与第三方的弱耦合。
在另一实施例中,结合参考图2,本S130步骤中由第一语言处理系统或第二语言处理系统执行的所述对所述待处理自然语言进行处理,具体可包括以下子步骤:
S231:对待处理自然语言进行语义理解,得到语义结果。
具体地,先对待处理自然语言进行自然语言理解,也即将待处理自然语言转换成计算机能够理解的槽位信息,利用该槽位信息即可得到待处理自然语言传达的语义信息。该子步骤S231可以由相应领域(如设定领域或通用领域)的语言处理系统中的自然语言理解(Natural Language Understanding,NLU)模块实现。
在一实施例中,子步骤S231可包括:对所述待处理自然语言进行槽位填充,得到槽位信息,其中所述槽位信息用于表示所述待处理自然语言的语义结果。槽位(也称为语义槽,slot)是指语义理解的表示,通常由一些参数对描述,例如:待处理自然语言为:“今天深圳天气怎么样”,其有以下槽位信息:{领域:天气;时间:今天;地址:深圳}。其中,设定领域和通用领域的槽位可设为不同,例如,对于第一语言处理系统,其关联的设定领域为家电领域,其槽位信息可包括:设备控制、厨房、场景等;对于通用领域的第二语言处理系统,其槽位信息可包括:天气、股票、音乐等。
S232:执行与所述语义结果匹配的响应。
具体地,该响应可以为产生匹配的执行指令或者产生用于交互的回复信息,其中该子步骤S232的执行可以由相应的语言处理系统中的对话管理(Dialog Management,DM)模块实现或者由相应的语言处理系统中的DM模块和自然语言生成(Natural LanguageGeneration,NLG)模块组合实现。
在一应用场景中,处理设备连接于智能设备如空调、微波炉等智能家居设备,用于为该智能设备提供自然语言处理。处理设备在步骤S110获取的待处理自然语言是由该智能设备发送的,处理设备执行该S232包括:生成与所述语义结果匹配的执行指令,并将所述执行指令发送给所述智能设备,以由所述智能设备执行所述执行指令;和/或,生成与所述语义结果匹配的回复信息,并将所述回复信息发送给所述智能设备,以由所述智能设备显示或语音播放所述回复信息。其中,该执行指令可以由相应语言处理系统配置的DM模块直接生成,该回复信息可先由相应语言处理系统配置的DM模块确定要回复的内容,并利用NLG模块将要回复的内容转换成生成文本类型的自然语言以得到该回复信息。可以理解的是的,相应语言处理系统可既产生执行指令也产生回复信息。例如,处理设备接收到空调发送的自然语言“帮我打开下空调”,处理设备对其进行自然语言处理产生并向空调发送空调打开指令和回复信息“好的,已为您打开空调”,空调设备响应于该空调打开指令而启动自身,并通过语音播报该回复信息“好的,已为您打开空调”。
可以理解的是,当该回复信息用于提供给智能设备进行语音播放时,可将该回复信息由文本类型转换成语音类型,再将该语音类型的回复信息发送给智能设备。其中,该回复信息的上述文本语音转换可以由相应的语言处理系统中的文本到语音合成(Text ToSpeech,TTS)模块实现,或者固定由其中一个语言处理系统的TTS模块实现,例如,第一语言处理系统和第二语言处理系统中只有第二语言处理系统配置有TTS模块,当第一语言处理系统对设定领域的待处理自然语言进行处理得到回复信息后,将包含所述回复信息的语音转换请求发送给第二语言处理系统,以请求第二语言处理系统利用其TTS模块将所述回复信息转换成语音数据并将所述语音数据发送至所述智能设备,进而智能设备可直接语音播放该语音数据,以响应用户输入的待处理自然语言,即实现与用户之间的交互。可以理解的是,本文所述的语音转换请求用于请求将文本类型的数据转换成语音类型的数据。
请结合参阅图3和图4,图3是本申请自然语言处理方法再一实施例的流程示意图,图4是本申请自然语言处理方法一应用系统实施例的结构示意图。其中,该应用系统包括第一处理设备410、第二处理设备420以及至少一个智能家居设备430。该第一处理设备410分别与第二处理设备420及至少一个智能家居设备430连接,且第二处理设备420与智能家居设备430也可连接。前述连接可以为能够实现通信的有线连接或无线连接。第一处理设备410配置有第一语言处理系统411,用于对设定领域的自然语言进行处理,可以由设定领域的产品制造方构建;第二处理设备420配置有第二语言处理系统421,用于对通用领域的自然语言进行处理,可以由第三方构建。第一处理设备410和第二处理设备420可以为服务器、计算机设备等具有一定处理能力的可通信设备,智能家居设备430可以为空调、电饭煲、微波炉、电冰箱、音箱等家居电子设备。
本实施例方法由第一处理设备410执行,以对智能家居设备430的语音类型的待处理自然语言进行处理为例,该方法具体包括以下步骤:
S310:第一处理设备410接收智能家居设备430发送的待处理自然语言。
具体地,智能家居设备430的语音采集电路定时检测环境的声音,在接收到用户输入的语音类型的待处理自然语言,并将待处理自然语言发送给第一处理设备410进行自然语言处理。
S320:第一处理设备410将待处理自然语言从语音类型转换成文本类型。
该语音识别转换可以由第一处理设备410执行或者发送给其他设备执行后再将该文本数据发送给第一处理设备410。本实施例中,第一处理设备410的第一语言处理系统411不具有自动语音识别功能,且第二处理设备420的第二语言处理系统421配置有ARS模块4211,第一处理设备410在接收到智能家居设备430发送的语音数据后,将该语音数据发送至第二处理设备420的ARS模块4211进行语音识别得到文本数据,第二处理设备420将该文本数据反馈至第一处理设备410,以得到文本类型的待处理自然语言。
可以理解的是,本实施例中,第二语言处理系统用于对通用领域的自然语言进行处理,由于目前有较多第三方可提供实现该功能的语言处理系统或其中部分的功能模块。而不同第三方提供的处理系统或功能模块对于每次不同的自然语言的处理速度存在差异,故可在第二处理设备420中配置多个由不同第三方提供的第二语言处理系统,或者在第二语言处理系统中配置多个由不同第三方提供的用于实现同一功能的模块,将待处理自然语言交给该多个第二语言处理系统或实现同一功能的模块同步处理,并选择处理速度最快的系统或模块输出的处理结果。以ARS模块为例,在第二语言处理系统421中包括多个ARS模块,第一处理设备410将属于语音类型的待处理自然语言分别发送给第二语言处理系统421的多个ARS模块4211,以由该多个ARS模块4211同步进行文本语音转换,每个ARS模块4211在完成文本语音转换后将得到的文本数据反馈给第一处理设备410;由于每个ARS模块4211的处理速度各不相同,故其反馈时间也有先后顺序。第一处理设备410接收到其中一个ARS模块4211对属于语音类型的待处理自然语言进行语音识别得到的属于文本类型的待处理自然语言后,则确定文本语音转换步骤已完成,故再后续接收到的其他ARS模块4211发送的属于文本类型的待处理自然语言时,将其他ARS模块4211发送的属于文本类型的待处理自然语言丢弃处理。
S330:第一处理设备410判断待处理自然语言属于设定领域的内容还是通用领域的内容。若属于设定领域的内容,则执行S340,若属于通用领域的内容,则执行S350。
具体,步骤S330的具体说明可参考上述S120的相关描述,现在不做赘述。
S340:第一处理设备410通过其配置的第一语言处理系统411对待处理自然语言进行处理。
S350:第一处理设备410将待处理自然语言发送给第二语言处理系统421,以选择第二语言处理系统421对待处理自然语言进行处理。
具体地,该第一语言处理系统411包括第一NLU模块4112、第一DM模块4113和第一NLG模块4114。第二语言处理系统421包括第二NLU模块4212、第二DM模块4213、第二NLG模块4214以及TTS模块4215,其中,第一语言处理系统411和第二语言处理系统421均通过TTS模块4215实现将对待处理自然语言进行处理得到的文本数据转换成语音数据。可以理解的是,类似于上述ARS模块,第二语言处理系统中也可设置多个TTS模块,以由多个TTS模块同步对文本数据转换成语音数据,并选取最后完成转换的TTS模块转换的语言数据发送给智能家居设备。另外,在其他实施例中,第一语言处理系统411和第二语言处理系统421也可分别设有TTS模块,以使得不同语言处理系统的TTS分别负责所在系统的文本数据转换成语音数据。
第一语言处理系统411的自然语言处理过程包括:通过第一NLU模块4112对设定领域的待处理自然语言进行语义理解,得到语义结果;通过第一DM模块4113生成与该语义结果匹配的执行命令和/或回复内容,若生成执行指令,则由第一处理设备410直接发送给智能家居设备430执行;若生成回复内容,则继续通过第一NLG模块4114将回复内容转换成自然语言,得到回复信息,再由第一处理设备410发送给第二处理设备420的TTS模块4215,由TTS模块4215将该回复信息从文本类型转换成语音类型后,再发送给智能家居设备430,使得智能家居设备430能够语音播放该回复信息。
第二语言处理系统421的自然语言处理过程包括:通过第二NLU模块4212对通用领域的待处理自然语言进行语义理解,得到语义结果;通过第二DM模块4213生成与该语义结果匹配的执行命令和/或回复内容,若生成执行指令,则由第二处理设备420直接发送给智能家居设备430执行;若生成回复内容,则继续通过第二NLG模块4214将回复内容转换成自然语言,得到回复信息,再由TTS模块4215将该回复信息从文本类型转换成语音类型后,再发送给智能家居设备430,使得智能家居设备430能够语音播放该回复信息。
本实施例中,自动语音识别(ARS)和文本语音转换(TTS)两部分由于不涉及特别敏感的数据,故可交给负责通用领域的第二语言处理系统来实现,故可降低负责设定领域的第一语言处理系统的工作内容,进而对于后续对第一语言处理系统的深度研究或改进,可降低其工作量。
可以理解的是,上述的第一处理设备和第二处理设备所执行的步骤可选择性集成在智能家居设备中,例如,上述第一语言处理系统和/或第二语言处理系统集成在智能家居设备中,以由智能家居设备能够自行实现对设定领域和/或通用领域的自然语言处理。
另外,上述提及的第一语言处理系统和第二语言处理系统中配置的各模块可以为不同的程序模块,也可为由不同电路实现的功能模块。
请参阅图5,图5是本申请处理设备一实施例的结构示意图。本实施例中,该处理设备50包括存储器51、处理器52和通信电路53。其中,通信电路53、存储器51分别耦接处理器52。具体地,处理设备50的各个组件可通过总线耦合在一起,或者处理设备50的处理器分别与其他组件一一连接。该处理设备50可以为上述服务器、智能家居设备等具有一定处理能力的设备。
通信电路53用于与其他设备通信。例如,当处理设备用于为智能设备如上述智能家居设备提供线上的自然语言处理功能时,通信电路53可与上述智能设备通信。
存储器51用于存储处理器52执行的程序指令以及处理器52在处理过程中的数据,其中,该存储器51包括非易失性存储部分,用于存储上述程序指令。
处理器52控制处理设备50的操作,处理器52还可以称为CPU(Central ProcessingUnit,中央处理单元)。处理器52可能是一种集成电路芯片,具有信号的处理能力。处理器52还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器52可以由多个成电路芯片共同实现。
在本实施例中,处理器52通过调用存储器51存储的程序指令,用于执行上述任一方法实施例方法的步骤。
例如,处理器52用于获取待处理自然语言;判断所述待处理自然语言属于设定领域的内容还是通用领域的内容;基于判断结果对应选择所述设定领域关联的第一语言处理系统521或所述通用领域关联的第二语言处理系统522,以对所述待处理自然语言进行处理。
在一些实施例中,处理器52执行所述基于判断结果对应选择所述设定领域关联的第一语言处理系统或所述通用领域关联的第二语言处理系统,以对所述待处理自然语言进行处理包括:响应于所述待处理自然语言属于设定领域的内容,选择所述第一语言处理系统对所述待处理自然语言进行处理;或响应于所述待处理自然语言属于通用领域的内容,选择所述第二语言处理系统对所述待处理自然语言进行处理。
本实施例中,该第一语言处理系统521和第二语言处理系统522均集成在处理器52中,也即第一语言处理系统521和第二语言处理系统522可以为处理器52中的不同程序模块。
在其他实施例中,第一语言处理系统和第二语言处理系统分设在不同设备上。例如,所述第一语言处理系统521可设在处理设备50上,即该第一语言处理系统集成在处理器52中,其对预设领域的自然语言处理的功能由处理器52实现。所述第二语言处理系统522可设在其他设备上,例如由其他设备的处理器实现通用领域的自然语言处理的功能。
进一步地,在第一语言处理系统521设在处理设备50且第二语言处理系统522设在其他设备上的实施例中,处理器52执行所述响应于所述待处理自然语言属于通用领域的内容,选择所述第二语言处理系统对所述待处理自然语言进行处理包括:响应于所述待处理自然语言属于通用领域的内容,通过通信电路53将所述待处理自然语言发送给所述第二语言处理系统522,以选择所述第二语言处理系统522对所述待处理自然语言进行处理。
在一些实施例中,处理器52执行所述判断所述待处理自然语言属于设定领域的内容还是通用领域的内容,包括:利用预设分类模型对所述待处理自然语言进行分析,并基于分析结果确定所述待处理自然语言属于设定领域的内容还是通用领域的内容。
在一些实施例中,处理器52执行所述对所述待处理自然语言进行处理,包括:对所述待处理自然语言进行语义理解,得到语义结果;执行与所述语义结果匹配的响应。
进一步地,处理器52执行所述对所述待处理自然语言进行语义理解,得到语义结果,可以包括:对所述待处理自然语言进行槽位填充,得到槽位信息,其中,所述槽位信息用于表示所述待处理自然语言的语义结果。
在一些实施例中,处理器52执行所述获取待处理自然语言,包括:通过通信电路53接收智能设备发送的待处理自然语言;处理器52执行所述执行与所述语义结果匹配的响应,包括:生成与所述语义结果匹配的执行指令,并通过通信电路53将所述执行指令发送给所述智能设备,以由所述智能设备执行所述执行指令;和/或,生成与所述语义结果匹配的回复信息,并通过通信电路53将所述回复信息发送给所述智能设备,以由所述智能设备显示或语音播放所述回复信息。
其中,在所述选择所述第一语言处理系统对所述待处理自然语言进行处理的情况下,处理器52执行所述将所述回复信息发送给所述智能设备,以由所述智能设备语音播放所述回复信息,可以包括:通过通信电路53将包含所述回复信息的语音转换请求发送给所述第二语言处理系统,以请求所述第二语言处理系统将所述回复信息转换成语音数据并将所述语音数据发送至所述智能设备。
在一些实施例中,所述获取的待处理自然语言属于语音类型;在所述判断所述待处理自然语言属于设定领域的内容还是通用领域的内容之前,处理器52还用于:将所述待处理自然语言从所述语音类型转换成文本类型。
进一步地,处理器52执行所述将所述待处理自然语言从所述语音类型转换成文本类型,可以包括:通过通信电路53将属于语音类型的所述待处理自然语言发送给所述第二语言处理系统;通过通信电路53接收所述第二语言处理系统对属于语音类型的所述待处理自然语言进行语音识别得到的属于文本类型的所述待处理自然语言。
在一些实施例中,所述第二语言处理系统包括多个自动语音识别模块;处理器52执行所述通过通信电路53将属于语音类型的所述待处理自然语言发送给所述第二语言处理系统,包括:通过通信电路53将属于语音类型的所述待处理自然语言分别发送给所述第二语言处理系统的所述多个自动语音识别模块;处理器52执行所述通过通信电路53接收所述第二语言处理系统对属于语音类型的所述待处理自然语言进行语音识别得到的属于文本类型的所述待处理自然语言,包括:通过通信电路53接收到其中一个所述自动语音识别模块对属于语音类型的所述待处理自然语言进行语音识别得到的属于文本类型的所述待处理自然语言,并丢弃后续接收到的其他所述自动语音识别模块发送的属于文本类型的所述待处理自然语言。
可以理解的是,在另一实施例中,若第一语言处理系统和第二语言处理系统均集成在处理设备中,该处理设备可不包括通信电路。
请参阅图6,本申请还提供一种存储装置的实施例。本实施例中,该存储装置60存储有处理器可运行的程序指令61,该程序指令61用于执行上述实施例中的方法。
该存储装置60具体可以为U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储程序指令的介质,或者也可以为存储有该程序指令的服务器,该服务器可将存储的程序指令发送给其他设备运行,或者也可以自运行该存储的程序指令。
在一实施例中,存储装置60还可以为如图5所示的存储器。
请参阅图7,图7是本申请自然语言处理系统一实施例的结构示意图。本实施例中,该自然语言处理系统包括相互连接的智能家居设备71和处理设备72,其中,所述智能家居设备71用于获得用户输入的待处理自然语言,并将所述待处理自然语言发送给所述处理设备72;所述处理设备72为上述的能够与智能家居设备连接的处理设备,以对所述待处理自然语言进行处理。
其中,该智能家居设备可以为空调、冰箱、微波炉、音箱等家居电子设备,该处理设备可以为服务器、或与智能家居设备连接的其他设备,如路由器等。
在另一实施例中,该自然语言处理系统可如如4所示,具体请参考上面相关说明,在此不做赘述。
上述方案中,通过判断待处理自然语言属于设定领域或是通用领域的内容,并基于判断结果选择设定领域关联的第一语言处理系统或通用领域关联的第二语言处理系统对待处理自然语言进行处理,故既可对通用领域自然语言进行处理,也可对设定领域自然语言进行处理,实现了通用领域场景和设定领域场景并存,且相比于采用通用领域的语言处理系统,采用专门针对该设定领域的第一语言处理系统进行自然语言处理,能够提高对设定领域自然语言的处理准确率。另外,通用领域的第二语言处理系统一般是由第三方提供,通过将设定领域的自然语言交与独立的第一语言处理系统进行处理,故关于该设定领域的相关数据均仅需提供给该第一语言处理系统,无需提供给通用领域的第二语言处理系统,可避免设定领域的敏感数据通过通用领域的第三方泄露,保证信息安全,而且可通过专门对第一语言处理系统进行研究改进,实现对设定领域的日益准确的自然语言处理。另外,若第三方提供的通用领域的第二语言处理系统出现问题,也可直接更换的新第二语言处理系统,无需考虑提供设定领域的相关数据而重新构建新第二语言处理系统,如与第三方的弱耦合。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (15)
1.一种自然语言处理方法,其特征在于,包括:
处理设备获取待处理自然语言;
判断所述待处理自然语言属于设定领域的内容还是通用领域的内容;
基于判断结果对应选择所述设定领域关联的第一语言处理系统或所述通用领域关联的第二语言处理系统,以对所述待处理自然语言进行处理;
其中,所述基于判断结果对应选择所述设定领域关联的第一语言处理系统或所述通用领域关联的第二语言处理系统,以对所述待处理自然语言进行处理,包括:
响应于所述待处理自然语言属于设定领域的内容,选择所述第一语言处理系统对所述待处理自然语言进行处理;
响应于所述待处理自然语言属于通用领域的内容,选择所述第二语言处理系统对所述待处理自然语言进行处理;
其中,所述第一语言处理系统与所述第二语言处理系统为两个独立的语言处理系统,并设置在不同设备中或者设置在同一设备中的两个不同的处理电路。
2.根据权利要求1所述的方法,其特征在于,所述第一语言处理系统设在所述处理设备上,所述第二语言处理系统设在其他设备上;
所述响应于所述待处理自然语言属于通用领域的内容,选择所述第二语言处理系统对所述待处理自然语言进行处理,包括:
响应于所述待处理自然语言属于通用领域的内容,将所述待处理自然语言发送给所述第二语言处理系统,以选择所述第二语言处理系统对所述待处理自然语言进行处理。
3.根据权利要求1所述的方法,其特征在于,所述判断所述待处理自然语言属于设定领域的内容还是通用领域的内容,包括:
利用预设分类模型对所述待处理自然语言进行分析,并基于分析结果确定所述待处理自然语言属于设定领域的内容还是通用领域的内容。
4.根据权利要求1所述的方法,其特征在于,所述对所述待处理自然语言进行处理,包括:
对所述待处理自然语言进行语义理解,得到语义结果;
执行与所述语义结果匹配的响应。
5.根据权利要求4所述的方法,其特征在于,所述对所述待处理自然语言进行语义理解,得到语义结果,包括:
对所述待处理自然语言进行槽位填充,得到槽位信息,其中,所述槽位信息用于表示所述待处理自然语言的语义结果。
6.根据权利要求4所述的方法,其特征在于,
所述获取待处理自然语言,包括:
接收智能设备发送的待处理自然语言;
所述执行与所述语义结果匹配的响应,包括:
生成与所述语义结果匹配的执行指令,并将所述执行指令发送给所述智能设备,以由所述智能设备执行所述执行指令;和/或
生成与所述语义结果匹配的回复信息,并将所述回复信息发送给所述智能设备,以由所述智能设备显示或语音播放所述回复信息。
7.根据权利要求6所述的方法,其特征在于,在所述选择所述第一语言处理系统对所述待处理自然语言进行处理的情况下,所述将所述回复信息发送给所述智能设备,以由所述智能设备语音播放所述回复信息,包括:
将包含所述回复信息的语音转换请求发送给所述第二语言处理系统,以请求所述第二语言处理系统将所述回复信息转换成语音数据并将所述语音数据发送至所述智能设备。
8.根据权利要求1所述的方法,其特征在于,所述获取的待处理自然语言属于语音类型;
在所述判断所述待处理自然语言属于设定领域的内容还是通用领域的内容之前,还包括:
将所述待处理自然语言从所述语音类型转换成文本类型。
9.根据权利要求8所述的方法,其特征在于,所述将所述待处理自然语言从所述语音类型转换成文本类型,包括:
将属于语音类型的所述待处理自然语言发送给所述第二语言处理系统;
接收所述第二语言处理系统对属于语音类型的所述待处理自然语言进行语音识别得到的属于文本类型的所述待处理自然语言。
10.根据权利要求9所述的方法,其特征在于,所述第二语言处理系统包括多个自动语音识别模块;
所述将属于语音类型的所述待处理自然语言发送给所述第二语言处理系统,包括:
将属于语音类型的所述待处理自然语言分别发送给所述第二语言处理系统的所述多个自动语音识别模块;
所述接收所述第二语言处理系统对属于语音类型的所述待处理自然语言进行语音识别得到的属于文本类型的所述待处理自然语言,包括:
接收到其中一个所述自动语音识别模块对属于语音类型的所述待处理自然语言进行语音识别得到的属于文本类型的所述待处理自然语言,并丢弃后续接收到的其他所述自动语音识别模块发送的属于文本类型的所述待处理自然语言。
11.一种处理设备,其特征在于,包括相互耦接的存储器和处理器;其中,所述处理器用于执行所述存储器存储的程序指令实现权利要求1至10任一项所述的方法。
12.根据权利要求11所述的处理设备,其特征在于,第一语言处理系统和第二语言处理系统分设在不同设备上。
13.根据权利要求12所述的处理设备,其特征在于,所述第一语言处理系统设在所述处理设备上,所述第二语言处理系统设在其他设备上。
14.一种自然语言处理系统,其特征在于,包括相互连接的智能设备和处理设备,其中,
所述智能设备用于获得用户输入的待处理自然语言,并将所述待处理自然语言发送给所述处理设备;
所述处理设备为权利要求11至13任一项所述的处理设备,以对所述待处理自然语言进行处理。
15.一种存储装置,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811553507.4A CN111414760B (zh) | 2018-12-18 | 2018-12-18 | 自然语言处理方法及相关设备、系统和存储装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811553507.4A CN111414760B (zh) | 2018-12-18 | 2018-12-18 | 自然语言处理方法及相关设备、系统和存储装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111414760A CN111414760A (zh) | 2020-07-14 |
CN111414760B true CN111414760B (zh) | 2023-06-16 |
Family
ID=71490664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811553507.4A Active CN111414760B (zh) | 2018-12-18 | 2018-12-18 | 自然语言处理方法及相关设备、系统和存储装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111414760B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593573B (zh) * | 2021-07-30 | 2024-01-12 | 思必驰科技股份有限公司 | 机器交互方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102681982A (zh) * | 2012-03-15 | 2012-09-19 | 上海云叟网络科技有限公司 | 可让计算机理解的自然语言句子的自动语义识别的方法 |
CN106326307A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种语言交互方法 |
CN106383875B (zh) * | 2016-09-09 | 2019-10-15 | 北京百度网讯科技有限公司 | 基于人工智能的人机交互方法和装置 |
US10971157B2 (en) * | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
CN108038240A (zh) * | 2017-12-26 | 2018-05-15 | 武汉大学 | 基于内容、用户多因素分析的社交网络谣言检测方法 |
-
2018
- 2018-12-18 CN CN201811553507.4A patent/CN111414760B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111414760A (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020042993A1 (zh) | 语音控制方法、装置及系统 | |
CN107276864A (zh) | 智能语音设备控制家电的方法、装置及系统 | |
CN110557451B (zh) | 对话交互处理方法、装置、电子设备和存储介质 | |
US11404052B2 (en) | Service data processing method and apparatus and related device | |
CN205508398U (zh) | 具有云端交互功能的智能机器人 | |
CN107195305A (zh) | 一种信息处理方法及电子设备 | |
CN112634897B (zh) | 设备唤醒方法、装置和存储介质及电子装置 | |
CN113053369A (zh) | 智能家电的语音控制方法及装置、智能家电 | |
CN112767916B (zh) | 智能语音设备的语音交互方法、装置、设备、介质及产品 | |
CN113840040B (zh) | 一种人机协作的外呼方法、装置、设备及存储介质 | |
CN111131005A (zh) | 一种客服系统的对话方法及装置、设备、存储介质 | |
CN112382279B (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN106653020A (zh) | 一种基于深度学习的智慧视听设备多业务控制方法及系统 | |
CN108897517B (zh) | 一种信息处理方法及电子设备 | |
CN113921004A (zh) | 智能设备控制方法、装置、存储介质和电子设备 | |
WO2017172655A1 (en) | Analysis of a facial image to extract physical and emotional characteristics of a user | |
CN110262278B (zh) | 智能家电设备的控制方法及装置、智能电器设备 | |
CN112037785A (zh) | 智能设备的控制方法、装置、电子设备及存储介质 | |
CN111414760B (zh) | 自然语言处理方法及相关设备、系统和存储装置 | |
CN116013257A (zh) | 语音识别、语音识别模型训练方法、装置、介质及设备 | |
KR102599948B1 (ko) | 전자 장치 및 그의 와이파이 연결 방법 | |
CN110493120B (zh) | 一种用于发送设备操作指令的方法与设备 | |
CN112420043A (zh) | 基于语音的智能唤醒方法、装置、电子设备及存储介质 | |
CN116566760A (zh) | 智能家居设备控制方法、装置、存储介质及电子设备 | |
CN113223510B (zh) | 冰箱及其设备语音交互方法、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |