CN112201250A - 一种语义分析方法、装置、电子设备及存储介质 - Google Patents
一种语义分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112201250A CN112201250A CN202011061493.1A CN202011061493A CN112201250A CN 112201250 A CN112201250 A CN 112201250A CN 202011061493 A CN202011061493 A CN 202011061493A CN 112201250 A CN112201250 A CN 112201250A
- Authority
- CN
- China
- Prior art keywords
- intention
- fields
- semantic analysis
- field
- character information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000004044 response Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 16
- 230000009471 action Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000475 sunscreen effect Effects 0.000 description 1
- 239000000516 sunscreening agent Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例涉及语音识别领域,公开了一种语义分析方法、装置、电子设备及存储介质。语义分析方法包括:对文字信息实时识别,得到相关的意图领域;实时识别为由语音指令每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;判断相关的意图领域的个数;若相关的意图领域的个数大于N,确定有效意图领域;根据有效意图领域进行语义解析。本发明实施例中,对文字信息实时识别,能够提高语义识别过程中的对多意图的识别效率,更完整的收集到用户意图领域;对于识别出的意图领域数量过多的情况,通过对意图领域进行判断,确定有效意图领域,使得语义解析更集中于用户意图。
Description
技术领域
本发明实施例涉及语音识别领域,特别涉及语义分析。
背景技术
智能设备如今的发展与用户生活息息相关,相对于按键、触摸、遥控等动作式指令,采用语音信号指令成为智能设备控制的一大趋势,使用语音指令更方便快捷。
目前市面上的智能语音系统或智能语音类产品,在解析语音指令时往往需要指令具备简洁意图,实际上,用户在日常沟通时,往往涉及多种意图。针对长句子或有多种意图的语音指令,现有技术并无法准确执行语义分析,由于多意图语音指令信息量过大,存在无法完整识别或口语化冗余语音指令产生干扰的情况,经常解析失败或解析错误。
发明内容
本发明实施方式的目的在于提供一种语义分析方法、装置、电子设备及存储介质,使得能够准确识别用户语音指令中的多种意图。
为解决上述技术问题,本发明的实施方式提供了一种语义分析方法,包括以下步骤:
获取语音指令;
将所述语音指令实时转化为文字信息;
对所述文字信息实时识别,得到相关的意图领域;所述实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
判断所述相关的意图领域的个数;
根据所述判断结果,执行对应的步骤;其中,若所述相关的意图领域的个数小于或等于N,根据所述相关的意图领域进行语义解析;若所述相关的意图领域的个数大于所述N,确定有效意图领域;根据所述有效意图领域进行语义解析,所述N为大于1的自然数。
本发明的实施方式还提供了一种语义分析装置,包括:
接收模块:获取语音指令;
转化模块:将所述语音指令实时转化为文字信息;
识别模块:对所述文字信息实时识别,得到相关的意图领域;所述实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
判断模块:判断所述相关的意图领域的个数;
解析模块:根据所述判断结果,执行对应的步骤;其中,若所述相关的意图领域的个数小于或等于N,根据所述相关的意图领域进行语义解析;若所述相关的意图领域的个数大于所述N,确定有效意图领域;根据所述有效意图领域进行语义解析,所述N为大于1的自然数。
本发明的实施方式还提供了一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的语义分析方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的语义分析方法。
在本发明实施方式中,将语音指令实时转为文字信息,并对文字信息进行实时识别,能够提高长句或多层语义识别过程中的对意图领域的识别效率,更完整的收集到用户表达包含的意图领域;对于识别出的意图领域数量过大,明显超出日常表达习惯的情况,通过对意图领域进行判断确定有效意图领域,去除无意义的冗余的意图领域,使得语义解析更集中于用户意图,结果更准确,提升用户体验。
另外,对已转化的所有的文字信息进行一次识别,包括:对所述已转化的所有的文字信息进行多层识别,得到相关的意图领域;所述多层识别为优先识别动词,次优先识别名词;所述相关的意图领域包括,所述各动词分别对应的意图领域和所述各名词分别对应的意图领域。采用多层识别方式,降低对于系统并发能力的需求,使得本语义分析方式的执行实现实时解析的响应能力。
另外,所述对所述已转化的所有的文字信息进行多层识别,得到相关的意图领域,包括:根据预设词槽对所述已转化的所有的文字信息优先识别所述动词,得到各所述动词分别对应的意图领域;根据预设词槽和预设句式对所述已转化的所有的文字信息识别所述名词,得到各所述名词分别对应的意图领域。
另外,所述根据预设词槽和预设句式对所述已转化的所有的文字信息识别所述名词,得到各所述名词分别对应的意图领域,包括:根据预设词槽和预设句式对所述已转化的所有的文字信息识别所述名词,得到各所述名词的识别结果;根据各所述名词的识别结果和通过屏幕内容获取到的关键字,得到各所述名词分别对应的意图领域。对于带屏幕的电子设备,结合屏幕端显示的信息进行意图领域的判断,使得语义解析结果更接近于用户所想表达的目的。
另外,所述若所述相关的意图领域的个数大于N,确定有效意图领域,包括:计算各意图领域对应权重;若所述意图领域对应权重的计算结果大于预设阈值,则为有效意图领域。对于意图领域是否有效的判断过程,引入权重公式进行筛选,去除用户表达中冗余的意图领域,得到更符合用户所处语境的相关的意图领域,提高语义识别结果的有效性。
另外,所述计算各意图领域对应权重,包括:根据以下权重公式计算各意图领域对应权重:权重=x*主语加权系数+y*形容词加权系数+z*意图领域与语境的关联系数;其中,x为当前主语明确程度/句子其他名词明确程度,y为当前形容词明确程度/句子其他形容词明确程度,z为用户最近的预设时间内使用所述意图领域的权重均值z1和时长均值z2的乘积,所述主语加权系数和所述形容词加权系数为预置数值,所述明确程度为可识别出所述语境的程度。该公式为所有相关的意图领域判断是否有效这一过程提供了统一标准,得到最符合用户语境的相关的意图领域,使得语义解析结果更准确。
另外,所述将所述语音指令实时转化为文字信息,包括:将所述语音指令结合预置的高频关键词,实时转化为所述文字信息,以便提高语音转文字过程的效率和准确程度。
另外,所述对所述文字信息实时识别,得到相关的意图领域之前,还包括:若所述文字信息与预存指令相匹配,则执行与所述预存指令对应的预存应答,并结束本次语义分析任务;若所述文字信息与预存指令不匹配,则执行所述对所述文字信息实时识别,得到相关的意图领域。由于预先设置了预存指令和与预存指令对应的预存应答,使得在文字信息和预存指令匹配时,可以直接执行预存应答,无需再经过语义识别过程,从而减少了不必要的系统运行,提高了任务执行效率。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明第一实施方式提供的语义识别方法的流程图;
图2是根据本发明第二实施方式提供的语义识别方法的流程图;
图3是根据本发明第三实施方式提供的语义识别方法的流程图;
图4是根据本发明第四实施方式提供的语义识别装置的示意图;
图5是根据本发明第五实施方式提供的电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种语义分析方法,具体流程如图1所示。
步骤101:获取语音指令;
步骤102:将语音指令实时转化为文字信息;
步骤103:对文字信息实时识别,得到相关的意图领域;实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
步骤104:判断相关的意图领域的个数是否大于N,若相关的意图领域的个数小于或等于N,执行步骤106;若相关的意图领域的个数大于N,则执行步骤105;
步骤105:确定有效意图领域,并根据有效意图领域进行语义解析;
步骤106:根据相关的意图领域进行语义解析。
具体的,本发明的实施方式主要由电子设备执行,每实时收到一个新转化的文字信息就对已转化的所有文字信息进行识别,保留每次识别得到的相关的技能领域。若用户发送的语音指令过长,超过可识别阈值后的语音指令无法完整识别,仍能够利用已保留的相关的技能领域进行语义解析,克服现有技术中由于语音指令超过可识别阈值,无法进行语义解析的状况。同时依据研究,日常表达涉及的有效意图领域在一定数量范围内,所以电子设备在识别得到所有用户语音指令中相关的技能领域后,对其个数执行判断,若超过日常表达的数量范围,则去除冗余的意图领域,冗余包括由于情绪犹豫或重复表述的口语化信息,得到有效的意图领域,将语义解析范围集中于有效技能领域,使得解析过程更能准确得到用户表达的目的。
下面对本实施方式的语义分析方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
对于步骤101,设备端接收用户的语音指令。
对于步骤102,将获取的语音指令结合预置的高频关键词,实时转化为文字信息。例如,习惯使用商务表述的用户预置的高频关键词之一为“单价”,同发音情况下不会识别为“担架”。从而提高对于语音指令转文字信息的准确程度,更符合用户使用习惯。
对于步骤103,将步骤102转化得到的文字信息进行实时识别,得到相关的意图领域;实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域。例如,用户说“播放音乐之声”,会依次按照“播”、“播放”、“播放音”、“播放音乐”、“播放音乐之”、“播放音乐之声”顺序,分别对不同阶段已转化的所有文字进行一次识别,保留识别到的“播放”对应的意图领域为“资源播放”,识别到“播放音乐”时添加意图领域“音频”,识别到“播放音乐之声”时添加意图领域“影视”。在一个例子中,对已转化的所有的文字信息进行一次识别,包括:对已转化的所有的文字信息进行多层识别,得到相关的意图领域;多层识别为优先识别动词,次优先识别名词;相关的意图领域包括,各动词分别对应的意图领域和各名词分别对应的意图领域。依据先动词后名词的识别顺序,能够有效减少对系统并发执行能力的需求,并且符合日常表述指令的习惯。如果该语音指令中无动词,则可直接识别名词。其中,根据预设词槽对已转化的所有的文字信息优先识别动词,得到各动词分别对应的意图领域;根据预设词槽和预设句式对已转化的所有的文字信息识别名词,得到各名词分别对应的意图领域。
对于步骤104,执行对上述由实时识别得到的技能领域的个数进行判断的操作,若个数过多,会超出语义解析过程的最佳范围,增大语义解析过程的复杂程度。同时,识别到的技能领域的个数超出日常表达范围,意味着所识别到的相关的技能领域中存在冗余无效的技能领域,需要进行筛选。基于前述理由,设置N为3,符合实际使用习惯。
对于步骤105,针对执行数量判断后,技能领域的数量超过预设值的情况进行处理,根据权重公式计算各意图领域对应权重;若意图领域对应权重的计算结果大于预设阈值,则为有效意图领域。可以筛除冗余无效的意图领域。在一个例子中,计算公式为:权重=x*主语加权系数+y*形容词加权系数+z*意图领域与语境的关联系数;其中,x为当前主语明确程度/句子其他名词明确程度,y为当前形容词明确程度/句子其他形容词明确程度,z为用户最近的预设时间内使用意图领域的权重均值z1和时长均值z2的乘积,主语加权系数和形容词加权系数为预置数值,意图领域与语境的关联系数存在预置数据库,在得到意图领域后可以调用该对应的关联系数,明确程度为可识别出语境的程度。例如,语境为天气时对x进行计算,当前主语“雷阵雨”表达明确,可识别出语境为天气的程度是0.9;句子其他名词“防晒霜”识别出语境为“天气”的程度是0.7,这时说明当前主语更加明确,所以增加当前意图领域所占权重。该权重计算公式为所有相关的意图领域判断是否有效这一过程提供了统一标准,若预设阈值为0.8,即计算结果超过0.8的意图领域为该语境下的有效意图领域,筛除计算结果小于或等于0.8的冗余意图领域,得到最符合用户表达的相关的意图领域,使得语义解析结果更准确。
在一个例子中,若步骤105执行语义解析过程完成后,结果为解析失败,并且根据预设对应关系判断该结果是由于用户语音指令中提供的关键信息不足所导致,则将缺失关键信息的反馈发送至用户端,等待用户补充关键信息后再次进行语义识别。进行信息的多轮交互来获取可以完成准确识别的用户指令,提高语义解析准确率。
本实施例中,采用语音指令实时转为文字信息,并对文字信息进行实时识别,能够提高长句或多层语义识别过程中的对意图领域的识别效率,更完整的收集到用户表达包含的意图领域;对于识别出的意图领域数量过大,明显超出日常表达习惯的情况,通过对意图领域进行判断确定有效意图领域,去除无意义的冗余的意图领域,使得语义解析更集中于用户意图,结果更准确,提升用户体验。
本发明的第二实施方式涉及一种语义分析方法,主要应用于用户设备带屏幕的情况,具体流程如图2所示。
步骤201:获取语音指令;
步骤202:将语音指令实时转化为文字信息;
步骤203:对文字信息结合屏幕内容进行实时识别,得到相关的意图领域;实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
步骤204:判断相关的意图领域的个数是否大于N,若相关的意图领域的个数小于或等于N,执行步骤206;若相关的意图领域的个数大于N,则执行步骤205;
步骤205:确定有效意图领域;根据有效意图领域进行语义解析;
步骤206:根据相关的意图领域进行语义解析。
本实施方式中的步骤201至202,步骤204至205与第一实施方式大致相同,不再赘述。下面对本实施方式的步骤203进行具体说明。
针对于用户设备带屏幕的情况,在一个例子中,对步骤202中已转化的文字信息结合屏幕内容进行实时识别,实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域。在执行对已转化的所有的文字信息进行一次识别时,根据预设词槽对已转化的所有的文字信息优先识别动词,得到各动词分别对应的意图领域,根据预设词槽和预设句式对已转化的所有的文字信息识别名词,得到各名词的识别结果;根据各名词的识别结果和通过屏幕内容获取到的关键字,得到各名词对应的意图领域,实现所见即所得效果。屏幕端会根据实时的播放内容,查询预置数据库中播放内容和关键字的对应关系,得到通过屏幕内容获取到的关键字。例如用户指令为“播放电视剧的主题曲”,只识别语音指令对于“电视剧”会存在多种结果,但若用户设备正在播放电视剧三国演义,结合屏幕内容会得到“三国演义”关键字,达到为后续语义识别过程提供更准确的意图领域的目的。
本发明的第三实施方式涉及一种语义分析方法,具体流程如图3所示。
步骤301:获取语音指令;
步骤302:将语音指令实时转化为文字信息;
步骤303:判断文字信息是否与预存指令匹配;若文字信息与预存指令相匹配,则执行步骤304;若文字信息与预存指令不匹配,则执行步骤305;
步骤304:执行与预存指令对应的预存应答,并结束本次语义分析任务;
步骤305:对文字信息实时识别,得到相关的意图领域;实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
步骤306:判断相关的意图领域的个数是否大于N,若相关的意图领域的个数小于或等于N,执行步骤308;若相关的意图领域的个数大于N,则执行步骤307;
步骤307:确定有效意图领域;根据有效意图领域进行语义解析;
步骤308:根据相关的意图领域进行语义解析。
本实施方式中的步骤301至202,步骤305至308与第一实施方式大致相同,不再赘述。下面对本实施方式的步骤303和步骤304进行具体说明。
在步骤303中,支持用户预存问答对,问答对为预存指令和与预存指令对应的预存应答,对于步骤302中由语音指令得到的文字信息,在文字信息和预存指令完成匹配后,进入步骤304执行预存指令对应的预存应答,不经过语义识别。例如,预存指令为“我回来了”对应的预存应答为:语音回复“欢迎回家”,不需要对“我回来了”指令执行意图领域的判断和语义解析,识别到此预存指令直接执行预存应答即可。对与预存指令不匹配的文字信息进入步骤305执行后续的语义识别过程,能够在准确执行用户语音指令的同时,减少不必要的系统运行,提高任务执行效率。
此外,本领域技术人员可以理解,上述区别步骤与第二实施例并不冲突,可以结合执行。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第四实施方式涉及一种语义分析装置,如图4所示,包括:
接收模块401:获取语音指令;
转化模块402:将语音指令实时转化为文字信息;
识别模块403:对文字信息实时识别,得到相关的意图领域;实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
判断模块404:判断相关的意图领域的个数;
解析模块405:根据判断结果,执行对应的步骤;其中,若相关的意图领域的个数小于或等于N,根据相关的意图领域进行语义解析;若相关的意图领域的个数大于N,确定有效意图领域;根据有效意图领域进行语义解析,N为大于1的自然数。
在一个例子中,转化模块402具体用于将接收模块401得到的语音指令结合预置的高频关键词,实时转化为文字信息。
在一个例子中,语义分析装置还包括匹配模块(图中未示出),用于将文字信息与预存指令相匹配,若所述文字信息与预存指令相匹配,则执行与预存指令对应的预存应答,并结束本次语义分析任务;若文字信息与预存指令不匹配,则执行后续的语义解析步骤。
在一个例子中,识别模块403具体用于在对已转化的所有的文字信息进行一次识别时,对已转化的所有的文字信息进行多层识别,得到相关的意图领域;多层识别为优先识别动词,次优先识别名词;相关的意图领域包括,各动词分别对应的意图领域和各名词分别对应的意图领域。
另外,对已转化的所有的文字信息进行多层识别,得到相关的意图领域,包括:根据预设词槽对已转化的所有的文字信息优先识别动词,得到各动词分别对应的意图领域;根据预设词槽和预设句式对已转化的所有的文字信息识别名词,得到各名词分别对应的意图领域。
其中,根据预设词槽和预设句式对已转化的所有的文字信息识别名词,得到各名词分别对应的意图领域,包括:根据预设词槽和预设句式对已转化的所有的文字信息识别名词,得到各名词的识别结果;根据各名词的识别结果和通过屏幕内容获取到的关键字,得到各名词分别对应的意图领域。
在一个例子中,解析模块405具体用于在相关的意图领域的个数大于N时,计算各意图领域对应权重;若意图领域对应权重的计算结果大于预设阈值,则为有效意图领域。例如:根据权重公式计算各意图领域对应权重:权重=x*主语加权系数+y*形容词加权系数+z*意图领域与语境的关联系数;其中,x为当前主语明确程度/句子其他名词明确程度,y为当前形容词明确程度/句子其他形容词明确程度,z为用户最近的预设时间内使用意图领域的权重均值z1和时长均值z2的乘积,主语加权系数和形容词加权系数为预置数值,明确程度为可识别出语境的程度。
不难发现,本实施方式为与上述实施方式相对应的装置实施例,本实施方式可与上述实施方式互相配合实施。上述实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在上述实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第五实施方式涉及一种电子设备,如图5所示,包括至少一个处理器501;以及,
与至少一个处理器通信连接的存储器502;其中,
存储器502存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的语义分析方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第六实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (11)
1.一种语义分析方法,其特征在于,包括:
获取语音指令;
将所述语音指令实时转化为文字信息;
对所述文字信息实时识别,得到相关的意图领域;所述实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
判断所述相关的意图领域的个数;
根据所述判断结果,执行对应的步骤;其中,若所述相关的意图领域的个数小于或等于N,根据所述相关的意图领域进行语义解析;若所述相关的意图领域的个数大于所述N,确定有效意图领域;根据所述有效意图领域进行语义解析;所述N为大于1的自然数。
2.根据权利要求1所述的语义分析方法,其特征在于,所述对已转化的所有的文字信息进行一次识别,包括:
对所述已转化的所有的文字信息进行多层识别,得到相关的意图领域;所述多层识别为优先识别动词,次优先识别名词;所述相关的意图领域包括,各所述动词分别对应的意图领域和各所述名词分别对应的意图领域。
3.根据权利要求2所述的语义分析方法,其特征在于,所述对所述已转化的所有的文字信息进行多层识别,得到相关的意图领域,包括:
根据预设词槽对所述已转化的所有的文字信息优先识别所述动词,得到各所述动词分别对应的意图领域;
根据预设词槽和预设句式对所述已转化的所有的文字信息识别所述名词,得到各所述名词分别对应的意图领域。
4.根据权利要求3所述的语义分析方法,其特征在于,所述根据预设词槽和预设句式对所述已转化的所有的文字信息识别所述名词,得到各所述名词分别对应的意图领域,包括:
根据预设词槽和预设句式对所述已转化的所有的文字信息识别所述名词,得到各所述名词的识别结果;
根据各所述名词的识别结果和通过屏幕内容获取到的关键字,得到各所述名词分别对应的意图领域。
5.根据权利要求1所述的语义分析方法,其特征在于,所述若所述相关的意图领域的个数大于N,确定有效意图领域,包括:
计算各意图领域对应权重;
若所述意图领域对应权重的计算结果大于预设阈值,则为有效意图领域。
6.根据权利要求5所述的语义分析方法,其特征在于,所述计算各意图领域对应权重,包括:根据以下权重公式计算各意图领域对应权重:
权重=x*主语加权系数+y*形容词加权系数+z*意图领域与语境的关联系数;
其中,x为当前主语明确程度/句子其他名词明确程度,y为当前形容词明确程度/句子其他形容词明确程度,z为用户最近的预设时间内使用所述意图领域的权重均值z1和时长均值z2的乘积,所述主语加权系数和所述形容词加权系数为预置数值,所述明确程度为可识别出所述语境的程度。
7.根据权利要求1至6中任一项所述的语义分析方法,其特征在于,所述将所述语音指令实时转化为文字信息,包括:
将所述语音指令结合预置的高频关键词,实时转化为所述文字信息。
8.根据权利要求1至6中任一项所述的语义分析方法,其特征在于,所述对所述文字信息实时识别,得到相关的意图领域之前,还包括:
若所述文字信息与预存指令相匹配,则执行与所述预存指令对应的预存应答,并结束本次语义分析任务;
若所述文字信息与预存指令不匹配,则执行所述对所述文字信息实时识别,得到相关的意图领域。
9.一种语义分析装置,其特征在于,包括:
接收模块:获取语音指令;
转化模块:将所述语音指令实时转化为文字信息;
识别模块:对所述文字信息实时识别,得到相关的意图领域;所述实时识别为每新转化一个单位文字信息,对已转化的所有的文字信息进行一次识别,保留每次识别得到的相关的意图领域;
判断模块:判断所述相关的意图领域的个数;
解析模块:根据所述判断结果,执行对应的步骤;其中,若所述相关的意图领域的个数小于或等于N,根据所述相关的意图领域进行语义解析;若所述相关的意图领域的个数大于所述N,确定有效意图领域;根据所述有效意图领域进行语义解析,所述N为大于1的自然数。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的语义分析方法。
11.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的语义分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011061493.1A CN112201250B (zh) | 2020-09-30 | 2020-09-30 | 一种语义分析方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011061493.1A CN112201250B (zh) | 2020-09-30 | 2020-09-30 | 一种语义分析方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112201250A true CN112201250A (zh) | 2021-01-08 |
CN112201250B CN112201250B (zh) | 2024-03-19 |
Family
ID=74013128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011061493.1A Active CN112201250B (zh) | 2020-09-30 | 2020-09-30 | 一种语义分析方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112201250B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090089044A1 (en) * | 2006-08-14 | 2009-04-02 | Inquira, Inc. | Intent management tool |
JP2012003573A (ja) * | 2010-06-18 | 2012-01-05 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
CN109388793A (zh) * | 2017-08-03 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 实体标注方法、意图识别方法及对应装置、计算机存储介质 |
CN109508376A (zh) * | 2018-11-23 | 2019-03-22 | 四川长虹电器股份有限公司 | 可在线纠错更新的意图识别方法及装置 |
CN109543016A (zh) * | 2018-11-15 | 2019-03-29 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN110162685A (zh) * | 2019-04-29 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 信息搜索方法、装置、存储介质及电子设备 |
CN110162633A (zh) * | 2019-05-21 | 2019-08-23 | 深圳市珍爱云信息技术有限公司 | 语音数据意图确定方法、装置、计算机设备和存储介质 |
CN110276067A (zh) * | 2019-05-07 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 文本意图确定方法以及装置 |
KR20200006738A (ko) * | 2018-07-11 | 2020-01-21 | 현대자동차주식회사 | 대화 시스템 및 대화 처리 방법 |
US20200034431A1 (en) * | 2018-07-25 | 2020-01-30 | Baidu Online Network Technology (Bijing ) Co., Ltd. | Method, computer device and readable medium for user's intent mining |
CN111339781A (zh) * | 2020-02-10 | 2020-06-26 | 科大讯飞华南人工智能研究院(广州)有限公司 | 意图识别方法、装置、电子设备和存储介质 |
CN111427992A (zh) * | 2019-01-10 | 2020-07-17 | 华为技术有限公司 | 对话处理方法及设备 |
-
2020
- 2020-09-30 CN CN202011061493.1A patent/CN112201250B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090089044A1 (en) * | 2006-08-14 | 2009-04-02 | Inquira, Inc. | Intent management tool |
JP2012003573A (ja) * | 2010-06-18 | 2012-01-05 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
CN109388793A (zh) * | 2017-08-03 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 实体标注方法、意图识别方法及对应装置、计算机存储介质 |
KR20200006738A (ko) * | 2018-07-11 | 2020-01-21 | 현대자동차주식회사 | 대화 시스템 및 대화 처리 방법 |
US20200034431A1 (en) * | 2018-07-25 | 2020-01-30 | Baidu Online Network Technology (Bijing ) Co., Ltd. | Method, computer device and readable medium for user's intent mining |
CN109543016A (zh) * | 2018-11-15 | 2019-03-29 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN109508376A (zh) * | 2018-11-23 | 2019-03-22 | 四川长虹电器股份有限公司 | 可在线纠错更新的意图识别方法及装置 |
CN111427992A (zh) * | 2019-01-10 | 2020-07-17 | 华为技术有限公司 | 对话处理方法及设备 |
CN110162685A (zh) * | 2019-04-29 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 信息搜索方法、装置、存储介质及电子设备 |
CN110276067A (zh) * | 2019-05-07 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 文本意图确定方法以及装置 |
CN110162633A (zh) * | 2019-05-21 | 2019-08-23 | 深圳市珍爱云信息技术有限公司 | 语音数据意图确定方法、装置、计算机设备和存储介质 |
CN111339781A (zh) * | 2020-02-10 | 2020-06-26 | 科大讯飞华南人工智能研究院(广州)有限公司 | 意图识别方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112201250B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377716B (zh) | 对话的交互方法、装置及计算机可读存储介质 | |
KR100807307B1 (ko) | 대화형 음성 인터페이스 시스템 및 그 응답 방법 | |
CN110245221B (zh) | 训练对话状态跟踪分类器的方法和计算机设备 | |
CN108364650B (zh) | 语音识别结果的调整装置及方法 | |
EP1685556B1 (en) | Audio dialogue system and voice browsing method | |
CN108538294B (zh) | 一种语音交互方法及装置 | |
CN111326154B (zh) | 语音交互的方法、装置、存储介质及电子设备 | |
CN111161726B (zh) | 一种智能语音交互方法、设备、介质及系统 | |
CN111261151A (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN112116910A (zh) | 语音指令的识别方法和装置、存储介质、电子装置 | |
CN110211576B (zh) | 一种语音识别的方法、装置和系统 | |
WO2021239078A1 (zh) | 领域识别的方法、交互的方法、电子设备及存储介质 | |
CN112256229A (zh) | 人机语音交互方法、装置、电子设备及存储介质 | |
CN112201250A (zh) | 一种语义分析方法、装置、电子设备及存储介质 | |
CN111680514A (zh) | 信息处理和模型训练方法、装置、设备及存储介质 | |
CN112420034B (zh) | 语音识别的方法、系统、电子装置和存储介质 | |
CN115132170A (zh) | 语种分类方法、装置及计算机可读存储介质 | |
CN110428814B (zh) | 一种语音识别的方法及装置 | |
CN111930884A (zh) | 一种确定回复语句的方法、设备和人机对话系统 | |
CN111583956B (zh) | 语音处理方法和装置 | |
CN116844523B (zh) | 语音数据生成方法、装置、电子设备及可读存储介质 | |
CN111951795A (zh) | 语音交互方法、服务器、电子设备和存储介质 | |
CN115934920B (zh) | 针对人机对话的模型训练方法及相关装置 | |
CN111899729B (zh) | 一种语音模型的训练方法、装置、服务器和存储介质 | |
CN112559719A (zh) | 意图识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |