CN109285545A - 信息处理方法及装置 - Google Patents
信息处理方法及装置 Download PDFInfo
- Publication number
- CN109285545A CN109285545A CN201811289784.9A CN201811289784A CN109285545A CN 109285545 A CN109285545 A CN 109285545A CN 201811289784 A CN201811289784 A CN 201811289784A CN 109285545 A CN109285545 A CN 109285545A
- Authority
- CN
- China
- Prior art keywords
- identification information
- default
- trigger word
- intended
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 28
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000012512 characterization method Methods 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000008569 process Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000010008 shearing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 30
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000011469 building brick Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本公开是关于信息处理方法及装置。该方法包括:对接收到的语音信息进行识别,得到识别信息;确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。通过本公开,可在识别信息中有预设触发词时,将识别信息中表征待处理内容的部分自动作为纯文本信息进行处理,避免误对该待处理内容进行意图分析而影响整个语音信息的意图分析,以提高语音意图分析的准确率。
Description
技术领域
本公开涉及信息处理领域,尤其涉及信息处理方法及装置。
背景技术
目前,为了方便操作,常常会使用到终端的语音助手,例如:很多场景下,需要使用语音助手进行语音分析得到用户输入语音的各项意图,进而根据用户意图调起各种服务,但目前的语音意图分析的准确度较低,常常会错误解析用户意图,将用户本期望仅作为文本信息而不进行意图分析的文本强行进行意图分析,而且还分析错误从而导致执行调用该文本对应的某些应用的操作而干扰整个语音的意图分析的正确性。
发明内容
本公开实施例提供了信息处理方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种信息处理方法,包括:
对接收到的语音信息进行识别,得到识别信息;
确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。
在一个实施例中,确定所述识别信息中是否包含有预设触发词,包括:
确定所述识别信息中表征意图的文本,所述表征意图的文本包括表征意图的词和/或表征意图的短语;
将所述表征意图的文本与预先存储的预设触发词进行比对;
若存在至少一个表征意图的文本与任一预设触发词匹配,则确定所述识别信息中包含有预设触发词。
在一个实施例中,针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括:
针对包含有所述预设触发词的情况,按照预设句式结构对所述识别信息进行解析;
将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
在一个实施例中,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括以下至少一项:
当所述预设触发词表征的意图为记录时,将所述识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
当所述预设触发词表征的意图为删除时,从预设应用中确定所述识别信息中表征待处理内容的部分,并从预设应用中进行删除;
当所述预设触发词表征的意图为复制时,将所述识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
当所述预设触发词表征的意图为剪切时,从预设应用中确定所述识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,所述预设应用包括通过文本记录信息的应用。
在一个实施例中,对接收到的语音信息进行识别,得到识别信息,包括:
将接收到的语音信息进行文本转换,得到转换文本信息;
采用预设算法对所述转换文本信息进行语义识别,得到识别信息。根据本公开实施例的第二方面,提供一种信息处理装置,包括:
识别模块,用于对接收到的语音信息进行识别,得到识别信息;
确定模块,用于确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
处理模块,用于针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。
在一个实施例中,所述确定模块包括:
第一确定子模块,用于确定所述识别信息中表征意图的文本,所述表征意图的文本包括表征意图的词和/或表征意图的短语;
比对子模块,用于将所述表征意图的文本与预先存储的预设触发词进行比对;
第二确定子模块,用于若存在至少一个表征意图的文本与任一预设触发词匹配,则确定所述识别信息中包含有预设触发词。
在一个实施例中,所述处理模块包括:
解析子模块,用于针对包含有所述预设触发词的情况,按照预设句式结构对所述识别信息进行解析;
处理子模块,用于将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
在一个实施例中,所述处理模块包括以下至少一个子模块:
记录子模块,用于当所述预设触发词表征的意图为记录时,将所述识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
删除子模块,用于当所述预设触发词表征的意图为删除时,从预设应用中确定所述识别信息中表征待处理内容的部分,并从预设应用中进行删除;
复制子模块,用于当所述预设触发词表征的意图为复制时,将所述识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
剪切子模块,用于当所述预设触发词表征的意图为剪切时,从预设应用中确定所述识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,所述预设应用包括通过文本记录信息的应用。
在一个实施例中,所述识别模块包括:
转换子模块,用于将接收到的语音信息进行文本转换,得到转换文本信息;
识别子模块,用于采用预设算法对所述转换文本信息进行语义识别,得到识别信息。根据本公开实施例的第三方面,提供了一种信息处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
对接收到的语音信息进行识别,得到识别信息;
确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。根据本公开实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现第一方面实施例所述方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
由于预设触发词可用于指示:将待处理内容直接作为文本处理而并不需要再对该待处理内容进行意图分析,以避免意图解析错误,因而,通过确定识别信息中是否包含有预设触发词,可在识别信息中有预设触发词时,将识别信息中表征待处理内容的部分自动作为纯文本信息进行处理,避免误对该待处理内容进行意图分析而影响整个语音信息的意图分析,以提高语音意图分析的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种信息处理方法的流程图。
图2是根据一示例性实施例示出的另一种信息处理方法的流程图。
图3是根据一示例性实施例示出的又一种信息处理方法的流程图。
图4是根据一示例性实施例示出的一种信息处理装置的框图。
图5是根据一示例性实施例示出的另一种信息处理装置的框图。
图6是根据一示例性实施例示出的又一种信息处理装置的框图。
图7是根据一示例性实施例示出的一种适用于信息处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
目前,为了方便操作,常常会使用到终端的语音助手,例如:很多场景下,需要使用语音助手进行语音分析得到用户输入语音的各项意图,进而根据用户意图调起各种服务,但目前的语音意图分析的准确度较低,常常会错误解析用户意图,将用户本期望仅作为文本信息而不进行意图分析的文本进行意图分析,而且还分析错误导致执行调用该文本对应的某些应用的操作而干扰整个语音的意图分析的正确性。
例如:当用户输入的语音“帮我记一下今天天气不怎么样”后,语音助手进行意图分析后,可能会调起了本地天气,从而违背用户的真实意图;
又例如:当用户输入的语音“输入今天天气怎么样”时,语音助手进行意图分析后,往往会调起了本地天气,而用户实际想在当前光标处输入“今天天气怎么样”。
为了解决上述技术问题,本公开实施例提供了一种信息处理方法,该方法可用于信息处理程序、系统或装置中,且该方法对应的执行主体可以是手机、平板等终端,如图1所示,该方法包括步骤S101至步骤S103:
在步骤S101中,对接收到的语音信息进行识别,得到识别信息;
该识别信息主要包括文本信息,可能包括文字、标点符号、数字、字母等,同时对语音信息进行识别主要是进行词法、句法的分析。
而接收到的语音信息包括:通过终端的语音助手接收到的语音信息,同时为了提高识别信息的准确性,可预先使用海量的语音信息对语音助手进行训练。
在步骤S102中,确定识别信息中是否包含有预设触发词,其中,预设触发词表征的意图为不对下文中的待处理内容进行意图分析而直接将其进行文本处理(即将该待处理内容作为纯文本进行处理);
预设触发词可以是一个或者多个,且预设触发词可以是预先设置好的。
在步骤S103中,针对包含有预设触发词的情况,将识别信息中表征待处理内容的部分作为纯文本信息进行处理。
由于预设触发词可用于指示:将待处理内容直接作为文本处理而并不需要再对该待处理内容进行意图分析,以避免意图解析错误,因而,通过确定识别信息中是否包含有预设触发词,可在识别信息中有预设触发词时,将识别信息中表征待处理内容的部分自动作为纯文本信息进行处理,避免误对该待处理内容进行意图分析而影响整个语音信息的意图分析,以提高语音意图分析的准确率。
如图2所示,在一个实施例中,上述图1所示的步骤S102,即确定识别信息中是否包含有预设触发词,可以包括步骤S201至步骤S203:
在步骤S201中,确定识别信息中表征意图的文本,表征意图的文本包括表征意图的词和/或表征意图的短语;
在确定识别信息中表征意图的文本时,可将识别信息进行分词,然后逐词确定意图,以得到识别信息中所有表征意图的文本。
例如:当语音信息的识别信息为“帮我在记事本应用中记一下后天9点需要在携程上定飞往广州的飞机票”时,表征意图的文本为“帮我记一下”、“在携程上定飞机票”。
在步骤S202中,将表征意图的文本与预先存储的预设触发词进行比对;
在步骤S203中,若存在至少一个表征意图的文本与任一预设触发词匹配,则确定识别信息中包含有预设触发词(即识别信息中包括上述任一预设触发词),至少一个表征意图的文本为上述识别信息中表征意图的文本,而上述任一预设触发词为预先存储的预设触发词中的预设触发词。
通过将表征意图的文本与预先存储的预设触发词进行比对,可在存在至少一个表征意图的文本与任一预设触发词匹配时,说明表征意图的文本中存在上述任一预设触发词,因而,可自动确定识别信息中包含有预设触发词。
如图3所示,在一个实施例中,上述图1所示的步骤S103,即针对包含有预设触发词的情况,将识别信息中表征待处理内容的部分作为纯文本信息进行处理,可以包括:
在步骤S301中,针对包含有预设触发词的情况,按照预设句式结构对识别信息进行解析;
预设句式结构为由预设触发词构成的句式。
在选择预设句式结构时,可利用预设触发词在预存储的句式结构中选择该预设触发词对应的预设句式结构,以确保能够利用正确的句式结构对识别信息进行自动解析。
在步骤S302中,将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,预设句式结构包括识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分,即预设句式结构包括识别信息包含的预设触发词以及待处理内容。
预设句式结构可由预设触发词以及待处理内容构成,因而,可按照预设句式结构对识别信息进行解析,将解析得到的待处理内容的部分作为纯文本信息进行处理。在句式结构简单的情况下,可以将预设句式结构中除预设触发词之外的剩余内容作为待处理内容即可,以将待处理内容的部分作为纯文本信息进行处理而不用对待处理内容进行意图分析。
例如:预设触发词为“帮我记一下”时,该预设句式结构可以设计为“帮我记一下XX”,或者“XX帮我记一下”,这样,当识别信息为“帮我记一下今天天气怎么样”时,就会确定出“帮我记一下”这个预设触发词,同时,记录一个内容为“今天天气怎么样”的便签。
同样地,预设触发词为“输入”时,该预设句式结构可以设计为“输入XX”,或者“XX输入”,这样,当识别信息为“输入今天天气怎么样”时,就会确定出“输入”这个预设触发词,同时,输入文本“今天天气怎么样”。
最后,可以为用户提供预设触发词以及预设句式结构设置接口,使用户根据自身的表达习惯对预设触发词以及预设句式结构进行设置;还可以允许用户输入句式修改指令,以根据该句式修改指令,对文本触发词对应的预设句式结构进行修改,从而使得预存储的预设句式结构更加符合用户习惯或要求,如此,能够进一步提高语音识别正确率。
在一个实施例中,将识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括以下至少一项:
当预设触发词表征的意图为记录时,将识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
当预设触发词表征的意图为删除时,从预设应用中确定识别信息中表征待处理内容的部分,并从预设应用中进行删除;
当预设触发词表征的意图为复制时,将识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
当预设触发词表征的意图为剪切时,从预设应用中确定识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置,其中,该预设位置可以是预设应用中默认的位置,或者为用户指定的预设应用中某指定位置;
其中,预设应用包括通过文本记录信息的应用,如便签应用、备忘录应用、记事本应用、日历等。
在将识别信息中表征待处理内容的部分作为纯文本信息进行处理时,可根据预设触发词的具体表征的意图对待处理内容按照上述方式进行处理,以避免误对该待处理内容进行意图分析而影响整个语音的意图解析,从而提高语音意图解析的准确率。
在一个实施例中,对接收到的语音信息进行识别,得到识别信息,包括:
将接收到的语音信息进行文本转换,得到转换文本信息;
采用预设算法对转换文本信息进行语义识别,得到识别信息。
上述预设算法可以是自然语言处理(NLP,Natural Language Processing),相关算法,即人工智能(AI)的一个子领域技术。
下面将举例进一步说明本公开的技术方案:
当接收到的语音信息对应的识别信息为“帮我在记事本应用中记一下后天9点需要在携程上定飞往广州的飞机票”时,该识别信息中表征意图的文本为“帮我记一下”、“在携程上定飞机票”这两个个关键词,而由于有2个可表征用户意图的关键词,因而,为了降低意图分析错误的概率,则需要确定该识别信息中是否有预设触发词。
具体地,如果预先设定了“帮我在XX应用中记一下”为文本触发词,且其对应的预设句式结构为[帮我在XX应用中记一下][YY],则将上述2个表征意图的文本与预存储的文本触发词进行比对后,就可确定该识别信息中具有“帮我记一下”这一预设触发词;
进而根据上述预设句式结构,即可将上述识别信息中的“后天9点需要在携程上定飞往广州的飞机票”作为纯文本信息记录在记事本应用中,而不是将携程应用打开并进行飞机票预定。
最后,需要明确的是:本领域技术人员可根据实际需求,将上述多个实施例任意地进行自由组合。
对应本公开实施例提供的上述信息处理方法,本公开实施例还提供一种信息处理装置,如图4所示,该装置包括:
识别模块401,被配置为对接收到的语音信息进行识别,得到识别信息;
确定模块402,被配置为确定识别信息中是否包含有预设触发词,其中,预设触发词表征的意图为进行文本处理;
处理模块403,被配置为针对包含有预设触发词的情况,将识别信息中表征待处理内容的部分作为纯文本信息进行处理。
如图5所示,在一个实施例中,确定模块402可以包括:
第一确定子模块4021,被配置为确定识别信息中表征意图的文本,表征意图的文本包括表征意图的词和/或表征意图的短语;
比对子模块4022,被配置为将表征意图的文本与预先存储的预设触发词进行比对;
第二确定子模块4023,被配置为若存在至少一个表征意图的文本与任一预设触发词匹配,则确定识别信息中包含有预设触发词。
如图6所示,在一个实施例中,处理模块403可以包括:
解析子模块4031,被配置为针对包含有预设触发词的情况,按照预设句式结构对识别信息进行解析;
处理子模块4032,被配置为将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
在一个实施例中,处理模块403可以包括以下至少一个子模块:
记录子模块,被配置为当预设触发词表征的意图为记录时,将识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
删除子模块,被配置为当预设触发词表征的意图为删除时,从预设应用中确定识别信息中表征待处理内容的部分,并从预设应用中进行删除;
复制子模块,被配置为当预设触发词表征的意图为复制时,将识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
剪切子模块,被配置为当预设触发词表征的意图为剪切时,从预设应用中确定识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,预设应用包括通过文本记录信息的应用。
在一个实施例中,识别模块401可以包括:
转换子模块,被配置为将接收到的语音信息进行文本转换,得到转换文本信息;
识别子模块,被配置为采用预设算法对转换文本信息进行语义识别,得到识别信息。
根据本公开实施例,还提供了一种信息处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
对接收到的语音信息进行识别,得到识别信息;
确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
针对包含有所述预设触发词的情况,将所述识别信息中预设触发词表征待处理内容的部分作为纯文本信息进行处理。
上述处理器还可被配置为:
确定所述识别信息中是否包含有预设触发词,包括:
确定所述识别信息中表征意图的文本,所述表征意图的文本包括表征意图的词和/或表征意图的短语;
将所述表征意图的文本与预先存储的预设触发词进行比对;
若存在至少一个表征意图的文本与任一预设触发词匹配,则确定所述识别信息中包含有预设触发词。
上述处理器还可被配置为:
针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括:
针对包含有所述预设触发词的情况,按照预设句式结构对所述识别信息进行解析;
将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
上述处理器还可被配置为:
将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括以下至少一项:
当所述预设触发词表征的意图为记录时,将所述识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
当所述预设触发词表征的意图为删除时,从预设应用中确定所述识别信息中表征待处理内容的部分,并从预设应用中进行删除;
当所述预设触发词表征的意图为复制时,将所述识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
当所述预设触发词表征的意图为剪切时,从预设应用中确定所述识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,所述预设应用包括通过文本记录信息的应用。
上述处理器还可被配置为:
对接收到的语音信息进行识别,得到识别信息,包括:
将接收到的语音信息进行文本转换,得到转换文本信息;
采用预设算法对所述转换文本信息进行语义识别,得到识别信息。图7是根据一示例性实施例示出的一种用于信息处理装置700的框图,该装置适用于终端设备。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个用户数字助理等。
参照图7,装置700可以包括以下一个或至少两个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或至少两个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或至少两个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何存储对象或方法的指令,联系用户数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为装置700的各种组件提供电源。电源组件706可以包括电源管理系统,一个或至少两个电源,及其他与为装置700生成、管理和分配电源相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或至少两个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或至少两个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或至少两个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件实现。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由上述装置700的处理器执行时,使得上述装置700能够执行一种信息处理方法,包括:
对接收到的语音信息进行识别,得到识别信息;
确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
针对包含有所述预设触发词的情况,将所述识别信息中预设触发词表征待处理内容的部分作为纯文本信息进行处理。
在一个实施例中,确定所述识别信息中是否包含有预设触发词,包括:
确定所述识别信息中表征意图的文本,所述表征意图的文本包括表征意图的词和/或表征意图的短语;
将所述表征意图的文本与预先存储的预设触发词进行比对;
若存在至少一个表征意图的文本与任一预设触发词匹配,则确定所述识别信息中包含有预设触发词。
在一个实施例中,针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括:
针对包含有所述预设触发词的情况,按照预设句式结构对所述识别信息进行解析;
将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
在一个实施例中,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括以下至少一项:
当所述预设触发词表征的意图为记录时,将所述识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
当所述预设触发词表征的意图为删除时,从预设应用中确定所述识别信息中表征待处理内容的部分,并从预设应用中进行删除;
当所述预设触发词表征的意图为复制时,将所述识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
当所述预设触发词表征的意图为剪切时,从预设应用中确定所述识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,所述预设应用包括通过文本记录信息的应用。
在一个实施例中,对接收到的语音信息进行识别,得到识别信息,包括:
将接收到的语音信息进行文本转换,得到转换文本信息;
采用预设算法对所述转换文本信息进行语义识别,得到识别信息。本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (12)
1.一种信息处理方法,其特征在于,包括:
对接收到的语音信息进行识别,得到识别信息;
确定所述识别信息中是否包含有预设触发词;
针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。
2.根据权利要求1所述的方法,其特征在于,确定所述识别信息中是否包含有预设触发词,包括:
确定所述识别信息中表征意图的文本,所述表征意图的文本包括表征意图的词和/或表征意图的短语;
将所述表征意图的文本与预先存储的预设触发词进行比对;
若存在至少一个表征意图的文本与任一预设触发词匹配,则确定所述识别信息中包含有预设触发词。
3.根据权利要求2所述的方法,其特征在于,针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括:
针对包含有所述预设触发词的情况,按照预设句式结构对所述识别信息进行解析;
将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
4.根据权利要求1-3任一项所述的方法,其特征在于,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理,包括以下至少一项:
当所述预设触发词表征的意图为记录时,将所述识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
当所述预设触发词表征的意图为删除时,从预设应用中确定所述识别信息中表征待处理内容的部分,并从预设应用中进行删除;
当所述预设触发词表征的意图为复制时,将所述识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
当所述预设触发词表征的意图为剪切时,从预设应用中确定所述识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,所述预设应用包括通过文本记录信息的应用。
5.根据权利要求1-3任一项所述的方法,其特征在于,对接收到的语音信息进行识别,得到识别信息,包括:
将接收到的语音信息进行文本转换,得到转换文本信息;
采用预设算法对所述转换文本信息进行语义识别,得到识别信息。
6.一种信息处理装置,其特征在于,包括:
识别模块,用于对接收到的语音信息进行识别,得到识别信息;
确定模块,用于确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
处理模块,用于针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。
7.根据权利要求6所述的装置,其特征在于,所述确定模块包括:
第一确定子模块,用于确定所述识别信息中表征意图的文本,所述表征意图的文本包括表征意图的词和/或表征意图的短语;
比对子模块,用于将所述表征意图的文本与预先存储的预设触发词进行比对;
第二确定子模块,用于若存在至少一个表征意图的文本与任一预设触发词匹配,则确定所述识别信息中包含有预设触发词。
8.根据权利要求7所述的装置,其特征在于,所述处理模块包括:
解析子模块,用于针对包含有所述预设触发词的情况,按照预设句式结构对所述识别信息进行解析;
处理子模块,用于将解析得到的待处理内容的部分作为纯文本信息进行处理;
其中,所述预设句式结构包括所述识别信息包含的预设触发词所表征的意图部分,以及待处理内容所表征的待处理部分。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述处理模块包括以下至少一个子模块:
记录子模块,用于当所述预设触发词表征的意图为记录时,将所述识别信息中表征待处理内容的部分作为纯文本信息记录至预设应用;
删除子模块,用于当所述预设触发词表征的意图为删除时,从预设应用中确定所述识别信息中表征待处理内容的部分,并从预设应用中进行删除;
复制子模块,用于当所述预设触发词表征的意图为复制时,将所述识别信息中表征待处理内容的部分作为纯文本信息复制至预设应用中的预设位置;
剪切子模块,用于当所述预设触发词表征的意图为剪切时,从预设应用中确定所述识别信息中表征待处理内容的部分,并剪切至预设应用中的预设位置;
其中,所述预设应用包括通过文本记录信息的应用。
10.根据权利要求6-8任一项所述的装置,其特征在于,所述识别模块包括:
转换子模块,用于将接收到的语音信息进行文本转换,得到转换文本信息;
识别子模块,用于采用预设算法对所述转换文本信息进行语义识别,得到识别信息。
11.一种信息处理装置,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
对接收到的语音信息进行识别,得到识别信息;
确定所述识别信息中是否包含有预设触发词,其中,所述预设触发词表征的意图为进行文本处理;
针对包含有所述预设触发词的情况,将所述识别信息中表征待处理内容的部分作为纯文本信息进行处理。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811289784.9A CN109285545A (zh) | 2018-10-31 | 2018-10-31 | 信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811289784.9A CN109285545A (zh) | 2018-10-31 | 2018-10-31 | 信息处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109285545A true CN109285545A (zh) | 2019-01-29 |
Family
ID=65174701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811289784.9A Pending CN109285545A (zh) | 2018-10-31 | 2018-10-31 | 信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109285545A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020211008A1 (zh) * | 2019-04-17 | 2020-10-22 | 深圳市欢太科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN111966781A (zh) * | 2020-06-28 | 2020-11-20 | 北京百度网讯科技有限公司 | 数据查询的交互方法及装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038220A (zh) * | 2017-03-20 | 2017-08-11 | 北京光年无限科技有限公司 | 用于生成备忘录的方法、智能机器人及系统 |
CN107305483A (zh) * | 2016-04-25 | 2017-10-31 | 北京搜狗科技发展有限公司 | 一种基于语义识别的语音交互方法及装置 |
CN107679033A (zh) * | 2017-09-11 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 文本断句位置识别方法和装置 |
US20180090144A1 (en) * | 2016-09-28 | 2018-03-29 | Toyota Jidosha Kabushiki Kaisha | Voice dialogue system and method of understanding utterance intention |
-
2018
- 2018-10-31 CN CN201811289784.9A patent/CN109285545A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107305483A (zh) * | 2016-04-25 | 2017-10-31 | 北京搜狗科技发展有限公司 | 一种基于语义识别的语音交互方法及装置 |
US20180090144A1 (en) * | 2016-09-28 | 2018-03-29 | Toyota Jidosha Kabushiki Kaisha | Voice dialogue system and method of understanding utterance intention |
CN107038220A (zh) * | 2017-03-20 | 2017-08-11 | 北京光年无限科技有限公司 | 用于生成备忘录的方法、智能机器人及系统 |
CN107679033A (zh) * | 2017-09-11 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 文本断句位置识别方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020211008A1 (zh) * | 2019-04-17 | 2020-10-22 | 深圳市欢太科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN111966781A (zh) * | 2020-06-28 | 2020-11-20 | 北京百度网讯科技有限公司 | 数据查询的交互方法及装置、电子设备和存储介质 |
CN111966781B (zh) * | 2020-06-28 | 2024-02-20 | 北京百度网讯科技有限公司 | 数据查询的交互方法及装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106024009B (zh) | 音频处理方法及装置 | |
CN101557432B (zh) | 移动终端及其菜单控制方法 | |
CN106202150B (zh) | 信息显示方法及装置 | |
EP4184506A1 (en) | Audio processing | |
CN106791921A (zh) | 视频直播的处理方法及装置 | |
CN105354017B (zh) | 信息处理方法及装置 | |
CN104035995A (zh) | 群标签生成方法及装置 | |
CN108509412A (zh) | 一种数据处理方法、装置、电子设备以及存储介质 | |
CN109002184A (zh) | 一种输入法候选词的联想方法和装置 | |
US11335348B2 (en) | Input method, device, apparatus, and storage medium | |
CN106537288B (zh) | 控制应用自启动的方法及装置 | |
CN107342082A (zh) | 基于语音交互的音频处理方法、装置及音频播放设备 | |
CN109977426A (zh) | 一种翻译模型的训练方法、装置以及机器可读介质 | |
CN108228620A (zh) | 一种词库更新方法及装置 | |
CN109285545A (zh) | 信息处理方法及装置 | |
CN107945552A (zh) | 对信号灯变灯时间进行提示的方法、装置及存储介质 | |
CN108766427B (zh) | 语音控制方法及装置 | |
CN106844717A (zh) | 网页搜索显示方法及装置 | |
CN111816174B (zh) | 语音识别方法、装置及计算机可读存储介质 | |
CN111209381B (zh) | 对话场景中时间管理方法及装置 | |
CN107295099A (zh) | 推送消息处理方法、装置及存储介质 | |
CN111324214B (zh) | 一种语句纠错方法和装置 | |
CN104699668B (zh) | 确定词语相似度的方法及装置 | |
CN105094891B (zh) | 效果显示方法及装置 | |
CN111667827A (zh) | 应用程序的语音控制方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190129 |