CN111723574A - 一种信息处理方法、装置及计算机可读存储介质 - Google Patents
一种信息处理方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111723574A CN111723574A CN202010657908.5A CN202010657908A CN111723574A CN 111723574 A CN111723574 A CN 111723574A CN 202010657908 A CN202010657908 A CN 202010657908A CN 111723574 A CN111723574 A CN 111723574A
- Authority
- CN
- China
- Prior art keywords
- target
- information
- slot position
- entity information
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Abstract
本申请实施例公开了一种信息处理方法、装置及计算机可读存储介质,本申请实施例通过获取用户输入的语言信息;对语言信息进行解析,确定目标意图;根据目标意图确定出相应的目标槽位集合;对语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。以此,通过解析用户的目标意图确定相应的目标槽位集合,获取语言信息进行分词,得到目标实体信息,将该目标实体信息加载至适配的目标槽位上,根据加载后的目标槽位生成实时的答复策略进行答复,直至将目标槽位集合全部加载完毕,完成智能对话,极大的提升了信息处理的效率和灵活性。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种信息处理方法、装置及计算机可读存储介质。
背景技术
自然语言处理(NLP,Natural Language Processing)是使用自然语言同计算机进行通讯的技术。因为处理自然语言的关键是要让计算机理解自然语言,所以自然语言处理又叫做自然语言理解(NLU,Natural Language Understanding)。
现有技术中,为了实现人机交互,需要设计人机对话任务,即通过运营人员配置好的会话顺序以及每轮会话中的关键信息提问,逐步引导用户提供对话信息,完成人机对话任务。
在对现有技术的研究和实践过程中,本申请的发明人发现,现有技术中,会话顺序是固定的,如果用户不按照会话顺序进行对话,会使得人机对话任务失败,需要重新进行人机对话任务,导致信息处理的效率较低。
发明内容
本申请实施例提供一种信息处理方法、装置及计算机可读存储介质,可以提升信息处理的效率。
为解决上述技术问题,本申请实施例提供以下技术方案:
一种信息处理方法,包括:
获取用户输入的语言信息;
对所述语言信息进行解析,确定目标意图;
根据所述目标意图确定出相应的目标槽位集合,所述目标槽位集合中包括至少一个目标槽位;
对所述语言信息进行分词操作,得到目标实体信息;
获取目标实体信息的上下文信息,根据所述上下文信息将所述目标实体信息加载至匹配的目标槽位上;
根据加载后匹配的目标槽位生成答复策略。
一种信息处理装置,包括:
获取单元,用于获取用户输入的语言信息;
解析单元,用于对所述语言信息进行解析,确定目标意图;
确定单元,用于根据所述目标意图确定出相应的目标槽位集合,所述目标槽位集合中包括至少一个目标槽位;
分词单元,用于对所述语言信息进行分词操作,得到目标实体信息;
加载单元,用于获取目标实体信息的上下文信息,根据所述上下文信息将所述目标实体信息加载至匹配的目标槽位上;
生成单元,用于根据加载后匹配的目标槽位生成答复策略。
在一些实施例中,所述装置还包括转化单元,用于:
记录预设实体信息关联的隐藏实体信息,生成语言信息库;
当检测到目标槽位上的目标实体信息为预设实体信息时,将所述目标槽位上的目标实体信息转化为隐藏实体信息。
在一些实施例中,所述解析单元,用于:
将所述语言信息中的非文本信息进行删除;
将所述语言信息中预设分词替换为目标分词;
通过自然语言处理模型对处理后的语言信息进行意图识别,确定相应的目标意图。
在一些实施例中,所述获取单元,用于:
接收用户输入的文本;
接收用户输入的语音,将所述语音转化为文本;和/或
接收用户输入的图像,通过光学字符识别将所述图像转化为文本;
将所述文本确定为语言信息。
在一些实施例中,所述分词单元,用于:
对所述语言信息进行分句和分词操作,得到多个分词信息;
根据所述多个分词信息的属性进行划分,得到预设属性的目标实体信息。
在一些实施例中,所述确定单元,用于:
基于预设映射关系,确定所述目标意图对应的目标槽位集合,所述预设映射关系包括目标意图和目标槽位集合的映射关系;
查找标槽位集合中的目标槽位的历史实体信息列表;
当所述历史实体信息列表中存在历史实体信息时,从所述历史实体信息列表中选择历史实体信息加载至查找的目标槽位上。
一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述信息处理方法中的步骤。
本申请实施例通过获取用户输入的语言信息;对语言信息进行解析,确定目标意图;根据目标意图确定出相应的目标槽位集合;对语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。以此,通过解析用户的目标意图确定相应的目标槽位集合,获取语言信息进行分词,得到目标实体信息,将该目标实体信息加载至适配的目标槽位上,根据加载后的目标槽位生成实时的答复策略进行答复,直至将目标槽位集合全部加载完毕,完成智能对话,极大的提升了信息处理的效率和灵活性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的信息处理系统的场景示意图;
图2是本申请实施例提供的信息处理方法的流程示意图;
图3是本申请实施例提供的信息处理方法的另一流程示意图;
图4a为本申请实施例提供的信息处理方法的产品示意图;
图4b为本申请实施例提供的信息处理方法的另一产品示意图;
图4c为本申请实施例提供的信息处理方法的另一产品示意图;
图5是本申请实施例提供的信息处理装置的结构示意图;
图6是本申请实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种信息处理方法、装置、及计算机可读存储介质。
请参阅图1,图1为本申请实施例所提供的信息处理系统的场景示意图,包括:终端A、和服务器(该信息处理系统还可以包括除终端A之外的其他终端,终端具体个数在此处不作限定),终端A与服务器之间可以通过通信网络连接,该通信网络,可以包括无线网络以及有线网络,其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体,图中并未示意出。终端A可以通过通信网络与服务器进行信息交互,比如终端A通过问答应用在线将语言信息发送至服务器。
该信息处理系统可以包括信息处理装置,该信息处理装置具体可以集成在服务器中,如图1所示,该服务器获取用户输入的语言信息进行解析,确定目标意图,例如目标意图为“买飞机票”、“查询天气”等等,根据该目标意图确定出相应的目标槽位集合,该目标槽位集合中包括至少一个目标槽位,对该语言信息进行分词操作,得到目标实体信息,将该目标实体信息加载至匹配的目标槽位上,根据加载后的目标槽位生成答复策略,根据该答复策略生成答复内容发送至终端A中进行答复,并持续引导用户补充其他目标槽位,实现多轮对话,直至该槽位集合加载完毕。
该信息处理系统中终端A可以安装各种用户需要的应用,比如问答应用等,用户可以通过终端A输入带有意图的语言信息,例如“我想买飞机票”、“我想查询天气”等等,终端A可以采集该语言信息发送至服务器进行人机对话。
需要说明的是,图1所示的信息处理系统的场景示意图仅仅是一个示例,本申请实施例描述的信息处理系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着信息处理系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
在本实施例中,将从信息处理装置的角度进行描述,该信息处理装置具体可以集成在具备储存单元并安装有微处理器而具有运算能力的服务器中。
请参阅图2,图2是本申请实施例提供的信息处理方法的流程示意图。该信息处理方法包括:
在步骤101中,获取用户输入的语言信息。
其中,该语言信息是人类交流和沟通的主要工具、及人机交互的工具,包括汉语、日语、英语等等,在本申请实施例中,主要指用户在人机交互应用中输入的文本信息,例如,“今天天气怎么样”等等,本申请实施例可以实时获取用户输入语言信息。
在步骤102中,对语言信息进行解析,确定目标意图。
其中,该用户意图,本文中简称意图,即用户通过语言信息所表达的请求或者目标,例如,用户的语句为“今天温度怎么样”,用户意图就是查询温度,再例如用户的语句为“帮我订个机票”,用户意图就是“订机票”。
本申请实施例中,用户可以通过终端输入语言信息,例如,该终端可以展示询问界面,该询问界面上设置有信息输入控件,用户可以通过该信息输入控件输入语言信息,该语言信息中隐含了相应的目标意图,服务器可以实时的获取该语言信息。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案涉及人工智能的自然语言处理技术等技术,具体通过如下实施例进行说明:
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
本申请实施例在获取用户输入的语言信息之后,可以通过自然语言处理模型对用户输入的语言信息进行解析,确定相应的目标意图,例如“订机票”等等,在一实施方式中,部分语言信息中并没有直接体现目标意图,但是自然语言处理模型仍然可以识别出相应隐藏意图,例如,你什么时候走/你想哪天走/你啥时候动身等等语言信息,没有直接体现目标意图,但是自然语言处理模型可以从历史的学习记录中,得到上述语言信息的目标意图为“订票”。
在一些实施方式中,该对该语言信息进行解析,确定目标意图的步骤,可以包括:
(1)将该语言信息中的非文本信息进行删除;
(2)将该语言信息中预设分词替换为目标分词;
(3)通过自然语言处理模型对处理后的语言信息进行意图识别,确定相应的目标意图。
其中,可以接收用户输入的语言信息,例如,“现在@什么时刻”,该非文本信息为一些特殊符号信息,例如“@”、“#”或者“%”等等,由于该非文本信息会对意图识别产生干扰,所以首先需要将该语言信息中的非文本信息进行删除,例如,将该非本文信息“@”删除。该分词为语言信息中的名词信息,例如“时刻”。
在实际的使用过程,由于用户使用习惯不一致,可能会使用各种各样的分词,而某些预设分词为服务器无法进行意图识别的分词,例如,预设分词“时刻”,服务器无法通过预设分词“时刻”进行意图识别,以此,为了后续可以顺利进行意图识别,本申请实施例可以预置与预设分词相似的近义词(即目标分词),且该目标分词为服务器可以直接识别的分词,例如,目标分词为“时间”,将该语言信息中的预设分词“时刻”替换为目标分词“时间”,使得替换后的语言信息可以更准确的被识别。
进一步的,通过自然语言处理模型对处理后的语言信息进行意图识别,该语言信息模型可以为卷积神经网络(Convolutional Neural Networks,CNN)模型,可以预先准备大量的带有意图标签的语言信息对该卷积神经网络模型进行预训练,使得该卷积神经网络型具有识别意图的能力,以此,可以确定处理后的语言信息相应的目标意图,例如目标意图为“询问时间”。
在步骤103中,根据目标意图确定出相应的目标槽位集合。
其中,该目标槽位集合中包括至少一个目标槽位,该槽位(Slot),也称为槽,用于表示将语言信息所表达的用户意图转化为明确的用户指令,语言信息中的实体信息所对应的属性,该实体信息为语言信息中的名词信息,根据该实体信息的属性确定相应加载的槽位,每一目标意图均预关联相应的目标槽位集合,以此,根据目标意图可以直接确定出相应的目标槽位集合。
例如,语言信息的意图为“天气查询”时,对应的槽位可以包括“城市名”和“时间”;当语言信息的意图为“音乐点播”时,对应的槽位可以包括“歌曲名”,“歌手名”,“专辑名”和“歌曲类型”等;当语言信息的意图“视频点播”意图中,对应的槽位可以包括“视频名称”,“导演”和“演员”等。
该槽位分为必填和非必填之分,必填槽位的信息没有不行,缺失就会进行追问,即该必填槽位为语句的意图的核心,该非必填槽为意图的附属槽位,可以为填充状态和非填充状态,用于更好的描述意图,即使非必填槽位填充完毕,本申请实施例也会持续追问该必填槽位,直至该必填槽位填充完毕,结合必填槽位和非必填槽位执行意图对应的动作,例如,当语句的意图为“音乐点播”时,歌曲名即为必填槽位,该歌手名、专辑名和歌曲类型可以为非必填槽位,假设该歌曲名缺失时,可以持续进行槽位追问,例如“您想听的歌曲名为什么?”等等,而该非必填槽位可以缺失,该非必填槽位在填充后,可以更准确的确定用户意图相应的音乐,但是核心还是为必填槽位的信息,即用户可以自由聊天进行非必填槽位的填充,但是服务器会在聊天的过程中持续对必填槽位的追问,直至必填槽位填充完毕,在对话结束后,结合必填槽位和非必填槽位确定用户需要听的歌曲名。在本申请实施例中,该目标槽位即为必填槽位,该目标槽位中必须填上对应的值,才可以执行意图对应的动作,进而达到对话故事的最终目的。
在一些实施方式中,该根据目标意图确定出相应的目标槽位集合的步骤,可以包括:
(1)基于预设映射关系,确定该目标意图对应的目标槽位集合,该预设映射关系包括目标意图和目标槽位集合的映射关系;
(2)查找目标槽位的历史实体信息列表;
(3)当该历史实体信息列表中存在历史实体信息时,从该历史实体信息列表中选择历史实体信息加载至查找的目标槽位上。
其中,该预设映射关系包括目标意图和目标槽位集合的映射关系,该预设映射表可以参阅如下表1所示:
表1
目标意图 | 目标槽位集合 |
订飞机票 | 出发地、目的地、出发时间 |
天气查询 | 城市名、时间 |
音乐点播 | 歌曲名 |
如上述表该,目标意图订飞机票对应对目标槽位集合可以包括出发地、目的地、出发时间三个目标槽位,目标意图天气查询对应对目标槽位集合可以包括城市名、时间二个目标槽位,目标意图音乐点播对应对目标槽位集合可以包括歌曲名一个目标槽位。
进一步的,基于预设映射关系,确定当前目标意图对应的目标槽位集合,该目标槽位集合中包括多个目标槽位,在实际的应用过程中,目标槽位在使用过程中,可能存在多次的槽位填充,服务器可以记录之前加载到目标槽位上的历史实体信息,生成历史实体信息列表,例如目标槽位“出发地”的历史实体信息列表中包括“深圳”、“惠州”和“东莞”,即该历史实体信息列表中存在历史实体信息,可以从该历史实体信息列表“深圳”、“惠州”和“东莞”选择当前需要的历史实体信息加载至目标槽位“出发地”上,例如将“深圳”加载至目标槽位“出发地”的上。在一实施方式中,可以将该历史实体信息列表反馈至终端上进行界面显示,用户基于终端的显示界面,可以从历史实体信息列表中选择相应的历史实体信息实现加载。在一实施方式中,还可以根据该历史实体信息列表中每一历史实体信息的使用频率,直接选择使用频率最高的历史实体信息加载至目标槽位上。当该历史实体信息列表中不存在历史实体信息时,执行步骤104。
在步骤104中,对语言信息进行分词操作,得到目标实体信息。
其中,可以对该语言信息进行分词操作,例如将“帮我订个机票”进行分词操作,得到“帮”“我”、“订个”和“机票”,该每一分词都具有相应的属性,如“帮”和“订个”为动词、“我”“机票”为名词,该实体信息,也称为命名实体,是人名、机构名、地名以及其他所有以名称为标识的实体;更广泛的实体还包括数字、日期、货币、地址等等;命名实体的不同类型可以使用标签来进行区分,例如标签可以为“歌曲”、“城市”等。以此,将名词属性的分词确定为目标实体信息,因为目标槽位集合中的目标槽位中缺失的内容均为名词,例如槽位“出发地”和槽位“出发时间”等缺失的内容均为名词属性的分词,所以本申请实施例只需要得到名词属性的分词即可。
在一些实施方式中,该对语言信息进行分词操作,得到目标实体信息的步骤,可以包括:
(1)对该语言信息进行分句和分词操作,得到多个分词信息;
(2)根据该多个分词信息的属性进行划分,得到预设属性的目标实体信息。
其中,首先对该语言信息进行分句操作,即根据分隔符号将语言信息分成多个句子,例如,将语言信息“你好,帮我订个机票”进行分句操作,得到“你好”的句子和“帮我定个机票”的句子,接着,对分句操作之后的句子进行分词操作,得到“你好”|“帮”“我”、“订个”和“机票”多个分词信息。
进一步的,划分每一个分词信息的属性,得到动词“帮”、“订个”和名词“我”、“机票”,该预设属性为名词,即将名词属性的分词信息确定为目标实体信息。
在步骤105中,获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上。
其中,为了实现用户的目标意图即实现完整的人机对话,需要不断进行槽位填充(Slot Filling),也叫槽位抽取,识别语句中的实体信息被明确定义的属性的值的过程。
例如,当目标意图为“买飞机票”时,必须将目标槽位出发地、目的地、出发时间均进行填充后,才可以执行买飞机票这个动作,实现完整的人机对话。
相关技术的基于框架的目标导向系统中,服务器根据框架向用户提出一系列预定义的问题,如果用户提出答案,才转向下一个问题,如果客户提供的不是答案,则忽略客户的任何事情,用户体验极差,用户只能按照既定好的对话顺序进行对话,很容易导致对话失败,且过于机械,信息获取的效率极差。
在本申请实施例中,由于目标槽位集合可以包括多个目标槽位,所以往往需要进行多轮对话实现所有目标槽位的填充,用户可以随时提供为了完成目标意图的任何对话信息元素,即对话可以顺序无序的进行,可以将目标实体信息加载至匹配的目标槽位上,例如可以将“从深圳出发”中的目标实体信息“深圳”加载至匹配的目标槽位出发地中进行保存。
在一实施方式中,可以获取目标实体信息的上下文信息,该上下文信息为目标实体的关系信息,例如“深圳”的上下文信息可以为从和出发,即可以通过该上下文信息确定“深圳”为出发地,进而将该目标实体信息“深圳”加载至匹配的目标槽位出发地上。
在步骤106中,根据加载后匹配的目标槽位生成答复策略。
其中,本申请实施例可以根据加载后的目标槽位生成答复策略进行灵活性回答,例如,根据加载后的目标槽位出发地“深圳”生成相应的答复策略,该答复策略可以为预先生成的针对不同的目标槽位对应不同的答复内容,例如“深圳包括2个火车站、2个高铁站和一个飞机场,您想什么时间从哪里出发呢”,假设加载后的目标槽位目的地和时间分别为“北京”和“明天”,答复内容可以为“北京明天的温度为30度,注意防暑,您具体从哪里出发呢”。
以此,本申请实施例可以实现不顾及对话中的既定对话顺序,用户可以随时提供完成目标的任何关键对话信息元素,实时的将关键对话信息元素中的实体信息智能的加载到合适的目标槽位上,并根据加载后的目标槽位生成不同的答复策略得到相应的答复内容,使得对话可以顺序无需的进行,不断地引导用户进行目标槽位的补充,直至目标槽位集合全部加载完毕,完成最终的对话目的,实现智能化的人机交互。
由上述可知,本申请实施例通过获取用户输入的语言信息;对语言信息进行解析,确定目标意图;根据目标意图确定出相应的目标槽位集合;对语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。以此,通过解析用户的目标意图确定相应的目标槽位集合,获取语言信息进行分词,得到目标实体信息,将该目标实体信息加载至适配的目标槽位上,根据加载后的目标槽位生成实时的答复策略进行答复,直至将目标槽位集合全部加载完毕,完成智能对话,极大的提升了信息处理的效率和灵活性。
结合上述实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该信息处理装置具体集成在服务器中为例进行说明,具体参照以下说明。
请参阅图3,图3为本申请实施例提供的信息处理方法的另一流程示意图。该方法流程可以包括:
在步骤201中,服务器接收用户输入的文本,接收用户输入的语音,将语音转化为文本,接收用户输入的图像,通过光学字符识别将图像转化为文本,将文本确定为语言信息。
其中,请一并参阅图4a所示,图4a为本申请实施例提供的信息处理方法的产品示意图,图4a为应答应用的交互画面,用户可以直接输入文本吃不到鸡11,输入语音,该终端可以将语音发送至服务器,服务器在接收到用户输入的语音时,可以对语音进行语义分析,得到语音相应的文本,例如,对接收到的语音信息进行分析,得到文本房区12,输入图像,该终端可以将图像发送至服务器,服务器在接收到用户输入的图像时,可以通过光学字符识别(Optical Character Recognition,OCR)技术对图像中的字符进行识别,得到文本狙击枪13,服务器可以依次将文本吃不到鸡11、房区12和狙击枪13确定为语言信息,即本申请实施例不仅可以识别用户输入的文本相应的语言信息,还可以识别语音和图像相应的语言信息,应用范围广。
在步骤202中,服务器将语言信息中的非文本信息进行删除,将语言信息中预设分词替换为目标分词,通过自然语言处理模型对处理后的语言信息进行意图识别,确定相应的目标意图。
例如,该语言信息可以为“#帮我订从家出发到鹏城的飞机票”,该非文本信息可以为特殊符号信息,例如#、@等等,以此,服务器首先可以将非文本信息#删除,该预设分词为服务器无法进行意图识别的分词,例如“鹏城”,服务器无法通过“鹏城”识别出用户的意图,该目标分词为预设分词的近义词,为服务器可以直接识别的分词,例如该目标分词可以服务器可以识别的“深圳”,服务器语言信息中的预设分词“鹏城”替换为近似词(即目标分词)“深圳”,得到处理后的处理后的语言信息“帮我订从家出发到深圳的飞机票”。
进一步的,该自然语言处理模型可以为卷积神经网络模型,该卷积神经网络通过预训练,具有识别语言信息的意图的能力,以此,通过该卷积神经网络模型可以对处理后的语言信息进行意图识别,确定相应的目标意图为“订飞机票”。
在步骤203中,服务器基于预设映射关系,确定目标意图对应的目标槽位集合,查找目标槽位的历史实体信息列表,当历史实体信息列表中存在历史实体信息时,从历史实体信息列表中选择历史实体信息加载至查找的目标槽位上。
其中,预设映射关系可以包括目标意图和目标槽位集合的映射关系,该映射关系可以通过人为设定,例如,可以参阅上述表1,目标意图订飞机票对应对目标槽位集合可以包括出发地、目的地、出发时间三个目标槽位,即当服务器发现语言信息的目标意图属于订飞机票时,可以通过该目标意图找到对应的对话故事节点(目标槽位集合),并开启这个对话故事。
进一步的,可以查找目标槽位出发地、目的地、出发时间的历史实体信息列表,假设只有目标槽位出发时间包括历史实体信息列表,该历史实体信息列表中包括三条历史实体信息今天、明天和后天,基于此,可以将该历史实体信息列表直接推送至终端进行显示,并接收用户选择的历史实体信息明天,将该历史实体信息明天直接加载至查找的目标槽位出发时间上,实现可以根据历史槽位中实体信息快速加载当前的目标槽位的实体信息,从而减少了一次人机交互的过程,提升人机交互的效率。
在步骤204中,服务器对语言信息进行分句和分词操作,得到多个分词信息,根据多个分词信息的属性进行划分,得到预设属性的目标实体信息。
其中,服务器可以对语言信息“帮我订从家出发到深圳的飞机票”进行分句和分词操作,得到“帮”“我”、“订”、“从”、“家”、“出发到”、“深圳”、“的”、“飞机票”的多个分词信息,根据分词信息的属性进行划分,得到动词“帮”“订”“出发到”、名词“我”、“家”、“深圳”、“飞机票”和副词“从”、“的”。
进一步的,该预设属性为名词,得到名词的目标实体信息“我”、“家”、“深圳”、“飞机票”。
在步骤205中,服务器获取目标实体信息的上下文信息。
其中,服务器获取每一目标实体信息的上下文信息,该上下文信息可以体现出目标实体信息的属性,例如“家”的上下文信息为“从”和“出发到”,“深圳”的上下文信息为“出发到”和空。
在步骤206中,服务器根据上下文信息确定目标实体信息匹配的目标槽位。
其中,服务器可以根据上下文信息确定“家”匹配的目标槽位为出发地,“深圳”匹配的目标槽位为“目的地”。
在步骤207中,当服务器检测到目标槽位上存在历史实体信息时,生成提示控件,当服务器检测到目标槽位上不存在历史实体信息时,将目标实体信息加载至匹配的目标槽位上。
其中,服务器检测目标槽位上是否存在历史实体信息,假设该目的地存在历史实体信息“北京”时,为了避免历史实体信息带来的错误干扰,可以生成相应的提示控件发送至终端上,终端会将该提示控件显示在界面上,该提示控件用于提示用户是否通过当前的目标实体信息替换该历史实体信息,当用户选择通过目标实体信息替换历史实体信息时,会将目的地的历史实体信息“北京”更换为“深圳”。当用户选择不通过目标实体信息替换历史实体信息时,保留历史实体信息“北京”。
进一步的,当服务器检测到目标槽位上不存在历史实体信息时,说明该目标槽位上的信息为空,可以直接将当前的目标实体信息加载至匹配的目标槽位上。以此,本申请可以在多轮人机交互的过程中,实现快速的修改目标槽位上的信息,使得人机交互更灵活和人性化。
在步骤208中,服务器记录预设实体信息关联的隐藏实体信息,生成语言信息库,当检测到目标槽位上的目标实体信息为预设实体信息时,将目标槽位上的目标实体信息转化为隐藏实体信息,根据加载后的目标槽位生成答复策略。
其中,该预设实体信息可以为一些经常使用指代词,例如家、公司等等,,该指代词为用户一些使用习惯,往往包括一个固定的实体信息,但是机器人无法直接获知该指代词相应的意思,在相关技术中,往往需要进行多一轮询问才可以确定,例如,追问用户“你家在哪里?”,过程繁琐,在本申请实施例中,可以预先记录预设实体信息关联的隐藏实体信息,例如将家关联北京XX小区,公司关联深圳XX大厦等等,生成语言信息库。
以此,当检测到目标槽位上的目标实体信息为预设实体信息时,可以直接从语言信息库中进行查找,将目标槽位上的目标实体信息转化为隐藏实体信息,例如把目标实体信息“家”替换为隐藏实体信息“北京XX小区”,可以减少一轮询问,提升人机交互的效率。
在相关技术中,由于业务的复杂性,想实现某个对话目标任务(目标意图)需要固定分步完成,可以理解为一个完成的对话中,有很多子对话模块(目标槽位),例如,实现目标意图订机票,往往需要先收集目标槽位出发地,在收集目标槽位目的地,最后收集目标槽位出发时间,实现对话完成,该对话顺序为既定不变的,如果用户不按照会话顺序进行对话,会使得人机对话任务失败,需要重新进行人机对话任务。在本申请实施例中,用户在每一次输入语言信息后,服务器均可以获取语言信息中的实体信息,遍历目标槽位集合中的每一个目标槽位,判断该实体信息是否符合目标槽位的条件,基于上下文信息,服务器可以优先检查具有依赖关系的目标槽位,缩小歧义的范围,进而提升了信息处理的效率。例如,相关技术中的对话目标任务需要用户先加载目标槽位出发地,再加载目标槽位目的地,最后加载目标槽位出发时间,而在本申请实施例中,假设用户提出了一个时间,例如“明天”、“大后天”或者“国庆节”,服务器可以直接跳过既定顺序目标槽位出发地和目标槽位目的地,直接定位到目标槽位出发时间进行加载。
该答复策略可以为预先生成的针对不同的目标槽位对应不同的答复内容,例如,请一并参阅图4b和图4c所示,图4b为本申请实施例提供的信息处理方法的另一产品示意图,图4c为本申请实施例提供的信息处理方法的另一产品示意图。用户可以通过配置界面进行意图配置,并且还可以对意图下包含的实体进行独立的答案配置,即用户可以点击该配置界面的控件14,跳转到图4c的配置界面为该控件14为“武器怎么获得”的意图的多个实体“M416”、“M16A4”等等武器进行独立的答案配置,使得后续根据目标槽位上的目标实体信息生成不同的答复策略得到不同的答复内容。
在本申请实施例中,由于目标槽位集合中的三个目标槽位出发地、目的地、出发时间均以经加载了信息“北京XX小区”、“深圳”、“明天”,即已经实现了完整的人机对话,以此,可以直接输出目标意图相应的处理结果,该处理结果可以是文案,也可能是其他的富文本选项,如图像、视频和攻略等等形式。
在一实施方式中,该处理结果还可以为复杂的逻辑,即与目标意图相关的智能处理结果,例如,动态的jason查询接口,该jason查询接口可以为基于上述目标槽位集合中的信息相应的飞机票预订网址,即用户可以基于该jason查询接口直接进行购买,进一步的提升了信息处理的效率。
在一实施方式中,在目标槽位集合中目标槽位未加载完毕时,系统会持续生成其他答复方式,并以询问的方式引导用户回答关键实体信息,直至目标槽位集合加载完毕。
由上述可知,本申请实施例通过获取用户输入的语言信息;对语言信息进行解析,确定目标意图;根据目标意图确定出相应的目标槽位集合;对语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。以此,通过解析用户的目标意图确定相应的目标槽位集合,获取语言信息进行分词,得到目标实体信息,将该目标实体信息加载至适配的目标槽位上,根据加载后的目标槽位生成实时的答复策略进行答复,直至将目标槽位集合全部加载完毕,完成智能对话,极大的提升了信息处理的效率和灵活性。
进一步的,本申请实施例还可以将历史实体信息快速加载至当前的目标槽位中,进一步提升了信息处理的效率和多样性。
为便于更好的实施本申请实施例提供的信息处理方法,本申请实施例还提供一种基于上述信息处理方法的装置。其中名词的含义与上述信息处理方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图5,图5为本申请实施例提供的信息处理装置的结构示意图,其中该信息处理装置可以包括获取单元301、解析单元302、确定单元303、分词单元304、加载单元305以及生成单元306等。
获取单元301,用于获取用户输入的语言信息。
其中,该语言信息是人类交流和沟通的主要工具、及人机交互的工具,包括汉语、日语、英语等等,在本申请实施例中,主要指用户在人机交互应用中输入的文本信息,例如,“今天天气怎么样”等等,获取单元301可以实时获取用户输入语言信息。
在一些实施方式中,该获取单元301,用于:
接收用户输入的文本;
接收用户输入的语音,将该语音转化为文本;和/或
接收用户输入的图像,通过光学字符识别将该图像转化为文本;
将该文本确定为语言信息。
解析单元302,用于对该语言信息进行解析,确定目标意图。
其中,该用户意图,本文中简称意图,即用户通过语言信息所表达的请求或者目标,例如,用户的语句为“今天温度怎么样”,用户意图就是查询温度,再例如用户的语句为“帮我订个机票”,用户意图就是“订机票”。
本申请实施例中,用户可以通过终端输入语言信息,例如,该终端可以展示询问界面,该询问界面上设置有信息输入控件,用户可以通过该信息输入控件输入语言信息,该语言信息中隐含了相应的目标意图,服务器可以实时的获取该语言信息。解析单元302可以通过自然语言处理模型对用户输入的语言信息进行解析,确定相应的目标意图,例如“订机票”等等,在一实施方式中,部分语言信息中并没有直接体现目标意图,但是解析单元302通过自然语言处理模型仍然可以识别出相应隐藏意图,例如,你什么时候走/你想哪天走/你啥时候动身等等语言信息,没有直接体现目标意图,但是自然语言处理模型可以从历史的学习记录中,得到上述语言信息的目标意图为“订票”。
在一些实施方式中,该解析单元302,用于:
将该语言信息中的非文本信息进行删除;
将该语言信息中预设分词替换为目标分词;
通过自然语言处理模型对处理后的语言信息进行意图识别,确定相应的目标意图。
确定单元303,用于根据该目标意图确定出相应的目标槽位集合,该目标槽位集合中包括至少一个目标槽位;
其中,该目标槽位集合中包括至少一个目标槽位,该槽位(Slot),也称为槽,用于表示将语言信息所表达的用户意图转化为明确的用户指令,语言信息中的实体信息所对应的属性,该实体信息为语言信息中的名词信息,根据该实体信息的属性确定相应加载的槽位,每一目标意图均预关联相应的目标槽位集合,以此,确定单元303可以根据目标意图可以直接确定出相应的目标槽位集合。
该槽位分为必填和非必填之分,必填槽位的信息没有不行,缺失就会进行追问,即该必填槽位为语句的意图的核心,该非必填槽为意图的附属槽位,可以为填充状态和非填充状态,用于更好的描述意图,即使非必填槽位填充完毕,本申请实施例也会持续追问该必填槽位,直至该必填槽位填充完毕,结合必填槽位和非必填槽位执行意图对应的动作,例如,当语句的意图为“音乐点播”时,歌曲名即为必填槽位,该歌手名、专辑名和歌曲类型可以为非必填槽位,假设该歌曲名缺失时,可以持续进行槽位追问,例如“您想听的歌曲名为什么?”等等,而该非必填槽位可以缺失,该非必填槽位在填充后,可以更准确的确定用户意图相应的音乐,但是核心还是为必填槽位的信息,即用户可以自由聊天进行非必填槽位的填充,但是服务器会在聊天的过程中持续对必填槽位的追问,直至必填槽位填充完毕,在对话结束后,结合必填槽位和非必填槽位确定用户需要听的歌曲名。在本申请实施例中,该目标槽位即为必填槽位,该目标槽位中必须填上对应的值,才可以执行意图对应的动作,进而达到对话故事的最终目的。
在一些实施方式中,该确定单元303,用于:
基于预设映射关系,确定该目标意图对应的目标槽位集合,该预设映射关系包括目标意图和目标槽位集合的映射关系;
查找标槽位集合中的目标槽位的历史实体信息列表;
当该历史实体信息列表中存在历史实体信息时,从该历史实体信息列表中选择历史实体信息加载至查找的目标槽位上。
分词单元304,用于对该语言信息进行分词操作,得到目标实体信息。
其中,分词单元304可以对该语言信息进行分词操作,例如将“帮我订个机票”进行分词操作,得到“帮”“我”、“订个”和“机票”,该每一分词都具有相应的属性,如“帮”和“订个”为动词、“我”“机票”为名词,该实体信息,也称为命名实体,是人名、机构名、地名以及其他所有以名称为标识的实体;更广泛的实体还包括数字、日期、货币、地址等等;命名实体的不同类型可以使用标签来进行区分,例如标签可以为“歌曲”、“城市”等。以此,将名词属性的分词确定为目标实体信息,因为目标槽位集合中的目标槽位中缺失的内容均为名词,例如槽位“出发地”和槽位“出发时间”等缺失的内容均为名词属性的分词,所以本申请实施例只需要得到名词属性的分词即可。
在一些实施方式中,该分词单元304,用于:
对该语言信息进行分句和分词操作,得到多个分词信息;
根据该多个分词信息的属性进行划分,得到预设属性的目标实体信息。
加载单元305,用于获取目标实体信息的上下文信息,根据该上下文信息将该目标实体信息加载至匹配的目标槽位上。
其中,为了实现用户的目标意图即实现完整的人机对话,需要不断进行槽位填充,也叫槽位抽取,识别语句中的实体信息被明确定义的属性的值的过程。
在本申请实施例中,由于目标槽位集合可以包括多个目标槽位,所以往往需要进行多轮对话实现所有目标槽位的填充,用户可以随时提供为了完成目标意图的任何对话信息元素,即对话可以顺序无序的进行,可以将目标实体信息加载至匹配的目标槽位上,例如可以将“从深圳出发”中的目标实体信息“深圳”加载至匹配的目标槽位出发地中进行保存。
加载单元305可以获取目标实体信息的上下文信息,该上下文信息为目标实体的关系信息,例如“深圳”的上下文信息可以为从和出发,即可以通过该上下文信息确定“深圳”为出发地,进而将该目标实体信息“深圳”加载至匹配的目标槽位出发地上。
在一些实施方式中,该加载单元305,用于:
获取目标实体信息的上下文信息,根据该上下文信息确定该目标实体信息匹配的目标槽位;
当该目标槽位上存在历史实体信息时,生成提示控件,以提示用户是否通过目标实体信息替换该历史实体信息;
当该目标槽位上不存在历史实体信息时,将该目标实体信息加载至匹配的目标槽位上。
生成单元306,用于根据加载后匹配的目标槽位生成答复策略。
其中,生成单元306可以根据加载后的目标槽位生成答复策略进行灵活性回答,例如,根据加载后的目标槽位出发地“深圳”生成相应的答复策略,该答复策略可以为预先生成的针对不同的目标槽位对应不同的答复内容,例如“深圳包括2个火车站、2个高铁站和一个飞机场,您想什么时间从哪里出发呢”,假设加载后的目标槽位目的地和时间分别为“北京”和“明天”,答复内容可以为“北京明天的温度为30度,注意防暑,您具体从哪里出发呢”。
在一些实施方式中,该装置还包括转化单元,用于:记录预设实体信息关联的隐藏实体信息,生成语言信息库;当检测到目标槽位上的目标实体信息为预设实体信息时,将该目标槽位上的目标实体信息转化为隐藏实体信息。
以上各个单元的具体实施可参见前面的实施例,在此不再赘述。
由上述可知,本申请实施例通过获取单元301获取用户输入的语言信息;解析单元302对语言信息进行解析,确定目标意图;确定单元303根据目标意图确定出相应的目标槽位集合;分词单元304对语言信息进行分词操作,得到目标实体信息;加载单元305获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上;生成单元306根据加载后匹配的目标槽位生成答复策略。以此,通过解析用户的目标意图确定相应的目标槽位集合,获取语言信息进行分词,得到目标实体信息,将该目标实体信息加载至适配的目标槽位上,根据加载后的目标槽位生成实时的答复策略进行答复,直至将目标槽位集合全部加载完毕,完成智能对话,极大的提升了信息处理的效率和灵活性。本申请实施例还提供一种计算机设备,如图6所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图6中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;可选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
计算机设备还包括给各个部件供电的电源403,可选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
计算机设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现前述实施例提供的各种方法步骤,如下:
获取用户输入的语言信息;对该语言信息进行解析,确定目标意图;根据该目标意图确定出相应的目标槽位集合,该目标槽位集合中包括至少一个目标槽位;对该语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据该上下文信息将该目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对信息处理方法的详细描述,此处不再赘述。
由上述可知,本申请实施例的计算机设备可以通过获取用户输入的语言信息;对语言信息进行解析,确定目标意图;根据目标意图确定出相应的目标槽位集合;对语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据上下文信息将目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。以此,通过解析用户的目标意图确定相应的目标槽位集合,获取语言信息进行分词,得到目标实体信息,将该目标实体信息加载至适配的目标槽位上,根据加载后的目标槽位生成实时的答复策略进行答复,直至将目标槽位集合全部加载完毕,完成智能对话,极大的提升了信息处理的效率和灵活性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种信息处理方法中的步骤。例如,该指令可以执行如下步骤:
获取用户输入的语言信息;对该语言信息进行解析,确定目标意图;根据该目标意图确定出相应的目标槽位集合,该目标槽位集合中包括至少一个目标槽位;对该语言信息进行分词操作,得到目标实体信息;获取目标实体信息的上下文信息,根据该上下文信息将该目标实体信息加载至匹配的目标槽位上;根据加载后匹配的目标槽位生成答复策略。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种信息处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种信息处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种信息处理方法、装置及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
获取用户输入的语言信息;
对所述语言信息进行解析,确定目标意图;
根据所述目标意图确定出相应的目标槽位集合,所述目标槽位集合中包括至少一个目标槽位;
对所述语言信息进行分词操作,得到目标实体信息;
获取目标实体信息的上下文信息,根据所述上下文信息将所述目标实体信息加载至匹配的目标槽位上;
根据加载后匹配的目标槽位生成答复策略。
2.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述上下文信息将所述目标实体信息加载至匹配的目标槽位上的步骤,包括:
根据所述上下文信息确定所述目标实体信息匹配的目标槽位;
当所述目标槽位上存在历史实体信息时,生成提示控件,以提示用户是否通过目标实体信息替换所述历史实体信息;
当所述目标槽位上不存在历史实体信息时,将所述目标实体信息加载至匹配的目标槽位上。
3.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述上下文信息将所述目标实体信息加载至匹配的目标槽位上的步骤之后,还包括:
记录预设实体信息关联的隐藏实体信息,生成语言信息库;
当检测到目标槽位上的目标实体信息为预设实体信息时,将所述目标槽位上的目标实体信息转化为隐藏实体信息。
4.根据权利要求1至3任一项所述的信息处理方法,其特征在于,所述对所述语言信息进行解析,确定目标意图的步骤,包括:
将所述语言信息中的非文本信息进行删除;
将所述语言信息中预设分词替换为目标分词;
通过自然语言处理模型对处理后的语言信息进行意图识别,确定相应的目标意图。
5.根据权利要求1至3任一项所述的信息处理方法,其特征在于,所述获取用户输入的语言信息的步骤,包括:
接收用户输入的文本;
接收用户输入的语音,将所述语音转化为文本;和/或
接收用户输入的图像,通过光学字符识别将所述图像转化为文本;
将所述文本确定为语言信息。
6.根据权利要求1至3任一项所述的信息处理方法,其特征在于,所述对所述语言信息进行分词操作,得到目标实体信息的步骤,包括:
对所述语言信息进行分句和分词操作,得到多个分词信息;
根据所述多个分词信息的属性进行划分,得到预设属性的目标实体信息。
7.根据权利要求1至3任一项所述的信息处理方法,其特征在于,所述根据所述目标意图确定出相应的目标槽位集合的步骤,包括:
基于预设映射关系,确定所述目标意图对应的目标槽位集合,所述预设映射关系包括目标意图和目标槽位集合的映射关系;
查找目标槽位的历史实体信息列表;
当所述历史实体信息列表中存在历史实体信息时,从所述历史实体信息列表中选择历史实体信息加载至查找的目标槽位上。
8.一种信息处理装置,其特征在于,包括:
获取单元,用于获取用户输入的语言信息;
解析单元,用于对所述语言信息进行解析,确定目标意图;
确定单元,用于根据所述目标意图确定出相应的目标槽位集合,所述目标槽位集合中包括至少一个目标槽位;
分词单元,用于对所述语言信息进行分词操作,得到目标实体信息;
加载单元,用于获取目标实体信息的上下文信息,根据所述上下文信息将所述目标实体信息加载至匹配的目标槽位上;
生成单元,用于根据加载后匹配的目标槽位生成答复策略。
9.根据权利要求8所述的信息处理装置,其特征在于,所述加载单元,用于:
获取目标实体信息的上下文信息,根据所述上下文信息确定所述目标实体信息匹配的目标槽位;
当所述目标槽位上存在历史实体信息时,生成提示控件,以提示用户是否通过目标实体信息替换所述历史实体信息;
当所述目标槽位上不存在历史实体信息时,将所述目标实体信息加载至匹配的目标槽位上。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的信息处理方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010657908.5A CN111723574A (zh) | 2020-07-09 | 2020-07-09 | 一种信息处理方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010657908.5A CN111723574A (zh) | 2020-07-09 | 2020-07-09 | 一种信息处理方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111723574A true CN111723574A (zh) | 2020-09-29 |
Family
ID=72572190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010657908.5A Pending CN111723574A (zh) | 2020-07-09 | 2020-07-09 | 一种信息处理方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111723574A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112562658A (zh) * | 2020-12-04 | 2021-03-26 | 广州橙行智动汽车科技有限公司 | 一种填槽方法和装置 |
CN113239688A (zh) * | 2021-05-24 | 2021-08-10 | 北京中科汇联科技股份有限公司 | 一种条件实体提取方法 |
CN113326367A (zh) * | 2021-06-30 | 2021-08-31 | 四川启睿克科技有限公司 | 基于端到端文本生成的任务型对话方法和系统 |
CN113470625A (zh) * | 2021-06-30 | 2021-10-01 | 西安力传智能技术有限公司 | 语音对话处理方法、装置、设备及存储介质 |
CN113779229A (zh) * | 2021-08-31 | 2021-12-10 | 康键信息技术(深圳)有限公司 | 用户需求识别匹配方法、装置、设备和可读存储介质 |
CN115576435A (zh) * | 2022-12-12 | 2023-01-06 | 深圳市人马互动科技有限公司 | 意图处理方法及相关装置 |
CN116628141A (zh) * | 2023-07-24 | 2023-08-22 | 科大讯飞股份有限公司 | 信息处理方法、装置、设备及存储介质 |
CN117252167A (zh) * | 2023-11-20 | 2023-12-19 | 青岛港国际股份有限公司 | 一种基于语音识别进行资产故障智能提报的方法和系统 |
WO2024002298A1 (zh) * | 2022-07-01 | 2024-01-04 | 华为技术有限公司 | 一种语音指令处理方法、装置、系统以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063035A (zh) * | 2018-07-16 | 2018-12-21 | 哈尔滨工业大学 | 一种面向出行领域的人机多轮对话方法 |
CN110321559A (zh) * | 2019-06-24 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 自然语言问题的答案生成方法、装置及存储介质 |
CN111274368A (zh) * | 2020-01-07 | 2020-06-12 | 北京声智科技有限公司 | 槽位填充方法及装置 |
CN111353027A (zh) * | 2020-02-17 | 2020-06-30 | 深圳数联天下智能科技有限公司 | 聊天机器人中的答案反馈方法、装置、计算机设备和介质 |
-
2020
- 2020-07-09 CN CN202010657908.5A patent/CN111723574A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063035A (zh) * | 2018-07-16 | 2018-12-21 | 哈尔滨工业大学 | 一种面向出行领域的人机多轮对话方法 |
CN110321559A (zh) * | 2019-06-24 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 自然语言问题的答案生成方法、装置及存储介质 |
CN111274368A (zh) * | 2020-01-07 | 2020-06-12 | 北京声智科技有限公司 | 槽位填充方法及装置 |
CN111353027A (zh) * | 2020-02-17 | 2020-06-30 | 深圳数联天下智能科技有限公司 | 聊天机器人中的答案反馈方法、装置、计算机设备和介质 |
Non-Patent Citations (1)
Title |
---|
声智科技: "《智能语音开发》", 31 December 2019, 北京:北京航空航天大学出版社 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112562658A (zh) * | 2020-12-04 | 2021-03-26 | 广州橙行智动汽车科技有限公司 | 一种填槽方法和装置 |
CN113239688A (zh) * | 2021-05-24 | 2021-08-10 | 北京中科汇联科技股份有限公司 | 一种条件实体提取方法 |
CN113239688B (zh) * | 2021-05-24 | 2022-04-08 | 北京中科汇联科技股份有限公司 | 一种条件实体提取方法 |
CN113326367A (zh) * | 2021-06-30 | 2021-08-31 | 四川启睿克科技有限公司 | 基于端到端文本生成的任务型对话方法和系统 |
CN113470625A (zh) * | 2021-06-30 | 2021-10-01 | 西安力传智能技术有限公司 | 语音对话处理方法、装置、设备及存储介质 |
CN113326367B (zh) * | 2021-06-30 | 2023-06-16 | 四川启睿克科技有限公司 | 基于端到端文本生成的任务型对话方法和系统 |
CN113779229A (zh) * | 2021-08-31 | 2021-12-10 | 康键信息技术(深圳)有限公司 | 用户需求识别匹配方法、装置、设备和可读存储介质 |
WO2024002298A1 (zh) * | 2022-07-01 | 2024-01-04 | 华为技术有限公司 | 一种语音指令处理方法、装置、系统以及存储介质 |
CN115576435A (zh) * | 2022-12-12 | 2023-01-06 | 深圳市人马互动科技有限公司 | 意图处理方法及相关装置 |
CN116628141B (zh) * | 2023-07-24 | 2023-12-01 | 科大讯飞股份有限公司 | 信息处理方法、装置、设备及存储介质 |
CN116628141A (zh) * | 2023-07-24 | 2023-08-22 | 科大讯飞股份有限公司 | 信息处理方法、装置、设备及存储介质 |
CN117252167A (zh) * | 2023-11-20 | 2023-12-19 | 青岛港国际股份有限公司 | 一种基于语音识别进行资产故障智能提报的方法和系统 |
CN117252167B (zh) * | 2023-11-20 | 2024-02-06 | 青岛港国际股份有限公司 | 一种基于语音识别进行资产故障智能提报的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723574A (zh) | 一种信息处理方法、装置及计算机可读存储介质 | |
CN107943998B (zh) | 一种基于知识图谱的人机对话控制系统及方法 | |
CN106777018B (zh) | 一种智能聊天机器人中对输入语句的优化方法及装置 | |
US20190294676A1 (en) | Written-modality prosody subsystem in a natural language understanding (nlu) framework | |
WO2018157700A1 (zh) | 对话生成方法、装置及存储介质 | |
US20130246392A1 (en) | Conversational System and Method of Searching for Information | |
TW201935273A (zh) | 語句的使用者意圖識別方法和裝置 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
KR20170047268A (ko) | 오펀 발화 검출 시스템 및 방법 | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
CN106575292A (zh) | 用于跨应用填写表单的命名实体的概念识别和捕获 | |
WO2020253064A1 (zh) | 语音的识别方法及装置、计算机设备、存储介质 | |
WO2020006827A1 (zh) | 一种智能应答的方法和装置 | |
KR20200006107A (ko) | 다수의 코퍼스들로부터 응답 정보 획득 | |
WO2017000809A1 (zh) | 一种语言交互方法 | |
US10586237B2 (en) | Method, apparatus, and computer-readable media for customer interaction semantic annotation and analytics | |
US20210151039A1 (en) | Method and apparatus for speech interaction, and computer storage medium | |
JP7204801B2 (ja) | ニューラルネットワークに基づくマンマシンインタラクション方法、装置、及び媒体 | |
CN111767385A (zh) | 一种智能问答方法及装置 | |
CN111930912A (zh) | 对话管理方法及系统、设备和存储介质 | |
CN111026840A (zh) | 文本处理方法、装置、服务器和存储介质 | |
CN109165286A (zh) | 自动问答方法、装置及计算机可读存储介质 | |
CN111858875A (zh) | 智能交互方法、装置、设备及存储介质 | |
CN109147792A (zh) | 一种语音简历系统 | |
CN117494814A (zh) | 提示词全生命周期管理方法、系统、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |