CN109683727B - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN109683727B
CN109683727B CN201811602331.7A CN201811602331A CN109683727B CN 109683727 B CN109683727 B CN 109683727B CN 201811602331 A CN201811602331 A CN 201811602331A CN 109683727 B CN109683727 B CN 109683727B
Authority
CN
China
Prior art keywords
user
input
session
character
input character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811602331.7A
Other languages
English (en)
Other versions
CN109683727A (zh
Inventor
程其江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201811602331.7A priority Critical patent/CN109683727B/zh
Publication of CN109683727A publication Critical patent/CN109683727A/zh
Application granted granted Critical
Publication of CN109683727B publication Critical patent/CN109683727B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种数据处理方法及装置,方法包括:获得第一用户在输入区域中输入或待输入的第一输入字符,所述第一用户与至少一个第二用户进行会话交互;在候选语句中筛选出与所述第一输入字符相关联的第一目标候选语句;其中,所述候选语句基于所述第一用户当前会话的上下文信息生成,用以提示所述第一用户进行会话交互;将所述第一目标候选语句以区别于所述第一输入字符的方式显示在所述输入区域中的所述第一输入字符之后。

Description

一种数据处理方法及装置
技术领域
本申请涉及通信与电子技术领域,尤其涉及一种数据处理方法及装置。
背景技术
在客服机器人的聊天系统中,用户对字符的输入是需要耗费一定时间的,例如,用户输入“请问什么时候到货”时,需要用户挨个输入每个字符,明显会增加用户输入字符时长,导致用户输入效率较低。
发明内容
有鉴于此,本申请提供一种数据处理方法及装置,用以解决现有技术中输入效率较低的技术问题。
本申请提供了一种数据处理方法,包括:
获得第一用户在输入区域中输入或待输入的第一输入字符,所述第一用户与至少一个第二用户进行会话交互;
在候选语句中筛选出与所述第一输入字符相关联的第一目标候选语句;
其中,所述候选语句基于所述第一用户当前会话的上下文信息生成,用以提示所述第一用户进行会话交互;
将所述第一目标候选语句以区别于所述第一输入字符的方式显示在所述输入区域中的所述第一输入字符之后。
上述方法,优选的,还包括:
获得所述第一用户在所述输入区域的第二输入字符,所述第二输入字符与为所述第一输入字符之后的输入字符;
在所述候选语句中筛选出与所述第一输入字符和所述第二输入字符相关联的第二目标候选语句,所述第二目标候选语句与所述第一目标候选语句具有至少一个字符不同;
将所述第二目标候选语句替换所述第一目标候选语句。
上述方法,优选的,所述第二目标候选语句和所述第二输入字符所组成的语句语义与所述第一目标候选语句的语义相对应。
上述方法,优选的,所述候选语句基于所述第一用户当前会话的上下文信息生成,具体包括:
获得所述第一用户的用户画像,所述用户画像表征第一用户对语句的输入方式;
结合所述用户画像,基于所述上下文信息,生成至少一条候选语句。
上述方法,优选的,所述候选语句基于所述第一用户当前会话的上下文信息生成,具体包括:
基于所述上下文信息,确定所述第一用户的下一个会话状态所处的会话领域;
获得所述会话领域对应的领域知识图谱,所述领域知识图谱包括至少一条语句;
在所述领域知识图谱中,提取出至少一条所述语句作为候选语句。
上述方法,优选的,还包括:
在所述候选语句中没有筛选出目标候选语句的情况下,在预设的通用字典中筛选与所述第一输入字符相关联的目标候选语句。
上述方法,优选的,基于所述上下文信息,确定所述第一用户的下一个会话状态所处的会话领域,包括:
获得所述第一用户的历史会话信息;
基于所述历史会话信息,确定所述上下文信息所对应的下一个会话状态;
确定所述下一个会话状态对应的会话领域。
上述方法,优选的,基于所述历史会话信息,确定所述上下文信息所对应的下一个会话状态,包括:
利用预设的会话状态机,对所述历史会话信息中的会话状态信息进行分析,以确定所述上下文信息所对应的下一个会话状态。
上述方法,优选的,所述第一输入字符包括:基于所述第一用户输入的字符元素所生成的至少一个候选字符。
本申请还提供了一种数据处理装置,包括:
字符获得单元,用于获得第一用户在输入区域中输入或待输入的第一输入字符,所述第一用户与至少一个第二用户进行会话交互;
语句筛选单元,用于在候选语句中筛选出与所述第一输入字符相关联的第一目标候选语句;
其中,所述候选语句基于所述第一用户当前会话的上下文信息生成,用以提示所述第一用户进行会话交互;
显示单元,用于将所述第一目标候选语句以区别于所述第一输入字符的方式显示在所述输入区域中的所述第一输入字符之后。
上述装置,优选的,字符获得单元还用于:获得所述第一用户在所述输入区域的第二输入字符,所述第二输入字符与为所述第一输入字符之后的输入字符;
所述语句筛选单元还用于:在所述候选语句中筛选出与所述第一输入字符和所述第二输入字符相关联的第二目标候选语句,所述第二目标候选语句与所述第一目标候选语句具有至少一个字符不同;
所述显示单元还用于将所述第二目标候选语句替换所述第一目标候选语句。
上述装置,优选的,所述第二目标候选语句和所述第二输入字符所组成的语句语义与所述第一目标候选语句的语义相对应。
上述装置,优选的,所述语句筛选单元基于所述第一用户当前会话的上下文信息生成所述候选语句,具体包括:
获得所述第一用户的用户画像,所述用户画像表征第一用户对语句的输入方式;
结合所述用户画像,基于所述上下文信息,生成至少一条候选语句。
上述装置,优选的,所述语句筛选单元基于所述第一用户当前会话的上下文信息生成所述候选语句,具体包括:
基于所述上下文信息,确定所述第一用户的下一个会话状态所处的会话领域;
获得所述会话领域对应的领域知识图谱,所述领域知识图谱包括至少一条语句;
在所述领域知识图谱中,提取出至少一条所述语句作为候选语句。
上述装置,优选的,所述语句筛选单元还用于:
在所述候选语句中没有筛选出目标候选语句的情况下,在预设的通用字典中筛选与所述第一输入字符相关联的目标候选语句。
上述装置,优选的,所述语句筛选单元基于所述上下文信息,确定所述第一用户的下一个会话状态所处的会话领域,包括:
获得所述第一用户的历史会话信息;
基于所述历史会话信息,确定所述上下文信息所对应的下一个会话状态;
确定所述下一个会话状态对应的会话领域。
上述装置,优选的,所述语句筛选单元基于所述历史会话信息,确定所述上下文信息所对应的下一个会话状态,包括:
利用预设的会话状态机,对所述历史会话信息中的会话状态信息进行分析,以确定所述上下文信息所对应的下一个会话状态。
上述装置,优选的,所述第一输入字符包括:基于所述第一用户输入的字符元素所生成的至少一个候选字符。
从上述技术方案可以看出,本申请公开的一种数据处理方法及装置,在获得到用户在输入区域中的第一输入字符之后,通过在基于用户当前会话的上下文信息生成的候选语句中筛选与第一输入字符相关联的目标候选语句,从而将目标候选语句以区别于第一输入字符的方式显示在输入区域中的第一输入字符之后。可见,本申请中,用户只需输入第一输入字符,就可以在输入区域中显示与第一输入字符相关联的目标候选语句,从而减少用户的输入操作,进一步减少用户输入字符时长,以提高用户输入效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的一种数据处理方法的流程图;
图2、图3a、图3b、图4分别为本申请实施例的示例图;
图5为本申请实施例一的另一流程图;
图6及图7分别为本申请实施例的其他示例图;
图8为本申请实施例一的部分流程图;
图9为本申请实施例二提供的一种数据处理装置的结构示意图;
图10为本申请实施例的其他示例图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1所示,为本申请实施例一提供的一种数据处理方法的实现流程图,用于对用户在输入区域中的字符输入进行处理,以减少用户本身的字符输入操作。
在本实施例中,该方法可以包括以下步骤:
步骤101:获得第一用户在输入区域中输入或待输入的第一输入字符。
其中,第一用户与至少第二用户进行会话交互。如图2中所示,第一用户与第二用户之间具有历史会话信息。例如,客户A与客服人员B就手机售后问题进行会话交互,客户A通过电子设备如笔记本或手机向客服询问保修期限的问题时,客户A在电子设备键盘区域的输入区域中进行输入操作,以在输入区域中生成输入或待输入的第一输入字符。
需要说明的是,第一输入字符可以包括有第一用户在输入区域中确定输入的字符,也可以包含有基于第一用户输入的字符元素所生成的至少一个候选字符。例如,如图3a中所示,第一用户在输入区域中输入“when”,该“when”即为第一输入字符;或者,如图3b中所示,第一用户在输入区域中进行汉字输入时,首先输入拼音“shenme”,其对应的待输入汉字“什么”,此时“什么”即为待输入的第一输入字符,或者,首先输入“b”,其对应的待输入汉字包括“吧”、“不”、“并”、“被”等,此时这些字或者词即为待输入的第一输入字符。
步骤102:在候选语句中筛选出与第一输入字符相关联的第一目标候选语句。
其中,候选语句基于第一用户当前会话的上下文信息生成,用以提示第一用户进行会话交互。
需要说明的是,第一用户的当前会话是指第一用户与第二用户之间当前正在进行的会话,第一用户当前会话的上下文信息是指第一用户与第二用户之间进行会话的内容上下文信息,例如,第一用户与第二用户在就手机的售后问题所进行的会话的上下文信息等。本实施例中基于第一用户与第二用户当前会话的上下文信息生成候选语句,这些候选语句表征第一用户进行字符输入的意图。由此,本实施例中在候选语句中筛选出与第一输入字符相关联的第一目标候选语句。
其中,第一目标候选语句中至少包括一个字符,这些字符中可以包括有汉字字符、字母字符、数字字符及特殊符号字符等中的一种或多种组合。
步骤103:将第一目标候选语句以区别于第一输入字符的方式显示在输入区域中的第一输入字符之后。
如图4中所示,第一输入字符在输入区域中具有第一显示方式,如黑色字体,相应的,第一目标候选语句在第一输入字符之后显示,并具有第二显示方式,如红色字体,以区别于用户本身所输入的第一输入字符。
由上述方案可知,本申请实施例一提供的一种数据处理方法,在获得到用户在输入区域中的第一输入字符之后,通过在基于用户当前会话的上下文信息生成的候选语句中筛选与第一输入字符相关联的目标候选语句,从而将目标候选语句以区别于第一输入字符的方式显示在输入区域中的第一输入字符之后。可见,本实施例中,用户只需输入第一输入字符,就可以在输入区域中显示与第一输入字符相关联的目标候选语句,从而减少用户的输入操作,进一步减少用户输入字符时长,以提高用户输入效率。
基于以上方案,本实施例中在基于第一用户当前会话的上下文信息所生成的候选语句中筛选出第一目标候选语句中,将第一目标候选语句显示在第一输入字符之后,此时用户点击发送或者保存等按键,就可以将第一输入字符及第一目标候选语句作为第一用户输入的字符内容进行发送或者进行保存等操作处理,可见,本实施例中的第一目标候选语句显示在输入区域中,区别于在汉字字符输入过程中所输入拼音对应的候选字符,由此,本实施例中无需第一用户在第一目标候选语句显示在输入区域之后再次进行选中等操作,就可以将第一目标候选语句作为第一用户的输入内容。
在一种实现方式中,本实施例在步骤103之后,还可以包括以下步骤,如图5中所示:
步骤104:获得第一用户在输入区域的第二输入字符。
其中,第二输入字符与第一输入字符之后的输入字符。也就是说,第一用户在输入区域中输入第一输入字符,之后,本实施例中将筛选出的第一目标候选语句显示在第一输入字符的后面,此时,如果第一用户对第一目标候选语句不满意,例如,第一目标候选语句中的语义描述方式并不能符合第一用户的字符输入意图,那么第一用户继续在第一输入字符之后输入第二输入字符,而此时第一目标候选语句不再继续显示在输入区域中,而是被第一用户输入的第二输入字符替代。
步骤105:在候选语句中筛选出与第一输入字符和第二输入字符相关联的第二目标候选语句。
其中,第二目标候选语句与第一目标候选语句具有至少一个字符不同。也就是说,在第一用户输入第一输入字符和第二输入字符之后,本实施例中将第一输入字符和第二输入字符作为整体,视为第一用户在输入区域中输入的字符,并在候选语句中筛选与第一输入字符和第二输入字符作为整体时所对应的第二目标候选语句,由此,由于被筛选的输入字符发生变化:从第一输入字符变化为第一输入字符和第二输入字符,相应的,在候选语句中所筛选出的第二目标候选语句也可能随之变化,由此,在本实施例中优选的情况下,第二目标候选语句与第一目标候选语句至少存在一个字符是不同的。当然,也可能存在以下情况:第二目标候选语句与第一目标候选语句相同。
步骤106:将第二目标候选语句替换第一目标候选语句。
其中,本实施例中将第二目标候选语句替换第一目标候选语句可以理解为:将第一目标候选语句不再显示在输入区域中第一输入字符之后,而是将第二目标候选语句显示在第二输入字符之后,而第二输入字符在第一输入字符之后,如图6中所示,此时,第一用户本身在输入区域中输入有第一输入字符和第二输入字符,而在第二输入字符之后自动显示筛选出的第二目标候选语句。
在具体实现中,第二目标候选语句和第二输入字符所组成的语句语义与第一目标候选语句的语义相对应,可以理解为语义是相同的,只是在语句的描述方式上不同。例如,第一输入字符和第一目标候选语句所组成的语义与第一输入字符、第二输入字符和第二目标候选语句所组成的语义相同,但两者对表达这一语义所采用的字符描述方式不同,如“我(第一输入字符)喜欢这个手机(第一目标候选语句)”和“我(第一输入字符)不(第二输入字符)讨厌这个手机(第二目标候选语句)”,可见,语义相同但描述方式不同,如图7中所示。
在一种实现方式中,本实施例中的候选语句基于第一用户当前的上下文信息所生成,具体可以通过以下方式实现:
首先,获得第一用户的用户画像。
其中,用户画像表征第一用户对语句的输入方式,如第一用户的性格使得在表达“喜欢这个手机”时的表达方式等,如第一用户偏向使用文言文表达方式、撒娇的表达方式或白话文陈述等等。而本实施例中可以通过获取第一用户的用户信息如生日、星座及生肖等等来进行数据分析,以得到第一用户的用户画像。
之后,在获得第一用户的用户画像之后,结合用户画像,基于第一用户当前会话的上下文信息生成至少一条候选语句,例如,第一用户在当前会话的上下文信息中表征第一用户即将表达对手机的喜好,此时结合第一用户的用户画像,生成候选语句:“喜欢这个手机”、“不讨厌这个手机”及“感觉这个手机不错”等等。
在另一种实现方式中,本实施例中的候选语句基于第一用户当前的上下文信息所生成,也可以通过以下步骤实现,如图8中所示:
步骤801:基于第一用户当前会话的上下文信息,确定第一用户的下一个会话状态所处的会话领域。
其中,本实施例中可以通过对第一用户所在设备中进行会话交互所产生的cookie信息进行获取,并在cookie信息中提取出第一用户的身份信息,进而利用第一用户的身份信息在缓存库中提取到第一用户进行会话的上下文信息,进而基于这些上下文信息确定第一用户的下一个会话状态所处的会话领域。
具体的,本实施例中在基于第一用户当前会话的上下文信息,确定第一用户的下一个会话状态所处的会话领域时,具体可以通过以下方式实现:
首先,获得第一用户的历史会话信息。例如,利用第一用户的身份信息在缓存库中提取到第一用户的历史会话信息:第一用户与哪些用户进行过会话,以及第一用户与这些用户之间的会话内容信息,等等。
之后,基于历史会话信息,确定上下文信息所对应的下一个会话状态。本实施例中可以利用预先设置的会话状态机,对历史会话信息中的会话状态信息进行分析,以确定上下文信息所对应的下一个会话状态。例如,在第一用户与客服的对话管理中,预先配置会话状态切换的状态机,对于第一用户进行对话的路径,如从哪一步到哪一步,再进入哪一步的会话,会话状态机基于历史会话信息对第一用户当前会话的下一个会话状态进行腿短,从而确定第一用户的下一个会话状态。
最后,确定下一个会话状态所对应的会话领域。例如,在确定下一个会话状态之后,对会话状态中所涉及的会话内容进行分析,以得到这些会话内容所对应的会话领域,如手机售后或者歌曲推荐等领域。
需要说明的是,本实施例中所确定的会话领域也可以理解为第一用户在当前会话中的会话意图,即表征第一用户在接下来的会话中可能会进行的会话状态或方式等意图。
步骤802:获得会话领域对应的领域知识图谱。
其中,领域知识图谱包括至少一条语句。
具体的,本实施例中可以通过匹配器在预设的领域知识图库中提取出第一用户的下一个会话状态所处的会话领域所对应的所有知识内容,即各种候选词条或语句等,将这些候选的词条或语句建立成一个领域字典树,即领域知识图谱,以表征第一用户的下一个会话状态中所有可能进行的会话语句图谱。
步骤803:在领域知识图谱中,提取出至少一条语句作为候选语句。
其中,本实施例中可以选取领域知识图谱中的所有或部分语句作为候选语句,以提供给后续进行第一输入字符和/或第二输入字符的语句匹配。即:在候选语句中,对第一用户在输入区域中的第一输入字符进行匹配,以筛选出第一目标候选语句作为对第一用户进行字符输入的输入提示内容,以区别于第一输入字符的方式显示在输入区域中第一输入字符的后面;或者,在候选语句中,对第一用户在输入区域中的第一输入字符和第二输入字符作为整体进行匹配,以筛选出第二目标候选语句作为对第一用户进行字符输入的输入提示内容,以区别于第一输入字符和第二输入字符的方式显示在输入区域中第二输入字符的后面。
在一种实现方式中,本实施例中如果在候选语句中没有筛选出与第一输入字符相关联的第一目标候选语句或者在候选语句中没有筛选出与第一输入字符和第二输入字符作为整体相关联的第二目标候选语句的情况下,本实施例中可以在预设的通用词典中筛选出与第一输入字符相关联的目标候选语句,在通用词典中筛选出第一输入字符和第二输入字符作为整体相关联的目标候选语句,由此,用以对第一用户进行会话进行输入提示,以减少第一用户的输入操作,提高输入效率。
参考图9,为本申请实施例二提供的一种数据处理装置的结构示意图,该装置可以用于对用户在输入区域中的字符输入进行处理,以减少用户本身的字符输入操作。
在本实施例中,该装置可以包括以下结构:
字符获得单元901,用于获得第一用户在输入区域中输入或待输入的第一输入字符。
其中,第一用户与至少第二用户进行会话交互。如图2中所示,第一用户与第二用户之间具有历史会话信息。例如,客户A与客服人员B就手机售后问题进行会话交互,客户A通过电子设备如笔记本或手机向客服询问保修期限的问题时,客户A在电子设备的输入区域中进行输入操作,以在输入区域中生成输入或待输入的第一输入字符。
需要说明的是,第一输入字符可以包括有第一用户在输入区域中确定输入的字符,也可以包含有基于第一用户输入的字符元素所生成的至少一个候选字符。如图3a中所示,第一用户在输入区域中输入“when”,该“when”即为第一输入字符;或者如图3b中所示,第一用户在输入区域中进行汉字输入时,首先输入拼音“shenme”,其对应的待输入汉字“什么”,此时“什么”即为待输入的第一输入字符,或者,首先输入“b”,其对应的待输入汉字包括“吧”、“不”、“并”、“被”等,此时这些字或者词即为待输入的第一输入字符。
语句筛选单元902,用于在候选语句中筛选出与所述第一输入字符相关联的第一目标候选语句。
其中,候选语句基于第一用户当前会话的上下文信息生成,用以提示第一用户进行会话交互。
需要说明的是,第一用户的当前会话是指第一用户与第二用户之间当前正在进行的会话,第一用户当前会话的上下文信息是指第一用户与第二用户之间进行会话的内容上下文信息,例如,第一用户与第二用户在就手机的售后问题所进行的会话的上下文信息等。本实施例中基于第一用户与第二用户当前会话的上下文信息生成候选语句,这些候选语句表征第一用户进行字符输入的意图。由此,本实施例中在候选语句中筛选出与第一输入字符相关联的第一目标候选语句。
其中,第一目标候选语句中至少包括一个字符,这些字符中可以包括有汉字字符、字母字符、数字字符及特殊符号字符等中的一种或多种组合。
显示单元903,用于将所述第一目标候选语句以区别于所述第一输入字符的方式显示在所述输入区域中的所述第一输入字符之后。
如图4中所示,第一输入字符在输入区域中具有第一显示方式,如黑色字体,相应的,第一目标候选语句在第一输入字符之后显示,并具有第二显示方式,如红色字体,以区别于用户本身所输入的第一输入字符。
由上述方案可知,本申请实施例二提供的一种数据处理装置,在获得到用户在输入区域中的第一输入字符之后,通过在基于用户当前会话的上下文信息生成的候选语句中筛选与第一输入字符相关联的目标候选语句,从而将目标候选语句以区别于第一输入字符的方式显示在输入区域中的第一输入字符之后。可见,本实施例中,用户只需输入第一输入字符,就可以在输入区域中显示与第一输入字符相关联的目标候选语句,从而减少用户的输入操作,进一步减少用户输入字符时长,以提高用户输入效率。
基于以上方案,本实施例中在基于第一用户当前会话的上下文信息所生成的候选语句中筛选出第一目标候选语句中,将第一目标候选语句显示在第一输入字符之后,此时用户点击发送或者保存等按键,就可以将第一输入字符及第一目标候选语句作为第一用户输入的字符内容进行发送或者进行保存等操作处理,可见,本实施例中的第一目标候选语句显示在输入区域中,区别于在汉字字符输入过程中所输入拼音对应的候选字符,如图5中所示,由此,本实施例中无需第一用户在第一目标候选语句显示在输入区域之后再次进行选中等操作,就可以将第一目标候选语句作为第一用户的输入内容。
在一种实现方式中,本实施例的字符获得单元901还可以用于:获得所述第一用户在所述输入区域的第二输入字符,所述第二输入字符与为所述第一输入字符之后的输入字符;之后,在所述候选语句中筛选出与所述第一输入字符和所述第二输入字符相关联的第二目标候选语句,所述第二目标候选语句与所述第一目标候选语句具有至少一个字符不同;将所述第二目标候选语句替换所述第一目标候选语句。
其中,所述第二目标候选语句和所述第二输入字符所组成的语句语义与所述第一目标候选语句的语义相对应。
在一种实现方式中,所述候选语句基于所述第一用户当前会话的上下文信息生成,具体包括:
获得所述第一用户的用户画像,所述用户画像表征第一用户对语句的输入方式;结合所述用户画像,基于所述上下文信息,生成至少一条候选语句。
或者,所述候选语句基于所述第一用户当前会话的上下文信息生成,也可以通过以下方式实现:
基于所述上下文信息,确定所述第一用户的下一个会话状态所处的会话领域;获得所述会话领域对应的领域知识图谱,所述领域知识图谱包括至少一条语句;在所述领域知识图谱中,提取出至少一条所述语句作为候选语句。
需要说明的是,本实施例中数据处理装置各单元的具体实现可以参考前文中相关内容,此处不再详述。
以下以用户在智能客服的聊天系统中进行字符输入为例,对以上本实施例中的技术方案进行举例说明:
如图10中所示,本实施例中在智能客服对话系统的客户端实时获取用户输入字符,传给服务器端的输入接收器,输入接收器进行转码等数据处理。
具体的,本实施例中在获取到用户输入字符之后,从cookie信息中提出用户身份ID(identification),利用用户ID在缓存库中提取该用户对话上下文信息,进一步抽取该用户历史对话的会话状态、领域和意图。
在智能客服的对话管理系统中,预先配置了会话状态切换的状态机。会话状态机根据用户之前历史的会话状态推断出在状态机里下一个会话状态,进而取出本轮的领域和意图。
之后,利用匹配器在领域知识图库中,提取该意图的所有知识作为输入的候选集,再把所有的候选词条建立一个领域字典树。
然后,将用户输入的前缀即用户在输入区域中的输入字符到领域字典树中检索候选集,如果检索结果不为空,检索结果作为输入提示内容;如果检索结果为空,再次从通用字典中用用户输入的前缀检索,并把检索结果作为提示内容。
最后,输出转化器把提示内容作各种格式转化,最终展示到终端,从而为用户提供输入内容的补全处理,减少用户输入操作,提高输入效率。
以下为举例说明:
在用户的历史会话中,存在第一轮会话,如下:
用户问题User question:connect to wifi
客服回复Bot answer:Please provide your phone model,for example"MotoG5Plus"or"Moto Z2Play".
To acquire your phone's model,go to:Settings app->About phone->checkModel number.You can also check your phone's retail package.
在用户的当前会话中,用户输入以下字符:
User question:m
在历史会话中,会话状态机经历how_to状态、slotNotFull状态、waitUserInput状态,其中,自然语言理解的内容:domain":"how_to","intentCode":"ht_wifi。
由此,在用户的当前会话中,从历史会话记录可判断本轮domain":"how_to","intentCode":"ht_wifi”需要填充机型slot。
查询机型领域知识图库,能获得用户输入提示候选集合:Moto G5Plus,MotoZ2Play…;然后用提示候选集合构造领域字典树;最后用户输入的字符m在领域字典树中能准确搜索提示内容。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种数据处理方法,包括:
获得第一用户在输入区域中输入或待输入的第一输入字符,所述第一用户与至少一个第二用户进行会话交互;
在候选语句中筛选出与所述第一输入字符相关联的第一目标候选语句;
其中,所述候选语句基于所述第一用户当前会话的上下文信息生成,用以提示所述第一用户进行会话交互,其中包括:基于所述上下文信息,确定所述第一用户的下一个会话状态,根据所述下一个会话状态中涉及的会话内容,确定所述下一个会话状态所处的会话领域,获得所述会话领域对应的领域知识图谱,所述领域知识图谱包括至少一条语句,在所述领域知识图谱中,提取出至少一条所述语句作为候选语句,所述会话领域为第一用户在当前会话中的会话意图,表征第一用户在接下来的会话中会进行的会话状态或方式的意图;
将所述第一目标候选语句以区别于所述第一输入字符的方式显示在所述输入区域中的所述第一输入字符之后。
2.根据权利要求1所述的方法,还包括:
获得所述第一用户在所述输入区域的第二输入字符,所述第二输入字符与为所述第一输入字符之后的输入字符;
在所述候选语句中筛选出与所述第一输入字符和所述第二输入字符相关联的第二目标候选语句,所述第二目标候选语句与所述第一目标候选语句具有至少一个字符不同;
将所述第二目标候选语句替换所述第一目标候选语句。
3.根据权利要求2所述的方法,所述第二目标候选语句和所述第二输入字符所组成的语句语义与所述第一目标候选语句的语义相对应。
4.根据权利要求1所述的方法,所述候选语句基于所述第一用户当前会话的上下文信息生成,具体包括:
获得所述第一用户的用户画像,所述用户画像表征第一用户对语句的输入方式;
结合所述用户画像,基于所述上下文信息,生成至少一条候选语句。
5.根据权利要求1或2所述的方法,还包括:
在所述候选语句中没有筛选出目标候选语句的情况下,在预设的通用字典中筛选与所述第一输入字符相关联的目标候选语句。
6.根据权利要求1所述的方法,基于所述上下文信息,确定所述第一用户的下一个会话状态,包括:
获得所述第一用户的历史会话信息;
基于所述历史会话信息,确定所述上下文信息所对应的下一个会话状态。
7.根据权利要求6所述的方法,基于所述历史会话信息,确定所述上下文信息所对应的下一个会话状态,包括:
利用预设的会话状态机,对所述历史会话信息中的会话状态信息进行分析,以确定所述上下文信息所对应的下一个会话状态。
8.根据权利要求1或2所述的方法,所述第一输入字符包括:基于所述第一用户输入的字符元素所生成的至少一个候选字符。
9.一种数据处理装置,包括:
字符获得单元,用于获得第一用户在输入区域中输入或待输入的第一输入字符,所述第一用户与至少一个第二用户进行会话交互;
语句筛选单元,用于在候选语句中筛选出与所述第一输入字符相关联的第一目标候选语句;
其中,所述候选语句基于所述第一用户当前会话的上下文信息生成,用以提示所述第一用户进行会话交互,其中包括:基于所述上下文信息,确定所述第一用户的下一个会话状态,根据所述下一个会话状态中涉及的会话内容,确定所述下一个会话状态所处的会话领域,获得所述会话领域对应的领域知识图谱,所述领域知识图谱包括至少一条语句,在所述领域知识图谱中,提取出至少一条所述语句作为候选语句,所述会话领域为第一用户在当前会话中的会话意图,表征第一用户在接下来的会话中会进行的会话状态或方式的意图;
显示单元,用于将所述第一目标候选语句以区别于所述第一输入字符的方式显示在所述输入区域中的所述第一输入字符之后。
CN201811602331.7A 2018-12-26 2018-12-26 一种数据处理方法及装置 Active CN109683727B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811602331.7A CN109683727B (zh) 2018-12-26 2018-12-26 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811602331.7A CN109683727B (zh) 2018-12-26 2018-12-26 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN109683727A CN109683727A (zh) 2019-04-26
CN109683727B true CN109683727B (zh) 2021-07-16

Family

ID=66189736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811602331.7A Active CN109683727B (zh) 2018-12-26 2018-12-26 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN109683727B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400475A (zh) * 2020-03-24 2020-07-10 联想(北京)有限公司 信息处理方法、装置和电子设备
CN111753073A (zh) * 2020-06-29 2020-10-09 北京联想软件有限公司 一种会话交互的处理方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103455A (zh) * 2009-12-18 2011-06-22 上海智问软件技术有限公司 一种基于交互输入的智能提示系统及其实现方法
CN102902362A (zh) * 2011-07-25 2013-01-30 腾讯科技(深圳)有限公司 文字输入方法及系统
CN103488796A (zh) * 2013-10-12 2014-01-01 惠州Tcl移动通信有限公司 根据上下文输入的方法及移动终端
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105138671A (zh) * 2015-09-07 2015-12-09 百度在线网络技术(北京)有限公司 基于人工智能的人机交互的交互引导方法和装置
JP2016186709A (ja) * 2015-03-27 2016-10-27 株式会社ナカヨ 文書作成支援装置、プログラムおよび文書作成支援方法
CN107168546A (zh) * 2017-03-27 2017-09-15 上海奔影网络科技有限公司 输入提示方法及装置
CN107688398A (zh) * 2016-08-03 2018-02-13 中国科学院计算技术研究所 确定候选输入的方法和装置及输入提示方法和装置
CN108170749A (zh) * 2017-12-21 2018-06-15 北京百度网讯科技有限公司 基于人工智能的对话方法、装置及计算机可读介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504051B (zh) * 2014-12-18 2018-04-10 宇龙计算机通信科技(深圳)有限公司 输入提示方法、装置及终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103455A (zh) * 2009-12-18 2011-06-22 上海智问软件技术有限公司 一种基于交互输入的智能提示系统及其实现方法
CN102902362A (zh) * 2011-07-25 2013-01-30 腾讯科技(深圳)有限公司 文字输入方法及系统
CN103488796A (zh) * 2013-10-12 2014-01-01 惠州Tcl移动通信有限公司 根据上下文输入的方法及移动终端
JP2016186709A (ja) * 2015-03-27 2016-10-27 株式会社ナカヨ 文書作成支援装置、プログラムおよび文書作成支援方法
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105138671A (zh) * 2015-09-07 2015-12-09 百度在线网络技术(北京)有限公司 基于人工智能的人机交互的交互引导方法和装置
CN107688398A (zh) * 2016-08-03 2018-02-13 中国科学院计算技术研究所 确定候选输入的方法和装置及输入提示方法和装置
CN107168546A (zh) * 2017-03-27 2017-09-15 上海奔影网络科技有限公司 输入提示方法及装置
CN108170749A (zh) * 2017-12-21 2018-06-15 北京百度网讯科技有限公司 基于人工智能的对话方法、装置及计算机可读介质

Also Published As

Publication number Publication date
CN109683727A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
US10210865B2 (en) Method and apparatus for inputting information
US10685186B2 (en) Semantic understanding based emoji input method and device
US10235680B2 (en) System and method for populating a database with user input
CN104765791A (zh) 一种信息输入方法和装置
KR100810999B1 (ko) 온라인 이메일 서비스 시스템 및 그 방법
KR101982081B1 (ko) 대응 메시지 추천 시스템
CN110765375B (zh) 一种页面跳转方法、装置及系统
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
US20190050376A1 (en) Automatic value formatting based on intrinsic structural semantics
CN109683727B (zh) 一种数据处理方法及装置
KR20110131065A (ko) 웹 질의에서의 온라인 핸드라이팅 인식을 위한 시스템 및 방법
CN114757176A (zh) 一种获取目标意图识别模型的方法以及意图识别方法
CN112905928B (zh) 网页刷新方法、装置、电子设备及存储介质
US20220156823A1 (en) System and method for product searching based on natural language processing
CN106708885A (zh) 一种实现搜索的方法和装置
CN112532507B (zh) 用于呈现表情图像、用于发送表情图像的方法和设备
CN110929014A (zh) 信息处理方法、装置、电子设备及存储介质
CN111552783A (zh) 内容分析查询方法、装置、设备和计算机存储介质
CN112445898A (zh) 对话情感分析方法及装置、存储介质及处理器
CN111897990A (zh) 获取表情信息的方法、装置和系统
CN104778156B (zh) 文本输入方法、文本输入装置及电子设备
CN113722467B (zh) 用户搜索意图的处理方法、系统、装置和存储介质
CN111309990A (zh) 一种语句应答方法及装置
CN108920630B (zh) 一种数据处理方法及电子设备
CN111753073A (zh) 一种会话交互的处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant