CN105912712A - 基于大数据的机器人对话控制方法和系统 - Google Patents

基于大数据的机器人对话控制方法和系统 Download PDF

Info

Publication number
CN105912712A
CN105912712A CN201610281588.1A CN201610281588A CN105912712A CN 105912712 A CN105912712 A CN 105912712A CN 201610281588 A CN201610281588 A CN 201610281588A CN 105912712 A CN105912712 A CN 105912712A
Authority
CN
China
Prior art keywords
statement
search results
robot
chat
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610281588.1A
Other languages
English (en)
Other versions
CN105912712B (zh
Inventor
朱定局
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201610281588.1A priority Critical patent/CN105912712B/zh
Publication of CN105912712A publication Critical patent/CN105912712A/zh
Application granted granted Critical
Publication of CN105912712B publication Critical patent/CN105912712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages

Abstract

本发明涉及一种机器人对话控制方法和系统,通过根据输入语句输入大数据搜索引擎进行搜索,获得搜索结果,将搜索结果中与输入语句匹配度最大的前m条语句作为第一语句,从第一语句中筛选合理性参数最大的语句作为聊天输出语句输出,可筛选出合理的第一语句作为输出语句输出,可提高机器人回复有效性和合理性。采用大数据搜索引擎对输入语句进行搜索,不再是根据人工建立的数据库进行搜索,由于大数据搜索引擎对应的语句是根据大量用户在历史聊天过程中产生的语句,获得的搜索结果更符合实际中用户聊天,从第一语句中筛选符合预设条件的语句更加符合聊天语句,提高机器人回复语句的有效性和真实性。

Description

基于大数据的机器人对话控制方法和系统
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于大数据的机器人对话控制方法和系统。
背景技术
随着机器人技术的快速发展,用户对聊天机器人功能的要求也越来越高。如果用户与聊天机器人聊天时,分不清聊天的对象是人还是聊天机器人,则能通过图灵测试,则说明该聊天机器人具备了人工智能,所以聊天机器人是人工智能的最重要内容之一。
现有聊天机器人,都是基于回复数据库对用户的输入语句进行恢复,数据库中的数据表一般包含两个基本字段,第一个字段是特征字符或词句,第二个字段是自动回复的内容,如图1所示。回复数据库中的内容需要人工增添或导入事先人工制作好的回复文本。人工制作回复数据库的成本非常高,而且无法罗列所有可能的自动回复的内容,因此导致了现有聊天机器人只能对用户的一些常用聊天输入语句进行有效的自动回复,而如果用户的其他聊天输入语句在回复数据库不存在相应特征字符或词句时,聊天机器人则不知道如何回答,而只能进行无效的自动回答,譬如回答“哦”等,如图2所示。而且因为回复数据库是人工构建的,并不是人们自然聊天中产生回复语句,所以有时只是构建者自己构造出来的回复语句,与人们真实的聊天回复语句有一定的差距,大大降低了机器人聊天回复的有效性和真实性。
发明内容
基于此,有必要针对机器人回复语句的有效性和真实性较低的问题,提供一种提高机器人回复语句的有效性和真实性的基于大数据的机器人对话控制方法和系统。
一种机器人对话控制方法,包括以下步骤:
获取输入语句,将所述输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果;
筛选所述搜索结果中与所述输入语句匹配度最大的前m条语句分别作为m条第一语句,其中,所述m为正整数;
分别计算每条所述第一语句的合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出。
本发明还提供一种机器人对话控制系统,包括:
搜索模块,用于获取输入语句,将所述输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果;
第一筛选模块,用于筛选所述搜索结果中与所述输入语句匹配度最大的前m条语句分别作为m条第一语句,其中,所述m为正整数;
第二筛选模块,用于分别计算每条所述第一语句的合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出。
上述机器人对话控制方法和系统,通过根据输入语句输入大数据搜索引擎进行搜索,获得搜索结果,将搜索结果中与输入语句匹配度最大的前m条语句作为第一语句,从m条第一语句中筛选合理性参数最大对应的语句作为聊天输出语句输出,即可筛选出合理的第一语句作为输出语句输出,可提高机器人回复有效性和合理性。采用大数据搜索引擎对输入语句进行搜索,不再是根据人工建立的数据库进行搜索,由于大数据搜索引擎对应的语句是根据大量用户在历史聊天过程中产生的语句,获得的搜索结果更符合实际中用户聊天的语句,且从m条第一语句中筛选合理性参数最大对应的语句则更加符合聊天语句,提高机器人回复语句的有效性和真实性。
附图说明
图1为现有机器人中回复数据库中内容导入图;
图2为现有机器人与用户交互的示意图;
图3为另一种实施方式的机器人对话控制方法的流程图;
图4为另一种实施方式的机器人对话控制方法的流程图;
图5为另一种实施方式的机器人对话控制方法的流程图;
图6为另一种实施方式的机器人对话控制方法的流程图;
图7为另一种实施方式的机器人对话控制方法的流程图;
图8为本发明机器人与用户交互的示意图;
图9为一种实施方式的机器人对话控制系统的模块图;
图10为另一种实施方式的机器人对话控制系统的模块图;
图11为另一种实施方式的机器人对话控制系统的模块图;
图12为另一种实施方式的机器人对话控制系统的模块图;
图13为另一种实施方式的机器人对话控制系统的模块图。
具体实施方式
请参阅图3,提供一种实施方式机器人对话控制方法,包括以下步骤:
S100:获取输入语句,将输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果。
在本实施例中,机器人是指泛义的机器人,包括一切模拟人类行为或思想以及模拟其他生物的机械,也包括一些电脑程序,例如,聊天机器人程序等。在用户需要与机器人进行交互时,用户可向机器人输入语句,从而机器人可获取用户的输入语句,其中,输入语句可以是文字和语音,甚至可以是视频。在本实施例中,输入语句为语音,将输入语句输入至大数据搜索引擎中进行搜索,可获得搜索结果,其中,其中,搜索结果中包括多条语句,搜索结果中语句的条数即是搜索结果的数量,搜索出的这些语句与输入语句相关。其中,搜索是调用大数据搜索引擎自动完成的,大数据搜索引擎包括但不限于baidu(百度)、google(谷歌)和gfsoso(谷粉搜搜)等互联网搜索引擎、局域网搜索引擎、基于数据仓库或数据库的搜索引擎以及机器人自带的搜索引擎。
S200:筛选搜索结果中与输入语句匹配度最大的前m条语句分别作为m条第一语句。
其中,m为正整数。由于根据输入语句进行搜索时,可能会获得较多的搜索结果,有些搜索结果可能不太合理,对全部的数据进行处理时会浪费较多时间,从而需要对搜索结果进行筛选,筛选出较为合理的,即筛选出搜索结果中与输入语句匹配度最大的前m条语句分别作为m条第一语句,即与输入语句匹配度最大的前m条语句是指将与输入语句匹配度按从大到小的顺序排序,排在最前的m条语句。例如,将输入语句输入到百度搜索引擎中进行搜索,根据匹配度从大到小进行排序后的搜索结果显示在页面上,排在越前的搜索结果,表示越合理。
S300:分别计算每条第一语句的合理性参数,并将合理性参数最大对应的第一语句作为聊天输出语句并输出。
获得的每条第一语句有其对应的合理性参数,在本实施例中,合理性参数与搜索结果数量对应,第一语句的合理性参数是由根据第一语句进行搜索得到的搜索结果数量来决定,即第一语句的合理性参数与第一语句的搜索结果数量相关的,第一语句的搜索结果数量越大,第一语句越合理,合理性参数越大。
可以理解,合理性参数还可与搜索结果数量在总搜索结果数量的比重对应,合理性参数由搜索结果数量在总搜索结果数量的比重决定,即第一语句的合理性参数与第一语句的搜索结果数量在总搜索结果数量的比重相关的,第一语句的总搜索结果数量为每条第一语句的搜索结果数量的总数,占的比重越大,合理性参数越大。
上述机器人对话控制方法,通过根据输入语句输入大数据搜索引擎进行搜索,获得搜索结果,将搜索结果中与输入语句匹配度最大的前m条语句作为第一语句,从m条第一语句中筛选合理性参数最大对应的语句作为聊天输出语句输出,即可筛选出合理的第一语句作为输出语句输出,可提高机器人回复有效性和合理性。采用大数据搜索引擎对输入语句进行搜索,不再是根据人工建立的数据库进行搜索,由于大数据搜索引擎对应的语句是根据大量用户在历史聊天过程中产生的语句,获得的搜索结果更符合实际中用户聊天的语句,且从m条第一语句中筛选合理性参数最大对应的语句则更加符合聊天语句,提高机器人回复语句的有效性和真实性。
请参阅图4,在其中一个实施例中,分别计算每条第一语句的合理性参数,并将最大合理性参数对应的第一语句作为聊天输出语句并输出的步骤S300包括:
S310:分别将每条第一语句作为大数据搜索引擎的输入进行搜索,获得搜索结果数量作为第一语句的搜索结果数量。
S320:将第一语句的搜索结果数量作为第一语句的合理性参数,并将最大合理性参数对应的第一语句作为聊天输出语句并输出。
获得m条第一语句后,分别根据每条第一语句进行搜索,获得搜索结果数量作为第一语句的搜索结果数量,搜索结果数量是根据第一语句搜索得到的,从而搜索结果数量是和第一语句对应的,即获得与第一语句对应的搜索结果数量,有m条第一语句,搜索m次,获得m个搜索结果数量,每条第一语句对应一个搜索结果数量,即由于有m条第一语句,根据每条第一语句进行搜索,从而可获得m个搜索结果数量分别作为第一语句的搜索结果数量,单个搜索结果数量作为单条第一语句的搜索结果数量。例如,有2条第一语句分别为A和B,根据第一语句A进行搜索,得到搜索结果数量为30,根据第一语句B进行搜索,得到搜索结果数量为10,分别进行了2次搜索,获得2个搜索结果数量分别30和10,将该2个搜索结果数量分别作为第一语句的搜索结果数量,30是对应第一语句A的,10对应第一语句B的。
可以理解,在本实施例中,将第一语句的搜索结果数量作为第一语句的合理性参数,即根据第一语句的搜索结果数可获得第一语句的合理性参数,从而,最大搜索结果数量对应最大合理性参数。分别将m条第一语句输入至大数据搜索引擎中进行搜索,即搜索m次,获得m个搜索结果数量。搜索是调用大数据搜索引擎自动完成的,从第一语句对应的搜索结果数量的大小可知人们对第一语句的认同度,搜索结果数量越大表示人们对第一语句的认同度越高,则该第一语句越合理。获得m条第一语句后,需要从其中选出一条最合理的语句作为输出语句输出给用户。从第一语句对应的搜索结果数量越大,其越合理,从而将最大搜索结果数量对应的第一语句作为聊天输出语句并输出,即是将合理性参数最大对应的语句作为输出语句输出,确保聊天语句的合理性。
请参阅图5,在其中一个实施例中,将第一语句的搜索结果数量作为第一语句的合理性参数,并将最大合理性参数对应的第一语句作为聊天输出语句并输出的步骤S320包括:
S321:将第一语句的搜索结果数量作为第一语句的合理性参数,并将最大合理性参数对应的第一语句作为聊天输出语句。
S322:将聊天输出语句进行人称变换后输出。
其中,搜索结果数量代表的是人们对第一语句的认同度,即第一语句的合理性,第一语句对应的搜索结果数量越大则越合理。由于是用户和机器人的聊天,为了使机器人回复语句更加的合理,将最大搜索结果数量对应的第一语句作为聊天输出语句输出时,即将最大合理性参数对应的第一语句作为聊天语句输出时,需要将聊天输出语句进行人称变换后再输出,即使对话合理化。例如,输入语句的主语是我时,表示是用户自己,那么机器人在回复时,是对用户的回复,将聊天输出语句中的我变换成你,让回复变得合理。
请参阅图6,其中一个实施例中,将聊天输出语句进行人称变换后输出的步骤S322包括:
S3221:根据预设人称变换规则,对聊天输出语句中的第一人称和第二人称分别进行变换,获得人称变换后的聊天输出语句;
S3222:将人称变换后的聊天输出语句输出。
其中,预设人称变换规则包括第一人称变换为第二人称和第二人称变换为第一人称,具体地,是对第二语句中的人称分别进行单次变换,即第二语句中的第一人称变换为第二人称后不再进行变换,第二语句中的第二人称变换为第一人称后不再进行变换,例如,第二语句为“我找你有事情”,分别对其中的第一人称和第二人称分别进行单次变换,即将我进行单次变换为你,将你进行单次变换为我,从而人称变换后的第二语句为“你找我有事情”。输入语句是用户对机器人所讲的话语,或向机器人输入的文字或视频,在本实施例中,输入语句为用户的语音,其中,人称变换将第二语句中的第一人称变换成第二人称,第二人称变为第一人称,即第一人称包括我,第二人称包括你和您,变换过程即为将“我”变换为“你”、“你”变换为“我”、“您”变换为“我”,实现机器人对用户的合理回复。
请参阅图7,在其中一个实施例中,获取输入语句,将输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果的步骤S100包括:
S110:获取输入语句;
S120:将输入语句输入至大数据搜索引擎,提取输入语句的关键词,根据关键词进行搜索,获得搜索结果,并对搜索结果中关键词进行标记。
在机器人获取输入语句后,将该输入语句输入至搜索引擎,对该输入语句进行分词,可获得候选词,可根据候选词的重要程度,从候选词中选取出关键词,以提取输入语句的关键词,例如,输入语句为“关键词怎么提取”时,提取的关键词可为“关键词”以及“提取”。根据该关键词进行搜索,即输入语句的关键词为搜索引擎对用户的输入语句进行分词后得到的多个词,在搜索结果中包含有该输入语句的关键词。
在搜索结果中对关键词进行标记,以突出关键词在搜索结果中的位置,由于机器人后续进行处理后回复给用户的是搜索结果中的某一条语句,从而通过标记关键词,可便于用户查看输入语句。具体地,标记包括颜色标记、加粗标记以及下划线标记等。
下面以一具体实施对上述机器人对话控制方法加以说明。请参阅图8,为机器人与人进行交流的示意图。
首先,接收用户的输入语句,例如“我肚子痛”。
将用户的输入语句“我肚子痛”作为大数据搜索引擎http://www.gfsoso.net的输入进行搜索,获得搜索结果,筛选出搜索结果中与“我肚子痛”匹配度最大的前50条语句作为50条第一语句,该50条语句中含有输入语句的关键词,并对50条语句中的关键词进行颜色标记。
通过大数据搜索引擎从50条第一语句中筛选合理性最大的语句作为聊天输出语句输出,其中,根据第一语句进行搜索获得的搜索结果数量越大,第一语句的合理性参数越大,就越合理,具体步骤如下:
将50条第一语句分别作为大数据搜索引擎的50次输入进行50次搜索,得到50条搜索结果数量。
将50条搜索结果数量从大到小进行排序,选出搜索结果数量最大的第一语句作为聊天输出语句输出。其中,排序后的序列中前9条搜索结果数量对应的9条第一语句如下。
我肚子痛是不是怀孕了(搜索结果数为6280000)。
我肚子痛,每个月月经过后就开始(搜索结果数为2880000)。
我肚子痛,也胃痛(搜索结果数为1960000)。
更年期肚子胀痛(搜索结果数为1940000)。
我肚子痛,拉肚子(搜索结果数为1380000)。
笑得我肚子痛(搜索结果数为1170000)
我肚子痛,想解大手(搜索结果数为486000)。
我肚子痛,要上厕所大便(搜索结果数为368000)。
我肚子痛的很厉害,痛的冒汗,是不是肠胃炎(搜索结果数为27100)。
将搜索结果数量作为合理性参数,从而可知9条第一语句对应的合理性参数,其中,上述9条第一语句中“我肚子痛是不是怀孕了”的搜索结果数量最大,则该语句对应的合理性参数最大,即选出该语句“我肚子痛是不是怀孕了”作为聊天输出语句。
将聊天输出语句进行人称变换后输出给用户。例如,将上述“我肚子痛是不是怀孕了”进行人称变换后输出,即将其中的我变换成你,得到:你肚子痛是不是怀孕了,输出给用户,实现机器人与用户之间的交互。
上述整个过程全部是机器人系统自动完成的。大数据搜索引擎(譬如google、gfsoso、baidu等)是在海量的用户在过去长时间积累的大数据的基础上形成的,某输入语句对应的搜索结果数越多,则表明该输入语句越合理,某输入语句对应的搜索结果数越少,则表明该输入语句越不合理。可以理解的是,将m个搜索结果数中最大搜索结果数对应的第一语句作为聊天输出语句,保证了机器人对用户的聊天输入语句所做回复的合理性,从而提高了聊天机器人的回复语句的有效性、真实性。
在搜索引擎中,由后台大数据的数据量的变化,不同时间搜到得到的结果数会有所波动,这种波动反映出人们对某一话语的认同度的真实变化,不但不影响本发明的使用,反而更能使得本发明的方法能真实地反映人们对某一话语的认同度。搜索引擎后台的大数据日益增多,搜索结果就越来越能反映出人们对某一话语的认同度,从而可以依据搜索引擎的结果来判断某话语的合理性,进而提高了聊天机器人的回复语句的有效性、真实性。
请参阅图9,本发明还提供一种实施方式的机器人对话控制系统,包括:
搜索模块100:用于获取输入语句,将输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果。
在本实施例中,机器人是指泛义的机器人,包括一切模拟人类行为或思想以及模拟其他生物的机械,也包括一些电脑程序,例如,聊天机器人程序等。在用户需要与机器人进行交互时,用户可向机器人输入语句,从而机器人可获取用户的输入语句,其中,输入语句可以是文字和语音,甚至可以是视频。在本实施例中,输入语句为语音,将输入语句输入至大数据搜索引擎中进行搜索,可获得搜索结果其中,其中,搜索结果中包括多条语句,搜索结果中语句的条数即是搜索结果的数量,搜索出的这些语句与输入语句相关。其中,搜索是调用大数据搜索引擎自动完成的,大数据搜索引擎包括但不限于baidu、google和gfsoso等互联网搜索引擎、局域网搜索引擎、基于数据仓库或数据库的搜索引擎以及机器人自带的搜索引擎。
第一筛选模块200:用于筛选搜索结果中与输入语句匹配度最大的前m条语句分别作为m条第一语句。
其中,m为正整数。由于根据输入语句进行搜索时,可能会获得较多的搜索结果,有些搜索结果可能不太合理,对全部的数据进行处理时会浪费较多时间,从而需要对搜索结果进行筛选,筛选出较为合理的,即筛选出搜索结果中与输入语句匹配度最大的前m条语句分别作为m条第一语句,即与输入语句匹配度最大的前m条语句是指将与输入语句匹配度按从大到小的顺序排序,排在最前的m条语句。例如,将输入语句输入到百度搜索引擎中进行搜索,根据匹配度从大到小进行排序后的搜索结果显示在页面上,排在越前的搜索结果,表示越合理。
第二筛选模块300,用于分别计算每条第一语句的合理性参数,并将合理性参数最大对应的第一语句作为聊天输出语句并输出。
获得的每条第一语句有其对应的合理性参数,在本实施例中,合理性参数与搜索结果数量对应,第一语句的合理性参数是由根据第一语句进行搜索得到的搜索结果数量来决定,即第一语句的合理性参数与第一语句的搜索结果数量相关的,第一语句的搜索结果数量越大,第一语句越合理,合理性参数越大。
可以理解,合理性参数还可与搜索结果数量在总搜索结果数量的比重对应,合理性参数由搜索结果数量在总搜索结果数量的比重决定,即第一语句的合理性参数与第一语句的搜索结果数量在总搜索结果数量的比重相关的,第一语句的总搜索结果数量为每条第一语句的搜索结果数量的总数,占的比重越大,合理性参数越大。
上述机器人对话控制系统,通过根据输入语句输入大数据搜索引擎进行搜索,获得搜索结果,将搜索结果中与输入语句匹配度最大的前m条语句作为第一语句,从m条第一语句中筛选合理性参数最大对应的语句作为聊天输出语句输出,即可筛选出合理的第一语句作为输出语句输出,可提高机器人回复有效性和合理性。采用大数据搜索引擎对输入语句进行搜索,不再是根据人工建立的数据库进行搜索,由于大数据搜索引擎对应的语句是根据大量用户在历史聊天过程中产生的语句,获得的搜索结果更符合实际中用户聊天的语句,且从m条第一语句中筛选合理性参数最大对应的语句则更加符合聊天语句,提高机器人回复语句的有效性和真实性。
请参阅图10,在其中一个实施例中,第二筛选模块300宝包括:
搜索单元310,还用于分别将每条第一语句作为大数据搜索引擎的输入进行搜索,获得搜索结果数量作为第一语句的搜索结果数量。
筛选单元320:用于将第一语句的搜索结果数量作为第一语句的合理性参数,并将最大合理性参数对应的第一语句作为聊天输出语句并输出。
获得m条第一语句后,分别根据每条第一语句进行搜索,获得搜索结果数量作为第一语句的搜索结果数量,搜索结果数量是根据第一语句搜索得到的,从而搜索结果数量是和第一语句对应的,即获得与第一语句对应的搜索结果数量,有m条第一语句,搜索m次,获得m个搜索结果数量,每条第一语句对应一个搜索结果数量,即由于有m条第一语句,根据每条第一语句进行搜索,从而可获得m个搜索结果数量分别作为第一语句的搜索结果数量,单个搜索结果数量作为单条第一语句的搜索结果数量。例如,有2条第一语句分别为A和B,根据第一语句A进行搜索,得到搜索结果数量为30,根据第一语句B进行搜索,得到搜索结果数量为10,分别进行了2次搜索,获得2个搜索结果数量分别30和10,将该2个搜索结果数量分别作为第一语句的搜索结果数量,30是对应第一语句A的,10对应第一语句B的。
可以理解,在本实施例中,将第一语句的搜索结果数量作为第一语句的合理性参数,即根据第一语句的搜索结果数可获得第一语句的合理性参数,从而,最大搜索结果数量对应最大合理性参数。分别将m条第一语句输入至大数据搜索引擎中进行搜索,即搜索m次,获得m个搜索结果数量。搜索是调用大数据搜索引擎自动完成的,从第一语句对应的搜索结果数量的大小可知人们对第一语句的认同度,搜索结果数量越大表示人们对第一语句的认同度越高,则该第一语句越合理。获得m条第一语句后,需要从其中选出一条最合理的语句作为输出语句输出给用户。从第一语句对应的搜索结果数量越大,其越合理,从而将最大搜索结果数量对应的第一语句作为聊天输出语句并输出,即是将合理性参数最大对应的语句作为输出语句输出,确保聊天语句的合理性。
请参阅图11,在其中一个实施例中,筛选单元320包括:
选择单元321:用于将第一语句的搜索结果数量作为第一语句的合理性参数,并将最大合理性参数对应的第一语句作为聊天输出语句。
人称变换单元322:用于将聊天输出语句进行人称变换后输出。
其中,搜索结果数量代表的是人们对第一语句的认同度,即第一语句的合理性,第一语句对应的搜索结果数量越大则越合理。由于是用户和机器人的聊天,为了使机器人回复语句更加的合理,将最大搜索结果数量对应的第一语句作为聊天输出语句输出时,即将最大合理性参数对应的第一语句作为聊天语句输出时,需要将聊天输出语句进行人称变换后再输出,即使对话合理化。例如,输入语句的主语是我时,表示是用户自己,那么机器人在回复时,是对用户的回复,将聊天输出语句中的我变换成你,让回复变得合理。
请参阅图12,在其中一个实施例中,人称变换单元322包括:
变换单元3221,用于根据预设人称变换规则,对聊天输出语句中的第一人称和第二人称分别进行变换,获得人称变换后的聊天输出语句。
输出单元3222,用于将人称变换后的聊天输出语句输出。
其中,预设人称变换规则包括第一人称变换为第二人称和第二人称变换为第一人称,具体地,是对第二语句中的人称分别进行单次变换,即第二语句中的第一人称变换为第二人称后不再进行变换,第二语句中的第二人称变换为第一人称后不再进行变换,例如,第二语句为“我找你有事情”,分别对其中的第一人称和第二人称分别进行单次变换,即将我进行单次变换为你,将你进行单次变换为我,从而人称变换后的第二语句为“你找我有事情”。输入语句是用户对机器人所讲的话语,或向机器人输入的文字或视频,在本实施例中,输入语句为用户的语音,其中,人称变换将第二语句中的第一人称变换成第二人称,第二人称变为第一人称,即第一人称包括我,第二人称包括你和您,变换过程即为将“我”变换为“你”、“你”变换为“我”、“您”变换为“我”,实现机器人对用户的合理回复。
请参阅图13,在其中一个实施例中,搜索模块100包括:
获取单元110,用于获取输入语句;
语句搜索单元120,用于将输入语句输入至大数据搜索引擎,提取输入语句的关键词,根据关键词进行搜索,获得搜索结果。
在机器人获取输入语句后,将该输入语句输入至搜索引擎,对该输入语句进行分词,可获得候选词,可根据候选词的重要程度,从候选词中选取出关键词,以提取输入语句的关键词,例如,输入语句为“关键词怎么提取”时,提取的关键词可为“关键词”以及“提取”。根据该关键词进行搜索,即输入语句的关键词为搜索引擎对用户的输入语句进行分词后得到的多个词,在搜索结果中包含有该输入语句的关键词。
标记单元130,用于对搜索结果中关键词进行标记。
在搜索结果中对关键词进行标记,以突出关键词在搜索结果中的位置,由于机器人后续进行处理后回复给用户的是搜索结果中的某一条语句,从而通过标记关键词,可便于用户查看输入语句。具体地,标记包括颜色标记、加粗标记以及下划线标记等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种机器人对话控制方法,其特征在于,包括以下步骤:
获取输入语句,将所述输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果;
筛选所述搜索结果中与所述输入语句匹配度最大的前m条语句分别作为m条第一语句,其中,所述m为正整数;
分别计算每条所述第一语句的合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出。
2.根据权利要求1所述的机器人对话控制方法,其特征在于,所述分别计算每条所述第一语句的合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出的步骤包括:
分别将每条所述第一语句作为所述大数据搜索引擎的输入进行搜索,获得搜索结果数量作为所述第一语句的搜索结果数量;
将所述第一语句的搜索结果数量作为所述第一语句的所述合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出。
3.根据权利要求2所述的机器人对话控制方法,其特征在于,所述将所述第一语句的搜索结果数量作为所述第一语句的所述合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出的步骤包括:
将所述第一语句的搜索结果数量作为所述第一语句的所述合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句;
将所述聊天输出语句进行人称变换后输出。
4.根据权利要求3所述的机器人对话控制方法,其特征在于,所述将所述聊天输出语句进行人称变换后输出的步骤包括:
根据预设人称变换规则,对所述聊天输出语句中的第一人称和第二人称分别进行变换,获得人称变换后的聊天输出语句;
将所述人称变换后的聊天输出语句输出。
5.根据权利要求1所述的机器人对话控制方法,其特征在于,所述获取输入语句,将所述输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果的步骤包括:
获取输入语句;
将所述输入语句输入至所述大数据搜索引擎,提取所述输入语句的关键词,根据所述关键词进行搜索,获得搜索结果,并对所述搜索结果中所述关键词进行标记。
6.一种机器人对话控制系统,其特征在于,包括:
搜索模块,用于获取输入语句,将所述输入语句作为大数据搜索引擎的输入进行搜索,获得搜索结果;
第一筛选模块,用于筛选所述搜索结果中与所述输入语句匹配度最大的前m条语句分别作为m条第一语句,其中,所述m为正整数;
第二筛选模块,用于分别计算每条所述第一语句的合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出。
7.根据权利要求6所述的机器人对话控制系统,其特征在于,所述第二筛选模块包括:
搜索单元,用于分别将每条所述第一语句作为所述大数据搜索引擎的输入进行搜索,获得搜索结果数量作为与所述第一语句的搜索结果数量;
筛选单元,用于将所述第一语句的搜索结果数量作为所述第一语句的所述合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句并输出。
8.根据权利要求7所述的机器人对话控制系统,其特征在于,所述筛选单元包括:
选择单元,用于将所述第一语句的搜索结果数量作为所述第一语句的所述合理性参数,并将最大所述合理性参数对应的所述第一语句作为聊天输出语句;
人称变换单元,用于将所述聊天输出语句进行人称变换后输出。
9.根据权利要求8所述的机器人对话控制系统,其特征在于,所述人称变换单元包括:
变换单元,用于根据预设人称变换规则,对所述聊天输出语句中的第一人称和第二人称分别进行变换,获得人称变换后的聊天输出语句;
输出单元,用于将所述人称变换后的聊天输出语句输出。
10.根据权利要求6所述的机器人对话控制系统,其特征在于,所述搜索模块包括:
获取单元,用于获取输入语句;
搜索单元,用于将所述输入语句输入至所述大数据搜索引擎,提取所述输入语句的关键词,根据所述关键词进行搜索,获得搜索结果;
标记单元,用于对所述搜索结果中所述关键词进行标记。
CN201610281588.1A 2016-04-29 2016-04-29 基于大数据的机器人对话控制方法和系统 Active CN105912712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610281588.1A CN105912712B (zh) 2016-04-29 2016-04-29 基于大数据的机器人对话控制方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610281588.1A CN105912712B (zh) 2016-04-29 2016-04-29 基于大数据的机器人对话控制方法和系统

Publications (2)

Publication Number Publication Date
CN105912712A true CN105912712A (zh) 2016-08-31
CN105912712B CN105912712B (zh) 2019-09-17

Family

ID=56753448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610281588.1A Active CN105912712B (zh) 2016-04-29 2016-04-29 基于大数据的机器人对话控制方法和系统

Country Status (1)

Country Link
CN (1) CN105912712B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951491A (zh) * 2017-03-14 2017-07-14 广东工业大学 一种应用于机器人的智能对话控制方法及装置
CN107679225A (zh) * 2017-10-20 2018-02-09 哈尔滨工业大学 一种基于关键词的回复生成方法
CN108921743A (zh) * 2018-06-20 2018-11-30 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的解惑方法和解惑教育机器人系统
CN109760041A (zh) * 2017-11-10 2019-05-17 贝斯平环球公司 基于聊天机器人的云管理系统及其操作方法
CN109922070A (zh) * 2019-03-13 2019-06-21 北京奇艺世纪科技有限公司 一种自动回复方法及装置
CN111381685A (zh) * 2018-12-29 2020-07-07 北京搜狗科技发展有限公司 一种句联想方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN101097573A (zh) * 2006-06-28 2008-01-02 腾讯科技(深圳)有限公司 一种自动问答系统及方法
CN102165435A (zh) * 2007-08-01 2011-08-24 金格软件有限公司 使用因特网语料库的自动上下文相关语言产生、校正和增强
CN104462553A (zh) * 2014-12-25 2015-03-25 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101097573A (zh) * 2006-06-28 2008-01-02 腾讯科技(深圳)有限公司 一种自动问答系统及方法
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN102165435A (zh) * 2007-08-01 2011-08-24 金格软件有限公司 使用因特网语料库的自动上下文相关语言产生、校正和增强
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN104462553A (zh) * 2014-12-25 2015-03-25 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘增健: "基于网络搜索的问答系统", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951491A (zh) * 2017-03-14 2017-07-14 广东工业大学 一种应用于机器人的智能对话控制方法及装置
CN107679225A (zh) * 2017-10-20 2018-02-09 哈尔滨工业大学 一种基于关键词的回复生成方法
CN107679225B (zh) * 2017-10-20 2021-03-09 哈尔滨工业大学 一种基于关键词的回复生成方法
CN109760041A (zh) * 2017-11-10 2019-05-17 贝斯平环球公司 基于聊天机器人的云管理系统及其操作方法
CN109760041B (zh) * 2017-11-10 2022-05-06 贝斯平环球公司 基于聊天机器人的云管理系统及其操作方法
CN108921743A (zh) * 2018-06-20 2018-11-30 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的解惑方法和解惑教育机器人系统
CN108921743B (zh) * 2018-06-20 2020-12-22 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的解惑方法和解惑教育机器人系统
CN111381685A (zh) * 2018-12-29 2020-07-07 北京搜狗科技发展有限公司 一种句联想方法和装置
CN111381685B (zh) * 2018-12-29 2024-03-22 北京搜狗科技发展有限公司 一种句联想方法和装置
CN109922070A (zh) * 2019-03-13 2019-06-21 北京奇艺世纪科技有限公司 一种自动回复方法及装置
CN109922070B (zh) * 2019-03-13 2021-11-26 北京奇艺世纪科技有限公司 一种自动回复方法及装置

Also Published As

Publication number Publication date
CN105912712B (zh) 2019-09-17

Similar Documents

Publication Publication Date Title
CN105912712A (zh) 基于大数据的机器人对话控制方法和系统
CN103076892B (zh) 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN105975530A (zh) 基于聊天大数据知识库的机器人对话控制方法和系统
CN106021433B (zh) 一种商品评论数据的口碑分析方法和装置
CN105975531B (zh) 基于对话知识库的机器人对话控制方法和系统
CN110781315B (zh) 一种食品安全知识图谱及相关智能问答系统的构建方法
CN107967267A (zh) 一种知识图谱构建方法、装置及系统
CN110516047A (zh) 基于包装领域的知识图谱的检索方法及检索系统
CN105912645B (zh) 一种智能问答方法及装置
CN105787134B (zh) 智能问答方法、装置及系统
CN104699766A (zh) 一种融合词语关联关系和上下文语境推断的隐式属性挖掘方法
CN105677795B (zh) 抽象语义的推荐方法、推荐装置及推荐系统
CN102495892A (zh) 一种网页信息抽取方法
CN105955949B (zh) 基于大数据搜索的幽默型机器人对话控制方法和系统
CN108647729B (zh) 一种用户画像获取方法
CN109933851B (zh) 台架耐久试验数据处理和分析方法
CN104598648B (zh) 一种微博用户交互式性别识别方法及装置
CN111782800A (zh) 一种面向事件追溯的智能会议分析方法
CN107818175B (zh) 一种基于裁判文书的法律类案问题分析方法及装置
CN103699612A (zh) 一种图像检索排序的方法及装置
Pallagani et al. A generic dialog agent for information retrieval based on automated planning within a reinforcement learning platform
Antonioni et al. Nothing about us without us: A participatory design for an inclusive signing Tiago robot
CN108509588B (zh) 一种基于大数据的律师评估方法及推荐方法
CN109934631A (zh) 问答信息处理方法、装置及计算机设备
CN111325562A (zh) 粮食安全追溯系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant