CN102194005B - 聊天机器人系统及自动聊天方法 - Google Patents
聊天机器人系统及自动聊天方法 Download PDFInfo
- Publication number
- CN102194005B CN102194005B CN201110139541.9A CN201110139541A CN102194005B CN 102194005 B CN102194005 B CN 102194005B CN 201110139541 A CN201110139541 A CN 201110139541A CN 102194005 B CN102194005 B CN 102194005B
- Authority
- CN
- China
- Prior art keywords
- user
- database
- information
- words
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000009471 action Effects 0.000 claims abstract description 26
- 210000004556 brain Anatomy 0.000 claims abstract description 13
- 230000003993 interaction Effects 0.000 claims description 42
- 230000006798 recombination Effects 0.000 claims description 14
- 238000005215 recombination Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000000151 deposition Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 abstract 4
- 238000004891 communication Methods 0.000 description 10
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种聊天机器人系统及自动聊天方法,其聊天机器人系统包括交互平台、分词模块、语言识别单元、数据库以及信息查询单元。分词模块与交互平台相连,用于对用户发送来的话述进行分词。语言识别单元与分词模块相连,用于对各个分词的语素进行判别,以及对用户话述的句子类型进行判别。数据库又进一步包括事件库、动作库、知识库及思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息。信息查询单元分别与语言识别单元、数据库及交互平台相连,用于根据用户话述的分词语素以及话述的句子类型,查询数据库,并将查询结果传输至交互平台。本发明具有精确性高、成本低、可扩展性强的优点。
Description
技术领域
本发明涉及人工智能领域,特别涉及一种聊天机器人系统及自动聊天方法。
背景技术
近些年来,人们之间的通讯手段日益丰富。即时通信工具、手机短信等通讯手段日渐风行。基于这些通讯手段,除了实现人与人之间的沟通交流外,也使得人与人工智能系统之间的沟通交流成为可能。
聊天机器人系统就是一种借助于通讯手段能够时时刻刻在线、并通过自然语言与人沟通交流的人工智能系统。聊天机器人系统实质上是一种自动问答系统。自动问答系统以自然语言理解技术为核心,涉及到计算语言学、信息科学和人工智能等多门学科,是计算机应用研究的热点之一。自然语言理解是人工智能领域中的一个重要研究方向,它使计算机能够理解和运用人类的自然语言,可以理解用户的谈话内容,实现人与计算机之间基于自然语言的有效沟通。
聊天机器人利用自然语言处理技术、知识库和实时更新的信息资源,一方面完成对用户问题的分析处理,另一方面完成正确答案的生成。
现有技术中的聊天机器人系统,通常包含通讯模块、查询服务器、人工智能服务器及相应的数据库。在这种聊天机器人系统中,采用数据库作为知识点的载体,用户通过即时通讯平台或短信平台与聊天机器人进行各种对话。
但是,现有聊天机器人系统普遍存在以下几个问题:
1、现有聊天机器人普遍采用语言中关键词的索引方式进行回复的生成,由于一个关键词可能关联多个问题,一旦用户发出一个关注度较高的关键词时,系统便可能会返回多个答案,导致其对用户语言不能充分地理解,精确性不高。
2、现有技术中一台服务器只能支持一个聊天机器人,企业使用的成本较高,无法普及聊天机器人的应用。
3、现有的聊天机器人不能支持无程序基础的用户知识教学,聊天机器人的知识积累大多来自程序员的预先设置,无法在使用过程中随时对聊天机器人进行完善,因此这种系统架构的可扩展性较差。
发明内容
本发明的目的是提供两种聊天机器人系统,以解决现有的聊天机器人系统精确性低、成本高、扩展性差的问题。
本发明的另一目的是提供一种自动聊天方法,以解决现有的聊天机器人系统精确性低、成本高、扩展性差的问题。
为解决以上问题,本发明提出一种聊天机器人系统,包括交互平台、分词模块、语言识别单元、数据库以及信息查询单元。交互平台用于与用户进行交互。分词模块与交互平台相连,用于对用户发送来的话述进行分词。语言识别单元与分词模块相连,用于对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语。数据库又进一步包括事件库、动作库、知识库及思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息。信息查询单元分别与语言识别单元、数据库及交互平台相连,用于根据用户话述的分词语素以及话述的句子类型,查询数据库,并将查询结果传输至交互平台。
依照本发明较佳实施例所述的聊天机器人系统,分词模块又进一步包括重组单元、短语库、词库以及标准语转化单元。重组单元与交互平台相连,用于对用户话述中各个字按顺序进行排列组合。短语库用于存放短语与标准语之间的对应关系。词库用于存放标准词语。标准语转化单元分别与重组单元、短语库及词库相连,用于将重组合的短语和词语分别与短语库及词库中存放的标准语进行比对,并将重组合的各个短语和词语转化为标准语,并形成用户话述的分词。
依照本发明较佳实施例所述的聊天机器人系统,其还包括修改单元,其与数据库相连,用于修改或新增该数据库中存储的信息。
本发明还提出了一种聊天机器人系统,包括交互平台、至少两个聊天机器人服务器以及数据库。数据库又进一步包括事件库、动作库、知识库及思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息,且每条信息与各个机器人标识一一对应。每个聊天机器人服务器又进一步包括分词模块、语言识别单元以及信息查询单元。分词模块与交互平台相连,用于对用户发送来的话述进行分词。语言识别单元与分词模块相连,用于对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语。信息查询单元分别与语言识别单元、数据库及交互平台相连,用于根据用户话述的分词语素以及话述的句子类型,并结合机器人标识,查询数据库,并将查询结果传输至交互平台。
依照本发明较佳实施例所述的聊天机器人系统,分词模块又进一步包括重组单元、短语库、词库以及标准语转化单元。重组单元与交互平台相连,用于对用户话述中各个字按顺序进行排列组合。短语库用于存放短语与标准语之间的对应关系。词库用于存放标准词语。标准语转化单元分别与重组单元、短语库及词库相连,用于将重组合的短语和词语分别与短语库及词库中存放的标准语进行比对,并将重组合的各个短语和词语转化为标准语,并形成用户话述的分词。
依照本发明较佳实施例所述的聊天机器人系统,交互平台为网站服务器或WAP服务器或短信服务器或机器人专用服务器。
依照本发明较佳实施例所述的聊天机器人系统,每个聊天机器人服务器还包括修改单元,其与数据库相连,用于修改或新增数据库中存储的信息。
本发明另提出一种自动聊天方法,包括以下步骤:(1)设置数据库,数据库又进一步包括事件库、动作库、知识库及思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息。(2)对用户发送来的话述进行分词。(3)对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语。(4)根据用户话述的分词语素以及话述的句子类型,查询数据库,并将查询结果反馈给用户。
依照本发明较佳实施例所述的自动聊天方法,设置数据库时,为数据库中的每条信息设置机器人标识,并使每条信息与至少一个机器人标识一一对应。
获取相应的信息时具体为:根据用户话述的分词语素以及话述的句子类型,并结合机器人标识,获取相应的信息。
依照本发明较佳实施例所述的自动聊天方法,向用户反馈查询结果时,若查询到用户所需要的信息,则同时将信息在数据库中的对应位置信息发送给用户,以供用户修改。
若没有查询到用户所需要的信息,则同时将数据库中空的位置信息发送给用户,以供用户对数据库写入新的数据。
相对于现有技术,本发明具有以下优点:
1、本发明通过将数据库中的信息划分为模拟人类大脑的知识库、思想库、事件库和动作库来储存,并根据用户话述的分词语素及句子类型来查询数据库,从而使聊天机器人可以对用户的问题、话述更精确地理解,并更加贴合人类的思考方式,提高了聊天机器人的回复精确性。
2、本发明运用分布式聊天机器人服务器的概念,在一个集中的服务器(系统)中,可以生成多个机器人,大大缩减聊天机器人的硬件投入成本。
3、本发明的聊天机器人具备了学习功能,可以由用户对数据库中的知识进行更新或将新知识写入到数据库中,而不像传统的聊天机器人那样要由程序员对数据库进行预设置,从而使得聊天机器人具备了可扩展性。
附图说明
图1为本发明自动聊天方法的一种实施例流程图;
图2为本发明自动聊天方法对用户话述进行分词时的一种实施例流程图;
图3为本发明自动聊天方法的另一种实施例流程图;
图4为本发明聊天机器人系统的第一种实施例结构图;
图5为本发明分词模块的一种实施例结构图;
图6为本发明聊天机器人系统的第二种实施例结构图;
图7为本发明聊天机器人系统的第三种实施例结构图。
具体实施方式
以下结合附图,具体说明本发明。
请参见图1,其为本发明自动聊天方法的一种实施例流程图,其包括以下步骤:
S101,设置数据库,数据库又进一步包括事件库、动作库、知识库及思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息。
S102,对用户发送来的话述进行分词。其中对用户话述进行分词时(即步骤S102)又可以具体包括步骤(如图2所示):S201,对用户话述中各个字按顺序进行排列组合。S202,将重组合的短语和词语分别与预定义的标准语进行比对。S203,将重组合的各个短语和词语转化为标准语,并形成分词。
S103,对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语。语素可以通过各个分词的词性(形容词、动词等)来进行判别。语素和句子类型的判别是为了确定以哪个库来进行索引,例如可以预置句子类型为疑问句时,与疑问词的语素相对应的库作为索引库;又如可以预置句子类型为陈述句时,与动作语的语素相对应的库作为索引库。
S104,根据用户话述的分词语素以及话述的句子类型,查询数据库,并将查询结果反馈给用户。对于查询结果有两种情况,即查询到相应的信息以及没有查找到相应的信息。若没有查到所需要的信息,则可以将预置的通用答复反馈给用户。
本发明通过将数据库中的信息划分为模拟人类大脑的知识库、思想库、事件库和动作库来储存,并根据用户话述的分词语素及句子类型来查询数据库,从而使聊天机器人可以对用户的问题、话述更精确地理解,使回答内容可以更加贴合人类的思考方式,提高了自然语言的理解程度。
示例一:
1、在机器人的短语库中预定义短语“多大了”对应“年龄”。
2、当机器人接收到用户发出一句话T-A01“小王多大了?”
3、首先将用户问题分解为:“小、小王、小王多、小王多大、小王多大了、王、王多。。。”以此类推,将各个字的组合与预定义短语库比对,发现“多大了”有预定义短语“年龄”,则将“小王多大了?”转化为标准语:“小王年龄?”
4、对转化为标准语的句子进行分词,分别将“小、小王、小王年、小王年龄、王、王年。。。”以此类推,将各个字的组合与词库比对,分词得到各个词的语素“小王(名词-主语)”、“年龄(名词-从语)”、“?(疑问句标识)”
5、根据该句出现了疑问句标识(?)判断该句为疑问句。
6、根据该句中仅出现了名词,判断句子从知识库取得信息。
7、按照顺序排列节点“小王->年龄”找到该节点下知识内容。
8、若没有找到相应节点知识,则取出用户预设的“无知识内容时回答”。
8、向用户返回该条知识内容。
示例二:
1、机器人接收到用户发出一句话T-A02“地球为何强大?”
2、同示例一,进行短语比对和分词,得到句子“地球(名词-主语)”“为何(事件疑问词-从语)”“强大(形容词-思想表达语)”“?(疑问句标识)”。
3、根据该句出现了疑问句标识(?)判断该句为疑问句。
4、根据该句中出现了事件疑问词,判断句子从事件库取得信息。
5、以名词作为索引(地球),找到知识库下的“地球”,取得索引标识。
6、按照该索引标识在事件库中找到该索引所有对应的事件,找到“强大”。
7、按照事件疑问词取得该事件中的“为何”属性,并返回该属性对应的描述。
示例三:
1、机器人接收到用户发出一句话T-A03“小张漂亮吗?”
2、同前示例,短语比对和分词,得到“小张(名词-主语)”“漂亮(形容词-思想表达语)”“吗(语气助词)”“?(疑问句标识)”
3、根据该句出现了疑问句标识(?)判断该句为疑问句。
4、根据该句中仅出现了形容词,并且无其它标识,判断句子从思想库取得信息。
5、以名词作为索引(小张),找到知识库下的“小张”,取得索引标识。
6、按照该索引标识在思想库中找到该索引所有对应的信息,找到“漂亮”。
7、若找到“漂亮”,则返回关于“漂亮”的描述.
8、若没找到“漂亮”,则返回“不漂亮”。
示例四:
1、机器人接收到用户发出一句话T-A04“我昨天去了北京。”
2、同前示例,短语比对和分词,得到“我(名词-主语)”“昨天(时间名词)”“去(动词-动作语)”“了(助词、忽略)”“北京(名词-从语)(动词之后,受力者)”
3、无疑问句标识时,默认为陈述句。
4、该句有动词,首先判断从动作库取得信息。
5、根据“我”的索引,从动作库查找“我去北京”的信息,若有,则返回该内容的描述。
请参见图3,其为本发明自动聊天方法的一种实施例流程图,其包括以下步骤:
S301,设置数据库,数据库又进一步包括事件库、动作库、知识库及思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息。
S302,为数据库中的每条信息设置机器人标识,并使每条信息与至少一个机器人标识一一对应。所述的机器人标识用来区分聊天机器人的身份,即每个聊天机器人都有其特有的机器人标识。
S303,对用户发送来的话述进行分词。
S304,对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语。
S305,根据用户话述的分词语素以及话述的句子类型,并结合机器人标识,查询数据库。若查询到用户所需要的信息,则进入步骤S306,若没有查询到用户所需要的信息,则进入步骤S307。
S306,向用户反馈查询结果,同时将信息在数据库中的对应位置信息发送给用户,以供用户修改。
S307,向用户反馈查询结果,同时将数据库中空的位置信息发送给用户,以供用户对数据库写入新的数据。
与图1的实施例相比,本实施例有两个区别;其一是为数据库中的信息设置了对应的机器人标识,这样,同一个数据库就可以被多个聊天机器人来使用,即在一个集中服务器中,可以生成多个聊天机器人,可以大大缩减聊天机器人的硬件投入成本。其二是针对用户接收到的反馈信息,可以对数据库进行修改或写入新数据,由于聊天机器人的所有回答内容全部使用数据库存储,判断逻辑也在数据库中存储,因此本实施例的方法使聊天机器人具备了学习功能,可以由用户对数据库中的知识进行更新或将新知识写入到数据库中,而不像传统的聊天机器人那样要由程序员对数据库进行预设置,使得聊天机器人具备了可扩展性。
本发明另提出一种聊天机器人系统,请参见图4,其包括交互平台41、分词模块42、语言识别单元43、数据库44以及信息查询单元45。交互平台41用于与用户进行交互。分词模块42与交互平台41相连,用于对用户发送来的话述进行分词。语言识别单元43与分词模块42相连,用于对各个分词的语素进行判别,以及对用户话述的句子类型进行判别。44数据库又进一步包括事件库46、动作库47、知识库48及思想库49,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息。信息查询单元45分别与语言识别单元、数据库44及交互平台41相连,用于根据用户话述的分词语素以及话述的句子类型,查询数据库44,并将查询结果传输至交互平台41。
其中,分词模块42又进一步包括重组单元51、短语库53、词库54以及标准语转化单元52,请参见图5,重组单元51与交互平台41相连,用于对用户话述中各个字按顺序进行排列组合。短语库53用于存放短语与标准语之间的对应关系。词库54用于存放词语与标准语之间的对应关系。标准语转化单元52分别与重组单元51、短语库53及词库54相连,用于将重组合的短语和词语分别与短语库53及词库54中存放的标准语进行比对,并将重组合的各个短语和词语转化为标准语,以形成用户话述的分词。
本发明所述的交互平台41可以是网站服务器或WAP服务器或短信服务器或机器人专用服务器。用户向交互平台发送一句话述后,首先是由分词模块42对该句话述进行分词处理。分词是自然语言识别技术常用的一种技术手段,在本发明中,可以先通过重组单元51对话述按顺序进行重新排列组合,例如将“小王多大了?”这句话述重新组合排列成“小、小王、小王多、小王多大、小王多大了、王、王多、王多大、王多大了、多大、多大了、大了”这些短语和词语。然后标准语转化单元52会将这些短语分别去和短语库53中存储的标准语进行比对,假设短语库53中存储有“多大了”对应“年龄”,则标准语转化单元52便将“小王多大了?”转换成“小王年龄?”,最后标准语转化单元52将“小、小王、小王年、小王年龄、王、王年、年龄”这些字的组合与词库54进行比对,并最终得到“小王(名词)”、“年龄(名词)”、“?(疑问句标识)”的分词结果。
语言识别单元43接收到分词模块42发送来的分词后,对各个分词的语素以及用户话述的句子类型进行判别,本发明的语素包括主语、从语、动作语和思想表达语。由“小王年龄?”的分词结果可以判别出“小王”为主语,“年龄”是从语,“?”表示该话述的句子类型为疑问句。
然后信息查询单元45便根据分词语素以及句子类型去数据库44的某个词库中查找相应的信息。这里查询规则可以是预先设置的,比如主语对应知识库、从语对应事件库、动作语对应动作库、思想表达语对应思想库、话述仅由主语和从语时,优先以主语对应的库作为索引库、话述的句子类型为陈述句时,与动作语的相对应的库作为索引库等。因此,“小王年龄?”这句话述可以优先用“小王”在知识库中遍历查询,然后在以“小王”作为节点查询到的相关信息中再以“年龄”进行查询。当查询到相关的信息后,信息查询单元45将其发送给交互平台41,由交互平台41显示或发送给用户。若没有查询到相关信息,则信息查询单元45将没有查询到的信息发送给交互平台41,由交互平台41将预置的回复内容发送给用户。
请参见图6,其为本发明聊天机器人系统的第二种实施例结构图。与图4相比,本实施例的聊天机器人系统还包括修改单元61,其分别与交互平台及数据库相连,其用于修改或新增数据库中存储的信息。在实际应用中,修改单元61类似于“教学面板”,在信息查询单元45将回复内容(即查询到的数据库44信息或未查询到时的预置回复内容)反馈给交互平台41的同时,若查询到了相应的内容,则将可以将回复信息在数据库44中的具体位置一起发送给交互平台41,以供用户修改;若没有查询到相应的内容,则将数据库44中的一个新位置发送到交互平台41,以供用户新增知识。修改单元61则通过交互平台41向用户提供“编辑”或“新增”等链接,实现对数据库44的操作。这样使聊天机器人具备了学习功能,可以由用户对数据库44中的知识进行更新或将新知识写入到数据库中,而不像传统的聊天机器人那样要由程序员对数据库进行预设置,从而使得聊天机器人具备了可扩展性。
在实际应用中,数据库44中往往包含了大量的数据,特别对于中小型企业来说,构建数据库44是一个费时费力的高成本工作,因此为了节约硬件成本,本发明还提出了一种多个聊天机器人共用一个数据库的思想,请参见图7,其为本发明聊天机器人系统的第三种实施例结构图。此聊天机器人系统包括交互平台41、多个聊天机器人服务器711~71n以及数据库74。所有的聊天机器人服务器711~71n均与数据库74相连,各个聊天机器人服务器的类型可以不同,例如可以是营销机器人、游戏客服机器人、医院客服机器人等,且每个聊天机器人服务器均有表示其身份的机器人标识。数据库74又进一步包括事件库76、动作库77、知识库78及思想库79,用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息,且每条信息与各个机器人标识一一对应,即是说只有含有机器人标识的信息才能被对应的机器人服务器查询到。
每个聊天机器人服务器又进一步包括分词模块72、语言识别单元73以及信息查询单元70。分词模块72以及语言识别单元73的作用与前述图4中的分词模块42以及语言识别单元43相同,在此不再赘述。信息查询单元70用于根据用户话述的分词语素以及话述的句子类型,并结合机器人标识,查询数据库,并将查询结果传输至交互平台41。由此可见,图7的实施例运用分布式聊天机器人服务器的概念,在一个集中的服务器(系统)中,可以生成多个机器人,大大缩减聊天机器人的硬件投入成本。
以上公开的仅为本申请的几个具体实施例,但本申请并非局限于此,任何本领域的技术人员能思之的变化,都应落在本申请的保护范围内。
Claims (8)
1.一种聊天机器人系统,其特征在于,包括:
一交互平台,用于与用户进行交互;
一分词模块,与该交互平台相连,用于对用户发送来的话述进行分词,其又进一步包括:
一重组单元,与该交互平台相连,用于对用户话述中各个字按顺序进行排列组合;
一短语库,用于存放短语与标准语之间的对应关系;
一词库,用于存放标准词语;
一标准语转化单元,分别与该重组单元、该短语库及该词库相连,用于将重组合的短语和词语分别与该短语库及该词库中存放的标准语进行比对,并将重组合的各个短语和词语转化为标准语,并形成用户话述的分词;
一语言识别单元,与该分词模块相连,用于对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语;
一数据库,其又进一步包括一事件库、一动作库、一知识库及一思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息;
一信息查询单元,分别与该语言识别单元、该数据库及该交互平台相连,用于根据用户话述的分词语素以及话述的句子类型,查询该数据库,并将查询结果传输至该交互平台。
2.如权利要求1所述的聊天机器人系统,其特征在于,其还包括一修改单元,其与该数据库相连,用于修改或新增该数据库中存储的信息。
3.一种聊天机器人系统,其特征在于,包括:一交互平台、至少两个聊天机器人服务器以及一数据库,该数据库又进一步包括一事件库、一动作库、一知识库及一思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息,且每条信息与各个机器人标识一一对应,每个聊天机器人服务器又进一步包括:
一分词模块,与该交互平台相连,用于对用户发送来的话述进行分词;
一语言识别单元,与该分词模块相连,用于对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语;
一信息查询单元,分别与该语言识别单元、该数据库及该交互平台相连,用于根据用户话述的分词语素以及话述的句子类型,并结合机器人标识,查询该数据库,并将查询结果传输至该交互平台;
其中,所述分词模块又进一步包括:
一重组单元,与该交互平台相连,用于对用户话述中各个字按顺序进行排列组合;
一短语库,用于存放短语与标准语之间的对应关系;
一词库,用于存放标准词语;
一标准语转化单元,分别与该重组单元、该短语库及该词库相连,用于将重组合的短语和词语分别与该短语库及该词库中存放的标准语进行比对,并将重组合的各个短语和词语转化为标准语,并形成用户话述的分词。
4.如权利要求3所述的聊天机器人系统,其特征在于,该交互平台为网站服务器或WAP服务器或短信服务器或机器人专用服务器。
5.如权利要求3所述的聊天机器人系统,其特征在于,每个聊天机器人服务器还包括一修改单元,其与该数据库相连,用于修改或新增该数据库中存储的信息。
6.一种自动聊天方法,其特征在于,包括以下步骤:
设置一数据库,该数据库又进一步包括一事件库、一动作库、一知识库及一思想库,分别用于存储模拟人类大脑的事件信息、动作信息、知识信息及思想信息;
对用户发送来的话述进行分词;其中,对用户话述进行分词时具体包括:对用户话述中各个字按顺序进行排列组合,将重组合的短语和词语分别与预定义的标准语进行比对,将重组合的各个短语和词语转化为标准语,并形成分词;
对各个分词的语素进行判别,以及对用户话述的句子类型进行判别,所述的语素包括主语、从语、动作语和思想表达语;
根据用户话述的分词语素以及话述的句子类型,查询该数据库,并将查询结果反馈给用户。
7.如权利要求6所述的自动聊天方法,其特征在于,设置该数据库时,为该数据库中的每条信息设置机器人标识,并使每条信息与至少一个机器人标识一一对应;
获取相应的信息时具体为:根据用户话述的分词语素以及话述的句子类型,并结合机器人标识,获取相应的信息。
8.如权利要求6所述的自动聊天方法,其特征在于,向用户反馈查询结果时,
若查询到用户所需要的信息,则同时将信息在该数据库中的对应位置信息发送给用户,以供用户修改;
若没有查询到用户所需要的信息,则同时将该数据库中空的位置信息发送给用户,以供用户对数据库写入新的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110139541.9A CN102194005B (zh) | 2011-05-26 | 2011-05-26 | 聊天机器人系统及自动聊天方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110139541.9A CN102194005B (zh) | 2011-05-26 | 2011-05-26 | 聊天机器人系统及自动聊天方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102194005A CN102194005A (zh) | 2011-09-21 |
CN102194005B true CN102194005B (zh) | 2014-01-15 |
Family
ID=44602074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110139541.9A Expired - Fee Related CN102194005B (zh) | 2011-05-26 | 2011-05-26 | 聊天机器人系统及自动聊天方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102194005B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318927B2 (en) | 2017-07-17 | 2019-06-11 | ExpertHiring, LLC | Method and system for managing, matching, and sourcing employment candidates in a recruitment campaign |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598445B (zh) * | 2013-11-01 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN104615646A (zh) * | 2014-12-25 | 2015-05-13 | 上海科阅信息技术有限公司 | 智能聊天机器人系统 |
CN105912530A (zh) * | 2016-04-26 | 2016-08-31 | 北京光年无限科技有限公司 | 面向智能机器人的信息处理方法及系统 |
CN106227747A (zh) * | 2016-07-13 | 2016-12-14 | 武威江 | 一种交互评比系统 |
CN106844558A (zh) * | 2016-12-31 | 2017-06-13 | 深圳市优必选科技有限公司 | 智能问答方法及系统 |
CN108319599B (zh) | 2017-01-17 | 2021-02-26 | 华为技术有限公司 | 一种人机对话的方法和装置 |
CN107135247B (zh) * | 2017-02-16 | 2019-11-29 | 江苏南大电子信息技术股份有限公司 | 一种人与人工智能协同工作的服务系统及方法 |
TWI754694B (zh) * | 2017-03-21 | 2022-02-11 | 香港商阿里巴巴集團服務有限公司 | 通訊方法及裝置 |
CN107368572A (zh) * | 2017-07-13 | 2017-11-21 | 张勇 | 多功能智能人机交互方法及系统 |
CN107526795B (zh) * | 2017-08-17 | 2020-05-29 | 晶赞广告(上海)有限公司 | 知识库的构建方法及装置、存储介质、计算设备 |
CN108255804A (zh) * | 2017-09-25 | 2018-07-06 | 上海四宸软件技术有限公司 | 一种语言交流人工智能系统及其语言处理方法 |
CN108509477B (zh) * | 2017-09-30 | 2019-10-11 | 平安科技(深圳)有限公司 | 语义识别方法、电子装置及计算机可读存储介质 |
CN107832342B (zh) * | 2017-10-13 | 2021-08-24 | 北京左医科技有限公司 | 机器人聊天方法及系统 |
CN107918647A (zh) * | 2017-11-08 | 2018-04-17 | 北京云知声信息技术有限公司 | 虚拟对象的控制方法及装置 |
US10771407B2 (en) * | 2017-12-29 | 2020-09-08 | Paypal, Inc. | Multi-level bot architecture for data access |
CN108881507B (zh) * | 2018-03-01 | 2021-08-31 | 赵建文 | 一种包括语音浏览器和区块链语音dns单元的系统 |
CN110769071A (zh) * | 2019-10-31 | 2020-02-07 | 北京鲲鹏神通科技有限公司 | 一种机器人远程学习控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075435A (zh) * | 2007-04-19 | 2007-11-21 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
CN101193069A (zh) * | 2006-12-13 | 2008-06-04 | 腾讯科技(深圳)有限公司 | 信息查询系统、即时通信机器人服务器及信息查询方法 |
-
2011
- 2011-05-26 CN CN201110139541.9A patent/CN102194005B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101193069A (zh) * | 2006-12-13 | 2008-06-04 | 腾讯科技(深圳)有限公司 | 信息查询系统、即时通信机器人服务器及信息查询方法 |
CN101075435A (zh) * | 2007-04-19 | 2007-11-21 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318927B2 (en) | 2017-07-17 | 2019-06-11 | ExpertHiring, LLC | Method and system for managing, matching, and sourcing employment candidates in a recruitment campaign |
Also Published As
Publication number | Publication date |
---|---|
CN102194005A (zh) | 2011-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102194005B (zh) | 聊天机器人系统及自动聊天方法 | |
US11741309B2 (en) | Templated rule-based data augmentation for intent extraction | |
JP7346609B2 (ja) | 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法 | |
CN106777018B (zh) | 一种智能聊天机器人中对输入语句的优化方法及装置 | |
JP7346610B2 (ja) | 自然言語理解フレームワークでの発言についての複数意味表現の導出 | |
KR102677035B1 (ko) | 정보를 출력하기 위한 방법, 장치, 기기 및 저장매체 | |
CN108491378B (zh) | 电力信息运维智能应答系统 | |
CN107766511A (zh) | 智能问答方法、终端及存储介质 | |
CN110222162A (zh) | 一种基于自然语言处理和知识图谱的智能问答方法 | |
CN108984778A (zh) | 一种智能交互自动问答系统以及自我学习方法 | |
CN107273350A (zh) | 一种实现智能问答的信息处理方法及其装置 | |
CN109657072B (zh) | 一种应用于政府辅助决策的智能搜索web系统及方法 | |
CN104182405A (zh) | 一种连接查询方法及装置 | |
US11568862B2 (en) | Natural language understanding model with context resolver | |
CN117493529B (zh) | 基于自然语言模型的拟人对话方法、装置及电子设备 | |
CN108388623A (zh) | Er关系生成方法、装置、计算机设备及存储介质 | |
CN109597739A (zh) | 人机对话中的语音日志服务方法及系统 | |
Vishwakarma et al. | A review & comparative analysis on various chatbots design | |
CN109344410A (zh) | 一种机器翻译控制系统及方法、信息数据处理终端 | |
US20230142351A1 (en) | Methods and systems for searching and retrieving information | |
CN106843822A (zh) | 一种执行代码生成方法及设备 | |
CN107729410A (zh) | 一种适用于电力设备大数据的数据库引擎 | |
Olar et al. | Software ontology subject domain intelligence diagnostics of computer means | |
Kuhn | Using the AIDA language to formally organize scientific claims | |
CN109582690A (zh) | 一种基于人工智能语音交互的质量审核信息查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20181024 Address after: 211135 Nanjing, Jiangsu, Kirin Technology Innovation Park, Tianjiao Road, 100, 7, 2 floor, Hua Qing Yuan. Patentee after: Nanjing Qi Bao Mdt InfoTech Ltd. Address before: 201199 201, 28 Lane 4499 lane, Minhang District City Road, Shanghai. Patentee before: Lu Yumin |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140115 |