CN108764480B - 一种信息处理的系统 - Google Patents

一种信息处理的系统 Download PDF

Info

Publication number
CN108764480B
CN108764480B CN201810620088.5A CN201810620088A CN108764480B CN 108764480 B CN108764480 B CN 108764480B CN 201810620088 A CN201810620088 A CN 201810620088A CN 108764480 B CN108764480 B CN 108764480B
Authority
CN
China
Prior art keywords
question
sample
standard
questions
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810620088.5A
Other languages
English (en)
Other versions
CN108764480A (zh
Inventor
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayuan Computing Technology Shanghai Co ltd
Original Assignee
Shanghai Xiaoi Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiaoi Robot Technology Co Ltd filed Critical Shanghai Xiaoi Robot Technology Co Ltd
Priority to CN201810620088.5A priority Critical patent/CN108764480B/zh
Publication of CN108764480A publication Critical patent/CN108764480A/zh
Application granted granted Critical
Publication of CN108764480B publication Critical patent/CN108764480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种信息处理的系统,包括:信息处理的装置,装置包括:第一分析模块,用于确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问;第二分析模块,用于响应于存在与用户问句相匹配的样例扩展问,则确定人机交互日志中用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问是否相同;以及优化模块,用于响应于用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问不相同,则优化知识库;模型样例库,模型样例库包括样例标准问以及与每个样例标准问相对应的样例扩展问;知识库,知识库包括知识库标准问以及与每个知识库标准问相对应的知识库扩展问和答案,知识库用于为用户问句提供答案。

Description

一种信息处理的系统
本申请是申请日为2016年8月23日,申请号为201610710565.8,发明创造名称为“一种信息处理的方法及装置”的分案申请。
技术领域
本发明涉及人机交互技术领域,尤其涉及人机交互中信息处理的系统。
背景技术
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。
人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。为了能够理解人类语言,人工智能语义识别系统需要一套知识库。海量异构数据通过知识学习体系整理成知识,并融入到已有的知识体系中来。
各种人工智能系统采用人工智能语义识别技术对用户提出的原始问句进行处理,确定出该原始问句对应的标准问句,再基于该标准问句及原始问句中所附带的一些限定性的信息给出相应的答案,在人工智能系统中以日志的形式记录下针对每一个原始问句的处理情况,每一条日志的信息包含:用户提出的原始问句(用户问句)、标准问句(标准问)和答案。
要对知识库进行优化,包含两个重要步骤:将需要优化的交互日志挑选出来;针对挑选出来的日志对知识库进行优化。
现有技术中,挑选交互日志时,主要是通过人工手动收集并整理出正确日志库和无意义日志库,然后用每日交互日志做对比,对完全匹配的日志内容进行过滤。每一条日志都需人工对比,需要投入大量人工劳动。同时,当需要对知识库进行优化时,也需要专业的知识运维人员针对每条需优化日志进行标准问编写,成本高且效率低下。
发明内容
本发明的目的在于提供一种信息处理的系统,克服了传统技术中存在的以下问题:需要投入大量人工劳动挑选需优化的交互日志。同时,在信息处理时,系统会自动推荐标准问,进一步减少了人工劳动的投入,提高了知识库的优化效率。
根据上述目的,本发明提供一种信息处理的系统,所述系统包括:
信息处理的装置,所述装置包括:第一分析模块,用于确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问;第二分析模块,用于响应于存在与所述用户问句相匹配的样例扩展问,则确定所述人机交互日志中所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问是否相同;以及优化模块,用于响应于所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问不相同,则优化知识库;所述第一分析模块包括:语义相似度计算模块,用于将所述用户问句与样例扩展问执行语义相似度计算,以确定所述模型样例库中是否存在至少一个与所述用户问句的语义相似度大于第一阈值的样例扩展问;
模型样例库,所述模型样例库包括样例标准问以及与每个样例标准问相对应的样例扩展问;
知识库,所述知识库包括知识库标准问以及与每个知识库标准问相对应的知识库扩展问和答案,所述知识库用于为用户问句提供答案。
在一实施例中,所述第二分析模块包括:比较模块,用于比较所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问文字是否完全一致。
在一实施例中,所述第二分析模块还包括:添加模块,用于响应于存在与所述用户问句语义相似度大于所述第一阈值且小于100%的样例扩展问,且所述用户问句的所对应标准问与语义相似度大于所述第一阈值且小于100%的样例扩展问的所对应样例标准问句相同,则将所述用户问句及所述用户问句的所对应标准问相关联地添加入所述模型样例库。
在一实施例中,若存在多个匹配的样例扩展问,则所述第二分析模块确定是否有一个匹配的样例扩展问的所对应样例标准问与所述用户问句的所对应标准问相同。
在一实施例中,所述优化模块包括:推荐模块,用于基于所述语义相似度计算的结果,推荐与所述用户问句的语义匹配度大于第二阈值的样例扩展问的所对应样例标准问;以及添加模块,用于将从所推荐的样例标准问中人工选择出的标准问与所述用户问句相关联地添加入所述知识库。
在一实施例中,所述添加模块进一步用于将所述从所推荐的样例标准问中人工选择出的标准问与所述用户问句相关联地添加入所述模型样例库。
在一实施例中,若所述模型样例库中不存在与所述用户问句相匹配的样例扩展问,则所述添加模块在知识库中创建与所述用户问句对应的知识点,所述知识点包括:知识库标准问、知识库扩展问和答案。
在一实施例中,所述添加模块还将在知识库中创建的知识点同时添加到所述模型样例库。
在一实施例中,所述语义相似度计算模块包括:分词及向量计算模块,用于对样例扩展问进行分词,并计算词和句子向量值,以及对所述用户问句进行分词,并计算词和句子向量值;以及相关度计算模块,用于计算样例扩展问的词和句子向量值与所述用户问句的词和句子向量值的相关度,以得出所述用户问句与样例扩展问的语义相似度。
在一实施例中,所述装置还包括:预处理模块,用于在确定所述模型样例库中是否存在与所述用户问句相匹配的样例扩展问之前,对所述人机交互日志中所有用户问句进行预处理,以过滤人机交互日志用户问句中的无效数据。
本发明在选取需优化人机交互日志时,首先通过设立的模型样例库进行自动筛选,过滤掉了大量的已有知识内容,减少了人工劳动的投入量。同时系统会自动向需优化人机交互日志推荐标准问,人工只需进行选择即可,进一步减少了人工劳动,提高了知识库的优化效率。
为了对本发明的上述及其他方面有更佳的了解,下文特举较佳实施例,并配合附图,作详细说明如下:
附图说明
图1为本发明知识库示意图;
图2为本发明模型样例库示意图;
图3为本发明一实施例的信息处理的方法流程中优化知识库流程的示意图;
图4为本发明一实施例的信息处理的方法流程的示意图;
图5为本发明一实施例的信息处理的装置的示意图。
具体实施方式
用户在与智能机器人交互过程中会产生交互日志,每条交互日志由用户问句、对应的知识库标准问以及答案三部分组成。其中用户问句是由用户直接输入获得,通过问答引擎对用户问句的解析识别后,调用相应的知识库标准问及对应的答案。在这些交互日志中根据用户问句与机器人给予对应知识点的答案回复准确性区分,可分为用户问句内容机器人未给予答复、用户问句内容机器人给予正确答复、用户问句内容机器人给予错误答复。造成机器人未答复或给予错误答复的原因主要是由于机器人知识库中缺失了相应的知识点或已有知识点的问法不够丰富。因此通过每天产生的交互日志的分析,提取因知识点缺失或问法不丰富造成的机器人非正确答复的日志是对知识库持续优化的一个主要途径。本发明提供的方法和装置可以大大减少在提取需要优化的人机交互日志时的人工投入量。本发明主要关注交互日志中的用户问句和标准问。
请参看图1和图2,图1和图2示出了本发明信息处理的部分对象,知识库和模型样例库。
如图1所示,知识库10包括至少一个知识库标准问101、知识库标准问102、……、知识库标准问10n,以及与知识库标准问101相对应的知识库扩展问1011、……、知识库扩展问101n和答案,与知识库标准问102相对应的知识库扩展问1021、……、知识库扩展问 102n和答案,与知识库标准问10n相对应的知识库扩展问10n1、……、知识库扩展问10nn 和答案,其中每个知识库标准问对应一个答案,可以有多个知识库扩展问1011-知识库扩展问101n对应一个知识库标准问101。由于知识库标准问101跟答案存在一一对应的关系,本发明主要关注知识库标准问以及与每个知识库标准问相对应的知识库扩展问的处理过程。通常,知识库中都会存在多个知识库标准问,知识库标准问101-知识库标准问10n。知识库中包括多个知识点,每个知识点包括:一个知识库标准问、多个知识库扩展问和一个答案,即不同的知识库扩展问都是对应同一个答案,一个知识库标准问也对应这一个答案。一般是从每个知识点对应的多个知识库扩展问中选择一个表达清晰易于维护的知识库扩展问作为该知识点的知识库标准问,因此知识库标准问与一个知识库扩展问相同。需要说明的是,每个知识库标准问所对应的知识库扩展问个数可以相同,也可以不同。
在人机交互过程中,接收到用户问句后,会通过语义相似度计算从知识库中得到与用户问句的语义相似度最高且高于阈值的知识库扩展问,并将该知识库扩展问对应的答案发送给用户,同时将该用户问句及与该知识库扩展问对应的知识库标准问关联性地作为一条交互日志。
如图2所示,模型样例库20包括至少一个样例标准问201、样例标准问202、……、样例标准问20n,以及与样例标准问201对应的一个或多个样例扩展问2011、……、样例扩展问201n,与样例标准问202对应的一个或多个样例扩展问2021、……、样例扩展问 202n,……,与样例标准问20n对应的一个或多个样例扩展问20n1、……、样例扩展问20nn,同知识库数据结构类似,一个样例标准问可以跟多个样例扩展问对应。一般是从多个样例扩展问中选择一个表达清晰易于维护的扩展问作为与所述多个样例对应的样例标准问,因此样例标准问与其中一个样例扩展问相同。每个样例标准问对应的样例扩展问个数可以相同,也可以不同。
请参看图3,示出了本发明一实施例的知识库优化流程,包含以下步骤:
步骤301:开始。
步骤302:确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问。
步骤303:若存在,则确定所述人机交互日志中所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问是否相同。
步骤304:若不相同,则优化所述知识库。
在步骤302中,首先在模型样例库中寻找是否有跟人机交互日志用户问句语义近似的样例扩展问,如果有近似的,则称之为匹配。若有匹配的,此时认为该条用户问句可被模型样例库判定。接着在步骤303中,若可被判定,则确定该用户问句对应的标准问与该样例扩展问对应的标准问是否相同,此处的相同是指文字完全一致,若相同则表明知识库中已包括与该用户问句对应的知识点,无需利用该条用户日志优化知识库。若不相同,则表明模型样例库和知识库中均没有与该交互日志内容对应的问句,此时表明该条交互日志是新的内容,需要利用该条交互日志信息优化知识库,也就是进入到步骤304中。此时,由于交互日志中的用户问句可被判定,即可直接将模型样例库中与交互日志用户问句语义近似的一个或多个样例问句对应的一个或多个样例标准问推荐给知识维护人员,当为一个时,由知识维护人员判断是否合适;当为多个时,由知识维护人员从中直接挑选一个最合适的即可,最后将判断合适或挑选的最合适的样例标准问以及用户问句相关联地存入知识库,从而人工的投入只需要进行简单的监督管理,进行监督管理的知识维护人员只需认识中文,具有正常的逻辑判断能力即可,这样对于之前需要投入人工需要有一定的知识编辑经验的来说,进一步降低了对人员门槛的要求,且提高了优化效率。
此方法的优点还在于,判断是否需要优化知识库完全是在本地模型样例库中完成的,而无需利用云端的知识库。这样既提高了运算速率,又节省了云端知识库的开支。
在一实施例中,样例扩展问包括知识库扩展问,样例标准问包括知识库标准问。更进一步地,样例扩展问包括知识库中的所有知识库扩展问,样例标准问包括知识库中的所有知识库标准问。在此实施例中,模型样例库包括了知识库中的所有知识库标准问和知识库扩展问。此时模型样例库对是否优化的判断更为准确,更进一步减小了后续人工挑选的工作量。
在一实施例中,在步骤302中,若判断结果为,模型样例库中不存在与所述用户问句相匹配的样例扩展问,则在知识库中创建与所述用户问句对应的知识点,所述知识点包括:知识库标准问、知识库扩展问和答案。此实施例中,认为该交互日志无法被模型样例库所判定,即知识库中没有与该交互日志相关的信息,需要利用此交互日志优化知识库。此时由于该交互日志不可判定,只有通过知识维护人员主动添加一条与该用户问句相关的知识点,即需要添加一个知识库标准问、多个知识库扩展问和一个答案,来完成知识库的优化。
在一优选实施例中,步骤302中是否匹配是通过语义相似度来衡量的,可以设定第一阈值,当语义相似度大于第一阈值时,认为交互日志用户问句跟样例扩展问匹配。当人工投入量可以保证时,可以把所述第一阈值设定地高一些。否则,则可以将第一阈值设定地低一些,从而可以节省人力成本。
在一实施例中,所述确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问,是通过语义匹配度运算完成的,包括步骤:对样例扩展问进行分词,并计算词和句子向量值;对所述用户问句进行分词,并计算词和句子向量值;计算每个样例扩展问的词和句子向量值与所述用户问句的词和句子向量值的相关度,以得出所述用户问句与样例扩展问的语义相似度。语义匹配度的运算方法很多,现有技术中的方法也可以被运用到本发明中。
由于模型样例库的质量对于本发明至关重要,更优地,在另一实施例中,对模型样例库进行优化,包括两种方式:一、在对知识库进行优化的同时,将相同的内容添加入模型样例库;二、当存在与所述用户问句语义相似度大于所述第一阈值且小于100%的样例扩展问,且所述用户问句的所对应标准问与语义相似度大于所述第一阈值且小于100%的样例扩展问的所对应样例标准问句相同,则将所述用户问句及所述用户问句的所对应标准问相关联地添加入模型样例库。第一种优化主要是为了使得模型样例库内容跟知识库内容保持一致,并将最新的问句和标准问更新入模型样例库,以在下次碰到跟更新的内容近似的交互日志时,可以通过本发明直接滤除,而不需人工判断优化。第二种优化方式下,由于已经能从知识库中为当前的用户问句提供正确的答案,即找到正确的标准问,从而可以不用将交互日志优化入知识库,但优化入模型样例库中有利于将后续更多的交互日志纳入可判定范围内,从而可以通过本发明直接处理相关交互日志。
请参看图4,为本发明一实施例的信息处理方法流程的示意图,相比图2,图3所示方法流程包括了对模型样例库的优化。具体包括:
步骤401:开始。
步骤402:确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问,若存在进入步骤403,否则进入步骤405。
步骤403:确定所述人机交互日志中所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问是否相同。若相同进入步骤404,否则进入步骤406。
步骤404:判断用户问句与样例扩展问的语义相似度是否大于第一阈值且小于100%,若是则进入407,否则进入408。
步骤405:重新创建知识点,并运用知识点优化知识库和模型样例库。
步骤406:选择创建知识点,并运用知识点优化知识库和模型样例库。
步骤407:运用交互日志内容,优化模型样例库。
步骤408:结束。
其中步骤405内容包括:通过知识维护人员主动添加一条与该用户问句相关的知识点,即需要添加一个知识库标准问、多个知识库扩展问和一个答案,来完成知识库的优化,同时利用相同的知识点优化模型样例库,只是模型样例库的优化只用到了知识点中的问句和标准问内容。步骤406包括:推荐模型样例库中的一个或多个标准问给知识维护人员,知识维护人员直接进行选择以形成用户问句和标准问的一个配对,然后将该配对添加入知识库,同时将该配对添加入模型样例库。步骤407中,将交互日志中的用户问句和所对应的标准问添加到模型样例库中,从而形成一对新的样例扩展问和样例标准问的对应。
本发明还提供一种信息处理的装置,请参看图5。在一实施例中,所述装置包括第一分析模块501、第二分析模块502和优化模块503。交互日志首先进入第一分析模块501,第一分析模块501确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问,若存在,则进入第二分析模块502,确定所述人机交互日志中所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问是否相同,若不相同则进入优化模块503对所述知识库进行优化。
在另一实施例中,请参看图5 ,第一分析模块501还包括语义相似度计算模块5011,用来计算人机交互日志中的用户问句与样例扩展问的语义相似度,进而得出匹配度。第二分析模块502包括比较模块5021,用来比较所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问文字是否完全一致。优化模块503还包括推荐模块5031,用于基于语义相似度计算模块5011的结果,推荐与所述用户问句的语义匹配度大于第二阈值的样例扩展问的所对应样例标准问。优化模块503还包括添加模块5032,用于将从所推荐的样例标准问中人工选择出的标准问与所述用户问句相关联地添加入所述知识库,同时将上述内容优化添加入模型样例库。
更优地,在对知识库优化的同时,对模型样例库504进行优化。第二分析模块502还包括添加模块5022,当用户问句与样例扩展问的语义相似度是否大于第一阈值且小于100%,且对应的标准问相同时,将交互日志内容优化入模型样例库。添加模块5032还用于将从推荐模块5031推荐的样例标准问中人工选择出的标准问与所述用户问句相关联地添加入模型样例库。
在另一实施例中,首先过滤交互日志中的无效数据,可以根据预设的过滤规则剔除日志数据中的垃圾数据,如:单个英文字母重复5次以上的数据。之后会采用朴素贝叶斯算法进行分析,计算日志内容是否在分析模型可判定范围内。
本发明还提供一种信息处理的系统52,请参看图5。包括所述任一信息处理装置,同时包括了知识库504和模型样例库505。
本发明在选取需优化人机交互日志时,首先通过设立的模型样例库进行自动筛选,过滤掉了大量的已有知识内容,减少了人工劳动的投入量。同时系统会自动向需优化人机交互日志推荐标准问,人工只需进行选择即可,进一步减少了人工劳动,提高了知识库的优化效率。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims (8)

1.一种信息处理的系统,其特征在于,所述系统包括:
信息处理的装置,所述装置包括:第一分析模块,用于确定模型样例库中是否存在与人机交互日志中的用户问句相匹配的样例扩展问;第二分析模块,用于响应于存在与所述用户问句相匹配的样例扩展问,则确定所述人机交互日志中所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问是否相同;以及优化模块,用于响应于所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问不相同,则优化知识库;所述第一分析模块包括:语义相似度计算模块,用于将所述用户问句与样例扩展问执行语义相似度计算,以确定所述模型样例库中是否存在至少一个与所述用户问句的语义相似度大于第一阈值的样例扩展问;
模型样例库,所述模型样例库包括样例标准问以及与每个样例标准问相对应的样例扩展问;
知识库,所述知识库包括知识库标准问以及与每个知识库标准问相对应的知识库扩展问和答案,所述知识库用于为用户问句提供答案;
所述第二分析模块包括:
比较模块,用于比较所述用户问句的所对应标准问与匹配的样例扩展问的所对应样例标准问文字是否完全一致;
添加模块,用于响应于存在与所述用户问句语义相似度大于所述第一阈值且小于100%的样例扩展问,且所述用户问句的所对应标准问与语义相似度大于所述第一阈值且小于100%的样例扩展问的所对应样例标准问句相同,则将所述用户问句及所述用户问句的所对应标准问相关联地添加入所述模型样例库。
2.如权利要求1所述的信息处理的系统,其特征在于,若存在多个匹配的样例扩展问,则所述第二分析模块确定是否有一个匹配的样例扩展问的所对应样例标准问与所述用户问句的所对应标准问相同。
3.如权利要求1所述的信息处理的系统,其特征在于,所述优化模块包括:
推荐模块,用于基于所述语义相似度计算的结果,推荐与所述用户问句的语义匹配度大于第二阈值的样例扩展问的所对应样例标准问;以及
添加模块,用于将从所推荐的样例标准问中人工选择出的标准问与所述用户问句相关联地添加入所述知识库。
4.如权利要求3所述的信息处理的系统,其特征在于,所述添加模块
进一步用于将所述从所推荐的样例标准问中人工选择出的标准问与所述用户问句相关联地添加入所述模型样例库。
5.如权利要求3所述的信息处理的系统,其特征在于,若所述模型样例库中不存在与所述用户问句相匹配的样例扩展问,则所述添加模块在知识库中创建与所述用户问句对应的知识点,所述知识点包括:知识库标准问、知识库扩展问和答案。
6.如权利要求5所述的信息处理的系统,其特征在于,所述添加模块还将在知识库中创建的知识点同时添加到所述模型样例库。
7.如权利要求1所述的信息处理的系统,其特征在于,所述语义相似度计算模块包括:
分词及向量计算模块,用于对样例扩展问进行分词,并计算词和句子向量值,以及对所述用户问句进行分词,并计算词和句子向量值;以及
相关度计算模块,用于计算样例扩展问的词和句子向量值与所述用户问句的词和句子向量值的相关度,以得出所述用户问句与样例扩展问的语义相似度。
8.如权利要求1所述的信息处理的系统,其特征在于,所述装置还包括:预处理模块,用于在确定所述模型样例库中是否存在与所述用户问句相匹配的样例扩展问之前,对所述人机交互日志中所有用户问句进行预处理,以过滤人机交互日志用户问句中的无效数据。
CN201810620088.5A 2016-08-23 2016-08-23 一种信息处理的系统 Active CN108764480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810620088.5A CN108764480B (zh) 2016-08-23 2016-08-23 一种信息处理的系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610710565.8A CN106295807B (zh) 2016-08-23 2016-08-23 一种信息处理的方法及装置
CN201810620088.5A CN108764480B (zh) 2016-08-23 2016-08-23 一种信息处理的系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201610710565.8A Division CN106295807B (zh) 2016-08-23 2016-08-23 一种信息处理的方法及装置

Publications (2)

Publication Number Publication Date
CN108764480A CN108764480A (zh) 2018-11-06
CN108764480B true CN108764480B (zh) 2020-07-07

Family

ID=57615826

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201810620088.5A Active CN108764480B (zh) 2016-08-23 2016-08-23 一种信息处理的系统
CN201610710565.8A Active CN106295807B (zh) 2016-08-23 2016-08-23 一种信息处理的方法及装置
CN201811074893.9A Active CN109344237B (zh) 2016-08-23 2016-08-23 一种用于人机交互的信息处理的方法及装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201610710565.8A Active CN106295807B (zh) 2016-08-23 2016-08-23 一种信息处理的方法及装置
CN201811074893.9A Active CN109344237B (zh) 2016-08-23 2016-08-23 一种用于人机交互的信息处理的方法及装置

Country Status (1)

Country Link
CN (3) CN108764480B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886820A (zh) * 2017-02-08 2017-06-23 深圳市科迈爱康科技有限公司 智能信息处理方法及系统
CN109934347B (zh) * 2017-12-18 2024-02-02 上海智臻智能网络科技股份有限公司 扩展问答知识库的装置
CN109933777B (zh) * 2017-12-18 2024-02-06 上海智臻智能网络科技股份有限公司 知识库扩展装置
CN110019305B (zh) * 2017-12-18 2024-03-15 上海智臻智能网络科技股份有限公司 知识库扩展方法及存储介质、终端
CN110019304B (zh) * 2017-12-18 2024-01-05 上海智臻智能网络科技股份有限公司 扩展问答知识库的方法及存储介质、终端
CN108345644A (zh) * 2018-01-15 2018-07-31 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN109325040B (zh) * 2018-07-13 2020-11-10 众安信息技术服务有限公司 一种faq问答库泛化方法、装置及设备
WO2020047779A1 (zh) * 2018-09-05 2020-03-12 西门子(中国)有限公司 故障分析方法、装置和计算机可读介质
CN109213847A (zh) * 2018-09-14 2019-01-15 广州神马移动信息科技有限公司 答案的分层方法及其装置、电子设备、计算机可读介质
CN109189912A (zh) * 2018-10-09 2019-01-11 阿里巴巴集团控股有限公司 用户咨询语句库的更新方法及装置
CN111382239B (zh) * 2018-12-27 2023-06-23 上海智臻智能网络科技股份有限公司 一种交互流程的优化方法及其装置
CN111400458A (zh) * 2018-12-27 2020-07-10 上海智臻智能网络科技股份有限公司 一种自动泛化方法及其装置
CN111382235A (zh) * 2018-12-27 2020-07-07 上海智臻智能网络科技股份有限公司 一种问答知识库的优化方法及其装置
CN109829051B (zh) * 2019-01-30 2023-01-17 科大讯飞股份有限公司 一种数据库相似语句筛选的方法和装置
CN109992675A (zh) * 2019-01-30 2019-07-09 阿里巴巴集团控股有限公司 信息处理方法和装置
CN109947651B (zh) * 2019-03-21 2022-08-02 上海智臻智能网络科技股份有限公司 人工智能引擎优化方法和装置
CN110347807B (zh) * 2019-05-20 2023-08-08 平安科技(深圳)有限公司 问题信息处理方法及装置
CN110362665B (zh) * 2019-06-12 2021-04-30 深圳追一科技有限公司 一种基于语义相似度的问答系统及方法
CN110928991A (zh) * 2019-11-20 2020-03-27 上海智臻智能网络科技股份有限公司 一种问答知识库的更新方法及其装置
CN111125379B (zh) * 2019-12-26 2022-12-06 科大讯飞股份有限公司 知识库扩充方法、装置、电子设备和存储介质
CN111144098B (zh) * 2019-12-26 2023-05-30 支付宝(杭州)信息技术有限公司 扩展问句的召回方法和装置
CN112936304B (zh) * 2021-02-02 2022-09-16 浙江大学 一种自演进式服务机器人系统及其学习方法
CN114064874A (zh) * 2021-11-19 2022-02-18 浙江百应科技有限公司 一种基于向量搜索引擎的知识库问题添加方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178705A (zh) * 2007-12-13 2008-05-14 中国电信股份有限公司 一种自然语言理解方法和人机交互智能系统
CN104360994A (zh) * 2014-12-04 2015-02-18 科大讯飞股份有限公司 自然语言理解方法及系统
CN104679815A (zh) * 2014-12-08 2015-06-03 北京云知声信息技术有限公司 一种筛选问答对并实时更新问答库的方法及系统
CN105488185A (zh) * 2015-12-01 2016-04-13 上海智臻智能网络科技股份有限公司 一种知识库的优化方法和装置
CN105550361A (zh) * 2015-12-31 2016-05-04 上海智臻智能网络科技股份有限公司 日志处理方法及装置和问答信息处理方法及装置
CN105631022A (zh) * 2015-12-29 2016-06-01 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105824797A (zh) * 2015-01-04 2016-08-03 华为技术有限公司 一种评价语义相似度的方法、装置和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504361B2 (en) * 2008-02-07 2013-08-06 Nec Laboratories America, Inc. Deep neural networks and methods for using same
CN104199825A (zh) * 2014-07-23 2014-12-10 清华大学 一种信息查询方法和系统
US20160196490A1 (en) * 2015-01-02 2016-07-07 International Business Machines Corporation Method for Recommending Content to Ingest as Corpora Based on Interaction History in Natural Language Question and Answering Systems
CN105591882B (zh) * 2015-12-10 2018-03-06 北京中科汇联科技股份有限公司 一种智能机器人与人混合客服的方法及系统
CN105677783A (zh) * 2015-12-31 2016-06-15 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及装置
CN105678324B (zh) * 2015-12-31 2019-03-26 上海智臻智能网络科技股份有限公司 基于相似度计算的问答知识库的建立方法、装置及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178705A (zh) * 2007-12-13 2008-05-14 中国电信股份有限公司 一种自然语言理解方法和人机交互智能系统
CN104360994A (zh) * 2014-12-04 2015-02-18 科大讯飞股份有限公司 自然语言理解方法及系统
CN104679815A (zh) * 2014-12-08 2015-06-03 北京云知声信息技术有限公司 一种筛选问答对并实时更新问答库的方法及系统
CN105824797A (zh) * 2015-01-04 2016-08-03 华为技术有限公司 一种评价语义相似度的方法、装置和系统
CN105488185A (zh) * 2015-12-01 2016-04-13 上海智臻智能网络科技股份有限公司 一种知识库的优化方法和装置
CN105631022A (zh) * 2015-12-29 2016-06-01 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105550361A (zh) * 2015-12-31 2016-05-04 上海智臻智能网络科技股份有限公司 日志处理方法及装置和问答信息处理方法及装置

Also Published As

Publication number Publication date
CN109344237A (zh) 2019-02-15
CN106295807A (zh) 2017-01-04
CN109344237B (zh) 2020-11-17
CN108764480A (zh) 2018-11-06
CN106295807B (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN108764480B (zh) 一种信息处理的系统
CN112487140B (zh) 问答对话评测方法、装置、设备及存储介质
US10242049B2 (en) Method, system and storage medium for implementing intelligent question answering
CN106202476B (zh) 一种基于知识图谱的人机对话的方法及装置
CN108932945B (zh) 一种语音指令的处理方法及装置
CN107729468B (zh) 基于深度学习的答案抽取方法及系统
CN106649742A (zh) 数据库维护方法和装置
CN111026884B (zh) 一种提升人机交互对话语料质量与多样性的对话语料库生成方法
CN104036004B (zh) 搜索纠错方法和搜索纠错装置
CN108710653B (zh) 一种绘本朗读点播方法、装置及系统
CN108108347B (zh) 对话模式分析系统及方法
US20210026890A1 (en) Faq consolidation assistance device, faq consolidation assistance method, and program
CN109948154B (zh) 一种基于邮箱名的人物获取及关系推荐系统和方法
CN112148852A (zh) 一种智能客服方法、装置、存储介质及计算机设备
CN111460114A (zh) 检索方法、装置、设备及计算机可读存储介质
CN112445894A (zh) 基于人工智能的商务智能系统及其分析方法
CN107967302A (zh) 基于深度神经网络的游戏客服对话系统
CN116542676A (zh) 一种基于大数据分析的智能客服系统及其方法
CN114186040A (zh) 一种智能机器人客服的运作方法
CN114186041A (zh) 一种答案输出方法
CN117556057A (zh) 知识问答方法、向量数据库构建方法及装置
CN117391093A (zh) 一种提供大数据解决方案的智能交互机器人
CN111782789A (zh) 智能问答方法与系统
CN115017271B (zh) 用于智能生成rpa流程组件块的方法及系统
CN111949781B (zh) 一种基于自然语句句法分析的智能交互方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230315

Address after: 200436 Floor 9, building a, yuncube, No. 1268, Wanrong Road, Jing'an District, Shanghai

Patentee after: Huayuan computing technology (Shanghai) Co.,Ltd.

Address before: 201803 7, 398 Lane 1555, Jiangxi Road, Jinsha, Jiading District, Shanghai.

Patentee before: SHANGHAI XIAOI ROBOT TECHNOLOGY Co.,Ltd.