CN104679492A - 计算机实现的提供技术支持的设备和方法 - Google Patents
计算机实现的提供技术支持的设备和方法 Download PDFInfo
- Publication number
- CN104679492A CN104679492A CN201310629393.8A CN201310629393A CN104679492A CN 104679492 A CN104679492 A CN 104679492A CN 201310629393 A CN201310629393 A CN 201310629393A CN 104679492 A CN104679492 A CN 104679492A
- Authority
- CN
- China
- Prior art keywords
- entity
- entity relationship
- relationship model
- technical documentation
- technical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种用于提供技术支持的设备和方法。该设备包括:输入处理单元,被配置为接收用户的输入信息,以获得相关文本;实体关系识别单元,被配置为根据所述输入处理单元获得的所述相关文本,识别多个实体和所述多个实体之间的关系,以构建多个实体关系模型;迭代匹配单元,被配置为将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值,以及输出处理单元,被配置为输出概率值大于一阈值的技术文档。
Description
技术领域
本公开涉及信息技术领域,具体地,涉及计算机实现的提供技术支持的设备和方法。
背景技术
当用户想从产品提供商获得帮助来解决硬件或软件问题时,会启动技术支持过程。一般地,由于地理位置的原因,技术支持工作依赖于通过电话呼叫、电子邮件或其他基于互联网的例如网站服务而交换的信息。例如,用户和技术支持者经常使用诸如呼叫中心和技术支持网站来处理问题。
然而,在一般的产品支持系统中,用户对产品环境的架构的描述经常会出错,通过电话以及网络交流所获得的语音、文本等信息的简单描述有时也会引起误解,技术支持者要理解用户的产品环境的准确架构需要花费较长时间。也就是说,在技术支持过程中,除了对产品本身的必要调试外,大量努力都花费在与用户的交流上,如果问题不能在第一时间得到解决,则会需要更多的交流。另外,技术支持者使用的技术文档与产品环境在一定程度上是相互隔离的,并且技术文档中包含大量内容,因此,在故障诊断方面,特别是对新手而言,是很难掌握的。另外,在IT领域中,IT服务的架构以及产业解决方案都是非常复杂的,其对于技术支持者来说是极大的挑战。
发明内容
根据本公开的一个方面,提供一种计算机实现的用于提供技术支持的设备,包括:输入处理单元,被配置为接收用户的输入信息,以获得相关文本;实体关系识别单元,被配置为根据所述输入处理单元获得的所述相关文本,识别多个实体和所述多个实体之间的关系,以构建多个实体关系模型;迭代匹配单元,被配置为将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值,以及输出处理单元,被配置为输出概率值大于一阈值的技术文档。
根据本公开的另一方面,提供一种计算机实现的用于提供技术支持的方法,包括:输入处理步骤,接收用户的输入信息,以获得相关文本;实体关系识别步骤,根据在输入处理步骤中获得的所述相关文本,识别多个实体和所述多个实体之间的关系,以构建多个实体关系模型;迭代匹配步骤,将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值,以及输出处理步骤,输出概率值大于一阈值的技术文档。
根据本公开的再一方面,提供一种用于提供技术支持的计算机程序产品,所述计算机程序产品包括可由计算机读取并存储指令的存储介质,所述指令由所述计算机执行,以执行根据本公开的另一方面提供的用于提供技术支持的方法的各步骤。
本公开的一个实施例提供的用于提供技术支持的设备、方法和计算机程序产品可以处理和分析用户输入的文本、语音、图形等信息,提取上述输入的信息中涉及的实体,识别所述实体之间的关系,有助于提高技术支持的效率。
附图说明
从下面结合附图对本公开实施例的详细描述中,本公开的这些和/或其它方面和优点将变得更加清楚并更容易理解,其中:
图1是适于实现本公开实施方式的示例性计算机系统/服务器12的框图;
图2是根据本公开的一个实施例的用于提供技术支持的设备的方框图;
图3是根据本公开的一个实施例的用于提供技术支持的设备的更详细的方框图;
图4是示出表达实体和实体关系的XML文件的结构示例的图;
图5是根据本公开的一个实施例的输出处理单元输出的图形视图的图;
图6是根据本公开的一个实施例的用于提供技术支持的方法的流程图;
图7是根据本公开的一个实施例的实体关系识别步骤的更具体的流程图;
图8是根据本公开的一个实施例的迭代匹配步骤的更具体的流程图;
图9是根据本公开一个实施例的用于提供技术支持的方法的另一个流程图。
具体实施方式
在附图中显示了本公开的一些优选实施方式,下面将参照附图更详细地描述这些优选实施方式。然而,可以以各种形式实现本公开,其不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
所属技术领域的技术人员知道,本公开的各个方面可以实现为系统、装置、方法或计算机程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本公开的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本公开。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的一个或多个方框中规定的功能/动作的过程。
图1示出了适于实现本公开的实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)、广域网(WAN)和/或公共网络,例如因特网)通信。如图1所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图1中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
本领域技术人员可以理解的是,本发明既可以以软件方式实现,也可以以硬件方式实现,或者通过软件与硬件相结合的方式实现。并且,本领域技术人员可以理解,通过以软件、硬件或者软硬件相结合的方式实现上述方法中的各个步骤,可以提供一种用于提供技术支持的设备。即使该装置在硬件结构上与通用处理设备相同,由于其中所包含的软件的作用,使得该装置表现出区别于通用处理设备的特性,从而形成本发明的各个实施例的装置。本发明中所述装置包括若干单元或模块,所述单元或模块被配置为执行相应步骤。本领域的所述技术人员通过阅读本说明书可以理解如何编写程序实现所述单元或模块执行的动作。下面将参考附图具体描述根据本发明的各个实施例的用于提供技术支持的设备。
首先对本公开中出现的技术术语进行说明如下:
实体:是指现实世界中任何可区分、可识别的事物。实体可以指人,如教师、学生等,也可以指物,如书、仓库、计算机、服务器、交换机等。它不仅可以指能触及的客观对象,还可以指抽象的事件,如演出、足球赛、位置等。在IT领域中,它还可以表示发送信息或接收信息的硬件或软件进程。在文本中是用名词的形式来表达实体的具体含义。
实体关系:是指实体之间的关系,例如不同实体之间的所属、位置等关系。
图2是示出根据本公开的一个实施例的用于提供技术支持的设备的方框图。如图2所示,根据本公开的一个实施例的用于提供技术支持的设备200包括:输入处理单元201,实体关系识别单元202,迭代匹配单元203和输出处理单元204。
输入处理单元201被配置为在线或可以离线接收用户的输入信息,对所述输入信息进行处理,以获得相关文本。本领域技术人员知道,也可以不对用户输入的信息进行处理而直接获得上述相关文本。例如在用户输入了适当的文本后,可以直接从输入的文本中获得上述相关文本。
实体关系识别单元202被配置为根据所述输入处理单元201获得的所述相关文本,识别多个实体和所述多个实体之间关系,以构建多个实体关系模型。所述实体以及实体之间的关系可以直接来自于所述相关文本,也可以间接来自于所述相关文本。例如,可以从所述相关文本中直接提取文字(例如,表示术语的词汇)来作为所述实体以及实体之间的关系,也可以通过所述相关文本中的文字间接地、抽象地获得所述实体以及实体之间的关系。
迭代匹配单元203被配置为将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值。
输出处理单元204被配置为输出若干个概率值较大的技术文档和/或概率值较大的实体关系模型。例如,可以为技术文档的概率值设置一阈值,也可以为实体关系模型的概率值设置另一阈值(第二阈值),用来选取要输出的技术文档和/或实体关系模型。例如,输出处理单元204可以被配置为输出概率值大于上述阈值的技术文档。输出处理单元204也可以被配置为还输出概率值大于该另一阈值(第二阈值)的实体关系模型。其中上述阈值和第二阈值可以是相同的值,也可以是不同的值。上述阈值和第二阈值的大小不对本公开的范围构成限制,本领域的技术人员可以根据实际需求进行适当设置。
实体关系模型和技术文档可以用文字来描述,或者可以用拓扑图形来表示,它们被呈现给技术支持者,以供技术支持者用于确定用户的产品环境的实际拓扑结构。
图3是根据本公开的一个实施例的用于提供技术支持的设备的更详细的方框图。如图3所示,本实施例的用于提供技术支持的设备300包括:输入处理单元301,实体关系数据库302,实体关系识别单元303,技术文档构建单元304,迭代匹配单元305,以及输出处理单元306。
输入处理单元301被配置为在线接收用户的输入信息,对所述用户的输入信息进行处理,以获得相关文本。输入处理单元301可以接收并记录用户的输入信息,对所述用户的输入信息进行处理和识别,以获得相关文本。所述用户的输入信息可以包括文本、语音和图形(表示产品环境的架构)等。例如,用户可以通过拨打呼叫中心的语音电话,利用麦克风等输入语音,用户输入的语音可以通过例如呼叫中心的电话网络或通过互联网传输到技术支持者的用于提供技术支持的设备300。用户还可以通过登录技术支持网站,利用鼠标、键盘、画板、照相机等,上传文本或者图形文件,所上传的文本或者图形文件通过互联网传输到技术支持者的用于提供技术支持的设备300。输入处理单元301对接收到的文本、语音、图形等进行处理和识别,从其中提取相关文本。这里所说的相关文本可以是不同领域(例如IT领域)中的技术术语或句子、文章等文字。
在本公开的实施例中,对图形的处理可以采用但不限于OCR(OpticalCharacter Recognition)技术。OCR用于识别用户通过例如技术支持网站上传的图形文件中的文字。OCR的识别方式的技术细节不对本公开的范围构成限制,本领域技术人员可以根据已有技术来实现本公开中的对于图形的处理,OCR的技术内容可以从站点http://en.wikipedia.org/wiki/Optical_character_recognition获得。经过OCR处理后,可以从图形中获得需要的文本。
对语音的处理包括对语音进行记录和对语音进行识别等,语音识别包括说话者识别和内容识别。技术支持者与用户的交流是按照Q&A(问题和回答)程序进行的,其中双方都要试图相互理解。说话者识别用于确定谁在说话,
比如可以确定是用户在说话还是技术支持者在说话,而内容识别用于确定在说什么。对语音的处理和识别的方式的技术细节不对本公开的范围构成限制,本领域技术人员可以根据已有技术来实现本公开中对于语音的处理。经过对语音的处理后,可以从语音中获得需要的文本。
对于文本的处理和识别可以采用文本提取技术,例如但不限于采用内容链接百分比(CLP:Content linkage percentage)技术。在内容链接百分比技术中,首先进行文本分段,然后通过应用投票算法(voting algorithm)对每部分文本给出最终分数来识别文档的主要部分。
例如:CLP=无链接文本长度/文本总长度
对文本进行处理和识别的方式的技术细节不对本公开的范围构成限制,本领域技术人员可以根据已有技术来实现本公开中对文本的处理和识别。经过对输入的文本的处理后,可以从输入的文本中获得需要的文本。
实体关系数据库302被配置为存储实体识别规则和实体之间关系识别规则。在例如信息技术(IT)领域中,实体是容易定义和识别的,例如,实体可以是数据库、程序库、防火墙、服务器、交换机、以及其它设备名称、软件名称等。这些术语、名称可以由技术人员在离线状态下输入到例如实体关系数据库302中,作为实体识别的规则。在IT领域中,对实体关系的识别也是简单的,这些关系可以例如表示为“…之上”、“链接到…”、“…之下”等等。这些关系也可以由技术人员在离线状态下输入到例如实体关系数据库302中,作为对实体之间的关系进行识别的规则。另外,还可以将用于进行实体识别和进行实体之间关系识别的方法(如后所述)存储在实体关系数据库302中,作为实体识别规则和实体之间关系识别规则。
实体关系识别单元303被配置为根据所述输入处理单元301获得的相关文本,识别多个实体和多个实体之间的关系,以构建多个实体关系模型。具体地,所述实体关系识别单元303还可以包括实体识别模块3031、关系识别模块3032、模型构建模块3033。
实体识别模块3031被配置为根据存储在实体关系数据库302中的实体识别规则,从所述输入处理单元301获得的相关文本中识别多个实体。例如,在一个文本句子“服务器链接到位于网关的交换机上”中含有“服务器”、“交换机”、“网关”等术语,实体识别模块3031可以将其中的“服务器”、“交换机”、“网关”识别为不同的实体。
对从输入处理单元301接收的文本进行处理以从中识别出实体的方法可以使用本领域技术人员知道的任何方法,所述方法的具体实现方式不对本公开的范围构成限制。例如,本公开可以使用但不限于“命名实体识别(NER)”方法。首先,对用户输入的文本或输入处理单元301提取的文本进行解析,确定该文本使用的语言,因为以不同语言描述的实体需要不同的特征集。如果是中文,则加载中文NER子模块,然后判断是否调用现有工具。如果需要调用现有工具,则使用诸如Stanford NER的现有工具。否则,使用用户自己准备的用于特定领域的中文命名实体语料,从中进行特征选择,然后通过应用CRF(条件随机场)或maxentropy(极大熵)算法来训练识别模型。如果是英文,则加载英文NER子模块,然后判断是否调用现有工具。如果需要调用现有工具,则使用诸如lctclas的现有工具。否则,使用用户自己准备的用于特定领域的英文命名实体语料,从中进行特征选择,然后通过应用CRF或maxentropy算法来训练识别模型。通过使用以上准备的训练模型来实现对实体的识别。
关系识别模块3032被配置为根据存储在实体关系数据库302中的所述实体之间关系识别规则来识别所述多个实体之间的关系(在本公开中可以简称为“实体关系”)。例如,通过对上述句子“服务器链接到位于网关的交换机上”的识别,关系识别模块3032将服务器与交换机之间的关系识别为“链接”关系,将交换机与网关之间的关系识别为“位置”关系。
对于实体关系的识别方法,可以使用本领域技术人员知道的任何方法,例如可以使用基于规则的方法或者监督机器学习的方法,这些方法的具体实现不对本公开的范围构成限制。
基于规则的方法:可以预先定义一组关系类型作为规则,将这些规则应用到对实体关系的识别中,从而确定实体之间的关系。例如:根据本公开的一个实施例,可以预先定义三种类型的实体关系:(1)位于,(2)雇佣,(3)陪伴。如果“产品实体”和“位置实体”同时出现在一个句子中,则可以推断这两个实体之间具有位置关系,如“人们在广场上”;如果两个“人实体”同时出现在一个句子中,则可以推断这两个“人实体”具有陪伴关系,他们也可能具有一定的合作关系,例如是合著者或者是同事;如果“人实体”和“机构实体”同时出现在一个句子中,则可以推断这两个实体之间具有某种雇佣关系,比如说,这个人为这个机构服务。基于规则的方法的规则组可以是变化的,可以向该规则组中添加新的规则,也可以从该规则组中删除规则。
监督机器学习方法:可以是用传统的机器学习方法来识别实体关系。例如,可以预先定义一组关系类型,然后构建训练语料,即准备一些文本作为语料,并用预先定义的关系类型来标记这些语料,然后应用CA(竞争聚集)算法来训练模型,并根据训练的模型来识别实体关系。
通过计算实体关系的权重,可以量化实体之间的关系。一般的规则是:一组实体在一段文本中同时出现的次数越多,它们之间的关系越强,并且一组实体在上下文中出现的次数越多,它们就越有可能成为该段文本中的核心内容。另外,两个实体之间的距离越短,它们之间的关系越近。以上的量化关系可以用下式来表达:
Wi,j∝α*freq(i,j)/β*dist(i,j)
上式中,Wi,j表示两个实体之间的关系的权重,freq(i,j)表示两个实体在一段文本中同时出现的次数,dist(i,j)表示两个实体之间的距离,α和β是预先定义的系数。式中的距离dist(i,j)可以通过使用先前的索引结构来计算,这对于本领域普通技术人员是可以知道的。
实体关系识别单元303基于从输入处理单元301获得的文本所识别出的实体和实体关系可以用XML文件或JSON文件的形式来表达。上述XML文件或JSON文件可以存储在实体关系数据库302中。
图4是示出表达实体和实体关系的XML文件的结构示例的图。
如图4所示,XML文件是记录实体及实体关系的结构化文件,其中包含多个实体块,每个实体块中包含参考列表以及多个实体,这些实体位于参考列表中,每个实体中又包含如下信息:实体ID,是该实体的识别标志;产品标签,表示该实体是哪类产品,包括产品别名等;缩略图,是该实体的概要描述,如图片等;属性,表示该实体的属性和特征等;关系,表示该实体与其它实体之间的关系;相关实体ID,表示与该实体相关的其它实体的识别标志。
模型构建模块3033被配置为根据所述多个实体和所述多个实体之间的关系来构建多个实体关系模型。上述实体关系模型可以用文字来描述,也可以用拓扑图形来表示,例如可以用XML文件或JSON文件来表示。通过对上述XML文件进行分析,可以获得由实体识别模块3031识别的实体以及由关系识别模块3032识别的实体关系,模型构建模块3033将所识别的实体依据所述实体关系而构建为一定的拓扑图形。由于识别出的实体以及实体关系具有多种可能性,所构建的拓扑图形也可以是多个。例如,针对某个实例,模型构建模块3033构建了多个实体关系模型(拓扑图形)ER1、ER2、ER3、…。
根据用户的连续输入,通过实体识别模块3031、关系识别模块3032、和模型构建模块3033构建的多个拓扑图形(实体关系模型)仅能提供接近实际产品环境架构的具有一定正确概率的拓扑结构。这是因为,如前所述,在产品支持过程中,用户对产品环境架构的描述经常会出错,并且通过电话以及网络交流所获得的语音和文本等信息的简单描述也会不准确。
技术文档构建单元304被配置为根据存储在实体关系数据库302中的所述实体识别规则和所述实体之间关系识别规则,对开发者在开发产品时使用的文档(例如文本、图形等)中的实体和实体之间的关系进行识别,以构建技术文档。上述技术文档可以用文字来描述,也可以用拓扑图形来表示,例如可以用XML文件或JSON文件来表示。这些开发者使用的文档可以由产品工程师等在离线时输入到用于提供技术支持的设备300中,用于提供技术支持的设备300中的技术文档构建单元304通过利用例如实体关系数据库302中预先存储的实体识别规则和实体关系识别规则,对开发者使用的文档中的实体和实体关系进行识别,并将所识别的实体和实体关系构建为具有拓扑图形的技术文档。
本公开的技术文档构建单元304可以具有与实体关系识别单元303同样的功能,也可以具有与其中的实体识别模块3031、关系识别模块3032、模型构建模块3033同样的功能。它们的区别可以是:实体关系识别单元303是实时地、动态地处理和识别用户的在线输入,而技术文档识别单元304是在离线状态下处理和识别开发者使用的文档。这种基于离线的完整文本和图形等构建的技术文档是准确的。
技术文档构建单元304所构建的技术文档可以被存储在技术文档数据库或文件库(未示出)中,也可以被存储在实体关系数据库302中。例如,针对某个实例,技术文档构建单元304构建了多个技术文档Ref1、Ref2、Ref3、…。另外,技术文档构建单元304还可以在数据库或文件库中存储多个既有案例。在本公开中,既有案例是指过去为用户成功地解决的技术问题的例子,具有与技术文档同样的作用和功能。
在本公开中,针对技术文档构建单元304构建的技术文档Ref1、Ref2、Ref3、…和在数据库或文件库中存储的既有案例,以及模型构建模块3033构建的多个实体关系模型(拓扑图形)ER1、ER2、ER3、…,可以进行概率加权处理和模糊性诱导测试。
迭代匹配单元305被配置为将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值。例如,迭代匹配单元305将从实体关系识别单元303输出的多个实体关系模型(拓扑图形)ER1、ER2、ER3、…与从技术文档构建单元304输出的多个技术文档(拓扑图形)Ref1、Ref2、Ref3、…分别进行比较,以对每个实体关系模型和每个技术文档按照匹配率设置概率值。
更具体地,本公开的迭代匹配单元305还可以包括比较单元3051、概率值加权模块3052、实体关系结构模糊性测试模块3053。
比较模块3051被配置为将多个实体关系模型与多个技术文档分别进行比较。在本公开中,若一实体关系模型中的全部元素与一技术文档中的全部元素或部分元素相同,则判定该实体关系模型与该技术文档相匹配。根据本公开的一个实施例,这里的“元素”是指实体关系模型以及技术文档中的实体以及实体之间的关系,一个实体可以是一个元素,一个关系也可以是一个元素。
概率值加权模块3052被配置为每多一个技术文档与该实体关系模型匹配,就增加该实体关系模型概率值,每多一个实体关系模型与该技术文档匹配,就增加该技术文档概率值。在本公开中,某个实体关系模型被分配的概率值与其所匹配的技术文档的数量成比例,即某个实体关系模型所匹配的技术文档的数量越多,其被分配的概率值越大,表明其越接近用户的实际的产品环境架构。同样,某个技术文档被分配的概率值与其所匹配的实体关系模型的数量成比例,即某个技术文档所匹配的实体关系模型的数量越多,其被分配的概率值越大,表明其越有可能适用于用户的实际的产品环境架构。
更具体地,这里利用一个实例来进行说明。例如,假定本公开中的多个实体关系模型和多个技术文档的初始概率值分别为0。如果比较模块3051将第一实体关系模型与第一技术文档进行比较,当判断该第一实体关系模型与该第一技术文档相匹配时,概率值加权模块3052给该第一实体关系模型与该第一技术文档分别增加一个分值,例如+1,该一个分值例如可以等价于0.05的概率值。这样,第一实体关系模型的概率值为0.05,该第一技术文档的概率值为0.05。接下来,比较模块3051将第一实体关系模型与第二技术文档进行比较,当判断该第一实体关系模型与该第二技术文档相匹配时,概率值加权模块3052给该第一实体关系模型与该第二技术文档分别增加一个分值,例如+1,该一个分值例如可以等价于0.05的概率值。这样,第一实体关系模型的概率值为0.10,该第二技术文档的概率值为0.05。接下来,比较模块3051将第一实体关系模型与第三技术文档进行比较,当判断该第一实体关系模型与该第三技术文档不匹配时,概率值加权模块3052不给该第一实体关系模型和该第二技术文档增加分值。这样,第一实体关系模型的概率值仍为0.10,而该第三技术文档的概率值为0。如此重复上述过程,直至所有的实体关系模型和技术文档全部经过比较为止。上述概率值加权模块3052给实体关系模型和技术文档分别增加的分值不限于是增加1个分值,该1个分值也不限于等价于0.05的概率值。本领域技术人员可以设置增加任意的分值和与其等价的概率值,这不对本公开的范围构成限制。
在上述概率值加权过程中,与最多的技术文档匹配的实体关系模型具有最高的概率值,与最少技术文档匹配的实体关系模型具有最低的概率值。根据本公开的一个实施例,上述概率值的范围可以是0至1。根据上述示例,假设实体关系模型ER1与16个技术文档匹配,实体关系模型ER2与14个技术文档匹配,而实体关系模型ER3与12个技术文档匹配。在这种情况下,对实体关系模型ER1赋予最高的概率值,例如但不限于是0.80,而实体关系模型ER2被赋予更低的概率值,例如但不限于是0.70,实体关系模型ER3被赋予最低的概率值,例如但不限于是0.60。
对技术文档的概率值的设置与对实体关系模型的概率值的设置相同,在此不再赘述。
在经过比较模块3051和概率值加权模块3052对全部的实体关系模型和技术文档比较和加权后,概率值加权模块3052从全部实体关系模型中选择概率值最高的前K个实体关系模型,从全部技术文档中选择概率值最高的前M个技术文档,并将它们输出到实体关系结构模糊性测试模块3053。
实体关系结构模糊性测试模块3053被配置为将概率值最大的K个实体关系模型中的每个与概率值最大的M个技术文档中的每个进行比较。具体例如,如果K个实体关系模型中的第一实体关系模型与第一技术文档的差别小于一预定值,确定第一实体关系模型与第一技术文档比较接近。上述预定值的大小不对本公开的范围构成限制,本领域的技术人员可以根据实际需求进行适当设置。
这样,该第一实体关系模型和该第一技术文档可以被进行诱导式测试。实体关系结构模糊性测试模块3053可以被配置为根据诱导性测试的结果增加或减小或维持(确定)该第一实体关系模型和该第一技术文档的概率值,并更新第一实体关系模型和第一技术文档的概率值。如果该第一实体关系模型与该第一技术文档的差别大于或等于预定阈值,则仅输出该差别,该第一实体关系模型与该第一技术文档之间的差别不再被进行诱导性测试,而是进一步将该第一实体关系模型与M个技术文档中与第一技术文档类似的第二技术文档进行比较。重复上述操作,直至将K个实体关系模型中的每个与M个技术文档中的每个全部比较完毕为止,并更新K个实体关系模型和M个技术文档的概率值。
上述诱导性测试可以采用以下的方法:基于差别小于上述预定值的该某一实体关系模型和该某一技术文档,向用户提供反馈消息,并接收用户对该反馈消息的响应输入(可以是在线连续接收输入),根据响应输入增加或减小或维持该某一实体关系模型和该某一技术文档的概率值。例如,上述诱导性测试可以是技术支持者向用户提出问题(反馈消息),并获得用户的答复(响应)。例如,假设实体关系模型ER1与技术文档Ref1被比较,其中实体关系模型ER1和技术文档Ref1中分别包含6个实体和8种关系类型,其中的6个实体以及5种关系类型是一样的,有3种关系类型不同。这时,技术支持者可以根据技术文档Ref1向用户描述3种不同关系类型中的某一种关系类型,并向用户询问用户的产品环境中是否存在上述某一种关系类型。如果用户确认存在,则获得的是肯定答复,可以分别增加实体关系模型ER1和技术文档Ref1的概率值;如果用户确认不存在,则获得的是否定答复,可以分别减少实体关系模型ER1和技术文档Ref1的概率值或或维持它们的概率值不变。
实体关系确定模块3054被配置为:根据实体关系结构模糊性测试模块3053的测试结果,确定概率值大于一阈值的技术文档和概率值大于一第二阈值的实体关系模型。如前所述,可以为技术文档的概率值设置一阈值,为实体关系模型的概率值设置第二阈值,用来选取技术文档和/或实体关系模型。上述阈值和第二阈值可以是相同的值,也可以是不同的值。上述阈值和第二阈值的大小不对本公开的范围构成限制,本领域的技术人员可以根据实际需求进行适当设置。
输出处理单元306被配置为:输出若干个概率值较大的实体关系模型和/或概率值较大的技术文档,以提供给技术支持者。例如,输出处理单元306可以被配置为输出概率值大于上述阈值的技术文档。输出处理单元306也可以被配置为还输出概率值大于上述第二阈值的实体关系模型。另外,在输入处理单元301、实体关系识别单元303、迭代匹配单元305的处理过程中,输出处理单元306还可以被配置为将模型构建模块3033所构建的多个实体关系模型ER1、ER2、ER3…,以及相关技术文档(既有案例)Ref1、Ref2、Ref3、…,提供给技术支持者。
输出处理单元306可以以文本、语音、图形等形式向技术提供者呈现上述多个实体关系模型、技术文档以及既有案例。例如,输出处理单元306中可以包括图形视图生成模块3061,其被配置为:基于被输出的实体关系模型和技术文档的XML文件或JSON文件,生成图形化的实体关系模型和技术文档,并通过根据本公开的用于提供技术支持的设备的显示装置(例如显示屏)呈现给技术支持者。
在本公开的输入处理单元301、实体关系识别单元303、迭代匹配单元305等的处理过程中,技术支持者基于输出处理单元306输出的多个实体关系模型、技术文档以及既有案例,判断是否能够准确地重现用户所提出的问题,即是否能够准确地构建用户的产品环境的架构。
如果不能准确地构建用户的产品环境的架构,技术支持者向用户提供反馈信息(文本、语音、图形等形式),即向用户提出更多的问题,并通过用户进一步输入(文本、语音、图形等形式)的内容,从用户获得响应消息。上述从用户获得的响应消息被输入处理单元301接收,并从其中提取相关文本。由此,通过输入处理单元301、实体关系识别单元303、迭代匹配单元305等连续地处理用户输入,实现对实体关系模型和技术文档的在线优化。
如果从输出处理单元306输出的实体关系模型、技术文档和既有案例的图形视图能够准确地构建用户的产品环境的架构,则技术支持者判断是否能够针对所确定的用户描述的问题给出解决方案。如果能够给出解决方案,则技术支持者可以即时向用户给出解决方案,并与用户共同确定所给出的解决方案是否可行。这时,技术支持的处理过程结束。如果不能够给出解决方案,则技术支持者将该问题提交给更高一级的技术支持者。这样,本级的技术支持者的用于提供技术支持的设备的处理过程结束。
图5是根据本公开的一个实施例的由输出处理单元输出的图形视图的图。
在图形视图生成模块3061所生成的图形视图中,可以使用节点来表示命名实体的类型,不同的实体使用不同的图标和名称来进行标记,使用实体之间的连线来表示实体之间的关系,实体之间的连线也可以用标号来区别。图5中示出了一个实体关系的图形视图,它是根据一篇描述“2010上海世界博览会”的中文文章所获得的实体关系模型的图形视图,其中,连线的宽度表示实体关系的强度。当点击连线时,可以显示诸如关系类型的信息以及支持文档片段等信息。对于所输出的图形视图,也可以使用诸如Google地图的替换数据融合方法。
图6是根据本公开的一个实施例的用于提供技术支持的方法的流程图。
如图6所示,根据本公开的一个实施例的用于提供技术支持的方法600可以包括:输入处理步骤、实体关系识别步骤、迭代匹配步骤、输出处理步骤。如图6所示,在输入处理步骤S601,接收用户的输入信息,以获得相关文本。在实体关系识别步骤S602,根据在所述输入处理步骤S601中获得的所述相关文本,识别多个实体和所述多个实体之间的关系,以构建多个实体关系模型。在迭代匹配步骤S603,将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值。在输出处理步骤S604,输出概率值大于一阈值的技术文档。
在输出处理步骤S604中,还可以输出概率值大于第二阈值的实体关系模型,以及在输入处理步骤S601、实体关系识别步骤S602、迭代匹配步骤S603中产生的多个实体关系模型、相关技术文档(以及既有案例)。
在上述输出处理步骤S604中,还可以包括图形视图生成步骤,基于所述实体关系模型和所述技术文档的XML文件或JSON文件,生成图形化的所述实体关系模型和所述技术文档。
上述输入处理步骤S601可以由输入处理单元201、301来实现,实体关系识别步骤S602可以由实体关系识别单元202、303来实现,迭代匹配步骤S603可以由迭代匹配单元203、305来实现,输出处理步骤S604可以由输出处理单元204、306来实现。
在本公开的上述用于提供技术支持的方法600中,还可以包括实体关系规则设置步骤。在该步骤中,设置并存储实体识别规则和实体之间关系识别规则。所设置的实体识别规则和实体之间关系识别规则可以存储在实体关系数据库302中。
在本公开的上述用于提供技术支持的方法600中,还可以包括技术文档构建步骤。在该步骤中,根据所述实体识别规则和所述实体之间关系识别规则,对开发测试者在开发产品时使用的文档和技术支持人员的支持文档以及记录中的实体和实体之间关系进行识别,以构建技术文档。技术文档构建步骤可以由技术文档构建单元304来实现。
在本公开的上述用于提供技术支持的方法600中,还可以包括步骤:判断概率值大于第一阈值的所述实体关系模型和概率值大于第二阈值的所述技术文档是否与所述用户的产品环境架构相符合,如果判断结果是相符合,继续进行第二判断,以判断是否能够向所述用户提供解决方案;如果判断结果是不符合,基于概率值大于第一阈值的所述实体关系模型和概率值大于第二阈值的所述技术文档,继续向所述用户提供反馈消息并在线接收来自用户的响应输入。
在本公开的上述用于提供技术支持的方法600中,还可以包括步骤:如果所述第二判断的结果是能够向所述用户提供解决方案,则即时向所述用户提供解决方案,并与所述用户验证所述解决方案;如果所述第二判断的结果是不能向所述用户提供解决方案,则将概率值大于第一阈值的所述实体关系模型和概率值大于第二阈值的所述技术文档提供给更高一级的技术支持者。同时,还可以将用户所提出的产品的问题提交给更高一级的技术支持者。
图7是根据本公开的一个实施例的实体关系识别步骤的更具体的流程图。
如图7所示,根据本公开的一个实施例的实体关系识别步骤进一步包括:实体识别步骤S701,根据所述实体识别规则识别所述多个实体;关系识别步骤S702,根据所述实体之间关系识别规则识别所述多个实体之间的关系;模型构建步骤S703,根据所述多个实体和所述多个实体之间的关系构建所述多个实体关系模型。
上述实体识别步骤S701可以由实体识别模块3031来实现,关系识别步骤S702可以由关系识别模块3032来实现,模型构建步骤S703可以由模型构成模块3033来实现。
图8是根据本公开的一个实施例的迭代匹配步骤的更具体的流程图。
如图8所示,根据本公开的一个实施例的实体关系识别步骤进一步包括:比较步骤S801,将所述多个实体关系模型与所述多个技术文档分别进行比较,若一实体关系模型中的全部元素与一技术文档中的全部元素或部分元素相同,则判定该实体关系模型与该技术文档匹配;概率值加权步骤S802,每多一个技术文档与该实体关系模型匹配,就增加该实体关系模型概率值,每多一个实体关系模型与该技术文档匹配,就增加该技术文档概率值;实体关系结构模糊性测试步骤S803,选取概率值最大的K(大于1的正整数)个实体关系模型和概率值最大的M(大于1的正整数)个技术文档,将其中每个实体关系模型与每个技术文档进行比较,在某一实体关系模型与某一技术文档的差别小于一预定值的情况下,该某一实体关系模型和该某一技术文档可以被进行诱导式测试,并且在实体关系结构模糊性测试步骤S803中,可以根据诱导性测试的结果增加或减小或维持该某一实体关系模型和该某一技术文档的概率值;实体关系确定步骤S804,根据实体关系结构模糊性测试步骤S803的测试结果,确定概率值大于第一阈值的实体关系模型和概率值大于第二阈值的技术文档。
根据本公开的一个实施例,上述诱导性测试包括步骤:基于该某一实体关系模型和该某一技术文档,向所述用户提供反馈消息,并(在线连续)接收所述用户对所述反馈消息的响应输入,根据所述响应输入增加或减小或维持该某一实体关系模型和该某一技术文档的概率值。
上述比较步骤S801可以由比较模块3051来实现,概率值加权步骤S802可以由概率值加权模块3052来实现,实体关系结构模糊性测试步骤S803可以由实体关系结构模糊性测试模块3053来实现,实体关系确定步骤S804可以由实体关系确定模块3054来实现。
图9是根据本公开一个实施例的用于提供技术支持的方法的另一个流程图。
如图9所示,一方面,在步骤S901,依据现有文档以及技术文档和记录,进行例如基于IT环境的、与拓扑相关的离线实体关系识别,并将所识别的实体关系以例如XML文件或JSON文件的形式构建为技术文档,并将所构建的技术文档保存在实体关系数据库中。以上处理可以由技术文档构建单元304来实现。
另一方面,在步骤S902,接收客户的输入(文本、语音、图片)。在步骤S903,对来自客户的输入进行解析处理,例如进行图像识别(OCR)或语音识别等处理。上述输入可以是用户的连续地在线输入。以上处理可以由输入处理单元201或301来实现。
在步骤S904,依据步骤S903中对客户的输入的处理的结果,进行例如基于IT环境的、与拓扑相关的在线实体关系识别(利用概率值),并以例如XML文件或JSON文件的形式生成相应的实体关系模型。以上处理可以由实体关系识别单元202或303来实现。
在步骤S905,对在步骤S904中生成的实体关系模型和在步骤S901中构建的技术文档进行匹配处理,以获得最匹配的若干个实体关系模型和技术文档,以及为技术支持人员列出的建议文档、案例及其它提示。以上处理可以由迭代匹配单元203或305来实现。
在步骤S906,对在以上步骤中输出的若干个实体关系模型和若干个技术文档进行(连续地)图形化处理,以在显示屏上向技术支持人员显示与客户的产品环境全部或部分匹配的现有拓扑结构以及客户采用的拓扑结构。以上处理可以由输出处理单元204或306以及其中的图形视图生成模块3061来实现。
在步骤S907,由例如第一、二级技术支持人员,根据在步骤S905中输出的为技术支持人员列出的建议文档、案例及其它提示,以及在步骤S906中输出的图形化的视图,判断是否能够解决客户所提出的技术问题。
当在步骤S907中的判断结果是肯定的“是”时,前进到步骤S908。
当在步骤S907中的判断结果是否定的“否”时,技术支持人员将所匹配的文档、案例、或结构反馈给客户,从客户获得连续的输入,以获取更多信息。
在步骤S908,判断现在是否能够为客户提供针对该技术问题的解决方案。如果在步骤S908中的判断的结果是否定的“否”时,则例如第一、二级技术支持人员将客户的问题以及所获得的匹配结果提交给更高级的技术支持人员。如果在步骤S908中的判断的结果是肯定的“是”时,则即时将解决方案提供给客户,并与客户对该解决方案进行验证。然后,全部处理结束。
附图中的流程图和框图显示了根据本公开的多个实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (16)
1.一种用于提供技术支持的设备,包括:
输入处理单元,被配置为接收用户的输入信息,以获得相关文本;
实体关系识别单元,被配置为根据所述输入处理单元获得的所述相关文本,识别多个实体和所述多个实体之间的关系,以构建多个实体关系模型;
迭代匹配单元,被配置为将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值,以及
输出处理单元,被配置为输出概率值大于一阈值的技术文档。
2.如权利要求1所述的设备,所述输出处理单元还被配置为输出概率值大于第二阈值的实体关系模型。
3.如权利要求1所述的设备,还包括:实体关系数据库,被配置为存储实体识别规则和实体之间关系识别规则。
4.如权利要求3所述的设备,所述实体关系识别单元包括:
实体识别模块,被配置为根据所述实体识别规则识别所述多个实体;
关系识别模块,被配置为根据所述实体之间关系识别规则识别所述多个实体之间的关系;
模型构建模块,被配置为根据所述多个实体和所述多个实体之间的关系构建所述多个实体关系模型。
5.如权利要求3所述的设备,还包括:
技术文档构建单元,被配置为根据所述实体识别规则和所述实体之间关系识别规则,对开发测试者在开发产品时使用的文档和支持人员的支持文档以及记录中的实体和实体之间的关系进行识别,以构建技术文档。
6.如权利要求1所述的设备,所述迭代匹配单元还包括:
比较模块,被配置为将所述多个实体关系模型与多个技术文档分别进行比较,若一实体关系模型中的全部元素与一技术文档中的全部元素或部分元素相同,则判定该实体关系模型与该技术文档匹配;
概率值加权模块,被配置为每多一个技术文档与该实体关系模型匹配,就增加该实体关系模型概率值,每多一个实体关系模型与该技术文档匹配,就增加该技术文档概率值。
7.如权利要求1所述的设备,所述迭代匹配单元还包括:
实体关系结构模糊性测试模块,被配置为选取概率值最大的K个实体关系模型和概率值最大的M个技术文档,将其中的每个实体关系模型与每个技术文档进行比较,以便在某一实体关系模型与某一技术文档的差别小于一预定值的情况下,该某一实体关系模型和该某一技术文档能够被进行诱导性测试,其中该实体关系结构模糊性测试模块还被配置为根据诱导性测试的结果确定该某一实体关系模型和该某一技术文档的概率值,其中K和M分别为大于1的正整数。
8.如权利要求1所述的设备,所述输出处理单元还包括:
图形视图生成模块,被配置为基于所述实体关系模型和所述技术文档的XML文件或JSON文件,生成图形化的所述实体关系模型和所述技术文档。
9.一种用于提供技术支持的方法,包括:
输入处理步骤,接收用户的输入信息,以获得相关文本;
实体关系识别步骤,根据在输入处理步骤中获得的所述相关文本,识别多个实体和所述多个实体之间的关系,以构建多个实体关系模型;
迭代匹配步骤,将所述多个实体关系模型与多个技术文档分别进行比较,以对每个实体关系模型和每个技术文档设置概率值,其中与更多技术文档匹配的实体关系模型被设置更大的概率值,与更多实体关系模型匹配的技术文档被设置更大的概率值,以及
输出处理步骤,输出概率值大于一阈值的技术文档。
10.如权利要求9所述的设备,所述输出处理步骤还输出概率值大于第二阈值的实体关系模型。
11.如权利要求9所述的方法,还包括:
实体关系规则设置步骤,设置并在实体关系数据库中存储实体识别规则和实体之间关系识别规则。
12.如权利要求11所述的方法,所述实体关系识别步骤进一步包括:
实体识别步骤,根据所述实体识别规则识别所述多个实体;
关系识别步骤,根据所述实体之间关系识别规则识别所述多个实体之间的关系;
模型构建步骤,根据所述多个实体和所述多个实体之间的关系构建所述多个实体关系模型。
13.如权利要求11所述的方法,还包括:
技术文档构建步骤,根据所述实体识别规则和所述实体之间关系识别规则,对开发测试者在开发产品时使用的文档和支持人员的支持文档以及记录中的实体和实体之间的关系进行识别,以构建技术文档。
14.如权利要求9所述的方法,所述迭代匹配步骤还包括:
比较步骤,将所述多个实体关系模型与所述多个技术文档分别进行比较,若一实体关系模型中的全部元素与一技术文档中的全部元素或部分元素相同,则判定该实体关系模型与该技术文档匹配;
概率值加权步骤,每多一个技术文档与该实体关系模型匹配,就增加该实体关系模型概率值,每多一个实体关系模型与该技术文档匹配,就增加该技术文档概率值。
15.如权利要求9所述的方法,所述迭代匹配步骤还包括:
实体关系结构模糊性测试步骤,选取概率值最大的K个实体关系模型和概率值最大的M个技术文档,将其中每个实体关系模型与每个技术文档进行比较,以便在某一实体关系模型与某一技术文档的差别小于一预定值的情况下,该某一实体关系模型和该某一技术文档能够被进行诱导性测试,其中在该实体关系结构模糊性测试步骤中,还根据诱导性测试的结果确定该某一实体关系模型和该某一技术文档的概率值,其中K和M分别为大于1的正整数。
16.如权利要求9所述的方法,所述输出处理步骤还包括:
图形视图生成步骤,基于所述实体关系模型和所述技术文档的XML文件或JSON文件,生成图形化的所述实体关系模型和所述技术文档。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310629393.8A CN104679492B (zh) | 2013-11-29 | 2013-11-29 | 计算机实现的提供技术支持的设备和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310629393.8A CN104679492B (zh) | 2013-11-29 | 2013-11-29 | 计算机实现的提供技术支持的设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104679492A true CN104679492A (zh) | 2015-06-03 |
CN104679492B CN104679492B (zh) | 2018-08-28 |
Family
ID=53314611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310629393.8A Expired - Fee Related CN104679492B (zh) | 2013-11-29 | 2013-11-29 | 计算机实现的提供技术支持的设备和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104679492B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145523A (zh) * | 2017-04-12 | 2017-09-08 | 浙江大学 | 基于迭代匹配的大型异构知识库对齐方法 |
CN109906449A (zh) * | 2016-10-27 | 2019-06-18 | 华为技术有限公司 | 一种查找方法及装置 |
CN111858550A (zh) * | 2020-07-07 | 2020-10-30 | 北京工业大学 | 一种固件系统特征数据库的构建及更新方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101377777A (zh) * | 2007-09-03 | 2009-03-04 | 北京百问百答网络技术有限公司 | 一种自动问答方法和系统 |
CN101751420A (zh) * | 2008-12-10 | 2010-06-23 | 华中科技大学 | 语义脉络文档查询方法 |
CN101770473A (zh) * | 2008-12-30 | 2010-07-07 | 华中科技大学 | 层次化语义脉络文档查询方法 |
CN101794304A (zh) * | 2010-02-10 | 2010-08-04 | 深圳先进技术研究院 | 行业信息服务系统及方法 |
CN101877003A (zh) * | 2009-01-20 | 2010-11-03 | 国际商业机器公司 | 数据分析系统和方法 |
CN102122286A (zh) * | 2010-04-01 | 2011-07-13 | 武汉福来尔科技有限公司 | 在手持学习终端上实现的聚合式搜索的方法 |
US20120030190A1 (en) * | 2010-08-02 | 2012-02-02 | Lee Hong-Lin | Method of recording and searching for a web page and method of recording a browsed web page |
-
2013
- 2013-11-29 CN CN201310629393.8A patent/CN104679492B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101377777A (zh) * | 2007-09-03 | 2009-03-04 | 北京百问百答网络技术有限公司 | 一种自动问答方法和系统 |
CN101751420A (zh) * | 2008-12-10 | 2010-06-23 | 华中科技大学 | 语义脉络文档查询方法 |
CN101770473A (zh) * | 2008-12-30 | 2010-07-07 | 华中科技大学 | 层次化语义脉络文档查询方法 |
CN101877003A (zh) * | 2009-01-20 | 2010-11-03 | 国际商业机器公司 | 数据分析系统和方法 |
CN101794304A (zh) * | 2010-02-10 | 2010-08-04 | 深圳先进技术研究院 | 行业信息服务系统及方法 |
CN102122286A (zh) * | 2010-04-01 | 2011-07-13 | 武汉福来尔科技有限公司 | 在手持学习终端上实现的聚合式搜索的方法 |
US20120030190A1 (en) * | 2010-08-02 | 2012-02-02 | Lee Hong-Lin | Method of recording and searching for a web page and method of recording a browsed web page |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109906449A (zh) * | 2016-10-27 | 2019-06-18 | 华为技术有限公司 | 一种查找方法及装置 |
CN109906449B (zh) * | 2016-10-27 | 2021-07-20 | 华为技术有限公司 | 一种查找方法及装置 |
US11210292B2 (en) | 2016-10-27 | 2021-12-28 | Huawei Technologies Co., Ltd. | Search method and apparatus |
CN107145523A (zh) * | 2017-04-12 | 2017-09-08 | 浙江大学 | 基于迭代匹配的大型异构知识库对齐方法 |
CN107145523B (zh) * | 2017-04-12 | 2019-10-18 | 浙江大学 | 基于迭代匹配的大型异构知识库对齐方法 |
CN111858550A (zh) * | 2020-07-07 | 2020-10-30 | 北京工业大学 | 一种固件系统特征数据库的构建及更新方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104679492B (zh) | 2018-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997371B2 (en) | Automatic response server device, terminal device, response system, response method, and program | |
CN107220386A (zh) | 信息推送方法和装置 | |
CN109033068A (zh) | 基于注意力机制的用于阅读理解的方法、装置和电子设备 | |
CN109478204A (zh) | 非结构化文本的机器理解 | |
CN108052577A (zh) | 一种通用文本内容挖掘方法、装置、服务器及存储介质 | |
CN104462056B (zh) | 用于呈现基于知识的信息的方法和信息操纵系统 | |
CN110781663B (zh) | 文本分析模型的训练方法及装置、文本分析方法及装置 | |
CN111046158B (zh) | 问答匹配方法及模型训练方法、装置、设备、存储介质 | |
CN112988963B (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
US20220100772A1 (en) | Context-sensitive linking of entities to private databases | |
CN113707299A (zh) | 基于问诊会话的辅助诊断方法、装置及计算机设备 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
US20230153335A1 (en) | Searchable data structure for electronic documents | |
CN114648032B (zh) | 语义理解模型的训练方法、装置和计算机设备 | |
CN113535977A (zh) | 一种知识图谱融合方法和装置及设备 | |
CN113032520A (zh) | 信息分析方法及装置、电子设备和计算机可读存储介质 | |
CN104679492A (zh) | 计算机实现的提供技术支持的设备和方法 | |
CN113705159A (zh) | 商户名称的标注方法、装置、设备及存储介质 | |
Cao et al. | Dual‐Channel Reasoning Model for Complex Question Answering | |
CN114547312A (zh) | 基于常识知识图谱的情感分析方法、装置以及设备 | |
CN114637850A (zh) | 异常行为识别及模型训练方法、装置、设备及存储介质 | |
CN115809313A (zh) | 一种文本相似度确定方法及设备 | |
CN117151247B (zh) | 机器学习任务建模的方法、装置、计算机设备和存储介质 | |
CN114330339B (zh) | 文本处理方法、计算机可读存储介质及计算机设备 | |
Wan et al. | TnT-LLM: Text Mining at Scale with Large Language Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180828 Termination date: 20201129 |
|
CF01 | Termination of patent right due to non-payment of annual fee |