CN101465749A - 基于Web Service组合的问答服务构建方法 - Google Patents

基于Web Service组合的问答服务构建方法 Download PDF

Info

Publication number
CN101465749A
CN101465749A CNA2008102374687A CN200810237468A CN101465749A CN 101465749 A CN101465749 A CN 101465749A CN A2008102374687 A CNA2008102374687 A CN A2008102374687A CN 200810237468 A CN200810237468 A CN 200810237468A CN 101465749 A CN101465749 A CN 101465749A
Authority
CN
China
Prior art keywords
web service
service
question
relation
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008102374687A
Other languages
English (en)
Other versions
CN101465749B (zh
Inventor
曾承
欧伟杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN2008102374687A priority Critical patent/CN101465749B/zh
Publication of CN101465749A publication Critical patent/CN101465749A/zh
Application granted granted Critical
Publication of CN101465749B publication Critical patent/CN101465749B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于Web服务组合的问答服务构建方法,用于从Web服务资源中提供当前用户提问的答案,其特征在于包括以下步骤:利用Web服务资源所含的所有Web服务在一个或以上层面的关联情况,确定这些Web服务两两之间的有向关系;构建Web服务有向关系网络;从Web服务资源中选择能够用于回答当前用户提问的Web服务,构建服务层次化网状图;根据服务层次化网状图,从Web服务集合中寻找能够回答当前用户提问的若干服务流程组合策略作为备选问答方案,供用户从中选择最佳问答方案,用于回答当前用户的提问。本发明能够通过自动Web服务组合的技术手段,生成能够回答一类问题的问答服务软件,从而能够满足复杂的跨领域跨系统问题的回答。

Description

基于Web Service组合的问答服务构建方法
技术领域
本发明属于软件工程技术领域,特别涉及一种基于Web Service组合的问答服务构建方法。
背景技术
自1966年Jaseph实现了第一个问答系统Eliza以来,人们就一直在探索能够让机器帮助回答人所需信息的技术。目前的问答系统根据采用的技术方法主要分为以下三类:
(1)基于关键字的问答系统
这类系统以知道、爱问、奇虎等为代表,利用IR领域中成熟的关键字及其相关技术,抽取网页中与用户问题相近的内容间接回答;或者靠群体力量构建问答知识库,通过FAQ技术寻找最匹配的问题答案。很多学者围绕此类系统展开研究并取得一定进展,如:通过构建词-句语义空间,提出基于潜在语义分析的问答匹配度方法;抽取问题特征集、答句特征集和组合特征集作为分类特征,结合最大熵模型和支持向量机实现答案自动分类;将词语概念描述分解为属性和语义角色两部分,通过加权计算词语相似度;基于关键字重叠率、密度、信息检索反馈、回答频率等6种特征,研究跨语言的问答排序问题。
(2)基于自然语言的问答系统
从1991年Loebner奖设立以来,许多基于自然语言的聊天式问答系统相继问世,如支持知识库扩展的Alice,提供在线语音问答的Talk-Bot,提供跨语言问答的Jabberwock,能够自我学习的Niall,以及08年的最佳得主艾尔博特等。这些系统以模式匹配相关方法为核心,通过用户问题理解、用户问题学习、答案合理性分析等技术,实现问题的巧妙回答。此外,有专家提出通过人机对话,挖掘用户情绪,自适应地调整网页中的音视频内容作为回答,延伸了问答系统的应用外延。
(3)基于语义网的问答系统
04年McGuinness指出了语义网对于问答系统发展的推动作用,尤其是本体的引入,提高了问题的理解、答案的分析、知识库的构建等环节语义描述的精确性,以及问答系统的智能性。陆汝钤院士主持开发的“Pangu”将自然语言理解与语义网相结合,是问答领域的典型代表;中科院开发的“知网”,提供了一个庞大的知识库,为大型智能问答系统的实现奠定了基础;还有专家提出通过构建用户profile,并结合本体,实现了移动平台上的个性化问答系统。值得一提的是,已出现一种发展趋势,将语义Web服务应用于问答系统,针对每个用户问题寻找一个合适的Web服务用于回答。
以上三类系统中,第一类的特点是系统并不理解问题及答案的真正含义,而仅提供一个异步式提问解惑的途径,并且,它们完全依赖于预先构建的问题-答案关联库;第二类系统在与用户交互过程中,侧重于谈话技巧和程序技巧,而非常识,从而回避领域知识库问题,但其返回的内容往往不是用户所需的答案。第三类系统通过语义网相关技术提高问答系统的语义性,并有效利用Web服务回答问题,省去了知识库维护的任务,但仅局限于某类应用,并没有从软件构造方法学的角度给出生产这类软件服务的通用技术手段。
发明内容
本发明目的在于解决现有技术不足,提供一种能够为每一类型问答构建共用软件服务的自动化方案。
为实现上述目的,本发明提供的技术方案包括以下步骤:
步骤1,利用Web服务资源所含的所有Web服务在一个或以上层面的关联情况,确定这些Web服务两两之间的有向关系;
步骤2,以Web服务资源所含的每个Web服务作为节点,Web服务两两之间的有向关系作为边,构建Web服务有向关系网络;
步骤3,从Web服务资源中选择能够用于回答当前用户提问的Web服务,构成Web服务集合,参照Web服务有向关系网络为该Web服务集合构建服务层次化网状图;
步骤4,根据服务层次化网状图,从Web服务集合中寻找能够回答当前用户提问的若干服务流程组合策略作为备选问答方案,供用户从中选择最佳问答方案,用于回答当前用户的提问。
而且,步骤1中考察不同Web服务之间在三个层面的关联情况,所述三个层面如下,
语义概念层RS,该层基于Web服务的名称及介绍中的核心关键词,通过领域本体扩展;
接口匹配层RI,该层综合考虑Web服务的操作、输入输出的名称及数据类型;
历史关系层RH,该层分析Web服务的历史调用日志,对曾经相互调用的Web服务之间建立历史关系。
而且,步骤1的具体实现方式为,根据Web服务资源中任意两个Web服务Si、Sj之间的关系大小和主导调用方向确定这两个Web服务Si、Sj之间的有向关系;Web服务Si、Sj在接口匹配层RI和历史关系层RH调用方向的叠加结果,决定Web服务Si、Sj之间的主导调用方向;Web服务资源中任意两个Web服务的关系大小求取方式如下,
将Web服务资源中任意两个Web服务Si、Sj的关系大小表示为关系值Φij,其计算公式为 Φ ij = ω 1 λ ij + ω 2 λ ij → ( 1 ) , i ≠ j ,
式(1)中ω1和ω2是关系权重;
式(1)中λij代表Web服务Si、Sj在语义概念层RS的无向关系值,关联对象为Web服务整体;λij通过对Web服务中的不同核心关键词计算平均概念关系求得;
式(1)中代表Web服务Si、Sj在接口匹配层RI和历史关系层RH的有向关系值,所谓有向是指对Web服务调用的先后次序有要求,关联对象为Web服务的接口操作;通过对Web服务中的不同Web服务接口操作对计算累计值求得。
而且,无向关系值λij计算公式为 λ ij = τ 1 · Σ a Σ b ζ ( a , b ) C ( a , b ) · Θ ( C a , C b ) - - - ( 2 ) ,
式(2)中τ1为常量,用以保证λij大小范围为(0,1];
式(2)中C(a,b)为关键词a和b的概念关联总数;
式(2)中关键词a和b的数量差异 Θ ( C a , C b ) = C a 2 + C b 2 · Sin ( | Arctg C b C a - 45 | )
(3),Ca为Si的关键词集合,Cb则为Sj的关键词集合;
式(2)中关键词a和b的语义距离 ζ ( a , b ) = θ ( a , b ) f 1 f 2 ( L a , L b ) (4),θ(a,b)表示关键词a和b映射到领域本体中的两个概念可能存在的关联规则的量化函数,而La和Lb表示关键词a和b映射到领域本体中的两个概念在领域本体中的抽象层次;假设La对应更为抽象的抽象层次,则f1(La)为关键词a和b关联比较时的抽象程度函数,若关键词a和b映射到领域本体中的两个概念越抽象,则关键词a和b关联程度越低;f2(La,Lb)为抽象程度差距函数,其实际意义是若关键词a和b映射到领域本体中两个概念抽象程度越接近,关键词a和b关联程度越高;
有向关系值
Figure A200810237468D00111
的计算公式为 λ ij → = τ 2 · Σ ( u , v ) K σ ( x ) - - - ( 5 ) ,
式(5)中τ2为常量,用以保证
Figure A200810237468D00113
大小范围为(0,1];
式(5)中K为Web服务Si、Sj在接口匹配层RI可以关联的不同Web服务接口操作对的总量之和;
式(5)中 &sigma; ( x ) = &Integral; p x ( u , v ) 1 / 3 dx ( p &GreaterEqual; 1 ) 1 ( p < 1 ) - - - ( 6 ) , 调用次数p≥1表示当前接口操作对(u,v)在历史关系层RH存在调用日志,采用积分方式实施累加;调用次数p<1表示当前接口操作对(u,v)在历史关系层RH不存在调用日志,仅通过1反映接口匹配层RI当前操作对(u,v)关系的存在。
而且,步骤3的具体实现方式包括以下步骤,
步骤3.1,对当前用户提问和Web服务资源所含Web服务的服务描述分别进行概念实体抽取,并以本体作为概念扩展的基础,映射出Web服务资源中与当前用户提问相关的所有Web服务S1,S2,...SN;利用Web服务有向关系网络,扩展与这N个Web服务S1,S2,...SN在历史关系层RH关系最为显著的M个外围服务S1,S2,...sM;构成当前问题相关Web服务集合{S1,S2,...SN,s1,s2,...sM};
步骤3.2,以Web服务S1,S2,...SN,s1,s2,...sM作为节点,抽取此N+M个Web服务两两之间的有向关系,组成一个服务关系子网;
步骤3.3,针对用户提问和Web服务S1,S2,...SN描述中各自的概念实体,依次计算概念集相似度并排序,选择其中与用户问题最相关的若干Web服务,作为起始服务,设定所有起始服务构成起始服务列集ΓB
步骤3.4,以起始服务为服务层次化网状图的第一层,按照服务关系子网中的节点及有向关系,并将服务关系子网转换成服务层次化网状图。
而且,在步骤4寻找服务流程组合策略时,设置阀值δ,所述阀值δ用于确定每次流程下推时所能选择的路径;具体实现方式包括以下步骤,
步骤4.1,从服务层次化网状图的最高层选择任一起始节点作为下推起点,
步骤4.2,执行下推,即根据阀值δ从下推起点下推一层时所能选择的路径,定位每条路径所连接的新节点;
步骤4.3,执行回溯,即以步骤4.2中确定的新节点之一为回溯起点,向上回溯与回溯起点连接的上层节点,逐层回溯直至最高层;
步骤4.4,检查此时整个流程中,该回溯起点、回溯起点连接的下层节点和回溯所涉及的所有节点是否完全包含起始服务列集ΓB,若是则终止该条流程,直接作为一个服务流程组合策略;若否则选取一个步骤4.2中确定的其它新节点,返回执行步骤4.3进行回溯;
若对步骤4.2中确定的所有新节点处理完毕,仍没有一个流程完全包含起始服务列集ΓB;将步骤4.2中确定的每个新节点作为下推起点,返回步骤4.2循环执行下推及回溯。
而且,从寻找到的备选问答方案中选出最优问答方案,供用户参考。
而且,根据其他用户历史上对同类问题已作的选择,对备选问答方案排序,供用户参考。
本发明为每个类型的问答设置相关的Web服务集合,从层面出发综合计算不同Web服务之间的关联大小,并将两个Web服务之间占主导地位的调用方向视为它们的最佳调用方向,从而确定Web服务之间的有向关系;然后将每个Web服务作为节点,不同Web服务之间的有向关系作为边,形成一个Web服务关系网络。该网络实际反映了任意两个或多个Web服务之间调用或被调用的概率。当确定了与当前问题相关的Web服务集合后,将服务关系网络的相应部分转换成层次化网状图。最后在服务自动组合阶段,基于该层次化网状图,及其节点边的概率值,逐层逐步地推导出能够回答当前问题的服务流程组合策略,每套服务流程组合策略即对应了能够回答一类问题的问答服务软件。本发明还提出通过一系列规则,对这些服务流程组合策略进行排序,即这些方案均可回答当前问题,但回答的质量较高的方案将排序较前。本发明的有益效果:通过自动Web服务组合的技术手段,生成能够回答一类问题的问答服务软件,从而能够满足复杂的跨领域跨系统问题的回答,并且克服了传统问答系统必须维护一个庞大的本地知识库的问题,具有广泛的应用前景。
附图说明
图1是本发明实施例的服务关系子网示意图;
图2是本发明实施例的服务层次化网状图。
具体实施方式
本发明通过动态组合Web服务,生成能够回答与当前提问相关的一类问题的问答服务,即为每一类问题生成一个统一的软件(即服务),以后类似问题均可以调用这个软件进行回答,而不是像目前的方法,每个问题单独去找答案。以下结合附图和实施例详细说明本发明技术方案,包括有4个步骤:
步骤1,利用Web服务资源所含的所有Web服务在一个或以上层面的关联情况,确定这些Web服务两两之间的有向关系。
不同于目前所有的问答服务构建技术,本发明创造性的提出直接利用Web服务资源,只需考察Web服务资源所含的所有Web服务在一个或以上层面的关联情况,作为提供问答服务的基础。可以从互联网上搜索Web服务,将所有Web服务的集合作为Web服务资源;或者事先收集Web服务存放到专用数据库,以便提供Web服务资源。
本发明提出了进一步技术方案:综合考察不同Web服务之间在三个层面的关联情况:
语义概念层Rs,该层基于Web服务的名称及介绍中的核心关键词,通过领域本体扩展;
接口匹配层RI,该层综合考虑Web服务的操作、输入输出的名称及数据类型;
历史关系层RH,该层分析Web服务的历史调用日志,对曾经相互调用的Web服务之间建立历史关系。
综合考察不同Web服务之间在这三个层面的关联情况,可以更准确的得到这些Web服务两两之间的有向关系。具体实施时,考察其中一个等数目层面的关联情况,或者按照其它层面划分考察关联情况,以得到Web服务两两之间的有向关系也是可行的方案。
为了方便以数据结构形式存储所得有向关系,利于计算机进行自动处理,本发明提出根据Web服务资源中任意两个Web服务Si、Sj之间的关系大小和主导调用方向确定这两个Web服务Si、Sj之间的有向关系。并且将Web服务资源中任意两个Web服务Si、Sj的关系大小表示为关系值Φij,采用量化的方式进行处理,能够清晰地反映任意两个或多个Web服务之间调用或被调用的概率。具体方式为:将Web服务资源中任意两个Web服务Si、Sj的关系大小表示为关系值Φij,其计算公式为 &Phi; ij = &omega; 1 &lambda; ij + &omega; 2 &lambda; ij &RightArrow; ( 1 ) , i &NotEqual; j ,
式(1)中ω1和ω2是关系权重;
式(1)中λij代表Web服务Si、Sj在语义概念层RS的无向关系值,关联对象为Web服务整体(即考察Web服务Si和Web服务Sj整体上的关联),λij通过对Web服务中的不同核心关键词计算平均概念关系求得;
式(1)中
Figure A200810237468D00152
代表Web服务Si、Sj在接口匹配层RI和历史关系层RH的有向关系值,所谓有向是指对Web服务调用的先后次序有要求,关联对象为Web服务的接口操作;
Figure A200810237468D00153
通过对Web服务中的不同Web服务接口操作对计算累计值求得。
具体实施设计求取公式时,无向关系值λij和有向关系值
Figure A200810237468D00154
的求取应该考虑能够准确反映Web服务在相应层面的关系。本发明提供最佳实施例如下:
无向关系值λij计算公式为 &lambda; ij = &tau; 1 &CenterDot; &Sigma; a &Sigma; b &zeta; ( a , b ) C ( a , b ) &CenterDot; &Theta; ( C a , C b ) - - - ( 2 ) ,
式(2)中τ1为常量,用以保证λij大小范围为(0,1];
式(2)中C(a,b)为关键词a和b的概念关联总数;a、b分别对应Si和Sj的某个关键词,即两个Web服务Si和Sj都有自己的关键字集合Ca、Cb,每次从集合Ca、Cb中各抽取1个进行比较;
式(2)中关键词a和b的数量差异 &Theta; ( C a , C b ) = C a 2 + C b 2 &CenterDot; Sin ( | Arctg C b C a - 45 | ) (3);
式(2)中关键词a和b的语义距离 &zeta; ( a , b ) = &theta; ( a , b ) f 1 f 2 ( L a , L b ) - - - ( 4 ) , θ(a,b)表示关键词a和b映射到领域本体中的两个概念可能存在的关联规则的量化函数,而La和Lb表示关键词a和b映射到领域本体中的两个概念在领域本体中的抽象层次。
假设La对应更为抽象的抽象层次,则f1(La)为关键词a和b关联比较时的抽象程度函数,若关键词a和b映射到领域本体中的两个概念越抽象,则关键词a和b关联程度越低。也就是说,所有概念可表示成一个概念树,假设a代表水果,b代表苹果,则概念a更为抽象,即覆盖面更广,那么,我们将概念a所在的概念层次表示为La,并通过函数f1(La)将其计算为一个数值,量化的表示其抽象程度,以方便和其他概念的抽象程度进行对比。
f2(La,Lb)为抽象程度差距函数,其实际意义是若关键词a和b映射到领域本体中两个概念抽象程度越接近,关键词a和b关联程度越高。
有向关系值
Figure A200810237468D00161
的计算公式为 &lambda; ij &RightArrow; = &tau; 2 &CenterDot; &Sigma; ( u , v ) K &sigma; ( x ) - - - ( 5 ) ,因为通过这种函数(公式5、6)计算累计值的结果可能偏大,为了便于衡量关系大小,本发明实施例提出将累积值结果转换到0~1之间的数。
式(5)中τ2为常量,用以保证大小范围为(0,1];
式(5)中K为接口匹配层RI可以关联的不同Web服务接口操作对的总量;
式(5)中 &sigma; ( x ) = &Integral; p x ( u , v ) 1 / 3 dx ( p &GreaterEqual; 1 ) 1 ( p < 1 ) - - - ( 6 ) , 调用次数p≥1表示当前接口操作对(u,v)在历史关系层RH存在调用日志,采用积分方式实施累加;调用次数p<1表示当前接口操作对(u,v)在历史关系层RH不存在调用日志,仅通过1反映接口匹配层RI当前操作对(u,v)关系的存在。Web服务Si、Sj在接口匹配层RI和历史关系层RH调用方向的叠加结果,则决定Web服务Si、Sj之间的主导调用方向。
步骤2,以Web服务资源所含的每个Web服务作为节点,Web服务两两之间的有向关系作为边,构建Web服务有向关系网络。
步骤3,从Web服务资源中选择能够用于回答当前用户提问的Web服务,构成Web服务集合,参照Web服务有向关系网络为该Web服务集合构建服务层次化网状图。
具体实施时,为了降低数据调用工作量,可以根据Web服务集合,首先从Web服务有向关系网络提取出服务关系子网,再构建服务层次化网状图。实施例中,步骤3的具体实现方式包括以下步骤,
步骤3.1,对当前用户提问和Web服务资源所含Web服务的服务描述分别进行概念实体抽取,并以本体作为概念扩展的基础,映射出Web服务资源中与当前用户提问相关的所有Web服务S1,S2,...SN;利用Web服务有向关系网络,扩展与这N个Web服务S1,S2,...SN在历史关系层RH关系最为显著的M个外围服务S1,S2,...sM;构成当前问题相关Web服务集合{S1,S2,...SN,s1,s2,...sM};
步骤3.2,以Web服务S1,S2,...SN、s1,s2,...sM作为节点,抽取此N+M个Web服务两两之间的有向关系,组成一个服务关系子网;
步骤3.3,针对用户提问和Web服务S1,S2,...SN描述中各自的概念实体,依次计算概念集相似度并排序,选择其中与用户问题最相关的若干Web服务,作为起始服务,设定所有起始服务构成起始服务列集ΓB
步骤3.4,以起始服务为服务层次化网状图的第一层,按照服务关系子网中的节点及有向关系,并将服务关系子网转换成服务层次化网状图。
参见附图1,本发明实施例的一个服务关系子网中的节点包括前N个服务A、B、C、D、E、G、K、H,和扩展的M个服务F、J、I、P,从中选择服务A、B为起始服务。附图2中过滤了服务P,将剩下的服务整理成了四层,其中有向关系方向参见图中箭头,关系值附在箭头上,都在0~1之间。转换后得到的服务层次化网状图参见附图2,第一层包括的起始服务为A、B,逐层存在调用关系。
步骤3.1可以参考一个可扩展的概念关系知识库实现,将对当前用户提问和Web服务资源所含Web服务的服务描述分别对照概念关系知识库进行实体抽取后,可以方便地实现映射,并以本体作为概念扩展的基础。计算概念集相似度可以采用现有技术,例如TD-IDF方法;选择其中与用户问题最相关的若干Web服务时,可以通过预先设定阀值自动选择,或者呈现排序给用户自行指定。步骤4,根据服务层次化网状图,从Web服务集合中寻找能够回答当前用户提问的若干服务流程组合策略作为备选问答方案,供用户从中选择最佳问答方案,用于回答当前用户的提问。
为了能够高效准确的从Web服务集合中寻找能够回答当前用户提问的服务流程组合策略,本发明提出可以通过循环下推、回溯方式实现。往往能够从Web服务集合中寻找到一个以上能够回答当前用户提问的不同服务流程组合策略,共同作为备选问答方案,用户可以从中择一作为答案。具体实现方式为,在步骤4寻找服务流程组合策略时,设置阀值δ,所述阀值δ用于确定每次流程下推时所能选择的路径;寻找按以下步骤实现,步骤4.1,从服务层次化网状图的最高层选择任一起始节点作为下推起点。
为了能够全面地找到所有能够当前用户提问的不同服务流程组合策略,可以采用轮序方式对每个起始节点都执行这些步骤。
步骤4.2,执行下推,即根据阀值δ从下推起点下推一层时所能选择的路径,定位每条路径所连接的新节点;
假设下层节点有5个,则有5条路径,但路径上的关联值仅有3个大于δ,则下推一层时所能选择的路径仅有3条,新节点为3个。具体实施时,阀值δ可以根据对答案的精确性要求设置。
步骤4.3,执行回溯,即以步骤4.2中确定的新节点之一为回溯起点,向上回溯与回溯起点连接的上层节点,逐层回溯直至最高层;
步骤4.4,检查此时整个流程中是否完全包含起始服务列集ΓB,若是则终止该条流程,直接作为一个服务流程组合策略;若否则选取一个步骤4.2中确定的其它新节点,返回执行步骤4.3进行回溯。
假设步骤4.2中确立了3个新节点,先选择一个为回溯起点进行回溯,一直到最高层的根节点处,判断当前整个流程(包括有该回溯起点、回溯起点连接的下层节点和回溯所涉及的所有节点)中是否完全包含ΓB,。包含了就中止该流程,否则再选择第2个新节点回溯起点进行回溯,以此类推。为了避免重复,回溯时注意避开该新节点上一层的下推起点。
若对步骤4.2中确定的所有新节点处理完毕,仍没有一个流程完全包含起始服务列集ΓB;将步骤4.2中确定的每个新节点做为下推起点,返回步骤4.2循环执行下推及回溯。不断下推寻找新节点,回溯进行检查,直到找到一个流程中完全包含起始服务列集ΓB,或者下推至服务层次化网状图的最低层仍没有找到。也就是说,规定所找到的服务流程组合策略必须完全包含起始服务列集ΓB,含有最符合当前用户提问需求的Web服务。具体实施时,还可以采用其它方式实现寻找服务流程组合策略,只需把握下推回溯原则即可。例如首先判断第一层的所有起始服务到第二层的所有关联值是否大于阀值δ,从中筛选出有关联值大于阀值δ的起始服务,再继续逐层进行下推回溯处理。
向用户提供备选问答方案时,还可以从寻找到的备选问答方案中选出最优问答方案供用户选择时参考。具体实施时可以按照以下规则对步骤4中获得的若干组合方案进行过滤,从层数相同的方案中选出最优的:
①层数相同方案中关系值Φij之和最大;
②层数相同方案中服务质量Qos之和最高;
③层数相同方案中节点服务价格之和最低。
以上规则可由用户选择部分考虑或全部考虑,并可动态调整每条规则的权重。
每次用户选择答案后,都可以根据用户选择对备选问答方案重新排序,主要供下次其它用户选择时参考。具体实施时,可以采取用户决策与层次判断相结合的答案排序方式,即先根据历史用户答案选择结果的统计进行排序,当用户选择数量相同时,则根据层次越多服务信息涉及面越广,提供的答案准确性越高原则,进行排序。用户选择方案进行问题回答,并可参与评价问题的好坏,从而间接判断了方案的优劣,为后期该问题的排序贡献一定知识。

Claims (8)

1.基于Web服务组合的问答服务构建方法,用于从Web服务资源中提供当前用户提问的答案,其特征在于包括以下步骤:
步骤1,利用Web服务资源所含的所有Web服务在一个或以上层面的关联情况,确定这些Web服务两两之间的有向关系;
步骤2,以Web服务资源所含的每个Web服务作为节点,Web服务两两之间的有向关系作为边,构建Web服务有向关系网络;
步骤3,从Web服务资源中选择能够用于回答当前用户提问的Web服务,构成Web服务集合,参照Web服务有向关系网络为该Web服务集合构建服务层次化网状图;
步骤4,根据服务层次化网状图,从Web服务集合中寻找能够回答当前用户提问的若干服务流程组合策略作为备选问答方案,供用户从中选择最佳问答方案,用于回答当前用户的提问。
2.如权利要求1所述的问答服务构建方法,其特征在于:步骤1中综合考察不同Web服务之间在三个层面的关联情况,所述三个层面如下,
语义概念层RS,该层基于Web服务的名称及介绍中的核心关键词,通过领域本体扩展;
接口匹配层RI,该层综合考虑Web服务的操作、输入输出的名称及数据类型;
历史关系层RH,该层分析Web服务的历史调用日志,对曾经相互调用的Web服务之间建立历史关系。
3.如权利要求2所述的问答服务构建方法,其特征在于:步骤1的具体实现方式为,根据Web服务资源中任意两个Web服务Si、Sj之间的关系大小和主导调用方向确定这两个Web服务Si、Sj之间的有向关系;Web服务Si、Sj在接口匹配层RI和历史关系层RH调用方向的叠加结果,决定Web服务Si、Sj之间的主导调用方向;Web服务资源中任意两个Web服务的关系大小求取方式如下,
将Web服务资源中任意两个Web服务Si、Sj的关系大小表示为关系值Φij
其计算公式为 &Phi; ij = &omega; 1 &lambda; ij + &omega; 2 &lambda; ij &RightArrow; ( 1 ) , i &NotEqual; j ,
式(1)中ω1和ω2是关系权重;
式(1)中λij代表Web服务Si、Sj在语义概念层RS的无向关系值,关联对象为Web服务整体;λij通过对Web服务中的不同核心关键词计算平均概念关系求得;
式(1)中
Figure A200810237468C00032
代表Web服务Si、Sj在接口匹配层RI和历史关系层RH的有向关系值,所谓有向是指对Web服务调用的先后次序有要求,关联对象为Web服务的接口操作;通过对Web服务中的不同Web服务接口操作对计算累计值求得。
4.如权利要求3所述的问答服务构建方法,其特征在于:无向关系值λij计算公式为 &lambda; ij = &tau; 1 &CenterDot; &Sigma; a &Sigma; b &zeta; ( a , b ) C ( a , b ) &CenterDot; &Theta; ( C a , C b ) - - - ( 2 ) ,
式(2)中τ1为常量,用以保证λij大小范围为(0,1];
式(2)中C(a,b)为关键词a和b的概念关联总数;
式(2)中关键词a和b的数量差异 &Theta; ( C a , C b ) = C a 2 + C b 2 &CenterDot; Sin ( | Arctg C b C a - 45 | ) (3),Ca为Si的关键词集合,Cb则为Sj的关键词集合;
式(2)中关键词a和b的语义距离 &zeta; ( a , b ) = &theta; ( a , b ) f 1 ( L a ) f 2 ( L a , L b ) - - - ( 4 ) , θ(a,b)表示关键词a和b映射到领域本体中的两个概念可能存在的关联规则的量化函数,而La和Lb表示关键词a和b映射到领域本体中的两个概念在领域本体中的抽象层次;假设La对应更为抽象的抽象层次,则f1(La)为关键词a和b关联比较时的抽象程度函数,若关键词a和b映射到领域本体中的两个概念越抽象,则关键词a和b关联程度越低;f2(La,Lb)为抽象程度差距函数,其实际意义是若关键词a和b映射到领域本体中两个概念抽象程度越接近,关键词a和b关联程度越高;
有向关系值
Figure A200810237468C00041
的计算公式为 &lambda; ij &RightArrow; = &tau; 2 &CenterDot; &Sigma; ( u , v ) K &sigma; ( x ) - - - ( 5 ) ,
式(5)中τ2为常量,用以保证
Figure A200810237468C0004142544QIETU
大小范围为(0,1];
式(5)中K为Web服务Si、Sj在接口匹配层RI可以关联的不同Web服务接口操作对的总量之和;
式(5)中 &sigma; ( x ) = &Integral; 1 p x ( u , v ) 1 / 3 dx ( p &GreaterEqual; 1 ) 1 ( p < 1 ) - - - ( 6 ) 调用次数p≥1表示当前接口操作对(u,v)在历史关系层RH存在调用日志,采用积分方式实施累加;调用次数p<1表示当前接口操作对(u,v)在历史关系层RH不存在调用日志,仅通过1反映接口匹配层RI当前操作对(u,v)关系的存在。
5.如权利要求3或4所述的问答服务构建方法,其特征在于:步骤3的具体实现方式包括以下步骤,
步骤3.1,对当前用户提问和Web服务资源所含Web服务的服务描述分别进行概念实体抽取,并以本体作为概念扩展的基础,映射出Web服务资源中与当前用户提问相关的所有Web服务S1,S2,...SN;利用Web服务有向关系网络,扩展与这N个Web服务S1,S2,...SN在历史关系层RH关系最为显著的M个外围服务s1,s2...sM;构成当前问题相关Web服务集合{S1,S2,...SN,s1,s2,...sM};
步骤3.2,以Web服务S1,S2,...SN,s1,s2,...sM作为节点,抽取此N+M个Web服务两两之间的有向关系,组成一个服务关系子网;
步骤3.3,针对用户提问和Web服务S1,S2,...SN描述中各自的概念实体,依次计算概念集相似度并排序,选择其中与用户问题最相关的若干Web服务,作为起始服务,设定所有起始服务构成起始服务列集ΓB
步骤3.4,以起始服务为服务层次化网状图的第一层,按照服务关系子网中的节点及有向关系,并将服务关系子网转换成服务层次化网状图。
6.如权利要求5所述的问答服务构建方法,其特征在于:在步骤4寻找服务流程组合策略时,设置阀值δ,所述阀值δ用于确定每次流程下推时所能选择的路径;具体实现方式包括以下步骤,
步骤4.1,从服务层次化网状图的最高层选择任一起始节点作为下推起点,
步骤4.2,执行下推,即根据阀值δ从下推起点下推一层时所能选择的路径,定位每条路径所连接的新节点;
步骤4.3,执行回溯,即以步骤4.2中确定的新节点之一为回溯起点,向上回溯与回溯起点连接的上层节点,逐层回溯直至最高层;
步骤4.4,检查此时整个流程中,该回溯起点、回溯起点连接的下层节点和回溯所涉及的所有节点是否完全包含起始服务列集ΓB,若是则终止该条流程,直接作为一个服务流程组合策略;若否则选取一个步骤4.2中确定的其它新节点,返回执行步骤4.3进行回溯;
若对步骤4.2中确定的所有新节点处理完毕,仍没有一个流程完全包含起始服务列集ΓB;将步骤4.2中确定的每个新节点作为下推起点,返回步骤4.2循环执行下推及回溯。
7.如权利要求6所述的问答服务构建方法,其特征在于:从寻找到的备选问答方案中选出最优问答方案,供用户参考。
8.如权利要求6所述的问答服务构建方法,其特征在于:而且,根据其他用户历史上对同类问题已作的选择,对备选问答方案排序,供用户参考。
CN2008102374687A 2008-12-29 2008-12-29 基于Web Service组合的问答服务构建方法 Expired - Fee Related CN101465749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102374687A CN101465749B (zh) 2008-12-29 2008-12-29 基于Web Service组合的问答服务构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102374687A CN101465749B (zh) 2008-12-29 2008-12-29 基于Web Service组合的问答服务构建方法

Publications (2)

Publication Number Publication Date
CN101465749A true CN101465749A (zh) 2009-06-24
CN101465749B CN101465749B (zh) 2011-05-11

Family

ID=40806124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102374687A Expired - Fee Related CN101465749B (zh) 2008-12-29 2008-12-29 基于Web Service组合的问答服务构建方法

Country Status (1)

Country Link
CN (1) CN101465749B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102035890A (zh) * 2010-12-08 2011-04-27 中国科学院声学研究所 一种基于面向物联网应用的Web服务并发控制方法及系统
CN102063811A (zh) * 2011-01-07 2011-05-18 广东电网公司电力科学研究院 数字化变电站多媒体培训考试系统
CN102880684A (zh) * 2012-09-13 2013-01-16 杭州电子科技大学 基于日志记录挖掘与组合验证的工作流建模方法
CN103780629A (zh) * 2014-02-14 2014-05-07 北京工业大学 面向并发访问请求关联关系的访问控制协调方法及其装置
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN105760273A (zh) * 2016-01-29 2016-07-13 浪潮通信信息系统有限公司 一种处理指标的方法及装置
CN107861951A (zh) * 2017-11-17 2018-03-30 康成投资(中国)有限公司 智能客服中的会话主题识别方法
CN108170780A (zh) * 2017-12-26 2018-06-15 北京邦邦共赢网络科技有限公司 一种自助问答的问题匹配方法及装置
CN109597874A (zh) * 2018-10-23 2019-04-09 重庆邂智科技有限公司 信息推荐方法、装置及服务器
CN110019710A (zh) * 2017-11-27 2019-07-16 厦门快商通信息技术有限公司 一种主题森林式人机对话方法及系统
CN110690997A (zh) * 2019-10-10 2020-01-14 深圳前海微众银行股份有限公司 节点格式化方法、装置、设备及可读存储介质
CN110737762A (zh) * 2019-10-09 2020-01-31 尹曦 一种基于语音交互的老年人个人信息助理系统
CN110874403A (zh) * 2018-08-29 2020-03-10 株式会社日立制作所 提问回答系统、提问回答处理方法以及提问回答整合系统
CN112313644A (zh) * 2018-04-20 2021-02-02 脸谱公司 基于会话数据构建定制的用户简档

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102035890B (zh) * 2010-12-08 2013-05-29 中国科学院声学研究所 一种基于面向物联网应用的Web服务并发控制方法及系统
CN102035890A (zh) * 2010-12-08 2011-04-27 中国科学院声学研究所 一种基于面向物联网应用的Web服务并发控制方法及系统
CN102063811A (zh) * 2011-01-07 2011-05-18 广东电网公司电力科学研究院 数字化变电站多媒体培训考试系统
CN102880684A (zh) * 2012-09-13 2013-01-16 杭州电子科技大学 基于日志记录挖掘与组合验证的工作流建模方法
CN102880684B (zh) * 2012-09-13 2015-08-12 杭州电子科技大学 基于日志记录挖掘与组合验证的工作流建模方法
CN103780629A (zh) * 2014-02-14 2014-05-07 北京工业大学 面向并发访问请求关联关系的访问控制协调方法及其装置
CN103780629B (zh) * 2014-02-14 2017-01-18 北京工业大学 面向并发访问请求关联关系的访问控制协调方法及其装置
CN105760273A (zh) * 2016-01-29 2016-07-13 浪潮通信信息系统有限公司 一种处理指标的方法及装置
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN105512349B (zh) * 2016-02-23 2019-03-26 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN107861951A (zh) * 2017-11-17 2018-03-30 康成投资(中国)有限公司 智能客服中的会话主题识别方法
CN110019710A (zh) * 2017-11-27 2019-07-16 厦门快商通信息技术有限公司 一种主题森林式人机对话方法及系统
CN108170780A (zh) * 2017-12-26 2018-06-15 北京邦邦共赢网络科技有限公司 一种自助问答的问题匹配方法及装置
CN112313644A (zh) * 2018-04-20 2021-02-02 脸谱公司 基于会话数据构建定制的用户简档
CN110874403A (zh) * 2018-08-29 2020-03-10 株式会社日立制作所 提问回答系统、提问回答处理方法以及提问回答整合系统
CN110874403B (zh) * 2018-08-29 2024-03-08 株式会社日立制作所 提问回答系统、提问回答处理方法以及提问回答整合系统
CN109597874A (zh) * 2018-10-23 2019-04-09 重庆邂智科技有限公司 信息推荐方法、装置及服务器
CN109597874B (zh) * 2018-10-23 2023-05-23 重庆邂智科技有限公司 信息推荐方法、装置及服务器
CN110737762A (zh) * 2019-10-09 2020-01-31 尹曦 一种基于语音交互的老年人个人信息助理系统
CN110690997A (zh) * 2019-10-10 2020-01-14 深圳前海微众银行股份有限公司 节点格式化方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN101465749B (zh) 2011-05-11

Similar Documents

Publication Publication Date Title
CN101465749B (zh) 基于Web Service组合的问答服务构建方法
CN101572623B (zh) 基于主客观组合评价的网络性能综合评价方法
CN104375992B (zh) 一种地址匹配的方法和装置
CN105808590B (zh) 搜索引擎实现方法、搜索方法以及装置
CN103473291B (zh) 一种基于隐语义概率模型的个性化服务推荐系统及方法
CN111489095B (zh) 一种风险用户管理方法、装置、计算机设备和存储介质
CN103729362B (zh) 导航内容的确定方法和装置
CN105740310B (zh) 一种用于问答系统中的自动答案摘要方法及系统
CN103838857B (zh) 一种基于语义的自动服务组合系统及方法
CN109858566A (zh) 一种基于多层模型构建增加入模维度的评分卡的方法
CN106528804B (zh) 一种基于模糊聚类的用户分群方法
CN110377689A (zh) 试卷智能生成方法、装置、计算机设备及存储介质
CN110288350A (zh) 用户价值预测方法、装置、设备及存储介质
CN107239489A (zh) 基于soar模型的突发事件中网络舆情的预测与仿真方法
CN109951846A (zh) 无线网络识别方法、装置、存储介质及计算机设备
CN104462318A (zh) 一种多网络中相同人名的身份识别方法及装置
CN110297712A (zh) 一种面向区块链节点负载预测的arima组合预测方法
CN101556582A (zh) 论坛网民兴趣分析预测系统
CN105005942A (zh) 一种智能配电网差异化建设模式选择方法
CN103577899B (zh) 一种基于可靠性预测与QoS相结合的服务组合方法
CN106022475B (zh) 基于动态自适应混沌蚁群算法的Web服务组合方法
CN112507224B (zh) 基于异质网络表示学习的人机物融合系统服务推荐方法
CN104703059B (zh) 一种宽带接入网络的规划方法及装置
CN107341733A (zh) 社区划分方法及装置
CN107133321A (zh) 页面的搜索特性的分析方法和分析装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110511

Termination date: 20121229