CN104021216A - 消息代理服务器及信息发布订阅方法和系统 - Google Patents

消息代理服务器及信息发布订阅方法和系统 Download PDF

Info

Publication number
CN104021216A
CN104021216A CN201410281789.2A CN201410281789A CN104021216A CN 104021216 A CN104021216 A CN 104021216A CN 201410281789 A CN201410281789 A CN 201410281789A CN 104021216 A CN104021216 A CN 104021216A
Authority
CN
China
Prior art keywords
result
matching
word segmentation
word
template document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410281789.2A
Other languages
English (en)
Other versions
CN104021216B (zh
Inventor
高锦春
裴君波
刘元安
马晓雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201410281789.2A priority Critical patent/CN104021216B/zh
Publication of CN104021216A publication Critical patent/CN104021216A/zh
Application granted granted Critical
Publication of CN104021216B publication Critical patent/CN104021216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种消息代理服务器及信息发布订阅方法和系统,所述方法包括:接收到订阅器发送的基于自然语言的订阅请求后,对其中以自然语言组建的订阅信息进行分词,得到分词结果;将分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对分词结果中的每个词语,将解析结果中限制内容或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;根据匹配结果中与分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将分词结果构建为符合订阅语言格式规范的标准订阅请求;将与标准订阅请求相匹配的发布信息向订阅器返回。应用本发明,用户可以采用自然语言进行信息订阅,使得信息订阅更为方便。

Description

消息代理服务器及信息发布订阅方法和系统
技术领域
本发明涉及软件领域,尤其涉及一种消息代理服务器及信息发布订阅方法和系统。
背景技术
Internet技术的飞速发展和广泛普及,使人们获取信息的方式发生了革命性的变革。传统的方式是信息查询,即访问Web网站或搜索感兴趣的Web页面,人们要花费很多时间才能找到自己感兴趣的信息,并且反复查询的方式也增加了网络中许多流量。发布/订阅(Publish/Subscribe)的通信方式能够解决这个问题。
发布/订阅系统通常包含发布器、消息代理服务器、订阅器三个部分。用户可通过发布器向消息代理服务器发布信息,用户通过订阅器向消息代理服务器订阅感兴趣的信息,消息代理服务器将用户感兴趣的信息准确及时地转发给订阅器。发布器和订阅器之间不直接通信,这样的系统具有很好的松散耦合性,与Web访问、远程过程调用、消息队列等传统的通信方式相比,更适合大规模分布式系统的实现,同时,信息是按需传递的,降低了网络流量。
另一方面,XML(Extensible Markup Language,可扩展标记语言)正在逐渐成为电子信息领域中数据表示和数据交换的基本格式。XML可以结构化地表示数据,而且具有扩展性强和平台无关性等优点。用XML作为发布/订阅系统中的数据模型,可以大大提高系统的表达能力。
XML由嵌套的元素标签、元素属性、元素内容等组成,使得信息被结构化地表示,从而大大提高信息表示的准确性和处理效率。这种结构不但使人们对文档的结构和内容一目了然,对计算机而言XML文档也是可读的。应用中只需要一个小的XML解析器(比如几十KB的Java解析器)就可以把XML表示的内容分析出来。
通常基于XML的发布/订阅系统中,用户通过订阅器将基于订阅语言的订阅请求发送到消息代理服务器后,消息代理服务器根据订阅请求中的信息在以XML文档表示的数据中进行查询匹配,并将查询匹配出的发布信息向订阅器返回,从而用户可获得所需内容。然而,用户通过基于XML的发布/订阅系统获取所需内容时,用户需要知道系统中XML文档的结构,并熟悉订阅语言的语法,才能够完整表达需要订阅的内容并成功接收到所需内容。而这两个条件对于多数用户是不具备的,使得用户在现有的发布/订阅系统中进行信息订阅并不方便;因此,有必要提供一种更方便用户进行信息订阅的发布/订阅系统。
发明内容
针对上述现有技术存在的缺陷,本发明实施例提供了一种消息代理服务器及信息发布订阅方法和系统,用以更方便用户进行信息订阅。
本发明实施例提供了一种信息发布订阅方法,包括:
接收到订阅器发送的基于自然语言的订阅请求后,对其中以自然语言组建的订阅信息进行分词,得到分词结果;
将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;
根据匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;
将与所述标准订阅请求相匹配的发布信息向所述订阅器返回。
较佳地,所述将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配,具体包括:
针对预先存储的每个XML约束模板文档,将所述分词结果与该XML约束模板文档的解析结果进行匹配:
针对所述分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素。
较佳地,在所述将所述分词结果与该XML约束模板文档的解析结果进行匹配后,还包括:
统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度;以及
所述根据匹配结果构建标准订阅请求,具体包括:
选取与所述分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;
根据所述匹配约束模板文档的匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求。
本发明实施例还提供了一种消息代理服务器,包括:
请求接收模块,用于接收订阅器发送的基于自然语言的订阅请求;
匹配模块,用于对所述请求接收模块接收的基于自然语言的订阅请求中以自然语言组建的订阅信息进行分词,得到分词结果;将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;
标准订阅请求构建模块,用于根据所述匹配模块得到的匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;
请求处理模块,用于将与所述标准订阅请求构建模块构建的标准订阅请求相匹配的发布信息向所述订阅器返回。
较佳地,所述匹配模块具体用于针对预先存储的每个XML约束模板文档,将所述分词结果与该XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素;之后,统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度。
较佳地,所述标准订阅请求构建模块具体用于根据据所述匹配模块得到的匹配结果和匹配程度,选取与所述分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;根据所述匹配约束模板文档的匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求。
进一步,所述消息代理服务器还包括:
解析模块,用于针对每个XML约束模板文档,从该XML约束模板文档中解析出每个元素的属性、结构化信息、限制内容,作为该XML约束模板文档的解析结果进行存储。
本发明实施例还提供了一种信息发布订阅系统,包括:用于进行信息发布的发布器,还包括:
订阅器,用于发送基于自然语言的订阅请求;
消息代理服务器,接收到订阅器发送的基于自然语言的订阅请求后,对其中以自然语言组建的订阅信息进行分词,得到分词结果;将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;根据匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;将与所述标准订阅请求相匹配的发布信息向所述订阅器返回。
其中,所述消息代理服务器具体包括:
请求接收模块,用于接收订阅器发送的基于自然语言的订阅请求;
匹配模块,用于对所述请求接收模块接收的基于自然语言的订阅请求中以自然语言组建的订阅信息进行分词,得到分词结果;将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;
标准订阅请求构建模块,用于根据所述匹配模块得到的匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;
请求处理模块,用于将与所述标准订阅请求构建模块构建的标准订阅请求相匹配的发布信息向所述订阅器返回。
较佳地,所述匹配模块具体用于针对预先存储的每个XML约束模板文档,将所述分词结果与该XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素;之后,统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度;以及
所述标准订阅请求构建模块具体用于根据据所述匹配模块得到的匹配结果和匹配程度,选取与所述分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;根据所述匹配约束模板文档的匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求。
本发明的技术方案中,消息代理服务器可以对订阅器发送的基于自然语言的订阅请求进行分词处理后,针对分词结果中的每个词语,将XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素,并根据匹配结果构建出符合订阅语言格式规范的标准订阅请求,将与标准订阅请求相匹配的发布信息向订阅器返回。这样,用户可以使用自然语言通过订阅器向消息代理服务器发送基于自然语言的订阅器请求,由消息代理服务器对基于自然语言的订阅请求进行处理,将其转换为符合订阅语言格式规范的标准订阅请求,并实现用户的信息订阅。从而,应用本发明的方法,可以使得用户可不必了解XML文档的结构,也不必学习复杂的订阅语言的语法便可实现信息订阅,使得用户进行信息订阅更为方便。
附图说明
图1为本发明实施例的信息发布订阅系统的架构图;
图2为本发明实施例的信息发布订阅方法的流程图;
图3为本发明实施例的消息代理服务器的内部结构框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内。
本发明的发明人发现,对于消息代理服务器中用于表示数据的一类XML文档,会有一份XML格式内容限制规范文档,如XML Schema(XML约束模板)文档,来定义该类XML文档;在本文中,将XML Schema文档或具有同等作用的XML格式内容限制规范文档统称为XML约束模板文档。其中,XML Schema文档用来描述XML文档的结构以及验证XML文档的合法性。XML Schema文档是一类特殊的XML文档,遵守和XML同样的语法规范。XML Schema文档的内容也是由元素及其内容组成,这些元素对XML文档中允许的语法和结构进行了定义。例如:
Schema元素为Schema文本的根元素,表明该文档是一个Schema文档;
ElementType元素用来声明定义的XML文档中使用的元素;
Element元素是对ElementType声明的元素的内容进行定义;
Group元素表达元素成组的概念;
AttributeType元素定义了Schema文档中使用的属性类型;
Attribute元素对AttributeType声明的属性进行具体的定义;
Datatype和description分别定义了元素的数据类型和为元素提供的说明资料。
由此,本发明的发明人考虑到,可以预先对消息代理服务器存储的XML约束模板文档进行解析,得到XML约束模板文档所限定的结构化信息(如层级)、内容、属性;这样,用户可使用自然语言通过订阅器向消息代理服务器发送基于自然语言的订阅请求,消息代理服务器可以利用对XML约束模板文档的解析结果,自动地将基于自然语言的订阅请求转换为符合该XML约束模板文档所定义的一类XML文档的格式的、基于订阅语言的标准订阅请求。消息代理服务器再根据转换得到的标准订阅请求在以XML文档表示的数据中进行查询匹配,并将查询匹配出的发布信息向订阅器返回。从而,用户可不必了解XML文档的结构,也不必学习复杂的订阅语言的语法,用户可使用自然语言更为方便地完成信息订阅。
下面结合附图详细说明本发明的技术方案。本发明实施例提供的信息发布订阅系统的架构图,如图1所示,包括:多个发布器101、多个订阅器102以及消息代理服务器103。
其中,发布器101用于进行信息发布,与现有技术的发布器的功能相同。具体地,发布器101中运行了发布应用程序,可通过网络向消息代理服务器103发布信息。
订阅器102不同于现有技术的订阅器,本发明的订阅器102可用于向消息代理服务器103发送基于自然语言的订阅请求。也就是说,订阅器102可以接收用户输入的自然语言,然后向消息代理服务器103发送基于自然语言的订阅请求,从而用户不必了解XML文档的结构,也不必学习复杂的订阅语言的语法。
消息代理服务器103也不同于现有技术的消息代理服务器,本发明的消息代理服务器103可用于对订阅器102发送的基于自然语言的订阅请求进行处理,将基于自然语言的订阅请求转换为符合订阅语言格式规范的标准订阅请求,并根据标准订阅请求向订阅器102返回发布信息。
具体地,消息代理服务器103获取到各发布器101所发布的发布信息后,可使用多类XML文档来表示和存储这些发布信息的数据;针对每类XML文档,消息代理服务器103存储有定义该类XML文档的XML约束模板文档。在实际应用中,XML约束模板文档可由同一领域信息发布者统一协商提供,也可由信息发布订阅系统内部统一设定,还可由第三方指定。而且,消息代理服务器103可预先对存储的XML约束模板文档进行解析,即对于待解析的XML约束模板文档,解析出XML约束模板文档中的每个元素的结构化信息、限制内容,以及属性作为XML约束模板文档的解析结果进行存储。
具体地,本发明的消息代理服务器103对订阅器102发送的基于自然语言的订阅请求进行处理,并向订阅器102返回发布信息的方法的流程,如图2所示,具体包括如下步骤:
S201:消息代理服务器103接收到订阅器102发送的基于自然语言的订阅请求后,对其中以自然语言组建的订阅信息进行分词,得到分词结果。
具体地,用户使用自然语言通过订阅器102向消息代理服务器103发送基于自然语言的订阅请求后,消息代理服务器103对接收到的订阅请求中以自然语言组建的订阅信息进行分词,得到分词结果。其中,对订阅信息进行分词也就是使用现有的分词算法将订阅信息划分为多个词语(或称为自然语言元素)。
S202:消息代理服务器103将得到的分词结果与预先存储的XML约束模板文档的解析结果进行匹配。
本步骤中,消息代理服务器103针对得到的分词结果中的每个词语,将预先存储的XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素。
较佳地,消息代理服务器103中可预先存储多个XML约束模板文档。消息代理服务器103可针对预先存储的每个XML约束模板文档,将得到的分词结果与该XML约束模板文档的解析结果进行匹配,即针对得到的分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素。之后,针对预先存储的每个XML约束模板文档,还可统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度,并选取与得到的分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档。
S203:消息代理服务器103根据匹配结果构建标准订阅请求。
具体地,消息代理服务器103根据匹配结果中与得到的分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将得到的分词结果构建为符合订阅语言格式规范的标准订阅请求。从而,消息代理服务器103可实现将自然语言转换为订阅语言,如Xpath、Xquery等包含结构和内容双重信息的订阅语言。而且消息代理服务器103转换的订阅语言可以完整覆盖用户使用的自然语言的订阅语义。
更优地,还可使用上述步骤S202中选取出的匹配约束模板文档的匹配结果构建标准订阅请求,具体为:根据匹配约束模板文档的匹配结果中与得到的分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将得到的分词结果构建为符合订阅语言格式规范的标准订阅请求。其中,预设规则可由本领域技术人员进行预先设定。基于自然语言的订阅请求的分词结果与选取出的匹配约束模板文档的匹配程度最高,表明基于自然语言的订阅请求与匹配约束模板文档所定义的一类XML文档的格式最匹配,因此使用匹配约束模板文档的解析结果将基于自然语言的订阅请求转换得到的标准订阅请求,可以较好地符合匹配约束模板文档所定义的一类XML文档的格式,从而实现从基于自然语言到基于订阅语言的订阅请求的自动转换,而不必用户去研究、熟悉XML文档的格式或架构来构建符合XML文档的格式的基于订阅语言的订阅请求。
例如,表1示出了一种预设规则(或称为转换规则)。转换规则也就是将自然语言的词语映射为订阅语言中的节点、属性、谓词以及层级关系的规则。若用户通过订阅器102向消息代理服务器103发送的订阅请求中的自然语言为“北京天气”,消息代理服务器103可将“海淀区一居房屋出租价格”划分为“海淀区”、“一居”、“房屋出租”、“价格”四个词语,并确定“海淀区”为XML Schema文档的解析结果中一个元素的属性,“一居”、“房屋出租”、“价格”分别为XML Schema文档的解析结果中的三个元素的限制内容,且这几个元素的层级分别为2、3、1、4,则根据表1的转换规则转换的订阅语言为:房屋出租/*[区=“海淀区”]/一居/价格。
表1
S204:消息代理服务器103将与标准订阅请求相匹配的发布信息向订阅器102返回。
具体地,消息代理服务器103根据标准订阅请求中的订阅语言对以XML表示的数据进行查询匹配,将与标准订阅请求相匹配的发布信息向订阅器102返回。
上述的消息代理服务器103的内部结构框图,如图3所示,具体包括:请求接收模块301、匹配模块302、标准订阅请求构建模块303和请求处理模块304。
请求接收模块301用于接收订阅器102发送的基于自然语言的订阅请求。
匹配模块302用于对请求接收模块301接收的基于自然语言的订阅请求中以自然语言组建的订阅信息进行分词,得到分词结果;将得到的分词结果与预先存储的XML约束模板文档的解析结果进行匹配,即针对得到的分词结果中的每个词语,将XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素。具体地,匹配模块302针对预先存储的每个XML约束模板文档,将得到的分词结果与该XML约束模板文档的解析结果进行匹配,即针对得到的分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素;之后,统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与得到的分词结果之间的匹配程度。
标准订阅请求构建模块303用于根据匹配模块302得到的匹配结果构建标准订阅请求,具体为:根据匹配结果中与匹配模块302得到的分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将匹配模块302得到的分词结果构建为符合订阅语言格式规范的标准订阅请求。具体地,标准订阅请求构建模块303具体用于根据匹配模块302得到的匹配结果和匹配程度,选取与匹配模块302得到的分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;根据匹配约束模板文档的匹配结果中与匹配模块302得到的分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将匹配模块302得到的分词结果构建为符合订阅语言格式规范的标准订阅请求。
请求处理模块304用于将与标准订阅请求构建模块303构建的标准订阅请求相匹配的发布信息向订阅器102返回。
进一步,上述的消息代理服务器103还包括:解析模块305。
解析模块305用于针对每个XML约束模板文档,从该XML约束模板文档中解析出每个元素的属性、结构化信息、限制内容,作为该XML约束模板文档的解析结果进行存储。
本发明的技术方案中,消息代理服务器可以对订阅器发送的基于自然语言的订阅请求进行分词处理后,针对分词结果中的每个词语,将XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素,并根据匹配结果构建出符合订阅语言格式规范的标准订阅请求,将与标准订阅请求相匹配的发布信息向订阅器返回。这样,用户可以使用自然语言通过订阅器向消息代理服务器发送基于自然语言的订阅器请求,由消息代理服务器对基于自然语言的订阅请求进行处理,将其转换为符合订阅语言格式规范的标准订阅请求,并实现用户的信息订阅。从而,应用本发明的方法,可以使得用户可不必了解XML文档的结构,也不必学习复杂的订阅语言的语法便可实现信息订阅,使得用户进行信息订阅更为方便。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种信息发布订阅方法,其特征在于,包括:
接收到订阅器发送的基于自然语言的订阅请求后,对其中以自然语言组建的订阅信息进行分词,得到分词结果;
将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;
根据匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;
将与所述标准订阅请求相匹配的发布信息向所述订阅器返回。
2.如权利要求1所述的方法,其特征在于,所述将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配,具体包括:
针对预先存储的每个XML约束模板文档,将所述分词结果与该XML约束模板文档的解析结果进行匹配:
针对所述分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素。
3.如权利要求2所述的方法,其特征在于,在所述将所述分词结果与该XML约束模板文档的解析结果进行匹配后,还包括:
统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度;以及
所述根据匹配结果构建标准订阅请求,具体包括:
选取与所述分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;
根据所述匹配约束模板文档的匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求。
4.一种消息代理服务器,其特征在于,包括:
请求接收模块,用于接收订阅器发送的基于自然语言的订阅请求;
匹配模块,用于对所述请求接收模块接收的基于自然语言的订阅请求中以自然语言组建的订阅信息进行分词,得到分词结果;将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;
标准订阅请求构建模块,用于根据所述匹配模块得到的匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;
请求处理模块,用于将与所述标准订阅请求构建模块构建的标准订阅请求相匹配的发布信息向所述订阅器返回。
5.如权利要求4所述的服务器,其特征在于,
所述匹配模块具体用于针对预先存储的每个XML约束模板文档,将所述分词结果与该XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素;之后,统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度。
6.如权利要求5所述的服务器,其特征在于,
所述标准订阅请求构建模块具体用于根据据所述匹配模块得到的匹配结果和匹配程度,选取与所述分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;根据所述匹配约束模板文档的匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求。
7.如权利要求4-6任一所述的服务器,其特征在于,还包括:
解析模块,用于针对每个XML约束模板文档,从该XML约束模板文档中解析出每个元素的属性、结构化信息、限制内容,作为该XML约束模板文档的解析结果进行存储。
8.一种信息发布订阅系统,包括:用于进行信息发布的发布器,其特征在于,还包括:
订阅器,用于发送基于自然语言的订阅请求;
消息代理服务器,接收到订阅器发送的基于自然语言的订阅请求后,对其中以自然语言组建的订阅信息进行分词,得到分词结果;将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;根据匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;将与所述标准订阅请求相匹配的发布信息向所述订阅器返回。
9.如权利要求8所述的系统,其特征在于,所述消息代理服务器具体包括:
请求接收模块,用于接收订阅器发送的基于自然语言的订阅请求;
匹配模块,用于对所述请求接收模块接收的基于自然语言的订阅请求中以自然语言组建的订阅信息进行分词,得到分词结果;将所述分词结果与预先存储的XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将所述解析结果中限制内容、或属性中包含有该词语的元素,作为匹配结果中与该词语对应的匹配元素;
标准订阅请求构建模块,用于根据所述匹配模块得到的匹配结果构建标准订阅请求:根据匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求;
请求处理模块,用于将与所述标准订阅请求构建模块构建的标准订阅请求相匹配的发布信息向所述订阅器返回。
10.如权利要求9所述的系统,其特征在于,
所述匹配模块具体用于针对预先存储的每个XML约束模板文档,将所述分词结果与该XML约束模板文档的解析结果进行匹配:针对所述分词结果中的每个词语,将该XML约束模板文档的解析结果中限制内容、或属性中包含有该词语的元素,作为该XML约束模板文档的匹配结果中的与该词语对应的匹配元素;之后,统计该XML约束模板文档的匹配结果中的匹配元素的数目,将统计出的数目作为该XML约束模板文档与所述分词结果之间的匹配程度;以及
所述标准订阅请求构建模块具体用于根据据所述匹配模块得到的匹配结果和匹配程度,选取与所述分词结果匹配程度最高的XML约束模板文档作为匹配约束模板文档;根据所述匹配约束模板文档的匹配结果中与所述分词结果的各词语所对应的匹配元素的属性、结构化信息,运用预设规则将所述分词结果构建为符合订阅语言格式规范的标准订阅请求。
CN201410281789.2A 2014-06-20 2014-06-20 消息代理服务器及信息发布订阅方法和系统 Active CN104021216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410281789.2A CN104021216B (zh) 2014-06-20 2014-06-20 消息代理服务器及信息发布订阅方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410281789.2A CN104021216B (zh) 2014-06-20 2014-06-20 消息代理服务器及信息发布订阅方法和系统

Publications (2)

Publication Number Publication Date
CN104021216A true CN104021216A (zh) 2014-09-03
CN104021216B CN104021216B (zh) 2017-05-10

Family

ID=51437970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410281789.2A Active CN104021216B (zh) 2014-06-20 2014-06-20 消息代理服务器及信息发布订阅方法和系统

Country Status (1)

Country Link
CN (1) CN104021216B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657018A (zh) * 2016-01-04 2016-06-08 上海斐讯数据通信技术有限公司 一种订阅远程消息的方法及系统
WO2017214813A1 (zh) * 2016-06-13 2017-12-21 深圳天珑无线科技有限公司 一种分布式网络的消息回复方法、节点及系统
CN111026972A (zh) * 2019-12-26 2020-04-17 远景智能国际私人投资有限公司 物联网中的订阅数据推送方法、装置、设备及存储介质
US20220159038A1 (en) * 2020-11-19 2022-05-19 Illumio, Inc. Constraint rules for constraining creation of a segmentation policy
CN117252730A (zh) * 2023-11-17 2023-12-19 浙江口碑网络技术有限公司 服务订阅处理系统、服务订阅信息处理方法与装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079051A (zh) * 2007-06-11 2007-11-28 周广宇 在网络环境下进行结构化信息发布与搜索的方法
US20090282005A1 (en) * 2008-05-09 2009-11-12 Samsung Electronics Co. Ltd. Sip network-based content sharing method and system
CN102262634A (zh) * 2010-05-24 2011-11-30 北京大学深圳研究生院 一种自动问答方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079051A (zh) * 2007-06-11 2007-11-28 周广宇 在网络环境下进行结构化信息发布与搜索的方法
US20090282005A1 (en) * 2008-05-09 2009-11-12 Samsung Electronics Co. Ltd. Sip network-based content sharing method and system
CN102262634A (zh) * 2010-05-24 2011-11-30 北京大学深圳研究生院 一种自动问答方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
闫秋艳等: "一种基于自然语言生成的XML关键词查询技术", 《计算机工程与应用》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657018A (zh) * 2016-01-04 2016-06-08 上海斐讯数据通信技术有限公司 一种订阅远程消息的方法及系统
WO2017214813A1 (zh) * 2016-06-13 2017-12-21 深圳天珑无线科技有限公司 一种分布式网络的消息回复方法、节点及系统
CN111026972A (zh) * 2019-12-26 2020-04-17 远景智能国际私人投资有限公司 物联网中的订阅数据推送方法、装置、设备及存储介质
US20220159038A1 (en) * 2020-11-19 2022-05-19 Illumio, Inc. Constraint rules for constraining creation of a segmentation policy
US11647050B2 (en) * 2020-11-19 2023-05-09 Illumio, Inc. Constraint rules for constraining creation of a segmentation policy
CN117252730A (zh) * 2023-11-17 2023-12-19 浙江口碑网络技术有限公司 服务订阅处理系统、服务订阅信息处理方法与装置
CN117252730B (zh) * 2023-11-17 2024-03-19 浙江口碑网络技术有限公司 服务订阅处理系统、服务订阅信息处理方法与装置

Also Published As

Publication number Publication date
CN104021216B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
US11940999B2 (en) Metadata-driven computing system
AU2021212135B2 (en) Building and managing data-processing attributes for modelled data sources
US10963513B2 (en) Data system and method
US10984913B2 (en) Blockchain system for natural language processing
US9495429B2 (en) Automatic synthesis and presentation of OLAP cubes from semantically enriched data sources
CN110399388A (zh) 数据查询方法、系统和设备
US11798208B2 (en) Computerized systems and methods for graph data modeling
CN109284323B (zh) 检测数据的管理方法及装置
CN103095823A (zh) 一种物联网系统中对象的描述方法及对象信息交互系统
US8745096B1 (en) Techniques for aggregating data from multiple sources
CN104021216A (zh) 消息代理服务器及信息发布订阅方法和系统
CN111026931B (zh) 一种数据查询方法、装置、设备及介质
CN102257488A (zh) 用于经由网络自动聚合内容的技术
US20090319494A1 (en) Field mapping for data stream output
CN103425726A (zh) 使用业务智能工具访问开放数据
US20150142781A1 (en) Interacting with resources exchanged using open data protocol
CN102761532A (zh) 网络视频的信息处理系统和方法
US9330140B1 (en) Transient virtual single tenant queries in a multi-tenant shared database system
CN106339498A (zh) 数据同步方法、装置和系统
US10397326B2 (en) IRC-Infoid data standardization for use in a plurality of mobile applications
CN107515866B (zh) 一种数据操作方法、装置和系统
CN107665237A (zh) 数据结构分类装置、非结构化数据的发布订阅系统及方法
CN115016784B (zh) 低代码应用复用方法、应用解析系统、设备及存储介质
CN109471957B (zh) 一种基于统一标签的元数据转换方法及装置
KR20210063878A (ko) 지식 그래프 기반 마케팅 정보 분석 챗봇 서비스 제공 방법 및 그 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant