CN101288071A - 用于确定计算机服务名称的方法和计算机单元 - Google Patents

用于确定计算机服务名称的方法和计算机单元 Download PDF

Info

Publication number
CN101288071A
CN101288071A CNA2006800061032A CN200680006103A CN101288071A CN 101288071 A CN101288071 A CN 101288071A CN A2006800061032 A CNA2006800061032 A CN A2006800061032A CN 200680006103 A CN200680006103 A CN 200680006103A CN 101288071 A CN101288071 A CN 101288071A
Authority
CN
China
Prior art keywords
service
service name
computer
names
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800061032A
Other languages
English (en)
Inventor
V·鲍彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unify GmbH and Co KG
Original Assignee
Siemens Enterprise Communications GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Enterprise Communications GmbH and Co KG filed Critical Siemens Enterprise Communications GmbH and Co KG
Publication of CN101288071A publication Critical patent/CN101288071A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

由于所提供的计算机服务的数量的增长,使得难以借助其名称来找到这些服务,因为通常缺少关于这些服务的概况。本方法用于确定计算机服务名称,其中输入虚构的服务名称(10),将虚构的服务名称按词典编纂学分解(12)成子字符串,并且执行第一确定阶段(14),其中根据存在的服务名称与子字符串的字符串匹配来选择第一组服务名称。在另一步骤(16)中,搜索词典编纂学的部分的同义词,使得在另一确定阶段中可以确定其它的服务名称。此外还可以实现语法分析(20),并且根据该语法分析实现另一确定阶段(22),使得输出所确定的存在的服务名称的更狭窄的选择(24)。所确定的真实的服务名称在意义上对应于开始时所输入的虚构的服务名称。

Description

用于确定计算机服务名称的方法和计算机单元
本发明涉及用于确定计算机服务名称的方法和计算机单元。
通常在计算机科学中存在客户端服务器关系、即由服务器提供确定的计算机服务(Service),并且客户端可以调用这些服务。
该模式日益如下被拆开,即等价的单元相互间对等地(Peer-to-Peer)交换其服务。在此情况下每一个计算机单元都提供服务和使用服务。
总之已经得出,在该领域中所提供的服务的总数持续地上升。越来越多地存在为了能够完全使用这种服务而识别所述服务的名称的困难性。常规的搜索机在此情况下可能很少是有用处的,因为这些搜索机通常以全文本搜索来工作,为此必须准确知晓这种服务的名称,因为否则不能找到所述名称。当前涉及的是,基于不清晰的所谓模糊信息来确定计算机服务名称。在此,计算机服务的准确名称是未知的,仅仅知道其确定借助于其内容描述。
在现有技术中还没有这种方法。
本发明的任务是提供用于确定计算机服务名称的方法和计算机单元,如果预先给定的信息也如此不准确,以致于不知道或也仅仅大约知道服务的名称,则所述计算机单元能工作并找到大量服务。
通过按照权利要求1的方法和按照权利要求3的计算机单元来解决根据本发明的任务。
本发明利用服务名称具有标准化的结构化的形式的事实。例如存在以具有不带空格的大写字母的所谓匈牙利标记法的服务名称(例如getAverageTemperature)。还存在设置下划线的可能性,例如get_average_temperature,等等。可能性的总数不是太多。通过服务名称的这种标准化形式能够发明虚构的服务名称。虚构的服务名称反映模糊逻辑。所述虚构的服务名称在理论上能够对应于服务的真实的名称,因为所述虚构的服务名称遵循上述的协定。但是真实的名称也可能听起来完全不同,因为服务提供商已选择了另外的标记法或另外的概念。现在将虚构的服务名称按词典编纂学(lexigraphisch)分解为子字符串。在第一确定阶段中执行字符串匹配,也即找到在子字符串方面与虚构的服务名称一致的服务名称。为了提高收获,也搜索子字符串的同义词。众所周知,虚构的服务名称仅仅是真实的服务名称的理论可能性。但是真实的服务名称将以高的概率至少含有子字符串的同义词。这些同义词可以被存放在表格或XML文件中。现在根据与这些同义词的子字符串匹配来执行另一确定阶段,这提高了总共所确定的真实的服务名称的数量。
用于找到正确的服务的一种其它的准则是语法分析。按照所搜索的服务的类型,需要转交一定数量的参数。例如提供针对确定的坐标的温度值的服务需要这些坐标作为参数。可以将不要求这些参数的所找到的真实的服务作为潜在的搜索结果排除在外。由此缩小总共所确定的服务名称的组,其中可以在搜索同义词之前或之后进行语法分析的步骤。
因此,用于确定计算机服务名称的本发明计算机单元包括输入单元、语句分析程序(Parser)(用于按词典编纂学分解可以通过输入单元输入的虚构的服务名称)、和具有同义词的文件。该文件以优选的格式是XML文件。
根据优选形式的计算机单元最后应具有语法分析器、也就是拥有用于分析所搜索的和所找到的服务的语法的设备,该设备尤其可以对服务调用的参数进行计数。
现在参照附图来详细阐述本发明,其中:
图1是本发明方法的流程图,和
图2示出了本发明计算机单元。
在图1中示出了首先在步骤10中进行虚构的服务名称的输入。这可以是上面所提及的虚构的名称getAverageTemperature(6,22),因此所述虚构的名称的任务在这里应该用来找到在6和22点之间的平均温度。
现在在步骤12中实现虚构的服务名称在词典编纂学上的分解、所谓的解析(Parsen)。在解析时,将虚构的服务名称划分成多个子字符串,这些子字符串分别代表各个字或承载含义的音节。该虚构名称在词典编纂学上的优选分解是get、Average和Temperature,其中在词典编纂学上的分解也可能得出搜索子字符串temp。在第一确定阶段中实现了存在的服务名称的彻底搜索。可以在一种网络中来识别这些名称,其中所述名称以合适的形式作为名称存在,并且可以相应地调用服务。
在第一确定阶段14中根据所谓的子字符串匹配来实现确定。这意味着,将是在词典编纂学上的分解12的结果的子字符串与存在的真正服务名称的部分、即与子字符串进行比较,并且根据一致性来找到确定的名称。在本实例中,因此也会搜寻包含子字符串“get”,“Average”和“Temperature”的名称。例如会获得get_Airpressure(时间)、get_temp(时间)、get_mid_temp(时间1,时间2)等等。在本实例中,最后的服务可能是所搜索的。但是其名称含有概念“mid”代替概念“Average”。只有当对为服务名称的典型名称组成部分提供同义词的同义词文件进行访问时,才可以确定这种概念。当前这种表格或文件必须包含:概念“mid”是“Average”的同义词。
如果在步骤16中实现对同义词的这种搜索,则在步骤18中可以跟随第二确定阶段,在所述第二确定阶段期间,实施从所确定的服务名称的组中的选择,或通过找到同义词来扩展该选择。附加地可以实现语法分析20,并且然后可以在第三确定阶段中进行其它限制。语法分析包含:从一组多个所确定的服务名称中、例如get_mid_temp(时间1,时间2)和get_mid_temp(时间1,时间3,时间5)中搜寻仅与两个变量有关的该指令。第三确定阶段22在其顺序上可以与第二确定阶段18对换,即可以在步骤16和18之前进行步骤20和22。第二和第三确定阶段分别是补充第一确定阶段14的其它的确定阶段。最终在步骤24中,输出所确定的存在的服务名称的组、或仅还剩余的子组,使得用户从现在起获得服务名称,所述服务名称按照所述准则最接近地对应于由该用户所输入的虚构的服务名称。
可以在计算机单元上执行本发明方法,所述计算机单元可以是移动终端设备,其中移动终端设备在这里称为计算机单元。当前在图2中示出了这种计算机单元26,所述计算机单元具有中央处理器单元CPU 28。还需要用于输入虚构的服务名称的输入装置30、用于在词典编纂学上分解虚构的服务名称的语句分析程序32、用于分析虚构的服务名称的和所找到的真实的服务名称的语法的语法分析器34、和具有针对名称组成部分的同义词的XML文件36。元件32和34可以是能够在CPU 28上运行的适当的软件部分,并且XML文件36必须可以由计算机单元访问。在图2中示出了网络连接38,通过所述网络连接对XML文件36进行访问。
通过本发明可以根据不清晰的输入信息来确定代表了在内容上所搜索的服务的一个或多个真实存在的服务名称。

Claims (5)

1.用于确定计算机服务名称的方法,具有以下步骤:
(a)输入(10)虚构的服务名称,
(b)将所述虚构的服务名称按词典编纂学分解(12)成子字符串,
(c)执行(14)第一确定阶段,其中根据存在的服务名称与虚构的服务名称的子字符串的字符串匹配来选择第一组服务名称,
(d)执行(16)对所述子字符串的同义词的搜索,
(e)执行(18)另一确定阶段,其中对该组服务名称根据存在的服务名称与虚构的服务名称的子字符串的同义词的字符串匹配确定其它存在的服务名称,和
(f)输出所确定的存在的服务名称。
2.按权利要求1的方法,其中根据语法分析(20)执行另一确定阶段(22),其中缩小了所确定的存在的服务名称的组。
3.用于确定计算机服务名称的计算机单元(26)、尤其是移动终端设备,具有:
-输入装置(30),
-语法分析程序(32),和
-具有常规服务名称组成部分的同义词的文件(36)、尤其是XML文件。
4.按权利要求3的计算机单元,还具有
-语法分析器(34)。
5.按权利要求3或4的计算机单元,其中可以通过网络连接、尤其是因特网来访问文件。
CNA2006800061032A 2005-02-25 2006-02-08 用于确定计算机服务名称的方法和计算机单元 Pending CN101288071A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005008803A DE102005008803A1 (de) 2005-02-25 2005-02-25 Verfahren und Computereinheit zum Ermitteln von Computer-Servicenamen
DE102005008803.1 2005-02-25

Publications (1)

Publication Number Publication Date
CN101288071A true CN101288071A (zh) 2008-10-15

Family

ID=36693119

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800061032A Pending CN101288071A (zh) 2005-02-25 2006-02-08 用于确定计算机服务名称的方法和计算机单元

Country Status (5)

Country Link
US (1) US20080147618A1 (zh)
EP (1) EP1851659A2 (zh)
CN (1) CN101288071A (zh)
DE (1) DE102005008803A1 (zh)
WO (1) WO2006089838A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699667A (zh) * 2015-02-15 2015-06-10 深圳市前海安测信息技术有限公司 改进的基于语义词典的词语相似度计算方法和装置
CN115883765A (zh) * 2021-09-26 2023-03-31 天翼爱音乐文化科技有限公司 一种进行图像共享的虚拟客服应答方法、设备和存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092517B2 (en) * 2008-09-23 2015-07-28 Microsoft Technology Licensing, Llc Generating synonyms based on query log data
US20100293179A1 (en) * 2009-05-14 2010-11-18 Microsoft Corporation Identifying synonyms of entities using web search
US8533203B2 (en) * 2009-06-04 2013-09-10 Microsoft Corporation Identifying synonyms of entities using a document collection
US9600566B2 (en) 2010-05-14 2017-03-21 Microsoft Technology Licensing, Llc Identifying entity synonyms
US8745019B2 (en) 2012-03-05 2014-06-03 Microsoft Corporation Robust discovery of entity synonyms using query logs
US10032131B2 (en) 2012-06-20 2018-07-24 Microsoft Technology Licensing, Llc Data services for enterprises leveraging search system data assets
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
US9229924B2 (en) 2012-08-24 2016-01-05 Microsoft Technology Licensing, Llc Word detection and domain dictionary recommendation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3484779B2 (ja) * 1994-10-12 2004-01-06 富士ゼロックス株式会社 名前サービス方式及び名前サービス方法
JP2001137788A (ja) * 1999-11-12 2001-05-22 Hitachi Ltd 地名表記辞書作成方法および地名表記辞書作成装置
US20020152206A1 (en) * 2001-04-12 2002-10-17 International Business Machines Corporation Synonym-enabled enhancements for matching and registering internet domain names
US20020169755A1 (en) * 2001-05-09 2002-11-14 Framroze Bomi Patel System and method for the storage, searching, and retrieval of chemical names in a relational database
JP2004280661A (ja) * 2003-03-18 2004-10-07 Fujitsu Ltd 検索方法及びプログラム
US7254579B2 (en) * 2004-03-15 2007-08-07 Microsoft Corporation Using endpoint references in a pub-sub system
US8041727B2 (en) * 2005-01-06 2011-10-18 Sabre Inc. System, method, and computer program product for finding web services using example queries

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699667A (zh) * 2015-02-15 2015-06-10 深圳市前海安测信息技术有限公司 改进的基于语义词典的词语相似度计算方法和装置
WO2016127458A1 (zh) * 2015-02-15 2016-08-18 深圳市前海安测信息技术有限公司 改进的基于语义词典的词语相似度计算方法和装置
CN115883765A (zh) * 2021-09-26 2023-03-31 天翼爱音乐文化科技有限公司 一种进行图像共享的虚拟客服应答方法、设备和存储介质

Also Published As

Publication number Publication date
WO2006089838A2 (de) 2006-08-31
US20080147618A1 (en) 2008-06-19
EP1851659A2 (de) 2007-11-07
WO2006089838A3 (de) 2007-12-06
DE102005008803A1 (de) 2006-09-07

Similar Documents

Publication Publication Date Title
CN101288071A (zh) 用于确定计算机服务名称的方法和计算机单元
US8521748B2 (en) System and method for managing metadata in a relational database
US7577641B2 (en) Computer-implemented system and method for analyzing search queries
CN112860727B (zh) 基于大数据查询引擎的数据查询方法、装置、设备及介质
JP2001067255A (ja) ラッパ文法を生成する方法
CN115016793A (zh) 基于语法树的代码生成方法和装置、电子设备、存储介质
CN112416962A (zh) 数据查询方法、装置以及存储介质
CN109542942B (zh) 函数调用的查询方法及装置、电子设备
CN1601524A (zh) 模糊查询系统及方法
KR19990070968A (ko) 인터넷 자료 검색 및 데이터베이스화 방법
CN112069305B (zh) 数据筛选方法、装置及电子设备
CN113094283A (zh) 一种数据获取方法、装置、设备及存储介质
CN117688151A (zh) 基于知识库的问答方法、装置、计算机设备及存储介质
Myllymaki et al. Robust web data extraction with xml path expressions
CN103177038A (zh) 一种垂直搜索引擎中的查询表达式
CN113806647A (zh) 识别开发框架的方法及相关设备
CN117056347A (zh) Sql语句永真式注入检测方法、装置、计算机设备及存储介质
CN111160500A (zh) 生成合同二维码的方法及装置、获取合同的方法及装置
KR102023999B1 (ko) 웹 페이지를 생성하는 방법 및 장치
CN115827487A (zh) 知识图谱构建及查询方法、装置、设备、存储介质及产品
CN113806321B (zh) 一种日志处理方法及系统
Bo et al. Towards an efficient searching approach of ros message by knowledge graph
CN114238326A (zh) 数据批量对比方法、装置、设备及存储介质
CN113239039A (zh) 动态数据的存储方法、查询方法、管理方法及管理系统
CN111695031A (zh) 基于标签的搜索方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20081015