CN106815220A - 数据分类及搜寻方法 - Google Patents

数据分类及搜寻方法 Download PDF

Info

Publication number
CN106815220A
CN106815220A CN201510846742.0A CN201510846742A CN106815220A CN 106815220 A CN106815220 A CN 106815220A CN 201510846742 A CN201510846742 A CN 201510846742A CN 106815220 A CN106815220 A CN 106815220A
Authority
CN
China
Prior art keywords
those
classification
data
record
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510846742.0A
Other languages
English (en)
Inventor
陈志伟
卢晓芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Pudong Technology Corp
Inventec Corp
Original Assignee
Inventec Pudong Technology Corp
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Pudong Technology Corp, Inventec Corp filed Critical Inventec Pudong Technology Corp
Priority to CN201510846742.0A priority Critical patent/CN106815220A/zh
Priority to US15/086,037 priority patent/US10311067B2/en
Publication of CN106815220A publication Critical patent/CN106815220A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种数据分类及搜寻方法,其包含:根据纪录的原因字段或注记字段的数据以对纪录进行分类标记;根据纪录的概要字段的数据以产生索引;根据纪录的概要字段的数据的类别以对纪录进行权重标记;根据关键词由索引搜寻出对应纪录;以及根据对应纪录的权重,以由对应纪录中选出相关纪录,并列出相关纪录的分类。

Description

数据分类及搜寻方法
技术领域
本案有关于一种分类及搜寻方法,尤指一种错误纪录的数据分类及搜寻方法。
背景技术
在电子装置的测试领域中,测试部门会将电子装置于测试过程中产生的错误纪录于一数据库。当使用者欲查询某一错误状况时,可利用上述数据库中设计的字段,以进行错误状况的查询、浏览错误列表或产出报表。
然而,当用户输入关键词以进行错误状况的查询时,数据库系统仅会通过存储顺序进行搜寻,而找出具有用户输入的关键词的对应错误纪录。藉由上述方式找出的错误纪录的错误纪录列表,仅以错误记录在数据库中的存储顺序为依据,因此,上述错误纪录列表所记载的错误纪录往往不是用户最关注的错误纪录。
此外,数据库中存储的错误纪录均为文字描述,由于每位使用者的用字习惯不一定相同,导致数据库内的错误纪录有所差异,如此,亦会导致错误纪录列表内的错误纪录并非用户最关注的错误纪录。
由此可见,上述现有的方式,显然仍存在不便与缺陷,而有待改进。为了解决上述问题,相关领域莫不费尽心思来谋求解决的道,但长久以来仍未发展出适当的解决方案。
发明内容
发明内容旨在提供本揭示内容的简化摘要,以使阅读者对本揭示内容具备基本的理解。此发明内容并非本揭示内容的完整概述,且其用意并非在指出本案实施例的重要/关键组件或界定本案的范围。
本案内容的一目的是在提供一种数据分类及搜寻方法,藉以改善先前技术的问题。
为达上述目的,本案内容的一技术态样关于一种数据分类及搜寻方法,此数据分类及搜寻方法包含:根据多个纪录的原因字段或注记字段所包含的数据,以对该些纪录进行分类标记;根据该些纪录的概要字段所包含的数据,以产生索引;根据该些纪录的概要字段所包含的数据的类别,以对该些纪录进行权重标记;根据关键词由索引搜寻该些纪录中的多个对应纪录;以及根据该些对应纪录的权重,以由该些对应纪录中选出多个相关纪录,并列出该些相关纪录的分类。
因此,根据本案的技术内容,本案实施例提供一种数据分类及搜寻方法,藉以改善搜寻方式仅以数据库中的存储顺序为依据且用户的用字习惯有所差异,而导致搜寻到的错误纪录并非用户最关注的错误纪录的问题。
在参阅下文实施方式后,本案所属技术领域中具有通常知识者当可轻易了解本案的基本精神及其他发明目的,以及本案所采用的技术手段与实施态样。
附图说明
为让本案的上述和其他目的、特征、优点与实施例能更明显易懂,所附图式的说明如下:
图1依照本案一实施方式绘示一种数据分类及搜寻方法的流程图。
图2依照本案另一实施例绘示一种错误纪录的示意图。
图3依照本案再一实施例绘示一种错误纪录列表及错误分类标记的示意图。
图4依照本案又一实施例绘示一种错误纪录列表及错误分类百分比的示意图。
根据惯常的作业方式,图中各种特征与组件并未依比例绘制,其绘制方式是为了以最佳的方式呈现与本案相关的具体特征与组件。此外,在不同图式间,以相同或相似的组件符号来指称相似的组件/部件。
组件标号说明:
100:方法
110~160:步骤
210:错误纪录
310:错误纪录列表
320:分类
410:错误纪录列表
420:分类
430:错误分类百分比列表
具体实施方式
为了使本揭示内容的叙述更加详尽与完备,下文针对了本案的实施态样与具体实施例提出了说明性的描述;但这并非实施或运用本案具体实施例的唯一形式。实施方式中涵盖了多个具体实施例的特征以及用以建构与操作这些具体实施例的方法步骤与其顺序。然而,亦可利用其他具体实施例来达成相同或均等的功能与步骤顺序。
除非本说明书另有定义,此处所用的科学与技术词汇的含义与本案所属技术领域中具有通常知识者所理解与惯用的意义相同。此外,在不和上下文冲突的情形下,本说明书所用的单数名词涵盖该名词的复数型;而所用的复数名词时亦涵盖该名词的单数型。
为改善用户输入关键词以进行错误状况的查询时,搜寻到的错误纪录列表内的错误纪录往往不是用户最关注的错误纪录的问题,本案提出一种数据分类及搜寻方法,此方法可将以往测试过程中产生的所有错误纪录进行完整的分类,并制作索引,供用户通过索引而快速搜寻到相关错误纪录。另外,此方法更可赋予错误纪录相应的权重,因此,用户搜寻到的错误纪录列表可依照上述权重进行排列,利于使用者找到最关注的错误纪录,详细说明如后。
图1依照本案一实施方式绘示一种数据分类及搜寻方法的流程图。如图所示,数据分类及搜寻方法100包含以下步骤:
步骤110:根据多个纪录的原因字段或注记字段所包含的数据,以对该些纪录进行分类标记;
步骤120:根据该些纪录的概要字段所包含的数据,以产生索引;
步骤130:根据该些纪录的概要字段所包含的数据的类别,以对该些纪录进行权重标记;
步骤140:根据关键词由该索引搜寻该些纪录中的多个对应纪录;
步骤150:根据该些对应纪录的权重,以由该些对应纪录中选出多个相关纪录,并列出该些相关纪录的分类;以及
步骤160:统计该些相关纪录的分类,以列出该些相关纪录的各种分类的百分比。
为使步骤110的操作方式易于理解,请一并参阅图1及图2。图2依照本案另一实施例绘示一种错误纪录的示意图,此错误纪录210是测试部门对电子装置进行测试时,电子装置的错误状况的纪录表,此错误纪录210包含多个字段,分别纪录错误状况的各种细节,诸如概要字段(Synopsis)、操作细节字段(Detail Description)、注记字段(Comments/Answer)、原因字段(Root Cause)等。本案的数据分类及搜寻方法100会根据上述错误纪录210的字段记载的数据,以对所有过往测试过程中产生的错误纪录进行分类。
请参阅步骤110,本案的方法可根据多个错误纪录的原因字段或注记字段记载的数据,以对这些纪录进行分类标记。举例而言,本案的方法可判断这些纪录的每一者的原因字段是否有记载数据,若原因字段有记载数据,则根据此数据由对照表(mapping table)中取得对应分类,并标记此分类于错误纪录上。例如原因字段记载BIOS(Basic Input/Output System)、ROM(Read-Only Memory)、ACPI(Advanced Configuration and Power Interface)、SMBIOS(SystemManagement BIOS)等,则根据对照表将上述数据分类为BIOS Error,另外,原因字段记载iLO(Integrated Ligths-out)、Server Mgmt(Sever Management)、BMC(Baseboard ManagementController)等,则根据对照表将上述数据分类为Mgmt Firmware error,并将上述分类标记于错误纪录上。
反之,若原因字段未记载数据,则根据注记字段记载的数据由对照表中取得对应分类,并标记分类于错误纪录上。举例而言,本案的方法可统计注记字段记载的多个注记,以取得这些注记中数量最多的相关注记,例如注记字段一直出现ROM注记,则ROM即为相关注记。本案的方法根据相关注记ROM由对照表中取得对应分类BIOS error,并标记分类BIOS error于错误纪录上。
此外,若无法由注记字段取得相关注记,例如注记字段包含太多注记,且这些注记间的出现次数又太接近,例如注记字段包含ROM、BIOS、ACPI、Server Mgmt、BMC,且ROM、BIOS、ACPI、Server Mgmt、BMC皆出现3次,则将错误纪录标记为未知(Unknown error),并产生一警告。当使用者收到警告时,即可采取相关措施以改善错误纪录,例如此错误的注记太多,表示可能导致电子装置错误的原因较多,此时可以聚集各类测试部门,一同商讨如何解决上述错误。
请参阅步骤120,本案的方法可根据多个错误纪录的概要字段记载的数据,以产生索引。举例而言,本案的方法可对所有错误纪录的概要字段利用一索引工具将所有概要字段记载的关键词作成索引,以利查询时能快速反查某一关键词曾出现在哪些错误纪录的概要字段中。
请参阅步骤130,本案的方法可根据多个错误纪录的概要字段记载的数据的类别,以对这些错误纪录进行权重标记。举例而言,本案的方法可利用大数据文字处理方式,将系统中所有错误纪录,先对错误纪录的概要字段记载的关键词做预先处理,依据概要字段出现过的所有关键词进行分析,去除与错误分析无关的字词(例如a,an,the,when,system等字词),并将概要字段记载的关键词进行类别标记,并根据概要字段记载的关键词的类别,以取得并标记对应权重于错误纪录上,以利将来在查询比对时可依照每条错误纪录的概要字段,与欲查询的概要字段作一相似度比对,利于找出最相似的错误纪录。在另一实施例中,可采用TF-IDF(termfrequency–inverse document frequency)技术来对错误纪录的概要字段出现过的所有关键词进行分析,以取得各个关键词的权重,以标记对应权重于错误纪录上。
举例而言,于概要字段中所描述者,不外乎是被测组件、测试动作、错误现象等,因此,本案的方法可分析概要字段记载的关键词,以将错误纪录归类为被测组件类别、测试动作类别或错误现象类别。依照概要字段的类别归类方式,可以将CPU、Memory、Windows、Linux、VMWare等字词归类为被测组件类别,将Stress、install、test、diag等归类为测试动作类别,将power cycle、hang、blue screen、reboot、yellow bang等归类为错误现象类别。
再者,本案的方法可对被测组件类别、测试动作类别及错误现象类别进行编码。例如将概要字段记载的关键词用一个位(bit)来编码。如上述实施例所示,被测组件类别有五种组件,测试动作类别有四种动作,错误现象类别有五种错误现象,因此,每一条错误纪录的概要字段记载的关键词可用14位进行编码,如可编码为「00100:1000:01100」。此外,本案的方法可根据概要字段记载的数据的类别,以标记上述编码于错误纪录上。
再者,由于概要字段记载的关键词可用14位进行编码,因此,可形成14维的空间向量。本案的方法可根据错误纪录的编码以计算出第一向量,并根据概要字段记载的关键词的类别,以标记第一向量于错误纪录上。再者,本案的方法可分析用户输入的关键词,以将关键词归类为被测组件类别、测试动作类别或错误现象类别,并根据关键词的类别,以标记编码于关键词上,其次,根据关键词的编码以计算第二向量,随后,计算错误纪录的第一向量与关键词的第二向量的向量距离,接着,根据向量距离以选出相关错误纪录,并列出相关错误纪录的分类。需说明的是,向量距离的距离越小代表两向量越相似,因此,可利用此方式来找出最相似的错误纪录。
在另一实施例中,可采用余弦相似性(Cosine Similarity)来计算错误纪录的第一向量与关键词的第二向量的相似程度。举例而言,若第一向量为[x1,y1],第二向量为[x2,y2],则余弦相似性的计算公式如下:
…公式1
此外,余弦相似性亦可适用于n维向量,举例而言,若第一向量与第二向量皆为n维向量,第一向量为[A1,A2,…,An],第二向量为[B1,B2,…,Bn],则余弦相似性的计算公式如下:
…公式2
需说明的是,于公式1、2中,若计算出的余弦值越接近1,表示两向量的夹角越接近0度,亦即两向量的相似程度越高。如上所述,概要字段记载的关键词可用14位进行编码,而形成14维的空间向量,错误纪录的第一向量与关键词的第二向量可采用上述公式2来进行计算。根据计算出的余弦值即可了解两向量的相似程度,接着,根据相似程度以选出相关错误纪录,并列出相关错误纪录的分类,因此,可利用此方式来找出最相似的错误纪录。
请参阅步骤140,当用户输入关键词以进行错误状况的查询时,本案的方法可根据上述关键词,以步骤120所制作的索引来搜寻多个纪录中的多个对应纪录,换言之,可由所有错误纪录中,找出与关键词对应的错误纪录。
为使步骤150的操作方式易于理解,请一并参阅图1及图3。图3依照本案再一实施例绘示一种错误纪录列表及错误分类标记的示意图。于步骤150中,本案的方法可根据多个对应纪录的权重,以由这些对应纪录中选出多个相关纪录。需说明的是,与关键词对应的错误纪录可能笔数非常多,因此,本案的方法更依据权重进行筛选,以选出最接近的相关纪录,例如由1000笔对应错误纪录中,筛选出最接近的100笔相关纪录。
如图3所示,错误纪录列表310纪录了步骤150所搜寻到的多个相关错误纪录。此外,本案的方法可列出这些相关错误纪录的分类320。举例而言,错误纪录列表310中编号278039的错误纪录的分类320为BIOS,错误纪录列表310中编号278070的错误纪录的分类320为iLO,以此方式列出所有错误纪录对应的分类320。由于本案的方法可赋予错误纪录相应的权重,因此,用户搜寻到的错误纪录列表310可依照上述权重进行排列,利于使用者找到最关注的错误纪录,并可得知错误纪录的对应分类320,以让使用者针对错误有效除错。
为使步骤160的操作方式易于理解,请一并参阅图1及图4。图4依照本案又一实施例绘示一种错误纪录列表及错误分类百分比的示意图,图4的错误纪录列表410及分类420类似于图3的错误纪录列表310及分类320。请参阅步骤160,本案的方法可统计多个相关纪录的分类,以列出如图4所示的相关纪录的各种分类420的百分比。如图4的错误分类百分比列表430所示,BIOS的百分比为75%、iLo的百分比为12%、Driver的百分比为10%而HW的百分比为3%,由上述百分比的高低可知,造成此错误的相关原因中,最有可能的原因为BIOS,因此,使用者可根据错误分类百分比列表430,以得知最有可能造成上述错误的原因,以让使用者针对错误有效除错。
如上所述的数据分类及搜寻方法皆可由软件、硬件与/或轫体来执行。举例来说,若以执行速度及精确性为首要考虑,则基本上可选用硬件与/或轫体为主;若以设计弹性为首要考虑,则基本上可选用软件为主;或者,可同时采用软件、硬件及轫体协同作业。应了解到,以上所举的这些例子并没有所谓孰优孰劣的分,亦并非用以限制本发明,熟习此项技艺者当视当时需要弹性设计的。
所属技术领域中具有通常知识者当可明白,数据分类及搜寻方法中的各步骤依其执行的功能予以命名,仅是为了让本案的技术更加明显易懂,并非用以限定该等步骤。将各步骤予以整合成同一步骤或分拆成多个步骤,或者将任一步骤更换到另一步骤中执行,皆仍属于本揭示内容的实施方式。
由上述本案实施方式可知,应用本案具有下列优点。本案实施例提供一种数据分类及搜寻方法,藉以改善搜寻方式仅以数据库中的存储顺序为依据且用户的用字习惯有所差异,而导致搜寻到的错误纪录并非用户最关注的错误纪录的问题。
虽然上文实施方式中揭露了本案的具体实施例,然其并非用以限定本案,本案所属技术领域中具有通常知识者,在不悖离本案的原理与精神的情形下,当可对其进行各种更动与修饰,因此本案的保护范围当以附随权利要求书所界定者为准。

Claims (10)

1.一种数据分类及搜寻方法,其特征为,该数据分类及搜寻方法包含:
根据多个纪录的原因字段或注记字段所包含的数据,以对该些纪录进行分类标记;
根据该些纪录的概要字段所包含的数据,以产生一索引;
根据该些纪录的概要字段所包含的数据的类别,以对该些纪录进行权重标记;
根据一关键词由该索引搜寻该些纪录中的多个对应纪录;以及
根据该些对应纪录的权重,以由该些对应纪录中选出多个相关纪录,并列出该些相关纪录的分类。
2.如权利要求1所述的数据分类及搜寻方法,其特征为,还包含:
统计该些相关纪录的分类,以列出该些相关纪录的各种分类的百分比。
3.如权利要求1所述的数据分类及搜寻方法,其特征为,对该些纪录进行分类标记包含:
判断该些纪录的每一者的该原因字段是否包含一第一数据;
若该原因字段包含该第一数据,则根据该第一数据由一对照表中取得对应分类,并标记该分类于该纪录上;
若该原因字段未包含该第一数据,则根据该注记字段包含的一第二数据由该对照表中取得对应分类,并标记该分类于该纪录上。
4.如权利要求3所述的数据分类及搜寻方法,其特征为,根据该注记字段包含的该第二数据由该对照表中取得对应分类,并标记该分类于该纪录上包含:
统计该第二数据包含的多个注记,以取得该些注记中数量最多的相关注记;以及
根据该相关注记由该对照表中取得对应分类,并标记该分类于该纪录上。
5.如权利要求4所述的数据分类及搜寻方法,其特征为,统计该第二数据包含的多个注记,以取得该些注记中数量最多的相关注记包含:
若无法取得该些注记中数量最多的相关注记,则将该纪录标记为未知,并产生一警告。
6.如权利要求1所述的数据分类及搜寻方法,其特征为,对该些纪录进行权重标记包含:
对该些概要字段所包含的数据进行类别标记;以及
根据该些概要字段所包含的数据的类别,以取得并标记对应权重于该些纪录上。
7.如权利要求6所述的数据分类及搜寻方法,其特征为,对该些纪录的概要字段所包含的数据进行类别标记包含:
分析该些概要字段所包含的数据,以将该些纪录归类为被测组件类别、测试动作类别或错误现象类别。
8.如权利要求7所述的数据分类及搜寻方法,其特征为,根据该些概要字段所包含的数据的类别,以取得并标记对应权重于该些纪录上包含:
对该被测组件类别、该测试动作类别及该错误现象类别进行编码;以及
根据该些概要字段所包含的数据的类别,以标记该编码于该些纪录上。
9.如权利要求8所述的数据分类及搜寻方法,其特征为,根据该些概要字段所包含的数据的类别,以标记该编码于该些纪录上包含:
根据该些纪录的该编码以计算一第一向量;以及
根据该些概要字段所包含的数据的类别,以标记该第一向量于该些纪录上。
10.如权利要求9所述的数据分类及搜寻方法,其特征为,根据该些对应纪录的权重,以由该些对应纪录中选出该些相关纪录包含:
分析该关键词,以将该关键词归类为该被测组件类别、该测试动作类别或该错误现象类别;
根据该关键词的类别,以标记该编码于该关键词上;
根据该关键词的该编码以计算一第二向量;
计算该第一向量与该第二向量的一向量距离;以及
根据该向量距离,以由该些对应纪录中选出该些相关纪录,并列出该些相关纪录的分类。
CN201510846742.0A 2015-11-27 2015-11-27 数据分类及搜寻方法 Pending CN106815220A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510846742.0A CN106815220A (zh) 2015-11-27 2015-11-27 数据分类及搜寻方法
US15/086,037 US10311067B2 (en) 2015-11-27 2016-03-30 Device and method for classifying and searching data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510846742.0A CN106815220A (zh) 2015-11-27 2015-11-27 数据分类及搜寻方法

Publications (1)

Publication Number Publication Date
CN106815220A true CN106815220A (zh) 2017-06-09

Family

ID=58777667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510846742.0A Pending CN106815220A (zh) 2015-11-27 2015-11-27 数据分类及搜寻方法

Country Status (2)

Country Link
US (1) US10311067B2 (zh)
CN (1) CN106815220A (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10600002B2 (en) * 2016-08-04 2020-03-24 Loom Systems LTD. Machine learning techniques for providing enriched root causes based on machine-generated data
US11416325B2 (en) 2012-03-13 2022-08-16 Servicenow, Inc. Machine-learning and deep-learning techniques for predictive ticketing in information technology systems
US10740692B2 (en) * 2017-10-17 2020-08-11 Servicenow, Inc. Machine-learning and deep-learning techniques for predictive ticketing in information technology systems
US10963634B2 (en) 2016-08-04 2021-03-30 Servicenow, Inc. Cross-platform classification of machine-generated textual data
US10789119B2 (en) 2016-08-04 2020-09-29 Servicenow, Inc. Determining root-cause of failures based on machine-generated textual data
US10817709B2 (en) * 2017-03-10 2020-10-27 Hitachi Kokusai Electric Inc. Similar image search system
CN113448935B (zh) * 2020-03-24 2024-04-26 伊姆西Ip控股有限责任公司 用于提供日志信息的方法、电子设备和计算机程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504654A (zh) * 2009-03-17 2009-08-12 东南大学 一种实现数据库模式自动匹配的方法
CN102317943A (zh) * 2011-07-29 2012-01-11 华为技术有限公司 一种全文搜索的方法和装置
CN103310014A (zh) * 2013-07-02 2013-09-18 北京航空航天大学 一种提高检索结果准确率的方法
CN103365914A (zh) * 2012-04-10 2013-10-23 北京易盟天地信息技术有限公司 基于搜索引擎的数据库查询系统和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10475116B2 (en) * 2003-06-03 2019-11-12 Ebay Inc. Method to identify a suggested location for storing a data entry in a database
US20130212089A1 (en) * 2012-02-10 2013-08-15 Google Inc. Search Result Categorization
US9317829B2 (en) * 2012-11-08 2016-04-19 International Business Machines Corporation Diagnosing incidents for information technology service management

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504654A (zh) * 2009-03-17 2009-08-12 东南大学 一种实现数据库模式自动匹配的方法
CN102317943A (zh) * 2011-07-29 2012-01-11 华为技术有限公司 一种全文搜索的方法和装置
CN103365914A (zh) * 2012-04-10 2013-10-23 北京易盟天地信息技术有限公司 基于搜索引擎的数据库查询系统和方法
CN103310014A (zh) * 2013-07-02 2013-09-18 北京航空航天大学 一种提高检索结果准确率的方法

Also Published As

Publication number Publication date
US20170154046A1 (en) 2017-06-01
US10311067B2 (en) 2019-06-04

Similar Documents

Publication Publication Date Title
CN106815220A (zh) 数据分类及搜寻方法
Ilyas et al. Data cleaning
US7711736B2 (en) Detection of attributes in unstructured data
US10949450B2 (en) Mtransaction processing improvements
CN110569328B (zh) 实体链接方法、电子装置及计算机设备
US8412653B2 (en) Knowledge extraction and transformation
Koehler et al. Data context informed data wrangling
RU2008145584A (ru) Аннотация посредством поиска
US20150286713A1 (en) System and method for fuzzy ontology matching and search across ontologies
Feng et al. Practical duplicate bug reports detection in a large web-based development community
Zhu et al. Matching heterogeneous events with patterns
Koehler et al. Incorporating data context to cost-effectively automate end-to-end data wrangling
CN113326187A (zh) 数据驱动的内存泄漏智能化检测方法及系统
Ko et al. Natural language processing–driven model to extract contract change reasons and altered work items for advanced retrieval of change orders
Chen et al. Definition, approaches, and analysis of code duplication detection (2006–2020): a critical review
Chen et al. CGAP-align: a high performance DNA short read alignment tool
TWI573031B (zh) 資料分類及搜尋方法
Chern et al. Automatically detecting errors in employer industry classification using job postings
US20210103593A1 (en) Model validation for query intent
Wilcox et al. A New Semantic Similarity Scheme for more Accurate Identification in Medical Data
Paganelli et al. Evaluating the integration of datasets
Gabor-Toth et al. Linking Deutsche Bundesbank Company Data
Li et al. Approximate address matching
Chuang et al. Integrating web query results: holistic schema matching
Kokhov Two approaches to determining similarity of two digraphs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170609