CN111782824B - 信息查询方法、装置、系统和介质 - Google Patents

信息查询方法、装置、系统和介质 Download PDF

Info

Publication number
CN111782824B
CN111782824B CN202010822844.XA CN202010822844A CN111782824B CN 111782824 B CN111782824 B CN 111782824B CN 202010822844 A CN202010822844 A CN 202010822844A CN 111782824 B CN111782824 B CN 111782824B
Authority
CN
China
Prior art keywords
information
knowledge graph
pieces
graph
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010822844.XA
Other languages
English (en)
Other versions
CN111782824A (zh
Inventor
钱晓萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010822844.XA priority Critical patent/CN111782824B/zh
Publication of CN111782824A publication Critical patent/CN111782824A/zh
Application granted granted Critical
Publication of CN111782824B publication Critical patent/CN111782824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种信息查询方法和装置,涉及大数据领域或其他领域。信息查询方法包括:获取预构建的知识图谱,知识图谱用于以图谱形式指示多个信息和多个信息彼此之间的关联关系,多个信息属于至少两个标准文件;响应于检测到查询指令,确定知识图谱指示的多个信息中针对查询指令的目标信息,得到多个目标信息;以及以图谱形式展示多个目标信息以及多个目标信息彼此之间的关联关系。

Description

信息查询方法、装置、系统和介质
技术领域
本公开涉及信息处理技术领域,特别是涉及一种信息查询方法、装置、设备和介质。
背景技术
信息标准化是稳定企业生产经营秩序和经济效益的手段之一。但随着大数据时代的到来,各行各业在数据运用中形成了很多的信息标准。在数据运用中数据与标准能否达成一致,应用人员如何准确识别所需领域的标准信息并按照标准信息进行信息统计成为难点。
在实现本公开构思的过程中,发明人发现相关技术中至少存在以下问题:同一信息针对不同的标准文件可能具有不同的含义。为了在用户查询时,能够向用户反馈得到其所需的信息,信息标准系统通常采用模糊查询的方式进行查询匹配。因此,在响应于用户的查询指令,往往会向用户展示大量的信息,且该些信息是排列展示的,用户往往需要从该大量的信息中挑选得到所需的信息,这在一定程度上会给用户造成较大的干扰,导致信息查询效率低,信息使用效率低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的信息查询方法、装置、系统和介质。
根据本发明实施例的一个方面,提供一种信息查询方法,包括:获取预构建的知识图谱,该知识图谱用于以图谱形式指示多个信息和多个信息彼此之间的关联关系,多个信息属于至少两个标准文件;响应于检测到查询指令,确定知识图谱指示的多个信息中针对查询指令的目标信息,得到多个目标信息;以及以图谱形式展示多个目标信息以及多个目标信息彼此之间的关联关系。
可选地,确定知识图谱指示的多个信息中针对查询指令的目标信息包括:确定查询指令包括的查询关键词;对查询关键词进行语义扩展,得到与查询关键词相关联的关联关键词;以及确定多个第一信息中针对查询关键词的信息和针对关联关键词的信息,作为针对查询指令指向的目标信息。
可选地,确定查询关键词中的目标关键词;确定多个目标信息中指示目标关键词的信息,作为特定信息;以及在以图谱形式展示多个目标信息时,对特定信息添加预定标识。
可选地,上述信息查询方法还包括构建知识图谱,具体包括:获取信息集,该信息集包括至少两个标准文件中的细粒度信息和粗粒度信息;从信息集中抽取细粒度信息以及针对细粒度信息的关联关系,存入预定数据表,其中,针对细粒度信息的关联关系包括:细粒度信息在所属的标准文件中与粗粒度信息之间的关联关系;利用第一配置文件确定知识图谱中节点指示的信息的类别和节点之间的边,并存入预定数据库;利用第二配置文件,配置预定数据库与预定数据表之间的映射关系;利用第三配置文件将预定数据表中的数据载入预定数据库中;以及利用预定脚本加载预定数据库中存储的信息,得到知识图谱。
可选地,上述信息查询方法还包括在构建所述知识图谱后采用标准化规则对知识图谱中多个节点指示的信息的表述进行统一。
可选地,上述信息查询方法还包括在构建所述知识图谱后基于预定扩展规则,扩展知识图谱指示的多个信息和/或多个信息彼此之间的关联关系,得到扩展后信息;以及根据扩展后信息,扩充知识图谱。
可选地,上述信息查询方法还包括在构建所述知识图谱后:确定知识图谱中多个节点彼此之间的边指示的关联关系是否合理;在确定存在指示的关联关系不合理的边时,调整第一配置文件,以使得利用调整后第一配置文件确定的边合理。
可选地,知识图谱中的任意两个节点所指示的两个信息之间的关联关系包括以下至少之一:两个信息之间的从属关系;两个信息之间的层级关系;以及两个信息中的一个信息是另一个信息的属性信息。
可选地,上述信息查询方法还包括在构建知识图谱之后:采用预定质量模型评估知识图谱的质量,得到评估结果;以及展示评估结果。
可选地,确定知识图谱指示的多个信息中针对查询指令的目标信息包括:确定多个信息中查询指令所指向的第一信息;确定知识图谱中与第一信息具有关联关系的信息,作为第二信息;以及确定第一信息与第二信息为目标信息。
根据本发明实施例的另一方面,提供一种信息查询装置,包括:获取模块,获取预构建的知识图谱,该知识图谱用于以图谱形式指示多个信息和多个信息彼此之间的关联关系,多个信息属于至少两个标准文件;信息确定模块,响应于检测到查询指令,确定知识图谱指示的多个信息中针对查询指令的目标信息,得到多个目标信息;展示模块,以图谱形式展示多个目标信息以及多个目标信息彼此之间的关联关系。
根据本发明实施例的再一方面,提供一种计算机系统,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的信息查询方法。
根据本发明实施例的再一方面,提供一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上所述的信息查询方法。
根据本发明实施例的信息查询方法和装置,通过基于知识图谱查询信息,能够将查询得到的多个信息及多个信息之间的关联关系以图谱的形式展现,相较于相关技术可以方便用户了解查询到的信息之间的关联关系,以便更快速的找到需要的信息。
附图说明
图1示意性示出了根据本公开实施例的信息查询方法、装置、设备和介质的应用场景示意图;
图2示意性示出了根据本公开实施例的信息查询方法的流程图;
图3示意性示出了根据本公开实施例的确定多个信息中针对查询指令的目标信息的流程图;
图4示意性示出了根据本公开另一实施例的信息查询方法的流程图;
图5示意性示出了根据本公开实施例的构建知识图谱的流程图;
图6示意性示出了根据本公开实施例的信息查询装置的结构框图;以及
图7示意性示出了根据本公开实施例的适于执行信息查询方法的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种信息查询方法,包括:获取预构建的知识图谱,该知识图谱用于以图谱形式指示多个信息和多个信息彼此之间的关联关系,多个信息属于至少两个标准文件;响应于检测到查询指令,确定知识图谱指示的多个信息中针对查询指令的目标信息,得到多个目标信息;以及以图谱形式展示多个目标信息以及多个目标信息彼此之间的关联关系。
图1示意性示出了根据本公开实施例的信息查询方法、装置、设备和介质的应用场景示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104和数据库105。网络104用以在终端设备101、102、103和数据库105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路等等。
终端设备101、102、103可以为手机、平板电脑、笔记本电脑等智能终端。该终端设备上可以安装有各种客户端应用,例如信息查询类应用、网页浏览类应用、即时通信类应用等(仅为示例)。
该终端设备101、102、103可以通过网络从数据库105中获取标准文件,并通过获取的标准文件构建信息库。该信息库包括多个信息,多个信息为获取的标准文件中的指标信息。或者,信息库可以预先构建后存储于数据库105中,终端设备可以直接从数据库105中获取信息库。随后根据获取的信息库构建多个信息的知识图谱,并响应于查询指令,从知识图谱中查询得到信息后进行展示。
示例性地,如图1所示,该应用场景100例如还可以包括服务器106,该服务器106通过网络104与客户端或数据库交互。例如,服务器106可以通过从数据库获取信息库,并基于信息库构建知识图谱。如此,客户端可以直接从服务器106中获取预构建的知识图谱,以响应于查询指令从知识图谱中查询得到信息并进行展示。
需要说明的是,本公开实施例所提供的信息查询方法一般可以由终端设备101、102、103执行。相应地,本公开实施例所提供的信息查询装置一般可以设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络、数据库和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将结合图2~图5对本公开实施例所提供的信息查询方法进行详细描述。
图2示意性示出了根据本公开实施例的信息查询方法的流程图。
如图2所示,该实施例的信息查询方法包括操作S210~操作S230。
在操作S210,获取预构建的知识图谱。
根据本公开的实施例,知识图谱用于以图谱形式指示多个信息以及多个信息彼此之间的关联关系。知识图谱例如可以将多个信息彼此之间的关联关系以图谱配置文件的形式或者直接以图谱的形式进行记录。获取的知识图谱可以是根据已有的信息以及信息之间的关联关系预先构建得到的,也可以是从物理数据库,云端的数据、服务器或终端的存储器中获取到的。
根据本公开的实施例,知识图谱可以包括多个节点和连接节点的边。其中,多个节点中的每个节点用于指示一个信息,通过边连接的两个节点所指示的两个信息之间具有关联关系。
示例性地,任意两个节点之间所指示的两个信息之间的关联关系例如可以包括以下至少之一:两个信息之间的从属关系;两个信息之间的层级关系;以及两个信息中的一个信息是另一个信息的属性信息。在一具体应用场景中,每个节点指示的信息可以为标准文件中的指标信息。例如,节点指示的信息可以包括资产和存款,资产与存款之间具有从属关系,即存款属于资产中的一种。例如,节点指示的信息可以包括大堂经理和柜员,大堂经理和柜员之间具有层级关系。例如,节点指示的信息包括货币和颜色,则货币的属性包括颜色。
在操作S220,响应于检测到查询指令,确定知识图谱指示的多个信息中针对查询指令的目标信息,得到多个目标信息。
根据本公开的实施例,终端例如可以安装有信息查询类APP,在该信息查询类APP运行过程中,终端可以实时地检测对查询类APP的操作。该操作可以为用户或操作体的接触操作或者通过输入设备的操作。查询指令可以是响应于检测到对信息查询类APP中的目标控件进行的操作而产生并被检测响应的。
示例性地,信息查询类APP例如可以展示有输入框和设置于输入框附近的“查找”控件,客户端可以在检测到用户对“查找”控件的操作时,生成查询指令,并响应检测到该查询指令执行上述操作S104。
根据本公开的实施例,操作S104可以是响应于检测到查询指令,先对查询指令进行识别。示例性地,查询指令中包括通过输入框输入的查询语句。对查询指令的识别可以是对查询语句进行识别,得到查询语句中的关键词,然后确定多个信息中与关键词匹配的信息为目标信息。其中,在确定多个信息与关键词是否匹配时,例如可以采用以下参数的取值来体现:余弦相似度、皮尔逊相关系数、杰卡德相似系数等。例如,若信息与关键词的余弦相似度大于预定阈值,则确定信息与关键词匹配。其中,预定阈值可以根据实际需求进行设定,本公开对此不作限定。
根据本公开的实施例,为了保证查询结果的完整性,在确定针对查询指令的目标信息时,可以不仅确定多个信息中查询指令指向的第一信息,还确定与该第一信息具有关联关系的第二信息,并将第一信息与第二信息作为确定的目标信息。其中,多个信息中查询指令所指向的第一信息可以为与查询指令中的查询语句匹配的信息。与第一信息具有关联关系的第二信息可以为与第一信息具有直接关联关系的信息,也可以是具有间接关联关系的信息。
在操作S230,以图谱形式展示多个目标信息以及多个目标信息彼此之间的关联关系。
根据本公开的实施例,该操作S230可以是从知识图谱截取包括指示多个目标信息的节点及指示多个目标信息之间的关联关系的边的部分知识图谱,并进行展示。
根据本公开的实施例,对于信息之间的关系进行展示可以是将与针对查询指令的多条信息中的每条信息具有关联关系的所有信息都进行展示,也可以选择仅展示针对查询指令的多条信息彼此之间的关联关系。
示例性地,终端设备还可以提供选择界面,使得用户可以自行选择信息之间的关联关系的展现方法,用户可以根据实际的需求,来选择展示哪些信息之间的关联关系,以及选择展示哪一种类型的关联关系(例如属性关系、从属关系或层级关系等)。
综上可知,本公开实施例的信息查询方法能够向用户展示图谱化的信息查询结果,使得用户能够快速的获得查询到的信息之间的关联关系,或者与查询到的信息存在关联关系的信息,从而能够快速的获得需要的信息。
图3示意性示出了根据本公开实施例的确定多个信息中针对查询指令的目标信息的流程图。
如图3所示,该实施例的确定多个信息中针对查询指令的目标信息的操作S220可以包括操作S321~操作S323。
在操作S321,确定查询指令包括的查询关键词。
根据本公开的实施例,可以采用关键词提取算法(例如可以采用Text Rank算法)对查询指令中包括的检索语句进行关键词提取。或者也可以对查询指令中包括的检索语句进行分词处理,得到查询关键词。
在操作S322,对查询关键词进行语义扩展,得到与查询关键词相关联的关联关键词。
根据本公开的实施例,进行语义扩展例如可以包括从预设词库中查找得到查询关键词的同义词或含义相近的词,作为关联关键词。例如,对于关键词“资产”,通过语义扩展得到的关联关键词例如可以包括“财产”。
在操作S323,确定多个信息中针对查询关键词的信息和针对关联关键词的信息,作为针对查询指令的目标信息。
根据本公开的实施例,该操作S323可以是确定多个信息中与每个查询关键词匹配的信息,以及与每个关联关键词匹配的信息,将所有确定的信息作为针对查询指令的目标信息。
示例性地,在该实施方式中,实质上是使用关键词检索的方式来检索知识图谱,为了尽可能的使查询结果中能够包括获得用户真实需要的信息,在提取到查询指令中包括的关键词以后,使用语义扩展的方法获得新的关键词,组成关键词集,利用该关键词集中的关键词进行检索,以对信息查询的结果进行扩展。可以理解的,在这些实施方式中还可以提供选择界面,使得用户可以自行选择是否使用关键词扩展功能。
图4示意性示出了根据本公开另一实施例的信息查询方法的流程图。
如图4所示,该实施例的信息查询方法除了操作S210~操作S230外,例如还可以包括操作S440~操作S460。其中,操作S440~操作S450可以在操作S220~操作S230之间执行。操作S460可以为操作S230的一个具体实施方式。
在操作S440,确定查询关键词中的目标关键词。
在步骤S450,确定多个目标信息中指示目标关键词的信息,作为特定信息。
在操作S460,在以图谱形式展示多个目标信息时,对特定信息添加预定标识。
根据本公开的实施例,目标关键词例如可以为设定的指示预定信息的关键词。例如,可以预先设定表示实体的关键词作为目标关键词。或者,可以预先设定表示属性的关键词作为目标关键词。该实施例可以根据实际需求设定任意的、用户关注度较高的关键词作为目标关键词。该目标关键词例如也可以通过对查询指令中的检索语句进行语义识别,识别得到更能表征检索语句语义的词作为目标关键词。通过该语义识别的方式,可以进一步提高确定的目标关键词的准确性。
根据本公开的实施例,对特定信息添加预定标识例如可以包括:对以图谱形式展示的部分知识图谱中,指示特定信息的节点进行突出显示。例如,可以对该指示特定信息的节点进行高亮显示,或者放大显示指示特定信息的节点等。
示例性地,若检索语句为“XX银行的X数据处理标准”,可以自动解析到该检索语句对信息进行了两个维度的限定,一是X数据,二是XX银行,因此确定得到的目标信息可能包括多个指示X数据处理指标的信息,其中指示XX银行的X数据处理指标信息的节点将会被高亮显示,例如指示XX银行业务部X数据处理指标信息的节点、XX银行市场部X数据处理指标信息的节点等会被高亮显示。或者,在检索语句为“XX银行的X数据处理标准2010”时,则这里实际上对信息进行了3个维度的限定。当检索语句中的检索词包括了多个维度的限定的时候,以哪个维度的限定词作为目标关键词可以由本领域技术人员根据实际情况自行选择,在此不做具体的限定。实际上检索语句还可能包括同一维度的多个关键词,例如当检索语句为“X数据处理标准”的时候,实际上还可以将“X数据”和“处理标准”均设置为目标关键词。
图5示意性示出了根据本公开实施例的构建知识图谱的流程图。
根据本公开的实施例,终端设备例如可以预先构建知识图谱。因此,该实施例的信息查询方法还包括构建知识图谱的操作。如图5所示,该操作具体可以包括操作S510~操作S550。
在操作S510,获取信息集,该信息集包括至少两个标准文件中的细粒度信息和粗粒度信息。根据本公开的实施例,信息集为从数据库中获取的。信息集中例如可以包括多个粒度、多个类别的信息。每个信息为从标准文件中提取得到的指标信息。
在操作S520,从信息集中抽取细粒度信息以及针对细粒度信息的关联关系,存入预定数据表,其中,针对细粒度信息的关联关系包括:细粒度信息在所属的标准文件中与粗粒度信息之间的关联关系。
根据本公开的实施例,为了避免因同一粗粒度信息在不同标准中包括有不同的细粒度信息的情况,该实施例可以直接从信息集中抽取细粒度信息,从而可以保证信息抽取的完整性。在一实施例中,可以是从信息集中抽取已有指标信息的原子信息元素,即最细粒度的指标信息。在抽取针对信息的关联关系时,例如可以包括从信息库中抽取原子信息元素与其他指标信息之间的语义关系。
示例性地,该操作S520可以使用Pipeline方法对信息库中的指标信息进行信息及关联关系抽取。关联关系抽取可以采用常用的基于模板的方法(例如触发词的模板(Pattern),依存句法分析的(Pattern))、基于监督学习的方法(例如机器学习方法)或弱监督学习的方法(例如远程监督、Bootstrapping(自助法))等。
示例性地,抽取的信息和关联关系例如可以基于表结构储存。在一实施例中,可以使用表结构存储方式存储至CSV(Comma-Separated Values,逗号分隔值)文件中,并通过.cfg配置文件导入hive表中。其中,hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
在操作S530,利用第一配置文件确定知识图谱中节点指示的信息的类别和节点之间的边,并存入预定数据库。
示例性地,第一配置文件可以为配置有节点与节点之间关联关系的类型,节点个数的文件,通过利用该第一配置文件,可以定义知识图谱架构中节点指示的信息的类别和节点之间的边。例如,可以确定知识图谱架构中某个节点指示的信息为属性信息,该某个节点与另一个节点之间的关联关系为该某个节点指示的信息为另一个节点指示的信息的属性信息。类似地,可以确定知识图谱的架构。
示例性地,第一配置文件可以采用schema配置文件,进行点边类型的定义和点边属性的定义。该定义后的点边属性和点边类型可以存储至Hbase中。其中,Hbase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在PC Server(PC服务器)上搭建的大规模结构化存储集群。
在操作S540,利用第二配置文件,配置预定数据库与预定数据表之间的映射关系。
根据本公开的实施例,第二配置文件用于构建数据表中的表结构到数据库的映射关系,具体而言,可以使用struct配置文件,进行hive表到Hbase之间的映射关系的配置。
在操作S550,利用第三配置文件将预定数据表中的数据载入预定数据库中。
根据本公开的实施例,该第三配置文件具体可以为前述的.cfg配置文件,该配置文件配置有抽取得到的信息和关联关系在hive表中的存储位置,同时根据hive表与Hbase的映射关系,即可将hive表中的数据导入Hbase数据库中。
在操作S560,利用预定脚本加载预定数据库中存储的信息,得到知识图谱。
根据本公开的实施例,该操作S560可以是通过运行shell脚本来加载前述导入了hive表中信息的Hbase,从而执行图加载,构建得到知识图谱。其中,具体可以是通过在图数据库的调度服务器上运行shell脚本,并通过调用前述的第三配置文件(.cfg配置文件),来将hive表中的数据载入Hbase中。
在一实施例中,知识图谱的构建可以是通过将前述的三个配置文件及csv文件中存储的数据上传至hdfs(Hadoop分布式文件系统,Hadoop Distributed File System)中,通过运行shell脚本进行图加载即可得到知识图谱。其中,进行图加载时,例如可以使用Neo4j或者MongoDB图数据库方法等。其中,Neo4j是一个高性能的,NOSQL图形数据库,其是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。MangoDB是一个基于分布式文件存储的数据库。该MangoDB最大的特点是它支持的查询语言非常强大,几乎可以实现类似关系数据库单表查询的绝大部分功能,还支持对数据建立索引。通过该图加载的方式,可以使得构建的知识图谱能够用于作为检索查询信息的基础。
根据本公开的实施例,构建得到知识图谱后,还可以采用标准化规则对知识图谱中多个节点指示的信息的表述进行统一。具体即为对于节点指示的信息的表述,可以进行标准化的标识,以方便用户快速准确地获得信息所包含的内容。所进行的标准化标识使用的规则是预先设定的,具体而言,可以采用实体归一技术,通过语义网和本体工程、规则引擎、自然语言处理和机器学习等技术,结合专家经验、人工标注,形成标准化的表述。
根据本公开的实施例,构建得到知识图谱后,本公开实施例的信息查询方法还可以基于预定扩展规则,扩展所述知识图谱指示的所述多个信息和多个信息彼此之间的关联关系,得到扩展后信息。随后根据扩展后信息,扩充知识图谱。
示例性地,对于已经获得的知识图谱,可以进行知识计算,从已有的信息和关联关系出发,通过逻辑推理,在信息之间建立新的关联关系,或者获取到新的信息,获取到新的信息可以是通过逻辑推理后,获取到与知识图谱中的信息存在关联关系,但是并没有记录在知识图谱中的信息,还可以是获取到了新的关键词等等,新的信息可以从其他的数据库或互联网中获取并加入到知识图谱。通过这样的信息计算方式,能够进一步的扩展和丰富知识图谱,使得用户能够更加完整和准确的获取到需要的信息。
根据本公开的实施例,构建得到知识图谱后,本公开实施例的信息查询方法还可以确定知识图谱中的多个节点彼此之间的边指示的关联关系是否合理。在确定存在指示的关联关系不合理的边时,调整第一配置文件,以使得利用调整后的第一配置文件确定的边更为合理。
示例性地,在获取到知识图谱后,需要对其中的关联关系的逻辑进行合理性的检验,该检验可以通过算法、机器学习模型等来进行检验,还可以是结合人工审核来进行合理性的检验。当关系的逻辑不合理时,需要对第一配置文件进行调整,具体而言,需要调整第一配置文件中的点边属性、点边类型的定义等,直到图谱化信息集中的关系符合逻辑。
根据本公开的实施例,在构建得到知识图谱后,该实施例的信息查询方法例如还可以对知识图谱进行质量评估。具体地,可以采用预定质量模型来评估知识图谱的质量,得到评估结果。该评估结果例如可以评估知识图谱的完整性,边指示的关联关系的合理性等。
示例性地,质量评估例如可以包括三部分:本体需求、本体的质量模型和质量评估模型。示例性地,可以基于软件质量模型ISO/IEC25010,通过具体领域的具体应用需求,定义一组本体质量的特性和子特性,构建本体质量模型;基于本体质量模型,制定本体质量评估模型。根据需求定制属性模型并录入相应的质量证据信息,依据评估指标体系和评估准则,通过简单线性加权法(用于评估本体质量模型中的主属性和子属性的评估指标计算)和层次分析法(用于评估过程的分级结果的处理,将细化的结果进行整合得到整体结果)获得本体的各质量属性的评估结果以及本体质量的综合评估结果。
图6示意性示出了根据本公开实施例的信息查询装置的结构框图。
如图6所示,该实施例的信息查询装置600例如可以包括获取模块610、信息确定模块620和展示模块630。
获取模块610用于获取预构建的知识图谱,该知识图谱用于以图谱形式指示多个信息和多个信息彼此之间的关联关系,该多个信息属于至少两个标准文件。在一实施例中,获取模块610可以用于执行图2描述的操作S210,在此不再赘述。
信息确定模块620用于响应于检测到查询指令,确定知识图谱指示的多个信息中针对查询指令的目标信息,得到多个目标信息。在一实施例中,信息确定模块620可以用于执行图2描述的操作S220,在此不再赘述。
展示模块630用于以图谱形式展示多个目标信息以及多个目标信息彼此之间的关联关系。在一实施例中,展示模块630可以用于执行图2描述的操作S230,在此不再赘述。
根据本公开的实施例,信息确定模块620例如可以用于通过以下操作来确定目标信息:确定查询指令包括的查询关键词;对查询关键词进行语义扩展,得到与查询关键词相关联的关联关键词;以及确定多个信息中针对查询关键词的信息和针对关联关键词的信息,作为针对查询指令的目标信息。在一实施例中,信息确定模块620具体可以用于执行图3描述的操作S321~操作S323,在此不再赘述。
根据本公开的实施例,上述信息查询装置600例如还可以包括关键词确定模块,特定信息确定模块。其中,关键词确定模块用于确定查询关键词中的目标关键词。特定信息确定模块用于确定多个目标信息中指示目标关键词的信息,作为特定信息。上述展示模块630还用于在以图谱形式展示多个目标信息时,对特定信息添加预定标识。在一实施例中,关键词确定模块、特定信息确定模块和展示模块例如可以分别用于执行图4描述的操作S440~操作S460,在此不再赘述。
根据本公开的实施例,上述信息查询装置600例如还可以包括图谱构建模块,用于构建知识图谱。该图谱构建模块具体可以用于通过以下操作构建知识图谱:获取信息集,该信息集包括至少两个标准文件中的细粒度信息和粗粒度信息;从信息集中抽取细粒度信息以及针对细粒度信息的关联关系,存入预定数据表,其中,针对细粒度信息的关联关系包括:细粒度信息在所属的标准文件中与粗粒度信息之间的关联关系;利用第一配置文件确定知识图谱中节点指示的信息的类别和节点之间的边,并存入预定数据库;利用第二配置文件,配置预定数据库与预定数据表之间的映射关系;利用第三配置文件将预定数据表中的数据载入预定数据库中;以及利用预定脚本加载预定数据库中存储的信息,得到知识图谱。在一实施例中,图谱构建模块例如可以用于执行图5描述的操作S510~操作S560,在此不再赘述。
根据本公开的实施例,上述信息查询装置600例如还可以包括标准化模块,用于在图谱构建模块构建得到知识图谱后,采用标准化规则对知识图谱中多个节点指示的信息的表述进行统一。
根据本公开的实施例,上述信息查询装置600例如还可以包括扩展模块和扩充模块。扩展模块用于在图谱构建模块构建知识图谱后,基于预定扩展规则,扩展知识图谱指示的多个信息和多个信息彼此之间的关联关系,得到扩展后信息。扩充模块用于根据扩展后信息,扩充知识图谱。
根据本公开的实施例,上述信息查询装置600例如还可以包括合理性检查模块和调整模块,合理性检查模块用于在图谱构建模块构建知识图谱后,确定知识图谱中多个节点彼此之间的边指示的关联关系是否合理。调整模块用于在确定存在指示的关联关系不合理的边时,调整第一配置文件,以使得利用调整后第一配置文件确定的边合理。
根据本公开的实施例,任意两个节点所指示的两个信息之间的关联关系包括以下至少之一:两个信息之间的从属关系;两个信息之间的层级关系;以及两个信息中的一个信息是另一个信息的属性信息。
根据本公开的实施例,上述信息查询装置600例如还可以包括质量评估模块,用于在图谱构建模块构建知识图谱后,采用预定质量模型评估知识图谱的质量,得到评估结果。上述展示模块630还用于展示评估结果。
根据本公开的实施例,上述信息确定模块例如可以用于通过以下操作确定目标信息包括:确定多个信息中查询指令所指向的第一信息;确定知识图谱中与第一信息具有关联关系的信息,作为第二信息;以及确定第一信息与第二信息为目标信息。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图7示意性示出了根据本公开实施例的适于实现上文描述的信息查询方法的计算机系统的方框图。图7示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,根据本公开实施例的计算机系统700包括处理器701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器701还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 703中,存储有系统700操作所需的各种程序和数据。处理器701、ROM 702以及RAM 703通过总线704彼此相连。处理器701通过执行ROM 702和/或RAM 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM702和RAM703以外的一个或多个存储器中。处理器701也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统700还可以包括输入/输出(I/O)接口705,输入/输出(I/O)接口705也连接至总线704。系统700还可以包括连接至I/O接口705的以下部件中的一项或多项:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 702和/或RAM 703和/或ROM 702和RAM 703以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (12)

1.一种信息查询方法,包括:
获取预构建的知识图谱,所述知识图谱用于以图谱形式指示多个信息和所述多个信息彼此之间的关联关系,所述多个信息属于至少两个标准文件,其中,构建所述知识图谱,包括:获取信息集,所述信息集包括所述至少两个标准文件中的细粒度信息和粗粒度信息;从所述信息集中抽取细粒度信息以及针对所述细粒度信息的关联关系,存入预定数据表,其中,针对所述细粒度信息的关联关系包括:所述细粒度信息在所属的标准文件中与粗粒度信息之间的关联关系;利用第一配置文件确定知识图谱中节点指示的信息的类别和节点之间的边,并存入预定数据库;利用第二配置文件,配置所述预定数据库与所述预定数据表之间的映射关系;利用第三配置文件将所述预定数据表中的数据载入所述预定数据库中;以及利用预定脚本加载所述预定数据库中存储的信息,得到所述知识图谱;
响应于检测到查询指令,确定所述知识图谱指示的所述多个信息中针对查询指令的目标信息,得到多个目标信息;以及
以图谱形式展示所述多个目标信息以及所述多个目标信息彼此之间的关联关系。
2.根据权利要求1所述的方法,其中,确定所述知识图谱指示的所述多个信息中针对所述查询指令的目标信息包括:
确定所述查询指令包括的查询关键词;
对所述查询关键词进行语义扩展,得到与所述查询关键词相关联的关联关键词;以及
确定所述多个信息中针对所述查询关键词的信息和针对所述关联关键词的信息,作为针对所述查询指令的目标信息。
3.根据权利要求2所述的方法,还包括:
确定所述查询关键词中的目标关键词;
确定所述多个目标信息中指示所述目标关键词的信息,作为特定信息;以及
在以图谱形式展示所述多个目标信息时,对所述特定信息添加预定标识。
4.根据权利要求1所述的方法,还包括在构建所述知识图谱后:
采用标准化规则对所述知识图谱中多个节点指示的信息的表述进行统一。
5.根据权利要求1所述的方法,还包括在构建所述知识图谱之后:
基于预定扩展规则,扩展所述知识图谱指示的所述多个信息和所述多个信息彼此之间的关联关系,得到扩展后信息;以及
根据所述扩展后信息,扩充所述知识图谱。
6.根据权利要求1所述的方法,还包括在构建所述知识图谱后:
确定所述知识图谱中多个节点彼此之间的边指示的关联关系是否合理;
在确定存在指示的关联关系不合理的边时,调整所述第一配置文件,以使得利用调整后第一配置文件确定的边合理。
7.根据权利要求1所述的方法,其中,所述知识图谱中的任意两个节点所指示的两个信息之间的关联关系包括以下至少之一:
所述两个信息之间的从属关系;
所述两个信息之间的层级关系;以及
所述两个信息中的一个信息是另一个信息的属性信息。
8.根据权利要求1所述的方法,还包括在构建所述知识图谱之后:
采用预定质量模型评估所述知识图谱的质量,得到评估结果;以及
展示所述评估结果。
9.根据权利要求1所述的方法,其中,确定所述知识图谱指示的所述多个信息中针对所述查询指令的目标信息包括:
确定所述多个信息中所述查询指令所指向的第一信息;
确定所述知识图谱中与所述第一信息具有关联关系的信息,作为第二信息;以及
确定所述第一信息与所述第二信息为所述目标信息。
10.一种信息查询装置,包括:
获取模块,用于获取预构建的知识图谱,所述知识图谱用于以图谱形式指示多个信息和所述多个信息彼此之间的关联关系,所述多个信息属于至少两个标准文件,其中,构建所述知识图谱,包括:获取信息集,所述信息集包括所述至少两个标准文件中的细粒度信息和粗粒度信息;从所述信息集中抽取细粒度信息以及针对所述细粒度信息的关联关系,存入预定数据表,其中,针对所述细粒度信息的关联关系包括:所述细粒度信息在所属的标准文件中与粗粒度信息之间的关联关系;利用第一配置文件确定知识图谱中节点指示的信息的类别和节点之间的边,并存入预定数据库;利用第二配置文件,配置所述预定数据库与所述预定数据表之间的映射关系;利用第三配置文件将所述预定数据表中的数据载入所述预定数据库中;以及利用预定脚本加载所述预定数据库中存储的信息,得到所述知识图谱;
信息确定模块,用于响应于检测到查询指令,确定所述知识图谱指示的所述多个信息中针对所述查询指令的目标信息,得到多个目标信息;
展示模块,用于以图谱形式展示所述多个目标信息以及所述多个目标信息彼此之间的关联关系。
11.一种计算机系统,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~9中任一项所述的方法。
CN202010822844.XA 2020-08-14 2020-08-14 信息查询方法、装置、系统和介质 Active CN111782824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010822844.XA CN111782824B (zh) 2020-08-14 2020-08-14 信息查询方法、装置、系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010822844.XA CN111782824B (zh) 2020-08-14 2020-08-14 信息查询方法、装置、系统和介质

Publications (2)

Publication Number Publication Date
CN111782824A CN111782824A (zh) 2020-10-16
CN111782824B true CN111782824B (zh) 2024-04-19

Family

ID=72762996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010822844.XA Active CN111782824B (zh) 2020-08-14 2020-08-14 信息查询方法、装置、系统和介质

Country Status (1)

Country Link
CN (1) CN111782824B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417004A (zh) * 2020-11-23 2021-02-26 中国建设银行股份有限公司 一种实体关系图谱构建的方法和装置
CN112905858A (zh) * 2021-03-05 2021-06-04 北京中经惠众科技有限公司 节点关系图谱显示方法及装置、计算机设备和存储介质
CN112989029A (zh) * 2021-03-09 2021-06-18 上海魔橙网络科技有限公司 知识图谱可视化快速检索实现方法、系统、装置及介质
CN113434506B (zh) * 2021-06-29 2023-05-16 平安科技(深圳)有限公司 数据管理及检索方法、装置、计算机设备及可读存储介质
CN115168605A (zh) * 2022-06-28 2022-10-11 青岛海尔科技有限公司 图谱的确定方法和装置、存储介质及电子装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829858A (zh) * 2018-06-22 2018-11-16 北京京东金融科技控股有限公司 数据查询方法、装置及计算机可读存储介质
CN109885698A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种知识图谱构建方法及装置、电子设备
CN110147436A (zh) * 2019-03-18 2019-08-20 清华大学 一种基于教育知识图谱与文本的混合自动问答方法
CN111061750A (zh) * 2019-12-17 2020-04-24 Oppo广东移动通信有限公司 一种查询处理方法、装置及计算机可读存储介质
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829858A (zh) * 2018-06-22 2018-11-16 北京京东金融科技控股有限公司 数据查询方法、装置及计算机可读存储介质
CN109885698A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种知识图谱构建方法及装置、电子设备
CN110147436A (zh) * 2019-03-18 2019-08-20 清华大学 一种基于教育知识图谱与文本的混合自动问答方法
CN111061750A (zh) * 2019-12-17 2020-04-24 Oppo广东移动通信有限公司 一种查询处理方法、装置及计算机可读存储介质
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置

Also Published As

Publication number Publication date
CN111782824A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN111782824B (zh) 信息查询方法、装置、系统和介质
US10347019B2 (en) Intelligent data munging
US11734233B2 (en) Method for classifying an unmanaged dataset
EP3475887B1 (en) System and method for dynamic lineage tracking, reconstruction, and lifecycle management
US11055350B2 (en) Method and system for abstracting information for use in link analysis
CN111061859B (zh) 基于知识图谱的数据处理方法、装置和计算机设备
US9535902B1 (en) Systems and methods for entity resolution using attributes from structured and unstructured data
US9911082B2 (en) Question classification and feature mapping in a deep question answering system
US10956469B2 (en) System and method for metadata correlation using natural language processing
WO2012129149A2 (en) Aggregating search results based on associating data instances with knowledge base entities
US11449477B2 (en) Systems and methods for context-independent database search paths
CN111078776A (zh) 数据表的标准化方法、装置、设备及存储介质
US20210042589A1 (en) System and method for content-based data visualization using a universal knowledge graph
Rahnama Distributed real-time sentiment analysis for big data social streams
CN111553556A (zh) 业务数据分析方法、装置、计算机设备及存储介质
CN116955856A (zh) 信息展示方法、装置、电子设备以及存储介质
CA3051919C (en) Machine learning (ml) based expansion of a data set
US10990881B1 (en) Predictive analytics using sentence data model
US20130024761A1 (en) Semantic tagging of user-generated content
US11874868B2 (en) Generating and presenting multi-dimensional representations for complex entities
Wang et al. Duplicate Detection of Crowdsourced Testing Reports
CN116578885A (zh) 数据处理方法、装置及电子设备
CN114297228A (zh) Es服务器查询方法、装置和计算机可读存储介质
CN116910229A (zh) 针对指标的智能查询方法和装置
CN113378203A (zh) 数据展示处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant