CN112579642A - 数据处理方法、装置、存储介质及电子设备 - Google Patents

数据处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN112579642A
CN112579642A CN201910945241.6A CN201910945241A CN112579642A CN 112579642 A CN112579642 A CN 112579642A CN 201910945241 A CN201910945241 A CN 201910945241A CN 112579642 A CN112579642 A CN 112579642A
Authority
CN
China
Prior art keywords
data
task
question
knowledge base
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910945241.6A
Other languages
English (en)
Inventor
葛婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201910945241.6A priority Critical patent/CN112579642A/zh
Priority to PCT/CN2020/103211 priority patent/WO2021063087A1/zh
Publication of CN112579642A publication Critical patent/CN112579642A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Agronomy & Crop Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据处理方法、装置、存储介质及电子设备,包括:获取问题数据;对所述问题数据进行分解;基于分解后的结果,判断所述问题数据是否包含问题任务;若问题数据不包含问题任务,直接在知识库中检索与所述问题数据对应的基础数据并返回;若问题数据包含问题任务,根据问题任务的内容,对知识库中与问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。所述数据处理方法、装置、存储介质及电子设备,不仅能够根据问题数据自动搜索对应的答案,还能在问题数据中包括问题任务时,自动对搜索到的基础数据进行对应的任务处理,从而能够更好地服务于用户,节省用户手动处理任务的时间,极大的提升了用户的使用体验。

Description

数据处理方法、装置、存储介质及电子设备
技术领域
本发明涉及数据处理技术,更具体的说,是涉及一种数据处理方法、装置、存储介质及电子设备。
背景技术
油气领域是工业领域中一个重要的子领域,如何对已发现油田进行更加高效和高质量的开采,是本领域技术人员始终致力于的目标之一。
在油田开采过程中,生产持续时间长,涉及的地理条件、生产设备复杂,因此会产生大量发地质资料和生产数据;这些数据对后续油田生产具有重要的指导意义。因此,如何更好的利用已积累的油气领域知识服务于后续的油田生产工作,对于油气领域具有重要意义。
发明内容
有鉴于此,本发明提供了一种,以克服现有技术中由于的问题。
为实现上述目的,本发明提供如下技术方案:
一种数据处理方法,包括:
获取问题数据;
对所述问题数据进行分解;
基于分解后的结果,判断所述问题数据是否包含问题任务;
若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
可选的,在判断所述问题数据是否包含问题任务之前,所述方法进一步包括:
判断分解后的问题数据中是否包含主题词;
若不包含主题词,确定所述问题数据为词条检索,并停止执行判断所述问题数据是否包含问题任务的步骤;
若包含主题词,确定需要执行判断所述问题数据是否包含问题任务的步骤。
可选的,在所述问题数据为词条检索的情况下,则所述直接在所述知识库中检索与所述问题数据对应的基础数据并返回,包括:
直接在所述知识库的词条中检索与所述问题数据对应的基础数据并返回。
可选的,在所述问题数据包含主题词、而不包含问题任务的情况下,所述方法进一步包括:
从所述分解后的问题数据中确定出主题词;
在所述主题词对应的主题范围内查询与所述问题数据对应的属性和关系。
可选的,在判断分解后的问题数据中是否包含主题词的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,包括:
从所述分解后的问题数据中确定出主题词;
在所述主题词对应的主题范围内查询与所述问题数据对应的基础数据,并通过识别所述问题任务的内容来确定需要执行的任务处理;
对所述基础数据进行确定的所述任务处理。
可选的,所述任务处理包括以下至少之一:组合、推理、计算。
可选的,在对所述知识库中与所述问题任务对应的基础数据进行的任务处理为计算的情况下,根据所述预设的计算公式完成计算,其中,所述预设公式为通过历史知识积累和专家总结方式收集录入到知识库中的计算公式。
一种数据处理装置,包括:
问题获取模块,用于获取问题数据;
问题分解模块,用于对所述问题数据进行分解;
任务判断模块,用于基于分解后的结果,判断所述问题数据是否包含问题任务;
第一处理模块,用于在所述问题数据不包含问题任务的情况下,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
第二处理模块,用于在所述问题数据包含问题任务的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一种所述的数据处理方法。
一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述可执行指令包括:
获取问题数据;
对所述问题数据进行分解;
基于分解后的结果,判断所述问题数据是否包含问题任务;
若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
经由上述的技术方案可知,与现有技术相比,本发明实施例公开了一种数据处理方法、装置、存储介质及电子设备,包括:获取问题数据;对所述问题数据进行分解;基于分解后的结果,判断所述问题数据是否包含问题任务;若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。所述数据处理方法、装置、存储介质及电子设备,不仅能够根据问题数据自动搜索对应的答案,还能在问题数据中包括问题任务时,自动对搜索到的基础数据进行对应的任务处理,从而能够更好地服务于用户,节省用户手动处理任务的时间,极大的提升了用户的使用体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种数据处理方法的流程图;
图2为本发明实施例公开的另一种数据处理方法的流程图;
图3为本发明实施例公开的又一种数据处理方法的流程图;
图4为本发明实施例公开的一种数据处理装置的结构示意图;
图5为本发明实施例公开的另一种数据处理装置的结构示意图;
图6为本发明实施例公开的第二处理模块的结构示意图;
图7为本发明实施例公开的电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例公开的一种数据处理方法的流程图,参见图1所示,数据处理方法可以包括:
步骤101:获取问题数据。
本实施例所述数据处理方法的执行主体可以是智能问答工具或系统的处理器,在实际应用场景中,用户首先通过输入装置,如键盘、语音采集装置等输入问题数据,系统获取所述问题数据,后续可以对所述问题数据进行相应的处理和查询检索工作。
其中,所述智能问答工作或系统的正常工作需要基于预先建立好的知识库实现。所述知识库可以是特定领域的知识库,如油气领域知识库,该油气领域知识库中可以对行业知识、行业数据、物理模型、行业规律等知识进行整合存储。
步骤102:对所述问题数据进行分解。
对所述问题数据进行语句分解是为了更加准确的进行任务识别,例如问题数据为“史南油田的发现井是哪个?”,则对其进行语句分解,分解结果包括“史南油田”、“的”、“发现井”、“是哪个”。
步骤103:基于分解后的结果,判断所述问题数据是否包含问题任务。
本实施例中,所述问题数据的类别可以包括任务问题和非任务问题,通过问题数据中是否包含问题任务来确定问题数据的类别。包含问题任务的为任务问题,所述任务问题是指回答所述问题数据不仅需要在知识库中查找数据,还需要对查找到的数据进行进一步处理,完成任务要求。其中的处理可以但不限制为包括计算、组合等处理。不包含问题任务的为非任务问题,所述非任务问题即答案不需要进行额外的处理,直接根据问题数据在所述知识库中进行相应查找检索,将查找到的数据直接作为答案返回即可。
步骤104:若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回。
例如,所述问题数据是“大庆油田位于哪个平原?”,这个知识点早就收录在油气领域知识库中,因此,直接在知识库中搜索就可以得到答案,即所述基础数据。
步骤105:若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
其中,所述任务处理可以但不限制为合、推理、计算中的任意一种或几种的组合。在对所述知识库中与所述问题任务对应的基础数据进行的任务处理为计算的情况下,根据所述预设的计算公式完成计算,其中,所述预设公式为通过历史知识积累和专家总结方式收集录入到知识库中的计算公式。
例如,所述问题数据为“东京油气田的采油井数量是多少?”,实际上,这个问题是一个统计类的问题。油气田包含油气藏,油气田节点的存储信息中是没有采油井数量这个属性的。因此要回答这个问题,需要查询到油气田下包含的油气藏,根据每个油气藏中采油井的数量进行统计,最后得到油气田包含的采油井的总数量。所以整个过程涉及查询、组合、计算。
这样,在建立的比较完备的油气领域知识库的基础上,通过对问题语句进行意图识别、知识检索、任务执行、答案组合的流程,对问题返回基于知识库中基础知识的知识及答案。答案中可以包含知识库中的基础知识,也可以是对多种基础知识的组合和计算得到的答案。
本实施例中,所述数据处理方法不仅能够根据问题数据自动搜索对应的答案,还能在问题数据中包括问题任务时,自动对搜索到的基础数据进行对应的任务处理,从而能够更好地服务于用户,节省用户手动处理任务的时间,极大的提升了用户的使用体验。
图2为本发明实施例公开的另一种数据处理方法的流程图,参见图2所示,数据处理方法可以包括:
步骤201:获取问题数据。
步骤202:对所述问题数据进行分解。步骤203:判断分解后的问题数据中是否包含主题词,若不包含,进入步骤204;若包含,进入步骤205。
主题词可以按照油气领域的业务需求,分为油气田、油气藏、盆地、地质勘探等等类别。例如上述“史南油田的发现井是哪个?”中,“史南油田”即为主题词,其归类在油气田分类下。
步骤204:确定所述问题数据为词条检索,直接在所述知识库的词条中检索与所述问题数据对应的基础数据并返回。
若所述问题数据若不包含主题词,确定所述问题数据为词条检索。其中所述词条可以是领域内一些术语定义,例如问题数据为“什么是射孔?”,这个问题数据中没有油气主体,所以属于词条检索,其中“射孔”就是词条。通过在知识库中的检索,可以得到“射孔”的解释为:固井后将射孔枪下到油气井中指定层段,将套管、水泥环和地层射穿,使油气从储层流入井筒的作业。
步骤205:基于分解后的结果,判断所述问题数据是否包含问题任务,若包含,进入步骤206,若不包含,进入步骤207。
在确定问题数据包含主题词后,进一步判断所述问题数据是否包含问题任务。
步骤206:根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
在确定所述问题数据包含主题词和问题任务时,除了在知识库中进行相应查询检索操作外,还需要对查询到的数据进行进一步的任务处理。
步骤207:直接在所述知识库中检索与所述问题数据对应的基础数据并返回。
在确定所述问题数据包含主题词但不包含问题任务时,在知识库中进行相应查询检索即可,具体主题问答可以是对基础实体、属性、关系等数据的查询。还以“史南油田的发现井是哪个?”为例,在这个问题中,涉及的基础实体(主题词)是史南油田,发现井可能是该实体的某个属性或者某个关系,所以通过对该实体的属性和关系进行查询。
本实施例中,对问题数据分解后,首先判断其是否包含主题词,再进一步根据是否包含主题词而确定执行判断问题数据是否包含问题任务的必要性,通过本实施例相关内容的介绍,能够使领域人员更好的了解本申请公开实施例的具体实现。
基于上述实施例公开的内容,在其他的实现中,在所述问题数据包含主题词、而不包含问题任务的情况下,数据处理方法方法进一步可以包括:从所述分解后的问题数据中确定出主题词;在所述主题词对应的主题范围内查询与所述问题数据对应的属性和关系。
由于问题数据中包含主题词,因此,可以在主题词对应的主题范围内查询与所述问题数据对应的属性和关系,这样,相对于在整个知识库数据中心查询所述问题数据对应的属性和关系,大大缩小了查询范围,提升了查询速度和查询精度。
在上述本发明公开的实施例的基础上,图3为本发明实施例公开的又一种数据处理方法的流程图,参见图3所示,数据处理方法可以包括:
步骤301:获取问题数据。
步骤302:对所述问题数据进行分解。
步骤303:判断分解后的问题数据中是否包含主题词,若不包含,进入步骤304;若包含,进入步骤305。
步骤304:确定所述问题数据为词条检索,直接在所述知识库的词条中检索与所述问题数据对应的基础数据并返回。
步骤305:基于分解后的结果,判断所述问题数据是否包含问题任务,若包含,进入步骤306,若不包含,进入步骤308。
步骤306:,从所述分解后的问题数据中确定出主题词。
步骤307:在所述主题词对应的主题范围内查询与所述问题数据对应的基础数据,并通过识别所述问题任务的内容来确定需要执行的任务处理;对所述基础数据进行确定的所述任务处理。
步骤308:直接在所述知识库中检索与所述问题数据对应的基础数据并返回。
上述实施例介绍了一个完整的数据处理方法的实现,所述数据处理方法在建立的比较完备的油气领域知识库的基础上,通过对问题语句进行意图识别、知识检索、任务执行、答案组合的流程,对问题返回基于知识库中基础知识的知识及答案。实现中不仅能够根据问题数据自动搜索对应的答案,还能在问题数据中包括问题任务时,自动对搜索到的基础数据进行对应的任务处理,从而能够更好地服务于用户,节省用户手动处理任务的时间,极大的提升了用户的使用体验。
上述各实施例中,所述根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回,可以包括:依据预设的计算公式对知识库中与所述问题任务对应的基础数据进行计算处理,将计算后的结果返回。
其中,所述预设的计算公式可以为通过历史知识积累和专家总结方式收集录入到知识库中的计算公式。
在其他的实现中,问题任务可以包括对基础关系的组合、推理,以及对基础属性值的计算。具体计算根据问题中的不同任务,会涉及不同的公式,例如有些是带有实际生产中的物理意义的公式,有些是求和、求平均等。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。
图4为本发明实施例公开的一种数据处理装置的结构示意图,参见图4所示,数据处理装置40可以包括:
问题获取模块401,用于获取问题数据。
本实施例所述数据处理装置的执行主体可以是智能问答工具或系统的处理器,在实际应用场景中,用户首先通过输入装置,如键盘、语音采集装置等输入问题数据,系统获取所述问题数据,后续可以对所述问题数据进行相应的处理和查询检索工作。
其中,所述智能问答工作或系统的正常工作需要基于预先建立好的知识库实现。所述知识库可以是特定领域的知识库,如油气领域知识库,该油气领域知识库中可以对行业知识、行业数据、物理模型、行业规律等知识进行整合存储。
问题分解模块402,用于对所述问题数据进行分解。
对所述问题数据进行语句分解是为了更加准确的进行任务识别。
任务判断模块403,用于基于分解后的结果,判断所述问题数据是否包含问题任务。
本实施例中,所述问题数据的类别可以包括任务问题和非任务问题,通过问题数据中是否包含问题任务来确定问题数据的类别。包含问题任务的为任务问题,所述任务问题是指回答所述问题数据不仅需要在知识库中查找数据,还需要对查找到的数据进行进一步处理,完成任务要求。其中的处理可以但不限制为包括计算、组合等处理。不包含问题任务的为非任务问题,所述非任务问题即答案不需要进行额外的处理,直接根据问题数据在所述知识库中进行相应查找检索,将查找到的数据直接作为答案返回即可。
第一处理模块404,用于在所述问题数据不包含问题任务的情况下,直接在所述知识库中检索与所述问题数据对应的基础数据并返回。
第二处理模块405,用于在所述问题数据包含问题任务的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
其中,所述任务处理可以但不限制为合、推理、计算中的任意一种或几种的组合。在对所述知识库中与所述问题任务对应的基础数据进行的任务处理为计算的情况下,根据所述预设的计算公式完成计算,其中,所述预设公式为通过历史知识积累和专家总结方式收集录入到知识库中的计算公式。
在建立的比较完备的油气领域知识库的基础上,通过对问题语句进行意图识别、知识检索、任务执行、答案组合的流程,对问题返回基于知识库中基础知识的知识及答案。答案中可以包含知识库中的基础知识,也可以是对多种基础知识的组合和计算得到的答案。
本实施例中,所述数据处理装置不仅能够根据问题数据自动搜索对应的答案,还能在问题数据中包括问题任务时,自动对搜索到的基础数据进行对应的任务处理,从而能够更好地服务于用户,节省用户手动处理任务的时间,极大的提升了用户的使用体验。
图5为本发明实施例公开的另一种数据处理装置的结构示意图,如图5所示,数据处理装置50可以包括:
问题获取模块401,用于获取问题数据。
问题分解模块402,用于对所述问题数据进行分解。
主题词判断模块501,用于判断分解后的问题数据中是否包含主题词。
类型确定模块502,用于在所述主题词判断模块501确定分解后的问题数据中不包含主题词时,确定所述问题数据为词条检索。
任务判断模块403,用于在所述主题词判断模块501确定分解后的问题数据中包含主题词时,进一步判断所述分解后的问题数据是否包含问题任务。
第一处理模块404,用于在所述任务判断模块403确定问题数据不包含问题任务的情况下,直接在所述知识库中检索与所述问题数据对应的基础数据并返回,或在所述类型确定模块502确定所述问题数据为词条检索时,直接在所述知识库的词条中检索与所述问题数据对应的基础数据并返回。
第二处理模块405,用于在所述任务判断模块403确定问题数据包含问题任务的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
本实施例中,对问题数据分解后,首先判断其是否包含主题词,再进一步根据是否包含主题词而确定执行判断问题数据是否包含问题任务的必要性,通过本实施例相关内容的介绍,能够使领域人员更好的了解本申请公开实施例的具体实现。
基于上述实施例公开的内容,在其他的实现中,在所述问题数据包含主题词、而不包含问题任务的情况下,第一处理模块404具体可用于:从所述分解后的问题数据中确定出主题词;在所述主题词对应的主题范围内查询与所述问题数据对应的属性和关系。
由于问题数据中包含主题词,因此,可以在主题词对应的主题范围内查询与所述问题数据对应的属性和关系,这样,相对于在整个知识库数据中心查询所述问题数据对应的属性和关系,大大缩小了查询范围,提升了查询速度和查询精度。
图6为本发明实施例公开的第二处理模块的结构示意图,参见图6所示,第二处理模块60可以包括:
主题词确定模块601,用于在所述任务判断模块405的判断结果为是时,从所述分解后的问题数据中确定出主题词;
任务处理模块602,用于在所述主题词确定模块601确定的主题词对应的主题范围内查询与所述问题数据对应的基础数据,并通过识别所述问题任务的内容来确定需要执行的任务处理;对所述基础数据进行确定的所述任务处理。
本实施例中,在问题数据包含主题词和问题任务时,能够先确定主题词,然后在主题词对应的主题范围内查询与所述问题数据对应的基础数据范围内进行相应的任务处理,保障返回结果的准确性。
所述数据处理装置包括处理器和存储器,上述问题获取模块、问题分解模块、任务判断模块、主题词确定模块、任务处理模块、第一处理模块、第二处理模块、主题词判断模块、任务处理模块和类型确定模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现答案搜索、处理及返回。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述数据处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述数据处理方法。
图7为本发明实施例公开的电子设备结构示意图,如图7所示,所述电子设备70包括至少一个处理器701、以及与处理器701连接的至少一个存储器702、总线703;其中,处理器、存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述的数据处理方法。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取问题数据;
对所述问题数据进行分解;
基于分解后的结果,判断所述问题数据是否包含问题任务;;
若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
其中,在判断所述问题数据是否包含问题任务之前,所述方法进一步包括:
判断分解后的问题数据中是否包含主题词;
若不包含主题词,确定所述问题数据为词条检索,并停止执行判断所述问题数据是否包含问题任务的步骤;若包含主题词,确定需要执行判断所述问题数据是否包含问题任务的步骤。
其中,在所述问题数据为词条检索的情况下,所述直接在所述知识库中检索与所述问题数据对应的基础数据并返回,可以包括:直接在所述知识库的词条中检索与所述问题数据对应的基础数据并返回。
在所述问题数据包含主题词、而不包含问题任务的情况下,所述方法进一步包括::从所述分解后的问题数据中确定出主题词;在所述主题词对应的主题范围内查询与所述问题数据对应的属性和关系。
在判断分解后的问题数据中是否包含主题词的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,包括::从所述分解后的问题数据中确定出主题词;在所述主题词对应的主题范围内查询与所述问题数据对应的基础数据,并通过识别所述问题任务的内容来确定需要执行的任务处理;对所述基础数据进行确定的所述任务处理。
其中,所述任务处理包括以下至少之一::组合、推理、计算。
其中,在对所述知识库中与所述问题任务对应的基础数据进行的任务处理为计算的情况下,根据所述预设的计算公式完成计算,其中,所述预设公式为通过历史知识积累和专家总结方式收集录入到知识库中的计算公式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取问题数据;
对所述问题数据进行分解;
基于分解后的结果,判断所述问题数据是否包含问题任务;
若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
2.根据权利要求1所述的数据处理方法,其特征在于,在判断所述问题数据是否包含问题任务之前,所述方法进一步包括:
判断分解后的问题数据中是否包含主题词;
若不包含主题词,确定所述问题数据为词条检索,并停止执行判断所述问题数据是否包含问题任务的步骤;
若包含主题词,确定需要执行判断所述问题数据是否包含问题任务的步骤。
3.根据权利要求2所述的数据处理方法,其特征在于,在所述问题数据为词条检索的情况下,则所述直接在所述知识库中检索与所述问题数据对应的基础数据并返回,包括:
直接在所述知识库的词条中检索与所述问题数据对应的基础数据并返回。
4.根据权利要求2所述的数据处理方方法,其特征在于,在所述问题数据包含主题词、而不包含问题任务的情况下,所述方法进一步包括:
从所述分解后的问题数据中确定出主题词;
在所述主题词对应的主题范围内查询与所述问题数据对应的属性和关系。
5.根据权利要求2所述的数据处理方法,其特征在于,在判断分解后的问题数据中是否包含主题词的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,包括:
从所述分解后的问题数据中确定出主题词;
在所述主题词对应的主题范围内查询与所述问题数据对应的基础数据,并通过识别所述问题任务的内容来确定需要执行的任务处理;
对所述基础数据进行确定的所述任务处理。
6.根据权利要求1所述的数据处理方法,其特征在于,所述任务处理包括以下至少之一:组合、推理、计算。
7.根据权利要求6所述的数据处理方法,其特征在于,在对所述知识库中与所述问题任务对应的基础数据进行的任务处理为计算的情况下,根据所述预设的计算公式完成计算,其中,所述预设公式为通过历史知识积累和专家总结方式收集录入到知识库中的计算公式。
8.一种数据处理装置,其特征在于,包括:
问题获取模块,用于获取问题数据;
问题分解模块,用于对所述问题数据进行分解;
任务判断模块,用于基于分解后的结果,判断所述问题数据是否包含问题任务;
第一处理模块,用于在所述问题数据不包含问题任务的情况下,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
第二处理模块,用于在所述问题数据包含问题任务的情况下,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述的数据处理方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述可执行指令包括:
获取问题数据;
对所述问题数据进行分解;
基于分解后的结果,判断所述问题数据是否包含问题任务;
若所述问题数据不包含问题任务,直接在所述知识库中检索与所述问题数据对应的基础数据并返回;
若所述问题数据包含问题任务,根据所述问题任务的内容,对所述知识库中与所述问题任务对应的基础数据进行对应的任务处理,得到任务处理结果并返回。
CN201910945241.6A 2019-09-30 2019-09-30 数据处理方法、装置、存储介质及电子设备 Pending CN112579642A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910945241.6A CN112579642A (zh) 2019-09-30 2019-09-30 数据处理方法、装置、存储介质及电子设备
PCT/CN2020/103211 WO2021063087A1 (zh) 2019-09-30 2020-07-21 数据处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910945241.6A CN112579642A (zh) 2019-09-30 2019-09-30 数据处理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN112579642A true CN112579642A (zh) 2021-03-30

Family

ID=75117047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910945241.6A Pending CN112579642A (zh) 2019-09-30 2019-09-30 数据处理方法、装置、存储介质及电子设备

Country Status (2)

Country Link
CN (1) CN112579642A (zh)
WO (1) WO2021063087A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
US20150356142A1 (en) * 2014-06-06 2015-12-10 Xerox Corporation Question answering system adapted to style of user requests
CN105787134A (zh) * 2016-04-07 2016-07-20 上海智臻智能网络科技股份有限公司 智能问答方法、装置及系统
CN107918678A (zh) * 2017-12-28 2018-04-17 北京洪泰同创信息技术有限公司 问答信息处理方法、问答信息处理系统及服务器
CN107993724A (zh) * 2017-11-09 2018-05-04 易保互联医疗信息科技(北京)有限公司 一种医学智能问答数据处理的方法及装置
CN108959627A (zh) * 2018-07-23 2018-12-07 北京光年无限科技有限公司 基于智能机器人的问答交互方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
US20150356142A1 (en) * 2014-06-06 2015-12-10 Xerox Corporation Question answering system adapted to style of user requests
CN105787134A (zh) * 2016-04-07 2016-07-20 上海智臻智能网络科技股份有限公司 智能问答方法、装置及系统
CN107993724A (zh) * 2017-11-09 2018-05-04 易保互联医疗信息科技(北京)有限公司 一种医学智能问答数据处理的方法及装置
CN107918678A (zh) * 2017-12-28 2018-04-17 北京洪泰同创信息技术有限公司 问答信息处理方法、问答信息处理系统及服务器
CN108959627A (zh) * 2018-07-23 2018-12-07 北京光年无限科技有限公司 基于智能机器人的问答交互方法及系统

Also Published As

Publication number Publication date
WO2021063087A1 (zh) 2021-04-08

Similar Documents

Publication Publication Date Title
US8560531B2 (en) Search tool that utilizes scientific metadata matched against user-entered parameters
CN106897334A (zh) 一种问题推送方法和设备
CN108920654A (zh) 一种问答文本语义匹配的方法和装置
CN105187237B (zh) 查找相关联的用户标识的方法和装置
CN111125086B (zh) 获取数据资源的方法、装置、存储介质及处理器
US20200364250A1 (en) Multi-model approach for job recommendation platform
US20140280242A1 (en) Method and apparatus for acquiring hot topics
US8838512B2 (en) Random walk on query pattern graph for query task classification
CN113360676A (zh) 一种基于知识图谱确定企业潜在关系的方法及装置
US20220222268A1 (en) Recommendation system for data assets in federation business data lake environments
Hamad et al. Knowledge-driven decision support system based on knowledge warehouse and data mining for market management
CN112579642A (zh) 数据处理方法、装置、存储介质及电子设备
CN116150484A (zh) 信息推送方法、装置、存储介质以及电子设备
CN111428037B (zh) 一种分析行为政策匹配性的方法
CN104156492A (zh) 搜索内容的提示方法和装置
CN108241622B (zh) 一种查询脚本的生成方法及装置
CN113672710A (zh) 一种基于分布式检索专利数据的方法和系统
CN109948034B (zh) 基于过滤会话实现提取页面信息的方法及装置
CN113627148A (zh) 一种知识库中知识的自动关联方法及装置
CN110955760B (zh) 判决结果的评价方法和相关装置
CN113408263A (zh) 刑期预测方法、装置、存储介质及电子设备
CN109725982B (zh) 数据对象构建方法及装置
CN112580915A (zh) 一种项目里程碑确定方法、装置、存储介质及电子设备
US20230252497A1 (en) Systems and methods for measuring impact of online search queries on user actions
CN117743564B (zh) 一种科技政策信息自动抽取与推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination