CN112416984B - 一种数据处理方法及其装置 - Google Patents

一种数据处理方法及其装置 Download PDF

Info

Publication number
CN112416984B
CN112416984B CN201910776210.2A CN201910776210A CN112416984B CN 112416984 B CN112416984 B CN 112416984B CN 201910776210 A CN201910776210 A CN 201910776210A CN 112416984 B CN112416984 B CN 112416984B
Authority
CN
China
Prior art keywords
queried
objects
text
word
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910776210.2A
Other languages
English (en)
Other versions
CN112416984A (zh
Inventor
梁文秀
陈开济
陈文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910776210.2A priority Critical patent/CN112416984B/zh
Priority to PCT/CN2020/107291 priority patent/WO2021031862A1/zh
Priority to US17/637,362 priority patent/US20220292122A1/en
Priority to EP20854658.0A priority patent/EP4020251A4/en
Publication of CN112416984A publication Critical patent/CN112416984A/zh
Application granted granted Critical
Publication of CN112416984B publication Critical patent/CN112416984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种数据处理方法及其装置,该方法可以应用于基于人工智能的智能搜索领域,该方法包括:获取待查询文本;从预设数据库中确定该待查询文本对应的待查询对象集合,该待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象;从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息;根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域。通过实施本申请实施例,可以确定待查询文本对应的查询领域,从而有利于降低查询结果冗余。

Description

一种数据处理方法及其装置
技术领域
本申请涉及通信技术领域,尤其涉及一种数据处理方法及其装置。
背景技术
随着通信技术的不断发展,终端设备支持的应用越来越丰富。当终端设备接收到查询请求后,可以向该终端设备支持的所有服务提供商发送查询请求,并在接收到每个服务提供商返回的查询结果之后,向用户反馈查询结果。
当前互联网中信息量巨大,且每个服务提供商对应的领域中的数据存在重名问题。如“XX传”在影视领域存在多个版本的电视剧《XX传》,在有声领域存在相声《XX传》和评书《XX传》。因此,针对同一查询请求每个服务提供商对应的领域中均存在对应的查询结果,但是实际上用户需要的查询结果属于一个或少数的服务提供商对应的领域。所以,采用现有查询方法进行查询,会导致查询结果冗余。
发明内容
本申请实施例提供一种数据处理方法及其装置,可以确定待查询文本对应的查询领域,从而有利于降低查询结果冗余。
第一方面,本申请实施例提供一种数据处理方法,该方法可以应用于基于人工智能的智能搜索领域,该方法包括:获取待查询文本;从预设数据库中确定该待查询文本对应的待查询对象集合,该待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象;从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息;根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域。
在该技术方案中,根据各个待查询对象集合中待查询对象的关系信息,可以确定用户输入待查询文本时实际想访问的是服务设备所支持的多个领域中的哪个领域的资源,进而将用户实际想访问的领域作为该待查询文本对应的查询领域。这样有利于降低查询的领域数量,即可以缩小查询范围,这样不仅可以查询得到与用户意图相匹配的查询结果,还有利于提高查询效率、降低查询结果冗余。
在一种实现方式中,各个待查询对象集合可以包括一个待查询对象,各个待查询对象集合中待查询对象的关系信息可以包括一个或多个关系类型;根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域的具体实施方式可以为:针对各个待查询对象集合,若该待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则确定该第一预设领域属于上述待查询文本对应的查询领域。
在该技术方案中,相较于通过待查询对象的关系确定待查询文本对应的查询领域,通过待查询对象的关系类型确定待查询文本对应的查询领域,可以提高确定待查询文本对应的查询领域的效率。
在一种实现方式中,各个待查询对象集合可以包括多个待查询对象,各个待查询对象集合中的各个待查询对象的关系信息可以包括该待查询对象与该待查询对象集合中除该待查询对象以外的其他待查询对象之间的关系类型;根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域的具体实施方式可以为:针对各个待查询对象集合,若该待查询对象集合中的各个待查询对象通过类型属于第一预设领域的关系相连接,则确定该第一预设领域属于上所述待查询文本对应的查询领域。
在该技术方案中,当各个待查询对象集合包括多个待查询对象时,根据各个待查询对象集合中待查询对象的关系类型,可以确定用户输入待查询文本时实际想访问的是服务设备所支持的多个领域中的哪个领域的资源,进而将用户实际想访问的领域作为该待查询文本对应的查询领域。这样不仅可以查询得到与用户意图相匹配的查询结果,还有利于降低查询的领域数量、提高查询效率、降低查询结果冗余。另外,相较于通过待查询对象的关系确定待查询文本对应的查询领域,通过待查询对象的关系类型确定待查询文本对应的查询领域,可以提高确定待查询文本对应的查询领域的效率。
在一种实现方式中,从预设数据库中确定上述待查询文本对应的待查询对象集合的具体实施方式可以为:确定目标文本,该目标文本为对上述待查询文本进行自然语言理解NLU处理后得到的文本;对该目标文本进行分词处理,得到该目标文本的各个分词;根据该述目标文本的各个分词,从所述预设数据库中确定各个待查询对象集合中的待查询对象。
在一种实现方式中,上述目标文本的各个分词在预设数据库中均存在对应的对象;根据上述目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象的具体实施方式可以为:针对该目标文本的各个分词,将该分词在预设数据库中对应的不同对象作为不同待查询对象集合中的待查询对象。
在一种实现方式中,上述目标文本的分词至少可以包括第一分词和第二分词,该第一分词在预设数据库中对应第一对象,该第二分词在所述预设数据库中不存在对应的对象;根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象的具体实施方式可以为:从预设的两两对象之间的关系信息中确定该第一对象的关系信息;从该第一对象的关系信息中确定与该第二分词具有匹配关系的第一关系信息;若该第一对象在预设数据库中通过该第一关系信息与第二对象相连接,则根据该第二对象确定目标对象;并将该目标对象作为各个待查询对象集合中的待查询对象。
在该技术方案中,当目标文本的分词包括一个第一分词和多个第二分词时,可以根据该第一分词在预设数据库中对应第一对象和该多个第二分词进行多级推理,以得到目标实体,并将目标实体作为各个待查询对象集合中的待查询对象。通过这种方式,有利于确定出用户实际需要查询的对象。
在一种实现方式中,该方法还可以包括:将任意一个待查询对象集合对应的文本信息发送给上述查询领域对应的服务设备;接收来自该查询领域对应的服务设备的查询结果;并输出该查询结果。
在该技术方案中,通过仅将待查询对象集合对应的文本信息发送给上述查询领域对应的服务设备,既可以使得用户可以得到需要的查询结果,也可以避免向服务设备所支持的所有领域对应的服务设备发送待查询对象集合对应的文本信息所导致的额外开销。同时,还能避免搜索得到一些用户并不需要的查询结果,这样有利于降低查询结果冗余。
第二方面,本申请实施例提供一种数据处理装置,该装置可以是服务设备,也可以是用于服务设备的装置(例如芯片)。该装置具有实现第一方面所提供的数据处理方法的功能,该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。
第三方面,本申请实施例提供一种计算机可读存储介质,用于储存为第二方面所述的数据处理装置所用的计算机程序指令,其包含用于执行上述第一方面所涉及的程序。
第四方面,本申请实施例提供又一种数据处理装置,该装置可以为服务设备或用于服务设备的装置(例如芯片)。该装置包括存储器和处理器,所述处理器通过总线与所述存储器连接,存储器中存储有程序指令,处理器调用存储器中存储的程序指令以实现第一方面所提供的数据处理方法。
第五方面,本申请实施例提供一种计算机程序产品,该程序产品包括程序,所述程序被数据处理装置执行时,使得所述数据处理装置实现上述第一方面所述的方法。
附图说明
图1a是本申请实施例公开的一种通信系统的架构示意图;
图1b是本申请实施例公开的一种服务设备的结构示意图;
图1c是本申请实施例公开的一种服务设备的软件系统的示意图;
图2是本申请实施例公开的一种数据处理方法的流程示意图;
图3是本申请实施例公开的另一种数据处理方法的流程示意图;
图4是本申请实施例公开的又一种数据处理方法的流程示意图;
图5是本申请实施例公开的一种数据处理装置的结构示意图;
图6是本申请实施例公开的另一种数据处理装置的结构示意图。
具体实施方式
为了便于理解,首先介绍本申请涉及的术语。
1、知识图谱(knowledge graph,KG)
知识图谱是一种基于图的数据结构,由节点和边组成。知识图谱用于描述真实世界中存在的各种实体和概念,以及他们之间(即概念与概念之间、概念与实体之间、实体与实体之间)的关系。知识图谱中的一条知识可以用三元组(triple)来表示,三元组可以表示为(实体1,实体关系,实体2)。其中,实体1和实体2表示知识图谱中的节点,实体关系表示知识图谱中的边,该三元组表示实体1和实体2在知识图谱中通过该实体关系相关联。
概念是具有同种特性的实体构成的集合,如国家、民族、书籍、电脑等。概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等。实体代表属于某概念的基本元素,即某概念所指的具体实体。实体是具有可区别性且独立存在的某种事物。如某一个人、某一个城市、某一种植物、某一种商品等。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。
2、自然语言理解(natural language understanding,NLU)
人工智能(artificial intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。AI的核心是使用机器学习技术,以允许机器模拟人类行为的某些核心方面。换言之,AI允许机器表现为能够在很少或没有人为干预的情况下感知、学习、做出决策、以及采取行动的自主系统。
NLU是人工智能的一个应用领域,NLU是使用自然语言同计算机进行通讯的技术,通过NLU可以让计算机“理解”自然语言,进而执行人类所期望的某些语言功能,换言之,NLU是人与机器交流的桥梁。
语言理解可以包括但不限于以下内容:①能够理解句子的正确次序规则和概念,也能理解不含规则的句子;②知道词的确切含义、形式、词类及构词法;③了解词的语义分类、词的多义性、词的歧义性;④指定和不定特性及所有特性;⑤问题领域的结构知识和实践概念;⑥语言的语气信息和韵律表现;⑦有关语言表达形式的文字知识;⑧论域的背景知识。
为了更好的理解本申请实施例公开的一种数据处理方法,下面首先对本申请实施例适用的通信系统进行描述。
请参见图1a,图1a是本申请实施例公开的一种通信系统的架构示意图。如图1a所示,该通信系统包括终端设备101和服务设备102。
用户可以通过终端设备101的输入设备在终端设备101显示的文本框中输入待查询文本(例如“郭某某A的XX传”),然后点击查询按钮,以便终端设备101检测到查询按钮被点击时,将该待查询文本发送给服务设备102;
服务设备102接收到该待查询文本之后,可以从预设数据库中确定该待查询文本对应的待查询对象集合,待查询对象集合的数量可以为一个或多个,然后从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息,然后根据各个待查询对象集合中待查询对象的关系信息,确定该待查询文本对应的查询领域。其中,各个待查询对象集合可以包括一个或多个待查询对象。
待查询对象可以为预设数据库中的一个实体。例如,待查询文本为“郭某某A的XX传”时,若该待查询文本对应一个待查询对象集合,则该待查询对象集合中的待查询对象可以包括人物“郭某某A”和相声《XX传》。其中,人物“郭某某A”、相声《XX传》分别为预设数据库中的一个实体。
待查询对象的关系信息为该待查询对象在预设数据库中对应的实体的关系信息,即待查询对象的关系信息可以包括该待查询对象在预设数据库中对应的实体与预设数据库中除该待查询对象对应的实体以外的其他实体之间的关系信息。例如,待查询对象为人物“郭某某A”时,该待查询对象的关系信息可以包括但不限于:人物“郭某某A”与相声《XX传》之间的关系信息、人物“郭某某A”与郭某某A创办的XX社之间的关系信息。
在一种实现方式中,图1a所示的通信系统还可以包括数据服务器(图1a未示),服务设备102确定查询领域之后,可以将任意一个待查询对象集合对应的文本信息发送给该查询领域对应的数据服务器,接收来自该数据服务器的查询结果,并输出该查询结果,以供用户根据自身需要进行选择。
在一种实现方式中,图1a中由服务设备102执行的步骤,可以由终端设备101替代执行,即终端设备101可以从预设数据库中确定该待查询文本对应的待查询对象集合,并从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息,然后根据各个待查询对象集合中待查询对象的关系信息,确定该待查询文本对应的查询领域。同理,在一种实现方式中,图1a中由终端设备101执行的步骤,可以由服务设备102替代执行,即图1a中服务设备102接收到的待查询文本,可以是服务设备102根据用户的输入操作得到的。
其中,本申请实施例中的终端设备101是用户侧的一种用于接收或发射信号的实体,如手机。终端设备也可以称为终端(terminal)、用户设备(user equipment,UE)、移动台(mobile station,MS)、移动终端(mobile terminal,MT)等。终端设备可以是手机(mobilephone)、智能电视、穿戴式设备、平板电脑(Pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等等。本申请的实施例对终端设备所采用的具体技术和具体设备形态不做限定。
本申请实施例中的服务设备102可以由处理器、存储器和网络接口组成,服务设备102可以是终端设备或者服务器。
需要说明的是,本申请实施例的技术方案可以应用于基于人工智能的智能搜索系统、智能问答系统等查询系统。当应用于智能搜索系统时,数据服务器可以为搜索引擎服务器、多媒体服务器等资源服务器。当应用于智能问答系统时,数据服务器可以为搜索引擎服务器或其他资源服务器。
可以理解的是,本申请实施例描述的通信系统是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
为了能够更好地理解本申请实施例,下面对本申请实施例的服务设备的结构进行介绍:
图1b示出了服务设备1300的结构示意图。服务设备1300可以包括处理器1310,外部存储器接口1320,内部存储器1321,通用串行总线(universal serial bus,USB)接口1330,充电管理模块1340,电源管理模块1341,电池1342,天线1,天线2,移动通信模块1350,无线通信模块1360,音频模块1370,扬声器1370A,受话器1370B,麦克风1370C,耳机接口1370D,传感器模块1380,按键1390,马达1391,指示器1392,摄像头1393,显示屏1394,以及用户标识模块(subscriber identification module,SIM)卡接口1395等。其中,传感器模块1380可以包括压力传感器1380A,陀螺仪传感器1380B,气压传感器1380C,磁传感器1380D,加速度传感器1380E,距离传感器1380F,接近光传感器1380G,指纹传感器1380H,温度传感器1380J,触摸传感器1380K,环境光传感器1380L,骨传导传感器1380M等。
可以理解的是,本发明实施例示意的结构并不构成对服务设备1300的具体限定。在本申请另一些实施例中,服务设备1300可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器1310可以包括一个或多个处理单元,例如:处理器1310可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器1310中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器1310中的存储器为高速缓冲存储器。该存储器可以保存处理器1310刚用过或循环使用的指令或数据。如果处理器1310需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器1310的等待时间,因而提高了系统的效率。
在一些实施例中,处理器1310可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器1310可以包含多组I2C总线。处理器1310可以通过不同的I2C总线接口分别耦合触摸传感器1380K,充电器,闪光灯,摄像头1393等。例如:处理器1310可以通过I2C接口耦合触摸传感器1380K,使处理器1310与触摸传感器1380K通过I2C总线接口通信,实现服务设备1300的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器1310可以包含多组I2S总线。处理器1310可以通过I2S总线与音频模块1370耦合,实现处理器1310与音频模块1370之间的通信。在一些实施例中,音频模块1370可以通过I2S接口向无线通信模块1360传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块1370与无线通信模块1360可以通过PCM总线接口耦合。在一些实施例中,音频模块1370也可以通过PCM接口向无线通信模块1360传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器1310与无线通信模块1360。例如:处理器1310通过UART接口与无线通信模块1360中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块1370可以通过UART接口向无线通信模块1360传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器1310与显示屏1394,摄像头1393等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(display serial interface,DSI)等。在一些实施例中,处理器1310和摄像头1393通过CSI接口通信,实现服务设备1300的拍摄功能。处理器1310和显示屏1394通过DSI接口通信,实现服务设备1300的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器1310与摄像头1393,显示屏1394,无线通信模块1360,音频模块1370,传感器模块1380等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口1330是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口1330可以用于连接充电器为服务设备1300充电,也可以用于服务设备1300与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他服务设备,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对服务设备1300的结构限定。在本申请另一些实施例中,服务设备1300也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块1340用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块1340可以通过USB接口1330接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块1340可以通过服务设备1300的无线充电线圈接收无线充电输入。充电管理模块1340为电池1342充电的同时,还可以通过电源管理模块1341为服务设备供电。
电源管理模块1341用于连接电池1342,充电管理模块1340与处理器1310。电源管理模块1341接收电池1342和/或充电管理模块1340的输入,为处理器1310,内部存储器1321,显示屏1394,摄像头1393,和无线通信模块1360等供电。电源管理模块1341还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块1341也可以设置于处理器1310中。在另一些实施例中,电源管理模块1341和充电管理模块1340也可以设置于同一个器件中。
服务设备1300的无线通信功能可以通过天线1,天线2,移动通信模块1350,无线通信模块1360,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。服务设备1300中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块1350可以提供应用在服务设备1300上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块1350可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块1350可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块1350还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块1350的至少部分功能模块可以被设置于处理器1310中。在一些实施例中,移动通信模块1350的至少部分功能模块可以与处理器1310的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器1370A,受话器1370B等)输出声音信号,或通过显示屏1394显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器1310,与移动通信模块1350或其他功能模块设置在同一个器件中。
无线通信模块1360可以提供应用在服务设备1300上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块1360可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块1360经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器1310。无线通信模块1360还可以从处理器1310接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,服务设备1300的天线1和移动通信模块1350耦合,天线2和无线通信模块1360耦合,使得服务设备1300可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobilecommunications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(code division multiple access,CDMA),宽带码分多址(wideband codedivision multiple access,WCDMA),时分码分多址(time-division code divisionmultiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidou navigation satellite system,BDS),准天顶卫星系统(quasi-zenithsatellite system,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
服务设备1300通过GPU,显示屏1394,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏1394和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器1310可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏1394用于显示图像,视频等。显示屏1394包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,服务设备1300可以包括1个或N个显示屏1394,N为大于1的正整数。
服务设备1300可以通过ISP,摄像头1393,视频编解码器,GPU,显示屏1394以及应用处理器等实现拍摄功能。
ISP用于处理摄像头1393反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头1393中。
摄像头1393用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,服务设备1300可以包括1个或N个摄像头1393,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当服务设备1300在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。服务设备1300可以支持一种或多种视频编解码器。这样,服务设备1300可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现服务设备1300的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口1320可以用于连接外部存储卡,例如Micro SD卡,实现扩展服务设备1300的存储能力。外部存储卡通过外部存储器接口1320与处理器1310通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器1321可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器1321可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储服务设备1300使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器1321可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器1310通过运行存储在内部存储器1321的指令,和/或存储在设置于处理器中的存储器的指令,执行服务设备1300的各种功能应用以及数据处理。
服务设备1300可以通过音频模块1370,扬声器1370A,受话器1370B,麦克风1370C,耳机接口1370D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块1370用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块1370还可以用于对音频信号编码和解码。在一些实施例中,音频模块1370可以设置于处理器1310中,或将音频模块1370的部分功能模块设置于处理器1310中。
扬声器1370A,也称“喇叭”,用于将音频电信号转换为声音信号。服务设备1300可以通过扬声器1370A收听音乐,或收听免提通话。
受话器1370B,也称“听筒”,用于将音频电信号转换成声音信号。当服务设备1300接听电话或语音信息时,可以通过将受话器1370B靠近人耳接听语音。
麦克风1370C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风1370C发声,将声音信号输入到麦克风1370C。服务设备1300可以设置至少一个麦克风1370C。在另一些实施例中,服务设备1300可以设置两个麦克风1370C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,服务设备1300还可以设置三个,四个或更多麦克风1370C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口1370D用于连接有线耳机。耳机接口1370D可以是USB接口1330,也可以是3.5mm的开放移动服务设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器1380A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器1380A可以设置于显示屏1394。压力传感器1380A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器1380A,电极之间的电容改变。服务设备1300根据电容的变化确定压力的强度。当有触摸操作作用于显示屏1394,服务设备1300根据压力传感器1380A检测所述触摸操作强度。服务设备1300也可以根据压力传感器1380A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器1380B可以用于确定服务设备1300的运动姿态。在一些实施例中,可以通过陀螺仪传感器1380B确定服务设备1300围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器1380B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器1380B检测服务设备1300抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消服务设备1300的抖动,实现防抖。陀螺仪传感器1380B还可以用于导航,体感游戏场景。
气压传感器1380C用于测量气压。在一些实施例中,服务设备1300通过气压传感器1380C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器1380D包括霍尔传感器。服务设备1300可以利用磁传感器1380D检测翻盖皮套的开合。在一些实施例中,当服务设备1300是翻盖机时,服务设备1300可以根据磁传感器1380D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器1380E可检测服务设备1300在各个方向上(一般为三轴)加速度的大小。当服务设备1300静止时可检测出重力的大小及方向。还可以用于识别服务设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器1380F,用于测量距离。服务设备1300可以通过红外或激光测量距离。在一些实施例中,拍摄场景,服务设备1300可以利用距离传感器1380F测距以实现快速对焦。
接近光传感器1380G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。服务设备1300通过发光二极管向外发射红外光。服务设备1300使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定服务设备1300附近有物体。当检测到不充分的反射光时,服务设备1300可以确定服务设备1300附近没有物体。服务设备1300可以利用接近光传感器1380G检测用户手持服务设备1300贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器1380G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器1380L用于感知环境光亮度。服务设备1300可以根据感知的环境光亮度自适应调节显示屏1394亮度。环境光传感器1380L也可用于拍照时自动调节白平衡。环境光传感器1380L还可以与接近光传感器1380G配合,检测服务设备1300是否在口袋里,以防误触。
指纹传感器1380H用于采集指纹。服务设备1300可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器1380J用于检测温度。在一些实施例中,服务设备1300利用温度传感器1380J检测的温度,执行温度处理策略。例如,当温度传感器1380J上报的温度超过阈值,服务设备1300执行降低位于温度传感器1380J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,服务设备1300对电池1342加热,以避免低温导致服务设备1300异常关机。在其他一些实施例中,当温度低于又一阈值时,服务设备1300对电池1342的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器1380K,也称“触控器件”。触摸传感器1380K可以设置于显示屏1394,由触摸传感器1380K与显示屏1394组成触摸屏,也称“触控屏”。触摸传感器1380K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏1394提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器1380K也可以设置于服务设备1300的表面,与显示屏1394所处的位置不同。
骨传导传感器1380M可以获取振动信号。在一些实施例中,骨传导传感器1380M可以获取人体声部振动骨块的振动信号。骨传导传感器1380M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器1380M也可以设置于耳机中,结合成骨传导耳机。音频模块1370可以基于所述骨传导传感器1380M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器1380M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键1390包括开机键,音量键等。按键1390可以是机械按键。也可以是触摸式按键。服务设备1300可以接收按键输入,产生与服务设备1300的用户设置以及功能控制有关的键信号输入。
马达1391可以产生振动提示。马达1391可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏1394不同区域的触摸操作,马达1391也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器1392可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口1395用于连接SIM卡。SIM卡可以通过插入SIM卡接口1395,或从SIM卡接口1395拔出,实现和服务设备1300的接触和分离。服务设备1300可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口1395可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口1395可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口1395也可以兼容不同类型的SIM卡。SIM卡接口1395也可以兼容外部存储卡。服务设备1300通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,服务设备1300采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在服务设备1300中,不能和服务设备1300分离。
以下对服务设备1300的软件系统进行详细介绍:
服务设备1300的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本发明实施例以分层架构的Android系统为例,示例性说明服务设备1300的软件结构。
如图1c所示,图1c是本发明实施例的服务设备1300的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。如图1c所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。如图1c所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供服务设备1300的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,服务设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面结合捕获拍照场景,示例性说明服务设备1300软件以及硬件的工作流程。
当触摸传感器1380K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过摄像头1393捕获静态图像或视频。
下面结合附图对本申请所提供的数据处理方法及其装置进行详细地介绍。
请参见图2,图2是本申请实施例提供的一种数据处理方法的流程示意图。其中,步骤S201~S204的执行主体为服务设备,或者为服务设备中的芯片,以下以服务设备为数据处理方法的执行主体为例进行说明。如图2所示,该方法可以包括但不限于如下步骤:
步骤S201:服务设备获取待查询文本。
其中,待查询文本可以是一个词,也可以是由多个词组成的句子。在一种实现方式中,当图2所示方法应用于基于人工智能的智能搜索系统时,该待查询文本可以是用户在查询搜索时输入的查询语,该查询语可以是以文本方式输入的,也可以是以语音方式输入的,当查询语以语音方式输入时,需要将语音格式的查询语转换为文本格式。
在一种实现方式中,当图2所示方法应用于基于人工智能的智能问答系统时,该待查询文本可以是用户在询问时输入的问题,该问题可以是以文本方式输入的,也可以是以语音方式输入的,当问题以语音方式输入时,需要将语音格式的问题转换为文本格式。
在一种实现方式中,待查询文本可以是用户在终端设备中输入,并由该终端设备发送给服务设备的,或者,该待查询文本也可以是用户在服务设备中输入的,本申请实施例对此不作限定。其中,服务设备可以是图1a中的服务设备102。
在本申请实施例中,服务设备获取到待查询文本时,表示需要确定该待查询文本对应的查询领域。具体的,服务设备确定该待查询文本对应的查询领域之前,需要确定该待查询文本对应的待查询对象集合,并通过该待查询对象集合中的待查询对象的关系信息,确定该待查询文本对应的查询领域。
步骤S202:服务设备从预设数据库中确定该待查询文本对应的待查询对象集合,待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象。
具体的,服务设备获取待查询文本之后,可以从预设数据库中确定该待查询文本对应的待查询对象集合。待查询对象集合的数量可以为一个或多个,各个待查询对象集合可以包括一个或多个待查询对象,各个待查询对象集合中的待查询对象的数量相同。
待查询对象可以为预设数据库中的一个实体。例如,待查询文本为“郭某某A的XX传”时,若该待查询文本对应一个待查询对象集合,则该待查询对象集合中的待查询对象可以包括人物“郭某某A”和相声《XX传》。其中,人物“郭某某A”、相声《XX传》分别为预设数据库中的一个实体。
不同待查询对象集合中的待查询对象可以完全不同,也可以部分不同。例如,待查询文本为“郭某某A的XX传”时,若该待查询文本对应两个待查询对象集合,则第一个待查询对象集合中的待查询对象可以包括人物“郭某某A”和相声《XX传》,第二个待查询对象集合中的待查询对象可以包括人物“郭某某A”和电视剧《XX传》。其中,相声《XX传》和电视剧《XX传》是词语“XX传”在预设数据库中对应的两个不同的实体。
同一字词在预设数据库中可以对应一个或多个实体,待查询对象集合的数量可以根据待查询文本对应的字词在预设数据库中存在的实体数量确定。具体的,待查询对象集合的数量可以为待查询文本对应的各个字词在预设数据库中存在的实体数量之间的乘积。例如,待查询文本为“郭某某A的XX传”,且该待查询文本对应的两个词语分别为“郭某某A”和“XX传”时,若词语“郭某某A”在预设数据库中对应2个实体(如人物“郭某某A”和书籍《郭某某A》),词语“XX传”在预设数据库中也对应2个实体(如相声《XX传》和电视剧《XX传》),则待查询对象集合的数量可以为2*2个。第一个待查询对象集合中的待查询对象包括:人物“郭某某A”和相声《XX传》;第二个待查询对象集合中的待查询对象包括:人物“郭某某A”和电视剧《XX传》;第三个待查询对象集合中的待查询对象包括:书籍《郭某某A》和相声《XX传》;第四个待查询对象集合中的待查询对象包括:书籍《郭某某A》和电视剧《XX传》。
在一种实现方式中,待查询对象集合的数量可以小于待查询文本对应的各个字词在预设数据库中存在的实体数量之间的乘积。例如,待查询文本为“郭某某A的XX传”,且该待查询文本对应的两个词语分别为“郭某某A”和“XX传”时,若词语“郭某某A”在预设数据库中对应2个实体(如人物“郭某某A”和书籍《郭某某A》),词语“XX传”在预设数据库中对应2个实体(如相声《XX传》和电视剧《XX传》)。此时,服务设备可以对词语“郭某某A”和“XX传”分别进行实体排歧处理,进而确定词语“郭某某A”对应的实体为人物“郭某某A”,词语“XX传”对应的实体为相声《XX传》和电视剧《XX传》。经过实体排歧处理之后,可以确定待查询对象集合的数量为1*2个。其中,第一个待查询对象集合中的待查询对象包括人物“郭某某A”和相声《XX传》,第二个待查询对象集合中的待查询对象包括人物“郭某某A”和电视剧《XX传》。需要说明的是,每个待查询对象集合中的待查询对象对应的字词相同,例如,上例中第一个待查询对象集合和第二个待查询对象集合中的待查询对象对应的字词均为“郭某某A”和“XX传”。
实体的歧义是指同一字词可以对应多个不同的概念,例如,词语“郭某某A”可以指一个人物,也可以指与人物“郭某某A”同名的书籍《郭某某A》。实体排歧可以确定字词真正对应的概念。例如,待查询文本为“郭某某A的XX传”时,可以确定该待查询文本中的词语“郭某某A”对应的真正实体是一个人物,即对应的真正实体为人物“郭某某A”。
在实际应用中,直接搜索用户输入的待查询文本,可能不能搜索到用户实际需要的查询结果,或者会导致查询结果冗余。例如,用户输入的待查询文本为“邓某的妻子的作品”时,实际上用户希望查询的是“孙某的作品”(邓某的妻子为孙某),但是在实际搜索过程中,可能搜索得到的结果是与邓某的作品相关的资源,此时,不能搜索到用户实际需要的查询结果。或者,搜索得到的结果是与邓某的作品相关的资源以及与孙某的作品相关的资源,此时,查询结果中与邓某的作品相关的资源是用户不需要的信息,这样会导致查询结果冗余。
在本申请实施例中,待查询对象集合对应的文本信息可以是用户实际希望查询的信息。例如,待查询文本为“邓某的妻子的作品”时,待查询对象集合可以包括一个待查询对象,该待查询对象是人物“孙某”。此时,人物“孙某”所在的待查询对象集合对应的文本信息为“孙某的作品”,该文本信息是用户实际希望查询的信息。在本申请实施例中,待查询文本对应的查询领域是通过该待查询对象集合中的待查询对象的关系信息来确定的,通过确定待查询对象集合,可以确定用户实际希望查询的信息,这样有利于提高待查询文本对应的查询领域的准确度,从而有利于查询得到与用户意图相匹配的查询结果。
在一种实现方式中,待查询对象可以是待查询文本中的字词在预设数据库中对应的实体。例如,待查询文本为“郭某某A的XX传”时,待查询对象集合可以包括两个待查询对象(如人物“郭某某A”和相声《XX传》),其中,人物“郭某某A”是该待查询文本中的词语“郭某某A”在预设数据库中对应的实体,相声《XX传》是该待查询文本中的词语“XX传”在预设数据库中对应的实体。在一种实现方式中,待查询对象可以是根据第一实体推理得到的第二实体,其中,第一实体是待查询文本中的字词在预设数据库中对应的实体。例如,待查询文本为“邓某的妻子的作品”,该待查询文本中的词语“邓某”在预设数据库中对应的第一实体为人物“邓某”,且人物“邓某”在预设数据库中通过夫妻关系与人物“孙某”相连接。据此,可以推理得到第二实体为人物“孙某”。
其中,预设数据库可以是服务设备中的本地数据库,也可以云端的数据库,本申请实施例对此不做限定。在本申请实施例中,预设数据库中可以存储有知识图谱,具体的,服务设备可以从预设数据库中的知识图谱中确定该待查询文本对应的待查询对象集合,本申请实施例中提及预设数据库之处,具体可以指该预设数据库中的知识图谱。需要说明的是,本申请实施例以从知识图谱中确定待查询文本对应的待查询对象集合为例进行介绍,但并不构成对本申请实施例的限定,在其他可行的实现方式中,服务设备也可以从非知识图谱的知识组织结构中确定待查询文本对应的待查询对象集合,该知识组织结构用于存储多个对象以及各个对象之间的关系,该知识组织结构存储于预设数据库中。
步骤S203:服务设备从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息。
具体的,服务设备从预设数据库中确定该待查询文本对应的待查询对象集合之后,可以从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息,进而根据各个待查询对象集合中待查询对象的关系信息,确定前述待查询文本对应的查询领域。
在本申请实施例中,预设的两两对象之间的关系信息可以存储于前述预设数据库,知识图谱中的两个节点通过一条边相连时,这两个节点对应的实体之间的关系信息可以存储于预设数据库中。两个对象之间的关系信息可以为该两个对象在知识图谱中对应的节点之间的关系,例如,两个对象分别为人物“郭某某A”和相声《XX传》时,人物“郭某某A”和相声《XX传》之间的关系信息可以为创作关系或者表演关系(假设相声《XX传》是由郭某某A创作或者表演的)。
需要说明的是,在本申请实施例中,节点、实体和对象在预设数据库(如预设数据库中的知识图谱)中相当于同一概念。各个待查询对象集合中待查询对象的关系信息是指该待查询对象与知识图谱中的所有对象中除该待查询对象以外的其他对象之间的关系信息,其中,该其他对象在知识图谱中对应的节点与该待查询对象在知识图谱中对应的节点通过一条边相连接,即该其他对象与该待查询对象在知识图谱中具有关联关系。
待查询对象的关系信息可以包括该待查询对象与一个或多个对象之间的关系信息。在一种实现方式中,待查询对象的关系信息可以包括该待查询对象与所有对象之间的关系信息,或者该待查询对象与所有对象中的部分对象之间的关系信息。其中,该所有对象为该待查询对象在知识图谱中具有关联关系的所有对象。例如,若待查询对象1对应的节点在知识图谱中与10个节点分别通过不同的边相连,即待查询对象1与10个对象具有关联关系。此时,前述所有对象即包括这10个对象,前述部分对象即为这10个对象中的部分对象。
具体的,若待查询对象集合包括一个待查询对象,则服务设备可以获取该待查询对象关联的所有对象与该待查询对象之间的关系信息。若待查询对象集合包括多个待查询对象,针对各个待查询对象,服务设备可以获取该待查询对象在该待查询对象集合中关联的所有对象与该待查询对象之间的关系信息。例如,若待查询对象集合包括4个待查询对象(如待查询对象1、待查询对象2、待查询对象3、待查询对象4),且该4个待查询对象在知识图谱中的关系如下:待查询对象1与待查询对象2、待查询对象3、对象5(对象5是知识图谱中的一个实体)均关联,待查询对象3与待查询对象4关联。此时,服务设备获取的关系信息可以包括:待查询对象1与待查询对象2之间的关系信息,待查询对象1与待查询对象3之间的关系信息,以及待查询对象3与待查询对象4之间的关系信息。由此可见,服务设备在获取待查询对象1的关系信息时,可以获取待查询对象1在待查询对象集合中关联的所有对象(即待查询对象2和待查询对象3)与待查询对象1之间的关系信息,而不用获取待查询对象1与待查询对象集合以外的其他对象(即对象5)之间的关系信息。
在本申请实施例中,预设的两两对象之间的关系信息可以从网络中自动抓取,且可以实时刷新,预设的两两对象之间的关系信息的生成和维护可以不用人工参与。这样可以使得从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息的效率更高,且可以确保确定出的待查询对象的关系信息的时效性。
步骤S204:服务设备根据各个待查询对象集合中待查询对象的关系信息,确定前述待查询文本对应的查询领域。
具体的,服务设备确定各个待查询对象集合中待查询对象的关系信息之后,可以根据各个待查询对象集合中待查询对象的关系信息,确定前述待查询文本对应的查询领域。
在本申请实施例中,服务设备可以预先设置支持的领域,服务设备可以支持一个或多个领域,本申请实施例以服务设备支持多个领域为例进行说明。需要说明的是,服务设备支持多个领域表示:服务设备可以获取所支持的每个领域中的资源。具体的,服务设备所支持的领域的资源可以存储于服务设备本地,也可以存储于各个领域对应的云端服务器中,本申请实施例对此不做限定。在本申请实施例中,待查询文本对应的查询领域的数量可以为一个或多个。
服务设备根据各个待查询对象集合中待查询对象的关系信息,可以确定用户输入待查询文本时实际想访问的是所支持的多个领域中的哪个领域的资源,进而将用户实际想访问的领域作为该待查询文本对应的查询领域,并仅在查询领域对应的服务设备进行查询,从而有利于降低查询结果冗余。其中,查询领域对应的服务设备可以为数据服务器。
在一种实现方式中,服务设备根据各个待查询对象集合中待查询对象的关系信息,确定前述待查询文本对应的查询领域之后,还可以将任意一个待查询对象集合对应的文本信息发送给该查询领域对应的服务设备。查询领域对应的服务设备接收到待查询对象集合对应的文本信息之后,可以根据该文本信息得到查询结果,并将查询结果发送给服务设备。服务设备接收到来自查询领域对应的服务设备的查询结果之后,可以输出该查询结果。
其中,各个待查询对象集合对应的文本信息可以包括该待查询对象集合中的待查询对象对应的字词。例如,第一个待查询对象集合中的待查询对象包括人物“郭某某A”和相声《XX传》,且第二个待查询对象集合中的待查询对象包括人物“郭某某A”和电视剧《XX传》时,第一个待查询对象集合对应的文本信息和第二个待查询对象集合对应的文本信息均可以为“郭某某A”和“XX传”。需要说明的是,各个待查询对象集合对应的文本信息均相同,因此,服务设备将任意一个待查询对象集合对应的文本信息发送给该查询领域对应的服务设备,即可得到用户需要的查询结果。
通过仅将待查询对象集合对应的文本信息发送给上述查询领域对应的服务设备,既可以使得用户可以得到需要的查询结果,也可以避免向服务设备所支持的所有领域对应的服务设备发送待查询对象集合对应的文本信息所导致的额外开销。同时,还能避免搜索得到一些用户并不需要的查询结果,这样有利于降低查询结果冗余。
需要说明的是,查询领域对应的服务设备可以与确定查询领域的服务设备为同一设备,也可以为不同设备。当查询领域对应的服务设备与确定查询领域的服务设备为不同设备时,服务设备确定待查询文本对应的查询领域之后,将待查询对象集合对应的文本信息发送给该查询领域对应的服务设备仅用于举例说明,并不构成对本申请实施例的限定。当查询领域对应的服务设备与确定查询领域的服务设备为同一设备时,服务设备可以在查询领域对应的数据库中,根据任意一个待查询对象集合对应的文本信息得到查询结果。其中,服务设备支持的不同领域对应的资源可以存储于该服务设备中不同的本地数据库中。通过这种方式,可以避免在服务设备支持的所有领域对应的数据库中进行查询,而仅需在查询领域对应的数据库中查询,这样可以确保得到用户需要的查询结果的同时,提高查询效率,还可以降低查询结果冗余。
在一种实现方式中,服务设备获取的查询结果的数量可以为一个或多个。当查询结果的数量为多个时,服务设备得到查询结果之后,还可以对该查询结果进行排序处理,并输出排序后的查询结果。通过对查询结果进行排序处理,可以优先输出更符合用户搜索需求的查询结果,即将更符合用户搜索需求的查询结果排在前面展示给用户,这样可以有效提高智能搜索效果。
通过实施本申请实施例,根据各个待查询对象集合中待查询对象的关系信息,可以确定用户输入待查询文本时实际想访问的是服务设备所支持的多个领域中的哪个领域的资源,进而将用户实际想访问的领域作为该待查询文本对应的查询领域,并仅在查询领域对应的服务设备进行查询。相较于在服务设备支持的所有领域对应的服务设备中进行查询,采用本申请实例,可以降低查询的领域数量,即可以缩小查询范围,这样不仅可以查询得到与用户意图相匹配的查询结果,还有利于提高查询效率、降低查询结果冗余。
请参见图3,图3是本申请实施例提供的另一种数据处理方法的流程示意图,该方法详细描述了如何从预设数据库中确定待查询文本对应的待查询对象集合,以及当各个待查询对象集合包括一个待查询对象时,如何根据各个待查询对象集合中待查询对象的关系信息,确定待查询文本对应的查询领域。其中,步骤S301~S306的执行主体为服务设备,或者为服务设备中的芯片,以下以服务设备为数据处理方法的执行主体为例进行说明。如图3所示,该方法可以包括但不限于如下步骤:
步骤S301:服务设备获取待查询文本。
需要说明的是,步骤S301的执行过程可参见图2中步骤S201的具体描述,此处不再赘述。
步骤S302:服务设备确定目标文本,该目标文本为对该待查询文本进行自然语言理解NLU处理后得到的文本。
具体的,服务设备获取待查询文本之后,可以对该待查询文本进行NLU处理,得到目标文本。其中,目标文本可以是一个短语。对待查询文本进行处理得到的目标文本的数量可以为一个或多个。例如,待查询文本为“郭某某A的XX传”时,对该待查询文本进行NLU处理后得到一个短语,该短语为“郭某某A的XX传”。又如,待查询文本为“郭某某B的父亲的XX传”时,对该待查询文本进行NLU处理后得到两个短语,两个短语分别为“郭某某B的父亲”、“XX传”。又如,待查询文本为“邓某的妻子的作品”时,对该待查询文本进行NLU处理后得到一个短语,该短语为“邓某的妻子”。
步骤S303:服务设备对该目标文本进行分词处理,得到该目标文本的各个分词。
具体的,服务设备确定目标文本之后,可以分别对各个目标文本进行分词处理,得到各个目标文本的各个分词。
在一种实现方式中,服务设备可以调用分词算法对目标文本进行分词处理,得到该目标文本的各个分词。在一种实现方式中,分词算法可以包括但不限于基于字符串匹配的分词算法(如正向最大匹配法、逆向最大匹配法、最少切分、双向最大匹配法等)、基于理解的分词算法和基于统计的分词算法,本申请实施例对此不作限定。
例如,当两个目标文本分别为“郭某某B的父亲”和“XX传”时,对“郭某某B的父亲”进行分词处理后得到的分词包括“郭某某B”和“父亲”,对“XX传”进行分词处理后得到的分词包括“XX传”。
步骤S304:服务设备根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象,待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象。
具体的,服务设备得到目标文本的各个分词之后,可以根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象。
在本申请实施例中,一个分词在预设数据库中可以对应一个或多个对象(即实体),也可以不存在对应的对象(即实体)。需要说明的是,同一目标文本中的不同分词在预设数据库中对应的对象数量相互独立。例如,目标文本为“郭某某B的父亲”时,该目标文本包括两个分词(即“郭某某B”和“父亲”),其中,分词“郭某某B”在预设数据库中可以对应一个实体(如人物“郭某某B”),分词“父亲”在预设数据库中可以不存在对应的实体。
需要说明的是,根据每个目标文本的分词,在预设数据库中至少可以确定一个待查询对象。该待查询对象可以是该目标文本的其中一个分词在预设数据库中对应的实体,也可以是根据该目标文本的其中一个分词在预设数据库中对应的实体,以及该目标文本中除该分词以外的其他分词推理得到的实体。
在一种实现方式中,目标文本的各个分词在预设数据库中均存在对应的对象,服务设备根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象的具体实施方式可以为:针对目标文本的各个分词,将该分词在预设数据库中对应的不同对象作为不同待查询对象集合中的待查询对象。例如,目标文本为“XX传”时,该目标文本仅包括一个分词(即“XX传”),若该分词在预设数据库中对应2个不同的对象,该2个对象分别为相声《XX传》和电视剧《XX传》时,服务设备可以将相声《XX传》作为第一待查询对象集合中的待查询对象,并将电视剧《XX传》作为第二待查询对象集合中的待查询对象。其中,第一待查询对象集合和第二待查询对象集合为不同的待查询对象集合。
在一种实现方式中,若目标文本仅包括一个分词,且该分词在预设数据库中仅对应一个对象,且待查询对象集合的数量为N个,则服务设备可以将该分词在预设数据库中对应的对象作为该N个待查询对象集合中的待查询对象。
在一种实现方式中,各个待查询对象集合中的待查询对象的数量相同,待查询对象集合中的待查询对象的数量可以为对待查询文本进行NLU处理之后得到的目标文本的数量。例如,待查询文本为“郭某某B的父亲的XX传”时,对该待查询文本进行NLU处理后可以得到2个目标文本(即“郭某某B的父亲”和“XX传”),该待查询文本对应的待查询对象集合中的待查询对象可以包括人物“郭某某A”和相声《XX传》(或者人物“郭某某A”和电视剧《XX传),即该待查询文本对应的待查询对象集合中的待查询对象的数量也为2个。
在一种实现方式中,目标文本的分词至少可以包括一个第一分词和一个第二分词,该第一分词在预设数据库中对应第一对象,该第二分词在预设数据库中不存在对应的对象;服务设备根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象的具体实施方式可以为:从预设的两两对象之间的关系信息中确定该第一对象的关系信息;从该第一对象的关系信息中确定与该第二分词具有匹配关系的第一关系信息;若该第一对象在预设数据库中通过该第一关系信息与第二对象相连接,则根据该第二对象确定目标对象;并将该目标对象作为各个待查询对象集合中的待查询对象。
其中,第一对象的关系信息可以包括该第一对象与多个对象中的各个对象之间的关系,或者包括该第一对象与多个对象中的各个对象之间的关系类型,该多个对象中的各个对象为与该第一对象在预设数据库中存在关联关系的对象。例如,第一对象为人物“郭某某B”,且人物“郭某某B”在预设数据库中与2个对象(如人物“郭某某A”和喜剧节目《XX喜剧人》)具有关联关系时。此时,人物“郭某某B”与人物“郭某某A”之间的关系可以为父子,该关系的类型可以为亲属;人物“郭某某B”与喜剧节目《XX喜剧人》之间的关系可以为节目嘉宾,该关系的类型可以为节目。
第一对象的关系信息中的第一关系信息与第二分词具有匹配关系可以表示:该第一关系信息与该第二分词为同义词。例如,目标分词为“郭某某B的父亲”,该目标分词中的第一分词为“郭某某B”,第二分词为“父亲”,且第一分词在预设数据库中对应的第一对象为人物“郭某某B”时,若人物“郭某某B”在预设数据库中与2个对象(如人物“郭某某A”和喜剧节目《XX喜剧人》)具有关联关系,且人物“郭某某B”与人物“郭某某A”之间的关系为父子,人物“郭某某B”与喜剧节目《XX喜剧人》之间的关系为节目嘉宾。由于“父亲”(即第二分词)与人物“郭某某B”的关系信息中的父子关系为同义词,因此,可以将“父子”关系作为第一关系信息。由于人物“郭某某B”与人物“郭某某A”在预设数据库中通过该第一关系信息(即“父子”关系)相连接,因此,可以将人物“郭某某A”确定为第二对象。
在一种实现方式中,若目标文本包括一个第一分词和一个第二分词,则服务设备可以将第二对象作为目标对象,即将第二对象作为各个待查询对象集合中的待查询对象。
在一种实现方式中,若目标文本包括一个第一分词和多个第二分词,则服务设备可以根据该第二对象确定目标对象,并将该目标对象作为各个待查询对象集合中的待查询对象。具体的,服务设备可以根据该第二对象和该多个第二分词中除了用于确定该第二对象以外的其他第二分词,确定目标对象。例如,若目标文本为“郭某某B的弟弟的哥哥的父亲”,此时,该目标文本包括一个第一分词(即“郭某某B”),三个第二分词(分别为“弟弟”、“哥哥”、“父亲”)。根据该第一分词和第一个第二分词(即“弟弟”)确定出的第二对象为人物“郭某某C”。根据人物“郭某某C”和第二个第二分词(即“哥哥”)确定出的第三对象为人物“郭某某B”。根据人物“郭某某B”和第三个第二分词(即“父亲”)确定出的第四对象为人物“郭某某A”。直至目标文本的所有第二分词均用于确定出一个对象之后,可以将最后得到的对象(即第四对象)作为目标对象。通过这种方式,可以实现多级推理(如上例中实现了三级推理),从而有利于确定出用户实际需要查询的对象(即目标对象)。
步骤S305:服务设备从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息。
需要说明的是,步骤S305的执行过程可参见图2中步骤S203的具体描述,此处不再赘述。
步骤S306:针对各个待查询对象集合,若该待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则服务设备确定该第一预设领域属于前述待查询文本对应的查询领域;各个待查询对象集合包括一个待查询对象,各个待查询对象集合中待查询对象的关系信息包括一个或多个关系类型。
具体的,当各个待查询对象集合包括一个待查询对象时,针对各个待查询对象集合,若该待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则服务设备可以确定该第一预设领域属于前述待查询文本对应的查询领域。
其中,第一预设领域的数量可以为一个或多个,该第一预设领域可以是服务设备支持的多个领域中的一个或多个领域。即服务设备首先可以根据预设的关系类型和预设领域之间的对应关系,确定待查询对象集合中待查询对象的关系类型所属的领域,若该领域为服务设备支持的领域中的任意一个或多个领域,则服务设备可以确定该一个或多个领域属于前述待查询文本对应的查询领域。
需要说明的是,不同待查询对象集合中待查询对象的关系类型中可以存在属于不同的第一预设领域的关系类型。例如,当服务设备支持3个领域(如影视、音乐、有声),且待查询文本对应的待查询对象集合的数量为2个,且该2个待查询对象集合包括一个待查询对象时,第一个待查询对象集合中的待查询对象的关系类型中可以存在属于影视、音乐这两个领域的关系类型,第二个待查询对象集合中的待查询对象的关系类型中可以存在属有声领域的关系类型。即第一个待查询对象集合对应的第一预设领域包括影视、音乐,第二个待查询对象集合对应的第一预设领域包括有声,第一个待查询对象集合和第二个待查询对象集合对应的第一预设领域不同。前述待查询文本对应的查询领域包括各个待查询对象集合对应的第一预设领域,即前述待查询文本对应的查询领域包括影视、音乐、有声这3个领域。
实际情况下,一个实体(即对象)在知识图谱中可以存在大量的关系,通过将关系进行分类,可以将大量的关系分成较少的关系类型。并且通过实体的关系类型也同样可以确定出待查询文本对应的查询领域,相较于通过实体的关系确定待查询文本对应的查询领域,通过实体的关系类型确定待查询文本对应的查询领域,可以提高确定待查询文本对应的查询领域的效率。
在本申请实施例中,各个待查询对象集合中待查询对象的关系信息可以包括多个关系类型,例如,当待查询对象集合包括一个待查询对象(如“郭某某A”),该待查询对象在知识图谱中可以通过创作关系和/或表演关系与对象1(如相声《XX传》)相连接,还可以通过表演关系与对象2(如电影《XX归根》)相连接,且创作关系的类型属于影视领域或有声领域,表演关系的类型属于影视领域。此时,该待查询对象的关系信息可以包括创作关系的类型和表演关系的类型。
需要说明的是,本申请实施例也可以通过待查询对象集合中待查询对象的关系确定待查询文本对应的查询领域。具体的,服务设备可以确定待查询对象集合中待查询对象的关系所属的领域,若该领域为服务设备支持的领域中的任意一个或多个领域,则服务设备可以确定该一个或多个领域属于前述待查询文本对应的查询领域。
还需要说明的是,本申请实施例通过知识图谱不仅可以确定待查询文本对应的查询领域,还可以从该知识图谱中获取待查询对象之间的关系信息,该关系信息属于待查询文本对应的查询领域。换言之,本申请实施例可以提供可解释的领域校验功能,不仅可以确定待查询文本对应的查询领域,还可以确定在该查询领域中待查询对象之间是通过何种关系相关联的。例如,待查询文本为“郭某某A的XX传”时,确定出的该查询文本对应的查询领域为影视,并且还可以确定待查询对象人物“郭某某A”和相声《XX传》是通过属于影视领域的创作关系相关联。
通过实施本申请实施例,根据各个待查询对象集合中待查询对象的关系类型,可以确定用户输入待查询文本时实际想访问的是服务设备所支持的多个领域中的哪个领域的资源,进而将用户实际想访问的领域作为该待查询文本对应的查询领域,并仅在查询领域对应的服务设备进行查询。相较于在服务设备支持的所有领域对应的服务设备中进行查询,采用本申请实例,可以降低查询的领域数量,即可以缩小查询范围,这样不仅可以查询得到与用户意图相匹配的查询结果,还有利于提高查询效率、降低查询结果冗余。另外,相较于通过待查询对象的关系确定待查询文本对应的查询领域,通过待查询对象的关系类型确定待查询文本对应的查询领域,可以提高确定待查询文本对应的查询领域的效率。
请参见图4,图4是本申请实施例提供的又一种数据处理方法的流程示意图,该方法详细描述了当各个待查询对象集合包括多个待查询对象时,如何根据各个待查询对象集合中待查询对象的关系信息,确定待查询文本对应的查询领域。其中,步骤S401~S406的执行主体为服务设备,或者为服务设备中的芯片,以下以服务设备为数据处理方法的执行主体为例进行说明。如图4所示,该方法可以包括但不限于如下步骤:
步骤S401:服务设备获取待查询文本。
需要说明的是,步骤S401的执行过程可参见图2中步骤S201的具体描述,此处不再赘述。
步骤S402:服务设备确定目标文本,该目标文本为对该待查询文本进行自然语言理解NLU处理后得到的文本。
步骤S403:服务设备对该目标文本进行分词处理,得到该目标文本的各个分词。
步骤S404:服务设备根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象,待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象。
步骤S405:服务设备从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息。
需要说明的是,步骤S402~S405的执行过程可分别参见图3中步骤S302~S304、图2中步骤S203的具体描述,此处不再赘述。
步骤S406:针对各个待查询对象集合,若该待查询对象集合中的各个待查询对象通过类型属于第一预设领域的关系相连接,则服务设备确定该第一预设领域属于前述待查询文本对应的查询领域;其中,各个待查询对象集合包括多个待查询对象,各个待查询对象集合中的各个待查询对象的关系信息包括该待查询对象与该待查询对象集合中除该待查询对象以外的其他待查询对象之间的关系类型。
当各个待查询对象集合包括多个待查询对象时,待查询对象集合中的各个待查询对象的关系信息可以包括该待查询对象与该待查询对象集合中除该待查询对象以外的其他待查询对象之间的关系类型。例如,当待查询文本为“郭某某A的XX传”,该待查询文本对应的待查询对象集合中的待查询对象包括人物“郭某某A”和相声《XX传》,且人物“郭某某A”在知识图谱中与2个对象(如相声《XX传》和人物“郭某某B”)具有关联关系时,服务设备获取的人物“郭某某A”的关系信息可以包括人物“郭某某A”和相声《XX传》之间的关系的类型,即服务设备可以不获取人物“郭某某A”和人物“郭某某B”(人物“郭某某B”是待查询对象集合以外的对象)之间的关系的类型。因此,只有人物“郭某某A”和相声《XX传》之间的关系的类型可以用于确定上述待查询文本对应的查询领域。
当各个待查询对象集合包括多个待查询对象时,服务设备根据各个待查询对象集合中待查询对象的关系信息,确定待查询文本对应的查询领域的具体实施方式可以为:针对各个待查询对象集合,判断该待查询对象集合中的各个待查询对象在预设数据库中是否连通,若连通,则进一步根据预设的关系类型和预设领域之间的对应关系,确认待查询对象集合中的各个待查询对象是否通过类型属于同一领域的关系相连接,若是,且该同一领域为服务设备支持的多个领域中的一个或多个领域,则确定该一个或多个领域属于前述待查询文本对应的查询领域。
若该待查询对象集合中的各个待查询对象在预设数据库中不连通,则表明通过该待查询对象集合无法确定前述待查询文本对应的查询领域,此时,服务设备可以通过其他的待查询对象集合确定前述待查询文本对应的查询领域。例如,若待查询文本为“郭某某A的XX传”,且该待查询文本对应两个待查询对象集合,第一个待查询对象集合包括的待查询对象为人物“郭某某A”和电视剧《XX传》,第二个待查询对象集合包括的待查询对象为人物“郭某某A”和相声《XX传》。若人物“郭某某A”和电视剧《XX传》在预设数据库中不具有关联关系,即人物“郭某某A”在预设数据库的知识图谱中对应的节点和电视剧《XX传》在预设数据库的知识图谱中对应的节点之间没有边相连接,此时,服务设备可以通过第二个待查询对象集合确定该待查询文本对应的查询领域。第二个待查询对象集合中的人物“郭某某A”和相声《XX传》在预设数据库中通过创作关系相连接,该创作关系的类型属于有声领域,若服务设备支持的领域包括影视、有声和音乐,此时,服务设备可以将有声领域作为上述待查询文本对应的查询领域。
若待查询对象集合中的各个待查询对象不通过类型属于同一领域的关系相连接,表明通过该待查询对象集合无法确定前述待查询文本对应的查询领域,此时,服务设备可以通过其他的待查询对象集合确定前述待查询文本对应的查询领域。
其中,第一预设领域的数量可以为一个或多个,该第一预设领域可以是服务设备支持的多个领域中的一个或多个领域。
通过实施本申请实施例,当各个待查询对象集合包括多个待查询对象时,根据各个待查询对象集合中待查询对象的关系类型,可以确定用户输入待查询文本时实际想访问的是服务设备所支持的多个领域中的哪个领域的资源,进而将用户实际想访问的领域作为该待查询文本对应的查询领域,并仅在查询领域对应的服务设备进行查询。相较于在服务设备支持的所有领域对应的服务设备中进行查询,采用本申请实例,可以降低查询的领域数量,即可以缩小查询范围,这样不仅可以查询得到与用户意图相匹配的查询结果,还有利于提高查询效率、降低查询结果冗余。另外,相较于通过待查询对象的关系确定待查询文本对应的查询领域,通过待查询对象的关系类型确定待查询文本对应的查询领域,可以提高确定待查询文本对应的查询领域的效率。
上述详细阐述了本申请实施例的方法,下面提供本申请实施例的装置。
请参见图5,图5是本申请实施例提供的一种数据处理装置的结构示意图,该数据处理装置可以为服务设备或用于服务设备的装置(例如芯片),数据处理装置50用于执行图2-图4对应的方法实施例中服务设备所执行的步骤,数据处理装置50可以包括:
获取模块501,用于获取待查询文本;
处理模块502,用于从预设数据库中确定该待查询文本对应的待查询对象集合,该待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象;
该处理模块502,还用于从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息;
该处理模块502,还用于根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域。
在一种实现方式中,各个待查询对象集合可以包括一个待查询对象,各个待查询对象集合中待查询对象的关系信息可以包括一个或多个关系类型;处理模块502用于根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域时,具体可以用于:针对各个待查询对象集合,若该待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则确定该第一预设领域属于上述待查询文本对应的查询领域。
在一种实现方式中,各个待查询对象集合可以包括多个待查询对象,各个待查询对象集合中的各个待查询对象的关系信息可以包括该待查询对象与该待查询对象集合中除该待查询对象以外的其他待查询对象之间的关系类型;处理模块502用于根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域时,具体可以用于:针对各个待查询对象集合,若该待查询对象集合中的各个待查询对象通过类型属于第一预设领域的关系相连接,则确定该第一预设领域属于上所述待查询文本对应的查询领域。
在一种实现方式中,处理模块502用于从预设数据库中确定上述待查询文本对应的待查询对象集合时,具体可以用于:确定目标文本,该目标文本为对上述待查询文本进行自然语言理解NLU处理后得到的文本;对该目标文本进行分词处理,得到该目标文本的各个分词;根据该述目标文本的各个分词,从所述预设数据库中确定各个待查询对象集合中的待查询对象。
在一种实现方式中,上述目标文本的各个分词在预设数据库中均存在对应的对象;处理模块502用于根据上述目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象时,具体可以用于:针对该目标文本的各个分词,将该分词在预设数据库中对应的不同对象作为不同待查询对象集合中的待查询对象。
在一种实现方式中,上述目标文本的分词至少可以包括第一分词和第二分词,该第一分词在预设数据库中对应第一对象,该第二分词在所述预设数据库中不存在对应的对象;处理模块502用于根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象时,具体可以用于:从预设的两两对象之间的关系信息中确定该第一对象的关系信息;从该第一对象的关系信息中确定与该第二分词具有匹配关系的第一关系信息;若该第一对象在预设数据库中通过该第一关系信息与第二对象相连接,则根据该第二对象确定目标对象;并将该目标对象作为各个待查询对象集合中的待查询对象。
在一种实现方式中,数据处理装置50还可以包括通信模块503和输出模块504;该通信模块503,可以用于将任意一个待查询对象集合对应的文本信息发送给上述查询领域对应的服务设备;该通信模块503,还可以用于接收来自该查询领域对应的服务设备的查询结果;输出模块504,可以用于输出该查询结果。
需要说明的是,图5对应的实施例中未提及的内容以及各个模块执行步骤的具体实现方式可参见图2-图4所示实施例以及前述内容,这里不再赘述。
在一种实现方式中,图5中的各个模块所实现的相关功能可以结合处理器与通信接口来实现。参见图6,图6是本申请实施例提供的另一种数据处理装置的结构示意图,该数据处理装置可以为服务设备或用于服务设备的装置(例如芯片)。该数据处理装置60可以包括通信接口601、处理器602和存储器603,通信接口601、处理器602和存储器603可以通过一条或多条通信总线相互连接,也可以通过其它方式相连接。图5所示的获取模块501、处理模块502、通信模块503和输出模块504所实现的相关功能可以通过同一个处理器602来实现,也可以通过多个不同的处理器602来实现。
通信接口601可以用于发送数据和/或信令,以及接收数据和/或信令。应用在本申请实施例中,通信接口601可以用于将任意一个待查询对象集合对应的文本信息发送给上述查询领域对应的服务设备。通信接口601可以为收发器。
处理器602被配置为执行图2-图4所述方法中服务设备相应的功能。该处理器602可以包括一个或多个处理器,例如该处理器602可以是一个或多个中央处理器(centralprocessing unit,CPU),网络处理器(network processor,NP),硬件芯片或者其任意组合。在处理器602是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器603用于存储程序代码等。存储器603可以包括易失性存储器(volatilememory),例如随机存取存储器(random access memory,RAM);存储器603也可以包括非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器603还可以包括上述种类的存储器的组合。
处理器602可以调用存储器603中存储的程序代码以执行以下操作:
获取待查询文本;
从预设数据库中确定该待查询文本对应的待查询对象集合,该待查询对象集合的数量为一个或多个,各个待查询对象集合包括一个或多个待查询对象;
从预设的两两对象之间的关系信息中确定各个待查询对象集合中待查询对象的关系信息;
根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域。
在一种实现方式中,各个待查询对象集合可以包括一个待查询对象,各个待查询对象集合中待查询对象的关系信息可以包括一个或多个关系类型;处理器602执行根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域时,具体可以执行以下操作:针对各个待查询对象集合,若该待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则确定该第一预设领域属于上述待查询文本对应的查询领域。
在一种实现方式中,各个待查询对象集合可以包括多个待查询对象,各个待查询对象集合中的各个待查询对象的关系信息可以包括该待查询对象与该待查询对象集合中除该待查询对象以外的其他待查询对象之间的关系类型;处理器602执行根据各个待查询对象集合中待查询对象的关系信息,确定上述待查询文本对应的查询领域时,具体可以执行以下操作:针对各个待查询对象集合,若该待查询对象集合中的各个待查询对象通过类型属于第一预设领域的关系相连接,则确定该第一预设领域属于上所述待查询文本对应的查询领域。
在一种实现方式中,处理器602执行从预设数据库中确定上述待查询文本对应的待查询对象集合时,具体可以执行以下操作:确定目标文本,该目标文本为对上述待查询文本进行自然语言理解NLU处理后得到的文本;对该目标文本进行分词处理,得到该目标文本的各个分词;根据该述目标文本的各个分词,从所述预设数据库中确定各个待查询对象集合中的待查询对象。
在一种实现方式中,上述目标文本的各个分词在预设数据库中均存在对应的对象;处理器602执行根据上述目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象时,具体可以执行以下操作:针对该目标文本的各个分词,将该分词在预设数据库中对应的不同对象作为不同待查询对象集合中的待查询对象。
在一种实现方式中,上述目标文本的分词至少可以包括第一分词和第二分词,该第一分词在预设数据库中对应第一对象,该第二分词在所述预设数据库中不存在对应的对象;处理器602执行根据该目标文本的各个分词,从预设数据库中确定各个待查询对象集合中的待查询对象时,具体可以执行以下操作:从预设的两两对象之间的关系信息中确定该第一对象的关系信息;从该第一对象的关系信息中确定与该第二分词具有匹配关系的第一关系信息;若该第一对象在预设数据库中通过该第一关系信息与第二对象相连接,则根据该第二对象确定目标对象;并将该目标对象作为各个待查询对象集合中的待查询对象。
在一种实现方式中,处理器602还可以执行以下操作:将任意一个待查询对象集合对应的文本信息发送给上述查询领域对应的服务设备;接收来自该查询领域对应的服务设备的查询结果;并输出该查询结果。
进一步地,处理器602还可以执行图2-图4所示实施例中服务设备对应的操作,具体可参见方法实施例中的描述,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,可以用于存储图5所示实施例中数据处理装置所用的计算机软件指令,其包含用于执行上述实施例中为服务设备所设计的程序。
上述计算机可读存储介质包括但不限于快闪存储器、硬盘、固态硬盘。
本申请实施例还提供一种计算机程序产品,该计算机产品被计算设备运行时,可以执行上述图2-图4实施例中为服务设备所设计的方法。
在本申请实施例中还提供一种芯片,包括处理器和存储器,该存储器用包括处理器和存储器,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,该计算机程序用于实现上述方法实施例中的方法。
本领域普通技术人员可以意识到,结合本申请中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种数据处理方法,其特征在于,所述方法包括:
获取待查询文本;
根据目标文本的各个分词,从预设数据库中确定待查询对象集合中的待查询对象,所述待查询对象集合的数量为一个或多个,各个所述待查询对象集合包括一个或多个待查询对象,所述目标文本为对所述待查询文本进行自然语言理解NLU处理后得到的文本;
从预设的两两对象之间的关系信息中确定各个所述待查询对象集合中待查询对象的关系信息;
针对各个所述待查询对象集合,若所述待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则确定所述第一预设领域属于所述待查询文本对应的查询领域,所述待查询对象集合包括一个待查询对象,所述待查询对象集合中的待查询对象的关系信息包括一个或多个关系类型;或者,针对各个所述待查询对象集合,若所述待查询对象集合中的各个待查询对象通过类型属于第一预设领域的关系相连接,则确定所述第一预设领域属于所述待查询文本对应的查询领域,所述待查询对象集合包括多个待查询对象,所述待查询对象集合中的待查询对象的关系信息包括所述待查询对象与所述待查询对象集合中除所述待查询对象以外的其他待查询对象之间的关系类型。
2.根据权利要求1所述的方法,其特征在于,所述目标文本的各个分词在所述预设数据库中均存在对应的对象;
所述根据所述目标文本的各个分词,从所述预设数据库中确定各个所述待查询对象集合中的待查询对象,包括:
针对目标文本的各个分词,将所述分词在所述预设数据库中对应的不同对象作为不同待查询对象集合中的待查询对象。
3.根据权利要求1所述的方法,其特征在于,所述目标文本的分词至少包括第一分词和第二分词,所述第一分词在所述预设数据库中对应第一对象,所述第二分词在所述预设数据库中不存在对应的对象;
所述根据所述目标文本的各个分词,从所述预设数据库中确定各个所述待查询对象集合中的待查询对象,包括:
从所述预设的两两对象之间的关系信息中确定所述第一对象的关系信息;
从所述第一对象的关系信息中确定与所述第二分词具有匹配关系的第一关系信息;
若所述第一对象在所述预设数据库中通过所述第一关系信息与第二对象相连接,则根据所述第二对象确定目标对象;
将所述目标对象作为各个所述待查询对象集合中的待查询对象。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述根据各个所述待查询对象集合中待查询对象的关系信息,确定所述待查询文本对应的查询领域之后,所述方法还包括:
将任意一个所述待查询对象集合对应的文本信息发送给所述查询领域对应的服务设备;
接收来自所述服务设备的查询结果;
输出所述查询结果。
5.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取待查询文本;
处理模块,用于根据目标文本的各个分词,从预设数据库中确定待查询对象集合中的待查询对象,所述待查询对象集合的数量为一个或多个,各个所述待查询对象集合包括一个或多个待查询对象,所述目标文本为对所述待查询文本进行自然语言理解NLU处理后得到的文本;
所述处理模块,还用于从预设的两两对象之间的关系信息中确定各个所述待查询对象集合中待查询对象的关系信息;
所述处理模块,还用于针对各个所述待查询对象集合,若所述待查询对象集合中待查询对象的关系类型中存在属于第一预设领域的关系类型,则确定所述第一预设领域属于所述待查询文本对应的查询领域,所述待查询对象集合包括一个待查询对象,所述待查询对象集合中的待查询对象的关系信息包括一个或多个关系类型;或者,针对各个所述待查询对象集合,若所述待查询对象集合中的各个待查询对象通过类型属于第一预设领域的关系相连接,则确定所述第一预设领域属于所述待查询文本对应的查询领域,所述待查询对象集合包括多个待查询对象,所述待查询对象集合中的待查询对象的关系信息包括所述待查询对象与所述待查询对象集合中除所述待查询对象以外的其他待查询对象之间的关系类型。
6.根据权利要求5所述的装置,其特征在于,所述目标文本的各个分词在所述预设数据库中均存在对应的对象;
所述处理模块用于根据所述目标文本的各个分词,从所述预设数据库中确定各个所述待查询对象集合中的待查询对象时,具体用于:针对目标文本的各个分词,将所述分词在所述预设数据库中对应的不同对象作为不同待查询对象集合中的待查询对象。
7.根据权利要求5所述的装置,其特征在于,所述目标文本的分词至少包括第一分词和第二分词,所述第一分词在所述预设数据库中对应第一对象,所述第二分词在所述预设数据库中不存在对应的对象;
所述处理模块用于根据所述目标文本的各个分词,从所述预设数据库中确定各个所述待查询对象集合中的待查询对象时,具体用于:从所述预设的两两对象之间的关系信息中确定所述第一对象的关系信息;从所述第一对象的关系信息中确定与所述第二分词具有匹配关系的第一关系信息;若所述第一对象在所述预设数据库中通过所述第一关系信息与第二对象相连接,则根据所述第二对象确定目标对象;将所述目标对象作为各个所述待查询对象集合中的待查询对象。
8.根据权利要求5~7任一项所述的装置,其特征在于,所述装置还包括通信模块和输出模块;
所述通信模块,用于将任意一个所述待查询对象集合对应的文本信息发送给所述查询领域对应的服务设备;
所述通信模块,还用于接收来自所述服务设备的查询结果;
所述输出模块,用于输出所述查询结果。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1~4任一项所述的方法。
CN201910776210.2A 2019-08-21 2019-08-21 一种数据处理方法及其装置 Active CN112416984B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201910776210.2A CN112416984B (zh) 2019-08-21 2019-08-21 一种数据处理方法及其装置
PCT/CN2020/107291 WO2021031862A1 (zh) 2019-08-21 2020-08-06 一种数据处理方法及其装置
US17/637,362 US20220292122A1 (en) 2019-08-21 2020-08-06 Data Processing Method and Apparatus
EP20854658.0A EP4020251A4 (en) 2019-08-21 2020-08-06 DATA PROCESSING METHOD AND ASSOCIATED APPARATUS

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910776210.2A CN112416984B (zh) 2019-08-21 2019-08-21 一种数据处理方法及其装置

Publications (2)

Publication Number Publication Date
CN112416984A CN112416984A (zh) 2021-02-26
CN112416984B true CN112416984B (zh) 2024-06-04

Family

ID=74660406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910776210.2A Active CN112416984B (zh) 2019-08-21 2019-08-21 一种数据处理方法及其装置

Country Status (4)

Country Link
US (1) US20220292122A1 (zh)
EP (1) EP4020251A4 (zh)
CN (1) CN112416984B (zh)
WO (1) WO2021031862A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7142315B2 (ja) * 2018-09-27 2022-09-27 パナソニックIpマネジメント株式会社 説明支援装置および説明支援方法
CN113902315A (zh) * 2021-10-13 2022-01-07 四川才能科技有限公司 一种智能生活服务系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170859A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN108205593A (zh) * 2017-12-29 2018-06-26 华为技术有限公司 一种查询的方法及装置
CN110008413A (zh) * 2019-03-14 2019-07-12 海信集团有限公司 一种交通出行问题查询方法和装置
CN110019911A (zh) * 2017-12-29 2019-07-16 苏州工业职业技术学院 支持知识演化的知识图谱的查询方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005029379A1 (ja) * 2003-09-19 2006-11-30 東芝ソリューション株式会社 情報処理装置及び情報処理方法
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US8019752B2 (en) * 2005-11-10 2011-09-13 Endeca Technologies, Inc. System and method for information retrieval from object collections with complex interrelationships
CN102339294B (zh) * 2010-07-27 2013-09-11 卓望数码技术(深圳)有限公司 一种对关键词进行预处理的搜索方法和系统
CN102591880B (zh) * 2011-01-14 2015-02-18 阿里巴巴集团控股有限公司 信息提供方法及装置
US10545956B2 (en) * 2015-06-05 2020-01-28 Insight Engines, Inc. Natural language search with semantic mapping and classification
CN108228657B (zh) * 2016-12-22 2022-05-27 沈阳美行科技股份有限公司 一种关键字检索的实现方法及装置
CN108268500A (zh) * 2016-12-30 2018-07-10 阿里巴巴集团控股有限公司 传输信息和显示信息的方法、设备及系统
CN108427686A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 文本数据查询方法及装置
US10657572B2 (en) * 2017-03-16 2020-05-19 Wipro Limited Method and system for automatically generating a response to a user query
CN107402954B (zh) * 2017-05-26 2020-07-10 百度在线网络技术(北京)有限公司 建立排序模型的方法、基于该模型的应用方法和装置
CN107451208B (zh) * 2017-07-12 2020-08-21 北京潘达互娱科技有限公司 一种数据搜索方法与装置
CN108228820A (zh) * 2017-12-30 2018-06-29 厦门太迪智能科技有限公司 用户查询意图理解方法、系统及计算机终端
CN108628941A (zh) * 2018-03-23 2018-10-09 华为技术有限公司 关联对象获取方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205593A (zh) * 2017-12-29 2018-06-26 华为技术有限公司 一种查询的方法及装置
CN110019911A (zh) * 2017-12-29 2019-07-16 苏州工业职业技术学院 支持知识演化的知识图谱的查询方法和装置
CN108170859A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN110008413A (zh) * 2019-03-14 2019-07-12 海信集团有限公司 一种交通出行问题查询方法和装置

Also Published As

Publication number Publication date
EP4020251A1 (en) 2022-06-29
EP4020251A4 (en) 2022-08-24
CN112416984A (zh) 2021-02-26
WO2021031862A1 (zh) 2021-02-25
US20220292122A1 (en) 2022-09-15

Similar Documents

Publication Publication Date Title
CN110910872B (zh) 语音交互方法及装置
WO2022052776A1 (zh) 一种人机交互的方法、电子设备及系统
CN111881315A (zh) 图像信息输入方法、电子设备及计算机可读存储介质
CN115333941B (zh) 获取应用运行情况的方法及相关设备
CN116070035A (zh) 数据处理方法和电子设备
CN112416984B (zh) 一种数据处理方法及其装置
EP4195073A1 (en) Content recommendation method, electronic device and server
WO2021238371A1 (zh) 生成虚拟角色的方法及装置
CN112740148A (zh) 一种向输入框中输入信息的方法及电子设备
CN113380240B (zh) 语音交互方法和电子设备
CN111339513B (zh) 数据分享的方法和装置
CN116561085A (zh) 图片分享方法和电子设备
CN116414500A (zh) 电子设备操作引导信息录制方法、获取方法和终端设备
CN114817521B (zh) 搜索方法和电子设备
CN117133311B (zh) 音频场景识别方法及电子设备
CN115437601B (zh) 图像排序方法、电子设备、程序产品及介质
CN114666441B (zh) 一种调用其他设备能力的方法、电子设备、系统和存储介质
CN114115772B (zh) 灭屏显示的方法及装置
CN116266159B (zh) 一种缺页异常处理方法和电子设备
WO2024087202A1 (zh) 一种搜索方法、模型训练方法、装置及存储介质
CN115016666B (zh) 触控处理方法、终端设备以及存储介质
WO2024114785A1 (zh) 一种图像处理方法、电子设备及系统
CN116301905A (zh) 数据处理方法以及相关设备
CN117131380A (zh) 匹配度计算方法及电子设备
CN116757259A (zh) 网络模型处理方法、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant