WO2023141900A1 - 新闻图文类数据知识图谱的建立方法、装置、设备及介质 - Google Patents

新闻图文类数据知识图谱的建立方法、装置、设备及介质 Download PDF

Info

Publication number
WO2023141900A1
WO2023141900A1 PCT/CN2022/074424 CN2022074424W WO2023141900A1 WO 2023141900 A1 WO2023141900 A1 WO 2023141900A1 CN 2022074424 W CN2022074424 W CN 2022074424W WO 2023141900 A1 WO2023141900 A1 WO 2023141900A1
Authority
WO
WIPO (PCT)
Prior art keywords
news
key information
text
image
related personnel
Prior art date
Application number
PCT/CN2022/074424
Other languages
English (en)
French (fr)
Inventor
张森
黄学涛
辛伏炎七妹
曾勇华
谭卓
许云侠
唐跃文
袁埜
张润南
Original Assignee
基建通(三亚)国际科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 基建通(三亚)国际科技有限公司 filed Critical 基建通(三亚)国际科技有限公司
Priority to PCT/CN2022/074424 priority Critical patent/WO2023141900A1/zh
Publication of WO2023141900A1 publication Critical patent/WO2023141900A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Abstract

本申请提供一种新闻图文类数据知识图谱的建立方法、装置、设备及介质,涉及计算机技术领域。方法包括获取新闻图文;如果新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对新闻现场图像中的人脸图像进行人脸识别,提取新闻文本中的第一关键信息,根据人脸识别结果和第一关键信息生成新闻相关人员的新闻记录;如果新闻图文中包括新闻文本,提取新闻文本中的第二关键信息,根据第二关键信息生成新闻相关人员的新闻记录,根据新闻相关人员的所有新闻记录建立对应的新闻图文类数据知识图谱。本申请提供的方法、装置、设备及介质可自动生成企业工作人员的新闻图文类数据知识图谱,方便对企业工作人员参与事务的新闻记录进行统计。

Description

新闻图文类数据知识图谱的建立方法、装置、设备及介质 技术领域
本申请涉及计算机技术领域,尤其涉及一种新闻图文类数据知识图谱的建立方法、装置、设备及介质。
背景技术
在企业管理中,企业工作人员开展一些重要事务时,常常会以新闻图文的方式将相关内容记录在企业的系统后台中,并可能在新闻图文中附上相关人员的现场图像,以便对企业工作人员参与的事务进行统计以作为参与工作事务的凭证。
目前,对企业工作人员参与事务的统计,常采用的方式是由后台专门的人员进行人工统计,然而采用这样的方式需要耗费大量的人力资源,给企业工作人员参与事务的统计带来了极大的不便。
因此,如何提供一种有效的方案,以方便对企业工作人员参与的各项事务进行统计,已成为现有技术中一亟待解决的难题。
发明内容
第一方面,本申请实施例提供了一种新闻图文类数据知识图谱的建立方法,包括:
获取服务器记录的新闻图文;
如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
在一个可能的设计中,当人脸识别结果为所述新闻现场图像中包含已知的第一目标人员的人脸图像时,所述根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录,包括:
根据所述第一关键信息和所述第一目标人员的个人信息生成所述第一目标人员的新闻记录;
其中,所述个人信息包括姓名和职务。
在一个可能的设计中,当所述人脸识别结果为所述新闻现场图像中包含未知的第二目标人员的人脸图像时,所述方法还包括:
接收用户上传的所述第二目标人员的个人信息;
根据所述第一关键信息和所述第二目标人员的个人信息生成所述第二目标人员的新闻记录;
其中,所述个人信息包括姓名和职务。
在一个可能的设计中,所述方法还包括:
将所述第二目标人员的个人信息与所述第二目标人员所对应的人脸图像关联后进行存储。
在一个可能的设计中,所述获取服务器记录的新闻图文,包括:
当所述服务器接收到用户端最新上传的新闻图文时,从所述服务器获取所述最新上传的新闻图文;或
每隔预设的时间间隔,从所述服务器获取用户端最新上传的新闻图文。
在一个可能的设计中,在建立与所述新闻相关人员对应的新闻图文类数据知识图谱之后,所述方法还包括:
将新闻图文类数据知识图谱所包含的新闻记录存储至与所述新闻相关人员对应的文件目录中;
其中,新闻图文类数据知识图谱所包含的新闻记录在文件目录中按照时间先后顺序进行存储。
在一个可能的设计中,所述对所述新闻现场图像中的人脸图像进行人脸识别,包括:
对所述新闻现场图像进行分割,得到多张子图像;
对所述多张子图像中的每张子图像进行人脸特征提取,得到至少一张人脸特征图;
通过自适应对比度增强算法对所述至少一张人脸特征图进行对比度频域范围增强处理;
对增强处理后的所述至少一张人脸特征图进行超分辨率重建;
对超分辨率重建后的所述至少一张人脸特征图进行人脸识别。
第二方面,本申请实施例提供了一种新闻图文类数据知识图谱的建立装置,包括:
获取单元,用于获取服务器记录的新闻图文;
判断单元,用于判断所述新闻图文中是否包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像;
执行单元,用于当所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像时,对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
当所述新闻图文中仅包括新闻文本时,提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;以及
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
第三方面,本申请实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序,实现以下流程:
获取服务器记录的新闻图文;
如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现以下流程:
获取服务器记录的新闻图文;
如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关 键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
本申请一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过获取服务器记录的新闻图文,如果新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像时,则对新闻现场图像中的人脸图像进行人脸识别,提取出新闻文本中的第一关键信息,并根据人脸识别结果和第一关键信息生成新闻相关人员的新闻记录;如果新闻图文中仅包括新闻文本,则提取出新闻文本中的第二关键信息,并根据第二关键信息生成新闻相关人员的新闻记录,然后根据新闻相关人员的所有新闻记录建立与新闻相关人员对应的新闻图文类数据知识图谱。如此能够结合人脸识别和文本提取,自动生成包含企业工作人员所有新闻记录的新闻图文类数据知识图谱,方便对企业工作人员参与各项事务的新闻记录进行统计。
附图说明
此处所说明的附图用来提供对本文件的进一步理解,构成本文件的一部分,本文件的示意性实施例及其说明用于解释本文件,并不构成对本文件的不当限定。在附图中:
图1为本申请一个实施例提供的新闻图文类数据知识图谱的建立方法的流程图。
图2为本申请另一个实施例提供的新闻图文类数据知识图谱的建立方法的流程图。
图3为本申请一个实施例提供的电子设备的结构示意图。
图4为本申请一个实施例提供的新闻图文类数据知识图谱的建立装置的结 构示意图。
具体实施方式
为了方便对企业工作人员参与的各项事务进行统计,本申请实施例提供了一种新闻图文类数据知识图谱的建立方法、装置、设备及介质,该新闻图文类数据知识图谱的建立方法、装置、设备及介质能够自动生成与企业工作人员相关的所有新闻记录的新闻图文类数据知识图谱,方便对企业工作人员参与的各项事务进行统计。
本申请实施例提供的新闻图文类数据知识图谱的建立方法可应用于服务器或用户终端,所述用户终端可以是,但不限于个人电脑、智能手机、平板电脑、个人数字助理(personal digital assistant,PDA)等。
下面将对本申请实施例提供的应用于用户终端的新闻图文类数据知识图谱的建立方法进行详细说明。可以理解,所述执行主体并不构成对本申请实施例的限定。
如图1所示,是本申请实施例提供的新闻图文类数据知识图谱的建立方法的流程图,新闻图文类数据知识图谱的建立方法可以包括如下步骤:
步骤S101,获取服务器记录的新闻图文。
本申请实施例中,服务器记录的新闻图文可以是,企业工作人员或领导开展重要会议的新闻、开展一些重要事务的报告等,本申请实施例中不做具体限定。
其中,所述新闻图文中可以包括新闻文本,也可以同时包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像。新闻文本中的内容可以包括事务所对应的时间、地点以及新闻主题等信息。
本申请实施例中,服务器端的新闻图文可根据客户端的上传实时更新,为便于及时对新闻记录进行统计,可以是服务器端每接收到一条上传的新闻图文,就对该最新上传的新闻图文进行统计。即当服务器接收到用户端最新上传的新闻图文时,就会从服务器获取该最新上传的新闻图文。
可以理解的,在其他的一些实施例中,也可以每隔预设的时间间隔,从服务器获取用户端最新上传的新闻图文。例如,可以每隔一天从服务器获取一次用户端最新上传的新闻图文。
步骤S102,判断新闻图文中除新闻文本外,是否还包括包含新闻相关人员人脸图像的新闻现场图像,如果是,则执行步骤S103;如果否,则执行步骤S104。
步骤S103,对新闻现场图像中的人脸图像进行人脸识别,提取出新闻文本中的第一关键信息,并根据人脸识别结果和第一关键信息生成新闻相关人员的新闻记录。
如果新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对新闻现场图像中的人脸图像进行人脸识别,提取出新闻文本中的第一关键信息,并根据人脸识别结果和第一关键信息生成新闻相关人员的新闻记录。
本申请实施例中,预先建立有企业所有人员人脸特征的人脸特征库,在获取到服务器记录的新闻图文后,可对其中的新闻现场图像中的人脸图像进行人脸识别,从而识别出新闻现场图像中是否包含已知的第一目标人员的人脸图像。
本申请实施例中,对新闻现场图像中的人脸图像进行人脸识别可以包括如下的步骤S1031-S1035。
步骤S1031,对新闻现场图像中进行分割,得到多张子图像。
在本实施例中,对新闻现场图像进行切割可以但不限于采用:python opencv脚本;即利用python opencv脚本对新闻现场图像不断的切分小区域,然后将切分的区域存储为新的小图片,存储的小图片则为子图像。
对新闻现场图像进行分割时,分割的子图像的数量和尺寸可根据实际情况设定。分割的子图像的尺寸可以相同或不同,分割的子图像的数量可以是4张、9张、16张等。
步骤S1032,对多张子图像中的每张子图像进行人脸特征提取,得到至少一张人脸特征图。
在进行图像分割时,新闻现场图像中的人脸图像可能会分割至同一张子图像中,同一人脸图像的不同区域或多个人脸图像也可能被分割至不同的子图像中,因此在进行人脸特征提取时,可得到一张或多种人脸特征图。
步骤S1033,通过自适应对比度增强算法对至少一张人脸特征图进行对比度频域范围增强处理。
自适应对比度增强(Adaptive Contrast Enhancement,ACE)算法源自retinex算法,其主要原理是通过差分计算目标点与周围像素点的相对阴暗关系来矫正最终像素值,具有很好的增强效果,其详细过程在此不再具体说明。
步骤S1034,对增强处理后的至少一张人脸特征图进行超分辨率重建。
超分辨率重建的过程为,先对人脸特征图进行通道数扩展,然后对扩展后的通道数对应的特征图进行卷积操作,最后再对像素进行重新排列,从而可得到高分辨率的特征图,以便用于后续的人脸识别,提高人脸识别精度。
步骤S1035,对超分辨率重建后的至少一张人脸特征图进行人脸识别。
本申请实施例中,在提取出所述新闻文本中的第一关键信息时,可通过自然语言处理(Natural Language Processing,NLP)算法提取出新闻文本中的第一关键信息。所述第一关键信息包括,但不限于时间、地点和新闻主题等。
对新闻现场图像中的人脸图像进行人脸识别时,新闻现场图像中的人脸图像可以是已知人员的人脸图像,也可以是未知人员的人脸图像。
服务器记录有所有工作人员的个人信息,个人信息可以包括姓名、工作单位和职务,还可以包括个人所在地区和个人简介等信息。
如果识别出新闻现场图像中包括已知的第一目标人员的人脸图像,则可根据第一关键信息和第一目标人员的个人信息生成第一目标人员的新闻记录。生成的新闻记录中至少包括有第一目标人员的姓名、工作单位和职务,以及参与事务的时间、地点和新闻主题等内容,还可以包括第一目标人员所在地区和个 人简介等。其中,第一目标人员可以是一个或多个,本申请实施例中不做具体限定。
例如,在一个实施例中,通过人脸识别识别出新闻现场图像中包含已知的第一目标人员包括第一目标人员A和第一目标人员B,通过提取出新闻文本中的关键信息,得到的时间为2021年1月1日,地点为CD市,新闻主题为X项目调研。而第一目标人员A的姓名为张三,职务为项目总工,第一目标人员B的名称为李四,职务为项目经理。则第一目标人员A的新闻记录可以包括如下:
姓名:张三;
职务:项目总工;
时间:2021年1月1日;
地点:CD市;
新闻主题:X项目调研。
第一目标人员B的新闻记录可以包括如下:
姓名:李四;
职务:项目经理;
时间:2021年1月1日;
地点:CD市;
新闻主题:X项目调研。
可以理解的,第一目标人员A和第一目标人员B的新闻记录中还可以包括个人所在地区和个人简介等其他信息。
在人脸识别过程中,还可能存在不能识别的人脸图像。如果识别出新闻现场图像中包括未知的第二目标人员的人脸图像,则可以提取出第二目标人员的人脸图像,用户可人为编辑第二目标人员的个人信息并上传,此时可接收到用户上传的第二目标人员的个人信息,然后根据第一关键信息和第二目标人员的个人信息,生成第二目标人员的新闻记录。其中,编辑的第二目标人员的个人 信息可以包括姓名、工作单位和职务,还可以包括个人所在地区和个人简介等信息。
步骤S104,提取出新闻文本中的第二关键信息,并根据第二关键信息生成新闻相关人员的新闻记录。
如果新闻图文中只包括新闻文本,不包括包含新闻相关人员人脸图像的新闻现场图像,则可提取出新闻文本中的第二关键信息,并根据第二关键信息生成新闻相关人员的新闻记录。其中,第二关键信息包括,但不限于时间、地点、新闻主题和姓名。根据第二关键信息生成新闻相关人员的新闻记录中包括参与事务人员的姓名、参与事务的时间、地点和新闻主题等,还可以包括参与事务人员的职务、所在地区和个人简介等。
在一个可能的设计中,在识别出已知的第一目标人员的人脸图像后,还可以将识别出的第一目标人员的人脸特征图储至人脸特征库中,或者通过识别出第一目标人员的人脸特征图替换掉人脸特征库中原始的人脸特征图,从而实现人脸特征库的迭代更新。
另外,在用户人为编辑第二目标人员的个人信息后,还可以将第二目标人员的个人信息与第二目标人员所对应的人脸图像关联并通过人脸特征库进行存储,从而实现人脸数据库的手动更新。
步骤S105,根据新闻相关人员的所有新闻记录建立与新闻相关人员对应的新闻图文类数据知识图谱。
其中,建立的新闻图文类数据知识图谱中包含有所述新闻相关人员的所有新闻记录。
在一个可能的设计中,在建立与所述新闻相关人员对应的新闻图文类数据知识图谱之后,还可将新闻图文类数据知识图谱所包含的新闻记录存储至与所述新闻相关人员对应的文件目录中,其中,新闻图文类数据知识图谱所包含的新闻记录在文件目录中按照时间先后顺序进行存储。如此可方便对企业工作人员的各项新闻记录进行查找。
如图2所示,是本申请实施例提供的另一新闻图文类数据知识图谱的建立方法的流程图,其可以包括如下步骤:
步骤S201,获取服务器记录的新闻图文。
步骤S202,判断新闻图文中除新闻文本外,是否还包括包含新闻相关人员人脸图像的新闻现场图像,如果否,则执行步骤S203;如果是,则执行步骤S204。
步骤S203,提取出新闻文本中的第二关键信息,并根据第二关键信息生成新闻相关人员的新闻记录。
步骤S204,对新闻现场图像中的人脸图像进行人脸识别,并提取出新闻文本中的第一关键信息。
步骤S205,判断人脸识别是否成功,如果是,则执行步骤S206,如果否,则执行步骤S207。
步骤S206,根据人脸识别结果和第一关键信息生成新闻相关人员的新闻记录。
步骤S207,通过关系抽取技术提取出未识别人员的个人信息,根据提取出的未识别人员的个人信息和第一关键信息生成新闻相关人员的新闻记录,并将提取出的未识别人员的个人信息存储至本地数据库。
本申请实施例中,新闻现场图像中可能在未能识别的人员,此时可以通过关系抽取技术提取出未识别人员的个人信息,并根据提取出的未识别人员的个人信息和第一关键信息生成新闻相关人员的新闻记录,同时还可以将提取出的未识别人员的个人信息和头像存储至本地数据库,以便用于后续的人脸识别。
综上所述,通过获取服务器记录的新闻图文,如果新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像时,则对新闻现场图像中的人脸图像进行人脸识别,提取出新闻文本中的第一关键信息,并根据人脸识别结果和第一关键信息生成新闻相关人员的新闻记录;如果新闻图文中仅包括新闻文本,则提取出新闻文本中的第二关键信息,并根据第二关键信息生成新闻相 关人员的新闻记录,然后根据新闻相关人员的所有新闻记录建立与新闻相关人员对应的新闻图文类数据知识图谱。如此能够结合人脸识别和文本提取,自动生成包含企业工作人员所有新闻记录的新闻图文类数据知识图谱,方便对企业工作人员参与各项事务进行统计。同时,在对新闻现场图像中的人脸图像进行人脸识别时,通过对新闻现场图像进行分割得到多张子图像,对每张子图像进行人脸特征提取得到至少一张人脸特征图,然后通过自适应对比度增强算法对至少一张人脸特征图进行对比度频域范围增强处理,并在增强处理进行超分辨率重建,如此可得到高分辨率的特征图,以便用于后续的人脸识别,提高人脸识别精度。其次,还可针对每个企业工作人员的新闻图文类数据知识图谱单独进行存储,方便对企业工作人员的各项新闻记录进行查找。另外,在识别出已知的第一目标人员的人脸图像,还可以将识别出的第一目标人员的人脸特征图储至人脸特征库中,或者通过识别出第一目标人员的人脸特征图替换掉人脸特征库中原始的人脸特征图,从而实现人脸特征库的迭代更新。最后,对于不能识别的人脸图像,还可以通过编辑实现人脸数据库的手动更新。
图3是本申请的一个实施例提供的电子设备的结构示意图。请参考图3,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成新闻图文类数据知识图谱的建立装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取服务器记录的新闻图文;
如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
上述如本申请图3所示实施例揭示的新闻图文类数据知识图谱的建立装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本 申请一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1和图2的方法,并实现新闻图文类数据知识图谱的建立装置在图3所示实施例的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
获取服务器记录的新闻图文;
如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息 包括时间、地点、新闻主题和姓名。
图4是本申请的一个实施例提供的新闻图文类数据知识图谱的建立装置的结构示意图。请参阅图4,在一种软件实施方式中,新闻图文类数据知识图谱的建立装置包括:
获取单元,用于获取服务器记录的新闻图文;
判断单元,用于判断所述新闻图文中是否包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像;
执行单元,用于当所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像时,对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
当所述新闻图文中仅包括新闻文本时,提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;以及
根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
总之,以上所述仅为本文件的较佳实施例而已,并非用于限定本文件的保护范围。凡在本文件的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本文件的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任 何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本文件中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (10)

  1. 一种新闻图文类数据知识图谱的建立方法,其特征在于,包括:
    获取服务器记录的新闻图文;
    如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
    如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
    根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
    其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
  2. 根据权利要求1所述的方法,其特征在于,当人脸识别结果为所述新闻现场图像中包含已知的第一目标人员的人脸图像时,所述根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录,包括:
    根据所述第一关键信息和所述第一目标人员的个人信息生成所述第一目标人员的新闻记录;
    其中,所述个人信息包括姓名和职务。
  3. 根据权利要求1所述的方法,其特征在于,当所述人脸识别结果为所述新闻现场图像中包含未知的第二目标人员的人脸图像时,所述方法还包括:
    接收用户上传的所述第二目标人员的个人信息;
    根据所述第一关键信息和所述第二目标人员的个人信息生成所述第二目标人员的新闻记录;
    其中,所述个人信息包括姓名和职务。
  4. 根据权利要求3所述的方法,其特征在于,所述方法还包括:
    将所述第二目标人员的个人信息与所述第二目标人员所对应的人脸图像关联后进行存储。
  5. 根据权利要求1所述的方法,其特征在于,所述获取服务器记录的新闻图文,包括:
    当所述服务器接收到用户端最新上传的新闻图文时,从所述服务器获取所述最新上传的新闻图文;或
    每隔预设的时间间隔,从所述服务器获取用户端最新上传的新闻图文。
  6. 根据权利要求1所述的方法,其特征在于,在建立与所述新闻相关人员对应的新闻图文类数据知识图谱之后,所述方法还包括:
    将新闻图文类数据知识图谱所包含的新闻记录存储至与所述新闻相关人员对应的文件目录中;
    其中,新闻图文类数据知识图谱所包含的新闻记录在文件目录中按照时间先后顺序进行存储。
  7. 根据权利要求1所述的方法,其特征在于,所述对所述新闻现场图像中的人脸图像进行人脸识别,包括:
    对所述新闻现场图像进行分割,得到多张子图像;
    对所述多张子图像中的每张子图像进行人脸特征提取,得到至少一张人脸特征图;
    通过自适应对比度增强算法对所述至少一张人脸特征图进行对比度频域范围增强处理;
    对增强处理后的所述至少一张人脸特征图进行超分辨率重建;
    对超分辨率重建后的所述至少一张人脸特征图进行人脸识别。
  8. 一种新闻图文类数据知识图谱的建立装置,其特征在于,包括:
    获取单元,用于获取服务器记录的新闻图文;
    判断单元,用于判断所述新闻图文中是否包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像;
    执行单元,用于当所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像时,对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
    当所述新闻图文中仅包括新闻文本时,提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;以及
    根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
    其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
  9. 一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;
    存储器,用于存放计算机程序;
    处理器,用于执行存储器上所存放的程序,实现以下流程:
    获取服务器记录的新闻图文;
    如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
    如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
    根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
    其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
  10. 一种计算机可读存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现以下流程:
    获取服务器记录的新闻图文;
    如果所述新闻图文中包括新闻文本和包含新闻相关人员人脸图像的新闻现场图像,则对所述新闻现场图像中的人脸图像进行人脸识别,提取出所述新闻文本中的第一关键信息,并根据人脸识别结果和所述第一关键信息生成新闻相关人员的新闻记录;
    如果所述新闻图文中仅包括新闻文本,则提取出所述新闻文本中的第二关键信息,并根据所述第二关键信息生成新闻相关人员的新闻记录;
    根据新闻相关人员的所有新闻记录建立与所述新闻相关人员对应的新闻图文类数据知识图谱;
    其中,所述第一关键信息包括时间、地点和新闻主题,所述第二关键信息包括时间、地点、新闻主题和姓名。
PCT/CN2022/074424 2022-01-27 2022-01-27 新闻图文类数据知识图谱的建立方法、装置、设备及介质 WO2023141900A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/074424 WO2023141900A1 (zh) 2022-01-27 2022-01-27 新闻图文类数据知识图谱的建立方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/074424 WO2023141900A1 (zh) 2022-01-27 2022-01-27 新闻图文类数据知识图谱的建立方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
WO2023141900A1 true WO2023141900A1 (zh) 2023-08-03

Family

ID=87469930

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/074424 WO2023141900A1 (zh) 2022-01-27 2022-01-27 新闻图文类数据知识图谱的建立方法、装置、设备及介质

Country Status (1)

Country Link
WO (1) WO2023141900A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091164A (zh) * 2014-07-28 2014-10-08 北京奇虎科技有限公司 人脸图片人名识别方法和系统
US20170024375A1 (en) * 2015-07-26 2017-01-26 Microsoft Technology Licensing, Llc Personal knowledge graph population from declarative user utterances
CN109754224A (zh) * 2018-12-29 2019-05-14 贵州小爱机器人科技有限公司 人事关系图谱构建方法、装置以及计算机存储介质
CN110245244A (zh) * 2019-06-20 2019-09-17 贵州电网有限责任公司 一种基于海量文本数据的人事关系知识图谱构建方法
CN110750656A (zh) * 2019-10-29 2020-02-04 上海德拓信息技术股份有限公司 一种基于知识图谱的多媒体检测方法
CN112364091A (zh) * 2020-11-09 2021-02-12 北京工商大学 一种基于知识图谱的人物关系可视化查询方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091164A (zh) * 2014-07-28 2014-10-08 北京奇虎科技有限公司 人脸图片人名识别方法和系统
US20170024375A1 (en) * 2015-07-26 2017-01-26 Microsoft Technology Licensing, Llc Personal knowledge graph population from declarative user utterances
CN109754224A (zh) * 2018-12-29 2019-05-14 贵州小爱机器人科技有限公司 人事关系图谱构建方法、装置以及计算机存储介质
CN110245244A (zh) * 2019-06-20 2019-09-17 贵州电网有限责任公司 一种基于海量文本数据的人事关系知识图谱构建方法
CN110750656A (zh) * 2019-10-29 2020-02-04 上海德拓信息技术股份有限公司 一种基于知识图谱的多媒体检测方法
CN112364091A (zh) * 2020-11-09 2021-02-12 北京工商大学 一种基于知识图谱的人物关系可视化查询方法及系统

Similar Documents

Publication Publication Date Title
CN111062871B (zh) 一种图像处理方法、装置、计算机设备及可读存储介质
US8725490B2 (en) Virtual universal translator for a mobile device with a camera
US20140348394A1 (en) Photograph digitization through the use of video photography and computer vision technology
TWI760671B (zh) 一種音視訊訊息處理方法及裝置、電子設備和電腦可讀儲存介質
CN107679249A (zh) 好友推荐方法及设备
US20180025215A1 (en) Anonymous live image search
WO2021012382A1 (zh) 配置聊天机器人的方法、装置、计算机设备和存储介质
CN112954450B (zh) 视频处理方法、装置、电子设备和存储介质
US20180336931A1 (en) Automatic and intelligent video sorting
US9665773B2 (en) Searching for events by attendants
US10158598B2 (en) Social interaction data preservation for augmented photos
WO2023141900A1 (zh) 新闻图文类数据知识图谱的建立方法、装置、设备及介质
CN110737820A (zh) 用于生成事件信息的方法和装置
CN115333879B (zh) 一种远程会议方法及系统
CN114155841A (zh) 语音识别方法、装置、设备及存储介质
CN114862720A (zh) 画布还原方法、装置、电子设备和计算机可读介质
US20180189602A1 (en) Method of and system for determining and selecting media representing event diversity
CN113741864A (zh) 基于自然语言处理的语义化服务接口自动设计方法与系统
CN114140427A (zh) 一种物体检测方法及装置
WO2021114824A1 (zh) 演示文稿生成方法、装置、设备及介质
Nguyen et al. Unmasking the artist: Discriminating human-drawn and ai-generated human face art through facial feature analysis
CN112036350B (zh) 一种基于政务云的用户调查方法和系统
CN114117095A (zh) 一种基于图像识别的声像档案著录方法及装置
CN116385597B (zh) 文本配图方法和装置
CN111292333B (zh) 用于分割图像的方法和装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22922746

Country of ref document: EP

Kind code of ref document: A1