WO2023040530A1 - Procédé de traçabilité de contenu de page web, procédé de construction de graphe de connaissance et dispositif associé - Google Patents

Procédé de traçabilité de contenu de page web, procédé de construction de graphe de connaissance et dispositif associé Download PDF

Info

Publication number
WO2023040530A1
WO2023040530A1 PCT/CN2022/111896 CN2022111896W WO2023040530A1 WO 2023040530 A1 WO2023040530 A1 WO 2023040530A1 CN 2022111896 W CN2022111896 W CN 2022111896W WO 2023040530 A1 WO2023040530 A1 WO 2023040530A1
Authority
WO
WIPO (PCT)
Prior art keywords
webpage
entity
relationship
website
knowledge graph
Prior art date
Application number
PCT/CN2022/111896
Other languages
English (en)
Chinese (zh)
Inventor
党倩
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2023040530A1 publication Critical patent/WO2023040530A1/fr

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Des modes de réalisation de la présente demande concernent un procédé de traçabilité de contenu de page Web, un procédé de construction de graphe de connaissances et un dispositif associé, qui se rapportent au domaine des terminaux. Un dispositif informatique dans la présente demande peut construire un graphe de connaissances, le graphe de connaissances comprenant une pluralité d'entités et la relation entre les entités ; ensuite, une traçabilité de contenu de page Web peut être effectuée sur la base du graphe de connaissances ; une première entité de page Web correspondant à une page Web à tracer est déterminée dans le graphe de connaissances, au moins une entité cible correspondant à la première entité de page Web est déterminée dans le graphe de connaissances, et une relation directe ou indirecte existe entre les entités cibles et la première entité de page Web ; et enfin, sur la base de ladite au moins une entité cible et de la relation entre la première entité de page Web et ladite au moins une entité cible, un résultat de traçabilité de contenu de la page Web à tracer peut être affiché. Selon la présente demande, une traçabilité de contenu de page Web automatique peut être obtenue, et l'efficacité de la traçabilité de contenu de page Web est améliorée.
PCT/CN2022/111896 2021-09-18 2022-08-11 Procédé de traçabilité de contenu de page web, procédé de construction de graphe de connaissance et dispositif associé WO2023040530A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111113469.2 2021-09-18
CN202111113469.2A CN115840863A (zh) 2021-09-18 2021-09-18 网页内容溯源方法、知识图谱构建方法以及相关设备

Publications (1)

Publication Number Publication Date
WO2023040530A1 true WO2023040530A1 (fr) 2023-03-23

Family

ID=85574512

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/111896 WO2023040530A1 (fr) 2021-09-18 2022-08-11 Procédé de traçabilité de contenu de page web, procédé de construction de graphe de connaissance et dispositif associé

Country Status (2)

Country Link
CN (1) CN115840863A (fr)
WO (1) WO2023040530A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117332856A (zh) * 2023-11-03 2024-01-02 安徽国麒科技有限公司 一种基于采样子图策略的电池知识图谱摘要生成方法
CN117876651A (zh) * 2024-03-13 2024-04-12 浪潮电子信息产业股份有限公司 视觉定位方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100070463A1 (en) * 2008-09-18 2010-03-18 Jing Zhao System and method for data provenance management
US20150067839A1 (en) * 2011-07-08 2015-03-05 Brad Wardman Syntactical Fingerprinting
CN109446341A (zh) * 2018-10-23 2019-03-08 国家电网公司 知识图谱的构建方法及装置
CN110909178A (zh) * 2019-11-22 2020-03-24 上海交通大学 一种暗网威胁情报收集与信息关联系统和方法
CN112364173A (zh) * 2020-10-21 2021-02-12 中国电子科技网络信息安全有限公司 一种基于知识图谱的ip地址机构溯源方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100070463A1 (en) * 2008-09-18 2010-03-18 Jing Zhao System and method for data provenance management
US20150067839A1 (en) * 2011-07-08 2015-03-05 Brad Wardman Syntactical Fingerprinting
CN109446341A (zh) * 2018-10-23 2019-03-08 国家电网公司 知识图谱的构建方法及装置
CN110909178A (zh) * 2019-11-22 2020-03-24 上海交通大学 一种暗网威胁情报收集与信息关联系统和方法
CN112364173A (zh) * 2020-10-21 2021-02-12 中国电子科技网络信息安全有限公司 一种基于知识图谱的ip地址机构溯源方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VOGT LARS, BAUM ROMAN, BHATTY PHILIPP, KÖHLER CHRISTIAN, MEID SANDRA, QUAST BJÖRN, GROBE PETER: "SOCCOMAS: a FAIR web content management system that uses knowledge graphs and that is based on semantic programming", DATABASE, vol. 2019, 1 January 2019 (2019-01-01), XP093048577, DOI: 10.1093/database/baz067 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117332856A (zh) * 2023-11-03 2024-01-02 安徽国麒科技有限公司 一种基于采样子图策略的电池知识图谱摘要生成方法
CN117332856B (zh) * 2023-11-03 2024-02-23 安徽国麒科技有限公司 一种基于采样子图策略的电池知识图谱摘要生成方法
CN117876651A (zh) * 2024-03-13 2024-04-12 浪潮电子信息产业股份有限公司 视觉定位方法、装置、设备及介质

Also Published As

Publication number Publication date
CN115840863A (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
WO2023040530A1 (fr) Procédé de traçabilité de contenu de page web, procédé de construction de graphe de connaissance et dispositif associé
US9405746B2 (en) User behavior models based on source domain
CN104850546B (zh) 移动媒介信息的展示方法和系统
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
CN109726280B (zh) 一种针对同名学者的排歧方法及装置
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
CN107784059A (zh) 用于搜索和选择图像的方法和系统以及机器可读媒体
JP6363682B2 (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
US10769196B2 (en) Method and apparatus for displaying electronic photo, and mobile device
US20160306887A1 (en) Methods, apparatuses and systems for linked and personalized extended search
CN103617266A (zh) 个性化扩展搜索方法及装置、系统
CN110245069A (zh) 页面版本的测试方法和装置、页面的展示方法和装置
US20210097045A1 (en) Object identifier index
CN107977678B (zh) 用于输出信息的方法和装置
CN105550206A (zh) 结构化查询语句的版本控制方法及装置
CN111367870A (zh) 一种绘本共享方法、装置和系统
CN107748772B (zh) 一种商标识别方法及装置
JP6419969B2 (ja) 画像の提示情報を提供するための方法及び機器
CN112328592A (zh) 数据存储方法、电子设备及计算机可读存储介质
CN114241501B (zh) 影像文档处理方法、装置及电子设备
CN112825089A (zh) 文章推荐方法、装置、设备及存储介质
CN112559913B (zh) 一种数据处理方法、装置、计算设备及可读存储介质
EP3564833B1 (fr) Procédé et dispositif d'identification d'image principale dans une page web
WO2021114634A1 (fr) Procédé d'annotation de texte, dispositif, et support de stockage
CN110955855A (zh) 一种信息拦截的方法、装置及终端

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22868906

Country of ref document: EP

Kind code of ref document: A1