TWI774117B - 知識圖譜建置系統與知識圖譜建置方法 - Google Patents

知識圖譜建置系統與知識圖譜建置方法 Download PDF

Info

Publication number
TWI774117B
TWI774117B TW109139046A TW109139046A TWI774117B TW I774117 B TWI774117 B TW I774117B TW 109139046 A TW109139046 A TW 109139046A TW 109139046 A TW109139046 A TW 109139046A TW I774117 B TWI774117 B TW I774117B
Authority
TW
Taiwan
Prior art keywords
entity
recommended
knowledge graph
historical
triples
Prior art date
Application number
TW109139046A
Other languages
English (en)
Other versions
TW202219790A (zh
Inventor
郭欣逸
王文男
高嘉偉
黃文發
江柏憲
鄭富烝
李宜修
楊又權
Original Assignee
財團法人資訊工業策進會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人資訊工業策進會 filed Critical 財團法人資訊工業策進會
Priority to TW109139046A priority Critical patent/TWI774117B/zh
Priority to CN202011292148.9A priority patent/CN114461808A/zh
Priority to US17/111,499 priority patent/US20220147835A1/en
Publication of TW202219790A publication Critical patent/TW202219790A/zh
Application granted granted Critical
Publication of TWI774117B publication Critical patent/TWI774117B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Devices For Executing Special Programs (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

一種知識圖譜建置系統與方法被揭露。該系統根據文本資料及複數三元組,產生文本資料的推薦第一實體、至少一推薦第二實體、與至少一推薦關聯性。該系統根據該推薦第一實體,在文本資料中的當前段落上顯示推薦第二實體與推薦關聯性供使用者選擇。該系統接收與該推薦第一實體、使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、與使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關的確認訊息。該系統根據確認訊息,將推薦第一實體、被選擇的推薦第二實體與推薦關聯性新增至該複數三元組中,並利用該複數三元組建立當前知識圖譜。

Description

知識圖譜建置系統與知識圖譜建置方法
本揭露是關於知識圖譜的建置。更具體而言,本揭露是關於一種知識圖譜建置系統與知識圖譜建置方法。
知識圖譜(Knowledge Graph)是一種由複數實體與關連性所組成的資料結構。透過知識圖譜,可以展現非結構化資料(例如,文本資料)所對應的語意關係網路。「實體」與「關連性」相當於知識圖譜的結構中的「節點」與「邊」,二個「實體」與一個「關聯性」可以組成一「三元組」,而在一「三元組」中,「關聯性」代表該二「實體」之間的關係。
若要針對一特定領域建立對應的知識圖譜,通常必須對特定領域的多個文本資料由人工來建立所需要的複數三元組,再整合該些三元組以建立對應的知識圖譜。然而,建置知識圖譜需針對大量文本資料透過人工標記出三元組,且相同的三元組都需要重複標記,而標記文本資料的過程往往需仰賴專業知識與經驗並將耗費大量時間成本,導致現有的知識圖譜建置技術建置知識圖譜的效率不佳。
有鑑於此,如何增加知識圖譜的建置效率,正是本發明所屬領域中亟待解決的問題。
為了至少解決上述問題,本發明的實施例提供一種知識圖譜建置系統。該知識圖譜建置系統可包含互相電性連接的一操作介面、一儲存器、以及一處理器。該操作介面,可用以輸入並顯示一文本資料。該儲存器可包含一資料庫,該資料庫可用以儲存複數三元組,其中各該三元組包含一第一實體、一第二實體、以及該第一實體與該第二實體之一關聯性資料。該處理器,可用以:根據該文本資料與該資料庫的該複數三元組,產生該文本資料的一推薦第一實體;透過該操作介面,根據該推薦第一實體,在該文本資料中的一當前段落上顯示對應該推薦第一實體的至少一推薦第二實體、以及該推薦第一實體與各該至少一推薦第二實體之間的至少一推薦關聯性,以供一使用者選擇;透過該操作介面,接收一確認訊息,該確認訊息與該推薦第一實體、該使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、以及該使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關;根據該確認訊息,將該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性儲存到該資料庫以新增至該複數三元組中;以及利用該複數三元組建立一當前知識圖譜。
為了至少解決上述問題,本發明的實施例還提供一種知識圖譜建置方法。該知識圖譜建置方法可包含以下步驟:由一知識圖譜建置系統,輸入並顯示一文本資料;由該知識圖譜建置系統,根據該文本資料與該資料庫的複數三元組,產生該文本資料的一推薦第一實體,其中該複數三元組是被儲存於該知識圖譜建置系統中,且各該三元組包含一第一實體、一第二實體、以及該第一實體與該第二實體之一關聯性資料;由該知識圖譜建置系統,根據該推薦第一實體,在該文本資料中的一當前段落上顯示對應該推薦第一實體的至少一推薦第二實體、以及該推薦第一實體與各該至少一推薦第二實體之間的至少一推薦關聯性,以供一使用者選擇;由該知識圖譜建置系統,接收一確認訊息,該確認訊息與該推薦第一實體、該使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、以及該使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關;由該知識圖譜建置系統,根據該確認訊息,將該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性儲存到該資料庫以新增至該複數三元組中;以及由該知識圖譜建置系統,利用該複數三元組建立一當前知識圖譜。
本發明的實施例中的知識圖譜建置系統及知識圖譜建置方法在分析文本資料時,是同時考量資料庫中預先儲存的三元組才產生相關的推薦標記(即,推薦第一實體、推薦第二實體、以及推薦關聯性)。因直接比對上述預先儲存的三元組與文本資料中的當前段落,故本發明能直接自當前段落中找出與上述預先儲存的三元組相同或相似的推薦標記,著實增加了文本資料的標記效率,並進而增加了知識圖譜的建置效率。據此,本發明所提供的知識圖譜建置系統及知識圖譜建置方法確實解決了本發明所屬技術領域中的上述問題。
以上內容並非為了限制本發明,而只是概括地敘述了本發明可解決的技術問題、可採用的技術手段以及可達到的技術功效,以讓本發明所屬技術領域中具有通常知識者初步地瞭解本發明。根據檢附的圖式及以下的實施方式所記載的內容,本發明所屬技術領域中具有通常知識者便可進一步瞭解本發明的各種實施例的細節。
以下將透過實施方式來解釋本發明所提供之知識圖譜建置裝置、知識圖譜建置方法及相應之電腦程式產品。然而,該等實施方式並非用以限制本發明須在如該等實施方式所述之任何環境、應用或方式方能實施。因此,關於實施方式之說明僅為闡釋本發明之目的,而非用以限制本發明之範圍。應理解,在以下實施方式及圖式中,與本發明非直接相關之元件已省略而未繪示,且各元件之尺寸以及元件間之尺寸比例僅為例示而已,而非用以限制本發明之範圍。
本揭露使用之用語僅用於描述實施例,並不意圖限制本發明。除非上下文另有明確說明,否則單數形式「一」也旨在包括複數形式。「包括」、「包含」等用語指示所述特徵、整數、步驟、操作、元素及/或元件的存在,但並不排除一或多個其他特徵、整數、步驟、操作、元素、元件及/或前述之組合之存在。用語「及/或」包含一或多個相關所列項目的任何及所有的組合。
第1圖例示了根據本發明的某些實施例的一種知識圖譜建置系統的示意圖。第1圖所示內容是為了舉例說明本發明的實施例,而非為了限制本發明的保護範圍。
參照第1圖,一知識圖譜建置系統1基本上可包含互相電性連接的一儲存器11、一操作介面12以及一處理器13。儲存器11、操作介面12與處理器13之間的電性連接可以是直接的(即沒有透過其他功能性元件而彼此連接)或是間接的(即透過其他功能性元件而彼此連接)。知識圖譜建置系統1可以是各種計算裝置,例如但不限於:桌上型電腦、可攜式電腦、智慧型手機、可攜式電子配件(眼鏡、手錶等等)、雲伺服器。
儲存器11可包含一般計算裝置/電腦內所具備的各種儲存單元,藉以實現以下所述的各種對應功能。舉例而言,儲存器11可包含第一級記憶體(又稱主記憶體或內部記憶體),且處理器13可直接讀取儲存在第一級記憶體內的指令集,並在需要時執行這些指令集。儲存器11還可包含第二級記憶體(又稱外部記憶體或輔助記憶體),其可透過資料緩衝器將儲存的資料傳送至第一級記憶體。第二級記憶體可以是,例如但不限於:硬碟、光碟等。儲存器11亦可包含第三級記憶體,亦即,可直接插入或自電腦拔除的儲存裝置,例如隨身硬碟、或是雲端硬碟。儲存器可包含一資料庫111,資料庫111可用以儲存複數三元組T1、T2、…、Tn 。第1圖繪示的三元組之數量僅為示意,並非限制。
操作介面12可包含一般計算機裝置/電腦內所具備的各種輸入/輸出元件,用以接收來自外部的資料以及輸出資料至外部,藉以實現以下所述的各種對應功能。操作介面12可包含例如但不限於:滑鼠、軌跡球、觸控板、鍵盤、掃描器、麥克風、使用者介面、螢幕、觸控式螢幕、投影機等等。於某些實施例中,操作介面12可包含一人機介面(例如,一圖形化使用者介面),以利於使用者與知識圖譜建置系統1進行互動。操作介面12可用以接收各種資料,例如但不限於:文本資料D1、確認訊息M1;亦可用以顯示各種資訊,例如但不限於:文本資料D1、推薦第一實體、對應該推薦第一實體的至少一推薦第二實體、以及該推薦第一實體與各該至少一推薦第二實體之間的至少一推薦關聯性、操作選單,以供使用者進行各種運作。
處理器13可以包含各種具備訊號處理功能的微處理器(Microprocessor)或微控制器(Microcontroller)等。微處理器或微控制器是一種可程式化的特殊積體電路,其具有運算、儲存、輸出/輸入等能力,且可接受並處理各種編碼指令,藉以進行各種邏輯運算與算術運算,並輸出相應的運算結果。處理器13可被編程以解釋各種指令與執行各項任務或程式,藉以實現以下所述的各種對應功能。
接下來,將透過第2A圖至第4圖來說明根據本發明的某些實施例的知識圖譜建置系統1的運作細節。第2A圖例示了根據本發明的某些實施例,第1圖中的知識圖譜建置系統執行知識圖譜建置流程的示意圖。第2A圖所示的內容是為了舉例說明本發明的實施例,而非為了限制本發明的保護範圍。
參照第2A圖,知識圖譜建置流程2可包含運作21、23、25、27、29,該些運作將詳述如下。
首先,在運作21中,處理器13可根據文本資料D1以及資料庫111中的複數三元組T1、T2、…、Tn,產生文本資料D1的一推薦第一實體、至少一推薦第二實體、以及至少一推薦關聯性(標示為運作21)。在某些其他的實施例中,可以僅由處理器13產生該推薦第一實體,而該至少一推薦第二實體、以及該至少一推薦關聯性可以是由外部裝置產生並提供給知識圖譜建置系統1。
文本資料D1可以是各種文字資料或非結構化資料(例如:文章、新聞稿),並經由操作介面12而被輸入。舉例而言,使用者可以直接在操作介面12提供的圖形化介面直接輸入文字以作為文本資料D1,使用者也可以透過各種外部裝置將文本資料D1傳送至知識圖譜建置系統1中。
每一組三元組T1、T2、…、Tn是由「第一實體」、「第二實體」、「關聯性」所組成,可以被表示為「第一實體-關聯性-第二實體」或「第二實體-關聯性-第一實體」。「第一實體」與「第二實體」分別對應一個詞彙,而「關聯性」代表此二詞彙之間的關聯,詞彙可以是名詞、數字或日期等等。須說明,本文中針對「實體」所使用的用語「第一」與「第二」並非用以限制其方向性。在某些實施例中,具有方向性的三元組所包含的「第一實體」可以是「頭實體(head entity)」與「尾實體(tail entity)」的其中一個,而「第二實體」就是其中另一個。
在某些實施例中,「第一實體」、「第二實體」可以各自對應至一類別,以分別表示其詞彙的涵義或上位概念。舉例而言,「腸胃道」此詞彙可以對應至「器官」類別、「唐氏症」此詞彙可以對應至「疾病」類別、「乙型鏈球菌」此詞彙可以對應至「病毒」類別,但不以此為限。
接著,將分別透過第2B圖、第2C圖與第2D圖、以及第2E圖來說明運作21在不同實施例中的三種運作細節。第2B圖至第2E圖所示的內容是為了舉例說明本發明的實施例,而非為了限制本發明的保護範圍。
首先參照第2B圖,在第2B圖所示的實施例中,處理器13可透過執行動作211b、213b、215b以完成運作21,該些動作將詳述如下。
在動作211b中,處理器13可分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體。具體而言,處理器13可以藉由分析該推薦第一實體所在的一當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體(即,動作211b)。在某些實施例中,處理器13可以透過語義分析技術或自然語言處理技術來分析文本資料D1中的各個段落,藉此針對各個段落進行分詞及判別詞性等處理,以從各段落中決定可以作為該推薦第一實體的一詞彙。在某些其他的實施例中,處理器13也可以將文本資料D1中已經被標記為實體的詞彙做為該推薦第一實體。在某些其他的實施例中,處理器13也可以透過將文本資料D1中曾經出現於歷史段落中的詞彙作為該第一推薦實體。前述所說明的當前段落、段落、歷史段落等,其可能包含有一個以上的句子。
在動作213b中,處理器13可比對該當前段落及各該複數歷史段落,選擇各該歷史段落中與該當前段落相似度高之一歷史段落。該複數歷史段落及各該歷史段落分別對應之一歷史第一實體、一歷史第二實體、以及一歷史關聯性可被預先儲存於資料庫111中。
詳言之,若一歷史段落對應的歷史第一實體與歷史第二實體的其中一者與該推薦第一實體相同(例如:詞彙相同)或相似(例如:詞彙具有相同類別),且另一者確實出現於該當前段落中,則處理器13可將該歷史段落視為與該當前段落相似度高。舉例而言,假設推薦第一實體為「乙型鏈球菌」,且該推薦第一實體所在的當前段落為「孕婦體內若帶有乙型鏈球菌」。而某一歷史段落為「孕婦乙型鏈球菌篩檢」,且該歷史段落所對應的該歷史第一實體、歷史關聯性、歷史第二實體分別為「孕婦」、「含有」、「乙型鏈球菌」,則因為該歷史段落包含與該推薦第一實體相同的一歷史第二實體「乙型鏈球菌」,該歷史第二實體與該歷史第一實體「孕婦」存在歷史關聯性「含有」,且被關聯的該歷史第一實體「孕婦」確實存在於該當前段落中,故處理器13將該歷史段落與該當前段落判斷為相似度高。
在動作215b中,在決定相似度較高的該歷史段落之後,處理器13可根據被選擇的該歷史段落所對應之該歷史第一實體、該歷史第二實體、以及該歷史關聯性,產生與該推薦第一實體對應的一推薦第二實體以及一推薦關聯性。換言之,處理器13可以根據該歷史段落及其所對應的歷史三元組,找到該推薦第一實體所在的該當前段落中可能存在的三元組。舉例而言,處理器13可根據該當前段落、該歷史段落對應的該歷史第一實體、該歷史第二實體、以及該歷史關聯性產生該當前段落的該推薦第一實體「孕婦」、該推薦關聯性「含有」、以及該推薦第二實體「乙型鏈球菌」。
接著參照第2C圖與第2D圖,在第2C圖所示的實施例中,處理器13可透過執行動作211c、213c、215c以完成運作21,該些動作將詳述如下。
在動作211c中,處理器13可分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體。動作211c的運作細節可以與動作211b相同,故此不再贅述。
在動作213c中,處理器13可比對該當前知識圖譜及該複數歷史知識圖譜,從該複數歷史知識圖譜中找出和該當前知識圖譜的該複數三元組具有近似結構的至少一歷史知識圖譜三元組。該複數歷史知識圖譜可以被儲存在資料庫111中。該當前知識圖譜可以包含該文本資料D1所對應的已被確認的複數三元組。
在比對該當前知識圖譜及各該複數歷史知識圖譜後,若處理器13判斷當前知識圖譜與某一歷史知識圖譜具有類似的連接方式(例如,歷史三元組在歷史文本中的分布結構,類似於當前圖譜的三元組在當前文本中的分布結構)及/或具有對應相同類別的實體,則可判斷該當前知識圖譜與該歷史知識圖譜具有近似結構。換言之,若當前段落中包含與該歷史知識圖譜中的一歷史知識圖譜三元組「相同」(即,當前段落中的三元組與歷史知識圖譜三元組包含詞彙完全相同的二實體)或「相似」(即,當前段落中的三元組與歷史知識圖譜三元組包含詞彙不同但類別相同的二實體),處理器13可判斷該當前知識圖譜與該歷史知識圖譜具有近似結構。
同時參照第2D圖,第2D圖例示了本發明的某些實施例的當前知識圖譜與歷史知識圖譜的示意圖。在第2D圖例示的實施例中,文本資料D1可對應當前知識圖譜K1,而當前知識圖譜K1包含二組已經被確認的三元組:「新生兒-患有-腦膜炎」、以及「新生兒-感染-乙型鏈球菌」。資料庫111儲存了複數歷史知識圖譜K2(例如,第2D圖中的歷史知識圖譜K21、歷史知識圖譜K2),各該歷史知識圖譜K2可以是由複數個已被確認的歷史知識圖譜三元組所組成。各該複數歷史知識圖譜三元組可以分別來自於不同的文本資料(不包含文本資料D1),或是他人已經建置完成的知識圖譜,且各該複數歷史知識圖譜三元組可以是在文本資料D1被輸入之前就已經被確認並儲存至資料庫111中。
舉例而言,歷史知識圖譜K21中包含的其中二組歷史知識圖譜三元組為「新生兒-患有-腦膜炎」、「新生兒-感染-乙型鏈球菌」,因為此歷史知識圖譜三元組與當前知識圖譜K1包含的三元組「新生兒-患有-腦膜炎」、「新生兒-感染-乙型鏈球菌」相同,故處理器13可判斷該當前知識圖譜K1與該歷史知識圖譜K21具有近似結構。
接著,在動作215c中,在從該複數歷史知識圖譜中找出和該當前知識圖譜的該複數三元組具有近似結構的至少一歷史知識圖譜三元組之後,處理器13可產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
詳言之,處理器13可根據該推薦第一實體,將該歷史知識圖譜三元組中對應的一實體作為推薦第二實體,並將該歷史知識圖譜三元組中的對應的一關聯性作為推薦關聯性。舉例而言,若該推薦第一實體是「乙型鏈球菌」,處理器13將於文本資料D1中找尋是否存在相同於歷史知識圖譜K21中的歷史知識圖譜三元組「乙型鏈球菌-常見於-腸胃道」、「乙型鏈球菌-引發-肺炎」,或相似於該二歷史知識圖譜三元組(即,具有類別為「病毒-常見於-器官」、「病毒-引發-疾病」)的三元組。
若文本資料D1中的當前段落為:「乙型鏈球菌是人類的腸胃道常見的細菌」,由於該段落包含了「乙型鏈球菌」及「腸胃道」二個實體,處理器13可根據歷史知識圖譜三元組將「腸胃道」作為推薦第二實體以及將「常見於」作為其推薦關聯性。若文本資料D1的當前段落為:「乙型鏈球菌是人類的泌尿道常見的細菌」,由於該段落包含的「泌尿道」的類別「器官」與「腸胃道」的類別「器官」相同,處理器13可判斷「泌尿道」與「腸胃道」相似,並可將「泌尿道」作為推薦第二實體,以及將「常見於」作為其推薦關聯性,並針對文本資料D1產生推薦的三元組「乙型鏈球菌-常見於-泌尿道」。
再參照第2E圖,在第2E圖所示的實施例中,處理器13可透過執行動作211e、213e、215e以完成運作21,該些動作將詳述如下。
在動作211e中,處理器13可將該文本資料輸入一推薦模型。在動作213e中,推薦模型分析該文本資料之該當前段落以取出該詞彙作為該推薦第一實體。在動作215e中,推薦模型產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
在某些實施例中,動作211e、213e、215e中所述的該推薦模型可以是由處理器13使用Bi-LSTM(Bi-directional Long Short-Term Memory)演算法,並以資料庫111所儲存的複數三元組T1、T2、…、Tn 中的至少十組三元組作為訓練資料所建立的。處理器13可以是根據該至少十組三元組中所包含的元架構(meta structure)來訓練一深度學習模型,以使得被訓練後的該深度學習模型有能力辨識一文本中的實體及關聯性。
在某些其他的實施例中,該推薦模型亦可以是由外部裝置預先採用相同或不同的方式訓練後,輸入至知識圖譜建置系統1中。
在某些實施例中,複數三元組T1、T2、…、Tn 包含已被確認的至少十組三元組,且處理器13還可用以將已被確認的該至少十組三元組作為訓練資料,以重新訓練並更新該推薦模型。
回到第2A圖,在運作23中,操作介面12可在該文本資料中的一當前段落上顯示該推薦第一實體、該至少一推薦第二實體、以及該至少一推薦關聯性,以供一使用者選擇。
第3圖例示了根據本發明的某些實施例的操作介面12在文本資料中的一當前段落上顯示該推薦第一實體、該至少一推薦第二實體、以及該至少一推薦關聯性的示意圖。
在第3圖例示的實施例中,操作介面12可顯示一文本資料顯示區31以及一操作選單32。文本資料顯示區31可顯示文本資料D1的全部或一部份,文本資料D1包含該推薦第一實體所在的該當前段落。操作介面12還可以在文本資料顯示區31中顯示該推薦第一實體的一實體標記,舉例而言,處理器13可以在文本顯示區31中的「新生兒」處標示底線,以顯示「新生兒」為推薦第一實體。操作介面12亦可在操作選單32上顯示該推薦第一實體以及該推薦第一實體所對應之該至少一推薦第二實體和該至少一推薦關聯性,以供使用者進行選擇。
舉例而言,操作選單32上可顯示該推薦第一實體「新生兒」,其對應的推薦第二實體「乙型鏈球菌」、「肺炎」、以及「敗血症」,且該等推薦第二實體分別對應的推薦關聯性「感染」、「肺炎」、以及「患有」。
在某些實施例中,該推薦第一實體與各該推薦第二實體還可分別對應至一類別,舉例而言,如操作選單32中的推薦第一實體「新生兒」可對應至「人類」類別。在某些實施例中,處理器13可同樣地在文本資料顯示區31中顯示推薦第二實體的一實體標記。
須說明,第3圖所示操作介面12所顯示的內容僅為舉例而非限制,該實體標記的種類及操作選單的排列方式可因應於需求或喜好而有不同的設定。
再回到第2A圖,在運作25中,處理器13可透過操作介面12接收一確認訊息M1,該確認訊息M1與該推薦第一實體、該使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、以及該使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關。
使用者可以在操作介面12所顯示的操作選單中,從該至少一推薦第二實體及該至少一推薦關聯性中選擇一推薦第二實體及一推薦關聯性。然後,操作介面12可接收該使用者提供的該確認訊息M1,且該確認訊息M1可對應該推薦第一實體、使用者所選擇的該推薦第二實體及該推薦關聯性。在某些實施例中,操作介面12可用以提供一確認選項以接收該確認訊息M1。舉例而言,在使用者點選一推薦第二實體及一推薦關聯性之後,操作介面12再顯示一確認選項讓使用者點選,以接收該確認訊息M1。
接著,在運作27中,處理器13可將該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性儲存到該資料庫以新增至該複數三元組中。在運作29中,處理器13利用該複數三元組建立一當前知識圖譜。
在某些實施例中,處理器13可以將使用者確認過後的該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性作為已確認的一組三元組,並將已確認的該組三元組儲存至資料庫111中以新增至該複數三元組中,以更新該資料庫111中的複數三元組。如此一來,更新後的資料庫111中將包含已確認的該組三元組,處理器13即可根據更新後的資料庫111中的所有三元組重新建立一當前知識圖譜。
第4圖例示了根據本發明的某些實施例的一種知識圖譜建置方法。第4圖所示內容是為了舉例說明本發明的實施例,而非為了限制本發明的保護範圍。
參照第4圖,知識圖譜建置方法4可包含以下步驟:由一知識圖譜建置系統,輸入並顯示一文本資料(標示為步驟401);由該知識圖譜建置系統,根據該文本資料與該資料庫的複數三元組,產生該文本資料的一推薦第一實體,其中該複數三元組是被儲存於該知識圖譜建置系統中,且各該三元組包含一第一實體、一第二實體、以及該第一實體與該第二實體之一關聯性資料(標示為步驟403);由該知識圖譜建置系統,根據該推薦第一實體,在該文本資料中的一當前段落上顯示對應該推薦第一實體的至少一推薦第二實體、以及該推薦第一實體與各該至少一推薦第二實體之間的至少一推薦關聯性,以供一使用者選擇(標示為步驟405);由該知識圖譜建置系統,接收一確認訊息,該確認訊息與該推薦第一實體、該使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、以及該使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關(標示為步驟407);由該知識圖譜建置系統,根據該確認訊息,將該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性儲存到該資料庫以新增至該複數三元組中(標示為步驟409);以及由該知識圖譜建置系統,利用該複數三元組建立一當前知識圖譜(標示為步驟411)。
在某些實施例中,除了步驟401~411,知識圖譜建置方法4還可包含以下步驟:由該知識圖譜建置系統,分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體。
在某些實施例中,該知識圖譜建置系統可儲存複數歷史段落及各該歷史段落分別對應之一歷史第一實體、一歷史第二實體、以及一歷史關聯性,且知識圖譜建置方法4該還可以包含以下步驟:由該知識圖譜建置系統,分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體;由該知識圖譜建置系統,比對該當前段落及各該歷史段落,選擇各該歷史段落中與該當前段落相似度高之一歷史段落;以及由該知識圖譜建置系統,根據被選擇的該歷史段落所對應之該歷史第一實體、該歷史第二實體、以及該歷史關聯性,產生與該推薦第一實體對應的一推薦第二實體以及一推薦關聯性。
在某些實施例中,除了步驟401~411,知識圖譜建置方法4還可包含以下步驟:由該知識圖譜建置系統,於該文本資料中的該推薦第一實體上顯示一實體標記;以及由該知識圖譜建置系統,顯示一操作選單,該操作選單包含該推薦第一實體所對應之該至少一推薦第二實體及該至少一推薦關聯性,以供該使用者選擇。
在某些實施例中,除了步驟401~411,知識圖譜建置方法4還可包含以下步驟:由該知識圖譜建置系統,於該文本資料中的該推薦第一實體上顯示一實體標記;以及由該知識圖譜建置系統,顯示一操作選單,該操作選單包含該推薦第一實體所對應之該至少一推薦第二實體及該至少一推薦關聯性,以供該使用者選擇。其中,該推薦第一實體與各該推薦第二實體分別對應至一類別,且各該第二推薦實體之實體標記同樣顯示於該知識圖譜建置系統及該操作選單中。
在某些實施例中,除了步驟401~411,知識圖譜建置方法4還可包含以下步驟:由該知識圖譜建置系統,於該文本資料中的該推薦第一實體上顯示一實體標記;由該知識圖譜建置系統,顯示一操作選單,該操作選單包含該推薦第一實體所對應之該至少一推薦第二實體及該至少一推薦關聯性,以供該使用者選擇;以及由該知識圖譜建置系統,提供一確認選項以接收該確認訊息。其中,該推薦第一實體與各該推薦第二實體分別對應至一類別,且各該第二推薦實體之實體標記同樣顯示於該知識圖譜建置系統及該操作選單中。
在某些實施例中,該知識圖譜建置系統可儲存複數歷史知識圖譜,且除了步驟401~411,知識圖譜建置方法4該還可以包含以下步驟:由該知識圖譜建置系統,分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體;以及由該知識圖譜建置系統,比對該當前知識圖譜及該複數歷史知識圖譜,從該複數歷史知識圖譜中找出和該當前知識圖譜的該複數三元組具有近似結構的至少一歷史知識圖譜三元組,以產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
在某些實施例中,關於知識圖譜建置方法4,該複數三元組至少包含:該文本資料中已被確認的至少一三元組。
在某些實施例中,除了步驟401~411,知識圖譜建置方法4還可包含以下步驟:由該知識圖譜建置系統,分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體;以及由該知識圖譜建置系統,產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。其中,該知識圖譜建置系統是使用Bi-LSTM演算法,並以該複數三元組中的至少十組三元組作為訓練資料,以建立一推薦模型;且該知識圖譜建置系統並透過將該文本資料輸入該推薦模型,以分析該文本資料之該當前段落以取出該詞彙作為該推薦第一實體,以及產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
在某些實施例中,該知識圖譜建置系統儲存的該複數三元組至少包含已被確認的至少十組三元組,且除了步驟401~411,知識圖譜建置方法4還可包含以下步驟:由該知識圖譜建置系統,分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體;由該知識圖譜建置系統,產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性;以及由該知識圖譜建置系統,將該至少十組三元組作為訓練資料,以重新訓練並更新該推薦模型。其中,該知識圖譜建置系統是使用Bi-LSTM演算法,並以該複數三元組中的至少十組三元組作為訓練資料,以建立一推薦模型;且該知識圖譜建置系統並透過將該文本資料輸入該推薦模型,以分析該文本資料之該當前段落以取出該詞彙作為該推薦第一實體,以及產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
執行知識圖譜建置方法4的該知識圖譜建置系統可以是第1圖所敘述的知識圖譜建置系統1。亦即,知識圖譜建置方法4的每一個實施例本質上都會與知識圖譜建置系統1的某一個實施例相對應。因此,即使上文未針對知識圖譜建置方法4的每一個實施例進行詳述,本發明所屬技術領域中具有通常知識者仍可根據上文針對知識圖譜建置系統1的說明而直接瞭解知識圖譜建置方法4的未詳述的實施例。
以上所揭露的實施例並非為了限制本發明。針對以上所揭露的實施例的任何改變或調整,只要是本發明所屬技術領域中具有通常知識者可輕易思及的,也都落於本發明的範圍內。本發明的範圍以申請專利範圍所載內容為準。
如下所示: 1:知識圖譜建置系統 11:儲存器 111:資料庫 12:操作介面 13:處理器 D1:文本資料 M1:確認訊息 21、23、25、27、29:運作 211b、213b、215b:動作 211c、213c、215c:動作 K1:當前知識圖譜 K21、K22:歷史知識圖譜 211e、213e、215e:動作 31:文本資料顯示區 32:操作選單 4:知識圖譜建置方法 401、403、405、407、409、411:步驟 T1、T2、…、Tn:三元組
檢附的圖式可輔助說明本發明的各種實施例,其中: 〔第1圖〕例示了根據本發明的某些實施例的一種知識圖譜建置系統的示意圖; 〔第2A圖〕例示了根據本發明的某些實施例,第1圖的知識圖譜建置系統的運作流程的示意圖; 〔第2B圖〕至〔第2E圖〕例示了根據本發明的某些實施例,第2A圖中運作21的三種運作的細節的示意圖; 〔第3圖〕例示了根據本發明的某些實施例的操作介面顯示文本資料與操作選單的示意圖;以及 〔第4圖〕例示了根據本發明的某些實施例的一種知識圖譜建置方法。
4:知識圖譜建置方法 401、402、403、404、405、406:步驟

Claims (20)

  1. 一種知識圖譜建置系統,包含: 一操作介面,用以輸入並顯示一文本資料; 一儲存器,包含一資料庫,該資料庫用以儲存複數三元組,其中各該三元組包含一第一實體、一第二實體、以及該第一實體與該第二實體之一關聯性資料;以及 一處理器,電性連接至該操作介面和該儲存器,且用以: 根據該文本資料與該資料庫的該複數三元組,產生該文本資料的一推薦第一實體; 透過該操作介面,根據該推薦第一實體,在該文本資料中的一當前段落上顯示對應該推薦第一實體的至少一推薦第二實體、以及該推薦第一實體與各該至少一推薦第二實體之間的至少一推薦關聯性,以供一使用者選擇; 透過該操作介面,接收一確認訊息,該確認訊息與該推薦第一實體、該使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、以及該使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關; 根據該確認訊息,將該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性儲存到該資料庫以新增至該複數三元組中;以及 利用該複數三元組建立一當前知識圖譜。
  2. 如請求項1所述的知識圖譜建置系統,其中該處理器還用以分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體。
  3. 如請求項2所述的知識圖譜建置系統,其中: 該資料庫還用以儲存複數歷史段落及各該歷史段落分別對應之一歷史第一實體、一歷史第二實體、以及一歷史關聯性;且 該處理器還用以比對該當前段落及各該歷史段落,選擇各該歷史段落中與該當前段落相似度高之一歷史段落,並根據被選擇的該歷史段落所對應之該歷史第一實體、該歷史第二實體、以及該歷史關聯性,產生與該推薦第一實體對應的一推薦第二實體以及一推薦關聯性。
  4. 如請求項1所述的知識圖譜建置系統,其中該操作介面還用以: 於該文本資料中的該推薦第一實體上顯示一實體標記;以及 顯示一操作選單,該操作選單包含該推薦第一實體所對應之該至少一推薦第二實體及該至少一推薦關聯性,以供該使用者選擇。
  5. 如請求項4所述的知識圖譜建置系統,其中該推薦第一實體與各該推薦第二實體分別對應至一類別,且各該第二推薦實體之實體標記同樣顯示於該操作介面及該操作選單中。
  6. 如請求項4所述的知識圖譜建置系統,其中該操作介面還用以提供一確認選項以接收該確認訊息。
  7. 如請求項2所述的知識圖譜建置系統,其中: 該資料庫更用以儲存複數歷史知識圖譜;且 該處理器還用以比對該當前知識圖譜及該複數歷史知識圖譜,從該複數歷史知識圖譜中找出和該當前知識圖譜的該複數三元組具有近似結構的至少一歷史知識圖譜三元組,以產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
  8. 如請求項1所述的知識圖譜建置系統,其中該複數三元組至少包含:該文本資料中已被確認的至少一三元組。
  9. 如請求項2所述的知識圖譜建置系統,其中: 該處理器還用以使用Bi-LSTM(Bi-directional Long Short-Term Memory)演算法,並以該複數三元組中的至少十組三元組作為訓練資料,以建立一推薦模型;且 該處理器是透過將該文本資料輸入該推薦模型,以分析該文本資料之該當前段落以取出該詞彙作為該推薦第一實體,以及產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
  10. 如請求項9所述的知識圖譜建置系統,其中: 該資料庫儲存的該複數三元組至少包含已被確認的至少十組三元組;且 該處理器還用以將該至少十組三元組作為訓練資料,以重新訓練並更新該推薦模型。
  11. 一種知識圖譜建置方法,包含: 由一知識圖譜建置系統,輸入並顯示一文本資料; 由該知識圖譜建置系統,根據該文本資料與該資料庫的複數三元組,產生該文本資料的一推薦第一實體,其中該複數三元組是被儲存於該知識圖譜建置系統中,且各該三元組包含一第一實體、一第二實體、以及該第一實體與該第二實體之一關聯性資料; 由該知識圖譜建置系統,根據該推薦第一實體,在該文本資料中的一當前段落上顯示對應該推薦第一實體的至少一推薦第二實體、以及該推薦第一實體與各該至少一推薦第二實體之間的至少一推薦關聯性,以供一使用者選擇; 由該知識圖譜建置系統,接收一確認訊息,該確認訊息與該推薦第一實體、該使用者從該至少一推薦第二實體中所選擇的一推薦第二實體、以及該使用者從該至少一推薦關聯性中所選擇的一推薦關聯性相關; 由該知識圖譜建置系統,根據該確認訊息,將該推薦第一實體、被選擇的該推薦第二實體、以及被選擇的該推薦關聯性儲存到該資料庫以新增至該複數三元組中;以及 由該知識圖譜建置系統,利用該複數三元組建立一當前知識圖譜。
  12. 如請求項11所述的知識圖譜建置方法,還包含: 由該知識圖譜建置系統,分析該當前段落,以從該當前段落中取出一詞彙作為該推薦第一實體。
  13. 如請求項12所述的知識圖譜建置方法,其中: 該知識圖譜建置系統儲存複數歷史段落及各該歷史段落分別對應之一歷史第一實體、一歷史第二實體、以及一歷史關聯性;且 該知識圖譜建置方法還包含: 由該知識圖譜建置系統,比對該當前段落及各該歷史段落,選擇各該歷史段落中與該當前段落相似度高之一歷史段落;以及 由該知識圖譜建置系統,根據被選擇的該歷史段落所對應之該歷史第一實體、該歷史第二實體、以及該歷史關聯性,產生與該推薦第一實體對應的一推薦第二實體以及一推薦關聯性。
  14. 如請求項11所述的知識圖譜建置方法,還包含: 由該知識圖譜建置系統,於該文本資料中的該推薦第一實體上顯示一實體標記;以及 由該知識圖譜建置系統,顯示一操作選單,該操作選單包含該推薦第一實體所對應之該至少一推薦第二實體及該至少一推薦關聯性,以供該使用者選擇。
  15. 如請求項14所述的知識圖譜建置方法,其中該推薦第一實體與各該推薦第二實體分別對應至一類別,且各該第二推薦實體之實體標記同樣顯示於該知識圖譜建置系統及該操作選單中。
  16. 如請求項14所述的知識圖譜建置方法,還包含: 由該知識圖譜建置系統,提供一確認選項以接收該確認訊息。
  17. 如請求項12所述的知識圖譜建置方法,其中: 該知識圖譜建置系統中儲存複數歷史知識圖譜;且 該知識圖譜建置方法還包含: 由該知識圖譜建置系統,比對該當前知識圖譜及該複數歷史知識圖譜,從該複數歷史知識圖譜中找出和該當前知識圖譜的該複數三元組具有近似結構的至少一歷史知識圖譜三元組,以產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
  18. 如請求項11所述的知識圖譜建置方法,其中該複數三元組至少包含:該文本資料中已被確認的至少一三元組。
  19. 如請求項12所述的知識圖譜建置方法,還包含: 由該知識圖譜建置系統,使用Bi-LSTM演算法,並以該複數三元組中的至少十組三元組作為訓練資料,以建立一推薦模型;以及 由該知識圖譜建置系統,透過將該文本資料輸入該推薦模型,以分析該文本資料之該當前段落以取出該詞彙作為該推薦第一實體,以及產生對應該推薦第一實體的該至少一推薦第二實體及該至少一推薦關聯性。
  20. 如請求項19所述的知識圖譜建置方法,其中: 該知識圖譜建置系統儲存的該複數三元組至少包含已被確認的至少十組三元組;且 該知識圖譜建置方法還包含: 由該知識圖譜建置系統,將該至少十組三元組作為訓練資料,以重新訓練並更新該推薦模型。
TW109139046A 2020-11-09 2020-11-09 知識圖譜建置系統與知識圖譜建置方法 TWI774117B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW109139046A TWI774117B (zh) 2020-11-09 2020-11-09 知識圖譜建置系統與知識圖譜建置方法
CN202011292148.9A CN114461808A (zh) 2020-11-09 2020-11-18 知识图谱建置系统与知识图谱建置方法
US17/111,499 US20220147835A1 (en) 2020-11-09 2020-12-03 Knowledge graph construction system and knowledge graph construction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109139046A TWI774117B (zh) 2020-11-09 2020-11-09 知識圖譜建置系統與知識圖譜建置方法

Publications (2)

Publication Number Publication Date
TW202219790A TW202219790A (zh) 2022-05-16
TWI774117B true TWI774117B (zh) 2022-08-11

Family

ID=81403874

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109139046A TWI774117B (zh) 2020-11-09 2020-11-09 知識圖譜建置系統與知識圖譜建置方法

Country Status (3)

Country Link
US (1) US20220147835A1 (zh)
CN (1) CN114461808A (zh)
TW (1) TWI774117B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11893352B2 (en) * 2021-04-22 2024-02-06 Adobe Inc. Dependency path reasoning for measurement extraction
US20230316001A1 (en) * 2022-03-29 2023-10-05 Robert Bosch Gmbh System and method with entity type clarification for fine-grained factual knowledge retrieval
CN115168567B (zh) * 2022-09-07 2022-12-02 北京慧点科技有限公司 一种基于知识图谱的对象推荐方法
CN115271683B (zh) * 2022-09-26 2023-01-13 西南交通大学 基于标准知识图谱元结构的bim自动标准审查系统
CN115495595A (zh) * 2022-11-16 2022-12-20 北京大学 知识图谱构建方法、装置、电子设备及非易失性存储介质
CN116108162B (zh) * 2023-03-02 2024-03-08 广东工业大学 一种基于语义增强的复杂文本推荐方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095303A1 (en) * 2013-09-27 2015-04-02 Futurewei Technologies, Inc. Knowledge Graph Generator Enabled by Diagonal Search
TW202016758A (zh) * 2018-10-25 2020-05-01 財團法人資訊工業策進會 知識圖譜產生裝置、方法及其電腦程式產品
CN111400607A (zh) * 2020-06-04 2020-07-10 浙江口碑网络技术有限公司 搜索内容输出方法、装置、计算机设备及可读存储介质
CN111858836A (zh) * 2020-08-14 2020-10-30 连接派(杭州)互联网有限公司 数据处理及提供方法、装置、系统及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7398201B2 (en) * 2001-08-14 2008-07-08 Evri Inc. Method and system for enhanced data searching
US8359193B2 (en) * 2009-12-31 2013-01-22 International Business Machines Corporation Pre-highlighting text in a semantic highlighting system
US8719692B2 (en) * 2011-03-11 2014-05-06 Microsoft Corporation Validation, rejection, and modification of automatically generated document annotations
US10042836B1 (en) * 2012-04-30 2018-08-07 Intuit Inc. Semantic knowledge base for tax preparation
WO2017074401A1 (en) * 2015-10-29 2017-05-04 Hewlett Packard Enterprise Development Lp User interaction logic classification
US10606893B2 (en) * 2016-09-15 2020-03-31 International Business Machines Corporation Expanding knowledge graphs based on candidate missing edges to optimize hypothesis set adjudication
US11468342B2 (en) * 2018-09-14 2022-10-11 Jpmorgan Chase Bank, N.A. Systems and methods for generating and using knowledge graphs

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095303A1 (en) * 2013-09-27 2015-04-02 Futurewei Technologies, Inc. Knowledge Graph Generator Enabled by Diagonal Search
TW202016758A (zh) * 2018-10-25 2020-05-01 財團法人資訊工業策進會 知識圖譜產生裝置、方法及其電腦程式產品
CN111400607A (zh) * 2020-06-04 2020-07-10 浙江口碑网络技术有限公司 搜索内容输出方法、装置、计算机设备及可读存储介质
CN111858836A (zh) * 2020-08-14 2020-10-30 连接派(杭州)互联网有限公司 数据处理及提供方法、装置、系统及存储介质

Also Published As

Publication number Publication date
US20220147835A1 (en) 2022-05-12
CN114461808A (zh) 2022-05-10
TW202219790A (zh) 2022-05-16

Similar Documents

Publication Publication Date Title
TWI774117B (zh) 知識圖譜建置系統與知識圖譜建置方法
Song et al. Deep learning methods for biomedical named entity recognition: a survey and qualitative comparison
WO2021212682A1 (zh) 知识抽取方法、装置、电子设备及存储介质
US10853401B2 (en) Method, apparatus, and computer program product for classification and tagging of textual data
US10915577B2 (en) Constructing enterprise-specific knowledge graphs
US20210168098A1 (en) Providing local service information in automated chatting
WO2018072071A1 (zh) 知识图谱构建系统及方法
US10685183B1 (en) Consumer insights analysis using word embeddings
KR20200094627A (ko) 텍스트 관련도를 확정하기 위한 방법, 장치, 기기 및 매체
US20120290561A1 (en) Information processing apparatus, information processing method, program, and information processing system
WO2018165932A1 (en) Generating responses in automated chatting
WO2020063148A1 (zh) 一种基于深度学习的实体抽取方法、计算机设备和存储介质
CN111680159A (zh) 数据处理方法、装置及电子设备
US10558759B1 (en) Consumer insights analysis using word embeddings
US20210157983A1 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
CN112749547A (zh) 文本分类器训练数据的产生
WO2023029513A1 (zh) 基于人工智能的搜索意图识别方法、装置、设备及介质
KR102456535B1 (ko) 의료 사실 검증 방법, 장치, 전자 기기, 저장 매체 및 프로그램
US12007988B2 (en) Interactive assistance for executing natural language queries to data sets
US20210158210A1 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
US20180365592A1 (en) Analyzing data from structured and unstructured sources
US20220237376A1 (en) Method, apparatus, electronic device and storage medium for text classification
Das et al. Context-sensitive gender inference of named entities in text
US11030539B1 (en) Consumer insights analysis using word embeddings
WO2021097629A1 (zh) 数据处理方法、装置、电子设备和存储介质