TWI823091B - 資訊檢索系統 - Google Patents
資訊檢索系統 Download PDFInfo
- Publication number
- TWI823091B TWI823091B TW110119151A TW110119151A TWI823091B TW I823091 B TWI823091 B TW I823091B TW 110119151 A TW110119151 A TW 110119151A TW 110119151 A TW110119151 A TW 110119151A TW I823091 B TWI823091 B TW I823091B
- Authority
- TW
- Taiwan
- Prior art keywords
- information
- search
- keyword
- words
- categories
- Prior art date
Links
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 15
- 239000000284 extract Substances 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 11
- 230000000875 corresponding effect Effects 0.000 description 15
- 238000003058 natural language processing Methods 0.000 description 11
- 230000007257 malfunction Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 238000012508 change request Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 5
- 230000002950 deficient Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Liquid Crystal Substances (AREA)
Abstract
本發明提供一種可有效率地發現檢索者欲獲知的資訊的資訊檢索系統。資訊檢索系統包括:資料庫(12),儲存能夠進行文本檢索的多個資訊;詢問文章受理部(26),受理自然語言形式的詢問文章;輸入檢索關鍵字提取部(44),自詢問文章中提取輸入檢索關鍵字;檢索執行部(40),使用輸入檢索關鍵字及與輸入檢索關鍵字關聯的關鍵字對資料庫執行檢索處理;以及關鍵字辭典(30),註冊有與類別對應的單詞,其中,檢索執行部自關鍵字辭典中獲取與由檢索者所選擇的一個類別對應的單詞,基於所獲取的單詞將檢索處理中檢索到的資訊排序,並顯示給檢索者。
Description
本揭示是有關於一種資訊檢索系統。
先前,製造業等中的保養業務的資料為記載於紙面的資料(data)(紙質資料)。於保養業務的資訊檢索系統中,重要的是將該些紙質資料電子化,歸總蓄積並資料庫化。由於檢索技術的進步,而檢索結果的精度提高,正推進紙質資料的電子化及資料庫化。
例如在製造業中,將裝置等的故障、不良狀況、原因及應對法等隨時資料庫化,於產生了同樣的故障、不良狀況的情形時作為以往的事例進行參考,藉此謀求避免不良狀況,縮短直至恢復為止的時間。另外,於資料庫亦儲存有作業標準、手冊(manual)等資訊。因此,儲存於資料庫的資訊變得龐大。
作為自此種龐大的資料中得到必要資訊的方法,先前有下述文本檢索處理,即:將所給予的字符串作為關鍵字,輸出與其一致的內容作為檢索結果。例如專利文獻1揭示下述資訊檢索系統,即:即便是知識、經驗淺薄而難以輸入適當的關鍵字的人,亦能夠獲得良好的檢索結果。
[先前技術文獻]
[專利文獻]
專利文獻1:日本專利特開2019-121392號公報
[發明所欲解決之課題]
此處,先前技術中,檢索結果是以資訊檢索系統中規定的順序顯示。例如,於針對裝置的故障而搜索可能的原因的情形時,有時僅與代表性原因有關的資料顯示於檢索結果的上位,難以找到與並非代表性的原因有關的資料。因此,對故障的應對有時會長期化。
本揭示是鑑於該課題而成,目的在於提供一種可有效率地發現檢索者欲獲知的資訊的資訊檢索系統。
[解決課題之手段]
本揭示的資訊檢索系統包括:
資料庫,儲存能夠進行文本檢索的多個資訊;
詢問文章受理部,受理自然語言形式的詢問文章;
輸入檢索關鍵字提取部,自所述詢問文章中提取輸入檢索關鍵字;
檢索執行部,使用所述輸入檢索關鍵字及與所述輸入檢索關鍵字關聯的關鍵字對所述資料庫執行檢索處理;以及
關鍵字辭典,註冊有與類別對應的單詞,其中
所述檢索執行部自所述關鍵字辭典中獲取與由檢索者所選擇的一個所述類別對應的單詞,基於所獲取的單詞將所述檢索處理中檢索到的資訊排序,並顯示給所述檢索者。
[發明的效果]
根據本揭示,可提供一種可有效率地發現檢索者欲獲知的資訊的資訊檢索系統。
本實施形態中,資訊檢索系統將製造業中的設備保養作業資訊作為能夠進行文本檢索的資訊而資料庫化。以下述資訊檢索系統作為一例進行以下說明,即:於產生了故障、不良狀況的情形時,藉由檢索者以文章的形式輸入該狀況,從而可自資料庫中檢索成為參考的以往事例的資訊。檢索者可基於所檢索到的資訊來進行設備的恢復作業。此處,設備保養作業資訊例如包含記載有裝置等的故障、不良狀況、原因及應對法等的作業標準以及手冊等資訊。另外,以下有時將與故障或不良狀況有關的事例稱為「故障事例」。
本揭示的資訊檢索系統的檢索用途不限定於上文所述。本揭示的資訊檢索系統亦可用於支援設備故障恢復作業等設備保養作業以外的用途。本揭示的資訊檢索系統例如亦可適用於:於營業領域中,針對來自顧客的問詢內容來檢索以往的事例,提示最適的回答。本揭示的資訊檢索系統例如可適用於:於商品設計領域中,針對來自顧客的諮詢來檢索類似的製造實績、技術論文等文獻,提出最適的製品設計。
圖1為表示本揭示的一實施形態的資訊檢索系統的概略結構的方塊圖。資訊檢索系統包括執行檢索處理的資訊檢索裝置10、儲存能夠進行文本檢索的多個資訊的資料庫12、連接於資訊檢索裝置10的鍵盤、滑鼠等輸入裝置14、連接於資訊檢索裝置10的顯示器等顯示裝置16、以及經由網路18而與資訊檢索裝置10連接的檢索者側終端20而構成。
網路18為區域網路(Local Area Network,LAN)等通訊網。但是不限定於此,網路18除了網際網路(Internet)等公用通訊網以外,可為廣域網路(Wide Area Network,WAN)或虛擬私有網路(Virtual Private Network,VPN)般的局部介置有一般公用線路的通訊網。資訊檢索裝置10及檢索者側終端20分別藉由電腦及程式而實現。檢索者側終端20的示例為個人電腦(Personal Computer,PC)、平板型電腦等,將輸入裝置22及顯示裝置24連接或一體化。
此處,圖1的資訊檢索系統的結構為一例,可不含構成要素的一部分。另外,資訊檢索系統可包括其他構成要素。例如,資訊檢索系統可為不包括輸入裝置14及顯示裝置16而是使用檢索者側終端20來進行資訊的輸入輸出的結構。
於資料庫12內儲存有文章、圖式、照片等。文章不僅為自一開始進行文本輸入而成,亦可為使用聲音識別引擎將聲音加以文本化而成,亦可為使用光學字元閱讀器(Optical Character Reader,OCR)將紙介質中的文章加以文本化而成。於儲存圖式、照片的情形時可對嵌埋於圖式中的字符或文件名進行檢索處理。在儲存於資料庫12的資訊中,包含裝置等的故障、不良狀況及其原因、進而其應對法等作業標準、手冊等資訊。本實施形態中,資料庫12包含多個故障事例。
資訊檢索裝置10包括詢問文章受理部26、自然語言處理部28、關鍵字辭典30、檢索候補關鍵字讀出部32、檢索關鍵字記憶部34、資訊種類判斷部36、資訊種類判斷用辭典38、檢索執行部40及檢索候補關鍵字變更要求受理部42而構成。自然語言處理部28包含輸入檢索關鍵字提取部44及資訊種類判斷用關鍵字提取部46。此處,圖1的資訊檢索裝置10的結構為一例,可不含構成要素的一部分。另外,資訊檢索裝置10可包括其他構成要素。例如,資訊檢索裝置10可為不包括關鍵字辭典30及資訊種類判斷用辭典38,而經由網路18存取設於資訊檢索裝置10的外部的該些辭典的結構。
該些各功能塊概略而言具有如下功能。詢問文章受理部26經由網路18依序受理檢索者經由檢索者側終端20的輸入裝置22輸入的自然語言形式的詢問文章。於檢索者側終端20,例如可依序輸入「於○○設備產生××裝置的故障。以往有類似例?」、「故障的種類為△△故障的是?」、「□□零件的更換順序為?」、「反相器的跳脫的原因是?」等自然語言形式的詢問文章。
自然語言處理部28對詢問文章受理部26所受理的詢問文章進行已知的構詞分析等自然語言處理,並提取單詞。自然語言處理部28的輸入檢索關鍵字提取部44自所輸入的詢問文章中提取用於檢索的輸入檢索關鍵字。為了進行該提取,輸入檢索關鍵字提取部44例如可參照下文將詳細說明的關鍵字辭典30,提取註冊於關鍵字辭典30的單詞作為輸入檢索關鍵字。輸入檢索關鍵字提取部44例如於輸入有「於○○設備產生××裝置的故障。以往有類似例?」的詢問文章的情形時,提取「○○設備」及「××裝置」的單詞作為輸入檢索關鍵字。輸入檢索關鍵字提取部44例如於輸入有「故障的種類為△△故障的是?」的詢問文章的情形時,提取「△△故障」的單詞作為輸入檢索關鍵字。輸入檢索關鍵字提取部44例如於輸入有「□□零件的更換順序為?」的詢問文章的情形時,提取「□□零件」的單詞作為輸入檢索關鍵字。輸入檢索關鍵字提取部44例如於輸入有「反相器的跳脫的原因是?」的詢問文章的情形時,提取「反相器」及「跳脫」的單詞作為輸入檢索關鍵字。
自然語言處理部28的資訊種類判斷用關鍵字提取部46自所輸入的詢問文章中,提取用於判斷作為檢索意圖的資訊種類的、資訊種類判斷用關鍵字。為了進行該提取,資訊種類判斷用關鍵字提取部46可參照下文將詳細說明的資訊種類判斷用辭典38,提取註冊於資訊種類判斷用辭典38的單詞作為資訊種類判斷用關鍵字。資訊種類判斷用關鍵字提取部46例如於輸入有「於○○設備產生××裝置的故障。以往有類似例?」的詢問文章的情形時,提取「故障」及「類似例」的單詞作為資訊種類判斷用關鍵字。資訊種類判斷用關鍵字提取部46例如於輸入有「故障的種類為△△故障的是?」的詢問文章的情形時,提取「故障的種類」的單詞作為資訊種類判斷用關鍵字。資訊種類判斷用關鍵字提取部46例如於輸入有「□□零件的更換順序為?」的詢問文章的情形時,提取「更換順序」的單詞作為資訊種類判斷用關鍵字。資訊種類判斷用關鍵字提取部46例如於輸入有「反相器的跳脫的原因是?」的詢問文章的情形時,提取「原因」的單詞作為輸入檢索關鍵字。
於關鍵字辭典30,相互對應地預先註冊、儲存有關聯的關鍵字彼此。本實施形態中,於關鍵字辭典30,相互對應地註冊有互為相同含意的關鍵字彼此。另外,於關鍵字辭典30,相互對應地註冊有互為類似含意的關鍵字彼此。但是,於關鍵字辭典30,可僅註冊有互為相同含意的關鍵字,或可僅註冊有互為類似含意的關鍵字。亦可取而代之或除此以外,相互對應地預先註冊可認為相互關聯性高的關鍵字彼此。
圖2表示預先註冊於關鍵字辭典30的關鍵字的一例。屬於同一列的關鍵字彼此為相互關聯的關鍵字,相互對應。此處,所註冊的關鍵字(單詞)亦與類別對應。關於類別的詳情,將於後述。
檢索候補關鍵字讀出部32每當輸入檢索關鍵字提取部44提取輸入檢索關鍵字時,參照關鍵字辭典30,讀出與輸入檢索關鍵字關聯的關鍵字作為檢索候補關鍵字。檢索候補關鍵字讀出部32例如於輸入檢索關鍵字為「○○設備」的情形時,自關鍵字辭典30中讀出作為相同含意詞的「AA設備」、「A'A'設備」、「A”A”」,並讀出作為類似含意詞的「aaa」、「a'a'a'」。即,檢索候補關鍵字讀出部32讀出「AA設備」、「A'A'設備」、「A”A”」、「aaa」及「a'a'a'」作為檢索候補關鍵字。此處,檢索候補關鍵字讀出部32可不自關鍵字辭典30中讀出相同含意詞及類似含意詞全部,而是讀出一部分作為檢索候補關鍵字。作為一例,檢索候補關鍵字讀出部32可僅讀出相同含意詞。
檢索關鍵字記憶部34將如所述般獲得的輸入檢索關鍵字及檢索候補關鍵字作為檢索關鍵字而記憶。檢索關鍵字記憶部34例如於追加輸入有詢問文章的情形時,可將追加的輸入檢索關鍵字及追加的檢索候補關鍵字作為檢索關鍵字而累積地記憶。
資訊種類判斷部36基於自詢問文章中提取的資訊種類判斷用關鍵字,判斷檢索意圖。資訊種類判斷部36參照資訊種類判斷用辭典38,基於資訊種類判斷用關鍵字判斷應檢索的資訊種類。圖3表示儲存於資訊種類判斷用辭典38的資訊種類判斷用關鍵字的一例。於資訊種類判斷用辭典38,對應地註冊有可自詢問文章中提取的資訊種類判斷用關鍵字、及與資訊種類判斷用關鍵字對應的資訊種類。例如針對「故障」及「類似例」的資訊種類判斷用關鍵字,對應地註冊有「故障事例」作為資訊種類。另外,例如針對「故障的種類」及「更換順序」的資訊種類判斷用關鍵字,對應地註冊有「手冊」作為資訊種類。另外,儲存於資料庫12的資訊是針對每個資訊種類劃分為多個群而管理。例如,可於資料庫12中,以「故障事例」處於一個文件夾下的方式進行儲存,且以「手冊」處於另一文件夾下的方式進行儲存。
檢索執行部40針對儲存於資料庫12的資訊,進行使用記憶於檢索關鍵字記憶部34的檢索關鍵字的、文本庫的檢索處理。即,檢索執行部40使用輸入檢索關鍵字及與輸入檢索關鍵字關聯的關鍵字,對資料庫12執行檢索處理。檢索執行部40針對屬於資料庫12的多個群中至少與由資訊種類判斷部36所判斷的資訊種類對應的群的資訊進行檢索處理。
檢索執行部40自關鍵字辭典30中獲取與由檢索者所選擇的一個類別對應的單詞。檢索執行部40基於所獲取的單詞將檢索處理中檢索到的資訊排序,並顯示給檢索者。即,檢索執行部40根據檢索者所指定的類別將檢索到的資訊排序,例如將檢索結果顯示於顯示裝置24。
本實施形態中,檢索者可選擇六個類別中的一個,並根據所選擇的類別對檢索結果進行排序,從而有效率地發現欲獲知的資訊。六個類別為功能場所、設備、裝置、零件、狀態及原因。功能場所為劃分表示功能場所的單詞的類別,更具體而言,為關於用以藉由流水作業大量製造製品的步驟及工場的類別。設備為劃分表示設備的單詞的類別,更具體而言,為關於製造機械的類別。劃分為設備的類別的製造機械例如包含「厚板的軋壓機」般藉由製造的製品而指定的機械。裝置為劃分表示裝置的單詞的類別,更具體而言,尤其為關於作為電氣品的製品的類別。零件為劃分表示零件的單詞的類別,更具體而言,為關於製品的零件、即單體不具備製品功能的製品的構成要素的類別。狀態為特別劃分表示故障的狀態的單詞的類別。原因為特別劃分表示故障的原因的單詞的類別。本實施形態的資訊檢索系統中規定的多個類別不限定於所述六個。可不含所述六個類別的一部分,亦可包含與所述六個不同的類別。
如圖2所示,包含檢索的關鍵字的單詞是與類別對應地註冊於關鍵字辭典30中。例如「AA設備」是與相同含意詞及類似含意詞一起與設備的類別對應。例如「××裝置」是與相同含意詞及類似含意詞一起與裝置的類別對應。例如「CC故障」是與相同含意詞及類似含意詞一起與狀態的類別對應。例如「DD零件」是與相同含意詞及類似含意詞一起與零件的類別對應。例如「基板不良」是與相同含意詞及類似含意詞一起與原因的類別對應。例如「第一工場」是與相同含意詞一起與功能場所的類別對應。此處,記載於圖2的相同含意詞的最左側欄的單詞被稱為代表單詞。關於各類別,使多個代表單詞、以及該些的相同含意詞及類似含意詞對應。例如,關於原因的類別,不僅使基板不良對應,而且使控制、實績、波形及負荷等以及該些的相同含意詞及類似含意詞對應。此處,本實施形態中,關鍵字辭典30將代表單詞的相同含意詞及類似含意詞與類別的劃分歸總管理,但亦能夠分別管理。
圖4為例示檢索處理後顯示於例如顯示裝置24的檢索結果的圖。圖4的示例中,檢索執行部40針對「反相器的跳脫的原因是?」的詢問文章的輸入,進行資料庫12的檢索處理,獲取檢索到的多個資訊。以下,有時將檢索到的多個資訊稱為「檢測資訊」。如圖4所示,檢索者可藉由記載為類別的下拉項目表,自六個類別中選擇一個。圖4的示例中,檢索者選擇「原因」。檢索執行部40自關鍵字辭典30中獲取與由檢索者所選擇的類別即「原因」對應的單詞(代表單詞、相同含意詞及類似含意詞)。圖4的示例中,控制、實績、波形、基板不良、負荷、速度、破損、不明及指令與自關鍵字辭典30中獲取的代表單詞對應。
檢索執行部40基於所獲取的單詞(代表單詞、相同含意詞及類似含意詞)將檢測資訊排序。檢索執行部40根據所獲取的單詞存在的頻率、或與所獲取的單詞的關聯度將檢索資訊排序。所獲取的單詞存在的頻率為檢索資訊中,所述單詞於該些資訊中出現的次數。圖4的示例中,基板不良及其相同含意詞以及類似含意詞包含於檢索資訊中的13件資訊。另外,圖4的示例中,檢索執行部40利用與作為類別的「原因」對應的單詞,按頻率的順序將檢索資訊排序,並顯示給檢索者。檢索者例如可藉由點擊「基板不良」,從而顯示包含基板不良的故障事例等資訊的詳情。
與所獲取的單詞的關聯度為表示與除了檢索資訊以外的資料庫12的多個資訊相比,檢索資訊以何種程度與所述單詞更強地關聯的尺度。關聯度例如能夠藉由詞頻-逆向文件頻率(Term Frequency-inverse Document Frequency,tf-idf)等公知的方法計算。但是,關聯度的計算方法並無限定。檢索執行部40能夠根據與由檢索者所選擇的一個類別對應的單詞,按關聯度的順序將檢索資訊排序,並能夠顯示給檢索者。
本實施形態中,關鍵字辭典30與作為類別之一的原因對應地,註冊有表示故障的原因的單詞,所述故障的原因記載於資料庫12中儲存的多個資訊。另外,關鍵字辭典30與作為類別之一的狀態對應地,註冊有表示故障的狀態的單詞,所述故障的狀態記載於資料庫12中儲存的多個資訊。而且,檢索執行部40自關鍵字辭典30中獲取與由檢索者所選擇的原因或狀態對應的單詞,基於所獲取的單詞將檢索資訊排序,並顯示給檢索者。先前的檢索系統中,檢索資訊例如按檢索的命中數由多到少的順序顯示。因此,於欲獲知故障的原因或狀態的情形時,將記載有常見的原因、或常見的狀態的資訊顯示於上位。因此,於檢索者欲研究稀少的原因、或稀少的狀態的故障的情形時,以往的檢索系統中調查有時長期化。本實施形態的資訊檢索系統中,檢索者能夠按類別來選擇欲藉由檢索資訊調查的內容。因此,如圖4的示例般,不僅是頻率高的常見的原因(例如控制及實績),而且稀少的原因(例如波形、基板不良、負荷、速度、破損及指令)亦作為檢索結果而一覽可見。因此,可較先前的檢索系統更有效率地發現檢索者欲獲知的故障的原因或狀態。
本實施形態中,關鍵字辭典30與作為類別之一的零件對應地,註冊有表示零件的單詞,所述零件記載於資料庫12中儲存的多個資訊。另外,關鍵字辭典30與作為類別之一的裝置對應地,註冊有表示裝置的單詞,所述裝置記載於資料庫12中儲存的多個資訊。另外,關鍵字辭典30與作為類別之一的設備對應地,註冊有表示設備的單詞,所述設備記載於資料庫12中儲存的多個資訊。另外,關鍵字辭典30與作為類別之一的功能場所對應地,註冊有表示功能場所的單詞,所述功能場所記載於資料庫12中儲存的多個資訊。而且,檢索執行部40自關鍵字辭典30中獲取與由檢索者所選擇的零件、裝置、設備或功能場所對應的單詞,基於所獲取的單詞將檢索資訊排序,並顯示給檢索者。先前的檢索系統中,檢索資訊例如按檢索的命中數由多到少的順序顯示。因此,於欲調查零件的故障的情形時,若使用所述零件的製品的資訊的命中數多,則將製品的資訊顯示於上位。因此,於檢索者研究特定的對象的情形時,有時因埋沒於不同對象的資訊而導致調查長期化。本實施形態的資訊檢索系統中,檢索者能夠按類別來選擇欲藉由檢索資訊調查的對象。檢索者可使用類別的選擇,來指定調查的對象為零件、製品、設備或功能場所。因此,可較先前的檢索系統更有效率地發現檢索者欲獲知的對象的資訊。
檢索候補關鍵字變更要求受理部42自檢索者受理註冊於關鍵字辭典30的單詞的追加及刪除。檢索者例如能夠藉由追加新的類似含意詞,從而使檢索執行部40進一步執行無遺漏的檢索處理。
另外,檢索候補關鍵字變更要求受理部42受理與單詞對應的類別的追加、變更及刪除。檢索者例如能夠藉由將新的單詞一邊與類別對應一邊追加,從而使檢索執行部40進一步執行無遺漏的檢索處理及排序的處理。
圖5及圖6為用以說明資訊檢索系統的處理動作的流程圖。
首先,資訊檢索裝置10的詢問文章受理部26受理檢索者於檢索者側終端20經由輸入裝置22而輸入的詢問文章(步驟S101)。
繼而,自然語言處理部28對詢問文章受理部26所受理的詢問文章進行構詞分析等自然語言處理,提取單詞(獨立詞)(步驟S102)。
繼而,輸入檢索關鍵字提取部44自藉由自然語言處理所提取的單詞中提取(選擇)輸入檢索關鍵字(步驟S103)。
繼而,檢索候補關鍵字讀出部32參照關鍵字辭典30,讀出與輸入檢索關鍵字關聯的關鍵字作為檢索候補關鍵字(步驟S104)。
檢索關鍵字記憶部34記憶輸入檢索關鍵字及由檢索候補關鍵字讀出部32所讀出的檢索候補關鍵字(步驟S105)。
資訊檢索裝置10使檢索關鍵字記憶部34所記憶的檢索關鍵字顯示於顯示裝置24,視需要可使檢索者排除所顯示的多個檢索關鍵字中檢索者不想要的檢索關鍵字(步驟S106)。
資訊種類判斷部36參照資訊種類判斷用辭典38,基於由資訊種類判斷用關鍵字提取部46所提取的資訊種類判斷用關鍵字來判斷資訊種類(檢索意圖)(步驟S107)。
檢索執行部40針對資料庫12內的、儲存於與資訊種類判斷部36所判斷的資訊種類或由檢索者手動選擇的資訊種類對應的群的資訊,以所選擇的檢索關鍵字進行文本庫的檢索處理(步驟S108)。
檢索執行部40自關鍵字辭典30中獲取與由檢索者所選擇的類別對應的單詞(步驟S109)。
檢索執行部40基於所獲取的單詞將所檢索到的資訊排序(步驟S110)。
資訊檢索裝置10將執行了排序的檢索結果顯示於檢索者側的顯示裝置24(步驟S111)。
資訊檢索裝置10於由檢索者選擇了不同類別的情形時(步驟S112的是(Yes)),回到步驟S109的處理。資訊檢索裝置10於未由檢索者選擇不同類別的情形時(步驟S112的否(No)),結束處理。
此處,資訊檢索裝置10及檢索者側終端20可分別為圖7般的電腦。電腦中,記憶體(記憶裝置)、中央處理單元(Central Processing Unit,CPU)(處理裝置)、硬磁碟驅動機(Hard Disc Drive,HDD)、控制顯示裝置16或顯示裝置24的顯示的顯示控制部、及用以連接於網路18的通訊控制部等經由匯流排而連接。操作系統(Operation System,OS)及用以實施所述實施形態的處理的應用程式可儲存於HDD,並於藉由CPU執行時自HDD讀出至記憶體。視需要,CPU控制顯示控制部、通訊控制部等進行必要的動作。另外,關於處理中途的資料,儲存於記憶體,視需要儲存於HDD。所述各種功能是藉由使CPU、記憶體等硬體與OS及必要的應用程式有機地協作而實現。
如以上般,根據本實施形態的資訊檢索系統,藉由包括所述結構,從而可有效率地發現檢索者欲獲知的資訊。
以上,基於圖示例進行了說明,但本揭示不限定於所述實施形態,可於不偏離主旨的範圍內進行各種改良及變更。
[產業上的可利用性]
根據本揭示,可提供一種可有效率地發現檢索者欲獲知的資訊的資訊檢索系統。
10:資訊檢索裝置
12:資料庫
14、22:輸入裝置
16、24:顯示裝置
18:網路
20:檢索者側終端
26:詢問文章受理部
28:自然語言處理部
30:關鍵字辭典
32:檢索候補關鍵字讀出部
34:檢索關鍵字記憶部
36:資訊種類判斷部
38:資訊種類判斷用辭典
40:檢索執行部
42:檢索候補關鍵字變更要求受理部
44:輸入檢索關鍵字提取部
46:資訊種類判斷用關鍵字提取部
S101~S112:步驟
圖1為表示本揭示的一實施形態的資訊檢索系統的概略結構的方塊圖。
圖2為儲存於關鍵字辭典的關鍵字的一例的圖。
圖3為表示儲存於資訊種類判斷用辭典的資訊種類判斷用關鍵字的一例的圖。
圖4為例示所顯示的檢索結果的圖。
圖5為用以說明實施形態的資訊檢索系統的運作的流程圖。
圖6為繼圖5之後的流程圖。
圖7為電腦的功能塊圖。
10:資訊檢索裝置
12:資料庫
14、22:輸入裝置
16、24:顯示裝置
18:網路
20:檢索者側終端
26:詢問文章受理部
28:自然語言處理部
30:關鍵字辭典
32:檢索候補關鍵字讀出部
34:檢索關鍵字記憶部
36:資訊種類判斷部
38:資訊種類判斷用辭典
40:檢索執行部
42:檢索候補關鍵字變更要求受理部
44:輸入檢索關鍵字提取部
46:資訊種類判斷用關鍵字提取部
Claims (8)
- 一種資訊檢索系統,包括:資料庫,儲存能夠進行文本檢索的多個資訊;詢問文章受理部,受理自然語言形式的詢問文章;輸入檢索關鍵字提取部,自所述詢問文章中提取輸入檢索關鍵字;檢索執行部,使用所述輸入檢索關鍵字及與所述輸入檢索關鍵字關聯的檢索候補關鍵字對所述資料庫執行檢索處理;以及關鍵字辭典,註冊有與類別對應的單詞,所述關鍵字辭典界定出對應於所述類別的代表單詞、相同含意詞及類似含意詞的範圍,所述類別至少包括原因及狀態,其中,所述檢索執行部在排除了檢索者不需要的關鍵字後,使用所述輸入檢索關鍵字及所述檢索候補關鍵字進行所述搜索處理,並自所述關鍵字辭典中獲取與由所述檢索者所選擇的一個所述類別對應的單詞,基於獲取的單詞將所述檢索處理中檢索到的資訊排序,並顯示給所述檢索者。
- 如請求項1所述的資訊檢索系統,其中所述檢索執行部根據所述獲取的單詞存在的頻率、或與所述獲取的單詞的關聯度將所述檢索到的資訊排序。
- 如請求項1或請求項2所述的資訊檢索系統,其中所述關鍵字辭典與作為所述類別之一的所述原因對應地註冊有表示故障的原因的單詞,所述故障的原因記載於所述多個資訊中。
- 如請求項1或請求項2所述的資訊檢索系統,其中所述關鍵字辭典與作為所述類別之一的所述狀態對應地註冊有表示故障的狀態的單詞,所述故障的狀態記載於所述多個資訊中。
- 如請求項1或請求項2所述的資訊檢索系統,其中所述關鍵字辭典與作為所述類別之一的零件對應地註冊有表示零件的單詞,所述零件記載於所述多個資訊中。
- 如請求項1或請求項2所述的資訊檢索系統,其中所述關鍵字辭典與作為所述類別之一的裝置對應地註冊有表示裝置的單詞,所述裝置記載於所述多個資訊中。
- 如請求項1或請求項2所述的資訊檢索系統,其中所述關鍵字辭典與作為所述類別之一的設備對應地註冊有表示設備的單詞,所述設備記載於所述多個資訊中。
- 如請求項1或請求項2所述的資訊檢索系統,其中所述關鍵字辭典與作為所述類別之一的功能場所對應地註冊有表示功能場所的單詞,所述功能場所記載於所述多個資訊中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020093682A JP7264115B2 (ja) | 2020-05-28 | 2020-05-28 | 情報検索システム |
JP2020-093682 | 2020-05-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202145027A TW202145027A (zh) | 2021-12-01 |
TWI823091B true TWI823091B (zh) | 2023-11-21 |
Family
ID=78723365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110119151A TWI823091B (zh) | 2020-05-28 | 2021-05-27 | 資訊檢索系統 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230222146A1 (zh) |
EP (1) | EP4141698A4 (zh) |
JP (1) | JP7264115B2 (zh) |
KR (1) | KR20230003184A (zh) |
CN (1) | CN115668176A (zh) |
BR (1) | BR112022023806A2 (zh) |
MX (1) | MX2022014972A (zh) |
TW (1) | TWI823091B (zh) |
WO (1) | WO2021241601A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102649918B1 (ko) * | 2023-06-05 | 2024-03-20 | (주)복지이십사 | 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200521732A (en) * | 2003-12-31 | 2005-07-01 | Lin gui mei | Information system with natural language parsing ability and processing method thereof |
JP2005182280A (ja) * | 2003-12-17 | 2005-07-07 | Ibm Japan Ltd | 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム |
TW201428517A (zh) * | 2012-12-31 | 2014-07-16 | Via Tech Inc | 檢索方法、檢索系統以及自然語言理解系統 |
TW201619850A (zh) * | 2014-11-21 | 2016-06-01 | 財團法人工業技術研究院 | 問句處理系統及其方法 |
TW201935229A (zh) * | 2018-02-13 | 2019-09-01 | 鼎新電腦股份有限公司 | 操作虛擬助理的方法及系統 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002342376A (ja) * | 2001-05-18 | 2002-11-29 | Nikon Corp | サイト検索方法 |
JP2004118476A (ja) * | 2002-09-26 | 2004-04-15 | Sharp Corp | 電子辞書装置、電子辞書の検索結果表示方法、プログラムおよび記録媒体 |
JP2009087009A (ja) * | 2007-09-28 | 2009-04-23 | Kobe Steel Ltd | 文検索装置,文検索プログラム,文検索方法 |
JP4724701B2 (ja) * | 2007-10-30 | 2011-07-13 | 日本電信電話株式会社 | 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体 |
US8631019B1 (en) * | 2011-09-09 | 2014-01-14 | Google Inc. | Restricted-locality synonyms |
JP5885689B2 (ja) * | 2012-03-06 | 2016-03-15 | 株式会社オウケイウェイヴ | Q&aシステム |
JP6897140B2 (ja) * | 2017-02-14 | 2021-06-30 | 富士フイルムビジネスイノベーション株式会社 | 設計支援システムおよびプログラム |
JP6947155B2 (ja) | 2018-01-05 | 2021-10-13 | Jfeスチール株式会社 | 情報検索システム |
JP7251168B2 (ja) * | 2019-01-28 | 2023-04-04 | 富士フイルムビジネスイノベーション株式会社 | 設計支援システムおよびプログラム |
-
2020
- 2020-05-28 JP JP2020093682A patent/JP7264115B2/ja active Active
-
2021
- 2021-05-25 MX MX2022014972A patent/MX2022014972A/es unknown
- 2021-05-25 US US17/999,853 patent/US20230222146A1/en active Pending
- 2021-05-25 CN CN202180036733.9A patent/CN115668176A/zh active Pending
- 2021-05-25 EP EP21812955.9A patent/EP4141698A4/en active Pending
- 2021-05-25 WO PCT/JP2021/019883 patent/WO2021241601A1/ja active Application Filing
- 2021-05-25 KR KR1020227041838A patent/KR20230003184A/ko unknown
- 2021-05-25 BR BR112022023806A patent/BR112022023806A2/pt unknown
- 2021-05-27 TW TW110119151A patent/TWI823091B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182280A (ja) * | 2003-12-17 | 2005-07-07 | Ibm Japan Ltd | 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム |
TW200521732A (en) * | 2003-12-31 | 2005-07-01 | Lin gui mei | Information system with natural language parsing ability and processing method thereof |
TW201428517A (zh) * | 2012-12-31 | 2014-07-16 | Via Tech Inc | 檢索方法、檢索系統以及自然語言理解系統 |
TW201619850A (zh) * | 2014-11-21 | 2016-06-01 | 財團法人工業技術研究院 | 問句處理系統及其方法 |
TW201935229A (zh) * | 2018-02-13 | 2019-09-01 | 鼎新電腦股份有限公司 | 操作虛擬助理的方法及系統 |
Non-Patent Citations (1)
Title |
---|
網路文獻 ETO Ayaka "Development of Control Maintenance Support System" JFE技報 2020年2月 https://www.jfe-steel.co.jp/research/giho/045/pdf/045-11.pdf * |
Also Published As
Publication number | Publication date |
---|---|
TW202145027A (zh) | 2021-12-01 |
US20230222146A1 (en) | 2023-07-13 |
JP2021189694A (ja) | 2021-12-13 |
WO2021241601A1 (ja) | 2021-12-02 |
EP4141698A1 (en) | 2023-03-01 |
CN115668176A (zh) | 2023-01-31 |
BR112022023806A2 (pt) | 2022-12-20 |
EP4141698A4 (en) | 2023-09-20 |
MX2022014972A (es) | 2023-01-11 |
JP7264115B2 (ja) | 2023-04-25 |
KR20230003184A (ko) | 2023-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6947155B2 (ja) | 情報検索システム | |
US10915543B2 (en) | Systems and methods for enterprise data search and analysis | |
JP4896132B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
JP4832952B2 (ja) | データベース解析システム及びデータベース解析方法及びプログラム | |
US20120239657A1 (en) | Category classification processing device and method | |
TWI823091B (zh) | 資訊檢索系統 | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP6120607B2 (ja) | 要件検出装置及び要件検出プログラム | |
CN109213830B (zh) | 专业性技术文档的文档检索系统 | |
JP6684777B2 (ja) | 製造物良・不良判定システムおよび製造物良・不良判定方法 | |
TWI769835B (zh) | 資訊檢索系統 | |
TWI769834B (zh) | 資訊檢索系統 | |
Roy et al. | I-REX: a lucene plugin for explainable IR | |
JP2017076286A (ja) | 検査装置、検査プログラムおよび検査方法 | |
JPWO2009008129A1 (ja) | 開発書類データ管理装置、開発書類データ管理システム、開発書類データ管理方法及び、そのプログラム並びに記憶媒体 | |
JPH04237371A (ja) | チェック項目データベース検索システム | |
JPH08335222A (ja) | 類似文章及び文書検索機能付コンピュータ装置 | |
WO2021005936A1 (ja) | 文書情報提示装置及びプログラム | |
Robson et al. | Automatic aids to profile construction | |
JP2023057658A (ja) | 情報処理装置、情報を提供するためにコンピューターによって実行される方法、および、プログラム | |
Liao | A Study on the Application of Text Classification Algorithms in University Archive Management | |
JP2024030830A (ja) | 情報検索装置および情報検索方法 | |
JP2022117298A (ja) | 設計書管理プログラム、設計書管理方法および情報処理装置 | |
CN109597885A (zh) | 一种知识地图构建方法及存储介质 | |
JP2020106879A (ja) | 検査対応業務支援システム |