JP7264115B2 - 情報検索システム - Google Patents

情報検索システム Download PDF

Info

Publication number
JP7264115B2
JP7264115B2 JP2020093682A JP2020093682A JP7264115B2 JP 7264115 B2 JP7264115 B2 JP 7264115B2 JP 2020093682 A JP2020093682 A JP 2020093682A JP 2020093682 A JP2020093682 A JP 2020093682A JP 7264115 B2 JP7264115 B2 JP 7264115B2
Authority
JP
Japan
Prior art keywords
information
search
keyword
categories
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020093682A
Other languages
English (en)
Other versions
JP2021189694A (ja
Inventor
祐輔 竹村
彩香 衛藤
伸幸 諸岡
晃 假谷
智 桑原
大輝 重岡
秀同 竹中
大悟 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Steel Corp
Original Assignee
JFE Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2020093682A priority Critical patent/JP7264115B2/ja
Application filed by JFE Steel Corp filed Critical JFE Steel Corp
Priority to CN202180036733.9A priority patent/CN115668176A/zh
Priority to US17/999,853 priority patent/US20230222146A1/en
Priority to BR112022023806A priority patent/BR112022023806A2/pt
Priority to MX2022014972A priority patent/MX2022014972A/es
Priority to PCT/JP2021/019883 priority patent/WO2021241601A1/ja
Priority to KR1020227041838A priority patent/KR20230003184A/ko
Priority to EP21812955.9A priority patent/EP4141698A4/en
Priority to TW110119151A priority patent/TWI823091B/zh
Publication of JP2021189694A publication Critical patent/JP2021189694A/ja
Application granted granted Critical
Publication of JP7264115B2 publication Critical patent/JP7264115B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Liquid Crystal Substances (AREA)

Description

本開示は、情報検索システムに関する。
従来、製造業等での保全業務における資料は、紙面に記載されたデータ(紙データ)であった。保全業務における情報検索システムでは、これらの紙データを電子化し、まとめて蓄積してデータベース化することが重要である。検索技術の進歩によって、検索結果の精度が向上し、紙データの電子化とデータベース化が進められている。
例えば製造業では、装置等の故障、不具合、原因および対処法等を、都度データベース化し、同様の故障、不具合が発生した場合には過去の事例として参考にすることで、不具合回避、復旧までの時間短縮を図っている。また、データベースには、作業標準、マニュアル等の情報も格納されている。このため、データベースに格納された情報は膨大なものとなる。
このような膨大なデータの中から必要とする情報を入手する手法として、従来、与えられた文字列をキーワードとして、それに一致するものを検索結果として出力するテキスト検索処理がある。例えば特許文献1は、知識、経験が浅く、適正なキーワード入力が困難な者でも、良好な検索結果を得ることが可能な情報検索システムを開示する。
特開2019-121392号公報
ここで、従来技術において、検索結果は情報検索システムで定められた順序で表示される。例えば、装置の故障に対して可能性のある原因を探す場合に、代表的な原因に関するデータだけが検索結果の上位に表示されて、代表的でない原因に関するデータを見つけるのが困難な場合があった。そのため、故障への対応が長期化することがあった。
本開示は、かかる課題に鑑みてなされたものであり、検索者が知りたい情報を効率的に発見できる情報検索システムを提供することを目的とする。
本開示の情報検索システムは、
テキスト検索可能な複数の情報を格納するデータベースと、
自然言語形式の質問文章を受け付ける質問文章受付部と、
前記質問文章から入力検索キーワードを抽出する入力検索キーワード抽出部と、
前記入力検索キーワードおよび前記入力検索キーワードに関連するキーワードを用いて前記データベースに対して検索処理を実行する検索実行部と、
カテゴリと対応付けられた単語が登録されたキーワード辞書と、を備え、
前記検索実行部は、検索者によって選択された1つの前記カテゴリに対応付けられた単語を前記キーワード辞書から取得し、取得した単語に基づいて前記検索処理で検索した情報を並び替えて、前記検索者に表示させる。
本開示によれば、検索者が知りたい情報を効率的に発見できる情報検索システムを提供することができる。
図1は、本開示の一実施形態に係る情報検索システムの概略構成を示すブロック図である。 図2は、キーワード辞書に格納されたキーワードの一例を示す図である。 図3は、情報種類判断用辞書に格納された情報種類判断用キーワードの一例を示す図である。 図4は、表示される検索結果を例示する図である。 図5は、実施形態の情報検索システムの動作を説明するためのフローチャートである。 図6は、図5の続きのフローチャートである。 図7は、コンピュータの機能ブロック図である。
本実施形態では、製造業における設備保全作業情報をテキスト検索可能な情報としてデータベース化しておき、故障、不具合が発生した場合に、検索者がその状況を文章として入力することによって、データベースから参考になる過去の事例の情報を検索することができる情報検索システムを一例として説明する。検索者は、検索された情報に基づいて復旧作業を行うことができる。ここで、設備保全作業情報は、例えば装置等の故障、不具合、原因、および対処法等が記載された作業標準およびマニュアル等の情報を含む。また、以下において、故障または不具合に関する事例を「故障事例」と称することがある。
本開示の情報検索システムの検索用途は上記に限定されない。本開示の情報検索システムは、設備故障復旧作業等の設備保全作業の支援以外にも用いることができる。本開示の情報検索システムは、例えば営業分野において、顧客からの問合せ内容に対して過去の事例を検索し、最適な回答を提示することに適用できる。本開示の情報検索システムは、例えば商品設計分野において、顧客からの引合いに対して類似の製造実績、技術論文等の文献を検索し、最適な製品設計を提案することに適用できる。
図1は、本開示の一実施形態に係る情報検索システムの概略構成を示すブロック図である。情報検索システムは、検索処理を実行する情報検索装置10と、テキスト検索可能な複数の情報を格納するデータベース12と、情報検索装置10に接続されたキーボード、マウス等の入力装置14と、情報検索装置10に接続されたディスプレイ等の表示装置16と、ネットワーク18を介して情報検索装置10と接続される検索者側端末20とを備えて構成される。
ネットワーク18は、LAN(Local Area Network)等の通信網である。しかしこれに限定されず、ネットワーク18は、インターネット等の公衆通信網の他、WAN(Wide Area Network)またはVPN(Virtual Private Network)のような一般公衆回線を一部に介在させた通信網であってよい。情報検索装置10および検索者側端末20は、それぞれコンピュータとプログラムとによって実現される。検索者側端末20の例は、パーソナルコンピュータ(PC)、タブレット型コンピュータ等であり、入力装置22および表示装置24が接続または一体化されている。
ここで、図1の情報検索システムの構成は一例であり、構成要素の一部を含まなくてよい。また、情報検索システムは別の構成要素を備えてよい。例えば、情報検索システムは、入力装置14および表示装置16を備えずに、検索者側端末20を用いて情報の入出力が行われる構成であってよい。
データベース12内には、文書、図面、写真等が格納される。文章は、初めからテキスト入力されたもののみならず、音声認識エンジンを用いて、音声をテキスト化したものでよく、OCR(Optical Character Reader)を用いて紙媒体中の文章をテキスト化したものでよい。図面、写真を格納する場合には図面中に埋め込まれた文字あるいはファイル名に対して検索処理を行うことができる。データベース12に格納される情報には、装置等の故障、不具合とその原因、さらにはその対処法等の作業標準、マニュアル等の情報が含まれる。本実施形態において、データベース12は複数の故障事例を含む。
情報検索装置10は、質問文章受付部26と、自然言語処理部28と、キーワード辞書30と、検索候補キーワード読出部32と、検索キーワード記憶部34と、情報種類判断部36と、情報種類判断用辞書38と、検索実行部40と、検索候補キーワード変更要望受付部42とを備えて構成される。自然言語処理部28は、入力検索キーワード抽出部44および情報種類判断用キーワード抽出部46を含む。ここで、図1の情報検索装置10の構成は一例であり、構成要素の一部を含まなくてよい。また、情報検索装置10は別の構成要素を備えてよい。例えば、情報検索装置10は、キーワード辞書30および情報種類判断用辞書38を備えずに、情報検索装置10の外部に設けられたこれらの辞書に、ネットワーク18を経由してアクセスする構成であってよい。
これらの各機能ブロックは概略次のような機能を有する。質問文章受付部26は、検索者によって検索者側端末20の入力装置22を介して入力された自然言語形式の質問文章を、ネットワーク18を経由して逐次受け付ける。検索者側端末20には、例えば、「○○設備で××装置の故障が発生、過去に類似例があるか」、「故障の種類が△△故障である」、「□□部品の交換手順は」、「インバータのトリップの理由は」といった自然言語形式の質問文章が逐次入力され得る。
自然言語処理部28は、質問文章受付部26で受け付けた質問文章に対して既知の形態素解析等の自然言語処理を行い、単語を抽出する。自然言語処理部28の入力検索キーワード抽出部44は、入力された質問文章から検索で使用する入力検索キーワードを抽出する。この抽出のため、入力検索キーワード抽出部44は、例えば後に詳細に説明するキーワード辞書30を参照し、キーワード辞書30に登録された単語を入力検索キーワードとして抽出することができる。入力検索キーワード抽出部44は、例えば「○○設備で××装置の故障が発生。過去に類似例があるか」という質問文章が入力された場合に、「○○設備」および「××装置」という単語を入力検索キーワードとして抽出する。入力検索キーワード抽出部44は、例えば「故障の種類は△△故障である」という質問文章が入力された場合に、「△△故障」という単語を入力検索キーワードとして抽出する。入力検索キーワード抽出部44は、例えば「□□部品の交換手順は」という質問文章が入力された場合に、「□□部品」という単語を入力検索キーワードとして抽出する。入力検索キーワード抽出部44は、例えば「インバータのトリップの理由は」という質問文章が入力された場合に、「インバータ」および「トリップ」という単語を入力検索キーワードとして抽出する。
自然言語処理部28の情報種類判断用キーワード抽出部46は、入力された質問文章の中から検索意図である情報種類を判断するのに使用される情報種類判断用キーワードを抽出する。この抽出のため、情報種類判断用キーワード抽出部46は、後に詳細に説明する情報種類判断用辞書38を参照し、情報種類判断用辞書38に登録された単語を情報種類判断用キーワードとして抽出することができる。情報種類判断用キーワード抽出部46は、例えば「○○設備で××装置の故障が発生。過去に類似例があるか」という質問文章が入力された場合に、「故障」および「類似例」という単語を情報種類判断用キーワードとして抽出する。情報種類判断用キーワード抽出部46は、例えば「故障の種類は△△故障である」という質問文章が入力された場合に、「故障の種類」という単語を情報種類判断用キーワードとして抽出する。情報種類判断用キーワード抽出部46は、例えば「□□部品の交換手順は」という質問文章が入力された場合に、「交換手順」という単語を情報種類判断用キーワードとして抽出する。情報種類判断用キーワード抽出部46は、例えば「インバータのトリップの理由は」という質問文章が入力された場合に、「理由」という単語を入力検索キーワードとして抽出する。
キーワード辞書30には、関連するキーワード同士が互いに対応付けされて予め登録され、格納されている。この実施形態では、キーワード辞書30には、互いに同義のキーワード同士が互いに対応付けされて登録されている。また、キーワード辞書30には、互いに類義のキーワード同士が互いに対応付けされて登録されている。しかし、キーワード辞書30には、互いに同義のキーワードだけを登録してよいし、互いに類義のキーワードだけを登録してよい。これに代えてまたは加えて、互いに関連性が高いと思われるキーワード同士を互いに対応付けして予め登録することもできる。
図2は、キーワード辞書30に予め登録されたキーワードの一例を示す。同じ行に属するキーワード同士が互いに関連するキーワードであり、互いに対応付けされている。ここで、登録されたキーワード(単語)は、カテゴリとも対応づけられている。カテゴリの詳細については後述する。
検索候補キーワード読出部32は、入力検索キーワード抽出部44が入力検索キーワードを抽出する度にキーワード辞書30を参照し、入力検索キーワードに関連するキーワードを検索候補キーワードとして読み出す。検索候補キーワード読出部32は、例えば入力検索キーワードが「○○設備」の場合に、キーワード辞書30から、同義語として「AA設備」、「A´A´設備」、「A"A"」を読み出し、類義語として「aaa」、「a´a´a´」を読み出す。つまり、検索候補キーワード読出部32は、検索候補キーワードとして、「AA設備」、「A´A´設備」、「A"A"」、「aaa」および「a´a´a´」を読み出す。ここで、検索候補キーワード読出部32は、キーワード辞書30から同義語および類義語の全てでなく、一部を読み出して、検索候補キーワードとしてよい。一例として、検索候補キーワード読出部32は、同義語だけを読み出してよい。
検索キーワード記憶部34は、上記のように得られる入力検索キーワードと、検索候補キーワードとを、検索キーワードとして記憶する。検索キーワード記憶部34は、例えば質問文章が追加的に入力された場合に、追加の入力検索キーワードと、追加の検索候補キーワードとを、検索キーワードとして累積的に記憶してよい。
情報種類判断部36は、質問文章から抽出された情報種類判断用キーワードに基づき、検索意図を判断する。情報種類判断部36は、情報種類判断用辞書38を参照し、情報種類判断用キーワードに基づき検索すべき情報種類を判断する。図3は、情報種類判断用辞書38に格納された情報種類判断用キーワードの一例を示す。情報種類判断用辞書38には、質問文章から抽出され得る情報種類判断用キーワードと、情報種類判断用キーワードに対応する情報種類とが対応付けられて登録されている。例えば「故障」および「類似例」という情報種類判断用キーワードに対して、情報種類として「故障事例」が対応付けられて登録されている。また、例えば「故障の種類」および「交換手順」という情報種類判断用キーワードに対して、情報種類として「マニュアル」が対応付けられて登録されている。また、データベース12に格納される情報は、情報種類毎に複数のグループに区分されて管理されている。例えば、データベース12において、「故障事例」は1つのフォルダの下にあるように格納され、「マニュアル」は別のフォルダの下にあるように格納されてよい。
検索実行部40は、データベース12に格納された情報に対して、検索キーワード記憶部34に記憶された検索キーワードを用いたテキストベースの検索処理を行う。つまり、検索実行部40は、入力検索キーワードおよび入力検索キーワードに関連するキーワードを用いて、データベース12に対して検索処理を実行する。検索実行部40は、データベース12の複数のグループのうち、少なくとも情報種類判断部36によって判断された情報種類に対応するグループに属する情報に対して検索処理を行う。
検索実行部40は、検索者によって選択された1つのカテゴリに対応付けられた単語をキーワード辞書30から取得する。検索実行部40は、取得した単語に基づいて検索処理で検索した情報を並び替えて、検索者に表示させる。つまり、検索実行部40は、検索者が指定したカテゴリに応じて検索した情報を並び替えて、例えば表示装置24に検索結果を表示させる。
本実施形態において、検索者は6つのカテゴリのうちの1つを選択して、検索結果を選択したカテゴリに応じて並び替えさせて、知りたい情報を効率的に発見できる。6つのカテゴリは、機能場所、設備、装置、部品、状態および原因である。機能場所は、機能場所を示す単語が区分されるカテゴリであって、より具体的に言うと、製品を流れ作業で大量に製造するための工程および工場についてのカテゴリである。設備は、設備を示す単語が区分されるカテゴリであって、より具体的に言うと、製造機械についてのカテゴリである。設備のカテゴリに区分される製造機械は、例えば「厚板の圧延機」のように製造される製品によって特定されるものを含む。装置は、装置を示す単語が区分されるカテゴリであって、より具体的に言うと、特に電気品である製品についてのカテゴリである。部品は、部品を示す単語が区分されるカテゴリであって、より具体的に言うと、製品の部品、すなわち、単体では製品の機能を備えない製品の構成要素についてのカテゴリである。状態は、特に故障の状態を示す単語が区分されるカテゴリである。原因は、特に故障の原因を示す単語が区分されるカテゴリである。本実施形態に係る情報検索システムで定められる複数のカテゴリは上記の6つに限定されない。上記の6つのカテゴリの一部が含まれなくてよいし、上記の6つと異なるカテゴリが含まれていてよい。
図2に示すように、検索におけるキーワードを含む単語は、キーワード辞書30においてカテゴリと対応づけられて登録される。例えば「AA設備」は、同義語および類義語とともに、設備のカテゴリに対応付けられる。例えば「××装置」は、同義語および類義語とともに、装置のカテゴリに対応付けられる。例えば「CC故障」は、同義語および類義語とともに、状態のカテゴリに対応付けられる。例えば「DD部品」は、同義語および類義語とともに、部品のカテゴリに対応付けられる。例えば「基板不良」は、同義語および類義語とともに、原因のカテゴリに対応付けられる。例えば「第1工場」は、同義語とともに、機能場所のカテゴリに対応付けられる。ここで、図2の同義語の最も左側の欄に記載される単語は代表単語と称される。各カテゴリには複数の代表単語、ならびに、これらの同義語および類義語が対応づけられる。例えば、原因のカテゴリには、基板不良だけでなく、制御、実績、波形および負荷等、ならびに、これらの同義語および類義語が対応づけられる。ここで、本実施形態において、キーワード辞書30は代表単語の同義語および類義語と、カテゴリの区分とをまとめて管理するが、別々に管理することも可能である。
図4は、検索処理の後で例えば表示装置24に表示される検索結果を例示する図である。図4の例において、検索実行部40は「インバータのトリップの理由は」という質問文章の入力に対して、データベース12の検索処理を行って、検索された複数の情報を取得する。以下において、検索された複数の情報を「検出情報」と称することがある。図4に示すように、検索者は、カテゴリと記載されたプルダウンメニューによって、6つのカテゴリから1つを選択することができる。図4の例において、検索者は「原因」を選択している。検索実行部40は、検索者によって選択されたカテゴリである「原因」に対応付けられた単語(代表単語、同義語および類義語)をキーワード辞書30から取得する。図4の例では、制御、実績、波形、基板不良、負荷、速度、破損、不明および指令が、キーワード辞書30から取得された代表単語に対応する。
検索実行部40は、取得した単語(代表単語、同義語および類義語)に基づいて検出情報を並び替える。検索実行部40は、検索情報を、取得した単語が存在する頻度、または、取得した単語との相関度に応じて並び替える。取得した単語が存在する頻度は、検索情報のうち、それらの情報の中に、その単語が出現する数である。図4の例において、基板不良ならびにその同義語および類義語は、検索情報のうち13の情報に含まれる。また、図4の例において、検索実行部40は、カテゴリである「原因」に対応付けられた単語で、頻度の順に検索情報を並び替えて、検索者に表示させている。検索者は、例えば「基板不良」をクリックすることによって、基板不良を含む故障事例等の情報の詳細を表示させることができる。
取得した単語との相関度は、検索情報を除くデータベース12の複数の情報に比べて、検索情報が、その単語にどれだけ強く関連しているのかを示す尺度である。相関度は、例えばtf-idf等の公知の手法によって計算可能である。ただし、相関度の計算の手法は限定されない。検索実行部40は、検索者によって選択された1つのカテゴリに対応付けられた単語で、相関度の順に検索情報を並び替えて、検索者に表示可能であってよい。
本実施形態において、キーワード辞書30は、カテゴリの1つである原因に対応付けて、データベース12に格納された複数の情報に記載された故障の原因を示す単語が登録されている。また、キーワード辞書30は、カテゴリの1つである状態に対応付けて、データベース12に格納された複数の情報に記載された故障の状態を示す単語が登録されている。そして、検索実行部40は、検索者によって選択された原因または状態に対応付けられた単語をキーワード辞書30から取得し、取得した単語に基づいて検索情報を並び替えて、検索者に表示させる。従来の検索システムにおいて、検索情報は、例えば検索されるヒット数の多い順に表示される。そのため、故障の原因または状態について知りたい場合に、よくある原因、または、よくある状態が記載された情報が上位に表示される。そのため、検索者が、まれな原因、または、まれな状態の故障について調べる場合に、従来の検索システムでは調査が長期化することがあった。本実施形態に係る情報検索システムにおいて、検索者は検索情報によって調査したい内容をカテゴリで選択可能である。したがって、図4の例のように、頻度の高いよくある原因(例えば、制御および実績)だけでなく、まれな原因(例えば、波形、基板不良、負荷、速度、破損および指令)について、検索結果として一覧にして見ることができる。そのため、検索者が知りたい故障の原因または状態を、従来の検索システムよりも効率的に発見できる。
本実施形態において、キーワード辞書30は、カテゴリの1つである部品に対応付けて、データベース12に格納された複数の情報に記載された部品を示す単語が登録されている。また、キーワード辞書30は、カテゴリの1つである装置に対応付けて、データベース12に格納された複数の情報に記載された装置を示す単語が登録されている。また、キーワード辞書30は、カテゴリの1つである設備に対応付けて、データベース12に格納された複数の情報に記載された設備を示す単語が登録されている。また、キーワード辞書30は、カテゴリの1つである機能場所に対応付けて、データベース12に格納された複数の情報に記載された機能場所を示す単語が登録されている。そして、検索実行部40は、検索者によって選択された部品、装置、設備または機能場所に対応付けられた単語をキーワード辞書30から取得し、取得した単語に基づいて検索情報を並び替えて、検索者に表示させる。従来の検索システムにおいて、検索情報は、例えば検索されるヒット数の多い順に表示される。そのため、部品の故障について調査したい場合に、その部品を用いる製品の情報のヒット数が多いと、製品の情報が上位に表示される。そのため、検索者が、特定の対象について調べる場合に、異なる対象の情報に埋もれることによって調査が長期化することがあった。本実施形態に係る情報検索システムにおいて、検索者は検索情報によって調査したい対象をカテゴリで選択可能である。検索者は、カテゴリの選択を用いて、調査の対象が部品、製品、設備または機能場所であることを指定できる。そのため、検索者が知りたい対象の情報を、従来の検索システムよりも効率的に発見できる。
検索候補キーワード変更要望受付部42は、検索者からキーワード辞書30に登録される単語の追加および削除を受け付ける。検索者は、例えば新たな類義語を追加することによって、検索実行部40にさらに漏れのない検索処理を実行させることが可能になる。
また、検索候補キーワード変更要望受付部42は、単語に対応付けられるカテゴリの追加、変更および削除を受け付ける。検索者は、例えば新たな単語をカテゴリに対応付けながら追加することによって、検索実行部40にさらに漏れのない検索処理および並べ替えの処理を実行させることが可能になる。
図5および図6は、情報検索システムの処理動作を説明するためのフローチャートである。
まず、情報検索装置10の質問文章受付部26が、検索者が検索者側端末20で入力装置22を介して入力した質問文章を受け付ける(ステップS101)。
つづいて、自然言語処理部28が、質問文章受付部26で受け付けた質問文章に対して形態素解析等の自然言語処理を行い、単語(自立語)を抽出する(ステップS102)。
つづいて、入力検索キーワード抽出部44が自然言語処理により抽出された単語から入力検索キーワードを抽出(選択)する(ステップS103)。
ついで、検索候補キーワード読出部32が、キーワード辞書30を参照し、入力検索キーワードに関連するキーワードを検索候補キーワードとして読み出す(ステップS104)。
検索キーワード記憶部34は、入力検索キーワードおよび、検索候補キーワード読出部32で読み出された検索候補キーワードを記憶する(ステップS105)。
情報検索装置10は、検索キーワード記憶部34が記憶した検索キーワードを、表示装置24に表示させ、必要に応じて、表示された複数の検索キーワードのうち、検索者が所望しない検索キーワードを検索者に除外させることができる(ステップS106)。
情報種類判断部36は、情報種類判断用辞書38を参照し、情報種類判断用キーワード抽出部46で抽出された情報種類判断用キーワードに基づき情報種類(検索意図)を判断する(ステップS107)。
検索実行部40は、データベース12内の、情報種類判断部36が判断した情報種類あるいは検索者によって手動で選択された情報種類に対応するグループに格納された情報に対して、選択された検索キーワードとのテキストベースの検索処理を行う(ステップS108)。
検索実行部40は、検索者によって選択されたカテゴリに対応付けられた単語をキーワード辞書30から取得する(ステップS109)。
検索実行部40は、取得した単語に基づいて検索した情報を並び替える(ステップS110)。
情報検索装置10は、並び替えを実行した検索結果を検索者側の表示装置24に表示する(ステップS111)。
情報検索装置10は、検索者によって異なるカテゴリが選択された場合に(ステップS112のYes)、ステップS109の処理に戻る。情報検索装置10は、検索者によって異なるカテゴリが選択されない場合に(ステップS112のNo)処理を終了する。
ここで、情報検索装置10および検索者側端末20は、それぞれ図7のようなコンピュータであって、メモリ(記憶装置)、CPU(処理装置)、ハードディスクドライブ(HDD)、表示装置16または表示装置24の表示を制御する表示制御部、ネットワーク18に接続するための通信制御部等がバスを介して接続されている。オペレーティングシステム(OS)および上記実施形態における処理を実施するためのアプリケーションプログラムは、HDDに格納することができ、CPUにより実行される際にはHDDからメモリに読み出される。必要に応じてCPUは、表示制御部、通信制御部等を制御して必要な動作を行わせる。また、処理途中のデータについては、メモリに格納され、必要があればHDDに格納される。上記の各種機能は、CPU、メモリ等のハードウエアとOSおよび必要なアプリケーションプログラムとを有機的に協働させることにより実現される。
以上のように、この実施形態の情報検索システムによれば、上記の構成を備えることによって、検索者が知りたい情報を効率的に発見できる。
以上、図示例に基づいて説明したが、本開示は上記の実施形態に限定されず、要旨を逸脱しない範囲において各種の改良および変更を行うことができる。
本開示よれば、検索者が知りたい情報を効率的に発見できる情報検索システムを提供することができる。
10 情報検索装置
12 データベース
14 入力装置
16 表示装置
18 ネットワーク
20 検索者側端末
22 入力装置
24 表示装置
26 質問文章受付部
28 自然言語処理部
30 キーワード辞書
32 検索候補キーワード読出部
34 検索キーワード記憶部
36 情報種類判断部
38 情報種類判断用辞書
40 検索実行部
42 検索候補キーワード変更要望受付部
44 入力検索キーワード抽出部
46 情報種類判断用キーワード抽出部

Claims (8)

  1. テキスト検索可能な複数の情報を格納するデータベースと、
    自然言語形式の質問文章を受け付ける質問文章受付部と、
    前記質問文章から入力検索キーワードを抽出する入力検索キーワード抽出部と、
    前記入力検索キーワードおよび前記入力検索キーワードに関連するキーワードを用いて前記データベースに対して検索処理を実行する検索実行部と、
    カテゴリと対応付けられた単語が登録され、前記カテゴリに対応づけられて代表単語と同義語及び類義語の範囲が定められたキーワード辞書と、を備え、
    前記検索実行部は、検索者によって選択された1つの前記カテゴリに対応付けられた単語を前記キーワード辞書から取得し、取得した単語に基づいて前記検索処理で検索した情報を並び替えて、前記検索者に表示させる、情報検索システム。
  2. 前記検索実行部は、前記検索した情報を、前記取得した単語が存在する頻度、または、前記取得した単語との相関度に応じて並び替える、請求項1に記載の情報検索システム。
  3. 前記キーワード辞書は、前記カテゴリの1つである原因に対応付けて、前記複数の情報に記載された故障の原因を示す単語が登録される、請求項1または2に記載の情報検索システム。
  4. 前記キーワード辞書は、前記カテゴリの1つである状態に対応付けて、前記複数の情報に記載された故障の状態を示す単語が登録される、請求項1から3のいずれか一項に記載の情報検索システム。
  5. 前記キーワード辞書は、前記カテゴリの1つである部品に対応付けて、前記複数の情報に記載された部品を示す単語が登録される、請求項1から4のいずれか一項に記載の情報検索システム。
  6. 前記キーワード辞書は、前記カテゴリの1つである装置に対応付けて、前記複数の情報に記載された装置を示す単語が登録される、請求項1から5のいずれか一項に記載の情報検索システム。
  7. 前記キーワード辞書は、前記カテゴリの1つである設備に対応付けて、前記複数の情報に記載された設備を示す単語が登録される、請求項1から6のいずれか一項に記載の情報検索システム。
  8. 前記キーワード辞書は、前記カテゴリの1つである機能場所に対応付けて、前記複数の情報に記載された機能場所を示す単語が登録される、請求項1から7のいずれか一項に記載の情報検索システム。
JP2020093682A 2020-05-28 2020-05-28 情報検索システム Active JP7264115B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP2020093682A JP7264115B2 (ja) 2020-05-28 2020-05-28 情報検索システム
US17/999,853 US20230222146A1 (en) 2020-05-28 2021-05-25 Information search system
BR112022023806A BR112022023806A2 (pt) 2020-05-28 2021-05-25 Sistema de busca de informações
MX2022014972A MX2022014972A (es) 2020-05-28 2021-05-25 Sistema de busqueda de informacion.
CN202180036733.9A CN115668176A (zh) 2020-05-28 2021-05-25 信息检索系统
PCT/JP2021/019883 WO2021241601A1 (ja) 2020-05-28 2021-05-25 情報検索システム
KR1020227041838A KR20230003184A (ko) 2020-05-28 2021-05-25 정보 검색 시스템
EP21812955.9A EP4141698A4 (en) 2020-05-28 2021-05-25 INFORMATION RETRIEVAL SYSTEM
TW110119151A TWI823091B (zh) 2020-05-28 2021-05-27 資訊檢索系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020093682A JP7264115B2 (ja) 2020-05-28 2020-05-28 情報検索システム

Publications (2)

Publication Number Publication Date
JP2021189694A JP2021189694A (ja) 2021-12-13
JP7264115B2 true JP7264115B2 (ja) 2023-04-25

Family

ID=78723365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020093682A Active JP7264115B2 (ja) 2020-05-28 2020-05-28 情報検索システム

Country Status (9)

Country Link
US (1) US20230222146A1 (ja)
EP (1) EP4141698A4 (ja)
JP (1) JP7264115B2 (ja)
KR (1) KR20230003184A (ja)
CN (1) CN115668176A (ja)
BR (1) BR112022023806A2 (ja)
MX (1) MX2022014972A (ja)
TW (1) TWI823091B (ja)
WO (1) WO2021241601A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102649918B1 (ko) * 2023-06-05 2024-03-20 (주)복지이십사 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342376A (ja) 2001-05-18 2002-11-29 Nikon Corp サイト検索方法
JP2004118476A (ja) 2002-09-26 2004-04-15 Sharp Corp 電子辞書装置、電子辞書の検索結果表示方法、プログラムおよび記録媒体
JP2005182280A (ja) 2003-12-17 2005-07-07 Ibm Japan Ltd 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
JP2009087009A (ja) 2007-09-28 2009-04-23 Kobe Steel Ltd 文検索装置,文検索プログラム,文検索方法
JP2009110231A (ja) 2007-10-30 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
JP2013214294A (ja) 2012-03-06 2013-10-17 Okwave:Kk クライアントシステム及びサーバ
US8631019B1 (en) 2011-09-09 2014-01-14 Google Inc. Restricted-locality synonyms
JP2018132882A (ja) 2017-02-14 2018-08-23 富士ゼロックス株式会社 設計支援システムおよびプログラム
JP2020119449A (ja) 2019-01-28 2020-08-06 富士ゼロックス株式会社 設計支援システムおよびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI226560B (en) * 2003-12-31 2005-01-11 Lin Guei Mei Information system with natural language parsing ability and processing method thereof
TWI578175B (zh) * 2012-12-31 2017-04-11 威盛電子股份有限公司 檢索方法、檢索系統以及自然語言理解系統
TWI553491B (zh) * 2014-11-21 2016-10-11 財團法人工業技術研究院 問句處理系統及其方法
JP6947155B2 (ja) 2018-01-05 2021-10-13 Jfeスチール株式会社 情報検索システム
TWI674530B (zh) * 2018-02-13 2019-10-11 鼎新電腦股份有限公司 操作虛擬助理的方法及系統

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342376A (ja) 2001-05-18 2002-11-29 Nikon Corp サイト検索方法
JP2004118476A (ja) 2002-09-26 2004-04-15 Sharp Corp 電子辞書装置、電子辞書の検索結果表示方法、プログラムおよび記録媒体
JP2005182280A (ja) 2003-12-17 2005-07-07 Ibm Japan Ltd 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
JP2009087009A (ja) 2007-09-28 2009-04-23 Kobe Steel Ltd 文検索装置,文検索プログラム,文検索方法
JP2009110231A (ja) 2007-10-30 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
US8631019B1 (en) 2011-09-09 2014-01-14 Google Inc. Restricted-locality synonyms
JP2013214294A (ja) 2012-03-06 2013-10-17 Okwave:Kk クライアントシステム及びサーバ
JP2018132882A (ja) 2017-02-14 2018-08-23 富士ゼロックス株式会社 設計支援システムおよびプログラム
JP2020119449A (ja) 2019-01-28 2020-08-06 富士ゼロックス株式会社 設計支援システムおよびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
衛藤 彩香、外2名,制御保全支援システムの開発,JFE技報,日本,JFEホールディングス株式会社,2020年02月28日,第45巻,p.54-58

Also Published As

Publication number Publication date
EP4141698A1 (en) 2023-03-01
MX2022014972A (es) 2023-01-11
US20230222146A1 (en) 2023-07-13
JP2021189694A (ja) 2021-12-13
TWI823091B (zh) 2023-11-21
EP4141698A4 (en) 2023-09-20
KR20230003184A (ko) 2023-01-05
TW202145027A (zh) 2021-12-01
WO2021241601A1 (ja) 2021-12-02
CN115668176A (zh) 2023-01-31
BR112022023806A2 (pt) 2022-12-20

Similar Documents

Publication Publication Date Title
WO2019091026A1 (zh) 知识库文档快速检索方法、应用服务器及计算机可读存储介质
US7260570B2 (en) Retrieving matching documents by queries in any national language
US11321336B2 (en) Systems and methods for enterprise data search and analysis
US10372718B2 (en) Systems and methods for enterprise data search and analysis
CN107844493B (zh) 一种文件关联方法及系统
JP2019121392A (ja) 情報検索システム
CN111400323A (zh) 数据检索方法、系统、设备及存储介质
JP6533876B2 (ja) 商品情報表示システム、商品情報表示方法、及びプログラム
CN111373386A (zh) 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序
JP7264115B2 (ja) 情報検索システム
JP2001184358A (ja) カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体
EP4145302A1 (en) Information search system
JP7004123B1 (ja) 情報検索システム
WO2024079833A1 (ja) 情報処理装置、出力方法、及び出力プログラム
JP5068304B2 (ja) 抽出装置、方法及びプログラム
JP4572265B2 (ja) 実績管理支援システム及び実績管理支援プログラム
JP2009181524A (ja) 文書検索システム及び文書検索方法
JP2023057658A (ja) 情報処理装置、情報を提供するためにコンピューターによって実行される方法、および、プログラム
JP2002278991A (ja) 文書情報検索システム
Garg Cross Lingual Information Retrieval and Error Tracking in search engine
More et al. ALGOMINE: A SYSTEM FOR EXTACTING AND SEARCHING FOR ALGORITHMS IN SCHOLARLY BIG DATA
JPH11345245A (ja) データ入出力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230327

R150 Certificate of patent or registration of utility model

Ref document number: 7264115

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150