JP2021114234A - 情報処理装置、情報処理システム、および情報処理プログラム - Google Patents

情報処理装置、情報処理システム、および情報処理プログラム Download PDF

Info

Publication number
JP2021114234A
JP2021114234A JP2020007504A JP2020007504A JP2021114234A JP 2021114234 A JP2021114234 A JP 2021114234A JP 2020007504 A JP2020007504 A JP 2020007504A JP 2020007504 A JP2020007504 A JP 2020007504A JP 2021114234 A JP2021114234 A JP 2021114234A
Authority
JP
Japan
Prior art keywords
causal relationship
expression
unit
information processing
acquisition unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020007504A
Other languages
English (en)
Other versions
JP7305566B2 (ja
Inventor
寛子 藤井
Hiroko Fujii
寛子 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2020007504A priority Critical patent/JP7305566B2/ja
Priority to US17/005,420 priority patent/US11599569B2/en
Publication of JP2021114234A publication Critical patent/JP2021114234A/ja
Application granted granted Critical
Publication of JP7305566B2 publication Critical patent/JP7305566B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】対象文書に含まれる因果関係の一般化表現への変換効率の向上を図る。【解決手段】情報処理装置10は、因果関係取得部22Bと、類似表現取得部22Cと、取得部22Dと、を備える。因果関係取得部22Bは、因果関係管理情報12Bから、特定の文書である対象文書に含まれる因果関係を取得する。因果関係管理情報12Bには、1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録されている。類似表現取得部22Cは、特徴量管理情報12Cに基づいて、対象文書に含まれる因果関係の類似表現を取得する。類似表現取得部22Cには、1または複数の文書に含まれる複数のワードの各々の特徴量が登録されている。取得部22Dは、対象文書に含まれる因果関係および類似表現に基づいて、対象文書に含まれる因果関係の一般化表現を取得する。【選択図】図2

Description

本発明の実施形態は、情報処理装置、情報処理システム、および情報処理プログラムに関する。
複数の文書から、検索文字列または該検索文字列に類似する類似文字列を含む文書を検索するシステムが知られている。例えば、検索対象の文章から、予め作成された重要語辞書に記載された重要語を含む文を抽出し、抽出した文を、一般化辞書を用いて変換する。そして、変換された文に含まれる因果関係を有する語句を抽出し、これらの語句を連結した因果関係ネットワークを生成する。そして、入力されたテキストに含まれる因果関係と因果ネットワークとのマッチングにより、入力されたテキストに類似する事例を検索するシステムが開示されている。
特開2008−226168号公報
しかし、従来では、一般化された表現の因果関係を得るために、重要語辞書および一般化辞書を予め用意する必要があり、これらの辞書のメンテナンスが必要であった。また、カテゴリの異なる複数の文書に含まれる因果関係の一般化表現を得るためには、単なる変換ではなく、因果関係の有する意味を考慮して変換する必要があった。このため、従来技術では、対象文書に含まれる因果関係の一般化表現への変換効率の向上を図ることが困難な場合があった。
実施形態の情報処理装置は、因果関係取得部と、類似表現取得部と、取得部と、を備える。因果関係取得部は、1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得する。類似表現取得部は、1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得する。取得部は、前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得する。
実施形態に係る情報処理システムの模式図。 実施形態に係る情報処理装置および端末装置の各々の機能的構成を示すブロック図。 実施形態に係る文書の模式図。 実施形態に係る文書管理情報のデータ構成を示す模式図。 実施形態に係る因果関係管理情報のデータ構成を示す模式図。 実施形態に係る特徴量管理情報のデータ構成を示す模式図。 実施形態に係る表示画面の模式図。 実施形態に係る共起管理情報のデータ構成を示す模式図。 実施形態に係る表示画面の模式図。 実施形態に係る表示画面の模式図。 実施形態に係る表示画面の模式図。 実施形態に係る表示画面の模式図。 実施形態に係る表示画面の模式図。 実施形態に係る一般化管理情報のデータ構成の模式図。 実施形態に係る情報処理装置が実行する情報処理の流れを示すフローチャート。 実施形態に係る情報処理装置の機能的構成を示すブロック図。 実施形態に係る情報処理装置および端末装置のハードウェア構成図。
以下に添付図面を参照して、本実施形態の情報処理装置、情報処理システム、および情報処理プログラムを詳細に説明する。
図1は、本実施形態の情報処理システム1の一例を示す模式図である。
情報処理システム1は、情報処理装置10と、端末装置30と、を備える。情報処理装置10と端末装置30とは、ネットワークNなどの無線または有線の通信網を介して通信可能に接続されている。
情報処理装置10は、専用または汎用コンピュータである。本実施形態では、情報処理装置10は、文書に対して後述する処理を実行する。文書および処理の詳細は後述する。
端末装置30は、ユーザによって操作されるコンピュータである。端末装置30は、例えば、コンピュータ、携帯端末、スマートフォン、などであるが、これらに限定されない。
なお、図1には、情報処理システム1が、情報処理装置10および端末装置30を1台ずつ備えた構成を一例として示した。しかし、情報処理システム1は、1または複数の情報処理装置10、および、1または複数の端末装置30を備えた構成であればよい。
図2は、本実施形態の情報処理装置10および端末装置30の各々の機能的構成の一例を示すブロック図である。
端末装置30は、本実施形態では、情報処理装置10と通信する時にユーザによって操作される装置である。
端末装置30は、記憶部32と、UI(ユーザ・インターフェース)部34と、通信部36と、主制御部38と、を備える。記憶部32と、UI部34と、通信部36と、主制御部38とは、バス39を介してデータまたは信号を授受可能に接続されている。
記憶部32は、各種データを記憶する。記憶部32は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、ハードディスク、光ディスク等である。なお、記憶部32は、記憶媒体であってもよい。具体的には、記憶媒体は、プログラムや各種情報を、LAN(Local Area Network)やインターネットなどを介してダウンロードして記憶または一時記憶したものであってもよい。また、記憶部32を、複数の記憶媒体から構成してもよい。
通信部36は、ネットワークNを介して情報処理装置10と通信する。UI部34は、ユーザによる操作入力を受付ける機能、および、各種の情報を出力する機能を備える。
例えば、UI部34は、ディスプレイと、入力部と、を含む。ディスプレイは、各種の情報を表示する。ディスプレイは、例えば、公知の有機EL(Electro−Luminescence)ディスプレイ、LCD(Liquid Crystal Display、投影装置などである。入力部は、ユーザからの各種指示を受付ける。入力部は、例えば、キーボード、マウス、タッチパネル、マイクロフォン、などである。なお、UI部34を、入力機構と出力機構とを備えたタッチパネルで構成してもよい。また、UI部34は、更に、音声を出力するスピーカを含む構成であってもよい。主制御部38は、端末装置30に設けられた電子制御可能な機器の各部を制御する。
次に、情報処理装置10について説明する。
情報処理装置10は、記憶部12と、UI部14と、通信部16と、制御部18と、を備える。記憶部12と、UI部14と、通信部16と、制御部18とは、バス19を介してデータまたは信号を授受可能に接続されている。
なお、記憶部12およびUI部14の少なくとも一方と、制御部18とを、ネットワークNを介して接続してもよい。すなわち、記憶部12およびUI部14の少なくとも一方を、情報処理装置10に対してネットワークNを介して接続された外部装置に設けてもよい。また、制御部18に含まれる後述する機能部の少なくとも1つを、該外部装置に設けた構成としてもよい。外部装置は、例えば、外部サーバなどである。
記憶部12は、各種データを記憶する。記憶部12は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、ハードディスク、光ディスク等である。なお、記憶部12は、情報処理装置10の外部に設けられた記憶装置であってもよい。また、記憶部12は、記憶媒体であってもよい。具体的には、記憶媒体は、プログラムや各種情報を、LAN(Local Area Network)やインターネットなどを介してダウンロードして記憶または一時記憶したものであってもよい。また、記憶部12を、複数の記憶媒体から構成してもよい。
本実施形態では、記憶部12は、文書管理情報12A、因果関係管理情報12B、特徴量管理情報12C、共起管理情報12D、および一般化管理情報12Eを記憶する。これらの情報の詳細は後述する。
UI部14は、ユーザによる操作入力を受付ける機能、および、各種の情報を出力する機能を備える。例えば、UI部14は、ディスプレイと、入力部と、を含む。ディスプレイおよび入力部の一例は、UI部34と同様である。通信部16は、ネットワークNを介して端末装置30と通信する。
制御部18は、学習部20と、変換支援処理部22と、を備える。学習部20は、因果関係学習部20Aと、特徴量学習部20Bと、を有する。変換支援処理部22は、対象文書取得部22Aと、因果関係取得部22Bと、類似表現取得部22Cと、取得部22Dと、を備える。類似表現取得部22Cは、優先度判定部22Eを含む。取得部22Dは、共起語取得部22Fと、表示制御部22Gと、受付部22Hと、登録部22Iと、を含む。
学習部20、因果関係学習部20A、特徴量学習部20B、変換支援処理部22、対象文書取得部22A、因果関係取得部22B、類似表現取得部22C、取得部22D、優先度判定部22E、共起語取得部22F、表示制御部22G、受付部22H、および登録部22Iの少なくとも1つは、例えば、1または複数のプロセッサにより実現される。例えば、上記各部は、CPU(Central Processing Unit)などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のIC(Integrated Circuit)などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
学習部20は、文書に基づいて機械学習を実行する機能部である。
文書とは、複数のワードを含むデータである。ワードとは、形態素である。形態素とは、意味をもつ表現要素の最小単位である。文書は、例えば、会議、実験、各種の現象、および、各種のプロジェクト、などの報告書または事例データである。
具体的には、例えば、文書は、車両、航空機、各種の製品、または各種のプロジェクトなどにおける、設計、製造、および運用上の過去に発生したトラブルなどの事例データである。設計には、例えば、火力、水力、原子力発電所、ビル空調管理システム、および上下水道管理システム、等の製品設計などが含まれる。また、文書は、製品などに関する技術分野の規定類の資料であってもよい。
報告書の一例である実験のデータには、実験条件および実験結果を示すデータなどが含まれる。事例データには、題名、現象、現象の生じた原因、原因に対する対策、該当する製品名、などが含まれる場合がある。また、報告書には、課題および課題に対する効果を示すデータなどが含まれる場合がある。また、事例データには、特定の現象の原因と該原因に対する結果を示すデータなどが含まれる場合がある。また、文書には、時系列的または概念的に上位の現象と、該上位の現象に対して関係を有する下位の現象を示すデータが含まれる場合がある。
図3は、文書40の一例を示す模式図である。図3には、文書40の一例として、トラブルの事例データを示した。例えば、文書40には、文書40の題名、トラブルの内容である現象、該現象の生じた原因、該現象に対する対策、該現象の生じた製品名、などに関するワードが含まれる。なお、文書40に含まれる内容は、図3に示す内容に限定されない。また、文書40の形式についても、図3に示す形式に限定されない。
図2に戻り説明を続ける。本実施形態では、複数の文書40が文書管理情報12Aに予め登録されている。
図4は、文書管理情報12Aのデータ構成の一例を示す模式図である。文書管理情報12Aは、文書IDと、カテゴリと、文書40と、を対応付けたデータベースである。なお、文書管理情報12Aのデータ形式は、データベースに限定されない。
文書IDは、対応する文書40を識別するための識別情報である。カテゴリとは、複数の文書40を予め定めた分類条件に従って複数のグループに分類したときの、各グループの名称である。カテゴリは、例えば、製品、分野、業界、管理部門、日付、期間、などである。
文書管理情報12Aには、対応する文書40のカテゴリが登録されている。図4には、カテゴリが製品名である場合を一例として示した。すなわち、図4には、何れの製品に関する文書40であるかを示すカテゴリが、文書管理情報12Aに予め登録されている形態を、一例として示した。なお、上述したように、カテゴリは、製品名に限定されない。
本実施形態では、文書管理情報12Aには、複数の文書40として、文書40A〜文書40Cが予め登録されている形態を一例として説明する。なお、文書管理情報12Aには、少なくとも1つ以上の文書40が予め登録されていればよく、登録されている文書40の数は、3つに限定されない。
図2に戻り説明を続ける。本実施形態では、学習部20は、文書管理情報12Aを用いて、機械学習を実行する。学習部20は、因果関係学習部20Aと、特徴量学習部20Bと、を備える。
因果関係学習部20Aは、文書管理情報12Aに基づいて、文書管理情報12Aに登録されている文書40に含まれる因果関係を抽出し、因果関係管理情報12Bへ登録する。
因果関係とは、関係を有する第1要素と第2要素との組からなるデータである。第1要素と第2要素との組は、例えば、原因と結果、条件と結果又は結論、課題と効果、上位要素と下位要素、などである。上位要素とは、時系列的または概念的に上位の現象を表す要素である。下位要素とは、該該上位要素に対して関係を有する下位の現象を表す要素である。
第1要素および第2要素は、1または複数のワードの群によって表される。
本実施形態では、関係を有する第1要素と第2要素との組が、原因と結果の組である場合を一例として説明する。なお、上述したように、第1要素と第2要素との組は、原因と結果との組に限定されない。
因果関係学習部20Aは、文書管理情報12Aに登録されている複数の文書40から、これらの複数の文書40の各々に含まれる因果関係を抽出する。因果関係学習部20Aは、公知の技術を用いて、複数の文書40(文書40A〜文書40C)の各々から、原因と結果の組からなる因果関係を複数抽出する。
例えば、因果関係学習部20Aによる因果関係の抽出には、文献1に示される機械学習方法、または、文献2に示されるパターンマッチングを用いればよい。
・文献1:Kruengkrai他, Improving Event Causality Recognition With Multiple Background Knowledge Sources Using Multi−Column Convolutional NeuralNetworks, AAAI’17 Proceedings of the Thirty−First AAAI Conference on Artificial Intelligence,
pp.3466−3473, 2017
・文献2:坂地他, 決算短信PDFからの原因・結果表現の抽出, 電子情報通信学会論文誌D, Vol.J98−D, N0.5, pp.811−822, 2015
因果関係学習部20Aは、複数の文書40(文書40A〜文書40B)の各々から抽出した因果関係を、因果関係管理情報12Bへ登録する。このため、因果関係管理情報12Bは、1または複数の文書40の各々から抽出された、関係を有する第1要素と第2要素との組からなる、1または複数の因果関係が登録された状態となる。
図5は、因果関係管理情報12Bのデータ構成の一例を示す模式図である。因果関係管理情報12Bは、因果関係IDと、文書IDと、カテゴリと、因果関係42と、一般化IDと、を対応付けたデータベースである。なお、因果関係管理情報12Bのデータ形式は、データベースに限定されない。
因果関係IDは、対応する因果関係42の識別情報である。因果関係42は、第1要素と第2要素とを含む。上述したように、本実施形態では、第1要素と第2要素との組が、原因と結果の組である場合を一例として説明する。このため、以下では、因果関係42が、原因42Aと結果42Bとの組のデータである場合を一例として説明する。一般化IDは、因果関係42の一般化表現の識別情報である。一般化表現の詳細は後述する。
図2に戻り説明を続ける。特徴量学習部20Bは、1または複数の文書40の各々に含まれる複数のワードの各々の特徴量を学習し、特徴量管理情報12Cへ登録する。
図6は、特徴量管理情報12Cのデータ構成の一例を示す模式図である。特徴量管理情報12Cは、ワードと、特徴量と、カテゴリ毎含有数と、を対応付けたデータベースである。特徴量管理情報12Cに登録されているワードは、文書管理情報12Aに登録されている複数の文書40の各々に含まれるワードである。
特徴量とは、対応するワードの特徴量を示すデータである。特徴量は、例えば、文書40に含まれるワードの各々について、前後のワードとの関係から取得されるベクトル表現によって表される。
特徴量管理情報12Cは、文書40に含まれるワードの各々を学習データとして用い、単語埋込技術をn−gram(連続するn個の単語。以下、フレーズともいう)に拡張した拡張学習方法により、フレーズのベクトル表現を学習する。単語埋込技術は、学習対象となるワードの前後に配置されるワードの並びを、該学習対象のワードの文脈とみなす。そして、単語埋込技術では、意味的に類似したワードがベクトル空間上で近くに配置されるよう、ニューラルネットワークを用いて、ワードのベクトル表現を学習する。ワードのベクトル表現は、埋込ベクトルと称される場合がある。
このような学習により、特徴量管理情報12Cは、文書40に含まれるワードの各々のベクトル表現を学習する。なお、拡張学習方法には、例えば、以下の文献3に示される方法を用いればよい。
・文献3:Zhao他, Ngram2vec: Learning Improved Word Representations from Ngram Co−occurrence Statistics, Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing,pp.244−253, 2017
カテゴリ毎含有数とは、対応するワードが、複数のカテゴリの各々に属する文書40に何個含まれるかを示す情報である。図6には、一例として、4つのカテゴリの各々に、対応するワードが何個含まれるかを示す数値を示した。具体的には、[125,12,0,0]は、ワード“揺れ”がカテゴリ“製品A”に属する文書40に125個含まれ、カテゴリ“製品B”に属する文書40に12個含まれ、カテゴリ“製品C”および“製品D”に属する文書40に0個含まれることを意味する。
特徴量学習部20Bは、複数の文書40の各々に含まれるワードの各々について、各カテゴリに属する文書40の群ごとに、含まれる数を公知の解析方法を用いて取得する。そして、特徴量学習部20Bは、取得結果を、ワードの各々のカテゴリ毎含有数として、特徴量管理情報12Cに登録すればよい。
図2に戻り説明を続ける。学習部20は、外部装置やUI部14を介して新たな文書40を取得するごとに、取得した文書40を文書管理情報12Aへ登録すればよい。また、学習部20は、文書管理情報12Aへの文書40の登録時に、該文書40のカテゴリを公知の方法で特定すると共に、文書IDを付与し、文書管理情報12Aへ登録すればよい。例えば、学習部20は、文書40に含まれるカテゴリの識別対象となる文言を検索し、該検索結果を用いてカテゴリを特定すればよい。なお、文書管理情報12Aは、文書管理情報12Aへの文書40の登録時に、ユーザによって入力されたカテゴリを、該文書40のカテゴリとして用いてもよい。
また、学習部20では、文書管理情報12Aに新たな文書40が登録されるごとに、因果関係学習部20Aおよび特徴量学習部20Bの各々が上記学習処理を実行する。このため、学習部20は、文書管理情報12Aに登録されている全ての文書40を用いた学習結果を、因果関係管理情報12Bおよび特徴量管理情報12Cに登録することができる。
次に、変換支援処理部22について説明する。
変換支援処理部22は、文書40に含まれる因果関係42について、一般化表現への変換を支援する処理を実行する。
一般化表現への変換とは、因果関係42に含まれる原因42Aおよび結果42Bの少なくとも一方を、カテゴリ内の特有の表現に限定されない、一般化された表現に変換することを意味する。すなわち、一般化表現とは、カテゴリ内の特有の表現に限定されない、一般化された表現を意味する。
変換支援処理部22は、対象文書取得部22Aと、因果関係取得部22Bと、類似表現取得部22Cと、取得部22Dと、を備える。
対象文書取得部22Aは、対象文書を取得する。対象文書とは、一般化表現への変換対象の因果関係42を含む文書40である。言い換えると、対象文書は、文書管理情報12Aに登録されている複数の文書40の内の、1つの特定の文書40である。
対象文書取得部22Aは、例えば、文書管理情報12Aに登録されている複数の文書40の内、ユーザによって選択された文書40を、対象文書として取得する。
この場合、対象文書取得部22Aは、例えば、対象文書を選択するための表示画面を表示し、ユーザからの操作を受付ける制御を行う。
例えば、対象文書取得部22Aは、表示画面を、ユーザによって操作される端末装置30のUI部34へ表示する。なお、本実施形態の変換支援処理部22が実行する変換支援機能は、例えば、Webアプリケーションとして端末装置30に予め提供されている。例えば、ユーザは、端末装置30に搭載されたWebブラウザを介して、変換支援機能を利用する。
図7は、UI部34に表示された表示画面51の一例を示す模式図である。表示画面51は、表示画面50の一例である。表示画面50は、端末装置30がWebブラウザを介して変換支援機能にアクセスした際に、UI部34のWebブラウザ画面に表示されるインターフェース画面の一例である。
表示画面51は、検索クエリ入力欄50Aと、一覧表示領域50Bと、を含む。検索クエリ入力欄50Aは、検索クエリの入力欄である。一覧表示領域50Bは、検索された文書40の一覧の表示領域である。
例えば、ユーザは、検索クエリ入力欄50Aに検索対象の文書40の検索クエリを入力する。すると、端末装置30の主制御部38は、該検索クエリを、通信部36を介して情報処理装置10へ送信する。情報処理装置10の対象文書取得部22Aは、受付けた検索クエリに対応する文書40を文書管理情報12Aから検索し、通信部16を介して端末装置30へ送信する。すると、端末装置30の主制御部38は、情報処理装置10から受付けた文書40の一覧を、表示画面51の一覧表示領域50Bへ表示する。
このため、表示画面51には、文書40の一覧が表示される。ユーザは、一覧表示領域50Bに表示された複数の文書40の内、一般化表現への変換対象の文書40を選択する。端末装置30は、選択を受付けた文書40または文書40の文書IDを、通信部36を介して情報処理装置10へ送信する。対象文書取得部22Aは、端末装置30から受付けた文書40または文書IDに対応する文書40を、対象文書として取得する。
本実施形態では、図3に示す文書40Aを、対象文書41として取得した形態を一例として説明する。
図2に戻り説明を続ける。因果関係取得部22Bは、因果関係管理情報12Bから、対象文書41に含まれる因果関係42を取得する。因果関係取得部22Bは、対象文書41の文書IDに対応する、1または複数の因果関係42を因果関係管理情報12Bから読取ることで、因果関係42を取得する。
なお、因果関係取得部22Bは、因果関係管理情報12Bから取得した複数の因果関係42の内、ユーザによって選択された因果関係42を取得してもよい。
この場合、因果関係取得部22Bは、対象文書41に含まれる複数の因果関係42の一覧を、端末装置30のUI部34へ表示する。ユーザは、UI部34を参照しながら所望の因果関係42を選択する。端末装置30の主制御部38は、UI部34から受付けた因果関係42または因果関係42の因果関係IDを、通信部36を介して情報処理装置10へ送信する。そして、情報処理装置10の因果関係取得部22Bは、端末装置30から因果関係42または因果関係IDを受付ける事で、ユーザよって選択された因果関係42を取得すればよい。なお、因果関係取得部22Bは、因果関係IDを受付けた場合には、該因果関係IDに対応する因果関係42を因果関係管理情報12Bから読取ることで、因果関係42を取得すればよい。
次に、類似表現取得部22Cについて説明する。類似表現取得部22Cは、特徴量管理情報12Cに基づいて、対象文書41に含まれる因果関係42の類似表現を取得する。
類似表現とは、因果関係42に含まれる原因42Aおよび結果42Bの少なくとも一方の各々に類似する表現である。類似表現取得部22Cは、特徴量管理情報12Cに登録されているワードの内、対象文書41における因果関係42を構成するワードの各々に特徴量が類似するワードの群を、該因果関係42の類似表現として取得する。類似表現取得部22Cは、対象文書41に含まれる因果関係42を形態素解析することで、因果関係42(原因42A、結果42B)の各々を構成するワードを特定する。そして、類似表現取得部22Cは、特定したワード、すなわち、形態素または連続する形態素列であるフレーズに特徴量が類似するワードの群を、特徴量管理情報12Cから特定し、類似表現43として取得する。
図6を用いて説明する。例えば、類似表現取得部22Cが、対象文書41における因果関係42を構成するワードとして、原因42Aに含まれるワードである“揺れ”の類似表現を取得する場面を想定して説明する。この場合、類似表現取得部22Cは、特徴量管理情報12Cに登録されているワードの内、ワード“揺れ”の特徴量であるベクトル表現に類似するワードとして、例えば“振動”を特定する。類似表現取得部22Cは、類似表現を取得する対象のワードとの類似スコアが閾値以上の範囲の他のワードを、類似表現として取得すればよい。
詳細には、類似表現取得部22Cは、因果関係管理情報12Bに登録されているワードの各々について、ワード“揺れ”の特徴量であるベクトル表現との類似スコアを、例えば、コサイン距離により計算する。そして、類似表現取得部22Cは、類似スコアの高い順に、予め定めた閾値を超える類似スコアを有するワードを、ワード“揺れ”の類似表現として取得する。なお、閾値は、類似スコアに限定されない。例えば、閾値には、類似表現として取得するワードの最大数を設定してもよい。
そして、類似表現取得部22Cは、因果関係42に含まれる原因42Aおよび結果42Bの各々に含まれるワードごとに、上記と同様にして類似表現を取得する。この処理により、類似表現取得部22Cは、原因42Aの類似表現と、結果42Bの類似表現とを、因果関係42の類似表現として取得する。
なお、類似表現取得部22Cは、類似するワードの内、優先度の高いワードを類似表現として取得してもよい。この場合、類似表現取得部22Cは、優先度判定部22Eを含んだ構成とすればよい(図2参照)。
優先度判定部22Eは、特徴量管理情報12Cに登録されているワードの各々の優先度を判定する。優先度判定部22Eは、予め定めた判定条件を用いて、ワードの各々の優先度を判定すればよい。
例えば、優先度判定部22Eは、対象文書41が属するカテゴリを特定する。そして、優先度判定部22Eは、特定したカテゴリ以外の他のカテゴリに多く含まれるワードであるほど、高い優先度を判定する。図6を用いて説明する。例えば、対象文書41として取得した文書40Aのカテゴリが“製品A”であった場合を想定する(図4参照)。この場合、優先度判定部22Eは、特徴量管理情報12Cに登録されているワードの各々について、“製品A”以外のカテゴリである“製品B”、“製品C”、および“製品D”の少なくとも1つに多く含まれるワードほど、高い優先度を判定する。
そして、類似表現取得部22Cは、対象文書41における因果関係42を構成するワードに特徴量が類似する他のワードの内、判定した優先度が第1優先度より高いワードの群を、因果関係42の類似表現として取得する。第1優先度は、予め定めればよい。
例えば、優先度判定部22Eが、優先度計算方法において、(対象ワードのカテゴリ以外の含有数の合計)/(対象ワードのカテゴリの含有数)を、優先度として算出した場合を想定する。この場合、類似表現取得部22Cは、例えば、第1優先度を“1.0”とし、該第1優先度より高いワードの群を、因果関係42の類似表現として取得すればよい。
また、類似表現取得部22Cは、特徴量が類似する他のワードの内、判定した優先度が高い順に上位から予め定めた数のワードを、因果関係42の類似表現として取得してもよい。
なお、類似表現取得部22Cは、対象文書41の因果関係42に含まれるワードの品詞の内、予め定められた品詞を持つワードのみを対象として、類似表現を取得してもよい。例えば、類似表現取得部22Cは、対象文書41の因果関係42に含まれるワードの品詞を特定する。品詞は、例えば、動詞、形容詞、形容動詞、名詞、副詞、連体詞、接続詞、感動詞、助動詞、助詞などである。例えば、類似表現取得部22Cは、因果関係42に含まれるワードのうち、品詞が名詞であるワードのみを選択する、そして、類似表現取得部22Cは、選択したワードと特徴量が類似するワードのうち、品詞が名詞であるワードの群を、類似表現として取得してもよい。
類似表現取得部22Cは、対象文書41に含まれる因果関係42の各々について、因果関係42を構成する原因42Aおよび結果42Bの各々を構成するワードごとに、上記処理を実行する。類似表現取得部22Cは、これらの処理によって、対象文書41に含まれる1または複数の因果関係42の各々について、原因42Aおよび結果42Bの各々の類似表現を取得する。
次に、取得部22Dについて説明する。取得部22Dは、対象文書41に含まれる因果関係42および類似表現に基づいて、対象文書41に含まれる因果関係42の一般化表現を取得する。なお、取得部22Dは、対象文書41に含まれる因果関係42、類似表現、および共起語に基づいて、対象文書41に含まれる因果関係42の一般化表現を取得してもよい。
本実施形態では、取得部22Dは、共起語取得部22Fと、表示制御部22Gと、受付部22Hと、登録部22Iと、を備える。
共起語取得部22Fは、対象文書41に含まれる因果関係42を構成するワードの共起語を取得する。共起語とは、ワードに対して、該ワードと併せて使用される確率の高い他のワードである。
本実施形態では、共起語取得部22Fは、共起管理情報12Dを用いて共起語を取得する。
図8は、共起管理情報12Dのデータ構成の一例を示す模式図である。共起管理情報12Dは、ワードと、該ワードに対する1または複数の共起語と、を対応付けたデータベースである。共起管理情報12Dのデータ構成は、データベースに限定されない。
共起管理情報12Dは、予め記憶部12に記憶されていればよい。例えば、情報処理装置10は、ネットワークNを介して外部装置から、共起管理情報12Dを取得し、記憶部12へ記憶してもよい。また、例えば、情報処理装置10は、文書管理情報12Aに登録されている複数の文書40の各々に含まれる複数のワードを抽出し、抽出した複数のワードの各々を用いる。そして、情報処理装置10は、該データと公知の共起度計算手法により、共起管理情報12Dを予め作成してもよい。
図2に戻り説明を続ける。共起語取得部22Fは、対象文書41に含まれる因果関係42を構成するワードに関する共起語を、共起管理情報12Dから取得する。ワードに関する共起語とは、ワードに対応する共起語、および、ワードの類似表現に対する共起語、を意味する。例えば、共起語取得部22Fは、対象文書41に含まれる因果関係42を構成するワードの各々に対応する共起語および該ワードの類似表現に対する共起語の少なくとも一方を、共起管理情報12Dから取得する。
なお、共起語取得部22Fは、対象文書41に含まれる因果関係42を構成するワードに関する共起語の内、ユーザが選択したワードの共起語を取得してもよい。
なお、取得部22Dは、共起語取得部22Fを備えた構成に限定されない。取得部22Dは、共起語取得部22Fを備えない構成であってもよい。本実施形態では、取得部22Dが、共起語取得部22Fを備えた構成である場合を一例として説明する。
表示制御部22Gは、対象文書41に含まれる因果関係42および類似表現を含む表示画面50を、表示部に表示する。本実施形態では、UI部34が、表示部の一例に相当する。なお、情報処理装置10に設けられたUI部14が、表示部の一例であってもよい。
表示制御部22Gによる表示制御によって、端末装置30のUI部34には、因果関係42および類似表現を含む表示画面50が表示される。
図9は、表示画面52の一例を示す模式図である。表示画面52は、表示画面50の一例である。表示画面52は、対象文書表示領域60と、因果関係表示領域62と、類似表現表示領域63と、一般化表現入力欄64と、を含む。なお、表示画面52は、因果関係表示領域62、類似表現表示領域63、および一般化表現入力欄64を少なくとも含む表示画面50であればよい。
対象文書表示領域60は、対象文書41の表示領域である。因果関係表示領域62は、対象文書41に含まれる因果関係42の表示領域である。図9には、因果関係表示領域62に1つの因果関係42が表示された形態を一例として示した。
類似表現表示領域63は、類似表現取得部22Cが取得した類似表現43の表示領域である。図9に示すように、類似表現表示領域63には、因果関係表示領域62に表示されている原因42Aの類似表現43である類似表現43Aと、結果42Bの類似表現43である類似表現43Bと、が表示される。
一般化表現入力欄64は、因果関係42に対応する一般化表現44の入力欄である。一般化表現入力欄64は、入力欄64Aと、入力欄64Bと、を含む。入力欄64Aは、原因42Aの一般化表現44Aの入力欄である。入力欄64Bは、結果42Bの一般化表現44Bの入力欄である。
図9に示すように、表示画面52には、因果関係表示領域62と、類似表現表示領域63と、が含まれる。このため、ユーザは、因果関係表示領域62に表示された因果関係42と、類似表現表示領域63に表示された、該因果関係42の類似表現43と、を視認しながら、容易に、因果関係42の一般化表現44を検討し一般化表現入力欄64へ入力することができる。
そして、ユーザは、一般化表現入力欄64への一般化表現44の入力完了後、登録ボタン65を操作すればよい。この操作により、端末装置30は、入力された一般化表現44と、該一般化表現44の入力時に処理対象とされていた因果関係42の因果関係IDと、を、通信部36を介して情報処理装置10へ送信する。
なお、因果関係取得部22Bが、対象文書41から複数の因果関係42を取得する場合がある。この場合、表示制御部22Gは、複数の因果関係42および複数の因果関係42の各々の類似表現43を含む表示画面50をUI部34へ表示すればよい。
図10は、表示画面53の一例を示す模式図である。表示画面53は、表示画面50の一例である。表示画面53は、対象文書表示領域60と、因果関係表示領域62と、類似表現表示領域63と、一般化表現入力欄64と、を含む。
表示画面53は、因果関係表示領域62として、複数の因果関係表示領域62(因果関係表示領域62A、因果関係表示領域62B)を有する。因果関係表示領域62Aには、原因42A1と結果42B1との組からなる因果関係420が表示される。因果関係表示領域62Bには、原因42A2と結果42B2との組からなる因果関係421が表示される。因果関係420および因果関係421は、因果関係42の一例である。
また、表示画面53は、類似表現表示領域63として、複数の類似表現表示領域63(類似表現表示領域63A、類似表現表示領域63B)を有する。類似表現表示領域63Aは、因果関係表示領域62Aに表示された因果関係420に対応する、類似表現43(類似表現43A1、類似表現43B1))の表示領域である。類似表現表示領域63Bは、因果関係表示領域62Bに表示された因果関係421に対応する、類似表現43(類似表現43A2、類似表現43B2)の表示領域である。
このように、表示画面53は、対象文書41に含まれる複数の因果関係42の各々に対応する類似表現43を表示した表示画面50であってもよい。また、ユーザは、表示画面53を介して、入力した一般化表現に対応する因果関係を選択状態にしておくなどの操作(複数選択可)を行うことで、因果関係と一般化表現の対応をとる事が出来る。
なお、上述したように、本実施形態の取得部22Dは、共起語取得部22Fを含む構成であってもよい。この場合、表示制御部22Gは、対象文書41の因果関係42と、類似表現43と、共起語45と、を含む表示画面50をUI部34へ表示すればよい。
図11は、表示画面54の一例を示す模式図である。表示画面54は、表示画面50の一例である。表示画面54は、対象文書表示領域60と、因果関係表示領域62と、類似表現表示領域63と、一般化表現入力欄64と、共起語表示領域66と、を含む。
共起語表示領域66は、因果関係42に含まれるワードの共起語45の表示領域である。例えば、因果関係表示領域62に表示されている原因42Aに含まれるワードの各々の類似表現43Aが類似表現表示領域63に表示され、該ワードのうち、選択されたワードの共起語45Aが共起語表示領域66に表示される。また、例えば、因果関係表示領域62に表示されている結果42Bに含まれるワードの各々の類似表現43Bが、類似表現表示領域63に表示され、該ワードのうち、選択されたワードの共起語45Bが共起語表示領域66に表示される。
このため、ユーザは、因果関係表示領域62に表示された因果関係42と、因果関係表示領域62に表示された、該因果関係42の類似表現43と、共起語表示領域66に表示された共起語45と、を視認しながら、容易に、因果関係42の一般化表現44を検討し一般化表現入力欄64へ入力することができる。
端末装置30の主制御部38は、入力された一般化表現44と、該一般化表現44の入力時に処理対象とされていた因果関係42の因果関係IDと、を、通信部36を介して情報処理装置10へ送信する。
なお、表示制御部22Gは、一般化表現44の候補の一覧を表示画面50に表示してもよい。
図12は、表示画面55の一例を示す模式図である。表示画面55は、表示画面50の一例である。表示画面55は、対象文書表示領域60と、因果関係表示領域62と、類似表現表示領域63と、一般化表現入力欄64と、共起語表示領域66と、候補選択欄67と、を含む。
候補選択欄67は、対象文書41に含まれる因果関係42に対応する、一般化表現44の候補の表示欄である。表示制御部22Gは、処理対象として選択されている因果関係42の因果関係IDに対応する一般化IDを、因果関係管理情報12Bから読取る(図5参照)。そして、表示制御部22Gは、読取った一般化IDに対応する一般化表現44を、後述する一般化管理情報12Eから読取り、候補選択欄67に表示すればよい。
なお、表示制御部22Gは、処理対象として選択されている因果関係42に対応する一般化IDに加えて、該因果関係42と類似している他の因果関係42の持つ一般化IDを読み取るようにしてもよい。この場合、例えば、表示制御部22Gは、ユーザが選択した因果関係42からキーワードを抽出し、これを検索キーワードとして因果関係管理情報12Bから、キーワードの一致する因果関係を検索する。そして、表示制御部22Gは、検索結果の因果関係42に対応する一般化IDを読み取り、一般化表現候補に加えて表示すればよい。
ユーザは、プルダウンボタン67Aを操作することにより、候補選択欄67に表示された一般化表現44の一覧の中から、所望の一般化表現44を選択すればよい。
この場合、端末装置30の主制御部38は、ユーザによって選択された一般化表現44と、該一般化表現44の選択時に処理対象とされていた因果関係42の因果関係IDと、を、通信部36を介して情報処理装置10へ送信すればよい。
なお、表示画面50は、対象文書41に含まれる複数の因果関係42の内、ユーザによって選択された因果関係42に対応する類似表現43を表示する形態であってもよい。
図13は、表示画面56の一例を示す模式図である。表示画面56は、表示画面50の一例である。表示画面56は、対象文書表示領域60と、因果関係表示領域62と、類似表現表示領域63と、一般化表現入力欄64と、共起語表示領域66と、候補選択欄67と、を含む。
表示画面56の因果関係表示領域62には、複数の因果関係42(因果関係420、因果関係421)が表示される。
例えば、ユーザがUI部34を操作することで、複数の因果関係42の内、因果関係421を選択した場合を想定する。この場合、端末装置30の主制御部38は、選択を受付けた因果関係420または因果関係420の因果関係IDを、通信部36を介して情報処理装置10へ送信する。情報処理装置10の表示制御部22Gは、受付けた因果関係420または因果関係IDによって識別される因果関係420、に対応する類似表現43を類似表現取得部22Cから取得し、端末装置30へ送信すればよい。また、表示制御部22Gは、該因果関係421の類似表現43のうち、ユーザが選択した類似表現(太字のワード)に対応する共起語45を、端末装置30へ送信すればよい。
このため、端末装置30の表示画面53には、選択された因果関係420に対応する類似表現43(類似表現43A1、類似表現43A2)が、類似表現表示領域63に表示される。また、端末装置30の表示画面53には、選択された因果関係420の共起語45(共起語45A1、共起語45B1)が、共起語表示領域66に表示される。
このように、表示制御部22Gは、ユーザによって選択された因果関係42の類似表現43および共起語45を含む表示画面56を、端末装置30のUI部34に表示してもよい。
図2に戻り説明を続ける。受付部22Hは、表示画面50に表示された因果関係42の一般化表現44の入力を受付ける。本実施形態では、受付部22Hは、ユーザによって選択または入力された一般化表現44を、端末装置30から受信することで、一般化表現44の入力を受付ける。本実施形態では、上述したように、受付部22Hは、一般化表現44と、該一般化表現44の入力または選択時に処理対象とされていた因果関係42の因果関係IDと、を端末装置30から受付ける。
なお、表示制御部22Gは、上記表示画面50を情報処理装置10のUI部14へ表示してもよい。この場合、受付部22Hは、UI部14から一般化表現44の入力を受付ければよい。
登録部22Iは、受付部22Hで受付けた一般化表現44を、該一般化表現44の入力または選択時に処理対象とされていた因果関係42の因果関係IDに対応付けて、記憶部12へ記憶する。
本実施形態では、登録部22Iは、因果関係管理情報12Bおよび一般化管理情報12Eを更新することで、一般化表現44を登録する。
図14は、一般化管理情報12Eのデータ構成の一例を示す模式図である。一般化管理情報12Eは、一般化IDと、因果関係42の一般化表現44と、を対応付けたデータベースである。なお、一般化管理情報12Eのデータ形式は、データベースに限定されない。
一般化IDは、一般化表現44の識別情報である。一般化表現44は、原因42Aの一般化表現44Aと、結果42Bの一般化表現44Bと、の組から構成される。
登録部22Iは、受付部22Hで受付けた一般化表現44を、一般化管理情報12Eへ登録すると共に、一般化IDを付与して一般化管理情報12Eへ登録する。また、登録部22Iは、一般化管理情報12Eへ登録した一般化表現44の一般化IDを、該一般化表現44の入力または選択時に処理対象とされていた因果関係42の因果関係IDに対応付けて、因果関係管理情報12Bへ登録する(図5参照)。
これらの処理により、登録部22Iは、一般化表現44を記憶部12へ記憶する。
例えば、ユーザが特定の検索クエリを用いて、該検索クエリに関する文書40を検索する場面を想定する。この場合、情報処理装置10の制御部18では、受付けた検索クエリを含む因果関係42を因果関係管理情報12Bから検索すると共に、該因果関係42に対応付けられた一般化IDに対応する一般化表現44を一般化管理情報12Eから検索する。そして、情報処理装置10の制御部18は、検索した因果関係42および一般化表現44を含む文書40を、文書管理情報12Aに登録されている複数の文書40から検索する。
このため、情報処理装置10では、入力された検索クエリまたは該検索クエリに対する一般化表現44を含む文書40を、文書管理情報12Aから検索することができる。
このため、情報処理装置10は、検索クエリを含む文書40の属するカテゴリに依存せず、複数種類のカテゴリに属する複数種類の文書40から、入力された検索クエリに関する文書40を検索することができる。
次に、情報処理装置10が実行する情報処理の流れの一例を説明する。
図15は、本実施形態の情報処理装置10が実行する情報処理の流れの一例を示す、フローチャートである。
対象文書取得部22Aは、端末装置30から文書IDを受付ける(ステップS100)。対象文書取得部22Aは、ステップS100で受付けた文書ID対応する文書40を文書管理情報12Aから読取ることで、該文書40を対象文書41として取得する(ステップS102)。
次に、因果関係取得部22Bが、ステップS100で受付けた文書IDに対応する因果関係42を、因果関係管理情報12Bから取得する(ステップS104)。ステップS104の処理によって、因果関係取得部22Bは、ステップS102で取得した対象文書41に含まれる1または複数の因果関係42を取得する。なお、上述したように、因果関係取得部22Bは、対象文書41に含まれる複数の因果関係42の内、ユーザによって選択された因果関係42を取得してもよい。
次に、類似表現取得部22Cが、特徴量管理情報12Cを用いて、ステップS104で取得した因果関係42の類似表現43を取得する(ステップS106)。なお、類似表現取得部22Cは、上述したように、優先度判定部22Eによる優先度の判定結果を用いて、類似表現43を取得してもよい。また、上述したように、類似表現取得部22Cは、予め定められた品詞の類似表現43を取得してもよい。
次に、共起語取得部22Fが、ステップS102で取得した対象文書41に含まれる因果関係42を構成するワードの共起語を、共起管理情報12Dから取得する(ステップS108)。なお、上述したように、ステップS108の処理は省略してもよい。
次に、表示制御部22Gは、表示画面50を端末装置30のUI部34に表示する(ステップS110)。表示画面50は、ステップS104で取得した因果関係42、および、ステップS106で取得した類似表現43、を含む。また、上述したように、表示画面50は、因果関係42および類似表現43に加えて、ステップS108で取得した共起語45や、対象文書41などを更に含んでいてもよい。
ユーザは、表示画面50に表示された因果関係42、類似表現43、対象文書41、および共起語45を視認しながら、因果関係42の一般化表現44を入力または選択する。変換支援処理部22は、端末装置30から一般化表現44を受付けたと判断するまで否定判断(ステップS112:No)を繰返す。変換支援処理部22は、端末装置30から一般化表現44を受付けたと判断すると(ステップS112:Yes)、ステップS114へ進む。
ステップS112で肯定判断した場合(ステップS112:Yes)、登録部22Iは、入力または選択された一般化表現44と、該一般化表現44の入力時に処理対象とされていた因果関係42の因果関係IDと、を端末装置30から受付ける。
登録部22Iは、ステップS112で受付けた一般化表現44を、該一般化表現44の入力または選択時に処理対象とされていた因果関係42の因果関係IDに対応付けて、因果関係管理情報12Bおよび一般化管理情報12Eへ登録する(ステップS114)。そして、本ルーチンを終了する。
なお、ステップS104で因果関係取得部22Bが複数の因果関係42を取得した場合には、複数の因果関係42をUI部34へ表示し、ユーザによって選択された因果関係42について、上記ステップS106〜ステップS114の処理を実行してもよい。
以上説明したように、本実施形態の情報処理装置10は、因果関係取得部22Bと、類似表現取得部22Cと、取得部22Dと、を備える。因果関係取得部22Bは、因果関係管理情報12Bから、特定の文書40である対象文書41に含まれる因果関係42を取得する。因果関係管理情報12Bには、1または複数の文書40から抽出された、関係を有する第1要素(原因42A)と第2要素(結果42B)との組からなる1または複数の因果関係42が登録されている。類似表現取得部22Cは、特徴量管理情報12Cに基づいて、対象文書41に含まれる因果関係42の類似表現43を取得する。類似表現取得部22Cには、1または複数の文書40に含まれる複数のワードの各々の特徴量が登録されている。取得部22Dは、対象文書41に含まれる因果関係42および類似表現43に基づいて、対象文書41に含まれる因果関係42の一般化表現44を取得する。
ここで、従来技術では、一般化された表現の因果関係を得るために、重要語辞書および一般化辞書を予め用意する必要があり、これらの辞書のメンテナンスが必要であった。また、カテゴリの異なる複数の文書から抽出された因果関係の一般化表現を得るためには、単なる変換ではなく、ユーザが因果関係の有する意味を考慮して変換する必要があった。このため、従来技術では、対象文書に含まれる因果関係の一般化表現への変換効率の向上を図ることが困難な場合があった。
一方、本実施形態の情報処理装置10では、対象文書41の因果関係42を因果関係管理情報12Bから取得する。また、本実施形態の情報処理装置10では、該因果関係42の類似表現43を特徴量管理情報12Cから取得する。そして、情報処理装置10は、対象文書41の因果関係42、および、該因果関係42の類似表現43を用いて、対象文書41に含まれる因果関係42の一般化表現44を取得する。
このため、本実施形態の情報処理装置10では、重要語辞書や一般化辞書などの辞書を用いることなく、対象文書41に含まれる因果関係42に対して、該対象文書41の属するカテゴリに依存しない一般化表現44を容易に取得することができる。
従って、本実施形態の情報処理装置10では、対象文書41に含まれる因果関係42の一般化表現44への変換効率の向上を図ることができる。
また、本実施形態の情報処理装置10では、取得部22Dが、表示制御部22Gと、受付部22Hと、登録部22Iと、を含む。表示制御部22Gは、対象文書41に含まれる因果関係42および類似表現43を含む表示画面50を、UI部34に表示する。受付部22Hは、表示画面50に表示された因果関係42の一般化表現44の入力を受付ける。登録部22Iは、受付けた一般化表現44を因果関係42の一般化表現44として登録する。
このように、本実施形態の情報処理装置10は、対象文書41に含まれる因果関係42と、因果関係42の類似表現43と、を含む表示画面50をUI部34へ表示する。このため、ユーザは、因果関係42および類似表現43を視認することで、他の類似の表現を容易に想起し、一般化表現44を容易に入力することができる。
このため、本実施形態の情報処理装置10は、上記効果に加えて、一般化表現44への変換を効果的に支援することができる。
また、本実施形態の情報処理装置10では、取得部22Dは、取得した一般化表現44を、該一般化表現44の取得時に処理対象とされていた因果関係42の因果関係IDに対応付けて、記憶部12へ記憶する。例えば、登録部22Iは、受付部22Hで受付けた一般化表現44を、一般化管理情報12Eへ登録すると共に、一般化IDを付与して一般化管理情報12Eへ登録する。また、登録部22Iは、一般化管理情報12Eへ登録した一般化表現44の一般化IDを、該一般化表現44の入力または選択時に処理対象とされていた因果関係42の因果関係IDに対応付けて、因果関係管理情報12Bへ登録する(図5参照)。
このため、情報処理装置10は、入力された検索クエリを含む文書40の属するカテゴリに依存せず、複数種類のカテゴリに属する複数種類の文書40から、入力された検索クエリに関する文書40を検索することができる。
ここで、文書40がトラブルの事例データである場合を想定する。トラブル回避のためには、ユーザは、過去のトラブルを把握し、同じトラブルを繰り返さないようにすることが重要である。例えば、火力、水力、原子力発電所、ビル空調管理システム、上下水道管理システム等に用いられる製品の場合、耐用年数が長いため、一人の設計者が関わる新規製品設計の数が限られている。
このため、従来では、過去のトラブルやその対策については、ベテランの設計者の知見に頼るところが大きかった。このため、従来では、若手設計者への指導という形で継承できなければ、必要な知見が失われてしまうリスクがあった。
そこで、近年では、過去に生じたトラブルの現象、原因、および対策などの事例データ(文書)をデータベース化しておき、新規に製品設計を行う際に、既存の類似製品で生じた過去の文書を参照する検索システムが導入されている。
しかし、従来の検索システムは、データベースに登録されている全ての文書を検索対象とし、入力された検索クエリを含む文書を検索するため、意図しない文書が大量に検索される場合があった。このため、従来では、大量に得られた検索結果の中からから、ユーザが必要とする文書を選択するのは時間を要する場合があった。また、設計経験の少ない若手設計者が、従来の検索システムを用いて文書を検索する場合、検索された文書が現在の設計に関連する文書か否かを判断することは困難な場合があった。また、従来では、入力された検索クエリを含む文書しか検索されないため、表記の異なる同義の単語を含む文書は検索されなかった。
また、カテゴリが異なる場合、意味が類似する単語であっても、異なる表記がなされる場合がある。このため、従来技術では、同義語辞書などを利用した場合であっても、意図する文書を検索することが困難な場合があった。
また、上述したように、重要語辞書および一般化辞書を予め用意する従来技術では、これらの辞書のメンテナンスが必要であった。また、従来技術では、カテゴリの異なる複数の文書から抽出された因果関係の一般化表現を得るためには、単なる変換ではなく、ユーザが因果関係の有する意味を考慮して変換する必要があった。
このため、従来技術では、入力された検索クエリを含む文書40の属するカテゴリに依存せず、複数種類のカテゴリに属する複数種類の文書40から、入力された検索クエリに関する文書40を検索することは困難であった。
一方、本実施形態の情報処理装置10では、取得部22Dが、因果関係取得部22Bによって取得された因果関係42、および、類似表現取得部22Cによって取得された類似表現43に基づいて、因果関係42の一般化表現44を取得する。そして、取得部22Dは、取得した一般化表現44を、該一般化表現44の取得時に処理対象とされていた因果関係42の因果関係IDに対応付けて、記憶部12へ記憶する。
このため、本実施形態の情報処理装置10は、上記効果に加えて、検索クエリを含む文書40の属するカテゴリに依存せず、複数種類のカテゴリに属する複数種類の文書40から、入力された検索クエリに関する文書40を検索することができる。
例えば、ユーザが特定の検索クエリを用いて、該検索クエリに関する文書40を検索する場面を想定する。この場合、情報処理装置10の制御部18では、受付けた検索クエリを含む因果関係42を因果関係管理情報12Bから検索すると共に、該因果関係42に対応付けられた一般化IDに対応する一般化表現44を一般化管理情報12Eから検索する。そして、情報処理装置10の制御部18は、検索した因果関係42および一般化表現44を含む文書40を、文書管理情報12Aに登録されている複数の文書40から検索する。
このように、情報処理装置10では、因果関係42に含まれる原因42Aおよび結果42B、並びに、一般化表現44を、入力された検索クエリの検索対象として用いることができる。このため、情報処理装置10は、ユーザの意図する文書40が検索される可能性を高めることができる。また、本実施形態の情報処理装置10は、因果関係42の類似表現43についても、検索対象とすることができるため、検索クエリとは表現が異なるために検索対象外の文書40とされることを抑制することができる。
(変形例)
上記実施形態では、取得部22Dは、ユーザに対して因果関係42および類似表現43を少なくとも含む表示画面50を提供し、ユーザによって入力または選択された一般化表現44を受付けることで、一般化表現44を取得する形態を一例として説明した。
しかし、取得部22Dは、対象文書41の因果関係42および該因果関係42の類似表現43に基づいて、ユーザの入力を介さずに一般化表現44を取得する形態であってもよい。
図16は、本変形例の情報処理装置11の機能的構成の一例を示すブロック図である。なお、上記実施形態の情報処理装置10と同じ機能および構成の部分には、同じ符号を付与して詳細な説明を省略する。
情報処理装置11は、記憶部13と、UI部14と、通信部16と、制御部17と、を備える。記憶部13と、UI部14と、通信部16と、制御部17とは、バス19を介してデータまたは信号を授受可能に接続されている。
記憶部13は、文書管理情報12Aと、因果関係管理情報12Bと、特徴量管理情報12Cと、共起管理情報12Dと、一般化管理情報12Eと、学習モデル12Fと、を記憶する。すなわち、記憶部13は、更に学習モデル12Fを記憶する点以外は、上記実施形態の記憶部12と同様である。
学習モデル12Fは、対象文書41に含まれる因果関係42および類似表現43から、該因果関係42の一般化表現44を取得するためのモデルである。学習モデル12Fは、後述するモデル学習部20Cによって学習される。
制御部17は、学習部21と、変換支援処理部23と、を備える。学習部21は、因果関係学習部20A、特徴量学習部20B、およびモデル学習部21Cを備える。学習部21は、モデル学習部21Cを更に備える点以外は、上記実施形態の学習部20と同様である。
モデル学習部21Cは、学習モデル12Fを学習する。例えば、学習部21Fは、因果関係42と一般化表現44との組を学習データとして用い、該学習データから該因果関係42の一般化表現44を取得するためのモデルを、公知の機械学習を用いて学習する。なお、モデル学習部21Cは、学習データとして、因果関係42、類似表現43、因果関係42の共起語45、および正解である一般化表現44を用いてもよい。
変換支援処理部23は、対象文書取得部22Aと、因果関係取得部22Bと、類似表現取得部22Cと、取得部23Dと、を備える。変換支援処理部23は、取得部22Dに代えて取得部23Dを備える点以外は、上記実施形態の変換支援処理部22と同様である。
取得部23Dは、因果関係取得部22Bで取得した因果関係42と、類似表現取得部22Cで取得した類似表現43と、を入力データとして学習モデル12Fへ入力する。この処理により、取得部23Dは、学習モデル12Fからの出力データとして、一般化表現44を取得する。
なお、取得部23Dは、上記実施形態の情報処理装置10の取得部22Dと同様に、共起語取得部22Fを備えた構成であってもよい。この場合、取得部23Dは、因果関係取得部22Bで取得した因果関係42と、類似表現取得部22Cで取得した類似表現43と、共起語取得部22Fで取得した共起語45と、を入力データとして、学習モデル12Fへ入力すればよい。この処理により、取得部23Dは、学習モデル12Fからの出力データとして、一般化表現44を取得する。
このように、取得部23Dは、対象文書41に含まれる因果関係42および該因果関係42の類似表現43から、学習モデル12Fを用いて、該因果関係42の一般化表現44を取得してもよい。
次に、上記実施形態および変形例における情報処理装置10、情報処理装置11、および端末装置30の、ハードウェア構成の一例を説明する。
図17は、上記実施形態および変形例に係る情報処理装置10、情報処理装置11、および端末装置30の、ハードウェア構成図の一例である。
情報処理装置10、情報処理装置11、および端末装置30は、CPU86などの制御装置と、ROM(Read Only Memory)88やRAM(Random Access Memory)90やHDD(ハードディスクドライブ)92などの記憶装置と、各種機器とのインターフェースであるI/F部82と、出力情報などの各種情報を出力する出力部80と、ユーザによる操作を受付ける入力部94と、各部を接続するバス96とを備えており、通常のコンピュータを利用したハードウェア構成となっている。
情報処理装置10、情報処理装置11、および端末装置30では、CPU86が、ROM88からプログラムをRAM90上に読み出して実行することにより、上記各部がコンピュータ上で実現される。
なお、情報処理装置10、情報処理装置11、および端末装置30で実行される上記各処理を実行するためのプログラムは、HDD92に記憶されていてもよい。また、情報処理装置10、情報処理装置11、および端末装置30で実行される上記各処理を実行するためのプログラムは、ROM88に予め組込まれて提供されていてもよい。
また、情報処理装置10、情報処理装置11、および端末装置30で実行される上記処理を実行するためのプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されてコンピュータプログラムプロダクトとして提供されるようにしてもよい。また、情報処理装置10、情報処理装置11、および端末装置30で実行される上記処理を実行するためのプログラムを、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、情報処理装置10、情報処理装置11、および端末装置30で実行される上記処理を実行するためのプログラムを、インターネットなどのネットワーク経由で提供または配布するようにしてもよい。
なお、上記には、本発明の実施形態および変形例を説明したが、上記実施形態および変形例は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 情報処理システム
10、11 情報処理装置
22A 対象文書取得部
22B 因果関係取得部
22C 類似表現取得部
22E 優先度判定部
22D、23D 取得部
22F 共起語取得部
22G 表示制御部
22H 受付部
22I 登録部
30 端末装置
40 文書
41 対象文書
42 因果関係
43 類似表現
44 一般化表現
45 共起語

Claims (13)

  1. 1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得する因果関係取得部と、
    1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得する類似表現取得部と、
    前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得する取得部と、
    を備える情報処理装置。
  2. 前記取得部は、
    前記対象文書に含まれる前記因果関係および前記類似表現を含む表示画面を表示部に表示する表示制御部と、
    前記表示画面に表示された前記因果関係の前記一般化表現の入力を受付ける受付部と、
    受付けた前記一般化表現を該因果関係の前記一般化表現として登録する登録部と、
    を有する、
    請求項1に記載の情報処理装置。
  3. 前記表示制御部は、
    前記対象文書に含まれる前記因果関係、前記類似表現、および、該因果関係の前記一般化表現の候補の選択画面、を含む前記表示画面を前記表示部に表示し、
    前記受付部は、
    前記選択画面の前記候補から選択された前記一般化表現の入力を受付ける、
    請求項2に記載の情報処理装置。
  4. 前記取得部は、
    前記対象文書に含まれる前記因果関係および前記類似表現から該因果関係の前記一般化表現を取得するための学習モデルを用いて、該因果関係の前記一般化表現を取得する、
    請求項1に記載の情報処理装置。
  5. 前記類似表現取得部は、
    前記特徴量管理情報に登録されているワードの内、前記対象文書における前記因果関係を構成するワードの各々に前記特徴量が類似するワードの群を、前記因果関係の前記類似表現として取得する、
    請求項1〜請求項4の何れか1項に記載の情報処理装置。
  6. 前記特徴量管理情報に登録されているワードの各々の優先度を判定する優先度判定部を備え、
    前記類似表現取得部は、
    前記対象文書における前記因果関係を構成するワードの各々に前記特徴量が類似する他のワードの内、優先度が予め定められた第1優先度より高いワードの群を、前記因果関係の前記類似表現として取得する、
    請求項1〜請求項5の何れか1項に記載の情報処理装置。
  7. 前記優先度判定部は、
    前記対象文書が属するカテゴリを特定し、特定した該カテゴリ以外の他のカテゴリに属する前記文書に多く含まれるワードほど、高い優先度を判定する、
    請求項6に記載の情報処理装置。
  8. 前記類似表現取得部は、
    前記特徴量管理情報に登録されているワードの内、前記対象文書における前記因果関係を構成する予め定められた品詞のワードの各々に前記特徴量が類似するワードの群を、前記因果関係の前記類似表現として取得する、
    請求項1〜請求項7の何れか1項に記載の情報処理装置。
  9. 前記対象文書に含まれる前記因果関係を構成するワードに関する共起語を取得する共起語取得部を備え、
    前記取得部は、
    前記対象文書に含まれる前記因果関係、前記類似表現、および前記共起語、に基づいて、前記一般化表現を取得する、
    請求項1〜請求項8の何れか1項に記載の情報処理装置。
  10. 前記共起語取得部は、
    複数のワードの各々の前記共起語を登録した共起管理情報における、前記対象文書に含まれる前記因果関係を構成するワードに関する前記共起語の内、選択を受付けたワードに対応する前記共起語を取得する、
    請求項9に記載の情報処理装置。
  11. 前記因果関係取得部は、
    前記因果関係管理情報から取得した複数の前記因果関係の内、選択された前記因果関係を取得する、
    請求項1〜請求項10の何れか1項に記載の情報処理装置。
  12. 情報処理装置と、前記情報処理装置と通信する端末装置と、を備えた情報処理システムであって。
    前記情報処理装置は、
    1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得する因果関係取得部と、
    1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得する類似表現取得部と、
    前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得する取得部と、
    を備え、
    前記取得部は、
    前記対象文書に含まれる前記因果関係および前記類似表現を含む表示画面を前記端末装置の表示部に表示する表示制御部と、
    前記表示画面に表示された前記因果関係の前記一般化表現の入力を受付ける受付部と、
    受付けた前記一般化表現を該因果関係の前記一般化表現として登録する登録部と、
    を有する、
    情報処理システム。
  13. 1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得するステップと、
    1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得するステップと、
    前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得するステップと、
    をコンピュータに実行させるための情報処理プログラム。
JP2020007504A 2020-01-21 2020-01-21 情報処理装置、情報処理システム、および情報処理プログラム Active JP7305566B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020007504A JP7305566B2 (ja) 2020-01-21 2020-01-21 情報処理装置、情報処理システム、および情報処理プログラム
US17/005,420 US11599569B2 (en) 2020-01-21 2020-08-28 Information processing device, information processing system, and computer program product for converting a causal relationship into a generalized expression

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020007504A JP7305566B2 (ja) 2020-01-21 2020-01-21 情報処理装置、情報処理システム、および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021114234A true JP2021114234A (ja) 2021-08-05
JP7305566B2 JP7305566B2 (ja) 2023-07-10

Family

ID=76857023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020007504A Active JP7305566B2 (ja) 2020-01-21 2020-01-21 情報処理装置、情報処理システム、および情報処理プログラム

Country Status (2)

Country Link
US (1) US11599569B2 (ja)
JP (1) JP7305566B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11567946B2 (en) 2020-09-16 2023-01-31 Kabushiki Kaisha Toshiba Document search apparatus and document search method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113806452B (zh) * 2021-09-17 2022-10-25 北京百度网讯科技有限公司 信息处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293537A (ja) * 1999-04-09 2000-10-20 Hitachi Ltd データ分析支援方法および装置
JP2009059323A (ja) * 2007-09-04 2009-03-19 Omron Corp 知識生成システム
JP2015032287A (ja) * 2013-08-07 2015-02-16 日本電信電話株式会社 行動目的抽出方法及び装置
JP2018190077A (ja) * 2017-04-28 2018-11-29 日本放送協会 発話生成装置、発話生成方法及び発話生成プログラム
JP2019128925A (ja) * 2018-01-26 2019-08-01 株式会社日立製作所 事象提示システムおよび事象提示装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5034580B2 (ja) 2007-03-15 2012-09-26 オムロン株式会社 因果推論装置、その制御プログラムおよび制御方法
US9886427B2 (en) * 2010-11-01 2018-02-06 Koninklijke Philips N.V. Suggesting relevant terms during text entry
JP5683758B1 (ja) * 2013-07-19 2015-03-11 楽天株式会社 レコメンド情報提示装置、レコメンド情報提示方法及びレコメンド情報提示プログラム
US20150310003A1 (en) * 2014-04-28 2015-10-29 Elwha Llc Methods, systems, and devices for machines and machine states that manage relation data for modification of documents based on various corpora and/or modification data
US10504030B2 (en) * 2015-07-25 2019-12-10 The Boeing Company Systems, methods, and computer program products for generating a query specific Bayesian network
US11068554B2 (en) * 2019-04-19 2021-07-20 Microsoft Technology Licensing, Llc Unsupervised entity and intent identification for improved search query relevance

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293537A (ja) * 1999-04-09 2000-10-20 Hitachi Ltd データ分析支援方法および装置
JP2009059323A (ja) * 2007-09-04 2009-03-19 Omron Corp 知識生成システム
JP2015032287A (ja) * 2013-08-07 2015-02-16 日本電信電話株式会社 行動目的抽出方法及び装置
JP2018190077A (ja) * 2017-04-28 2018-11-29 日本放送協会 発話生成装置、発話生成方法及び発話生成プログラム
JP2019128925A (ja) * 2018-01-26 2019-08-01 株式会社日立製作所 事象提示システムおよび事象提示装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11567946B2 (en) 2020-09-16 2023-01-31 Kabushiki Kaisha Toshiba Document search apparatus and document search method

Also Published As

Publication number Publication date
US20210224307A1 (en) 2021-07-22
US11599569B2 (en) 2023-03-07
JP7305566B2 (ja) 2023-07-10

Similar Documents

Publication Publication Date Title
US10303683B2 (en) Translation of natural language questions and requests to a structured query format
US11210468B2 (en) System and method for comparing plurality of documents
US9910848B2 (en) Generating semantic variants of natural language expressions using type-specific templates
CN104813275B (zh) 用于预测文本的方法和系统
US9928235B2 (en) Type-specific rule-based generation of semantic variants of natural language expression
Shaalan et al. A hybrid approach to Arabic named entity recognition
US8630989B2 (en) Systems and methods for information extraction using contextual pattern discovery
US10073827B2 (en) Method and system to generate a process flow diagram
US9767094B1 (en) User interface for supplementing an answer key of a question answering system using semantically equivalent variants of natural language expressions
US10410139B2 (en) Named entity recognition and entity linking joint training
CN105210057B (zh) 多语言商业标记管理以及音译合成
Mohanty et al. Resumate: A prototype to enhance recruitment process with NLP based resume parsing
Singh et al. A decision tree based word sense disambiguation system in Manipuri language
WO2021106380A1 (ja) プログラムコード自動生成装置及びプログラム
US11580100B2 (en) Systems and methods for advanced query generation
US20220358379A1 (en) System, apparatus and method of managing knowledge generated from technical data
CN116089873A (zh) 模型训练方法、数据分类分级方法、装置、设备及介质
US11599569B2 (en) Information processing device, information processing system, and computer program product for converting a causal relationship into a generalized expression
CN116797195A (zh) 工单处理方法、装置、计算机设备和计算机可读存储介质
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
CN112529743B (zh) 合同要素抽取方法、装置、电子设备及介质
Oudah et al. Person name recognition using the hybrid approach
Ariffin et al. Improved POS Tagging Model for Malay Twitter Data based on Machine Learning Algorithm
WO2019246252A1 (en) Systems and methods for identifying and linking events in structured proceedings
CN115714002A (zh) 抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230628

R151 Written notification of patent or utility model registration

Ref document number: 7305566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151