JP5699789B2 - 情報処理装置、情報処理方法、プログラム及び情報処理システム - Google Patents
情報処理装置、情報処理方法、プログラム及び情報処理システム Download PDFInfo
- Publication number
- JP5699789B2 JP5699789B2 JP2011105034A JP2011105034A JP5699789B2 JP 5699789 B2 JP5699789 B2 JP 5699789B2 JP 2011105034 A JP2011105034 A JP 2011105034A JP 2011105034 A JP2011105034 A JP 2011105034A JP 5699789 B2 JP5699789 B2 JP 5699789B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- information
- text
- sentence
- search condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 122
- 238000003672 processing method Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims description 153
- 238000004458 analytical method Methods 0.000 claims description 142
- 238000000034 method Methods 0.000 claims description 75
- 238000000605 extraction Methods 0.000 claims description 55
- 230000008569 process Effects 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 41
- 230000007704 transition Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 14
- 238000007619 statistical method Methods 0.000 claims description 6
- 239000002243 precursor Substances 0.000 claims description 3
- 238000003860 storage Methods 0.000 description 37
- 238000004891 communication Methods 0.000 description 31
- 230000000877 morphologic effect Effects 0.000 description 18
- 238000013519 translation Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000011282 treatment Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 208000010125 myocardial infarction Diseases 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000002861 ventricular Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 210000005240 left ventricle Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)第1の実施形態
(1−1)目的
(1−2)情報処理装置の構成について
(1−3)情報検索処理の具体例
(1−4)情報処理方法の流れについて
(1−5)第1変形例
(2)本開示の実施形態に係る情報処理装置のハードウェア構成について
(3)まとめ
以下の実施形態では、検索対象テキストとして、主に医療情報に関する各種テキストデータを例にとって説明を行うものとする。このような医療情報に関するテキストデータとしては、電子カルテ、クリニカルパス、退院サマリ(退院時要約)のような電子化された診療情報や、インターネット等のネットワーク上に存在する学会等における診療報告などの数多くの電子化されたテキストデータ等がある。これらの医療情報テキストは、小説などの一般的なテキストとは異なり、時間の流れ(時系列)に対して事実の記述が整理された形の文章であるという特徴を有する。
以下では、本開示の第1の実施形態に係る情報処理装置及び情報処理方法について説明するに先立ち、まず、本開示の実施形態の目的について簡単に説明するものとする。
まず、図1を参照しながら、本開示の第1の実施形態に係る情報処理装置の構成について、詳細に説明する。図1は、本実施形態に係る情報処理装置10の構成を示したブロック図である。
以下では、再び図1に戻って、本実施形態に係る情報処理装置10の構成について説明する。
以下では、再び図1に戻って、本実施形態に係る情報処理装置10の構成について説明する。
続いて、図4〜図19を参照しながら、本実施形態に係る情報処理装置10が実施する情報検索処理について、具体的に説明する。
まず、検索対象データの生成処理について、具体的に説明する。
なお、以下の説明では、電子カルテやクリニカルパスや退院サマリに代表されるような電子化された診療情報や、ウェブ上に存在する学会等における診療報告等の数多くの電子化された医療テキストに着目する。
テキスト構造抽出部107は、図7に示したように、「左心室前壁の」という語句を、かかる語句の上位概念である「左心室」という語句に関連づけられている言語コードを用いて、「T32600」と置換する。また、かかる国際医療コードを利用することで、「左心室前壁の」という句が「名詞句」であるという情報を保持しなくとも良くなるため、かかる部分に対応する句情報を、「(T32600、連体修飾)」という構造化データに変換する。
同様に、テキスト構造抽出部107は、「心筋梗塞を」という句を、「[ICD−9=410、M54700]」という識別番号に置換し、「入院した。」という句を、「P0020」という識別番号に置換する。
続いて、以上説明したような処理により生成された検索対象データの活用に関して、具体的に説明する。
まず、第一の活用方法である自然文入力による検索処理について、具体的に説明する。
本実施形態に係る情報検索方法は、上記のように、自然文による検索により、情報の更なる絞り込みを実現可能な自然文によるテキスト検索を実現可能である。また、本実施形態に係る情報処理装置では、検索条件情報として、複数の文章を設定することもできる。
また、本実施形態に係る情報検索方法を利用することで、例えば、症例の経過予測や、処置方法の検索を実施することも可能である。
次に、本実施形態に係る情報検索方法の更に別の活用方法である予測分析について説明する。すなわち、上記では、本実施形態に係る情報検索方法の活用方法である予測表示に関して説明したが、他の類似ケースに関しては、類似例におけるその後の処置を表示するだけでなく、その後の処置の統計情報を提示することも可能である。
続いて、図20〜図22を参照しながら、本実施形態に係る情報処理装置10で実施される情報処理方法の流れについて、簡単に説明する。
まず、図20を参照しながら、検索対象データの生成処理の流れの一例について、簡単に説明する。
情報処理装置10の検索対象テキスト取得部103は、まず、検索対象テキストの基となる非構造化テキストのデータを、当該データが存在する場所から取得し(ステップS101)、統括制御部101に出力する。
次に、図21を参照しながら、検索対象テキストの検索処理の流れの一例について、簡単に説明する。
まず、情報処理装置10の検索条件情報取得部111は、ユーザが各種の入力装置を介して入力した検索条件情報を取得して(ステップS121)、取得した検索条件情報を統括制御部101に出力する。
次に、図22を参照しながら、検索対象テキストの検索結果に含まれるトピックに対する統計処理の流れの一例について、簡単に説明する。
まず、情報処理装置10の検索条件情報取得部111は、ユーザが各種の入力装置を介して入力した検索条件情報を取得して(ステップS141)、取得した検索条件情報を統括制御部101に出力する。
以上説明したように、本実施形態に係る情報処理装置10は、形態素解析、構文解析及び意味解析のような各種解析機能及び翻訳機能を含む言語処理機能と、検索対象テキストを利用して、情報の検索に利用される検索対象データを生成する検索対象データ生成機能と、検索条件情報に基づいて検索対象テキストを検索する情報検索機能という、主に3つの機能を有する装置である。
次に、図24を参照しながら、本開示の実施形態に係る情報処理装置10のハードウェア構成について、詳細に説明する。図24は、本開示の実施形態に係る情報処理装置10のハードウェア構成を説明するためのブロック図である。
以上説明したように、本開示の実施形態に係る情報処理装置及び情報処理方法によれば、自然文を入力することにより、精度の高いテキストデータの検索を自然なインターフェースにより実現することができ、検索論理式を自然文から自動的に生成することが可能となる。また、カルテや診療データ等のようなデータに類似するものの検索を行う場合には、時系列を考慮した検索を行い前後関係が類似するものをより確からしいものとして検索することができる。
(1)格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得する検索条件情報取得部と、前記検索条件情報に対して言語解析処理を行う言語処理部と、前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出する構造抽出部と、前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成する検索式生成部と、生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索する検索部と、を備える、情報処理装置。
(2)前記検索部は、前記検索条件情報に複数の文が含まれる場合に、前記検索条件情報に含まれる各文の述語構造の推移に基づいて、前記検索対象テキストの中から前記述語構造の推移に適合するテキストを検索する、(1)に記載の情報処理装置。
(3)単語又は単語群が当該単語又は単語群に固有の識別情報である言語コードと関連付けられている言語コード情報に基づいて、前記検索対象テキストのうち前記言語コード情報に含まれる単語又は単語群が、対応する前記言語コードに置換されるとともに、前記言語コードに置換された前記単語又は単語群の前記検索対象テキスト中における格が、前記言語コードと関連付けられることにより、前記検索対象テキストの述語構造が表記されており、前記情報処理装置は、前記言語コード情報を利用して、前記検索対象テキストの検索処理に用いられる検索対象データを生成する検索対象データ生成部を更に備え、前記検索対象データ生成部は、前記検索対象テキストを構成する文のうち前記言語コードを含む文に対応する述語構造が、当該文の出現順に蓄積された時系列事実データを生成するとともに、前記検索対象テキストに付与された固有の識別情報であるテキスト識別情報と、前記検索対象テキストを構成するそれぞれの文に付与された固有の識別情報であるセンテンス識別情報と、を利用して、前記言語コードに対して、当該言語コードを含む文を特定するための前記テキスト識別情報及び前記センテンス識別情報が関連付けられた検索インデックスを生成する、(1)又は(2)に記載の情報処理装置。
(4)前記検索式生成部は、前記言語コード情報を利用し、前記検索条件情報に含まれるテキストのうち当該言語コード情報に含まれる単語又は単語群を前記言語コードに置換して前記検索式を生成し、前記検索部は、前記検索式に含まれる前記言語コードを利用して前記検索インデックスを検索し、当該検索式に含まれる言語コードを含む文を、候補データとして抽出する、(3)に記載の情報処理装置。
(5)前記情報処理装置は、前記検索部により抽出された前記候補データの中から、検索結果として出力するテキストを選択する選択部を更に備え、前記選択部は、前記検索条件情報に含まれるテキストの文構造と、前記候補データそれぞれの文構造との類似度合いに応じて、前記検索結果として出力するテキストを選択する、(1)〜(4)のいずれか1項に記載の情報処理装置。
(6)前記選択部は、前記検出結果として選択したテキストのうち、前記検索式に類似する文に対して先駆する文、又は、前記検索式に類似する文に対して後続する文を、前記検索結果として出力する、(5)に記載の情報処理装置。
(7)前記選択部は、前記検索結果として出力したテキストもしくは前記検索条件情報のうち、ユーザにより指定された文に対して先駆又は後続する文、又は、前記検索条件情報を構成するそれぞれの文に存在する前記言語コードに対応したトピックに関して統計解析を実施し、得られた統計解析結果を出力する、(5)に記載の情報処理装置。
(8)前記選択部は、前記ユーザにより指定された文に対して先駆又は後続する文、又は、前記検索条件情報を構成するそれぞれの文のうち、対象格又は述部に前記言語コードが含まれるものに対して、前記統計解析を実施する、(7)に記載の情報処理装置。
(9)前記情報処理装置は、格構造に応じた構造化がなされていない非構造化テキストを取得した場合、前記言語処理部による言語処理結果、及び、前記構造抽出部によって抽出された文構造に基づいて前記非構造化テキストを構造化することにより、前記検索対象テキストを生成する、(3)に記載の情報処理装置。
(10)前記情報処理装置は、前記検索対象テキストの中から検出された前記検出結果の表示制御を行う表示制御部を更に備え、前記表示制御部は、前記検出結果のうち前記検索条件情報と文構造の類似する箇所を強調して表示させる、(1)〜(9)のいずれか1項に記載の情報処理装置。
(11)格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得することと、前記検索条件情報に対して言語解析処理を行うことと、前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出することと、前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成することと、生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索することと、を含む、情報処理方法。
(12)コンピュータに、格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得する検索条件情報取得機能と、前記検索条件情報に対して言語解析処理を行う言語処理機能と、前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出する構造抽出機能と、前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成する検索式生成機能と、生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索する検索機能と、を実現させるためのプログラム。
(13)格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得する検索条件情報取得部と、前記検索条件情報に対して言語解析処理を行う言語処理部と、前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出する構造抽出部と、前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成する検索式生成部と、生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索する検索部と、を備える情報検索サーバと、前記検索条件情報を生成して、生成した前記検索条件情報を前記情報検索サーバへと出力するユーザ操作端末と、を有し、前記情報検索サーバは、前記ユーザ操作端末から出力された前記検索条件情報に対する検索結果を当該ユーザ操作端末に出力する、情報処理システム。
101 統括制御部
103 検索対象テキスト取得部
105 言語処理部
107 テキスト構造抽出部
109 検索対象データ生成部
111 検索条件情報取得部
113 検索論理式生成部
115 データ検索部
117 表示データ選択部
119 表示制御部
121 記憶部
131 形態素解析部
133 構文解析部
135 意味解析部
137 テキスト翻訳部
139 辞書ファイル記憶部
141 時系列事実データ生成部
143 検索インデックス生成部
Claims (12)
- 格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得する検索条件情報取得部と、
前記検索条件情報に対して言語解析処理を行う言語処理部と、
前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出する構造抽出部と、
前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成する検索式生成部と、
生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索する検索部と、
単語又は単語群が当該単語又は単語群に固有の識別情報である言語コードと関連付けられている言語コード情報を利用して、前記検索対象テキストの検索処理に用いられる検索対象データを生成する検索対象データ生成部と、
を備え、
前記言語コード情報に基づいて、前記検索対象テキストのうち前記言語コード情報に含まれる単語又は単語群が、対応する前記言語コードに置換されるとともに、前記言語コードに置換された前記単語又は単語群の前記検索対象テキスト中における格が、前記言語コードと関連付けられることにより、前記検索対象テキストの述語構造が表記されており、
前記検索対象データ生成部は、
前記検索対象テキストを構成する文のうち前記言語コードを含む文に対応する述語構造が、当該文の出現順に蓄積された時系列事実データを生成するとともに、
前記検索対象テキストに付与された固有の識別情報であるテキスト識別情報と、前記検索対象テキストを構成するそれぞれの文に付与された固有の識別情報であるセンテンス識別情報と、を利用して、前記言語コードに対して、当該言語コードを含む文を特定するための前記テキスト識別情報及び前記センテンス識別情報が関連付けられた検索インデックスを生成する、情報処理装置。 - 前記検索部は、前記検索条件情報に複数の文が含まれる場合に、前記検索条件情報に含まれる各文の述語構造の推移に基づいて、前記検索対象テキストの中から前記述語構造の推移に適合するテキストを検索する、請求項1に記載の情報処理装置。
- 前記検索式生成部は、前記言語コード情報を利用し、前記検索条件情報に含まれるテキストのうち当該言語コード情報に含まれる単語又は単語群を前記言語コードに置換して前記検索式を生成し、
前記検索部は、前記検索式に含まれる前記言語コードを利用して前記検索インデックスを検索し、当該検索式に含まれる言語コードを含む文を、候補データとして抽出する、請求項1に記載の情報処理装置。 - 前記情報処理装置は、前記検索部により抽出された前記候補データの中から、検索結果として出力するテキストを選択する選択部を更に備え、
前記選択部は、前記検索条件情報に含まれるテキストの文構造と、前記候補データそれぞれの文構造との類似度合いに応じて、前記検索結果として出力するテキストを選択する、請求項3に記載の情報処理装置。 - 前記選択部は、前記検索結果として選択したテキストのうち、前記検索式に類似する文に対して先駆する文、又は、前記検索式に類似する文に対して後続する文を、前記検索結果として出力する、請求項4に記載の情報処理装置。
- 前記選択部は、前記検索結果として出力したテキストもしくは前記検索条件情報のうち、ユーザにより指定された文に対して先駆又は後続する文、又は、前記検索条件情報を構成するそれぞれの文に存在する前記言語コードに対応したトピックに関して統計解析を実施し、得られた統計解析結果を出力する、請求項4に記載の情報処理装置。
- 前記選択部は、前記ユーザにより指定された文に対して先駆又は後続する文、又は、前記検索条件情報を構成するそれぞれの文のうち、対象格又は述部に前記言語コードが含まれるものに対して、前記統計解析を実施する、請求項6に記載の情報処理装置。
- 前記情報処理装置は、格構造に応じた構造化がなされていない非構造化テキストを取得した場合、前記言語処理部による言語処理結果、及び、前記構造抽出部によって抽出された文構造に基づいて前記非構造化テキストを構造化することにより、前記検索対象テキストを生成する、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記検索対象テキストの中から検出された検索結果の表示制御を行う表示制御部を更に備え、
前記表示制御部は、前記検索結果のうち前記検索条件情報と文構造の類似する箇所を強調して表示させる、請求項1に記載の情報処理装置。 - 単語又は単語群が当該単語又は単語群に固有の識別情報である言語コードと関連付けられている言語コード情報を利用して、格構造に応じて構造化された検索対象テキストの検索処理に用いられる検索対象データを生成することと、
前記検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得することと、
前記検索条件情報に対して言語解析処理を行うことと、
前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出することと、
前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成することと、
生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索することと、
を含み、
前記言語コード情報に基づいて、前記検索対象テキストのうち前記言語コード情報に含まれる単語又は単語群が、対応する前記言語コードに置換されるとともに、前記言語コードに置換された前記単語又は単語群の前記検索対象テキスト中における格が、前記言語コードと関連付けられることにより、前記検索対象テキストの述語構造が表記されており、
前記検索対象データを生成する際には、
前記検索対象テキストを構成する文のうち前記言語コードを含む文に対応する述語構造が、当該文の出現順に蓄積された時系列事実データが生成されるとともに、
前記検索対象テキストに付与された固有の識別情報であるテキスト識別情報と、前記検索対象テキストを構成するそれぞれの文に付与された固有の識別情報であるセンテンス識別情報と、を利用して、前記言語コードに対して、当該言語コードを含む文を特定するための前記テキスト識別情報及び前記センテンス識別情報が関連付けられた検索インデックスが生成される、情報処理方法。 - コンピュータに、
格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得する検索条件情報取得機能と、
前記検索条件情報に対して言語解析処理を行う言語処理機能と、
前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出する構造抽出機能と、
前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成する検索式生成機能と、
生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索する検索機能と、
単語又は単語群が当該単語又は単語群に固有の識別情報である言語コードと関連付けられている言語コード情報を利用して、前記検索対象テキストの検索処理に用いられる検索対象データを生成する検索対象データ生成機能と、
を実現させ、
前記言語コード情報に基づいて、前記検索対象テキストのうち前記言語コード情報に含まれる単語又は単語群が、対応する前記言語コードに置換されるとともに、前記言語コードに置換された前記単語又は単語群の前記検索対象テキスト中における格が、前記言語コードと関連付けられることにより、前記検索対象テキストの述語構造が表記されており、
前記検索対象データ生成機能は、
前記検索対象テキストを構成する文のうち前記言語コードを含む文に対応する述語構造が、当該文の出現順に蓄積された時系列事実データを生成するとともに、
前記検索対象テキストに付与された固有の識別情報であるテキスト識別情報と、前記検索対象テキストを構成するそれぞれの文に付与された固有の識別情報であるセンテンス識別情報と、を利用して、前記言語コードに対して、当該言語コードを含む文を特定するための前記テキスト識別情報及び前記センテンス識別情報が関連付けられた検索インデックスを生成する、プログラム。 - 格構造に応じて構造化された検索対象テキストを検索するための検索条件を表すテキスト情報である検索条件情報を取得する検索条件情報取得部と、
前記検索条件情報に対して言語解析処理を行う言語処理部と、
前記検索条件情報の言語解析結果を利用して、当該検索条件情報の文構造を抽出する構造抽出部と、
前記検索条件情報の文構造に応じて、前記検索対象テキストを検索するために用いられる前記検索条件情報の文構造を反映した検索式を生成する検索式生成部と、
生成された前記検索式を利用し、前記検索条件情報の文構造に応じて前記検索対象テキストの中から前記検索条件に適合するテキストを検索する検索部と、
単語又は単語群が当該単語又は単語群に固有の識別情報である言語コードと関連付けられている言語コード情報を利用して、前記検索対象テキストの検索処理に用いられる検索対象データを生成する検索対象データ生成部と、
を備え、
前記言語コード情報に基づいて、前記検索対象テキストのうち前記言語コード情報に含まれる単語又は単語群が、対応する前記言語コードに置換されるとともに、前記言語コードに置換された前記単語又は単語群の前記検索対象テキスト中における格が、前記言語コードと関連付けられることにより、前記検索対象テキストの述語構造が表記されており、
前記検索対象データ生成部は、
前記検索対象テキストを構成する文のうち前記言語コードを含む文に対応する述語構造が、当該文の出現順に蓄積された時系列事実データを生成するとともに、
前記検索対象テキストに付与された固有の識別情報であるテキスト識別情報と、前記検索対象テキストを構成するそれぞれの文に付与された固有の識別情報であるセンテンス識別情報と、を利用して、前記言語コードに対して、当該言語コードを含む文を特定するための前記テキスト識別情報及び前記センテンス識別情報が関連付けられた検索インデックスを生成する情報検索サーバと、
前記検索条件情報を生成して、生成した前記検索条件情報を前記情報検索サーバへと出力するユーザ操作端末と、
を有し、
前記情報検索サーバは、前記ユーザ操作端末から出力された前記検索条件情報に対する検索結果を当該ユーザ操作端末に出力する、情報処理システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011105034A JP5699789B2 (ja) | 2011-05-10 | 2011-05-10 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
EP12164283A EP2523126A3 (en) | 2011-05-10 | 2012-04-16 | Information processing apparatus, information processing method, program, and information processing system |
US13/454,791 US20120290561A1 (en) | 2011-05-10 | 2012-04-24 | Information processing apparatus, information processing method, program, and information processing system |
CN201210135871.5A CN102779149B (zh) | 2011-05-10 | 2012-05-03 | 信息处理装置,信息处理方法和信息处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011105034A JP5699789B2 (ja) | 2011-05-10 | 2011-05-10 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012238062A JP2012238062A (ja) | 2012-12-06 |
JP5699789B2 true JP5699789B2 (ja) | 2015-04-15 |
Family
ID=46456302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011105034A Expired - Fee Related JP5699789B2 (ja) | 2011-05-10 | 2011-05-10 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120290561A1 (ja) |
EP (1) | EP2523126A3 (ja) |
JP (1) | JP5699789B2 (ja) |
CN (1) | CN102779149B (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101361190B1 (ko) | 2007-01-22 | 2014-02-21 | 삼성전자주식회사 | 무선 메쉬 네트워크에서 채널을 할당하기 위한 방법 및이를 이용한 통신 디바이스 |
US10157175B2 (en) | 2013-03-15 | 2018-12-18 | International Business Machines Corporation | Business intelligence data models with concept identification using language-specific clues |
US20150309965A1 (en) * | 2014-04-28 | 2015-10-29 | Elwha Llc | Methods, systems, and devices for outcome prediction of text submission to network based on corpora analysis |
US10698924B2 (en) | 2014-05-22 | 2020-06-30 | International Business Machines Corporation | Generating partitioned hierarchical groups based on data sets for business intelligence data models |
CN104050295B (zh) * | 2014-07-01 | 2018-01-02 | 彩带网络科技(北京)有限公司 | 一种交互方法及系统 |
CN104166682B (zh) * | 2014-07-21 | 2018-05-01 | 安徽华贞信息科技有限公司 | 一种基于组合理论的类自然语言的语义信息抽取方法及系统 |
CN104199803B (zh) * | 2014-07-21 | 2017-10-13 | 安徽华贞信息科技有限公司 | 一种基于组合理论的文本信息处理系统及方法 |
US20170154035A1 (en) * | 2014-07-23 | 2017-06-01 | Nec Corporation | Text processing system, text processing method, and text processing program |
US9760353B2 (en) | 2014-12-19 | 2017-09-12 | Signalfx, Inc. | Dynamically changing input data streams processed by data stream language programs |
US10394692B2 (en) | 2015-01-29 | 2019-08-27 | Signalfx, Inc. | Real-time processing of data streams received from instrumented software |
US10002179B2 (en) | 2015-01-30 | 2018-06-19 | International Business Machines Corporation | Detection and creation of appropriate row concept during automated model generation |
US9984116B2 (en) | 2015-08-28 | 2018-05-29 | International Business Machines Corporation | Automated management of natural language queries in enterprise business intelligence analytics |
CN105550261A (zh) * | 2015-12-09 | 2016-05-04 | 国云科技股份有限公司 | 一种基于ibatis的快速检索方法 |
CN107515851B (zh) * | 2016-06-16 | 2021-09-10 | 佳能株式会社 | 用于共指消解、信息提取以及相似文档检索的装置和方法 |
CN108320788A (zh) * | 2017-01-16 | 2018-07-24 | 医渡云(北京)技术有限公司 | 医院业务分析方法及装置 |
CN107341264B (zh) * | 2017-07-19 | 2020-09-25 | 东北大学 | 一种支持自定义实体的电子病历检索系统及方法 |
CN110020006B (zh) * | 2017-07-27 | 2021-04-27 | 北京国双科技有限公司 | 查询语句的生成方法及相关设备 |
CN107562732B (zh) * | 2017-10-26 | 2022-06-14 | 北京康夫子健康技术有限公司 | 电子病历的处理方法及系统 |
JP7101946B2 (ja) * | 2018-07-10 | 2022-07-19 | 株式会社医用工学研究所 | 検索システム |
TWI702537B (zh) * | 2018-09-28 | 2020-08-21 | 智齡科技股份有限公司 | 基於語彙分析之智慧護理文本生成系統以及使用其之智慧護理資訊平台 |
US11210346B2 (en) * | 2019-04-04 | 2021-12-28 | Iqvia Inc. | Predictive system for generating clinical queries |
CN110347785A (zh) * | 2019-05-30 | 2019-10-18 | 平安科技(深圳)有限公司 | 非结构化文书搜索方法、装置、计算机设备和存储介质 |
CN112270167B (zh) * | 2020-10-14 | 2022-02-08 | 北京百度网讯科技有限公司 | 角色标注方法、装置、电子设备和存储介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5933822A (en) | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US6055528A (en) * | 1997-07-25 | 2000-04-25 | Claritech Corporation | Method for cross-linguistic document retrieval |
US6678677B2 (en) * | 2000-12-19 | 2004-01-13 | Xerox Corporation | Apparatus and method for information retrieval using self-appending semantic lattice |
US6766316B2 (en) * | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US7398201B2 (en) * | 2001-08-14 | 2008-07-08 | Evri Inc. | Method and system for enhanced data searching |
US20040167800A1 (en) * | 2003-02-26 | 2004-08-26 | Duke University | Methods and systems for searching, displaying, and managing medical teaching cases in a medical teaching case database |
JP4435144B2 (ja) * | 2006-12-04 | 2010-03-17 | 株式会社東芝 | データ検索システム及びプログラム |
US7890493B2 (en) * | 2007-07-20 | 2011-02-15 | Google Inc. | Translating a search query into multiple languages |
US8209321B2 (en) * | 2007-08-31 | 2012-06-26 | Microsoft Corporation | Emphasizing search results according to conceptual meaning |
CN101796508B (zh) * | 2007-08-31 | 2013-03-06 | 微软公司 | 歧义敏感自然语言处理系统中的共指消解 |
JP4602388B2 (ja) * | 2007-09-19 | 2010-12-22 | 株式会社東芝 | 類似文検索システム及びプログラム |
CN101446944A (zh) * | 2008-12-10 | 2009-06-03 | 苏州大学 | 一种自然语言句子的语义关系树的构造和比较方法 |
JP5439028B2 (ja) * | 2009-05-12 | 2014-03-12 | 株式会社エヌ・ティ・ティ・データ | 情報検索装置、情報検索方法、およびプログラム |
JP5391887B2 (ja) * | 2009-07-13 | 2014-01-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN102012900B (zh) * | 2009-09-04 | 2013-01-30 | 阿里巴巴集团控股有限公司 | 信息检索方法和系统 |
JP2011105034A (ja) | 2009-11-12 | 2011-06-02 | Etsuaki Matsui | 薄型画像表示モニタ車載用支持装置 |
US8375021B2 (en) * | 2010-04-26 | 2013-02-12 | Microsoft Corporation | Search engine data structure |
-
2011
- 2011-05-10 JP JP2011105034A patent/JP5699789B2/ja not_active Expired - Fee Related
-
2012
- 2012-04-16 EP EP12164283A patent/EP2523126A3/en not_active Ceased
- 2012-04-24 US US13/454,791 patent/US20120290561A1/en not_active Abandoned
- 2012-05-03 CN CN201210135871.5A patent/CN102779149B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102779149A (zh) | 2012-11-14 |
CN102779149B (zh) | 2016-12-14 |
JP2012238062A (ja) | 2012-12-06 |
EP2523126A2 (en) | 2012-11-14 |
US20120290561A1 (en) | 2012-11-15 |
EP2523126A3 (en) | 2012-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5699789B2 (ja) | 情報処理装置、情報処理方法、プログラム及び情報処理システム | |
JP6095621B2 (ja) | 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置 | |
US10394851B2 (en) | Methods and systems for mapping data items to sparse distributed representations | |
AU2012235939B2 (en) | Real-time automated interpretation of clinical narratives | |
US9690861B2 (en) | Deep semantic search of electronic medical records | |
JP6461980B2 (ja) | 検索結果におけるコヒーレントな質問回答 | |
US12007939B1 (en) | Method and apparatus for determining search result demographics | |
US9785671B2 (en) | Template-driven structured query generation | |
US20140115001A1 (en) | Structured query generation | |
US20130262449A1 (en) | System and method for search refinement using knowledge model | |
JP2021507350A (ja) | 複雑な回答の補強証拠取り出し | |
US20140108460A1 (en) | Data store organizing data using semantic classification | |
US10970324B2 (en) | System for generation of automated response follow-up | |
US20140108424A1 (en) | Data store organizing data using semantic classification | |
JP2015511746A5 (ja) | ||
US9081847B2 (en) | Data store organizing data using semantic classification | |
JP5497105B2 (ja) | 文書検索装置および方法 | |
TWI427494B (zh) | 雲端架構的專利文件檢索平台、處理方法及其檢索方法 | |
EP2720160A2 (en) | Data store organizing data using semantic classification | |
Dessi | Toward Automatic RDF Property Tagging | |
Górka et al. | Application of semantic networks in natural language issues | |
Atzoria et al. | QA 3: a Natural Language Approach to Statistical Question Answering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140331 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150202 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5699789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |