JPWO2013136634A1 - ドキュメント検索装置およびドキュメント検索方法 - Google Patents
ドキュメント検索装置およびドキュメント検索方法Info
- Publication number
- JPWO2013136634A1 JPWO2013136634A1 JP2014504643A JP2014504643A JPWO2013136634A1 JP WO2013136634 A1 JPWO2013136634 A1 JP WO2013136634A1 JP 2014504643 A JP2014504643 A JP 2014504643A JP 2014504643 A JP2014504643 A JP 2014504643A JP WO2013136634 A1 JPWO2013136634 A1 JP WO2013136634A1
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- result
- unit
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 108
- 230000010354 integration Effects 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 31
- 230000000877 morphologic effect Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 230000007704 transition Effects 0.000 description 10
- 239000010410 layer Substances 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
一方、ベストマッチング検索方式および統計型検索方式の場合には、キーワードに論理的な構造を入れる必要なく検索できるというメリットがある一方、ドキュメント中のキーワードの出現回数が単純にスコア化されたり、出現傾向に応じて重み付けされた値によってスコアが計算されたりするために、ユーザが制御することが難しいというデメリットがある。
論理型検索方式と統計型検索方式を合わせた場合には、たとえば、論理式型検索結果と統計型検索結果のうち文書IDの重なったものだけを最終結果候補としたり、論理式型検索結果と統計型検索結果の文書IDのすべてを最終結果候補とした上で、統計型検索結果のスコアを最終結果の順位付けに使ったりしている。
実施の形態1.
以下、図面を参照して本発明の実施の形態を説明する。
図1は、本実施の形態1に係るドキュメント検索装置の構成を示すブロック図である。
ドキュメント1は、製品の取扱説明書などを電子化したテキストデータである。このドキュメント1は、製品機能などに合わせて章、節、項などの項目にある程度階層化されているものとする。入力解析部2は、ドキュメント1のテキストなどを公知の技術である形態素解析などの方法により、形態素単位に分割する。ドキュメント解析結果3は、入力解析部2によってドキュメント1を形態素に分割したデータである。
収集発話データ6は、ドキュメント1を利用する場合にあらかじめユーザアンケートなどの方法によって聞きたいことを収集した発話データである。収集発話データ6の作成方法は、あらかじめドキュメント1に書かれた製品機能から質問を生成し、それをアンケートなどの形で事前に集めたものを想定する。
収集発話解析結果7は、入力解析部2によって収集発話データ6を形態素に分割したデータである。
発話内容推定部14は、ユーザ入力解析結果11を入力として、発話推定モデル9を使ってこの入力に対応する項目を推定し、その項目のドキュメントIDを取得する。ドキュメント推定結果15は、発話内容推定部14で推定したドキュメントIDとそのスコア(後述する)を含むデータである。
検索インデックス用データ3−2は、「Id_10_1_1」のドキュメント解析結果3−1をもとにした、検索インデックス作成部4が使用するデータ例を示している。ここではドキュメントIDと自立語形態素の一般形(キーワード)のリストとが抽出されている。
なお、これら収集発話データ6−1〜6−4は、ユーザが製品の機能を確認するためにどのような聞き方をするかを想定した質問文例である。
発話推定モデル用データ7−2は、「Id_10_1_1」の収集発話解析結果7−1をもとにした、発話推定モデル作成部8が使用するデータ例を示している。ここではドキュメントIDと自立語形態素の一般形(キーワード)のリストとが抽出されている。
動作は大きく2つの処理に分かれる。1つは、ドキュメント1および収集発話データ6からそれぞれ検索インデックス5、発話推定モデル9を作成する作成処理であり、もう1つは、ユーザ入力10を受けて最終検索結果17を作成する検索処理である。まず、作成処理について説明する。
図6は、ドキュメント1から検索インデックス5を作成するまでの動作を示すフローチャートである。図2に示したように、ドキュメント1はドキュメントIDとテキストとが対応付けられたペアになっているものとする。たとえば、ドキュメント1−2ではドキュメントID「Id_10_1_1」という名前に、「自車基準。自車の進行方向を上とした地図が表示されます。」というテキストが対応付けられている。ステップST1では、入力解析部2がこの構造のドキュメント1を順次読み込み、既知の技術である形態素解析によって形態素列に分割する。ドキュメント1−2を形態素解析した結果が、図3のドキュメント解析結果3−1である。このドキュメント解析結果3−1は、形態素の区切り「/」しか示していないが、実際には、品詞情報、活用語の原型、読みなどが含まれているものとする。
図7は、収集発話データ6から発話推定モデル9を作成するまでの動作を示すフローチャートである。収集発話データ6は、図4の収集発話データ6−1〜6−4に表したように、あらかじめユーザから集めた発話をその回答となるドキュメントIDに割り当てたデータである。収集発話データ6の作成方法は、アンケートなどでドキュメントIDごとの機能を説明した内容を提示して、その機能を探したい場合に何と言うかを表す文章を集めたデータである。たとえば、図4の「Id_10_1_1」の「自車基準。自車の進行方向を上とした地図が表示されます。」という具体的内容を提示した場合は、収集発話データ6−3のような発話が収集できることが期待でき、一方「Id_10」のような上位の概念を提示した場合には、収集発話データ6−1のようなデータを始め、収集発話データ6−2〜6−4のような発話も収集できることが期待できる。なお、収集発話データ6−4はドキュメント1の製品の機能外の内容の発話データであり、この場合は中間的な「Id_10_1」のドキュメントIDに割り当てることとなる。上記の作業は人手によってあらかじめ行い、図4の構造のデータを用意しておくこととなる。
すべての収集発話解析結果7からキーワードが抽出され、ME法によって学習して、発話推定モデル9が作成される。具体的には、図5の収集発話解析結果7−1に対して、同じ図5の発話推定モデル用データ7−2が抽出され、この発話推定モデル用データ7−2を元に上記学習が行われる。
図8は、ユーザ入力10から最終検索結果17を作成するまでの動作を示すフローチャートである。図9および図10は、ユーザ入力10の一例であるユーザ入力10−1の検索処理における遷移例を示す。ここではユーザ入力10はテキストでの入力を想定し、図9のユーザ入力10−1が入力されたとして説明する。入力解析部2は、ステップST11でまずユーザ入力10−1を受け取り、形態素解析してユーザ入力解析結果11−1を生成し、ユーザ入力解析結果11−1から自立語を抽出してキーワードリスト11−2を作成する。続くステップST12では、発話内容推定部14がこのキーワードリスト11−2を入力に用いて、発話推定モデル9から図10のドキュメント推定結果15−1を得る。図10に示すように、ドキュメント推定結果15−1は、スコア順に並んでいる。このスコアは、発話推定モデル9に保存された(ドキュメントID、キーワードリスト)のぺアの重みから算出される値であり、ユーザ入力10との関連度合いが高いドキュメントID、即ち、ユーザ入力10の質問に対する回答として相応しいドキュメントIDに高いスコアが付与される。
なお、ドキュメント推定結果15のスコアおよびドキュメント検索結果13のスコアの算出方法には公知の技術を用いればよいため、ここでの説明は省略する。
検索が終了すると、ドキュメント検索装置は画面にドキュメントIDのタイトルなどを表示して、ユーザに選択させることで、所望のドキュメント位置を提示する。
図11は、本実施の形態2に係るドキュメント検索装置の構成を示すブロック図である。なお、図11において図1と同一または相当の部分については同一の符号を付し説明を省略する。
上記実施の形態1との大きな違いは以下の2点である。
(1)収集発話データ6を割り当てるドキュメントIDの単位を細かい単位ではなく、より大きな単位にした発話推定モデル9を作成する。
(2)ドキュメント推定結果15は検索インデックス5による検索対象範囲を限定する目的で使用する。
作成処理における動作は基本的に上記実施の形態1と同じである。但し、収集発話データ6のドキュメントIDへの割り当てを、図12に示すように第2階層以上とする。従って、図4において収集発話データ6−1はドキュメントID「Id_10」に割り当て、それ以外の収集発話データ6−2〜6−4はすべて「Id_10_1」に割り当てる。
図13は、ユーザ入力10から最終検索結果17を作成するまでの動作を示すフローチャートである。図14は、検索対象限定部18の動作を説明する図である。上記実施の形態1と同様に、ここでもユーザ入力10はテキストでの入力を想定し、図9のユーザ入力10−1が入力されたとして説明する。ステップST11で入力解析部2は、図8と同様にユーザ入力10−1を解析する。次にステップST12で、発話内容推定部14が発話内容推定を行う。推定結果は、図14のドキュメント推定結果15−2(ドキュメントID、スコア)になる。上述したように、収集発話データ6のドキュメントIDへの割り当てが第2階層以上に制限されているため、第3階層以下のドキュメントIDは無い。
以下では、英語の入力例について説明する。
本実施の形態3のドキュメント検索装置は、図1に示すドキュメント検索装置と図面上では同様の構成であるため、以下では図1を援用して説明する。
検索インデックス用データ3−12は、「Id_10_1_1」のドキュメント解析結果3−11をもとにした、検索インデックス作成部4が使用するデータ例を示している。ここではドキュメントIDと、前置詞、冠詞、be動詞、代名詞を除く自立語形態素とが抽出されている。
本実施の形態3に係るドキュメント検索装置の動作(作成処理、検索処理)は基本的に上記実施の形態1の図6〜図8と同じである。従って、ここでは異なる部分のみを説明する。まず、作成処理について説明する。
図15に示したように、ドキュメント1は、ドキュメントIDとテキストとが対応付けられたペアになっているものとする。たとえば、ドキュメント1−12ではドキュメントID「Id_10_1_1」という名前に、「Heading up.Display the map which rotated to always face the direction you are travelling」というテキストが対応付けられている。図6のステップST1では、入力解析部2がこの構造のドキュメント1を順次読み込み、既知の技術である形態素解析によって形態素列に分割する。ドキュメント1−12を形態素解析した結果が、図16のドキュメント解析結果3−11である。このドキュメント解析結果3−11は、形態素の区切りしか示していないが、実際には、品詞情報、活用語の原形などが含まれているものとする。
収集発話データ6は、図17の収集発話データ6−11〜6−14に表したように、あらかじめユーザから集めた発話をその回答となるドキュメントIDに割り当てたデータである。収集発話データ6の作成方法は上記実施の形態1と同様であるため、説明を省略する。
図19および図20は、ユーザ入力10の一例であるユーザ入力10−11の検索処理における遷移例を示す。ここではユーザ入力10はテキストでの入力を想定し、図19のユーザ入力10−11が入力されたとして説明する。入力解析部2は、図8に示したステップST11でまずユーザ入力10−11を受け取り、形態素解析してユーザ入力解析結果11−11を生成し、ユーザ入力解析結果11−11から前置詞、冠詞、be動詞、代名詞を除外して自立語を抽出し、キーワードリスト11−12を作成する。続くステップST12では、発話内容推定部14がこのキーワードリスト11−12を入力に用いて、発話推定モデル9から図20のドキュメント推定結果15−11を得る。図20に示すように、ドキュメント推定結果15−11は、スコア順に並んでいる。
検索が終了すると、ドキュメント検索装置は画面にドキュメントIDのタイトルなどを表示して、ユーザに選択させることで、所望のドキュメント位置を提示する。
なお、説明は省略するが、実施の形態3の構成を上記実施の形態2に適用してもよい。
以下では、中国語の入力例について説明する。
本実施の形態4のドキュメント検索装置は、図1に示すドキュメント検索装置と図面上では同様の構成であるため、以下では図1を援用して説明する。
検索インデックス用データ3−22は、「Id_10_1_1」のドキュメント解析結果3−22をもとにした、検索インデックス作成部4が使用するデータ例を示している。ここではドキュメントIDと、代詞、助詞、介詞を除く自立語形態素とが抽出されている。
本実施の形態4に係るドキュメント検索装置の動作(作成処理、検索処理)は基本的に上記実施の形態1の図6〜図8と同じである。従って、ここでは異なる部分のみを説明する。まず、作成処理について説明する。
図21に示したように、ドキュメント1は、ドキュメントIDとテキストとが対応付けられたペアになっているものとする。
収集発話データ6は、図23の収集発話データ6−21〜6−24に表したように、あらかじめユーザから集めた発話をその回答となるドキュメントIDに割り当てたデータである。収集発話データ6の作成方法は上記実施の形態1と同様であるため、説明を省略する。
図25および図26は、ユーザ入力10の一例であるユーザ入力10−21の検索処理における遷移例を示す。ここではユーザ入力10はテキストでの入力を想定し、図25のユーザ入力10−21が入力されたとして説明する。入力解析部2は、図8に示したステップST11でまずユーザ入力10−21を受け取り、形態素解析してユーザ入力解析結果11−21を生成し、ユーザ入力解析結果11−21から代詞、助詞、介動詞を除外して自立語を抽出し、キーワードリスト11−22を作成する。続くステップST12では、発話内容推定部14がこのキーワードリスト11−22を入力に用いて、発話推定モデル9から図26のドキュメント推定結果15−21を得る。図26に示すように、ドキュメント推定結果15−21は、スコア順に並んでいる。
検索が終了すると、ドキュメント検索装置は画面にドキュメントIDのタイトルなどを表示して、ユーザに選択させることで、所望のドキュメント位置を提示する。
なお、説明は省略するが、実施の形態4の構成を上記実施の形態2に適用してもよい。
Claims (6)
- あらかじめ用意されたドキュメントから作成した検索インデックスと、
ユーザからの入力を受け、前記検索インデックスを用いて前記ドキュメント内から当該ユーザ入力に関連のある項目を検索するドキュメント検索部とを備えるドキュメント検索装置であって、
前記ドキュメントの内容を問う想定質問と当該想定質問の回答となる前記ドキュメント内の項目との対応関係を学習した発話推定モデルと、
前記発話推定モデルを基に前記ドキュメント内から前記ユーザ入力の回答に相当する項目を推定する発話内容推定部と、
前記ドキュメント検索部から得られたドキュメント検索結果および前記発話内容推定部から得られたドキュメント推定結果を統合して、最終検索結果を生成する結果統合部とを備えることを特徴とするドキュメント検索装置。 - 前記発話内容推定部は、推定した前記ドキュメント内の項目に、前記ユーザ入力との関連度合いに応じたスコアを付与し、
前記結果統合部は、前記発話内容推定部から得られたドキュメント推定結果のスコアがあらかじめ定めた値より大きい場合は、前記ドキュメント検索部から得られたドキュメント検索結果を無視して最終検索結果を生成することを特徴とする請求項1記載のドキュメント検索装置。 - 前記ドキュメント検索部は、検索した前記ドキュメント内の項目に、前記ユーザ入力との関連度合いに応じたスコアを付与し、
前記発話内容推定部は、推定した前記ドキュメント内の項目に、前記ユーザ入力との関連度合いに応じたスコアを付与し、
前記結果統合部は、前記ドキュメント検索部から得られたドキュメント検索結果のスコアと前記発話内容推定部から得られたドキュメント推定結果のスコアを一定の割合で加算して統合することを特徴とする請求項1記載のドキュメント検索装置。 - 前記発話内容推定部から得られたドキュメント推定結果のうち、所定の条件を満たす項目を抽出する検索対象限定部を備え、
前記発話内容推定部は、前記検索インデックスの検索の最小単位より大きな単位の項目と前記想定質問との対応関係を学習した発話推定モデルを基に推定し、
前記結果統合部は、前記発話内容推定部から得られたドキュメント推定結果のうちの前記検索対象限定部で抽出した項目を、前記ドキュメント検索部から得られたドキュメント検索結果と統合することを特徴とする請求項1記載のドキュメント検索装置。 - あらかじめ用意されたドキュメント、および当該ドキュメントの内容を問う想定質問と当該質問の回答となる当該ドキュメント内の項目との対応関係を定義した収集発話データを解析する入力解析部と、
前記入力解析部から出力された前記ドキュメントの解析結果から前記検索インデックスを作成する検索インデックス作成部と、
前記入力解析部から出力された前記収集発話データの解析結果を用いて、前記想定質問と前記ドキュメント内の項目との対応関係を学習し、前記発話推定モデルを作成する発話推定モデル作成部とを備えることを特徴とする請求項1記載のドキュメント検索装置。 - ユーザからの入力を受け付けるユーザ入力ステップと、
あらかじめ用意されたドキュメントから作成した検索インデックスを用いて、当該ドキュメント内から前記ユーザ入力に関連のある項目を検索するドキュメント検索ステップと、
前記ドキュメントの内容を問う想定質問と当該想定質問の回答となる前記ドキュメント内の項目との対応関係を学習した発話推定モデルを基に、前記ドキュメント内から前記ユーザ入力の回答に相当する項目を推定する発話内容推定ステップと、
前記ドキュメント検索ステップから得られたドキュメント検索結果および前記発話内容推定ステップから得られたドキュメント推定結果を統合して、最終検索結果を生成する結果統合ステップとを備えるドキュメント検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014504643A JP5847290B2 (ja) | 2012-03-13 | 2012-12-27 | ドキュメント検索装置およびドキュメント検索方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012055841 | 2012-03-13 | ||
JP2012055841 | 2012-03-13 | ||
PCT/JP2012/083925 WO2013136634A1 (ja) | 2012-03-13 | 2012-12-27 | ドキュメント検索装置およびドキュメント検索方法 |
JP2014504643A JP5847290B2 (ja) | 2012-03-13 | 2012-12-27 | ドキュメント検索装置およびドキュメント検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013136634A1 true JPWO2013136634A1 (ja) | 2015-08-03 |
JP5847290B2 JP5847290B2 (ja) | 2016-01-20 |
Family
ID=49160587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014504643A Active JP5847290B2 (ja) | 2012-03-13 | 2012-12-27 | ドキュメント検索装置およびドキュメント検索方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150112683A1 (ja) |
JP (1) | JP5847290B2 (ja) |
CN (1) | CN104221012A (ja) |
DE (1) | DE112012006633T5 (ja) |
WO (1) | WO2013136634A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170116180A1 (en) * | 2015-10-23 | 2017-04-27 | J. Edward Varallo | Document analysis system |
US10606815B2 (en) | 2016-03-29 | 2020-03-31 | International Business Machines Corporation | Creation of indexes for information retrieval |
JP6805927B2 (ja) * | 2017-03-28 | 2020-12-23 | 富士通株式会社 | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 |
JP7192507B2 (ja) * | 2019-01-09 | 2022-12-20 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
CN111339261A (zh) * | 2020-03-17 | 2020-06-26 | 北京香侬慧语科技有限责任公司 | 一种基于预训练模型的文档抽取方法及系统 |
US11386164B2 (en) | 2020-05-13 | 2022-07-12 | City University Of Hong Kong | Searching electronic documents based on example-based search query |
CN111783403B (zh) * | 2020-06-11 | 2022-10-04 | 云账户技术(天津)有限公司 | 一种文档提供方法、设备及介质 |
KR102585545B1 (ko) * | 2020-12-31 | 2023-10-05 | 채상훈 | 음성 기반 제품사용설명서 안내 서비스 제공 방법 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5519608A (en) * | 1993-06-24 | 1996-05-21 | Xerox Corporation | Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation |
JPH11338864A (ja) * | 1998-05-25 | 1999-12-10 | Sharp Corp | 学習機能付き検索装置 |
JP2002073661A (ja) * | 2000-08-31 | 2002-03-12 | Toshiba Corp | 知的情報管理システム及び知的情報登録方法 |
JP2004302660A (ja) * | 2003-03-28 | 2004-10-28 | Toshiba Corp | 質問応答システム、質問応答方法及びプログラム |
JP2007219955A (ja) * | 2006-02-17 | 2007-08-30 | Fuji Xerox Co Ltd | 質問応答システム、質問応答処理方法及び質問応答プログラム |
JP2009116662A (ja) * | 2007-11-07 | 2009-05-28 | National Institute Of Information & Communication Technology | 質問応答装置、質問応答方法、及びプログラム |
JP2010282403A (ja) * | 2009-06-04 | 2010-12-16 | Kansai Electric Power Co Inc:The | 文書検索方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756933A (ja) * | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
US20070168382A1 (en) * | 2006-01-03 | 2007-07-19 | Michael Tillberg | Document analysis system for integration of paper records into a searchable electronic database |
CN101086843A (zh) * | 2006-06-07 | 2007-12-12 | 中国科学院自动化研究所 | 一种应用于语音问答系统中的句子相似度识别方法 |
US20090006358A1 (en) * | 2007-06-27 | 2009-01-01 | Microsoft Corporation | Search results |
CN101593518A (zh) * | 2008-05-28 | 2009-12-02 | 中国科学院自动化研究所 | 实际场景语料和有限状态网络语料的平衡方法 |
US9569724B2 (en) * | 2010-09-24 | 2017-02-14 | International Business Machines Corporation | Using ontological information in open domain type coercion |
-
2012
- 2012-12-27 JP JP2014504643A patent/JP5847290B2/ja active Active
- 2012-12-27 CN CN201280067066.1A patent/CN104221012A/zh active Pending
- 2012-12-27 WO PCT/JP2012/083925 patent/WO2013136634A1/ja active Application Filing
- 2012-12-27 US US14/364,174 patent/US20150112683A1/en not_active Abandoned
- 2012-12-27 DE DE112012006633.2T patent/DE112012006633T5/de active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5519608A (en) * | 1993-06-24 | 1996-05-21 | Xerox Corporation | Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation |
JPH11338864A (ja) * | 1998-05-25 | 1999-12-10 | Sharp Corp | 学習機能付き検索装置 |
JP2002073661A (ja) * | 2000-08-31 | 2002-03-12 | Toshiba Corp | 知的情報管理システム及び知的情報登録方法 |
JP2004302660A (ja) * | 2003-03-28 | 2004-10-28 | Toshiba Corp | 質問応答システム、質問応答方法及びプログラム |
JP2007219955A (ja) * | 2006-02-17 | 2007-08-30 | Fuji Xerox Co Ltd | 質問応答システム、質問応答処理方法及び質問応答プログラム |
JP2009116662A (ja) * | 2007-11-07 | 2009-05-28 | National Institute Of Information & Communication Technology | 質問応答装置、質問応答方法、及びプログラム |
JP2010282403A (ja) * | 2009-06-04 | 2010-12-16 | Kansai Electric Power Co Inc:The | 文書検索方法 |
Also Published As
Publication number | Publication date |
---|---|
US20150112683A1 (en) | 2015-04-23 |
JP5847290B2 (ja) | 2016-01-20 |
DE112012006633T5 (de) | 2015-03-19 |
WO2013136634A1 (ja) | 2013-09-19 |
CN104221012A (zh) | 2014-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5847290B2 (ja) | ドキュメント検索装置およびドキュメント検索方法 | |
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
EP2956931B1 (en) | Facilitating development of a spoken natural language interface | |
US8150843B2 (en) | Generating search results based on user feedback | |
JP4966546B2 (ja) | 電子テキストに概念的強調を自動的に施す方法 | |
JP2018077858A (ja) | 会話式情報検索システムおよび方法 | |
US20140163959A1 (en) | Multi-Domain Natural Language Processing Architecture | |
JP2011503638A (ja) | カーナビゲーションシステムのための自由会話命令分類の改良 | |
CN102955772A (zh) | 一种基于语义的相似度计算方法和装置 | |
CN116450883A (zh) | 基于视频内容细粒度信息的视频时刻检索方法 | |
JP2008243024A (ja) | 情報取得装置、そのプログラム及び方法 | |
JP4065346B2 (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Xiong et al. | Extended HMM and ranking models for Chinese spelling correction | |
JP2021009538A (ja) | 自然言語処理装置および自然言語処理プログラム | |
JP4153843B2 (ja) | 自然文検索装置、自然文検索方法、自然文検索プログラム及び自然文検索プログラム記憶媒体 | |
Malandrakis et al. | Affective language model adaptation via corpus selection | |
JP2007026115A (ja) | ラベル付与システムおよびラベル付与方法 | |
CN114625845A (zh) | 一种信息检索方法、智能终端及计算机可读存储介质 | |
JP5072651B2 (ja) | 重要語句抽出装置 | |
JP6843689B2 (ja) | コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 | |
KR102429649B1 (ko) | 키워드 기반 구문 추천 시스템 및 방법 | |
Sinha et al. | Transforming interactions: mouse-based to voice-based interfaces | |
Scutelnicu | Romanian Lexical Resources Interconnection | |
Reddy et al. | Cross lingual information retrieval using search engine and data mining | |
JP5142897B2 (ja) | 文検索装置,文検索プログラム,文検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5847290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |