JP5640578B2 - 文書処理装置、文書処理方法、及び、プログラム - Google Patents

文書処理装置、文書処理方法、及び、プログラム Download PDF

Info

Publication number
JP5640578B2
JP5640578B2 JP2010197243A JP2010197243A JP5640578B2 JP 5640578 B2 JP5640578 B2 JP 5640578B2 JP 2010197243 A JP2010197243 A JP 2010197243A JP 2010197243 A JP2010197243 A JP 2010197243A JP 5640578 B2 JP5640578 B2 JP 5640578B2
Authority
JP
Japan
Prior art keywords
document
search
character string
information
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010197243A
Other languages
English (en)
Other versions
JP2012053797A (ja
Inventor
貢 三浦
貢 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010197243A priority Critical patent/JP5640578B2/ja
Publication of JP2012053797A publication Critical patent/JP2012053797A/ja
Application granted granted Critical
Publication of JP5640578B2 publication Critical patent/JP5640578B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、文書を表す文書データを処理する文書処理装置に関する。
検索用文字列を受け付け、当該受け付けられた検索用文字列と同一の文字列を含む文書を特定する検索処理を実行する文書処理装置が知られている。例えば、文書処理装置は、Nグラム(N−gram)方式に従って検索処理を実行する。
この種の文書処理装置の一つとして、特許文献1に記載の文書処理装置は、特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する。
特開平11−154164号公報
ところで、第1の検索用文字列(例えば、「プリンタ」)に対して検索処理が実行され、その後、第1の検索用文字列の一部である第2の検索用文字列(例えば、「プリン」)に対して検索処理が実行された場合を想定する。
この場合、第2の検索用文字列に対する検索処理によって特定される文書は、第1の検索用文字列に対する検索処理によって特定された文書と同一の文書も含む。しかしながら、第1の検索用文字列に対する検索処理によって特定された文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性が高い。即ち、上記文書処理装置によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定されてしまう虞があった。
このため、本発明の目的は、上述した課題である「検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される場合が生じること」を解決することが可能な文書処理装置を提供することにある。
かかる目的を達成するため本発明の一形態である文書処理装置は、
検索用文字列を受け付ける検索用文字列受付手段と、
上記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行手段と、
上記検索用文字列と、当該検索用文字列に対する上記検索処理により生成された上記文書特定情報と、を対応付けて記憶する検索結果記憶手段と、
上記受け付けられた検索用文字列と、上記検索処理により生成された上記文書特定情報と対応付けて記憶されている上記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された上記順位情報が表す順位を下げるように当該順位情報を補正する順位補正手段と、
を備える。
また、本発明の他の形態である文書処理方法は、
第1の検索用文字列を受け付け、
上記受け付けられた第1の検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行し、
上記第1の検索用文字列と、当該第1の検索用文字列に対する上記検索処理により生成された上記文書特定情報と、を対応付けて記憶し、
第2の検索用文字列を受け付け、
上記受け付けられた第2の検索用文字列に対して上記検索処理を実行し、
上記受け付けられた第2の検索用文字列と、上記検索処理により生成された上記文書特定情報と対応付けて記憶されている上記第1の検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された上記順位情報が表す順位を下げるように当該順位情報を補正する方法である。
また、本発明の他の形態であるプログラムは、
情報処理装置に、
検索用文字列を受け付ける検索用文字列受付手段と、
上記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行手段と、
上記検索用文字列と、当該検索用文字列に対する上記検索処理により生成された上記文書特定情報と、を対応付けて記憶する検索結果記憶手段と、
上記受け付けられた検索用文字列と、上記検索処理により生成された上記文書特定情報と対応付けて記憶されている上記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された上記順位情報が表す順位を下げるように当該順位情報を補正する順位補正手段と、
を実現させるためのプログラムである。
本発明は、以上のように構成されることにより、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性を低減することができる。
本発明の第1実施形態に係る文書処理装置の機能の概略を表すブロック図である。 本発明の第1実施形態に係る文書処理装置が記憶する、文書特定情報と検索用文字列とを対応付けたテーブルである。 本発明の第1実施形態に係る文書処理装置が実行する検索処理プログラムを示したフローチャートである。 本発明の第1実施形態に係る文書処理装置が記憶する、文書特定情報と検索用文字列とを対応付けたテーブルである。 本発明の第3実施形態に係る文書処理装置の機能の概略を表すブロック図である。 本発明の第4実施形態に係る文書処理装置の機能の概略を表すブロック図である。
以下、本発明に係る、文書処理装置、文書処理方法、及び、プログラム、の各実施形態について図1〜図6を参照しながら説明する。
<第1実施形態>
(構成)
図1に示したように、第1実施形態に係る文書処理装置10は、情報処理装置である。なお、文書処理装置10は、サーバ装置、パーソナル・コンピュータ、携帯電話端末、PHS(Personal Handyphone System)、PDA(Personal Data Assistance、Personal Digital Assistant)、カーナビゲーション端末、又は、ゲーム端末等であってもよい。
文書処理装置10は、図示しない中央処理装置(CPU;Central Processing Unit)、及び、記憶装置(メモリ及びハードディスク駆動装置(HDD;Hard Disk Drive))を備える。文書処理装置10は、記憶装置に記憶されているプログラムをCPUが実行することにより、後述する機能を実現するように構成されている。
(機能)
図1は、上記のように構成された文書処理装置10の機能を表すブロック図である。
文書処理装置10の機能は、文書記憶部11と、検索用文字列受付部(検索用文字列受付手段)12と、検索処理実行部(検索処理実行手段)13と、検索結果記憶部(検索結果記憶手段)14と、順位補正部(順位補正手段)15と、検索結果出力部(検索結果出力手段)16と、を含む。
文書記憶部11は、文字列を含む文書(を表す文書情報)を予め記憶している。なお、文書記憶部11は、通信可能に接続された他の情報処理装置から文書を受信し、当該受信した文書を記憶するように構成されていてもよい。この場合、文書記憶部11は、ウェブに配置された文書、及び/又は、ファイルサーバが保持する文書等を自動的に収集するように構成されていてもよい。また、文書記憶部11は、入力装置を介してユーザにより入力された文書を記憶するように構成されていてもよい。
後述するように、本例では、文書処理装置10は、N−gram方式に従って検索処理を実行する。従って、文書記憶部11は、記憶されている文書に基づいて転置インデックス(転置テーブル)を生成し、生成した転置インデックスを記憶する。
検索用文字列受付部12は、検索用文字列を受け付ける。本例では、検索用文字列受付部12は、通信可能に接続された他の情報処理装置(クライアント装置)から検索用文字列を受信し、当該受信した検索用文字列を受け付ける。なお、検索用文字列受付部12は、入力装置を介してユーザにより入力された検索用文字列を受け付けるように構成されていてもよい。
検索処理実行部13は、検索用文字列受付部12により受け付けられた検索用文字列に基づいて検索処理を実行する。本例では、検索処理実行部13は、N−gram方式に従って検索処理を実行する。なお、検索処理実行部13は、順次走査検索方式(grep方式、又は、逐次検索方式)に従って検索処理を実行するように構成されていてもよい。
検索処理は、文書特定処理と順位決定処理とを含む。
文書特定処理は、文書記憶部11に記憶されている文書のうちの、検索用文字列受付部12により受け付けられた検索用文字列と同一の文字列を含む文書を特定する処理である。
順位決定処理は、文書特定処理にて特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報(本例では、ファイルシステムにおけるパス、又は、URI(Uniform Resource Identifier)等)と、当該文書特定情報が出力される順位を表す順位情報と、を生成する処理である。
本例では、検索処理実行部13は、文書と検索用文字列との間の相関が大きくなるほど、当該文書を特定するための文書特定情報が出力される順位をより上位の順位とするように順位情報を生成する。本例では、文書に含まれる検索用文字列の総数が多くなることは、当該文書と当該検索用文字列との間の相関が大きくなることに対応している。
検索結果記憶部14は、検索処理実行部13によって検索処理が実行された場合、図2に示したように、検索用文字列受付部12により受け付けられた検索用文字列と、当該検索用文字列に対する検索処理により検索処理実行部13によって生成された文書特定情報と、を対応付けて記憶する。
順位補正部15は、検索処理実行部13によって実行された検索処理により生成された文書特定情報のそれぞれに対して、順位補正条件が成立するか否かを判定する判定処理を実行する。
順位補正条件は、検索用文字列受付部12により受け付けられた検索用文字列と、当該判定処理の対象となる文書特定情報と対応付けて検索結果記憶部14に記憶されている検索用文字列の一部と、が一致するという条件である。
順位補正部15は、順位補正条件が成立すると判定した場合、検索処理実行部13により生成された順位情報のうちの、当該判定処理の対象となる文書特定情報に対して生成された順位情報が表す順位を下げるように当該順位情報を補正する。本例では、順位補正部15は、順位補正条件が成立すると判定した場合、予め設定された値だけ順位を下げる。
即ち、順位補正部15は、検索用文字列受付部12により受け付けられた検索用文字列と、検索処理実行部13による検索処理により生成された文書特定情報と対応付けて検索結果記憶部14に記憶されている検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された順位情報が表す順位を下げるように当該順位情報を補正する、と言うことができる。
検索結果出力部16は、順位補正部15により補正された順位情報が表す順位に従って、検索処理実行部13により生成された文書特定情報を出力する。本例では、検索結果出力部16は、文書特定情報を、検索用文字列を送信してきた情報処理装置へ送信することにより出力する。
具体的には、検索結果出力部16は、より上位の順位と対応付けられた文書特定情報が、より上方に配置された画像を表す画像情報を、検索用文字列を送信してきた情報処理装置へ送信する。この情報処理装置は、画像情報を受信し、受信した画像情報が表す画像を、出力装置を介して出力する(例えば、ディスプレイに表示させる)。
なお、検索結果出力部16は、文書特定情報を、出力装置を介して出力する(例えば、ディスプレイに表示させる)ように構成されていてもよい。
(作動)
次に、上述した文書処理装置10の作動について説明する。
文書処理装置10のCPUは、図3にフローチャートにより示した検索処理プログラムを実行するようになっている。
具体的に述べると、文書処理装置10は、検索処理プログラムの処理を開始すると、ステップS101にて、検索用文字列を受け付けるまで待機する。
いま、文書処理装置10が、検索用文字列として「プリンタ」を受け付けた場合を想定して説明を続ける。この場合、文書処理装置10は、検索用文字列を受け付けると、「Yes」と判定してステップS102へ進み、受け付けた検索用文字列に対する検索処理を実行する。
文書処理装置10は、検索処理を実行することにより、文書特定情報と順位情報とを生成する。いま、文書処理装置10が文書特定情報として「D02」等を生成した場合を想定する。
そして、文書処理装置10は、ステップS101にて受け付けられた検索用文字列と、ステップS102にて生成した文書特定情報と、を対応付けて記憶装置に記憶させる(ステップS103)。上記仮定に従えば、文書処理装置10は、図4に示したように、文書特定情報としての「D02」と、検索用文字列としての「プリンタ」と、を対応付けて新たに記憶する。文書処理装置10は、ステップS102にて生成された、その他の文書特定情報のそれぞれも、同様に、検索用文字列としての「プリンタ」と対応付けて新たに記憶する。
次いで、文書処理装置10は、ステップS102にて生成された文書特定情報のリストを生成する(ステップS104)。そして、文書処理装置10は、ステップS104にて生成されたリスト内に文書特定情報が存在するか否かを判定する(ステップS105)。
この時点では、リスト内に文書特定情報が存在するので、文書処理装置10は、「Yes」と判定してステップS106へ進む。そして、文書処理装置10は、リストから文書特定情報を1つ取得し、当該取得した文書特定情報をリストから削除する。ステップS106にて取得された文書特定情報は、判定処理の対象となる文書を特定するための文書特定情報である。
次いで、文書処理装置10は、ステップS106にて取得された文書特定情報と対応付けて記憶装置に記憶されている検索用文字列(過去の検索用文字列)の一部と、ステップS101にて受け付けられた検索用文字列と、が一致しているか否かを判定する判定処理を実行する(ステップS107)。
いま、ステップS106にて取得された文書特定情報が「D02」である場合を想定する。この場合、ステップS101にて受け付けられた検索用文字列である「プリンタ」を一部として含む検索用文字列が、文書特定情報としての「D02」と対応付けて記憶されていないので、文書処理装置10は、「No」と判定してステップS108の処理を実行することなくステップS105へ戻る。
このようにして、文書処理装置10は、リスト内の文書特定情報のそれぞれに対して、ステップS105〜ステップS108の処理を実行する。
その後、リスト内に文書特定情報が存在しなくなった場合、文書処理装置10は、ステップS105にて「No」と判定してステップS109へ進む。そして、文書処理装置10は、ステップS102にて生成された順位情報が表す順位に従って、ステップS102にて生成された文書特定情報を出力する。その後、文書処理装置10は、ステップS101へ戻り、ステップS101〜ステップS109の処理を繰り返し実行する。
次に、文書処理装置10が、検索用文字列として「プリン」を受け付けた場合を想定して説明を続ける。この場合において、ステップS106にて取得された文書特定情報が「D02」である場合を想定する。
この場合、ステップS101にて受け付けられた検索用文字列である「プリン」(第2の検索用文字列)を一部として含む検索用文字列である「プリンタ」(第1の検索用文字列)が、文書特定情報としての「D02」と対応付けて記憶されている。従って、文書処理装置10は、ステップS107にて「Yes」と判定してステップS108へ進む。
そして、文書処理装置10は、ステップS102にて生成された順位情報のうちの、ステップS106にて取得された文書特定情報に対して生成された順位情報が表す順位を下げるように当該順位情報を補正する。次いで、文書処理装置10は、ステップS105へ戻る。
このようにして、文書処理装置10は、リスト内の文書特定情報のそれぞれに対して、ステップS105〜ステップS108の処理を実行する。
その後、リスト内に文書特定情報が存在しなくなった場合、文書処理装置10は、ステップS105にて「No」と判定してステップS109へ進む。そして、文書処理装置10は、ステップS108にて補正された順位情報が表す順位に従って、ステップS102にて生成された文書特定情報を出力する。その後、文書処理装置10は、ステップS101へ戻り、ステップS101〜ステップS109の処理を繰り返し実行する。
以上、説明したように、本発明の第1実施形態に係る文書処理装置10によれば、第2の検索用文字列(「プリン」)に対する検索処理によって特定された文書のうちの、第1の検索用文字列(「プリンタ」)に対する検索処理によって特定された文書と同一の文書を特定するための文書特定情報(「D02」)が出力される順位が、過度に上位に設定される可能性を低減することができる。
即ち、文書処理装置10によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性を低減することができる。換言すると、文書処理装置10によれば、検索ノイズを低減することができる。
なお、第1実施形態の変形例に係る文書処理装置10は、順位情報としてスコア値を生成するように構成されていてもよい。ここで、スコア値は、文書と検索用文字列との間の相関が大きくなるほど、大きくなる値を有する。この場合、文書処理装置10は、予め設定された値だけ、スコア値を減少させることにより順位情報を補正するように構成されていてもよい。
また、第1実施形態の他の変形例に係る文書処理装置10は、文書特定情報とともに当該文書特定情報により特定される文書の一部であるスニペットを出力するように構成されていてもよい。
<第2実施形態>
次に、本発明の第2実施形態に係る文書処理装置について説明する。第2実施形態に係る文書処理装置は、上記第1実施形態に係る文書処理装置に対して、文書にて検索用文字列と同一の文字列が配置されている位置にも基づいて順位情報を補正するか否かを決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
第2実施形態に係る検索処理実行部13が実行する検索処理は、文書特定処理及び順位決定処理に加えて、一致位置特定処理を含む。
一致位置特定処理は、文書特定処理にて特定された文書にて、検索用文字列受付部12により受け付けられた検索用文字列と同一の文字列が配置されている位置である一致位置を特定する処理である。
第2実施形態に係る検索結果記憶部14は、検索用文字列と、当該検索用文字列に対する検索処理により生成された文書特定情報と、当該検索処理により当該文書特定情報に対して特定された一致位置を表す一致位置情報と、を対応付けて記憶する。
第2実施形態に係る順位補正部15は、検索処理実行部13によって実行された検索処理により生成された文書特定情報のそれぞれに対して、第1の順位補正条件、及び、第2の順位補正条件の両方が成立するか否かを判定する判定処理を実行する。
第1の順位補正条件は、検索用文字列受付部12により受け付けられた検索用文字列(第2の検索用文字列)と、当該判定処理の対象となる文書特定情報と対応付けて検索結果記憶部14に記憶されている検索用文字列(第1の検索用文字列)の一部と、が一致するという条件である。
第2の順位補正条件は、当該判定処理の対象となる文書特定情報に対して検索処理実行部13により特定された一致位置が、上記第1の検索用文字列及び当該文書特定情報と対応付けて検索結果記憶部14に記憶されている一致位置情報が表す一致位置に含まれるという条件である。
順位補正部15は、第1の順位補正条件、及び、第2の順位補正条件の両方が成立すると判定した場合、検索処理実行部13により生成された順位情報のうちの、当該判定処理の対象となる文書特定情報に対して生成された順位情報が表す順位を下げるように当該順位情報を補正する。
ところで、同一の文書に対して、第2の検索用文字列に対して実行された検索処理により特定された一致位置が、第1の検索用文字列に対して実行された検索処理により特定された一致位置に含まれる場合、当該文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性がより一層高い。
従って、本発明の第2実施形態に係る文書処理装置10によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性をより一層確実に低減することができる。
<第3実施形態>
次に、本発明の第3実施形態に係る文書処理装置について説明する。第3実施形態に係る文書処理装置は、上記第1実施形態に係る文書処理装置に対して、文書特定情報に基づいてユーザが文書を閲覧したか否かにも基づいて順位情報を補正するか否かを決定する点において相違している。従って、以下、かかる相違点を中心として説明する。
第3実施形態に係る文書処理装置10の機能は、図5に示したように、第1実施形態に係る文書処理装置10の機能に加えて、閲覧情報取得部(閲覧情報取得手段)17を含む。
閲覧情報取得部17は、出力された文書特定情報に基づいて、当該文書特定情報により特定される文書を、ユーザが閲覧したか否かを表す閲覧情報を取得する。本例では、クライアント装置は、閲覧情報を取得し、取得した閲覧情報を文書処理装置10へ送信する。閲覧情報取得部17は、クライアント装置から閲覧情報を受信することにより当該閲覧情報を取得する。
第3実施形態に係る検索結果記憶部14は、検索用文字列と、当該検索用文字列に対する検索処理により生成された文書特定情報と、当該検索処理に基づいて出力された当該文書特定情報に対して閲覧情報取得部17により取得された閲覧情報と、を対応付けて記憶する。
第3実施形態に係る順位補正部15は、検索処理実行部13によって実行された検索処理により生成された文書特定情報のそれぞれに対して、第1の順位補正条件、及び、第2の順位補正条件の両方が成立するか否かを判定する判定処理を実行する。
第1の順位補正条件は、検索用文字列受付部12により受け付けられた検索用文字列(第2の検索用文字列)と、当該判定処理の対象となる文書特定情報と対応付けて検索結果記憶部14に記憶されている検索用文字列(第1の検索用文字列)の一部と、が一致するという条件である。
第2の順位補正条件は、上記第1の検索用文字列及び、及び、当該判定処理の対象となる文書特定情報と対応付けて記憶されている閲覧情報が、当該文書特定情報により特定される文書をユーザが閲覧した旨を表すという条件である。
順位補正部15は、第1の順位補正条件、及び、第2の順位補正条件の両方が成立すると判定した場合、検索処理実行部13により生成された順位情報のうちの、当該判定処理の対象となる文書特定情報に対して生成された順位情報が表す順位を下げるように当該順位情報を補正する。
ところで、第1の検索用文字列に対して実行された検索処理に基づいて出力された文書特定情報により特定される文書を、ユーザが閲覧した場合、当該文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性がより一層高い。
従って、本発明の第3実施形態に係る文書処理装置10によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性をより一層確実に低減することができる。
<第4実施形態>
次に、本発明の第4実施形態に係る文書処理装置について図6を参照しながら説明する。
第4実施形態に係る文書処理装置100は、
検索用文字列を受け付ける検索用文字列受付部(検索用文字列受付手段)101と、
上記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行部(検索処理実行手段)102と、
上記検索用文字列と、当該検索用文字列に対する上記検索処理により生成された上記文書特定情報と、を対応付けて記憶する検索結果記憶部(検索結果記憶手段)103と、
上記受け付けられた検索用文字列と、上記検索処理により生成された上記文書特定情報と対応付けて記憶されている上記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された上記順位情報が表す順位を下げるように当該順位情報を補正する順位補正部(順位補正手段)104と、
を備える。
ところで、第1の検索用文字列(例えば、「プリンタ」)に対して検索処理が実行され、その後、第1の検索用文字列の一部である第2の検索用文字列(例えば、「プリン」)に対して検索処理が実行された場合を想定する。
この場合、第2の検索用文字列に対する検索処理によって特定される文書は、第1の検索用文字列に対する検索処理によって特定された文書と同一の文書も含む。しかしながら、第1の検索用文字列に対する検索処理によって特定された文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性が高い。
従って、上記のように構成された文書処理装置100によれば、第2の検索用文字列に対する検索処理によって特定された文書のうちの、第1の検索用文字列に対する検索処理によって特定された文書と同一の文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性を低減することができる。即ち、上記文書処理装置100によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性を低減することができる。
以上、上記実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成及び詳細に、本願発明の範囲内において当業者が理解し得る様々な変更をすることができる。
なお、上記各実施形態において文書処理装置10の各機能は、CPUがプログラム(ソフトウェア)を実行することにより実現されていたが、回路等のハードウェアにより実現されていてもよい。
また、上記各実施形態においてプログラムは、記憶装置に記憶されていたが、コンピュータが読み取り可能な記録媒体に記憶されていてもよい。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。
また、上記実施形態の他の変形例として、上述した実施形態及び変形例の任意の組み合わせが採用されてもよい。
<付記>
上記実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限られない。
(付記1)
検索用文字列を受け付ける検索用文字列受付手段と、
前記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行手段と、
前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、を対応付けて記憶する検索結果記憶手段と、
前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する順位補正手段と、
を備える文書処理装置。
ところで、第1の検索用文字列(例えば、「プリンタ」)に対して検索処理が実行され、その後、第1の検索用文字列の一部である第2の検索用文字列(例えば、「プリン」)に対して検索処理が実行された場合を想定する。
この場合、第2の検索用文字列に対する検索処理によって特定される文書は、第1の検索用文字列に対する検索処理によって特定された文書と同一の文書も含む。しかしながら、第1の検索用文字列に対する検索処理によって特定された文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性が高い。
従って、上記のように構成された文書処理装置によれば、第2の検索用文字列に対する検索処理によって特定された文書のうちの、第1の検索用文字列に対する検索処理によって特定された文書と同一の文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性を低減することができる。即ち、上記文書処理装置によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性を低減することができる。
(付記2)
付記1に記載の文書処理装置であって、
前記検索処理は、前記特定された文書にて、前記受け付けられた検索用文字列と同一の文字列が配置されている位置である一致位置を特定する処理を含み、
前記検索結果記憶手段は、前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理により当該文書特定情報に対して特定された前記一致位置を表す一致位置情報と、を対応付けて記憶するように構成され、
前記順位補正手段は、前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合において、当該文書特定情報に対して特定された前記一致位置が、当該検索用文字列及び当該文書特定情報と対応付けて記憶されている前記一致位置情報が表す一致位置に含まれるとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正するように構成された文書処理装置。
ところで、同一の文書に対して、第2の検索用文字列に対して実行された検索処理により特定された一致位置が、第1の検索用文字列に対して実行された検索処理により特定された一致位置に含まれる場合、当該文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性がより一層高い。
従って、上記のように構成された文書処理装置によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性をより一層確実に低減することができる。
(付記3)
付記1又は付記2に記載の文書処理装置であって、
前記順位情報が表す順位に従って、前記文書特定情報を出力する検索結果出力手段を備える文書処理装置。
(付記4)
付記3に記載の文書処理装置であって、
前記出力された文書特定情報に基づいて、当該文書特定情報により特定される文書を、ユーザが閲覧したか否かを表す閲覧情報を取得する閲覧情報取得手段を備え、
前記検索結果記憶手段は、前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理に基づいて出力された当該文書特定情報に対して取得された前記閲覧情報と、を対応付けて記憶するように構成され、
前記順位補正手段は、前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合において、当該検索用文字列及び当該文書特定情報と対応付けて記憶されている前記閲覧情報が、当該文書特定情報により特定される文書をユーザが閲覧した旨を表すとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正するように構成された文書処理装置。
ところで、第1の検索用文字列に対して実行された検索処理に基づいて出力された文書特定情報により特定される文書を、ユーザが閲覧した場合、当該文書と、第2の検索用文字列と、の間の相関は、比較的小さい可能性がより一層高い。
従って、上記のように構成された文書処理装置によれば、検索用文字列との間の相関が比較的小さい文書を特定するための文書特定情報が出力される順位が、過度に上位に設定される可能性をより一層確実に低減することができる。
(付記5)
付記1乃至付記4のいずれか一項に記載の文書処理装置であって、
前記検索処理実行手段は、N−gram方式に従って前記検索処理を実行するように構成された文書処理装置。
(付記6)
第1の検索用文字列を受け付け、
前記受け付けられた第1の検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行し、
前記第1の検索用文字列と、当該第1の検索用文字列に対する前記検索処理により生成された前記文書特定情報と、を対応付けて記憶し、
第2の検索用文字列を受け付け、
前記受け付けられた第2の検索用文字列に対して前記検索処理を実行し、
前記受け付けられた第2の検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記第1の検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する、文書処理方法。
(付記7)
付記6に記載の文書処理方法であって、
前記検索処理は、前記特定された文書にて、前記受け付けられた検索用文字列と同一の文字列が配置されている位置である一致位置を特定する処理を含み、
前記第1の検索用文字列と、当該第1の検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理により当該文書特定情報に対して特定された前記一致位置を表す一致位置情報と、を対応付けて記憶し、
前記受け付けられた第2の検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記第1の検索用文字列の一部と、が一致する場合において、当該文書特定情報に対して特定された前記一致位置が、当該第1の検索用文字列及び当該文書特定情報と対応付けて記憶されている前記一致位置情報が表す一致位置に含まれるとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する、文書処理方法。
(付記8)
付記6又は付記7に記載の文書処理方法であって、
前記順位情報が表す順位に従って、前記文書特定情報を出力する、文書処理方法。
(付記9)
付記8に記載の文書処理方法であって、
前記出力された文書特定情報に基づいて、当該文書特定情報により特定される文書を、ユーザが閲覧したか否かを表す閲覧情報を取得し、
前記第1の検索用文字列と、当該第1の検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理に基づいて出力された当該文書特定情報に対して取得された前記閲覧情報と、を対応付けて記憶し、
前記受け付けられた第2の検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記第1の検索用文字列の一部と、が一致する場合において、当該第1の検索用文字列及び当該文書特定情報と対応付けて記憶されている前記閲覧情報が、当該文書特定情報により特定される文書をユーザが閲覧した旨を表すとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する、文書処理方法。
(付記10)
情報処理装置に、
検索用文字列を受け付ける検索用文字列受付手段と、
前記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行手段と、
前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、を対応付けて記憶する検索結果記憶手段と、
前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する順位補正手段と、
を実現させるためのプログラム。
(付記11)
付記10に記載のプログラムであって、
前記検索処理は、前記特定された文書にて、前記受け付けられた検索用文字列と同一の文字列が配置されている位置である一致位置を特定する処理を含み、
前記検索結果記憶手段は、前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理により当該文書特定情報に対して特定された前記一致位置を表す一致位置情報と、を対応付けて記憶するように構成され、
前記順位補正手段は、前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合において、当該文書特定情報に対して特定された前記一致位置が、当該検索用文字列及び当該文書特定情報と対応付けて記憶されている前記一致位置情報が表す一致位置に含まれるとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正するように構成されたプログラム。
(付記12)
付記10又は付記11に記載のプログラムであって、
前記情報処理装置に、更に、
前記順位情報が表す順位に従って、前記文書特定情報を出力する検索結果出力手段を実現させるためのプログラム。
(付記13)
付記12に記載のプログラムであって、
前記情報処理装置に、更に、
前記出力された文書特定情報に基づいて、当該文書特定情報により特定される文書を、ユーザが閲覧したか否かを表す閲覧情報を取得する閲覧情報取得手段を実現させるとともに、
前記検索結果記憶手段は、前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理に基づいて出力された当該文書特定情報に対して取得された前記閲覧情報と、を対応付けて記憶するように構成され、
前記順位補正手段は、前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合において、当該検索用文字列及び当該文書特定情報と対応付けて記憶されている前記閲覧情報が、当該文書特定情報により特定される文書をユーザが閲覧した旨を表すとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正するように構成されたプログラム。
本発明は、文書を表す文書データを処理する文書処理装置等に適用可能である。
10 文書処理装置
11 文書記憶部
12 検索用文字列受付部
13 検索処理実行部
14 検索結果記憶部
15 順位補正部
16 検索結果出力部
17 閲覧情報取得部
100 文書処理装置
101 検索用文字列受付部
102 検索処理実行部
103 検索結果記憶部
104 順位補正部

Claims (10)

  1. 検索用文字列を受け付ける検索用文字列受付手段と、
    前記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行手段と、
    前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、を対応付けて記憶する検索結果記憶手段と、
    前記検索用文字列受付手段により受け付けられた検索用文字列と、前記検索結果記憶手段に前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する順位補正手段と、
    を備える文書処理装置。
  2. 請求項1に記載の文書処理装置であって、
    前記検索処理は、前記特定された文書にて、前記受け付けられた検索用文字列と同一の文字列が配置されている位置である一致位置を特定する処理を含み、
    前記検索結果記憶手段は、前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理により当該文書特定情報に対して特定された前記一致位置を表す一致位置情報と、を対応付けて記憶するように構成され、
    前記順位補正手段は、前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合において、当該文書特定情報に対して特定された前記一致位置が、当該検索用文字列及び当該文書特定情報と対応付けて記憶されている前記一致位置情報が表す一致位置に含まれるとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正するように構成された文書処理装置。
  3. 請求項1又は請求項2に記載の文書処理装置であって、
    前記順位情報が表す順位に従って、前記文書特定情報を出力する検索結果出力手段を備える文書処理装置。
  4. 請求項3に記載の文書処理装置であって、
    前記出力された文書特定情報に基づいて、当該文書特定情報により特定される文書を、ユーザが閲覧したか否かを表す閲覧情報を取得する閲覧情報取得手段を備え、
    前記検索結果記憶手段は、前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理に基づいて出力された当該文書特定情報に対して取得された前記閲覧情報と、を対応付けて記憶するように構成され、
    前記順位補正手段は、前記受け付けられた検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合において、当該検索用文字列及び当該文書特定情報と対応付けて記憶されている前記閲覧情報が、当該文書特定情報により特定される文書をユーザが閲覧した旨を表すとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正するように構成された文書処理装置。
  5. 請求項1乃至請求項4のいずれか一項に記載の文書処理装置であって、
    前記検索処理実行手段は、N−gram方式に従って前記検索処理を実行するように構成された文書処理装置。
  6. 第1の検索用文字列を受け付け、
    前記受け付けられた第1の検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行し、
    前記第1の検索用文字列と、当該第1の検索用文字列に対する前記検索処理により生成された前記文書特定情報と、を対応付けて記憶し、
    第2の検索用文字列を受け付け、
    前記受け付けられた第2の検索用文字列に対して前記検索処理を実行し、
    前記受け付けられた第2の検索用文字列と、記憶している前記文書特定情報と対応付けて記憶されている前記第1の検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する、文書処理方法。
  7. 請求項6に記載の文書処理方法であって、
    前記検索処理は、前記特定された文書にて、前記受け付けられた検索用文字列と同一の文字列が配置されている位置である一致位置を特定する処理を含み、
    前記第1の検索用文字列と、当該第1の検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理により当該文書特定情報に対して特定された前記一致位置を表す一致位置情報と、を対応付けて記憶し、
    前記受け付けられた第2の検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記第1の検索用文字列の一部と、が一致する場合において、当該文書特定情報に対して特定された前記一致位置が、当該第1の検索用文字列及び当該文書特定情報と対応付けて記憶されている前記一致位置情報が表す一致位置に含まれるとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する、文書処理方法。
  8. 請求項6又は請求項7に記載の文書処理方法であって、
    前記順位情報が表す順位に従って、前記文書特定情報を出力する、文書処理方法。
  9. 請求項8に記載の文書処理方法であって、
    前記出力された文書特定情報に基づいて、当該文書特定情報により特定される文書を、ユーザが閲覧したか否かを表す閲覧情報を取得し、
    前記第1の検索用文字列と、当該第1の検索用文字列に対する前記検索処理により生成された前記文書特定情報と、当該検索処理に基づいて出力された当該文書特定情報に対して取得された前記閲覧情報と、を対応付けて記憶し、
    前記受け付けられた第2の検索用文字列と、前記検索処理により生成された前記文書特定情報と対応付けて記憶されている前記第1の検索用文字列の一部と、が一致する場合において、当該第1の検索用文字列及び当該文書特定情報と対応付けて記憶されている前記閲覧情報が、当該文書特定情報により特定される文書をユーザが閲覧した旨を表すとき、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する、文書処理方法。
  10. 情報処理装置に、
    検索用文字列を受け付ける検索用文字列受付手段と、
    前記受け付けられた検索用文字列と同一の文字列を含む文書を特定するとともに、当該特定された文書のそれぞれに対して、当該文書を特定するための文書特定情報と、当該文書特定情報が出力される順位を表す順位情報と、を生成する検索処理を実行する検索処理実行手段と、
    前記検索用文字列と、当該検索用文字列に対する前記検索処理により生成された前記文書特定情報と、を対応付けて記憶する検索結果記憶手段と、
    前記検索用文字列受付手段により受け付けられた検索用文字列と、前記検索結果記憶手段に前記文書特定情報と対応付けて記憶されている前記検索用文字列の一部と、が一致する場合、当該文書特定情報に対して生成された前記順位情報が表す順位を下げるように当該順位情報を補正する順位補正手段と、
    を実現させるためのプログラム。
JP2010197243A 2010-09-03 2010-09-03 文書処理装置、文書処理方法、及び、プログラム Active JP5640578B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010197243A JP5640578B2 (ja) 2010-09-03 2010-09-03 文書処理装置、文書処理方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010197243A JP5640578B2 (ja) 2010-09-03 2010-09-03 文書処理装置、文書処理方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2012053797A JP2012053797A (ja) 2012-03-15
JP5640578B2 true JP5640578B2 (ja) 2014-12-17

Family

ID=45907006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010197243A Active JP5640578B2 (ja) 2010-09-03 2010-09-03 文書処理装置、文書処理方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP5640578B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3696745B2 (ja) * 1999-02-09 2005-09-21 株式会社日立製作所 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3636941B2 (ja) * 1999-07-19 2005-04-06 松下電器産業株式会社 情報検索方法と情報検索装置
JP4581402B2 (ja) * 2003-12-26 2010-11-17 ソニー株式会社 投稿受信サーバ,投稿支援方法,およびそのプログラム
JP2008146147A (ja) * 2006-12-06 2008-06-26 Nec Corp 情報提示装置、情報提示方法及び情報提示用プログラム

Also Published As

Publication number Publication date
JP2012053797A (ja) 2012-03-15

Similar Documents

Publication Publication Date Title
US9378290B2 (en) Scenario-adaptive input method editor
WO2017088415A1 (zh) 检索视频内容的方法、装置和电子设备
US8195634B2 (en) Domain-aware snippets for search results
US10394839B2 (en) Crowdsourcing application history search
JP2016513827A (ja) アプリケーションへの状態リンクを含む検索結果の生成
US20120330955A1 (en) Document similarity calculation device
US20130304370A1 (en) Method and apparatus to provide location information
JP5733307B2 (ja) 情報配信システム
JP5640578B2 (ja) 文書処理装置、文書処理方法、及び、プログラム
JP2016528594A (ja) 電子文書の作成および検索方法と非一時的コンピュータ可読記録媒体
US10592572B2 (en) Application view index and search
US20170054865A1 (en) Information processing system, information processing apparatus, and method for processing information
JP5410409B2 (ja) プロフィール情報評価支援装置、プロフィール情報評価支援方法及びプログラム
JP6618103B1 (ja) 文章生成装置、文章生成方法、および文章生成プログラム
US20140289741A1 (en) Cooperation method, image processing device, and medium
JP5644558B2 (ja) 文書関連度算出装置
JP5636700B2 (ja) 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム
JP5644244B2 (ja) 文書処理装置、文書処理方法、及び、プログラム
JP5756350B2 (ja) 電話帳管理システム、電話帳管理方法
JP2008134925A (ja) アンケートブログシステムおよび方法
JP5630140B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP6175414B2 (ja) 文書処理装置および文書処理プログラム
JP2012141905A (ja) 文書検索装置
JP2022121747A (ja) データ変換装置およびデータ変換方法
JP2011248819A (ja) コンテンツ管理システム、コンテンツ管理方法、情報処理装置、及び、プログラム

Legal Events

Date Code Title Description
RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20120718

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141013

R150 Certificate of patent or registration of utility model

Ref document number: 5640578

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150