JP4439562B2 - 電子データ検索装置 - Google Patents

電子データ検索装置 Download PDF

Info

Publication number
JP4439562B2
JP4439562B2 JP2008044034A JP2008044034A JP4439562B2 JP 4439562 B2 JP4439562 B2 JP 4439562B2 JP 2008044034 A JP2008044034 A JP 2008044034A JP 2008044034 A JP2008044034 A JP 2008044034A JP 4439562 B2 JP4439562 B2 JP 4439562B2
Authority
JP
Japan
Prior art keywords
electronic data
word
search
recorded
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008044034A
Other languages
English (en)
Other versions
JP2009205222A (ja
Inventor
寛 村上
吉男 西本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008044034A priority Critical patent/JP4439562B2/ja
Priority to US12/378,292 priority patent/US8180772B2/en
Priority to CN200910008379A priority patent/CN101520795A/zh
Publication of JP2009205222A publication Critical patent/JP2009205222A/ja
Application granted granted Critical
Publication of JP4439562B2 publication Critical patent/JP4439562B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、記録された電子データの中から、指定されたワードを含む電子データを検索する電子データ検索装置、特に、記録された電子データを検索するための検索ワードの設定に関する。
記録された電子データの中から、指定されたワードを含む電子データを検索する電子データ検索装置においては、電子データの検索を可能にするために、電子データについて検索ワードの設定が行われる。
検索ワードの設定方法としては、特許文献1に開示されているように、記録された電子データ毎に抽出したワードの出現回数(頻度)に基づいて、検索ワードを設定する方法がある。
ここで、特許文献1の検索ワードの設定方法を、図7を用いて説明する。
100は、文書データ等の各種電子データを記録するフォルダXで、101は文書をスキャナなどで読み取ることによって生成された電子データAで、102は同電子データBである。
111は、電子データAにおけるワードに対応させて当該ワードの出現回数を記録した検索ワード設定テーブルで、112は、電子データBの同テーブルである。前記検索ワード設定テーブル(111、112)は、電子データ毎に対応付けられて生成される。ここで、ワードとは電子データに含まれる文書データを構成する、日本語、英語などの文書の単語を示す。
なお、本実施例では、文書データとして英文を例示しているが、この場合、be動詞、助動詞、助詞、冠詞は、検索対象として指定されることは殆どないので除外している。
そして、前記テーブルにおいて所定回数(例えば、3回)以上の出現回数のワード(“MFP”)を検索ワードとして設定する(図中“○”参照)。
以後、ユーザが電子データの検索を前記電子データ検索装置に指示すると、指示を受けた電子データ検索装置は、当該設定された検索ワードを基準に電子データの検索処理を実行する。
特開平06−19970号公報
通常、同一フォルダには、同一ジャンルに属する電子データを記録するものである。前述の例では、フォルダX100には、MFP関連の文書データ(電子データ)が記録され、“MFP”に関連する検索ワードが設定される。
このようにして検索ワードが設定された場合、例えば、新たにMFP及びLCDに関連する検索ワード設定テーブル113の電子データC103を、MFP関連の文書データが記録されているフォルダX100に記録する場合を想定する。
電子データC103は、MFP及びLCD関連の文書データであるが、前述の検索ワード設定方法によれば、電子データC103の検索ワード設定テーブル113に基づき、出現回数が4の“LCD”が検索ワードとして設定されるが、出現回数が1の“MFP”は検索ワードとして設定されない。
ここで、ユーザが“MFP”を検索ワードして指定して、“MFP”を含む電子データの検索を電子データ検索装置に指示すると、検索ワードとして“MFP”が設定されている電子データA101及び同B102は検索されるが、検索ワードとして“MFP”が設定されていない電子データC103は検索されることがない。
このように、各電子データにおけるワードの出現回数のみに基づき検索ワードを設定すると、同一フォルダに同一ジャンルに属する電子データを記録する場合においては、電子データにおけるジャンルによるワードの出現回数の相違を反映して、検索ワードを設定することができない。つまり、関連(類似)する電子データを集約して検索することができず、その結果、検索精度が低下してしまう。
一方、前述の所定回数(例えば、3回)を少なくして、各電子データに設定する検索ワード数を多くすると、検索ワードが多種多様になってしまい、検索効率が低下するだけでなく、検索ノイズが発生し易くなり検索精度が低下する。
本発明は、かかる実情に鑑みてなされたものであり、電子データにおけるジャンルによるワードの出現回数の相違を反映して、検索ワードを設定することで、検索効率を低下させることなく検索精度を向上させた電子データ検索装置を提供することを目的とする。
第1の技術手段は、ワードデータを含む電子データからワードを抽出するワード抽出部と、記録される検索対象の電子データ毎に当該電子データから抽出されるワードとその出現回数を対応させて記録する検索ワード設定テーブルと、記録される検索対象となる全電子データから抽出されるワードとその出現回数を対応させて記録する検索ワード設定用参照テーブルを有し、記録される電子データの前記検索ワード設定テーブルに所定回数以上出現するワード及び、当該検索ワード設定テーブルに出現し、かつ、前記検索ワード設定用参照テーブルにおいて所定回数以上出現するワードを当該電子データの検索ワードとして設定する電子データ検索装置において、電子データが記録された日時及び/又は当該電子データが閲覧された最新の日時を示すタイムスタンプ情報を前記電子データに併せて記録し、前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間に応じて、前記検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新することを特徴とする電子データ検索装置。
第2の技術手段は、第1の技術手段において、記録された電子データを削除した場合、前記検索ワード設定用参照テーブルにおけるワードの出現回数から前記削除した電子データのワードの出現回数を同一ワード毎に減算することによって、前記検索ワード設定用参照テーブルにおけるワードの出現回数を更新することを特徴とする。
の技術手段は、第1又は第2の技術手段において、前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間が所定時間を超えている電子データを除いた各電子データについての前記検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することによって前記検索ワード設定用参照テーブルのワードの出現回数の記録値を修正更新することを特徴とする。
の技術手段は、第1又は第2の技術手段において、前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間が所定時間を超えている各電子データについての前記検索ワード設定テーブルにおけるワードの出現回数に1/n(n>1)を乗算した補正出現回数を、前記修正更新した検索ワード設定用参照テーブルにおけるワード毎の出現回数の記録値に加算することを特徴とする。
の技術手段は、第1又は第2の技術手段において、電子データの閲覧回数を当該電子データと併せて記録し、当該記録した閲覧回数に応じて、前記検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新することを特徴とする。
の技術手段は、第の技術手段において、前記電子データの閲覧回数が所定回数を超えている各電子データのみの前記検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することによって前記検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新することを特徴とする。
の技術手段は、第の技術手段において、前記電子データの閲覧回数が所定回数を超えていない各電子データについての前記検索ワード設定テーブルにおけるワードの出現回数に1/n(n>1)を乗算した補正出現回数を、前記修正更新した検索ワード設定用参照テーブルにおけるワード毎の出現回数の記録値に加算することを特徴とする。
本発明により、電子データにおけるジャンルによるワードの出現回数の相違を反映して、検索ワードを設定することができるので、指定された検索ワードに基づいて当該検索ワードを含む電子データを検索する際の検索効率を低下させることなく、検索精度を向上できる。その結果、ユーザの利便性が向上する。
(実施例1)
図1は、本発明の概要を説明するための概略図である。
50は、各種電子データを記録するフォルダXで、51はワードデータを含む電子データAで、52は同電子データBである。なお、前述のように、各電子データは、MFP関連の文書(データ)である。
61は、電子データAの検索ワード設定テーブルで、62は、電子データBの検索ワード設定テーブルである。検索ワード設定テーブル(61、62)は、電子データ毎に対応付けられて生成され、必要に応じてフォルダに記録される。
検索ワード設定テーブルは、記録される検索対象の電子データ毎に当該電子データから抽出されるワードとその出現回数を対応させて記録したものである。
71は、検索ワード設定用参照テーブルで、記録される検索対象となる全電子データから抽出されるワードとその出現回数を対応させて記録したものである。
本発明に係わる電子データ検索装置は、記録される電子データA51の検索ワード設定テーブル61に所定回数(例えば、3回)以上出現するワードだけでなく、さらに、検索ワード設定テーブル61に出現し、かつ、検索ワード設定用参照テーブル71において所定回数(例えば、3回)以上出現するワード(“MFP”)を電子データA51の検索ワードとして設定する( “○”参照)。
なお、電子データB52についても同様である。
以後、前記設定された検索ワードに基づいて、当該検索ワードを含む電子データの検索を実行することになる。
検索ワード設定用参照テーブル71は、後述のように、電子データAの検索ワード設定テーブル61と電子データBの検索ワード設定テーブル62とを合成、すなわち、両検索ワード設定テーブル内のワード毎に当該ワードの出現回数を加算することにより作成される。
なお、電子データが一つの場合には、当該電子データの検索ワード設定テーブルが検索ワード設定用参照テーブルとして機能することになる。
図2は、図1で説明したフォルダX50に、新たに電子データを追加した場合に、本発明に係わる電子データ検索装置で実行される、検索ワード設定処理について説明するための図である。なお、検索ワード設定テーブル(61、62)は説明上図示を省略している。
53は、フォルダX50内に新たに記録する、ワードデータを含む電子データCで、63は、電子データCの検索ワード設定テーブルである。なお、電子データCは、MFP及びLCD関連の電子データであるとする。
72は、図1の検索ワード設定用参照テーブル71と電子データC53の検索ワード設定テーブル63とを合成、つまり、ワード毎に、当該ワードの出現回数を加算することにより新たに生成した検索ワード設定用参照テーブルである。
すなわち、検索ワード設定用参照テーブル72は、電子データC53を追加したことにより、検索ワード設定用参照テーブル71を更新したものである。
この場合、前述のように、記録される電子データC53の検索ワード設定テーブル63に所定回数(例えば、3回)以上出現するワード(“LCD”)だけでなく、さらに、検索ワード設定テーブル63に出現し、かつ、検索ワード設定用参照テーブル72において所定回数(例えば、3回)以上出現するワード(“MFP”)も電子データの検索ワードとして設定する( “○”参照)。
つまり、電子データC53の検索ワードとして、“MFP”、“LCD”が設定される。
以後、前記設定された検索ワードに基づいて、当該検索ワードを含む電子データの検索を実行することになる。
このようにすることで、検索精度が向上する。特に、“MFP”と“LCD”とをAND検索した場合には、従来例で説明した電子データ検索装置によれば、電子データC53を検索することができないが、本発明に係わる電子データ検索装置によれば、電子データC53を検索できる。
図3は、本発明に係わる電子データ検索装置10を説明するためのブロック図で、電子データ検索装置10は、電子データを検索するだけでなく、電子データを閲覧(ファイルを開く)することもできる。
11は、OCR部で、印字文字などを光学的に読み取ることによりワードデータを含む電子データを生成し、生成した電子データ内の文字を識別する。なお、生成した電子データは、HDD23のフォルダに記録される。
電子データは、テキストデータ(テキストファイル、HTMLファイル)、PDF形式で記録された文書データ(PDFファイル)、文字原稿を電子カメラで撮像した文字情報を含むJPEGファイルなどでもよい。また、電子データは、他の情報処理装置等から電子データ検索装置10に入力されたものであってもよい。
12は、ワード抽出部で、OCR部が識別した文字(列)から、ワード(単語)を抽出する。なお、ワードの抽出方法としては、従来より提案されている様々な方法、例えば、特許文献1に開示されている方法を用いることができる。
13は、検索ワード設定テーブル生成部で、例えばOCR部11が生成した電子データに基づいて、ワード抽出部12が抽出したワードと当該ワードの出現回数を対応させて記録した検索ワード設定テーブル(図1の検索ワード設定テーブル(61〜63)参照)を生成する。生成した検索ワード設定テーブルは、必要に応じて、前記電子データを記録したHDD23のフォルダに記録される。
14は、検索ワード設定用参照テーブル生成部で、記録される検索対象となる全電子データから抽出されるワードと当該ワードの出現回数を対応させて記録する検索ワード設定用参照テーブル(図1の検索ワード設定用参照テーブル71、72参照)を生成する。生成した検索ワード設定用参照テーブルは、必要に応じて、前記電子データを記録したHDD23のフォルダに記録される。
生成方法の一例としては、図1で説明したように、検索ワード設定テーブル生成部13が生成した各検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することにより新たに検索ワード設定用参照テーブルを生成する。
また、図2で説明したように、新たな電子データをHDD23のフォルダに記録する場合には、まず、検索ワード設定テーブル生成部13は、前記新たな電子データの検索ワード設定テーブルを生成する。そして、検索ワード設定用参照テーブル生成部14は、HDD23のフォルダに記録されている検索ワード設定用参照テーブルと前記新たに生成した検索ワード設定テーブルとを合成、つまり、前記検索ワード設定用参照テーブルと前記新たに生成した検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することにより新たに検索ワード設定用参照テーブルを生成する(検索ワード設定用参照テーブルを更新する)。
15は、検索ワード設定部で、電子データの検索ワード設定テーブルに所定回数(例えば、3回)以上出現するワード、及び、電子データの検索ワード設定テーブルに記録されたワードの中から、検索ワード設定用参照テーブル生成部14が生成した検索ワード設定用参照テーブルにおいて所定回数(例えば、3回)以上の出現回数のワードを特定し、当該特定したワードを、電子データの検索ワードとして設定する(図1の“○”参照)。
16は、電子データ検索部で、ユーザが、キーボード・マウス(図示しない)等を介して指定した検索ワードを含む電子データの検索を実行する。
21はRAM、22はROMである。HDD23は、各種アプリケーション等を記録する大容量記録装置で、分割された記録領域つまりフォルダA(23a)〜フォルダZ(23z)を有する。これらのフォルダに、前述の電子データが記録される。なお、当該電子データの検索ワード設定テーブル、検索ワード設定用参照テーブルも必要に応じて記録される。
24は、各機能ブロックを制御するCPUである。
図4は、検索ワード設定処理を説明するためのフロー図である。
なお、既に、電子データがフォルダに記録されているものとする。
ワード抽出部12は、フォルダに記録されている電子データからワードを抽出する(ステップS1)と、検索ワード設定テーブル生成部13は、前記抽出したワードとその出現回数を対応させて積算する、つまり、前記抽出したワードに基づいて前記電子データの検索ワード設定テーブルを生成する(ステップS2)。
次に、検索ワード設定用参照テーブル生成部14は、検索ワード設定用参照テーブルを更新する(ステップS3)。ここでは、既に検索ワード設定用参照テーブルが生成されているものとする。
検索ワード設定部15は、検索ワード設定テーブルにおいて所定回数以上の出現回数のワードを特定して、特定したワードを検索ワードとして設定する(ステップS4)。
さらに、検索ワード設定部15は、検索ワード設定テーブルに出現し、かつ、検索ワード設定用参照テーブルにおいて所定回数以上出現するワードを特定して、特定したワードを検索ワードとして設定する(ステップS5)。
以後、電子データ検索装置10は、前記設定された検索ワードに基づいて、電子データの検索処理を実行する。
前述の各ステップをプログラムによって実行することができる。
(実施例2)
実施例1では、電子データが記録されているフォルダに新たに電子データを記録した場合に実行される検索ワード設定用参照テーブルの更新処理について説明したが、実施例2では、電子データが記録されているフォルダXから他のフォルダYに電子データを移動(又はコピー)した場合に実行される検索ワード設定用参照テーブルの更新処理について図5を用いて説明する。
なお、フォルダYは、OCRに関連する電子データが記録されているものとする。
ここでは、例えば、フォルダX50内の電子データA51をフォルダY60に移動した場合、つまり、フォルダX50内の電子データA51を削除して、当該電子データA51をフォルダY60に新たに記録した場合の検索ワード設定用参照テーブルの更新処理について説明する。なお、電子データA51は、前述のようにMFP関連の文書であるだけでなく、OCR関連の文書でもある。
ユーザの指示によりフォルダX50に記録された電子データA51をフォルダY60に移動すると、電子データA51の移動元フォルダX50に記録された検索ワード設定用参照テーブル72の出現回数から、電子データA51の検索ワード設定テーブル61の出現回数を、同一ワード毎に減算し、検索ワード設定用参照テーブル生成部14は、新たに検索ワード設定用参照テーブル73を生成する(電子データの移動による検索ワード設定用参照テーブルの更新)。
なお、電子データA51をコピーし、当該コピーした電子データA51をフォルダX50からフォルダY60に移動する場合には、前記更新処理は行わない。
そして、電子データA51の移動先のフォルダY60に記録されている、電子データD54及び電子データE55の検索ワード設定テーブル(図示しない)を合成した検索ワード設定用参照テーブル74に対して、実施例1で説明したように、電子データA51の検索ワード設定テーブル61を合成し、新たに検索ワード設定用参照テーブル75を生成する。
最後に、前述のように、検索ワード設定部15が、電子データA51の検索ワード設定テーブル61に所定回数以上出現するワード(“MFP”)、及び、検索ワード設定テーブル61に出現し、かつ、検索ワード設定用参照テーブル75において所定回数以上出現するワード(“OCR”)を電子データAの検索ワードとして設定する。
電子データD54及び電子データE55の検索ワードとしては、“OCR”が設定される。
なお、新たに電子データを追加記録して、検索ワード設定用参照テーブルを更新することにより、当該検索ワード設定用参照テーブルにおけるワードの出現回数が変化し、当該ワードの出現回数が所定回数以上になった場合、当該変化に対応して、既に記録されている電子データに含まれる前記ワードを検索ワードとして再設定することもできる。
(実施例3)
実施例3では、検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新し、当該修正更新した検索ワード設定用参照テーブルに基づき、新たに記録する電子データに検索ワードを設定することで、検索ノイズを低減できる電子データ検索装置について説明する。
図6は、本発明に係わる、他の電子データ検索装置10’を説明するためのブロック図である。
17は、出現回数記録値修正更新部で、電子データが記録された日時及び/又は当該電子データが閲覧された(電子データが開かれた)最新の日時を示すタイムスタンプ情報を前記電子データに併せて記録し、前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間に応じて、検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新する。
そして、新たに電子データが記録されると、検索ワード設定部15は、出現回数記録値修正更新部17によって修正更新された検索ワード設定用参照テーブルに基づき、前記電子データに検索ワードを設定する。
修正更新の手法としては、記録又は閲覧されてから長時間経過し、ユーザの利用が少ない電子データ、つまり、前記経過時間が所定時間を超えている電子データを除いた各電子データについての検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することによって、既に記録されている検索ワード設定用参照テーブルのワードの出現回数の記録値を修正更新する手法がある。
また、前記経過時間が所定時間を超えている各電子データについての検索ワード設定テーブルにおけるワードの出現回数に1/n(nは前記経過時間が長くなると大きくなる値:n>1)を乗算した補正出現回数を、前述の修正更新した検索ワード設定用参照テーブルにおけるワード毎の出現回数の記録値に加算してもよい。
他にも、記録された電子データをユーザが閲覧した回数を当該電子データと併せて記録し、当該記録した閲覧回数に応じて、検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新してもよい。
この場合には、前述の、記録した電子データの閲覧回数が所定回数を超えている各電子データ(頻繁に閲覧され、ユーザの関心が高い電子データ)のみの検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することによって既に記録されている検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新する。
また、記録された電子データの閲覧回数が所定回数を超えていない各電子データについての検索ワード設定テーブルにおけるワードの出現回数に1/n(nは前記閲覧回数が少なくなると大きくなる値:n>1)を乗算した補正出現回数を、前述の修正更新した検索ワード設定用参照テーブルにおけるワード毎の出現回数の記録値に加算してもよい。
なお、前記修正更新処理は、任意のタイミング、例えば、新たに電子データをフォルダに記録する処理に伴って実行される。
このようにすることで、主に前記経過時間が所定時間を超えている電子データに設定されている検索ワードが、新たに記録する電子データに含まれていても(当該ワードの出現回数が所定回数未満)、検索ワード設定用参照テーブルが参照されて当該電子データの検索ワードとして設定されることがない。
つまり、実施例1又は実施例2では、新たに記録する電子データに、主に前記経過時間が所定時間を超えている電子データに設定されている検索ワードと同一ワードが所定回数未満出現していても、検索ワード設定用参照テーブルが参照されて、当該ワードが検索ワードして設定されることになる。しかし、本実施例では、検索ワード設定用参照テーブルにおける当該ワードの出現回数の記録値が修正更新され、所定回数未満になっていれば、当該ワードが検索ワードして設定されない。
従って、主に所定時間を超えている電子データに設定されている検索ワードを指定した検索が実行されても、新たに記録する電子データが検索されることがなくなり、検索ノイズが低減する。
本発明の概要を説明するための概略図である。 本発明の概要を説明するための他の概略図である。 本発明に係わる電子データ検索装置を説明するためのブロック図である。 検索ワード設定処理を説明するためのフロー図である。 検索ワード設定用参照テーブルの更新処理について説明するための図である。 本発明に係わる他の電子データ検索装置を説明するためのブロック図である。 従来の検索ワードの設定方法を説明するための図である。
符号の説明
10…電子データ検索装置、11…OCR部、12…ワード抽出部、13…検索ワード設定テーブル生成部、14…検索ワード設定用参照テーブル生成部、15…検索ワード設定部、16…電子データ検索部、17…出現回数記録値修正更新部、21…RAM、22…ROM、23…HDD、24…CPU、50,60,100…フォルダ、51〜55,101〜103…電子データ、61〜63,111〜113…検索ワード設定テーブル、71〜75…検索ワード設定用参照テーブル。

Claims (7)

  1. ワードデータを含む電子データからワードを抽出するワード抽出部と、
    記録される検索対象の電子データ毎に当該電子データから抽出されるワードとその出現回数を対応させて記録する検索ワード設定テーブルと、
    記録される検索対象となる全電子データから抽出されるワードとその出現回数を対応させて記録する検索ワード設定用参照テーブルを有し、
    記録される電子データの前記検索ワード設定テーブルに所定回数以上出現するワード及び、当該検索ワード設定テーブルに出現し、かつ、前記検索ワード設定用参照テーブルにおいて所定回数以上出現するワードを当該電子データの検索ワードとして設定する電子データ検索装置において、
    電子データが記録された日時及び/又は当該電子データが閲覧された最新の日時を示すタイムスタンプ情報を前記電子データに併せて記録し、前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間に応じて、前記検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新することを特徴とする電子データ検索装置。
  2. 記録された電子データを削除した場合、前記検索ワード設定用参照テーブルにおけるワードの出現回数から前記削除した電子データのワードの出現回数を同一ワード毎に減算することによって、前記検索ワード設定用参照テーブルにおけるワードの出現回数を更新することを特徴とする請求項1に記載の電子データ検索装置。
  3. 前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間が所定時間を超えている電子データを除いた各電子データについての前記検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することによって前記検索ワード設定用参照テーブルのワードの出現回数の記録値を修正更新することを特徴とする請求項1又は2に記載の電子データ検索装置。
  4. 前記電子データが記録された日時又は当該電子データが閲覧された最新の日時からの経過時間が所定時間を超えている各電子データについての前記検索ワード設定テーブルにおけるワードの出現回数に1/n(n>1)を乗算した補正出現回数を、前記修正更新した検索ワード設定用参照テーブルにおけるワード毎の出現回数の記録値に加算することを特徴とする請求項1又は2に記載の電子データ検索装置。
  5. 電子データの閲覧回数を当該電子データと併せて記録し、当該記録した閲覧回数に応じて、前記検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新することを特徴とする請求項1又は2に記載の電子データ検索装置。
  6. 前記電子データの閲覧回数が所定回数を超えている各電子データのみの前記検索ワード設定テーブルのワード毎に当該ワードの出現回数を加算することによって前記検索ワード設定用参照テーブルにおけるワードの出現回数の記録値を修正更新することを特徴とする請求項に記載の電子データ検索装置。
  7. 前記電子データの閲覧回数が所定回数を超えていない各電子データについての前記検索ワード設定テーブルにおけるワードの出現回数に1/n(n>1)を乗算した補正出現回数を、前記修正更新した検索ワード設定用参照テーブルにおけるワード毎の出現回数の記録値に加算することを特徴とする請求項に記載の電子データ検索装置。
JP2008044034A 2008-02-26 2008-02-26 電子データ検索装置 Active JP4439562B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008044034A JP4439562B2 (ja) 2008-02-26 2008-02-26 電子データ検索装置
US12/378,292 US8180772B2 (en) 2008-02-26 2009-02-13 Electronic data retrieving apparatus
CN200910008379A CN101520795A (zh) 2008-02-26 2009-02-26 电子数据检索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008044034A JP4439562B2 (ja) 2008-02-26 2008-02-26 電子データ検索装置

Publications (2)

Publication Number Publication Date
JP2009205222A JP2009205222A (ja) 2009-09-10
JP4439562B2 true JP4439562B2 (ja) 2010-03-24

Family

ID=40999306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008044034A Active JP4439562B2 (ja) 2008-02-26 2008-02-26 電子データ検索装置

Country Status (3)

Country Link
US (1) US8180772B2 (ja)
JP (1) JP4439562B2 (ja)
CN (1) CN101520795A (ja)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619970A (ja) 1992-07-01 1994-01-28 Nec Corp キーワード抽出方式
JP2583386B2 (ja) 1993-03-29 1997-02-19 日本電気株式会社 キーワード自動抽出装置
US7051277B2 (en) * 1998-04-17 2006-05-23 International Business Machines Corporation Automated assistant for organizing electronic documents
US6549897B1 (en) * 1998-10-09 2003-04-15 Microsoft Corporation Method and system for calculating phrase-document importance
US6611825B1 (en) * 1999-06-09 2003-08-26 The Boeing Company Method and system for text mining using multidimensional subspaces
CN1211747C (zh) 2002-09-06 2005-07-20 威盛电子股份有限公司 文章关键词登录系统及方法
JP2004102678A (ja) 2002-09-10 2004-04-02 Minolta Co Ltd データ管理装置及びデータ管理プログラム
JP2006072705A (ja) 2004-09-02 2006-03-16 Fuji Xerox Co Ltd 文書検索装置および方法
US7716236B2 (en) * 2006-07-06 2010-05-11 Aol Inc. Temporal search query personalization
JP4234740B2 (ja) 2006-08-03 2009-03-04 株式会社東芝 キーワード提示装置、プログラムおよびキーワード提示方法
CN101067808B (zh) 2007-05-24 2010-12-15 上海大学 文本关键词的提取方法
US8005643B2 (en) * 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets

Also Published As

Publication number Publication date
US8180772B2 (en) 2012-05-15
US20090216753A1 (en) 2009-08-27
JP2009205222A (ja) 2009-09-10
CN101520795A (zh) 2009-09-02

Similar Documents

Publication Publication Date Title
US11250020B2 (en) Syncronizing content blocks between multiple electronic documents
US8312388B2 (en) Information processing apparatus, information processing method and computer readable medium
JP5437557B2 (ja) 検索処理方法及び検索システム
US7254593B2 (en) System and method for tracking annotations of data sources
US7401078B2 (en) Information processing apparatus, document search method, program, and storage medium
US8584009B2 (en) Automatically propagating changes in document access rights for subordinate document components to superordinate document components
JP2020513599A (ja) コンテンツ管理システムにおけるタスクの管理
US20050203935A1 (en) Clipboard content and document metadata collection
JP2020501208A (ja) コンテンツ管理システムにおけるプロジェクトの管理
JP2010165030A (ja) 文書管理システム、文書管理方法および文書管理プログラム
JP2004046357A (ja) 文書編集方法、文書編集システム、サーバ装置および文書編集プログラム
JP2008282305A (ja) コメントデータを関連付ける方法
JP2011039580A (ja) 文書処理装置、文書処理方法およびプログラム
JP2008226110A (ja) 情報処理装置、情報処理方法および制御プログラム
JP2007052737A (ja) 情報処理装置およびコンピュータプログラム
JP4439562B2 (ja) 電子データ検索装置
US20130073549A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2005107931A (ja) 画像検索装置
US10275127B2 (en) Client apparatus, information processing system, information processing method, and non-transitory computer readable medium
JP2004145706A (ja) マルチメディアデータ検索システム
JP5169291B2 (ja) 文書管理システム、画像形成装置およびプログラム
JP5942649B2 (ja) 画像形成装置及びプログラム
JP5377023B2 (ja) リスト作成情報設定装置、リスト作成情報設定方法、および、プログラム
CN116166720A (zh) 数据排序方法、装置,及电子设备
JPH10312387A (ja) 情報処理装置及び方法並びに情報処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100105

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4439562

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3