JP2010092383A5 - - Google Patents

Download PDF

Info

Publication number
JP2010092383A5
JP2010092383A5 JP2008263416A JP2008263416A JP2010092383A5 JP 2010092383 A5 JP2010092383 A5 JP 2010092383A5 JP 2008263416 A JP2008263416 A JP 2008263416A JP 2008263416 A JP2008263416 A JP 2008263416A JP 2010092383 A5 JP2010092383 A5 JP 2010092383A5
Authority
JP
Japan
Prior art keywords
electronic document
image data
document file
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008263416A
Other languages
English (en)
Other versions
JP2010092383A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2008263416A priority Critical patent/JP2010092383A/ja
Priority claimed from JP2008263416A external-priority patent/JP2010092383A/ja
Publication of JP2010092383A publication Critical patent/JP2010092383A/ja
Publication of JP2010092383A5 publication Critical patent/JP2010092383A5/ja
Pending legal-status Critical Current

Links

Claims (8)

  1. ネットワークに接続されている複数のコンピュータに記憶されている複数の電子文書ファイル中から所望の電子文書ファイルを検索する電子文書ファイル検索装置において、
    少なくともテキストデータが含まれる複数の前記電子文書ファイルを識別する情報、該電子文書ファイルが記憶されている位置に関する情報、及び前記テキストデータを取得する電子文書ファイル情報取得手段と、
    複数の前記電子文書ファイルを一又は複数ページの印刷データに変換する印刷データ変換手段と、
    変換された複数ページの印刷データに基づいてページごとのイメージデータを生成するイメージデータ生成手段と、
    変換された複数ページの印刷データに含まれるページごとのテキストデータに対応付けて、前記電子文書ファイルを識別する情報、該電子文書ファイルが記憶されている位置に関する情報、ページごとの前記印刷データ及び対応する前記イメージデータを記憶する検索対象情報記憶手段と、
    検索条件の入力を受け付ける検索条件受付手段と、
    入力を受け付けた検索条件に基づいて前記テキストデータを検索し、検索された複数のテキストデータにそれぞれ対応する複数のイメージデータを抽出するイメージデータ抽出手段と、
    抽出された複数のイメージデータを、同一画面上で表示するイメージデータ表示手段と、
    一のイメージデータの選択を受け付けるイメージデータ選択受付手段と、
    選択を受け付けたイメージデータに対応する電子文書ファイルを抽出する電子文書ファイル抽出手段と
    を備えることを特徴とする電子文書ファイル検索装置。
  2. 前記電子文書ファイル情報取得手段、前記印刷データ変換手段、前記イメージデータ生成手段、及び前記検索対象情報記憶手段を、所定の期間が経過する都度、繰り返し実行するようにしてあることを特徴とする請求項1記載の電子文書ファイル検索装置。
  3. 前記テキストデータをページごとに解析してインデックス情報を生成するインデックス情報生成手段と、
    生成したインデックス情報を前記印刷データに対応付けて記憶するインデックス情報記憶手段と
    を備え、
    前記イメージデータ抽出手段は、受け付けた検索条件に基づいて前記インデックス情報を検索し、検索されたインデックス情報に対応付けて記憶されている印刷データに対応するイメージデータを抽出するようにしてあることを特徴とする請求項1又は2記載の電子文書ファイル検索装置。
  4. 前記イメージデータ抽出手段で抽出された複数のイメージデータに対応する複数の前記テキストデータを形態素解析する形態素解析手段と、
    形態素解析の結果に基づいて複数の単語を抽出する単語抽出手段と、
    抽出された複数のイメージデータに対応する複数のテキストデータのうち、抽出された複数の単語が含まれる前記テキストデータの数を計数する計数手段と、
    計数した前記テキストデータの数が所定数以上である単語が存在するか否かを判断する判断手段と
    を備え、
    該判断手段で所定数以上である単語が存在すると判断した場合、前記検索対象情報記憶手段は、存在すると判断された単語を関連語情報として、変換された印刷データに含まれるテキストデータに対応付けて記憶するようにしてあることを特徴とする請求項1乃至3のいずれか一項に記載の電子文書ファイル検索装置。
  5. 前記イメージデータ表示手段は、抽出された複数のイメージデータを縮小した縮小画像データを生成して表示するようにしてあることを特徴とする請求項1乃至4のいずれか一項に記載の電子文書ファイル検索装置。
  6. 複数の前記印刷データから一の代表データの選択を受け付ける代表データ選択受付手段を備え、
    前記イメージデータ表示手段で、一の電子文書ファイルに属する複数のイメージデータが抽出された場合、受け付けた一の代表データに対応するイメージデータのみを表示するようにしてあることを特徴とする請求項1乃至5のいずれか一項に記載の電子文書ファイル検索装置。
  7. ネットワークに接続されている複数のコンピュータに記憶されている複数の電子文書ファイル中から所望の電子文書ファイルを検索する電子文書ファイル検索装置で実行することが可能な電子文書ファイル検索方法において、
    少なくともテキストデータが含まれる複数の前記電子文書ファイルを識別する情報、該電子文書ファイルが記憶されている位置に関する情報、及び前記テキストデータを取得し、
    複数の前記電子文書ファイルを一又は複数ページの印刷データに変換し、
    変換された複数ページの印刷データに基づいてページごとのイメージデータを生成し、
    変換された複数ページの印刷データに含まれるページごとのテキストデータに対応付けて、前記電子文書ファイルを識別する情報、該電子文書ファイルが記憶されている位置に関する情報、ページごとの前記印刷データ及び対応する前記イメージデータを記憶し、
    検索条件の入力を受け付け、
    入力を受け付けた検索条件に基づいて前記テキストデータを検索し、検索された複数のテキストデータにそれぞれ対応する複数のイメージデータを抽出し、
    抽出された複数のイメージデータを、同一画面上で表示し、
    一のイメージデータの選択を受け付け、
    選択を受け付けたイメージデータに対応する電子文書ファイルを抽出することを特徴とする電子文書ファイル検索方法。
  8. ネットワークに接続されている複数のコンピュータに記憶されている複数の電子文書ファイル中から所望の電子文書ファイルを検索する電子文書ファイル検索装置で実行することが可能なコンピュータプログラムにおいて、
    前記電子文書ファイル検索装置を、
    少なくともテキストデータが含まれる複数の前記電子文書ファイルを識別する情報、該電子文書ファイルが記憶されている位置に関する情報、及び前記テキストデータを取得する電子文書ファイル情報取得手段、
    複数の前記電子文書ファイルを一又は複数ページの印刷データに変換する印刷データ変換手段、
    変換された複数ページの印刷データに基づいてページごとのイメージデータを生成するイメージデータ生成手段、
    変換された複数ページの印刷データに含まれるページごとのテキストデータに対応付けて、前記電子文書ファイルを識別する情報、該電子文書ファイルが記憶されている位置に関する情報、ページごとの前記印刷データ及び対応する前記イメージデータを記憶する検索対象情報記憶手段、
    検索条件の入力を受け付ける検索条件受付手段、
    入力を受け付けた検索条件に基づいて前記テキストデータを検索し、検索された複数のテキストデータにそれぞれ対応する複数のイメージデータを抽出するイメージデータ抽出手段、
    抽出された複数のイメージデータを、同一画面上で表示するイメージデータ表示手段、
    一のイメージデータの選択を受け付けるイメージデータ選択受付手段、及び
    選択を受け付けたイメージデータに対応する電子文書ファイルを抽出する電子文書ファイル抽出手段
    として機能させることを特徴とするコンピュータプログラム。
JP2008263416A 2008-10-10 2008-10-10 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム Pending JP2010092383A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008263416A JP2010092383A (ja) 2008-10-10 2008-10-10 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008263416A JP2010092383A (ja) 2008-10-10 2008-10-10 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010092383A JP2010092383A (ja) 2010-04-22
JP2010092383A5 true JP2010092383A5 (ja) 2011-11-04

Family

ID=42255011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008263416A Pending JP2010092383A (ja) 2008-10-10 2008-10-10 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2010092383A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5728167B2 (ja) * 2010-05-12 2015-06-03 キヤノン株式会社 情報処理装置およびその制御方法、コンピュータプログラム
US10073927B2 (en) 2010-11-16 2018-09-11 Microsoft Technology Licensing, Llc Registration for system level search user interface
US10346479B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Facilitating interaction with system level search user interface
US8515984B2 (en) 2010-11-16 2013-08-20 Microsoft Corporation Extensible search term suggestion engine
US10073819B2 (en) * 2014-05-30 2018-09-11 Hewlett-Packard Development Company, L.P. Media table for a digital document

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344248A (ja) * 2000-06-01 2001-12-14 Fuji Xerox Co Ltd 文書処理システム
JP2005222237A (ja) * 2004-02-04 2005-08-18 Mitsubishi Electric Corp 文書検索表示システム

Similar Documents

Publication Publication Date Title
CN104685501B (zh) 响应于可视化查询标识文本词汇
JP4898934B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
WO2011122432A1 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
CN102520843A (zh) 一种采集图像作为候选项的输入法及系统
JP2012032859A (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
Brenner et al. Social event detection and retrieval in collaborative photo collections
CN106156111B (zh) 专利文件检索方法、装置和系统
JPWO2008143116A1 (ja) 文書検索装置及び文書検索方法
JP2008217695A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2010092383A5 (ja)
JP5205028B2 (ja) 手書き注釈管理装置およびインタフェース
JP5669785B2 (ja) フォレンジックシステム
CN111078915B (zh) 一种点读模式下的点读内容获取方法及电子设备
KR100912288B1 (ko) 문서 내 목차정보를 이용한 검색 시스템
KR101401250B1 (ko) 전자문서에 대한 키워드맵 제공 방법 및 이를 위한 키워드맵 제공 프로그램을 기록한 컴퓨터로 판독가능한 기록매체
JP2011203776A (ja) 類似画像検索装置、方法及びプログラム
JP2014109852A5 (ja)
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2010049300A5 (ja)
CN114155547B (zh) 一种图表识别方法、装置、设备及存储介质
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
JP2010182165A5 (ja)
CN112800246B (zh) 一种政策谱系构建方法、装置和电子设备
JP2009199164A (ja) 文書管理装置、文書管理方法及び記録媒体
RU2012117557A (ru) Извлечение данных радиологических исследований с использованием запроса на основании изображений