JP2007004393A5 - - Google Patents

Download PDF

Info

Publication number
JP2007004393A5
JP2007004393A5 JP2005182495A JP2005182495A JP2007004393A5 JP 2007004393 A5 JP2007004393 A5 JP 2007004393A5 JP 2005182495 A JP2005182495 A JP 2005182495A JP 2005182495 A JP2005182495 A JP 2005182495A JP 2007004393 A5 JP2007004393 A5 JP 2007004393A5
Authority
JP
Japan
Prior art keywords
document
image data
extraction processing
feature
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005182495A
Other languages
English (en)
Other versions
JP2007004393A (ja
JP4788205B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2005182495A priority Critical patent/JP4788205B2/ja
Priority claimed from JP2005182495A external-priority patent/JP4788205B2/ja
Publication of JP2007004393A publication Critical patent/JP2007004393A/ja
Publication of JP2007004393A5 publication Critical patent/JP2007004393A5/ja
Application granted granted Critical
Publication of JP4788205B2 publication Critical patent/JP4788205B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (5)

  1. 文書に関する情報が蓄積されたデータベースの中から、入力された画像データに合致する文書を検索する文書検索装置において、
    文書の画像データを入力する画像データ入力手段と、
    入力された文書の画像データから当該文書を特定しうる複数種類の文書特徴情報を抽出する文書特徴抽出処理手段と、
    前記文書特徴抽出処理手段から抽出された各文書特徴情報に基づき前記データベースを検索することによって当該文書の選択候補を取得する取得手段と、
    前記取得手段により取得された選択候補を評価することによって当該文書を特定する評価手段と、
    前記評価手段による評価結果を出力する出力手段と、
    を有し、
    前記文書特徴抽出処理手段は、文書特徴情報として、当該画像データの文字認識結果の中から所定の基準で単語を抽出する検索語抽出部を有し、
    前記取得手段は、前記検索語抽出部によって抽出された単語を用いて作成した検索式に基づき前記データベースを検索する文書検索部を有することを特徴とする文書検索装置。
  2. 請求項1記載の文書検索装置において、
    前記文書特徴抽出処理手段は、文書特徴情報として当該文書に固有に割り付けられた識別情報を、画像データから抽出する識別情報抽出部を有し、
    前記取得手段は、各文書に固有に割り付けられた識別情報が登録された前記データベースを検索する識別情報検索部を有することを特徴とする文書検索装置。
  3. 請求項1又は2記載の文書検索装置において、
    前記文書特徴抽出処理手段は、文書識別情報として当該文書の特徴量を画像データから算出する特徴量抽出部を有し、
    前記取得手段は、各文書の特徴量が登録された前記データベースを検索する特徴量検索部を有することを特徴とする文書検索装置。
  4. 請求項1記載の文書検索装置において、
    前記文書特徴抽出処理手段は、複数種類の文書特徴情報を抽出する各処理の順番制御を行う抽出処理制御部を有することを特徴とする文書検索装置。
  5. 文書に関する情報が蓄積されたデータベースの中から、入力された画像データに合致する文書を検索するコンピュータを、
    文書の画像データを入力する画像データ入力手段、
    入力された文書の画像データから当該文書を特定しうる複数種類の文書特徴情報を抽出する文書特徴抽出処理手段、
    前記文書特徴抽出処理手段から抽出された各文書特徴情報に基づき前記データベースを検索することによって当該文書の選択候補を取得する取得手段、
    前記取得手段により取得された選択候補を評価することによって当該文書を特定する評価手段、
    前記評価手段による評価結果を出力する出力手段、
    として機能させ、
    前記文書特徴抽出処理手段は、文書特徴情報として、当該画像データの文字認識結果の中から所定の基準で単語を抽出し、
    前記取得手段は、前記文書特徴抽出処理手段によって抽出された単語を用いて作成した検索式に基づき前記データベースを検索することを特徴とする文書検索プログラム
JP2005182495A 2005-06-22 2005-06-22 文書検索装置及び文書検索プログラム Expired - Fee Related JP4788205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005182495A JP4788205B2 (ja) 2005-06-22 2005-06-22 文書検索装置及び文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005182495A JP4788205B2 (ja) 2005-06-22 2005-06-22 文書検索装置及び文書検索プログラム

Publications (3)

Publication Number Publication Date
JP2007004393A JP2007004393A (ja) 2007-01-11
JP2007004393A5 true JP2007004393A5 (ja) 2008-07-31
JP4788205B2 JP4788205B2 (ja) 2011-10-05

Family

ID=37689976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005182495A Expired - Fee Related JP4788205B2 (ja) 2005-06-22 2005-06-22 文書検索装置及び文書検索プログラム

Country Status (1)

Country Link
JP (1) JP4788205B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114610A (ja) * 1993-08-26 1995-05-02 Fuji Xerox Co Ltd 情報処理システムの入力装置及び情報処理システムの入力方法
JP2004164413A (ja) * 2002-11-14 2004-06-10 Kyocera Mita Corp 付帯情報提供システム
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP4405831B2 (ja) * 2003-05-20 2010-01-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2004348591A (ja) * 2003-05-23 2004-12-09 Canon Inc 文書検索方法及び装置

Similar Documents

Publication Publication Date Title
CN106815192B (zh) 模型训练方法及装置和语句情感识别方法及装置
CN106462399B (zh) 代码推荐
JP2016508264A5 (ja)
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN102053991B (zh) 用于多语言文档检索的方法及系统
CN101297288A (zh) 用于确定字词排列的自然度的装置、方法和程序存储介质
JP2013182338A5 (ja)
CN112543931A (zh) 自动识别专利文献中相关化合物的方法、系统和存储介质
JP4715389B2 (ja) パターン認識方法及び装置及びプログラム
CN107066474A (zh) 文献搜索方法和装置
CN109508557A (zh) 一种关联用户隐私的文件路径关键词识别方法
CN108345694A (zh) 一种基于主题数据库的文献检索方法及系统
JP2003178075A5 (ja)
JP2007004393A5 (ja)
KR101954512B1 (ko) 특허 검색 방법 및 시스템
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
CN107577667A (zh) 一种实体词处理方法和装置
JP2014134920A (ja) 設計書の検索システム、設計書の検索システムの構築方法およびそのためのプログラム
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP5826148B2 (ja) 図面管理サーバ及びこれを用いた図面管理システム
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
US10891332B2 (en) Instrumentation diagram data generation device, instrumentation diagram search system, and computer readable medium
JP2010092108A (ja) 類似文章抽出プログラム、方法、装置
JP6083819B2 (ja) 入力支援システム、入力支援方法および入力支援プログラム
CN117332045B (zh) 一种法律搜索方法和法律搜索系统