JP2007004393A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2007004393A5 JP2007004393A5 JP2005182495A JP2005182495A JP2007004393A5 JP 2007004393 A5 JP2007004393 A5 JP 2007004393A5 JP 2005182495 A JP2005182495 A JP 2005182495A JP 2005182495 A JP2005182495 A JP 2005182495A JP 2007004393 A5 JP2007004393 A5 JP 2007004393A5
- Authority
- JP
- Japan
- Prior art keywords
- document
- image data
- extraction processing
- feature
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims 14
- 238000011156 evaluation Methods 0.000 claims 6
- 239000000284 extract Substances 0.000 claims 3
- 238000000034 method Methods 0.000 claims 1
Claims (5)
- 文書に関する情報が蓄積されたデータベースの中から、入力された画像データに合致する文書を検索する文書検索装置において、
文書の画像データを入力する画像データ入力手段と、
入力された文書の画像データから当該文書を特定しうる複数種類の文書特徴情報を抽出する文書特徴抽出処理手段と、
前記文書特徴抽出処理手段から抽出された各文書特徴情報に基づき前記データベースを検索することによって当該文書の選択候補を取得する取得手段と、
前記取得手段により取得された選択候補を評価することによって当該文書を特定する評価手段と、
前記評価手段による評価結果を出力する出力手段と、
を有し、
前記文書特徴抽出処理手段は、文書特徴情報として、当該画像データの文字認識結果の中から所定の基準で単語を抽出する検索語抽出部を有し、
前記取得手段は、前記検索語抽出部によって抽出された単語を用いて作成した検索式に基づき前記データベースを検索する文書検索部を有することを特徴とする文書検索装置。 - 請求項1記載の文書検索装置において、
前記文書特徴抽出処理手段は、文書特徴情報として当該文書に固有に割り付けられた識別情報を、画像データから抽出する識別情報抽出部を有し、
前記取得手段は、各文書に固有に割り付けられた識別情報が登録された前記データベースを検索する識別情報検索部を有することを特徴とする文書検索装置。 - 請求項1又は2記載の文書検索装置において、
前記文書特徴抽出処理手段は、文書識別情報として当該文書の特徴量を画像データから算出する特徴量抽出部を有し、
前記取得手段は、各文書の特徴量が登録された前記データベースを検索する特徴量検索部を有することを特徴とする文書検索装置。 - 請求項1記載の文書検索装置において、
前記文書特徴抽出処理手段は、複数種類の文書特徴情報を抽出する各処理の順番制御を行う抽出処理制御部を有することを特徴とする文書検索装置。 - 文書に関する情報が蓄積されたデータベースの中から、入力された画像データに合致する文書を検索するコンピュータを、
文書の画像データを入力する画像データ入力手段、
入力された文書の画像データから当該文書を特定しうる複数種類の文書特徴情報を抽出する文書特徴抽出処理手段、
前記文書特徴抽出処理手段から抽出された各文書特徴情報に基づき前記データベースを検索することによって当該文書の選択候補を取得する取得手段、
前記取得手段により取得された選択候補を評価することによって当該文書を特定する評価手段、
前記評価手段による評価結果を出力する出力手段、
として機能させ、
前記文書特徴抽出処理手段は、文書特徴情報として、当該画像データの文字認識結果の中から所定の基準で単語を抽出し、
前記取得手段は、前記文書特徴抽出処理手段によって抽出された単語を用いて作成した検索式に基づき前記データベースを検索することを特徴とする文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005182495A JP4788205B2 (ja) | 2005-06-22 | 2005-06-22 | 文書検索装置及び文書検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005182495A JP4788205B2 (ja) | 2005-06-22 | 2005-06-22 | 文書検索装置及び文書検索プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007004393A JP2007004393A (ja) | 2007-01-11 |
JP2007004393A5 true JP2007004393A5 (ja) | 2008-07-31 |
JP4788205B2 JP4788205B2 (ja) | 2011-10-05 |
Family
ID=37689976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005182495A Expired - Fee Related JP4788205B2 (ja) | 2005-06-22 | 2005-06-22 | 文書検索装置及び文書検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4788205B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07114610A (ja) * | 1993-08-26 | 1995-05-02 | Fuji Xerox Co Ltd | 情報処理システムの入力装置及び情報処理システムの入力方法 |
JP2004164413A (ja) * | 2002-11-14 | 2004-06-10 | Kyocera Mita Corp | 付帯情報提供システム |
JP4251629B2 (ja) * | 2003-01-31 | 2009-04-08 | キヤノン株式会社 | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 |
JP4405831B2 (ja) * | 2003-05-20 | 2010-01-27 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP2004348591A (ja) * | 2003-05-23 | 2004-12-09 | Canon Inc | 文書検索方法及び装置 |
-
2005
- 2005-06-22 JP JP2005182495A patent/JP4788205B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106815192B (zh) | 模型训练方法及装置和语句情感识别方法及装置 | |
CN106462399B (zh) | 代码推荐 | |
JP2016508264A5 (ja) | ||
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
CN102053991B (zh) | 用于多语言文档检索的方法及系统 | |
CN101297288A (zh) | 用于确定字词排列的自然度的装置、方法和程序存储介质 | |
JP2013182338A5 (ja) | ||
CN112543931A (zh) | 自动识别专利文献中相关化合物的方法、系统和存储介质 | |
JP4715389B2 (ja) | パターン認識方法及び装置及びプログラム | |
CN107066474A (zh) | 文献搜索方法和装置 | |
CN109508557A (zh) | 一种关联用户隐私的文件路径关键词识别方法 | |
CN108345694A (zh) | 一种基于主题数据库的文献检索方法及系统 | |
JP2003178075A5 (ja) | ||
JP2007004393A5 (ja) | ||
KR101954512B1 (ko) | 특허 검색 방법 및 시스템 | |
JP2008059389A (ja) | 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム | |
CN107577667A (zh) | 一种实体词处理方法和装置 | |
JP2014134920A (ja) | 設計書の検索システム、設計書の検索システムの構築方法およびそのためのプログラム | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP5826148B2 (ja) | 図面管理サーバ及びこれを用いた図面管理システム | |
JP5188290B2 (ja) | アノテーション装置、アノテーション方法およびプログラム | |
US10891332B2 (en) | Instrumentation diagram data generation device, instrumentation diagram search system, and computer readable medium | |
JP2010092108A (ja) | 類似文章抽出プログラム、方法、装置 | |
JP6083819B2 (ja) | 入力支援システム、入力支援方法および入力支援プログラム | |
CN117332045B (zh) | 一种法律搜索方法和法律搜索系统 |