JP2007058605A5 - - Google Patents

Download PDF

Info

Publication number
JP2007058605A5
JP2007058605A5 JP2005243449A JP2005243449A JP2007058605A5 JP 2007058605 A5 JP2007058605 A5 JP 2007058605A5 JP 2005243449 A JP2005243449 A JP 2005243449A JP 2005243449 A JP2005243449 A JP 2005243449A JP 2007058605 A5 JP2007058605 A5 JP 2007058605A5
Authority
JP
Japan
Prior art keywords
keyword
normalized
document management
search
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005243449A
Other languages
English (en)
Other versions
JP2007058605A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2005243449A priority Critical patent/JP2007058605A/ja
Priority claimed from JP2005243449A external-priority patent/JP2007058605A/ja
Priority to US11/510,016 priority patent/US7668814B2/en
Publication of JP2007058605A publication Critical patent/JP2007058605A/ja
Publication of JP2007058605A5 publication Critical patent/JP2007058605A5/ja
Pending legal-status Critical Current

Links

Claims (10)

  1. 画像を電子データとして入力する画像入力手段と、該画像入力手段により入力された画像中から文字列を抽出する文字抽出手段と、該文字抽出手段により抽出された文字列から単語を抽出する単語抽出手段と、該単語抽出手段により抽出された単語をインデックスとして登録し文書検索を行う文書検索手段と、検索のためのキーワードを入力する検索条件入力手段と、前記キーワードによる検索結果から文書表示を行う際に前記キーワードもしくは正規化されたキーワードによるヒット文字列を抽出して表示する検索結果表示手段を有する文書管理システムにおいて、
    前記抽出したヒット文字列と正規化されたキーワードに基づいて、前記キーワードの位置情報を計算して画像に登録する属性情報を作成する属性情報作成手段を備え、前記属性情報として前記抽出したヒット文字列と正規化されたキーワードを保持することにより、ハイライト表示の抜けを防止することを特徴とする文書管理システム。
  2. 前記検索条件入力手段により入力したキーワードと前記正規化されたキーワードとのハイライト表示方法を変えることにより、前記ヒット文字列が前記入力したキーワードと同一か、あるいは正規化されたキーワードかを区別することを特徴とする請求項1に記載の文書管理システム。
  3. 前記単語抽出手段は、自然言語で書かれた文を意味を持つ最小単位の列に分割し、品詞を見分ける形態素解析により単語を抽出することを特徴とする請求項1又は2に記載の文書管理システム。
  4. 前記文書検索手段は、複数の表記をまとめて一つの表記として扱う表記正規化法により正規化したキーワードに基づいて検索することを特徴とする請求項1又は2に記載の文書管理システム。
  5. 画像入力手段が画像を電子データとして入力するステップと、文字抽出手段が該画像入力手段により入力された画像中から文字列を抽出するステップと、単語抽出手段が該文字抽出手段により抽出された文字列から単語を抽出するステップと、文書検索手段が該単語抽出手段により抽出された単語をインデックスとして登録し文書検索を行うステップと、検索条件入力手段が検索のためのキーワードを入力するステップと、検索結果表示手段が前記キーワードによる検索結果から文書表示を行う際に前記キーワードもしくは正規化されたキーワードによるヒット文字列を抽出して表示するステップと、を有する文書管理方法において、
    属性情報作成手段が前記抽出したヒット文字列と正規化されたキーワードに基づいて、前記キーワードの位置情報を計算して画像に登録する属性情報を作成するステップを備え、前記属性情報として前記抽出したヒット文字列と正規化されたキーワードを保持することにより、ハイライト表示の抜けを防止することを特徴とする文書管理方法。
  6. 前記検索条件入力手段により入力したキーワードと前記正規化されたキーワードとのハイライト表示方法を変えることにより、前記ヒット文字列が前記入力したキーワードと同一か、あるいは正規化されたキーワードかを区別することを特徴とする請求項5に記載の文書管理方法。
  7. 前記単語抽出手段は、自然言語で書かれた文を意味を持つ最小単位の列に分割し、品詞を見分ける形態素解析により単語を抽出することを特徴とする請求項5又は6に記載の文書管理方法。
  8. 前記文書検索手段は、複数の表記をまとめて一つの表記として扱う表記正規化法により正規化したキーワードに基づいて検索することを特徴とする請求項5又は6に記載の文書管理方法。
  9. 請求項5乃至8の何れか一項に記載の文書管理方法をコンピュータが制御可能にプログラミングしたことを特徴とする文書管理プログラム。
  10. 請求項9に記載の文書管理プログラムをコンピュータが読み取り可能な形式で記録したことを特徴とする記録媒体。
JP2005243449A 2005-08-24 2005-08-24 文書管理システム Pending JP2007058605A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005243449A JP2007058605A (ja) 2005-08-24 2005-08-24 文書管理システム
US11/510,016 US7668814B2 (en) 2005-08-24 2006-08-24 Document management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005243449A JP2007058605A (ja) 2005-08-24 2005-08-24 文書管理システム

Publications (2)

Publication Number Publication Date
JP2007058605A JP2007058605A (ja) 2007-03-08
JP2007058605A5 true JP2007058605A5 (ja) 2008-09-11

Family

ID=37922044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005243449A Pending JP2007058605A (ja) 2005-08-24 2005-08-24 文書管理システム

Country Status (2)

Country Link
US (1) US7668814B2 (ja)
JP (1) JP2007058605A (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4930153B2 (ja) * 2007-03-30 2012-05-16 富士通株式会社 文書検索システム、文書番号部分列取得装置、および文書検索方法
JP5376795B2 (ja) * 2007-12-12 2013-12-25 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
KR101392273B1 (ko) * 2008-01-07 2014-05-08 삼성전자주식회사 키워드 제공 방법 및 이를 적용한 영상기기
JP5215105B2 (ja) * 2008-09-30 2013-06-19 オリンパスメディカルシステムズ株式会社 画像表示装置、画像表示方法、および画像表示プログラム
JP5528121B2 (ja) * 2010-01-05 2014-06-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US8825670B2 (en) * 2010-02-26 2014-09-02 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
US8340429B2 (en) 2010-09-18 2012-12-25 Hewlett-Packard Development Company, Lp Searching document images
US20130007004A1 (en) * 2011-06-30 2013-01-03 Landon Ip, Inc. Method and apparatus for creating a search index for a composite document and searching same
JP2013077150A (ja) * 2011-09-30 2013-04-25 Fujitsu Broad Solution & Consulting Inc ファイル管理プログラム、情報処理装置およびファイル管理方法
WO2013079907A1 (en) * 2011-11-30 2013-06-06 The University Of Surrey System, process and method for the detection of common content in multiple documents in an electronic system
WO2013175608A1 (ja) * 2012-05-24 2013-11-28 株式会社日立製作所 画像解析装置、画像解析システム、画像解析方法
US10394936B2 (en) * 2012-11-06 2019-08-27 International Business Machines Corporation Viewing hierarchical document summaries using tag clouds
US9697182B2 (en) * 2012-12-11 2017-07-04 Xerox Corporation Method and system for navigating a hard copy of a web page
KR101541306B1 (ko) * 2013-11-11 2015-08-04 주식회사 엘지씨엔에스 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체
US10963686B2 (en) * 2017-12-01 2021-03-30 International Business Machines Corporation Semantic normalization in document digitization
US10878037B2 (en) * 2018-06-21 2020-12-29 Google Llc Digital supplement association and retrieval for visual search

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756933A (ja) * 1993-06-24 1995-03-03 Xerox Corp 文書検索方法
JP3477822B2 (ja) * 1994-05-26 2003-12-10 富士ゼロックス株式会社 文書登録検索システム
JPH1083404A (ja) * 1996-07-15 1998-03-31 Toshiba Corp 全文検索システム及びプログラムを記録した記録媒体
US6573907B1 (en) * 1997-07-03 2003-06-03 Obvious Technology Network distribution and management of interactive video and multi-media containers
JP2000322417A (ja) * 1999-05-06 2000-11-24 Canon Inc 画像ファイリング装置及び方法及び記憶媒体
JP2002269136A (ja) * 2001-03-14 2002-09-20 Ricoh Co Ltd 文書検索システム及びプログラム
JP4271878B2 (ja) * 2001-03-22 2009-06-03 株式会社日立製作所 映像中の文字検索方法及び装置並びに文字検索処理プログラム
JP4446728B2 (ja) 2002-12-17 2010-04-07 株式会社リコー 複数のマルチメディア文書に格納された情報の表示法
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US7849063B2 (en) * 2003-10-17 2010-12-07 Yahoo! Inc. Systems and methods for indexing content for fast and scalable retrieval
JP4461769B2 (ja) 2003-10-29 2010-05-12 株式会社日立製作所 文書検索・閲覧手法及び文書検索・閲覧装置
US20050097080A1 (en) * 2003-10-30 2005-05-05 Kethireddy Amarender R. System and method for automatically locating searched text in an image file
US20050177555A1 (en) * 2004-02-11 2005-08-11 Alpert Sherman R. System and method for providing information on a set of search returned documents
US20060062453A1 (en) * 2004-09-23 2006-03-23 Sharp Laboratories Of America, Inc. Color highlighting document image processing
US20060200464A1 (en) * 2005-03-03 2006-09-07 Microsoft Corporation Method and system for generating a document summary
WO2006127480A2 (en) * 2005-05-20 2006-11-30 Perfect Market Technologies, Inc. A search apparatus having a search result matrix display

Similar Documents

Publication Publication Date Title
JP2007058605A5 (ja)
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
US20200285808A1 (en) Synonym dictionary creation apparatus, non-transitory computer-readable recording medium storing synonym dictionary creation program, and synonym dictionary creation method
JP3983265B1 (ja) 辞書作成支援システム、方法及びプログラム
JP2016136341A5 (ja)
JP2007058605A (ja) 文書管理システム
Calzolari et al. The LRE Map. Harmonising Community Descriptions of Resources.
CN106980664B (zh) 一种双语可比较语料挖掘方法及装置
JP2005092883A5 (ja)
US20140348400A1 (en) Computer-readable recording medium storing program for character input
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
WO2014203573A1 (ja) デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
CN110688856A (zh) 一种裁判文书信息提取方法
CN112330501A (zh) 一种文书处理方法、装置、电子设备及存储介质
Crasborn et al. Improving the exploitation of linguistic annotations in ELAN
JP6379742B2 (ja) 情報表示制御装置およびプログラム
US10002450B2 (en) Analyzing a document that includes a text-based visual representation
Meurant et al. Using sign language corpora as bilingual corpora for data mining: Contrastive linguistics and computer-assisted annotation
JP2008134954A5 (ja)
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
JP2009282903A (ja) 知識抽出・検索装置およびその方法
JP5270199B2 (ja) テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法
JP2014146136A (ja) アイテム情報検索装置、モデル作成装置、アイテム情報検索方法、モデル作成方法、及びプログラム
JP5853090B2 (ja) デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
US11367442B2 (en) Device and method with input