JP2007058605A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2007058605A5 JP2007058605A5 JP2005243449A JP2005243449A JP2007058605A5 JP 2007058605 A5 JP2007058605 A5 JP 2007058605A5 JP 2005243449 A JP2005243449 A JP 2005243449A JP 2005243449 A JP2005243449 A JP 2005243449A JP 2007058605 A5 JP2007058605 A5 JP 2007058605A5
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- normalized
- document management
- search
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims 7
- 238000007726 management method Methods 0.000 claims 5
- 239000000284 extract Substances 0.000 claims 4
- 238000004458 analytical method Methods 0.000 claims 2
- 230000000877 morphologic Effects 0.000 claims 2
- 238000010606 normalization Methods 0.000 claims 2
Claims (10)
- 画像を電子データとして入力する画像入力手段と、該画像入力手段により入力された画像中から文字列を抽出する文字抽出手段と、該文字抽出手段により抽出された文字列から単語を抽出する単語抽出手段と、該単語抽出手段により抽出された単語をインデックスとして登録し文書検索を行う文書検索手段と、検索のためのキーワードを入力する検索条件入力手段と、前記キーワードによる検索結果から文書表示を行う際に前記キーワードもしくは正規化されたキーワードによるヒット文字列を抽出して表示する検索結果表示手段を有する文書管理システムにおいて、
前記抽出したヒット文字列と正規化されたキーワードに基づいて、前記キーワードの位置情報を計算して画像に登録する属性情報を作成する属性情報作成手段を備え、前記属性情報として前記抽出したヒット文字列と正規化されたキーワードを保持することにより、ハイライト表示の抜けを防止することを特徴とする文書管理システム。 - 前記検索条件入力手段により入力したキーワードと前記正規化されたキーワードとのハイライト表示方法を変えることにより、前記ヒット文字列が前記入力したキーワードと同一か、あるいは正規化されたキーワードかを区別することを特徴とする請求項1に記載の文書管理システム。
- 前記単語抽出手段は、自然言語で書かれた文を意味を持つ最小単位の列に分割し、品詞を見分ける形態素解析により単語を抽出することを特徴とする請求項1又は2に記載の文書管理システム。
- 前記文書検索手段は、複数の表記をまとめて一つの表記として扱う表記正規化法により正規化したキーワードに基づいて検索することを特徴とする請求項1又は2に記載の文書管理システム。
- 画像入力手段が画像を電子データとして入力するステップと、文字抽出手段が該画像入力手段により入力された画像中から文字列を抽出するステップと、単語抽出手段が該文字抽出手段により抽出された文字列から単語を抽出するステップと、文書検索手段が該単語抽出手段により抽出された単語をインデックスとして登録し文書検索を行うステップと、検索条件入力手段が検索のためのキーワードを入力するステップと、検索結果表示手段が前記キーワードによる検索結果から文書表示を行う際に前記キーワードもしくは正規化されたキーワードによるヒット文字列を抽出して表示するステップと、を有する文書管理方法において、
属性情報作成手段が前記抽出したヒット文字列と正規化されたキーワードに基づいて、前記キーワードの位置情報を計算して画像に登録する属性情報を作成するステップを備え、前記属性情報として前記抽出したヒット文字列と正規化されたキーワードを保持することにより、ハイライト表示の抜けを防止することを特徴とする文書管理方法。 - 前記検索条件入力手段により入力したキーワードと前記正規化されたキーワードとのハイライト表示方法を変えることにより、前記ヒット文字列が前記入力したキーワードと同一か、あるいは正規化されたキーワードかを区別することを特徴とする請求項5に記載の文書管理方法。
- 前記単語抽出手段は、自然言語で書かれた文を意味を持つ最小単位の列に分割し、品詞を見分ける形態素解析により単語を抽出することを特徴とする請求項5又は6に記載の文書管理方法。
- 前記文書検索手段は、複数の表記をまとめて一つの表記として扱う表記正規化法により正規化したキーワードに基づいて検索することを特徴とする請求項5又は6に記載の文書管理方法。
- 請求項5乃至8の何れか一項に記載の文書管理方法をコンピュータが制御可能にプログラミングしたことを特徴とする文書管理プログラム。
- 請求項9に記載の文書管理プログラムをコンピュータが読み取り可能な形式で記録したことを特徴とする記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005243449A JP2007058605A (ja) | 2005-08-24 | 2005-08-24 | 文書管理システム |
US11/510,016 US7668814B2 (en) | 2005-08-24 | 2006-08-24 | Document management system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005243449A JP2007058605A (ja) | 2005-08-24 | 2005-08-24 | 文書管理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058605A JP2007058605A (ja) | 2007-03-08 |
JP2007058605A5 true JP2007058605A5 (ja) | 2008-09-11 |
Family
ID=37922044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005243449A Pending JP2007058605A (ja) | 2005-08-24 | 2005-08-24 | 文書管理システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7668814B2 (ja) |
JP (1) | JP2007058605A (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4930153B2 (ja) * | 2007-03-30 | 2012-05-16 | 富士通株式会社 | 文書検索システム、文書番号部分列取得装置、および文書検索方法 |
JP5376795B2 (ja) * | 2007-12-12 | 2013-12-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 |
KR101392273B1 (ko) * | 2008-01-07 | 2014-05-08 | 삼성전자주식회사 | 키워드 제공 방법 및 이를 적용한 영상기기 |
JP5215105B2 (ja) * | 2008-09-30 | 2013-06-19 | オリンパスメディカルシステムズ株式会社 | 画像表示装置、画像表示方法、および画像表示プログラム |
JP5528121B2 (ja) * | 2010-01-05 | 2014-06-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US8825670B2 (en) * | 2010-02-26 | 2014-09-02 | Rakuten, Inc. | Information processing device, information processing method, and recording medium that has recorded information processing program |
US8340429B2 (en) | 2010-09-18 | 2012-12-25 | Hewlett-Packard Development Company, Lp | Searching document images |
US20130007004A1 (en) * | 2011-06-30 | 2013-01-03 | Landon Ip, Inc. | Method and apparatus for creating a search index for a composite document and searching same |
JP2013077150A (ja) * | 2011-09-30 | 2013-04-25 | Fujitsu Broad Solution & Consulting Inc | ファイル管理プログラム、情報処理装置およびファイル管理方法 |
WO2013079907A1 (en) * | 2011-11-30 | 2013-06-06 | The University Of Surrey | System, process and method for the detection of common content in multiple documents in an electronic system |
WO2013175608A1 (ja) * | 2012-05-24 | 2013-11-28 | 株式会社日立製作所 | 画像解析装置、画像解析システム、画像解析方法 |
US10394936B2 (en) * | 2012-11-06 | 2019-08-27 | International Business Machines Corporation | Viewing hierarchical document summaries using tag clouds |
US9697182B2 (en) * | 2012-12-11 | 2017-07-04 | Xerox Corporation | Method and system for navigating a hard copy of a web page |
KR101541306B1 (ko) * | 2013-11-11 | 2015-08-04 | 주식회사 엘지씨엔에스 | 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체 |
US10963686B2 (en) * | 2017-12-01 | 2021-03-30 | International Business Machines Corporation | Semantic normalization in document digitization |
US10878037B2 (en) * | 2018-06-21 | 2020-12-29 | Google Llc | Digital supplement association and retrieval for visual search |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756933A (ja) * | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
JP3477822B2 (ja) * | 1994-05-26 | 2003-12-10 | 富士ゼロックス株式会社 | 文書登録検索システム |
JPH1083404A (ja) * | 1996-07-15 | 1998-03-31 | Toshiba Corp | 全文検索システム及びプログラムを記録した記録媒体 |
US6573907B1 (en) * | 1997-07-03 | 2003-06-03 | Obvious Technology | Network distribution and management of interactive video and multi-media containers |
JP2000322417A (ja) * | 1999-05-06 | 2000-11-24 | Canon Inc | 画像ファイリング装置及び方法及び記憶媒体 |
JP2002269136A (ja) * | 2001-03-14 | 2002-09-20 | Ricoh Co Ltd | 文書検索システム及びプログラム |
JP4271878B2 (ja) * | 2001-03-22 | 2009-06-03 | 株式会社日立製作所 | 映像中の文字検索方法及び装置並びに文字検索処理プログラム |
JP4446728B2 (ja) | 2002-12-17 | 2010-04-07 | 株式会社リコー | 複数のマルチメディア文書に格納された情報の表示法 |
JP2004348706A (ja) * | 2003-04-30 | 2004-12-09 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
US7849063B2 (en) * | 2003-10-17 | 2010-12-07 | Yahoo! Inc. | Systems and methods for indexing content for fast and scalable retrieval |
JP4461769B2 (ja) | 2003-10-29 | 2010-05-12 | 株式会社日立製作所 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
US20050097080A1 (en) * | 2003-10-30 | 2005-05-05 | Kethireddy Amarender R. | System and method for automatically locating searched text in an image file |
US20050177555A1 (en) * | 2004-02-11 | 2005-08-11 | Alpert Sherman R. | System and method for providing information on a set of search returned documents |
US20060062453A1 (en) * | 2004-09-23 | 2006-03-23 | Sharp Laboratories Of America, Inc. | Color highlighting document image processing |
US20060200464A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | Method and system for generating a document summary |
WO2006127480A2 (en) * | 2005-05-20 | 2006-11-30 | Perfect Market Technologies, Inc. | A search apparatus having a search result matrix display |
-
2005
- 2005-08-24 JP JP2005243449A patent/JP2007058605A/ja active Pending
-
2006
- 2006-08-24 US US11/510,016 patent/US7668814B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007058605A5 (ja) | ||
JP5599662B2 (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
US20200285808A1 (en) | Synonym dictionary creation apparatus, non-transitory computer-readable recording medium storing synonym dictionary creation program, and synonym dictionary creation method | |
JP3983265B1 (ja) | 辞書作成支援システム、方法及びプログラム | |
JP2016136341A5 (ja) | ||
JP2007058605A (ja) | 文書管理システム | |
Calzolari et al. | The LRE Map. Harmonising Community Descriptions of Resources. | |
CN106980664B (zh) | 一种双语可比较语料挖掘方法及装置 | |
JP2005092883A5 (ja) | ||
US20140348400A1 (en) | Computer-readable recording medium storing program for character input | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
WO2014203573A1 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
CN110688856A (zh) | 一种裁判文书信息提取方法 | |
CN112330501A (zh) | 一种文书处理方法、装置、电子设备及存储介质 | |
Crasborn et al. | Improving the exploitation of linguistic annotations in ELAN | |
JP6379742B2 (ja) | 情報表示制御装置およびプログラム | |
US10002450B2 (en) | Analyzing a document that includes a text-based visual representation | |
Meurant et al. | Using sign language corpora as bilingual corpora for data mining: Contrastive linguistics and computer-assisted annotation | |
JP2008134954A5 (ja) | ||
JP4941495B2 (ja) | ユーザ辞書作成システム、方法、及び、プログラム | |
JP2009282903A (ja) | 知識抽出・検索装置およびその方法 | |
JP5270199B2 (ja) | テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法 | |
JP2014146136A (ja) | アイテム情報検索装置、モデル作成装置、アイテム情報検索方法、モデル作成方法、及びプログラム | |
JP5853090B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
US11367442B2 (en) | Device and method with input |