JP4576211B2 - Document information retrieval system - Google Patents
Document information retrieval system Download PDFInfo
- Publication number
- JP4576211B2 JP4576211B2 JP2004336856A JP2004336856A JP4576211B2 JP 4576211 B2 JP4576211 B2 JP 4576211B2 JP 2004336856 A JP2004336856 A JP 2004336856A JP 2004336856 A JP2004336856 A JP 2004336856A JP 4576211 B2 JP4576211 B2 JP 4576211B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- character
- information
- character string
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、文書中の文字列に擬似的に埋め込んだ関連情報を検索するシステムに係り、あらかじめ文書中の文字列と関連情報を対応した検索用DBを作成し、出版されている文書中の一部を携帯電話などに内蔵されているカメラで撮影した文書中の一部を撮影した画像から文字認識により文字列を認識し、前記複数の文字列から前記検索用DBに登録された関連情報を検索するものである。 The present invention relates to a system for searching related information that is artificially embedded in a character string in a document, and creates a search DB corresponding to the character string in the document and the related information in advance, Relevant information registered in the search DB from the plurality of character strings by recognizing a character string by character recognition from an image obtained by capturing a part of a document captured by a camera built in a mobile phone or the like Is to search.
従来、印刷された写真や文書に情報を埋め込む方法として電子透かしが知られていた。例えば、文書などの二値化された画像に電子透かしを埋め込む一例として特開2004−289783号公報(特許文献1)がある。
従来、カメラを搭載した携帯電話等の携帯端末で撮影した画像に含まれる文字列の文字を認識して、その認識結果である文字テキストを翻訳する技術が種々提案されている。例えば、特開平09−138802号公報(特許文献2)には、携帯端末内部に文字認識機能と翻訳機能を持ち、これらの機能を利用して、カメラで撮影した画像内の文字列を認識、翻訳処理する翻訳システムが開示されている。
Conventionally, digital watermarking has been known as a method for embedding information in a printed photograph or document. For example, as an example of embedding a digital watermark in a binarized image such as a document, there is Japanese Patent Laid-Open No. 2004-289883 (Patent Document 1).
Conventionally, various techniques for recognizing characters in a character string included in an image taken by a portable terminal such as a mobile phone equipped with a camera and translating the character text as a recognition result have been proposed. For example, Japanese Patent Application Laid-Open No. 09-138802 (Patent Document 2) has a character recognition function and a translation function inside a mobile terminal, and uses these functions to recognize a character string in an image taken by a camera. A translation system for translation processing is disclosed.
また、同出願人の先の出願、特願2004−227610号および特願2004−232891号に、携帯端末で撮影した画像中の複数の単語の並びや位置関係から、文書中の撮影位置を特定し、撮影した単語に関連した翻訳結果や文書中の位置に対して設定したリンク先URLをブラウザに表示する文書翻訳システムに関する発明がある。 Also, in the previous application of the same applicant, Japanese Patent Application No. 2004-227610 and Japanese Patent Application No. 2004-232891, the shooting position in the document is specified from the arrangement and positional relationship of a plurality of words in the image shot with the portable terminal. Then, there is an invention related to a document translation system that displays a translation result related to a photographed word and a link destination URL set for a position in a document on a browser.
特許文献1では、あらかじめ情報を埋め込んだ文書を印刷して配布する必要があった。そのため印刷済みの書籍に電子透かしを適用することができなかった。
また、特許文献2では、文書中の特定の場所を撮影し、文字認識により撮影した画像中の文字イメージを単語または文を含む文字列に変換して出力することにより、出力された単語または文を翻訳する翻訳システムが開示されている。認識範囲を文とした場合、撮影する範囲が広くなりカメラの解像度を高くするか、複数撮影した画像から文字列を認識し、細分化された文字列を再構築して文を再生する必要があった。また単語を翻訳する場合、文書中の単語の位置で訳が異なる場合があった。
In
Further, in
また、文字認識は、誤読の可能性があることから認識率を向上させる必要がある。図32は文字認識処理の流れの例であり、画像二値化部51は、文字を含む画像から背景と文字を分けた二値画像を作成する。文字行切り出し部52は、二値画像から1行分の文字列領域を判別する。文字切り出し部53は、1行分の文字列領域から1文字の文字領域を判別する。特徴抽出部54は、1文字の文字領域から文字の特徴を算出する。識別処理部55は、文字の特徴からあらかじめ文字毎に登録した文字の特徴と比較し、特徴が似通った順に文字の候補を出力する。単語照合部56は、連続した1文字の文字領域毎の文字の候補から単語照合辞書登録されている単語に最も近い単語を出力する。画像二値化部51では、印刷された文書は、カラー印刷や網点印刷など条件が広く、一種類の二値化方法では、正しく二値化できない場合がある。また、文字行切り出し部52や文字切り出し部53では、文字を認識する前に画像中から文字行および文字領域を予測する必要があるが、罫線、行間、文字間隔など文書により多種多様であり、判別を誤ることがある。また、識別処理部55では、類似文字(例えば日、白、目など非常に似通った文字)があり、画像のノイズやかすれなどによる悪影響により、文字候補が正しく出力されない場合がある。また、単語照合部56では、正読率の向上に全ての単語を単語照合辞書に登録する必要があるが、出版されている全ての文書の単語を登録には大きなメモリが必要であり、メモリ制限がある携帯電話などの携帯端末では全ての単語を単語照合辞書に登録できない。
Moreover, since character recognition has a possibility of misreading, it is necessary to improve a recognition rate. FIG. 32 shows an example of the flow of character recognition processing. The
本発明の目的は、カメラを内蔵した携帯可能な情報端末で文書の一部をカメラで撮影した画像に含まれている文字列が文書中のどの場所に存在するかを特定し、その場所に関連付けられる情報を取得する文書情報検索システムを提供することにある。 An object of the present invention is to specify a location in a document where a character string included in an image obtained by photographing a part of a document with a camera using a portable information terminal with a built-in camera, and to the location. An object of the present invention is to provide a document information retrieval system for acquiring associated information.
また、本発明の別の目的は、文字の場所を特定するためのデータの作成を自動化し、また文書に関連付けられる情報のデータの作成を簡素に行う、文書情報検索システムを提供することにある。
また、本発明の別の目的は、文書毎に文書の構造を定義した文書ファイルから文書の特徴を抽出することにより文字認識のパラメータを作成し、検索対象の文書に合わせて文字認識のパラメータを設定することにより、文字認識率を向上させることが可能な文書情報検索システムを提供することにある。
Another object of the present invention is to provide a document information search system that automates the creation of data for specifying the location of characters and simplifies the creation of information data associated with a document. .
Another object of the present invention is to create a character recognition parameter by extracting document features from a document file that defines the document structure for each document, and set the character recognition parameter according to the document to be searched. An object of the present invention is to provide a document information search system that can improve the character recognition rate by setting.
本発明は、画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部を有する携帯情報端末を用いて、画像撮影部で撮影された画像に含まれる文字に関連付けられた情報を得て、その情報を表示部に表示する文書情報検索システムにおいて、
文書の構成要素に関連する情報を対応付けた関連情報を作成する文書情報登録部と、文字列の位置情報を作成する座標登録部と前記関連情報と前記位置情報を保持する記憶装置とを備えるものである。また、文書選択部を設けることにより、文書毎に記憶装置に登録された関連情報と、位置情報を選択して検索部により情報を検索できるように文書を示す情報をも保持する。
The present invention relates to a character included in an image photographed by an image photographing unit using a portable information terminal having an image photographing unit, an input unit operated by a user to input information, and a display unit. In a document information retrieval system that obtains information and displays the information on a display unit,
A document information registration unit that creates related information in which information related to document components is associated; a coordinate registration unit that creates position information of a character string; and a storage device that holds the related information and the position information. Is. In addition, by providing a document selection unit, related information registered in the storage device for each document and information indicating the document are stored so that the position information can be selected and the search unit can retrieve the information.
また、本発明において、サーバ装置は、前記記憶装置、及び前記検索部を備え、携帯情報端末は、前記文字認識部より得られた文字列を、ネットワークを介して前記サーバに送信し、前記サーバにおいて前記検索部により関連情報を検索した結果得られた情報を、前記ネットワークを介して前記携帯情報端末に送信する。また、前記文字認識部は、サーバ装置に備えることもできる。 In the present invention, a server device includes the storage device and the search unit, and the portable information terminal transmits a character string obtained from the character recognition unit to the server via a network. The information obtained as a result of searching for related information by the search unit is transmitted to the portable information terminal via the network. The character recognition unit may be provided in a server device.
また、本発明の文書情報登録部は、文書の構造を定義した文書ファイルを入力し、前記文書ファイルの前記文書の構造、すなわち文字、文字種、文字座標、文字サイズなどを解析して文書の構成要素(章、段、文、行、見出しなど)に分解し、前記構成要素単位に関連する情報を対応付けた関連情報を作成する。例えば、図5に示す文書ファイル15は、PDFの文書構造を持つ。 PDFファイルでは、ページオブジェクト、テキストオブジェクトなど、文書を階層化した複数のオブジェクトを持つ。テキストオブジェクトには、書体、字体、文字幅の指定、ページ上の開始位置、文字コード、文字ごとの間隔が記述されている。これらの情報を利用することにより容易に文字列の位置を推定することが可能である。
The document information registration unit of the present invention inputs a document file that defines the document structure, analyzes the document structure of the document file, that is, character, character type, character coordinates, character size, etc. The information is divided into elements (chapter, column, sentence, line, heading, etc.), and related information in which information related to the constituent element unit is associated is created. For example, the
さらに好ましくは、文書の構成要素を階層化し、上位階層から関連情報を設定し、検索時には下位階層から関連情報を検索する。さらに好ましくは、前記文書の構成要素を形態素に分解し、前記形態素単位に関連する情報を対応付けた関連情報を作成する。また、さらに好ましくは、前記形態素は、形態素の区切りを登録者が編集する編集部を有する。 More preferably, the constituent elements of the document are hierarchized, the related information is set from the upper hierarchy, and the related information is searched from the lower hierarchy when searching. More preferably, the constituent elements of the document are decomposed into morphemes, and related information in which information related to the morpheme unit is associated is created. Still more preferably, the morpheme has an editing unit in which a registrant edits a morpheme break.
本発明によって、文書の文字列および文字位置から行、文、単語などといった関連情報を設定する単位を作成するため、登録者が文書から行や文、単語などを登録する作業が不要または簡易となる。 According to the present invention, since a unit for setting related information such as a line, a sentence, and a word is created from a character string and a character position of the document, a registrant does not need to register a line, a sentence, a word, or the like from the document. Become.
本発明の実施形態の文書情報登録システムは、文書登録装置、サーバ装置、携帯端末装置により構成する。検索する文書に設定する関連情報は、行と単語単位にURL(Uniform Resource Locator)を設定し、URLを使ってブラウザ上に情報を表示する。また入力を行う文書の構造を数値化して定義した文書ファイルとしてPDF(Portable Document Format)ファイルを例として説明を行う。 The document information registration system according to the embodiment of the present invention includes a document registration device, a server device, and a mobile terminal device. As the related information set in the document to be searched, a URL (Uniform Resource Locator) is set for each line and word, and the information is displayed on the browser using the URL. Also, a PDF (Portable Document Format) file will be described as an example of a document file that defines the structure of a document to be input as a numerical value.
本発明の実施形態を、図1を用いて説明する。図1は、本実施形態の全体構成図の例である。関連情報を登録する文書は、あらかじめ文書登録者が文書登録装置10を操作し、文書入力装置41にて文書データを入力する。解析装置42は、入力された文書ファイルを行や単語などの文書を構成する構成要素に分解し、分解した構成要素を表示装置40に表示する。文書登録者は、構成要素に関連した情報を入力装置45から入力する。構成要素と構成要素に対応した関連情報を含む検索用DBは、登録装置43にて記憶装置44に記憶する。また、検索用DBは、文書登録装置10の通信装置46からサーバ装置320の通信装置33にネットワーク36を経由して送信され、サーバ装置320の記憶装置32に格納される。
An embodiment of the present invention will be described with reference to FIG. FIG. 1 is an example of an overall configuration diagram of the present embodiment. A document registrant operates the
携帯端末装置300は、関連情報を登録した文書の一覧を表示装置22に表示する。携帯端末装置300の利用者は、関連情報を検索する撮影対象の文書を、入力装置20の操作で文書選択装置21により選択し、印刷された文書の一部を撮影装置23により撮影する。文字認識装置24は、撮影した画像から注目する単語とその周辺の複数の単語を認識する。携帯端末装置300は、携帯電話、PDAなどの、撮像装置を有する情報端末である。
The mobile
サーバ装置320において、位置検索装置34は、記憶装置32に記憶した検索用DBから、携帯端末装置300で撮影した注目単語の文書中の位置を特定し、情報検索装置31は、注目単語に対応する関連情報を検索用DBから検索する。携帯端末装置300の表示装置22は、情報検索装置31で得られた関連情報を表示する。携帯端末装置300とサーバ装置320間のデータ通信は、通信装置25と通信装置30間でネットワーク26を経由して接続し、携帯端末装置300で認識した注目単語と、サーバ装置320で検索した関連情報の転送を行う。
In the
次に本発明の実施形態における図1の文書登録装置10の詳細を、図2を用いて詳細に説明する。以下、図2の各部の動作を、図3のフローチャート図および必要に応じて図5、図8乃至図12の符号を用いて説明する。図2は、本実施形態の文書登録装置の動作を示すブロック図の例である。図3は、本実施形態の文書登録装置の動作を示すフローチャート図である。
Next, details of the
図1と図2の各ブロックの対応を説明する。文書入力装置41は,文書登録部101と文書入力部100に対応する。解析装置42は,属性抽出部102,文書座標抽出部106,文書抽出部103,形態素解析部104,単語編集部105,単語リスト作成部107,照合辞書作成部109に対応する。登録装置43は,リンク先登録部111に対応する。記憶装置43は,文書情報120,文書属性情報121,単語照合辞書122,単語情報123,文字情報126,行リンク情報124,単語リンク情報125に対応する。
The correspondence between the blocks in FIGS. 1 and 2 will be described. The
文書登録部101において、登録者は、文書登録部101から文書のタイトル201などを入力する(130)。登録者は、文書入力部100により文書ファイル15を入力する(131)。属性抽出部102は、文書ファイル15の文書構造を解析し、文書のページ数202、文字の背景、文字方向、使われている文字種を抽出し(132)、ページ数202と、文書登録部101により入力したタイトル201と、自動的に生成する文書番号200を文書情報120に登録する(133)。また、抽出した文字の背景、文字方向、使われている文字種から二値化モード70、文字方向71、文字コード72を作成し、文書属性情報121に登録する(150)。
In the
文字座標抽出部106は、ページ中の文字の位置座標を抽出(160)し、文字毎にページ番号210、行番号211、列番号233などの位置情報を出力する。文字抽出部103は、文書ファイル15から文字を抽出し(135)、文字座標抽出部106が設定した文字単位のページ番号210、行番号211から同一行の文字列を再構成し、文字情報126に登録する(139)。
The character coordinate
形態素解析部104は、文字情報126から、行単位に文字列を形態素解析して行を構成する複数の品詞に分解する(136)。接続詞など不用な品詞を除去し固有名詞など単語として利用可能な品詞を選択して出力する(137)。単語編集部105は、形態素解析部104が出力する品詞を構成する文字列に対し、登録者が必要に応じて行う、連続する複数の品詞を構成する文字列の結合、または品詞を構成する文字列の分割などの編集を受け付け、単語230を作成する(138)。単語リスト作成部107は、単語編集部105が出力する単語230と、単語230の先頭文字の文字座標抽出部106が出力するページ番号210、行番号211、列番号233を用いて、単語情報123に登録する(140)。
The
照合辞書作成部109は、単語情報123に登録されている全ての単語230から、単語照合辞書122を作成する(171)。リンク先登録部111は、文字情報126の各文字データ212−1〜b、および単語情報123に登録してある単語データ234−1〜cに対応するリンク先URLの情報について登録者からの入力を受け付け、行リンク情報124および単語リンク情報125を作成する(143)。
The collation
以下、文書登録装置10が作成する、文書情報120、文字情報126、単語情報123、行リンク情報124、単語リンク情報125、を図8乃至図12を用いて説明する。
文書情報120を、図8を用いて説明する。図8において、文書情報120は、文書データ203−1〜aから構成され、文書データ203−1〜aは、文書毎の文書番号200とタイトル201、ページ数202から構成する。文書番号200は、登録された文書毎に自動的に設定する番号であり、タイトル201は、文書の表題であり、ページ数202は、文書を構成する総ページ数を示す。
Hereinafter, the
The
次に文字情報126を、図9を用いて説明する。図9において、文字情報126は、文字データ212−1〜bから構成され、文字データ212−1〜bは、文書中の行単位毎に、文字列213と、文字列213が印刷されている、ページ番号210、行番号211、から構成される。
Next, the
次に単語情報123を、図10を用いて説明する。図10において、単語情報123は、単語データ234−1〜cから構成され、単語データ234−1〜cは、単語230と、単語230の印刷された文書中の位置を示すページ番号210、行番号211、列番号233から構成する。単語230は、単語リスト作成部107で作成する単語である。列番号233は、単語230が含まれる文書情報126中の文字列213において、単語230の先頭文字を文字列213の左の文字から数えた位置である。
Next, the
次に行リンク情報124を、図11を用いて説明する。図11において、行リンク情報124は、行リンクデータ222−1〜bから構成され、行リンクデータ222−1〜bは、文書中の全ての行に対して設定した、ページ番号210、行番号211、リンク先URL223から構成する。
Next, the
次に単語リンク情報125を、図12を用いて説明する。図12において単語リンク情報125は、単語リンクデータ235−1〜eから構成され、単語リンクデータ235−1〜eは、単語230と、単語230に設定するリンク先URL223と、単語230の印刷文書中の位置を示す、ページ番号210、行番号211、列番号233から構成する。
Next, the word link
以下、PDFファイルを例とする文書ファイル15から文字情報126を抽出する手順を図5と図28を用いて、詳細に説明する。図5は,本実施形態の入力する文書ファイルの例,図28は、本実施形態の文字情報126の作成手順を示すフローチャート図である。
Hereinafter, a procedure for extracting the
図5のPDFファイル例の代表的な各行の意味を,行番号16を用いて説明する。説明を分かりやすくするため,埋め込まれた文字は英文である。PDFでは,文書のレイアウトを定義するためオブジェクト単位で定義を行っている。行1と行38は,PDF形式であることを示すヘッダとフッタである。行4〜11は,ページのオブジェクトを定義する。行12〜24は,使用されている書体のオブジェクトを定義する。行16が定義する文字の開始コード,行17が定義する文字の終了コードであり,行18〜19が開始から終了文字の文字幅を定義する。行21は,書体である。行25〜37は,印刷されるテキストオブジェクトを定義する。行28は,テキストオブジェクトの開始,行34は,テキストオブジェクトの終了を示す。行30は,Tcが文字の間隔,Twが単語の間隔を定義する。行31は,印刷する文字と必要に応じて配置のオフセットを定義する。行32は,Tdが次の行へのオフセットを定義する。行33は,印刷する文字を定義する。
The meaning of each representative line in the PDF file example of FIG. 5 will be described using
文書ファイル15から文字情報126を抽出するために、まず、テキストブロックからテキストブロックに共通する書体、字体、文字毎の文字幅のパラメータを抽出する(550)。最初の文字の始点座標のパラメータを抽出する(551)。1文字ごとに文字幅と文字間隔のパラメータより終点座標を計算し、求めた終点座標を次の文字の始点座標とする(552)。552の処理を行方向の座標が異なる文字の始点座標が見つかるまで繰り返す(553)。552で処理した文字を同一行の文字列213として、文字情報126に登録する(555)。テキストブロック内が終了するまで551から555の処理を繰り返す(556)。ページオブジェクトが終了するまで550から556の処理を繰り返す(557)。文書を終了するまで、上記ページオブジェクト内の処理を繰り返す(558)。
In order to extract the
本発明の実施形態では、列番号233を行の先頭文字からの文字数としたが、例えば図28で求まる文字単位の始点座標を用いることも可能である。また、本発明の実施形態では、リンク先URL223の設定を行または単語単位設定し、それぞれ行リンク情報124、単語リンク情報125を作成したが、文単位にリンク先URL223を設定することも可能である。
In the embodiment of the present invention, the
以下、文単位にリンク先URL223を設定した文リンク情報590の作成手順を文情報580と、文情報580の作成手順を、図29、図30、図31を用いて説明する。図29は、本実施形態の文情報580の作成手順示すフローチャート図である。
Hereinafter, the creation procedure of the
図30は、本実施形態の文情報580の例であり、文情報580は、文データ582−1〜kから構成され、文データ582−1〜kは、文581と、文581が含まれるページのページ番号210と、文581の最初の文字が存在する文字データ212中の行番号211を始点の行番号273とし、文字列213の左から数えた文字数からなる列番号233を始点の列番号274とする。また、文581の最後の文字が存在する文字データ212中の行番号211を終点の行番号271とし、文字列213の左から数えた文字数からなる列番号233を終点の列番号272とする。
本実施形態では、列番号272、274を文字列中の左からの文字数としたが、図28で算出した文字の始点の座標を利用することも可能である。
FIG. 30 is an example of the
In this embodiment, the
図31は、本実施形態の文リンク情報590の例であり、文リンク情報590は、文リンクデータ591−1〜kから構成され、文リンクデータ591−1〜kは、文データ582−1〜kに対応して、文情報580の文581の代わりに、文581に関連つけられるリンク先URL223を設定する。
FIG. 31 is an example of the
文情報580の作成では、図28で作成した文字情報126と、書体、字体、文字コード、文字サイズを利用して作成する。文字情報126の文字データ212−1〜bに登録した行毎の文字列213について、文書ファイル15から図28で抽出した書体、字体と同様に、文字の書体、字体、文字サイズなどを抽出し、次の行の書体、字体、文字サイズなどが異なるか判定する(570)。異なる場合は、文字列213を見出し行として、文情報580の文データ582に追加登録する(573)。次に、先頭文字が記号“(1)”や見出し番号“1.1“など明らかに前後の行と異なるか判定する(571)。異なる場合は、文字列213を見出し行として、文情報580の文データ582に追加登録する(573)。次に、見出し行でなければ、順次行の文字列213から句点“。”を探索し、句点で区切った文581として文情報580の文データ582に登録する(572)。上記の処理を文書中の全ての行を走査するまで繰り返す(574)。
The
次に以下図4を用いて文書登録装置の構成を説明する。図4は、本実施形態の文書登録装置のハードウェア構成図の例である。
図1と図4の各ブロックの対応を説明する。入力装置45は,キーボード700,マウス701に対応する。表示装置40は,ディスプレイ703に対応する。通信装置320は,通信回路705に対応する。記憶装置44は,データメモリ801に対応する。文書選択装置21および文字認識装置24は,文書登録プログラム810に対応する。
Next, the configuration of the document registration apparatus will be described with reference to FIG. FIG. 4 is an example of a hardware configuration diagram of the document registration apparatus according to the present embodiment.
The correspondence between the blocks in FIGS. 1 and 4 will be described. The
キーボード700は、登録者からテキスト入力などを行う。マウス701は、利用者からのディスプレイ画面上のボタン操作などを行う。外部記憶装置702は、文書ファイル15を記憶したフロッピー(登録商標)ディスクやコンパクトディスクなどの記憶メディアから文書ファイル15を入力したり、データメモリ801に記憶されたデータを記憶メディアに出力したりする。ディスプレイ703は、登録者に操作画面などを表示する。CPU704はプログラムメモリ800中のプログラムを実行する。通信回路705は、サーバ装置320間でネットワーク36を経由してデータメモリ801に記憶されたデータの転送を行う。プログラムメモリ800は、図2の各部の動作を実行する文書登録プログラム810を格納する。データメモリ801は、文書情報120、文書属性情報121、単語照合辞書122、単語情報123、行リンク情報124、単語リンク情報125、文字情報126と、文書登録プログラム810が使用する作業用の一時データを格納する。
The
以下、本実施形態のリンク先登録のために文書登録装置300において、リンク先URL223を登録者が操作する手順を、図6を用いて説明する。図6は、本実施形態のディスプレイ703に表示する画面の例である。
CPU704で実行される文書登録プログラム810は、登録者が操作する画面をディスプレイ703に表示し、キーボード700およびマウス701を操作し入力操作を受け付ける。ボタンは、マウス701を利用して選択することができる。入力フィールドは、キーボード700を操作し文字を入力することができる。
The procedure for the registrant to operate the
The
文書登録プログラム810を起動すると、最初に文書登録画面600を表示する。最初に文書を登録する手順を説明する。文書登録画面600は、現在登録されている文書情報120を一覧表示する。登録者は、新規に文書を追加したい場合、追加ボタン601を選択することにより文書情報画面610を表示させることができる。登録した文書中登録を削除する場合は、削除したい項目の削除ボタン603を選択することにより、文書情報120より選択した文書情報を削除し、一覧表示から削除する。文書のリンク情報を設定する場合は、設定する文書の項目の設定ボタン602を選択することにより、リンク登録画面620を表示する。
When the
文書情報画面610は、文書番号フィールド611に自動的に設定した文書番号200を表示し、タイトルフィールド612にタイトル201を入力する。登録者は、開くボタン613を選択することにより、文書ファイル15を入力する。入力した文書ファイル15のページ数などの文書情報は文書情報表示フィールド614に表示される。登録者は、登録内容に問題がないことを確認し、登録ボタン615を選択することにより文書の解析が開始され文書登録画面600を表示する。登録をキャンセルする場合は、キャンセルボタン616を選択することで文書情報120に登録されず、文書登録画面600を表示する。
The
次にリンク情報を設定する手順を説明する。リンク登録画面620では、登録者がリンク先フィールド621に、文書全体に設定したいリンク先URL223を記入し、確定ボタン622で確定する。登録者は必要に応じて以下同様に確認ボタン623を選択することによりリンク確認画面660を表示する。登録者は、確定ボタン622を選択することにより、文書番号223および入力したリンク先URL223を、文書リンクテーブル240に登録する。ページ単位のリンク情報の設定では、ページ一括設定ボタン624の選択で、ページ設定画面630を表示する。行単位のリンク情報の設定では、行一括設定ボタン625の選択で、行設定画面640を表示する。単語単位のリンク情報設定では、単語設定626ボタンの選択で、単語設定画面650を表示する。以下同様に戻るボタン627の選択で、前画面を表示する。
リンク確認画面660は、設定したリンク先URL223に対応した画像などを表示画面662に表示する。リンク先URL223が誤った場合は、リンク先フィールド661に修正したリンク先URL223を記入し、更新ボタン663を選択することによりリンク先フィールド621に反映する。
Next, a procedure for setting link information will be described. On the link registration screen 620, the registrant enters the
The
ページ設定画面630は、登録者が追加ボタン601の選択で設定項目を追加し、追加した設定項目のページ数入力フィールド631に設定したいページ番号210、リンク先フィールド621にリンク先URL223をそれぞれ入力する。確定ボタン622の選択により、リンク先URL223、ページ番号210を、ページリンクテーブル250に登録する。
In the
行設定画面640は、登録者がページ設定フィールド641に設定したいページ番号210を入力し、追加ボタン601の選択により設定項目を追加する。登録者は、追加した設定項目の行数入力フィールド642に設定したい行番号211、リンク先フィールド621にリンク先URL223をそれぞれ入力する。登録者は、確定ボタン622の選択により、ページ番号210、行番号211、リンク先URL223を、行リンクテーブル260に登録する。
In the
単語設定画面650は、登録者がページ設定フィールド641に設定したいページ、行設定フィールド651に設定したい行を入力し、追加ボタン601の選択により設定項目を追加する。追加した設定項目の単語フィールド652にページ設定フィールド641および行設定フィールド651に入力したページと行に含まれている単語を単語情報123から取得し一覧表示する。登録者は、設定したい単語に対応したリンク先フィールド621にリンク先URL223を記入する。登録者は、確定ボタン622により、ページ設定フィールド641、行設定フィールド651、単語フィールド652、リンク先フィールド621のそれぞれに設定した値と、単語情報123の内、設定した単語の列番号233を単語リンク情報125に登録する。
On the
図6の実施例では、画面を切り替えて設定を行う例を示したが、図7に示すように画面を遷移することなく一画面中で全ての設定を行うことももちろん可能である。 In the embodiment of FIG. 6, an example in which the setting is performed by switching the screen is shown. However, as shown in FIG. 7, it is of course possible to perform all the settings in one screen without changing the screen.
図7の動作を説明する。図7は本実施形態のリンク先登録のためにディスプレイ703に表示される他の画面の例である。図7において、登録画面180は、文書表示エリア181に設定を行う文書を表示し、行番号182に対応して行リンク設定フィールド185で行単位にリンク先URL223を設定する。またリンク先URL223を設定可能な単語は、文書表示エリア181に表示された文書中に設定枠183が表示され、単語リンク設定フィールド185で単語ごとにリンク先URL223を設定することができる。
The operation of FIG. 7 will be described. FIG. 7 is an example of another screen displayed on the
次に、リンク先登録部111において図11の行リンク情報124を作成する手順を、以下図14のフローチャート図と図13を用いて詳細に説明する。図13は、本実施形態のリンク先登録部111が作成するデータの例、図14は、本実施形態のリンク先登録部111の動作を示すフローチャート図である。
Next, a procedure for creating the
図13において、文書リンクテーブル240は、文書毎に設定される文書リンクデータ243−1〜fから構成され、文書リンクデータ243−1〜fは、文書番号200とリンク先URL223から構成される。ページリンクテーブル250は、ページ単位に設定するページリンクデータ253−1〜gから構成され、ページリンクデータ253−1〜gは、ページ番号210、リンク先URL223から構成される。行リンクテーブル260は、行単位に設定する行リンクデータ263−1〜hから構成され、行リンクデータ263−1〜hは、ページ番号210、行番号211、リンク先URL223から構成される。
In FIG. 13, the document link table 240 is composed of document link data 243-1 to 24-f set for each document, and the document link data 243-1 to 243-f is composed of a
行リンク情報124は、文書リンクテーブル240、ページリンクテーブル250、行リンクテーブル260から自動的に生成される。すなわち、行リンクテーブル260にリンク先URL223が設定しているか行単位に検査し(280)、検査した行のリンク先URL223が設定されている場合は、行リンク情報124に行リンクテーブル260の検査した行のリンク先URL223を設定する(281)。行リンクテーブル260の検査した行にリンク先URL223が設定されていない場合は、ページリンクテーブル250に、検査する行を含むページがリンク先URL223を設定しているか検査する(282)。リンク先URL223が設定されている場合は、ページリンクテーブル250の検査する行を含む指定ページのリンク先URL223を、行リンク情報124の検査する行のリンク先URL223として設定する(283)。ページリンクテーブル250の指定ページにリンク先URL223が設定していない場合は、文書リンクテーブル240の該当する文書番号200に対応するリンク先URL223を、行リンク情報124の検査する行のリンク先URL223に設定する(284)。
The
図1の携帯端末装置300とサーバ装置320の詳細を、図15を用いて詳細に説明する。以下、図15の携帯端末装置300とサーバ装置320の各部の動作を、図16のフローチャート図と図20、図21を用いて説明する。図15は、本実施形態の携帯端末装置300とサーバ装置320の動作を示すブロック図の例であり、図16は、本実施形態の携帯端末装置300とサーバ装置320の動作を示すフローチャート図である。図20は、本実施形態の印刷した文書の例、図21は、本実施形態のカメラ303で撮影した画像がディスプレイ716に表示する例である。
Details of the mobile
図1と図15の各ブロックの対応を説明する。撮影装置23はカメラ303に対応する。表示装置22は,表示部305に対応する。文書選択装置21は,文書選択部301に対応する。文字認識装置24は,文字認識部304,単語照合部322,認識設定部302に対応する。
図15において、最初にサーバ装置320は、文書登録装置10から文書情報120、文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、文字情報126を取得する(355)。この処理は文書登録時に一度だけ実行すればよい。
The correspondence between the blocks in FIGS. 1 and 15 will be described. The photographing
In FIG. 15, the
携帯端末装置300において、文書選択部301は、サーバ装置320の文書情報120から利用者が選択した情報を文書選択情報127にコピーする(355)。さらに利用者は、文書選択情報127から検索対象の文書を選択する(340)。サーバ装置320の文書管理部321は、利用者が選択した文書の文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、文字情報126を選択する(350)。認識設定部302は、文書管理部321が選択した文書属性情報121から文字認識部304のパラメータの設定を行い、単語照合辞書122を単語照合辞書307にコピーする(341)。カメラ303は、利用者の操作により印刷された文書370の一部の領域371を撮影する。文字認識部304は、カメラ303で撮影した画像中に含まれる文字の認識を行い、マーカ841を含む中心行385と、中心行385の上の行386、中心行385の下の行387の文字を認識し文字候補を出力する(343)。単語照合部322は、中心行385および上の行386、下の行387の文字候補から、単語照合辞書122に登録されている単語を利用して注目単語382、上単語383、下単語384を出力する(352)。
In the mobile
サーバ装置320において、検索部323は、注目単語382、上単語383、下単語384を利用し、文字情報126から単語の位置を検索し、検索の確信度を候補リスト128に登録する(353)。判定部324は、候補リストから最も確信度の高い単語と単語位置から、行リンク情報124および単語リンク情報125を利用してリンク先URL223を検索する(354)。携帯端末装置300の表示部305は、判定部324で検索したリンク先URL223の情報をブラウザを利用して表示する(344)。
In the
次に、検索部323の単語位置検索の詳細を図23のフローチャート図と図24を用いて以下説明する。図23は、本実施形態の検索部323の動作を示すフローチャート図であり、図24は、本実施形態の候補リスト128の例である。
Next, details of the word position search of the search unit 323 will be described below with reference to the flowchart of FIG. 23 and FIG. FIG. 23 is a flowchart showing the operation of the search unit 323 of this embodiment, and FIG. 24 is an example of the
図24において、候補リスト128は、候補データ425−1〜iにより構成され、候補データ425−1〜iは、注目単語382の文書中の位置を示すページ番号210、行番号211、列番号233と、注目単語382の場所と一致する可能性を示す確信度424からなる。
In FIG. 24, the
検索部323は、注目単語382を単語情報123から検索し、注目単語382と同一の単語230の行番号211と列番号233を取得する(400)。単語情報123で検索した単語230の上下の行に含まれる単語から、上単語383、下単語384と同一の単語230を検索し(401)、上単語383、下単語384の存在の判定を行う(402)。上単語383、下単語384が見つからない場合は、単語情報123の次の単語から検索を継続する。単語情報123に上単語383または下単語384が存在した場合は、注目単語と上単語383および下単語384との位置関係を判定する(403)。位置関係が閾値内であれば、注目単語の文字位置を算出し、確信度424と共に候補リスト128に登録する(404)。候補リスト128の確信度424は、注目単語382と上単語383または下単語384との列番号233の差と、上単語383または下単語384の存在により決定する。単語情報123全てに対して、注目単語382の文字位置の検索を繰り返す(405)。
The search unit 323 searches the
本発明のサーバ装置300の実施形態では、検索部323は、単語情報123を使用して文字列位置を検索したが、文字情報126を利用することも可能である。すなわち、単語情報123から列番号を取得する代わりに、文字情報126の文字列から単語を検索し、単語の位置を文字列の文字数から逐次計算することにより、列番号を得ることができる。
In the embodiment of the
次に、判定部324の動作の詳細を図11、図12、図21、図22、図24および図25のフローチャート図を用いて以下説明する。図22は、本実施形態のカメラ303で撮影した画像がディスプレイ306に表示する他の例、図25は、本実施形態の判定部324の動作を示すフローチャート図である。
Next, details of the operation of the
判定部324は、候補リスト128中の候補データ425−1〜iから確信度424が最も大きい候補データ425−n検索する(365)。注目単語382上にマーカ381が設定されていたか判定する(361)。注目単語382上にマーカ381がある場合は、単語リンク情報125の単語リンクデータ235−1〜eより、候補データ425−nのページ番号210、行番号211、列番号233と一致する、単語リンクデータ235−mを検索する(362)。つぎに、注目単語382と単語リンクデータ235−mの単語230を照合する(363)。一致した場合は、単語リンクデータ235−mのリンク先URL223を出力する(364)。一致しない場合は、および注目単語382の判定(361)で図22に示すようにマーカ381と注目単語382がずれている場合は、行リンク情報124の行リンクデータ222−1〜bより、候補データ425−nのページ番号210、行番号211が一致する行リンクデータ222−rを検索する(365)。検索されたリンク先URL223を出力する(364)。
The
本発明の実施形態では、判定部は、単語リンク情報125と行リンク情報124を用いて単語単位あるいは行単位のリンク先URL223の検索を行ったが、文リンク情報590から文単位のリンク先URL223を検索することも可能である。文単位のリンク先URL223の検索は、まず最初に注目単語382の文書中の位置を示すページ番号210、行番号211、列番号233を単語情報123から取得する。次に取得したページ番号210と同一であり、かつ、行番号211が文字の始点の行番号273と終点の行番号271以内であり、かつ、列番号233が文字の始点の列番号274と終点の列番号272以内である文リンク情報590中のリンク先URL223を出力する。文のリンク情報としてリンク先URLとしたが、例えば日本語の文は英訳文を、英語の文は和訳を情報として出力することも可能である。
In the embodiment of the present invention, the determination unit searches the
携帯端末装置300のハードウェア構成を、図17を用いて説明する。図17は、本実施形態の携帯端末装置300のハードウェア構成図の例である。図1と図17の各ブロックの対応を説明する。入力装置20は,入力キー710に対応する。撮影装置23は,カメラ303に対応する。表示装置22は,ディスプレイ716に対応する。通信装置25は,通信回路713に対応する。文字選択装置21と文字認識装置24は,文字認識プログラム820に対応する。
A hardware configuration of the mobile
図17において、入力キー710は、検索対象の文書選択やカメラ設定を行う。通信回路713は、サーバ装置320の通信回路714とネットワーク36を介して接続し、カメラ303で撮影した画像中から文字認識にて得た文字列の送信と、文字列に関連した情報の受信を行う。ディスプレイ716は、カメラで撮影する画像の表示や文書選択を行う。文字認識プログラム820は、携帯端末装置300の動作を行うプログラムである。データメモリ801は、文書選択情報127と単語照合辞書307を格記憶する。
In FIG. 17, an
サーバ装置320のハードウェア構成を、図18を用いて説明する。図18は、本実施形態のサーバ装置320のハードウェア構成図の例である。図1と図18の各ブロックの対応を説明する。通信装置30は,通信回路714に対応する。通信回路33は,第2の通信回路715に対応する。位置検索装置34と情報検索装置31は,文書検索プログラム840に対応する。記憶装置32は,データメモリ801に対応する。
The hardware configuration of the
図18において、第2の通信回路715は、文書登録装置10とネットワーク26を介して接続し、文書登録装置10のデータメモリ801に記憶したデータを受信し、サーバ装置320のデータメモリ801に格納する。文書検索プログラム840は、サーバ装置320の動作を行うプログラムである。データメモリ801は、受信した、文書情報120、文書属性情報121、単語照合辞書122、行リンク情報124、単語リンク情報125、単語情報123と、候補リスト128を記憶する。
In FIG. 18, the
携帯端末装置300のディスプレイ716に表示される画面の遷移を、以下図19を用いて詳細に説明する。図19は、本実施形態のディスプレイ306に表示する画面遷移図の例である。以下ボタンは、入力キー710により選択される。また戻るボタン913の選択により前画面を表示する。文字認識プログラム820は、起動するとディスプレイ716に文書選択画面900を表示する。文書選択画面900は、利用可能な文書を文書選択情報127から読み出し、文書リスト901に表示する。利用者は、文書リスト901に利用する文書が表示されていない場合、追加ボタン902を選択することにより文書追加画面910を表示する。また、文書選択情報127から不要な文書情報を削除したい場合は、文書リスト901から削除する文書を選択し削除ボタン903を選択することにより文書選択情報127から該当する文書情報を削除する。検索を実行したい場合は、文書リスト901から文書を選択し選択ボタン904を選択することにより、文書確認画面930を表示する。文書追加画面910は、文書一覧911に、文書情報120に登録されている文書の一覧を表示し、文書一覧911から文書選択情報127に追加したい文書を選択し詳細ボタン912を選択することにより文書詳細画面920を表示する。文書詳細画面920は、選択した文書の詳細情報を詳細表示921に表示する。
The transition of the screen displayed on the
利用者は、タイトルや課金情報などを確認して登録ボタン922を選択することにより、文書選択情報127に選択した文書の文書情報を追加する。文書確認画面930は、詳細表示931に選択した文書の詳細情報を表示し、利用者は、タイトルや課金情報などを確認して、問題がなければ確認ボタン932を選択することにより撮影画面940を表示する。撮影画面940は、撮影する画像を表示画像380に表示し、利用者がマーカ381を検索したい文字に合わせ、検索ボタン943を選択することにより検索を実行し、検索が完了すると確認画面950を表示する。確認画面950は、リンク情報表示951に検索したリンク先URL223を表示する。利用者は、検索結果に誤りがなければ表示ボタン952を選択し、ブラウザ960を表示する。ブラウザ960は、リンク先URL223の情報を表示する。
The user adds the document information of the selected document to the
携帯端末装置300とサーバ装置320において、単語照合の別の方法について図26のブロック図を図27のフローチャート図を用いて詳細に説明する。図26は、本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すブロック図、図27は、本実施形態の携帯端末装置300とサーバ装置320の他の動作を示すフローチャート図である。
In the portable
携帯端末装置300は、あらかじめ第1の単語照合辞書501を備える。第2の単語照合辞書506は、単語照合辞書122と第1の単語照合辞書501との差で作成される。文書の選択(340)により、選択した文書に対応する第2の単語照合辞書501をデータメモリ801にロードする(521)。カメラ303から入力した画像は、文字認識部304で文字認識し文字候補を出力する(343)。第1の単語照合部500は、第1の単語照合辞書501を利用して文字候補から単語を照合し(514)、第1の単語照合辞書501に登録された単語と文字候補が一致するか判定する(515)。第1の単語照合辞書501の単語と一致した場合は、単語をサーバ装置320の検索部323に送信し、検索部323は、単語の文書中の位置の検索を行う(354)。一致しない場合は、サーバ装置320の第2の単語照合部505で第2の単語照合辞書506を利用して単語を照合する(522)。本発明の実施形態では、第2の単語照合辞書506をサーバ装置320に持つ例を示したが、携帯端末装置300にダウンロードし、携帯端末300側で第1の単語照合辞書501と第2の単語照合辞書506を利用して単語照合部322で単語照合を行うことも可能である。
The mobile
次に文字認識部304と認識設定部302の動作の詳細を、図33と図34を用いて以下説明する。図33は、本実施形態の文字認識部304と認識設定部302の動作を示す図の例、図34は、本実施形態の文書属性情報121の例である。文書属性情報121は、複数の文書属性73−1〜73−jにより構成され、文書属性73−1〜73−jは、文書番号200、二値化モード70、文字方向71、文字コード72により構成する。
The act of the details of the
認識設定部302は、サーバ装置320から受信した文書属性情報121から、選択した文書の文書番号200に対応する二値化モード70の値により、二値化処理部51の第1の画像二値化処理60と第2の画像二値化処理61を切り換える。また、文字方向71の値により、文字行切り出し部52の縦書き処理部62と横書き処理部63を切り換える。また、文字コード72の値により、識別部64が識別辞書65中の文字コード72で指定した文字コードの特徴量と比較するように設定する。なお、識別処理部55において、識別部64は、特徴抽出部54の文字ごとの特徴量と、識別辞書65に登録されている全ての文字コードの特徴量とを比較する。判定部66は、比較の差が小さい順に文字コードを出力する。
Based on the value of the
本発明の文書情報検索システムの利用形態を、以下図35を用いて詳細に説明する。図35は、本実施形態の文書情報登録システムを運用するためのシステム利用形態の例である。出版社956は、発行する文書の著者から原稿受け取り、キーボード950よりDTP951に入力し編集を行う。DTP951は、原稿の校正のためPDFファイル952に出力し、プリンタ953で校正用原稿954を出力する。校正が終了した原稿は、DTP951から出版用印刷データ955を出力し、印刷機956にて販売用の書籍957を印刷する。文書登録装置10は、校正のため出力するPDFファイル952を入力し、文書に関連情報を付加した検索用DBを作成する。作成したDBは、ネットワーク26を経由して、コンテンツプロバイダ958のサーバ装置300に転送する。利用者は、出版した書籍957を購入し、携帯端末装置320を使用して書籍957の一部画像を撮影する。携帯端末装置320は、画像中から認識した文字列を、ネットワーク36を経由してサーバ装置300に転送する。サーバ装置300は、検索用DBから文字列に関連した情報を検索する。検索した情報は、携帯端末装置300に表示する。
The usage mode of the document information retrieval system of the present invention will be described in detail below with reference to FIG. FIG. 35 is an example of a system usage mode for operating the document information registration system of this embodiment. The
また、出版社960は、既に出版されている書籍957を、スキャナ961から各ページを画像として入力する。OCR962は、各ページの画像から文字を認識するとともに文字画像の位置も検出する。構造化958は、文字と文字位置からPDFファイル952を作成する。文書登録装置10は、PDFファイル952を入力して、文書に関連情報を付加した検索用DBを作成する。
The
以上で説明した、PDAファイルから検索用DBを作成する手順は、もちろん出版社以外の第三者が請け負ってもよい。
本発明の実施形態では、文書に関連する情報としてURLを想定したが、URLの他に、直接文字、音、画像といった情報を直接送ることももちろん可能である。
The procedure for creating the search DB from the PDA file described above may of course be undertaken by a third party other than the publisher.
In the embodiment of the present invention, a URL is assumed as information related to a document. However, it is of course possible to directly send information such as characters, sounds, and images in addition to the URL.
日本語文書を対象としているが、もちろん英文など各国語にも適応することは容易である。例えば英文やハングル語などは単語がスペースで区切られているため、形態素解析を行うことなく容易に単語単位に切り出すことが可能であり、また注目単語の上下行の単語に加え、注目単語の左右の単語を利用して注目単語の位置を検索することも可能である。 It is intended for Japanese documents, but of course it is easy to adapt to other languages such as English. For example, in English and Korean, words are separated by spaces, so they can be easily extracted in units of words without performing morphological analysis. It is also possible to search the position of the attention word using the word.
実施例では、携帯端末装置とサーバ装置で分けたが処理の分担を制限することはない。例えば、単語照合を携帯端末装置で実施したがサーバ装置で実施することも可能である。また、例えば、文字認識を携帯端末装置で実施したがサーバ装置で実施することも可能である。また、サーバ装置と携帯端末装置に分けたが、サーバ装置の動作と携帯端末の動作が同一装置内で実行することも可能である。 In the embodiment, the mobile terminal device and the server device are divided, but the sharing of processing is not limited. For example, although word collation was implemented with the portable terminal device, it is also possible to implement with the server device. For example, although character recognition was implemented with the portable terminal device, it is also possible to implement with the server device. Moreover, although it divided into the server apparatus and the portable terminal device, the operation | movement of a server apparatus and the operation | movement of a portable terminal can also be performed within the same apparatus.
実施例では、携帯端末装置320のプログラムメモリ800に文字認識プログラム820があらかじめ記憶されていたが、サーバから文字認識プログラム820をダウンロードして実行することも可能である。また、実施例では検索対象の文書を選択したが検索対象の文書にあわせて文書に対応した文字認識プログラム820をダウンロードすることも可能である。
In the embodiment, the
実施例では、単語位置検索に注目単語382、上単語383、下単語383の3単語を使ったが、、検索に利用する単語の数を制限するものではない。
実施例では、電子ファイルから入力したが例えば既に印刷した文書をOCRを利用して文字および文字位置を取得することも可能である。
In the embodiment, three words of the
In the embodiment, it is also possible to acquire characters and character positions using, for example, an OCR for a document that has been input from an electronic file but has already been printed.
実施例では、リンク先URL223の設定を行または単語単位としたが、文単位にリンク先URLを設定することも可能である。例えば図28に示すように、文の開始の行番号211と列番号233、および文の終了の行番号271と列番号272に体操してリンク先URL223を記憶することにより、検索した単語が設定した文と開始と終了内にあれば、該当するリンク先URL223を出力することも可能である。これにより、例えば日本語文章であれば英訳文や英語の文書なら和訳を情報とすることももちろん可能である。
In the embodiment, the
10 文書登録装置、20 入力装置、21 文書選択装置、22 表示装置、23 撮影装置、24 文字認識装置、25 通信装置、26 ネットワーク、
30 通信装置、31 情報検索装置、32 記憶装置、33 通信装置、34 位置検索装置、36 ネットワーク、
41 文書入力装置、42 解析装置、43 登録装置、44 記憶装置、45 入力装置、46 通信装置、
300 サーバ装置、320 携帯端末装置。
10 document registration device, 20 input device, 21 document selection device, 22 display device, 23 photographing device, 24 character recognition device, 25 communication device, 26 network,
30 communication device, 31 information search device, 32 storage device, 33 communication device, 34 position search device, 36 network,
41 document input device, 42 analysis device, 43 registration device, 44 storage device, 45 input device, 46 communication device,
300 server device, 320 mobile terminal device.
Claims (11)
前記文書ファイルの文書中の文字列を抽出する文字列抽出手段と、
前記文字列の前記文書中の文字位置を登録する位置登録手段と、
前記文字列にリンクした情報を示す関連情報を登録する情報登録手段と、
前記文字列と前記文字位置と前記関連情報を関連付けて記憶する記憶手段と、
前記文書中の一部である画像から指定される注目文字列と、前記注目文字列の周囲にある周辺文字列を認識する文字認識手段を備える端末装置から入力される前記注目文字列と前記周辺文字列との位置関係に基づいて、前記位置関係を満たす前記注目文字列の前記文書中の前記文字位置を前記記憶手段から検索する文字位置検索手段と、
検索した前記文字位置の文字列にリンクした前記関連情報を検索する情報検索手段と、
前記情報検索手段により検索した前記関連情報を前記端末装置に出力する出力手段を有することを特徴とする文書情報検索システム。 An input means for inputting a document file describing a document to be searched;
A character string extracting means for extracting a character string in the document of the document file;
And location registration means for registering the character position location in said document of the string,
Information registration means for registering related information indicating information linked to the character string;
Storage means for storing in association with the related information and the character position location with the character string,
The target character string specified from an image that is a part of the document, and the target character string input from a terminal device that includes a character recognition unit that recognizes a peripheral character string around the target character string and the peripheral based on the positional relationship between the character strings, and character position search means for searching said character position in said document of the target character string satisfying the positional relationship from the storage means,
Information retrieval means for retrieving the related information linked to the character string at the retrieved character position;
A document information search system comprising: output means for outputting the related information searched by the information search means to the terminal device.
前記文書情報検索システムは、登録する文書から抽出した前記文字列と、前記第1の単語照合辞書に登録されている文字列との差分の文字列を記憶した第2の単語照合辞書を有し、
前記第1の単語照合辞書に登録した文字列が検索されない場合、前記第2の単語照合辞書を利用して文字列を出力することを特徴とする文書情報検索システム。 The document information retrieval system according to claim 1, wherein the terminal device further includes a first word matching dictionary created with a specific character string,
The document information search system includes a second word matching dictionary that stores a character string that is a difference between the character string extracted from a document to be registered and a character string registered in the first word matching dictionary. ,
A document information retrieval system that outputs a character string using the second word matching dictionary when a character string registered in the first word matching dictionary is not retrieved.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004336856A JP4576211B2 (en) | 2004-11-22 | 2004-11-22 | Document information retrieval system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004336856A JP4576211B2 (en) | 2004-11-22 | 2004-11-22 | Document information retrieval system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006146627A JP2006146627A (en) | 2006-06-08 |
JP4576211B2 true JP4576211B2 (en) | 2010-11-04 |
Family
ID=36626224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004336856A Expired - Fee Related JP4576211B2 (en) | 2004-11-22 | 2004-11-22 | Document information retrieval system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4576211B2 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5232449B2 (en) | 2007-11-21 | 2013-07-10 | Kddi株式会社 | Information retrieval apparatus and computer program |
KR101117171B1 (en) * | 2008-10-22 | 2012-03-07 | 엔에이치엔(주) | Method, system and computer-readable recording medium for creating data for retrieval |
JP5384315B2 (en) * | 2009-08-04 | 2014-01-08 | 日本電信電話株式会社 | SEARCH DEVICE, METHOD, AND PROGRAM |
JP5312310B2 (en) * | 2009-12-21 | 2013-10-09 | 日本電信電話株式会社 | SEARCH DEVICE, METHOD, AND PROGRAM |
JP5900204B2 (en) * | 2012-07-10 | 2016-04-06 | 富士ゼロックス株式会社 | Document processing apparatus and program |
CN105264486B (en) * | 2012-12-18 | 2018-10-12 | 汤姆森路透社全球资源无限责任公司 | Mobile phone for intelligent study platform may have access to system and process |
KR102244298B1 (en) | 2014-04-30 | 2021-04-23 | 삼성전자주식회사 | Apparatus and Method for structuring web page access history based on semantics |
US10102206B2 (en) * | 2016-03-31 | 2018-10-16 | Dropbox, Inc. | Intelligently identifying and presenting digital documents |
JP7019963B2 (en) * | 2016-05-10 | 2022-02-16 | 凸版印刷株式会社 | Character string area / character rectangle extraction device, character string area / character rectangle extraction method, and program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004157929A (en) * | 2002-11-08 | 2004-06-03 | Minoru Torii | Information providing system cooperating with paper medium and business method for information provision cooperating with paper medium and program for information providing system cooperating with paper medium |
JP2004318766A (en) * | 2003-02-26 | 2004-11-11 | Ricoh Co Ltd | Information retrieval device, program and storage medium |
-
2004
- 2004-11-22 JP JP2004336856A patent/JP4576211B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004157929A (en) * | 2002-11-08 | 2004-06-03 | Minoru Torii | Information providing system cooperating with paper medium and business method for information provision cooperating with paper medium and program for information providing system cooperating with paper medium |
JP2004318766A (en) * | 2003-02-26 | 2004-11-11 | Ricoh Co Ltd | Information retrieval device, program and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2006146627A (en) | 2006-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4854491B2 (en) | Image processing apparatus and control method thereof | |
JP4181892B2 (en) | Image processing method | |
US7783472B2 (en) | Document translation method and document translation device | |
JP5511450B2 (en) | Image processing apparatus, image processing method, and program | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
US20040213458A1 (en) | Image processing method and system | |
JP4576211B2 (en) | Document information retrieval system | |
JP4227432B2 (en) | Image processing method | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP4338189B2 (en) | Image processing system and image processing method | |
JP2008129793A (en) | Document processing system, apparatus and method, and recording medium with program recorded thereon | |
JP4597644B2 (en) | Character recognition device, program and recording medium | |
JP7379876B2 (en) | Character recognition device, document file generation method, document file generation program | |
JP2008282094A (en) | Character recognition processing apparatus | |
JP2008028716A (en) | Image processing method and apparatus | |
JP4474231B2 (en) | Document link information acquisition system | |
JP2004348467A (en) | Image retrieval apparatus and its control method, program | |
JP2007011683A (en) | Document management support device | |
JP2005149210A (en) | Image processor, method for controlling it, and program | |
JP4677750B2 (en) | Document attribute acquisition method and apparatus, and recording medium recording program | |
JP2006134042A (en) | Image processing system | |
JP2009110204A (en) | Document processing apparatus, document processing system, document processing method, and document processing program | |
Lins et al. | Generating Digital Libraries of M. Sc. and Ph. D. Theses | |
JP2009205209A (en) | Document image processor and document image processing program | |
JP2003173421A (en) | Character recognition result correcting device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060509 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100823 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |