JP5787925B2 - SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD - Google Patents

SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD Download PDF

Info

Publication number
JP5787925B2
JP5787925B2 JP2013060961A JP2013060961A JP5787925B2 JP 5787925 B2 JP5787925 B2 JP 5787925B2 JP 2013060961 A JP2013060961 A JP 2013060961A JP 2013060961 A JP2013060961 A JP 2013060961A JP 5787925 B2 JP5787925 B2 JP 5787925B2
Authority
JP
Japan
Prior art keywords
character
image
search target
search
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013060961A
Other languages
Japanese (ja)
Other versions
JP2014186545A (en
Inventor
直哉 別所
直哉 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013060961A priority Critical patent/JP5787925B2/en
Publication of JP2014186545A publication Critical patent/JP2014186545A/en
Application granted granted Critical
Publication of JP5787925B2 publication Critical patent/JP5787925B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、検索装置、検索プログラム、および検索方法に関する。   The present invention relates to a search device, a search program, and a search method.

書籍のスキャン画像を基にテキストデータを作成する書籍の電子化技術が普及している。書籍を電子化するには、まず、書籍をスキャンし、スキャン画像から文字画像を抽出する。この文字画像に対応する文字コードを文字パターン辞書から取得することにより、文字画像をテキストデータに変換する。そうして、スキャン画像を基にテキストデータを作成することにより、書籍を電子ファイル化する。   2. Description of the Related Art Computerization technology for books that creates text data based on scanned images of books has become widespread. In order to digitize a book, first, the book is scanned and a character image is extracted from the scanned image. By obtaining a character code corresponding to the character image from the character pattern dictionary, the character image is converted into text data. Then, by creating text data based on the scanned image, the book is converted into an electronic file.

スキャン画像に含まれる文章から用語を検索する際は、一旦、スキャン画像を電子化し、テキストデータに変換してから、テキストデータを基にして用語検索をおこなう。   When searching for terms from sentences included in a scanned image, the scanned image is first digitized and converted into text data, and then a term search is performed based on the text data.

特開2003−162469号公報JP 2003-162469 A 特開2012−256140号公報JP 2012-256140 A

しかしながら、スキャン画像における用語検索が困難という問題がある。   However, there is a problem that term search in the scanned image is difficult.

開示の技術は、上記に鑑みてなされたものであって、文書のスキャン画像を基に用語検索することができる検索装置、検索プログラム、および検索方法を提供することを目的する。   The disclosed technology has been made in view of the above, and an object of the present invention is to provide a search device, a search program, and a search method that can perform a term search based on a scanned image of a document.

本願に係る検索装置は、文書からスキャンされたスキャン画像と、該スキャン画像に含まれる文字画像および該文字画像に対応する文字コードとを対応付けた文字画像コードセットとを記憶する記憶手段と、検索対象として指定された検索対象文字に係る文字コードに対応する文字画像を、前記文字画像コードセットから取得する取得手段と、前記文字画像コードセットから取得された文字画像を、前記スキャン画像と照合する照合手段と、前記照合部による照合結果を出力する出力手段と、を備えたことを特徴とする。   The search device according to the present application stores a scanned image scanned from a document, a character image code set in which a character image included in the scanned image and a character code corresponding to the character image are associated with each other, An acquisition means for acquiring a character image corresponding to a character code related to a search target character designated as a search target from the character image code set, and collating the character image acquired from the character image code set with the scan image And collating means for outputting, and outputting means for outputting the collation result by the collating unit.

開示の技術の実施態様によれば、文書のスキャン画像を基に用語検索することができるという効果を奏する。   According to the embodiment of the disclosed technology, the term search can be performed based on the scanned image of the document.

図1は、実施例1に係る表示処理を説明するための図である。FIG. 1 is a diagram for explaining display processing according to the first embodiment. 図2は、書籍の電子化処理システムに係る構成の一例を示した図である。FIG. 2 is a diagram showing an example of a configuration relating to a book electronic processing system. 図3は、実施例1に係る電子化処理サーバの構成を示す機能ブロック図である。FIG. 3 is a functional block diagram illustrating the configuration of the electronic processing server according to the first embodiment. 図4は、スキャン画像の一例を示した図である。FIG. 4 is a diagram illustrating an example of a scanned image. 図5は、文字パターン辞書の一例を示した図である。FIG. 5 is a diagram showing an example of a character pattern dictionary. 図6は、文字画像コードセットの一例を示した図である。FIG. 6 is a diagram showing an example of a character image code set. 図7は、スキャン画像から文字画像コードセットを作成するまでの手順を示した図である。FIG. 7 is a diagram illustrating a procedure from creation of a character image code set from a scanned image. 図8は、実施例1に係る文字画像コードセットの作成手順を示すフローチャート図である。FIG. 8 is a flowchart illustrating a procedure for creating a character image code set according to the first embodiment. 図9は、実施例1に係る検索装置の構成を示す機能ブロック図である。FIG. 9 is a functional block diagram illustrating the configuration of the search device according to the first embodiment. 図10は、電子化処理サーバからダウンロードしたスキャン画像を検索装置に表示した状態を示した図である。FIG. 10 is a diagram illustrating a state in which the scanned image downloaded from the computerization processing server is displayed on the search device. 図11は、検索対象用語の検索結果を検索装置に表示した状態を示した図である。FIG. 11 is a diagram showing a state in which the search result of the search target term is displayed on the search device. 図12は、検索装置が検索対象用語の検索結果を表示するまでの手順を示した図である。FIG. 12 is a diagram showing a procedure until the search device displays the search result of the search target term. 図13は、実施例1に係る検索装置が検索対象用語の検索結果を表示するまでの手順を示すフローチャート図である。FIG. 13 is a flowchart illustrating a procedure until the search device according to the first embodiment displays the search result of the search target term. 図14は、検索対象文字入力欄に複数の検索対象文字が入力された場合において、第一の方法で検索対象用語をスキャン画像に照合する手順を示した図である。FIG. 14 is a diagram showing a procedure for collating a search target term with a scanned image by the first method when a plurality of search target characters are input in the search target character input field. 図15は、検索対象文字入力欄に複数の検索対象文字が入力された場合において、第二の方法で検索対象用語をスキャン画像に照合する手順を示した図である。FIG. 15 is a diagram showing a procedure for collating a search target term with a scan image by the second method when a plurality of search target characters are input in the search target character input field. 図16は、スキャン画像に複数の書体の文字画像を含む場合における文字画像コードセットを示した図である。FIG. 16 is a diagram showing a character image code set when a scanned image includes character images of a plurality of typefaces. 図17は、スキャン画像において検索対象用語が示されている部分をハイライト表示したときの図である。FIG. 17 is a diagram when the portion where the search target term is shown in the scanned image is highlighted.

以下に、本願に係る検索装置、検索プログラム、および検索方法を実施するための実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る検索装置、検索プログラム、および検索方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。   Hereinafter, embodiments for carrying out a search device, a search program, and a search method according to the present application will be described in detail with reference to the drawings. Note that the search device, search program, and search method according to the present application are not limited by this embodiment. In the following embodiments, the same portions are denoted by the same reference numerals, and redundant description is omitted. Each embodiment can be appropriately combined within a range in which processing contents do not contradict each other.

まず、図1を用いて、実施例1に係る表示処理について説明する。図1は、実施例1に係る表示処理を説明するための図である。図1の例では、検索装置13は、電子化処理サーバ10から書籍をスキャンすることにより作成されたスキャン画像11と、スキャン画像11に含まれる文字画像と文字コードを対応付けた文字画像コードセット12と、をダウンロードする。   First, display processing according to the first embodiment will be described with reference to FIG. FIG. 1 is a diagram for explaining display processing according to the first embodiment. In the example of FIG. 1, the search device 13 includes a scan image 11 created by scanning a book from the computerization processing server 10, and a character image code set in which a character image and a character code included in the scan image 11 are associated with each other. 12 are downloaded.

検索装置13は、電子化処理サーバ10からダウンロードしたスキャン画像11と文字コードセット12とを記憶領域に保存する。検索装置13は、表示部14から検索対象となる検索対象文字を受け付ける。例えば、検索装置13は、表示部14に「外」という検索対象文字が入力されているので、用語検索が開始されると、検索対象文字として「外」を受け付ける。次に、検索装置13は、検索対象文字に係る文字コードに対応する文字画像を、文字画像コードセット12から取得する。例えば、検索装置13は、検索対象文字「外」に係る文字コード「8A4F」により文字画像コードセット12から文字画像「外」を取得する。   The search device 13 stores the scanned image 11 and the character code set 12 downloaded from the computerization processing server 10 in a storage area. The search device 13 receives a search target character that is a search target from the display unit 14. For example, since the search target character “outside” is input to the display unit 14 when the term search is started, the search device 13 accepts “outside” as the search target character. Next, the search device 13 acquires a character image corresponding to the character code related to the search target character from the character image code set 12. For example, the search device 13 acquires the character image “outside” from the character image code set 12 using the character code “8A4F” related to the search target character “outside”.

次に、検索装置13は、文字画像コードセット12から取得された文字画像を、スキャン画像11と照合する。そして、検索装置13は、検索結果を表示部14に一覧で表示する。例えば、検索装置13は、文字画像「外」をスキャン画像11の文字列と照合する。このとき、検索装置13は、「外」が1ページ目の1行目に含まれるので、「1p1行」の表示と共に「外」を含むセンテンスを表示部14に表示する。なお、検索装置13は「外」を含む他のページ数、行数と共に「外」を含むセンテンスを表示部14に列挙して表示する。   Next, the search device 13 collates the character image acquired from the character image code set 12 with the scanned image 11. Then, the search device 13 displays the search results as a list on the display unit 14. For example, the search device 13 collates the character image “outside” with the character string of the scan image 11. At this time, since “outside” is included in the first line of the first page, the search device 13 displays a sentence including “outside” on the display unit 14 together with the display of “1p1 line”. The search device 13 lists and displays sentences including “Outside” on the display unit 14 together with the number of other pages and lines including “Outside”.

このように、検索装置13は、検索対象文字に係る文字コードに対応する文字画像を、文字画像コードセット12から取得し、取得した文字画像をスキャン画像11と照合し、その検索結果を表示部14に表示する。これにより、検索装置13は、文書のスキャン画像を基に用語検索することができる。   As described above, the search device 13 acquires a character image corresponding to the character code related to the search target character from the character image code set 12, collates the acquired character image with the scan image 11, and displays the search result on the display unit. 14 is displayed. Thereby, the search device 13 can perform a term search based on the scanned image of the document.

[電子化システムの全体構成]
図2は、電子化システムの全体構成の一例を示した図である。ユーザ端末101と電子化サーバ110と管理システム120は、図示しないネットワークを介して通信可能に接続され、各種の情報を交換することが可能とされている。かかるネットワークの一態様としては、有線または無線を問わず、LAN(Local Area Network)やVPN(Virtual Private Network)、移動体通信網などの任意の通信網が挙げられる。
[Overall configuration of electronic system]
FIG. 2 is a diagram illustrating an example of the overall configuration of the computerized system. The user terminal 101, the computerized server 110, and the management system 120 are communicably connected via a network (not shown) so that various types of information can be exchanged. As an aspect of such a network, there is an arbitrary communication network such as a local area network (LAN), a virtual private network (VPN), or a mobile communication network regardless of wired or wireless.

ユーザ端末101は、ユーザが操作する端末装置であり、一例として、デスクトップ型PC(パーソナルコンピュータ)、タブレット型PC、ノート型PCなどの情報処理装置等である。なお、ユーザ端末101は、スマートフォン、PDA(Personal Digital Assistant)、携帯電話機であってもよい。なお、図2の例では、ユーザ端末101として、デスクトップ型PCとスマートフォンをそれぞれ1つ例示したが、開示のシステムはこれに限定されず、ユーザ端末101は任意の数とすることができる。   The user terminal 101 is a terminal device operated by a user, and is, for example, an information processing apparatus such as a desktop PC (personal computer), a tablet PC, or a notebook PC. The user terminal 101 may be a smart phone, a PDA (Personal Digital Assistant), or a mobile phone. In the example of FIG. 2, one desktop PC and one smartphone are illustrated as the user terminals 101, but the disclosed system is not limited to this, and the number of user terminals 101 can be any number.

電子化サーバ110は、紙媒体の書籍の電子化する事業者111の所有するサーバである。電子化サーバ110には、スキャナ等の機器が接続され、紙媒体の書籍の電子化を行う。   The computerization server 110 is a server owned by a business entity 111 that digitizes paper-based books. A device such as a scanner is connected to the computerization server 110 to digitize a paper book.

管理システム120は、各種の管理を行うシステムである。例えば、管理システム120は、電子書籍データを管理する。管理システム120は、受信サーバ121と、ファイル管理サーバ122と、認証サーバ123と、決済サーバ124とを有する。受信サーバ121とファイル管理サーバ122と認証サーバ123と決済サーバ124は、図示しないネットワークを介して通信可能に接続され、各種の情報を交換する。かかるネットワークの一態様としては、LANなどが挙げられる。なお、ファイル管理サーバ122は、登録されたユーザ毎にユーザ用の記憶領域が設けている。   The management system 120 is a system that performs various types of management. For example, the management system 120 manages electronic book data. The management system 120 includes a receiving server 121, a file management server 122, an authentication server 123, and a settlement server 124. The receiving server 121, the file management server 122, the authentication server 123, and the settlement server 124 are communicably connected via a network (not shown) and exchange various types of information. An example of such a network is a LAN. The file management server 122 has a user storage area for each registered user.

電子化サーバ110は、Webページ103を提供しており、Webページ103から書籍の電子化の依頼を受け付ける。ユーザは、紙媒体の書籍を電子化する場合、Webページ103から会員登録を行い、付与された会員番号を用いてWebページ103にログインする。Webページ103には、書籍の電子化に関する料金など各種の情報が表示される。   The electronic server 110 provides a web page 103 and accepts a request for digitizing a book from the web page 103. When digitizing a paper book, the user registers as a member from the Web page 103 and logs in to the Web page 103 using the assigned member number. On the Web page 103, various kinds of information such as a fee related to digitization of books are displayed.

電子化サーバ110は、電子化した書籍のデータを、管理システム120を介してユーザに提供する。Webページ103は、管理システム120のユーザIDおよびパスワードを入力する入力領域が設けられており、書籍の電子化を依頼された場合、ユーザIDおよびパスワードを用いて認証サーバ123によりユーザの認証を行う。ユーザは、Webページ103に管理システム120のユーザIDおよびパスワードを入力してログインする(1)。Webページ103は、入力されたユーザIDおよびパスワードを用いて認証サーバ123によりユーザの認証を行い、認証が得られた場合、書籍の電子化の依頼を受け付ける(2)。Webページ103は、書籍の電子化の依頼を受け付けると、依頼内容を受信サーバ121へ通知する。   The electronic server 110 provides electronic book data to the user via the management system 120. The web page 103 is provided with an input area for inputting the user ID and password of the management system 120. When an electronic book is requested, the authentication server 123 authenticates the user using the user ID and password. . The user logs in by entering the user ID and password of the management system 120 on the Web page 103 (1). The web page 103 authenticates the user by the authentication server 123 using the input user ID and password, and accepts a request for digitization of the book when the authentication is obtained (2). When the Web page 103 receives a request for digitization of a book, the Web page 103 notifies the reception server 121 of the request content.

事業者がユーザから発送された書籍を受け付けると(3)、事業者は図示されていないスキャナにより書籍を読み取らせ、電子化サーバ110はスキャナからスキャン画像12を取得する。電子化サーバ110は、スキャン画像12に含まれる文字列を取得し、電子化することによりテキストデータに変換する(4)。   When the business operator accepts the book sent from the user (3), the business operator reads the book with a scanner (not shown), and the electronic server 110 acquires the scanned image 12 from the scanner. The computerization server 110 acquires a character string included in the scanned image 12 and converts it into text data by digitizing the character string (4).

電子化サーバ110は、ユーザにより課金を確認すると(5)、スキャンデータ12およびテキストデータ111等の電子書籍データを受信サーバ121へ送信して、記憶部21の事業者用の記憶領域に書き込む(6)。受信サーバ121は、事業者用の記憶領域に電子書籍データ112が書き込まれると、書き込まれた電子書籍データを、ファイル管理サーバ122に設けられた電子化を依頼した依頼元のユーザの記憶領域に格納する。ユーザは、ユーザ端末101から依頼元のユーザの記憶領域にアクセスすることによりスキャン画像12およびテキストデータ111を閲覧できる(7)。   When the electronic server 110 confirms charging by the user (5), the electronic server 110 transmits electronic book data such as the scan data 12 and the text data 111 to the receiving server 121 and writes it in the storage area for the business in the storage unit 21 ( 6). When the electronic book data 112 is written in the storage area for the business, the receiving server 121 stores the written electronic book data in the storage area of the requesting user who requested digitization provided in the file management server 122. Store. The user can browse the scanned image 12 and the text data 111 by accessing the storage area of the requesting user from the user terminal 101 (7).

[電子化処理サーバにおける処理]
実施例1に係る電子化処理サーバ10の機能構成の一例について説明する。図3は、実施例1に係る電子化処理サーバの構成を示す機能ブロック図である。図3に示すように、電子化処理サーバ10は、制御部210と、記憶部220とを有する。また、電子化処理サーバ10は、スキャナ231と、通信I/F232とに接続される。
[Processing in electronic processing server]
An example of a functional configuration of the electronic processing server 10 according to the first embodiment will be described. FIG. 3 is a functional block diagram illustrating the configuration of the electronic processing server according to the first embodiment. As illustrated in FIG. 3, the electronic processing server 10 includes a control unit 210 and a storage unit 220. In addition, the electronic processing server 10 is connected to the scanner 231 and the communication I / F 232.

スキャナ231は、紙媒体の情報をスキャン画像として取込むための装置である。スキャナ231は、書籍の各ページをスキャン画像11として取込む。また、通信I/F232は、NIC(Network Interface Card)等のインタフェースである。通信I/F232は、スキャナ231によって取込まれたスキャン画像11と、電子化処理サーバ10において作成された文字画像コードセット12とを検索装置13に送信する。   The scanner 231 is a device for capturing information on a paper medium as a scanned image. The scanner 231 captures each page of the book as a scanned image 11. The communication I / F 232 is an interface such as a NIC (Network Interface Card). The communication I / F 232 transmits the scan image 11 captured by the scanner 231 and the character image code set 12 created in the computerization processing server 10 to the search device 13.

記憶部220は、各種情報を記憶するデバイスである。記憶部220は、画像記憶部221と、辞書記憶部222と、セット記憶部223とを有する。記憶部220は、制御部210で実行されるOS(Operating System)や、後述する格納処理を実行するプログラムを含む各種プログラムを記憶する。   The storage unit 220 is a device that stores various types of information. The storage unit 220 includes an image storage unit 221, a dictionary storage unit 222, and a set storage unit 223. The storage unit 220 stores various programs including an OS (Operating System) executed by the control unit 210 and a program for executing a storage process described later.

記憶部220が有する画像記憶部221は、スキャナ231が取込んだ書籍のスキャン画像11を記憶する。図4は、スキャン画像11の一例を示した図である。図4のように、画像記憶部221は、スキャン画像11がページ単位に作成され、各スキャン画像に対応するページ数をスキャン画像11に対応付けて記憶してもよい。また、画像記憶部221は、書籍の全ページに係るスキャン画像11を一括して記憶してもよい。   The image storage unit 221 included in the storage unit 220 stores the scanned image 11 of the book captured by the scanner 231. FIG. 4 is a diagram illustrating an example of the scanned image 11. As illustrated in FIG. 4, the image storage unit 221 may create the scan image 11 for each page, and store the number of pages corresponding to each scan image in association with the scan image 11. Further, the image storage unit 221 may collectively store the scanned images 11 relating to all pages of the book.

記憶部220が有する辞書記憶部222は、文字パターン辞書21を記憶する。文字パターン辞書21は、文字コードと辞書画像とを対応付けたデータセットである。図5は、文字パターン辞書21の一例を示した図である。図5に示すように、文字パターン辞書21は、複数の書体で表した文字画像を、一つの文字コードで関連付ける。例えば、4つの書体で表された辞書画像「外」を文字コード「8A4F」で関連付ける。また、4つの書体で表された辞書画像「国」を文字コード「8D91」で関連付ける。なお、文字パターン辞書21は、文字コードにシフト−JISコード、JISコード、EUC、Unicode等を使用する。   The dictionary storage unit 222 included in the storage unit 220 stores the character pattern dictionary 21. The character pattern dictionary 21 is a data set in which character codes are associated with dictionary images. FIG. 5 is a diagram showing an example of the character pattern dictionary 21. As shown in FIG. 5, the character pattern dictionary 21 associates character images represented by a plurality of typefaces with one character code. For example, the dictionary image “outside” represented by four typefaces is associated with the character code “8A4F”. In addition, the dictionary image “country” represented by four typefaces is associated with the character code “8D91”. The character pattern dictionary 21 uses shift-JIS code, JIS code, EUC, Unicode, etc. as the character code.

記憶部220が有するセット記憶部223は、文字パターンコードセット12を記憶する。文字パターンコードセットは、スキャン画像11に含まれる文字画像に、文字コードを対応付けたデータセットである。図6は、文字画像コードセット12の一例を示した図である。図6に示すように、文字画像コードセット12は、文字コードと文字画像を関連付けている。文字画像コードセット12は、文字画像の欄にスキャン画像11から取得した文字画像を重複なく登録している。例えば、文字画像コードセット12は、スキャン画像11に含まれる文字画像「外」を、文字コード「8A4F」に対応付けている。また、文字画像コードセット12は、スキャン画像11に含まれる文字画像「国」を、文字コード「8D91」に対応付けている。   The set storage unit 223 included in the storage unit 220 stores the character pattern code set 12. The character pattern code set is a data set in which a character code is associated with a character image included in the scanned image 11. FIG. 6 is a diagram showing an example of the character image code set 12. As shown in FIG. 6, the character image code set 12 associates a character code with a character image. The character image code set 12 registers character images acquired from the scanned image 11 in the character image column without duplication. For example, the character image code set 12 associates the character image “outside” included in the scanned image 11 with the character code “8A4F”. The character image code set 12 associates the character image “country” included in the scanned image 11 with the character code “8D91”.

制御部210は、取込部211と、セット作成部212と、送信部213とを備える。制御部210の各機能は、例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。   The control unit 210 includes an acquisition unit 211, a set creation unit 212, and a transmission unit 213. Each function of the control unit 210 can be realized, for example, by a CPU (Central Processing Unit) executing a predetermined program.

制御部210が有する取込部211は、画像記憶部221に記憶されているスキャン画像11を読み込み、スキャン画像11に含まれる各文字画像を取得する。例えば、図4に示したスキャン画像11の文字列の先頭にある文字画像「外」を取得する。   The capturing unit 211 included in the control unit 210 reads the scanned image 11 stored in the image storage unit 221 and acquires each character image included in the scanned image 11. For example, the character image “outside” at the head of the character string of the scanned image 11 shown in FIG. 4 is acquired.

制御部210が有するセット作成部212は、辞書記憶部222に記憶されている文字パターン辞書21を使用して、取得した文字画像に対応する文字コードを特定する。そして、セット作成部212は、スキャン画像11から取得した文字画像を文字コードに対応付け、文字画像コードセット12を作成し、セット記憶部223に記憶する。   The set creation unit 212 included in the control unit 210 uses the character pattern dictionary 21 stored in the dictionary storage unit 222 to specify a character code corresponding to the acquired character image. Then, the set creation unit 212 associates the character image acquired from the scanned image 11 with the character code, creates the character image code set 12, and stores it in the set storage unit 223.

このように、セット作成部212は、文字画像コードセット12の文字画像の欄に辞書画像ではなく、スキャン画像11から取得した文字画像を登録している。セット作成部212が仮に文字画像コードセット12に辞書画像を登録ものとすると、スキャン画像11の基となっている書籍が古書である場合等で独特の書体で記載されていたとき、照合の成功率が低下すると考えられる。しかし、文字画像コードセット12にスキャン画像11から取得した文字画像を登録することにしたので、スキャン画像11に独特の書体の文字が含まれていても、検索装置13における照合処理での照合の成功率を向上できる。   As described above, the set creation unit 212 registers not the dictionary image but the character image acquired from the scanned image 11 in the character image column of the character image code set 12. Assuming that the set creation unit 212 registers a dictionary image in the character image code set 12, if the book on which the scanned image 11 is based is an old book, the collation is successful. The rate is thought to decline. However, since the character image acquired from the scan image 11 is registered in the character image code set 12, even if the scan image 11 includes a character of a unique typeface, the collation process in the collation process in the search device 13 is performed. Improve success rate.

なお、実施例1においては、スキャン画像11にゴシック体の文字画像が含まれていたため、文字画像コードセット12は文字コードとゴシック体の文字画像とを関連付けている。また、文字画像コードセット12は、図6に示されている文字画像だけでなく、スキャンデータ11に含まれる全ての文字画像を含む。   In the first embodiment, since the Gothic character image is included in the scan image 11, the character image code set 12 associates the character code with the Gothic character image. Further, the character image code set 12 includes not only the character image shown in FIG. 6 but also all character images included in the scan data 11.

送信部213は、画像記憶部221に記憶されているスキャン画像11と、セット記憶部223に記憶されている文字画像コードセット12とを、通信I/F232を介して管理システム120に送信する。   The transmission unit 213 transmits the scan image 11 stored in the image storage unit 221 and the character image code set 12 stored in the set storage unit 223 to the management system 120 via the communication I / F 232.

次に、図7を用いて、文字画像コードセット12を作成するまでの手順について説明する。図7は、スキャン画像11を取得してから文字画像コードセット12を作成するまでの手順を示した図である。取込部211は、スキャン画像11をレイアウト解析し、スキャン画像11に含まれる文字列が示されている範囲を特定する。取込部211は、当該特定された範囲の文字列を抽出し、抽出された各文字の大きさが均一でない場合、各文字画像を正規化して均一に整える。   Next, a procedure until the character image code set 12 is created will be described with reference to FIG. FIG. 7 is a diagram showing a procedure from acquisition of the scan image 11 to creation of the character image code set 12. The capturing unit 211 performs layout analysis on the scan image 11 and specifies a range in which a character string included in the scan image 11 is indicated. The capturing unit 211 extracts the character string in the specified range, and when the extracted characters are not uniform in size, normalizes each character image and arranges it uniformly.

次に、セット作成部212は、スキャン画像11から取得した文字画像と、文字パターン辞書21が有する辞書画像とを照合する。セット作成部212は、一致する辞書画像が含まれていた場合、文字パターン辞書21から辞書画像に対応する文字コードを取得し、文字画像と関連付けて文字画像コードセット12に登録する。ただし、セット作成部212は、文字画像コードセット12に同一の文字画像が既に登録されていた場合、同じ文字画像の重複登録を避けるため、セット作成部212は、当該文字画像を文字画像コードセット12に登録しない。   Next, the set creation unit 212 collates the character image acquired from the scanned image 11 with the dictionary image included in the character pattern dictionary 21. When a matching dictionary image is included, the set creation unit 212 acquires a character code corresponding to the dictionary image from the character pattern dictionary 21 and registers it in the character image code set 12 in association with the character image. However, if the same character image has already been registered in the character image code set 12, the set creation unit 212 avoids the duplicate registration of the same character image. 12 is not registered.

例えば、取込部211は、スキャン画像11の先頭に記載されている文字画像「外」を取得する。セット作成部212は、取得された文字画像「外」を文字パターン辞書21の各辞書画像に照合する。セット作成部212は、取得された文字画像「外」が、ゴシック体の辞書画像「外」に適合するので、対応する文字コード「8A4F」を特定する。セット作成部212は、文字コード「8A4F」を文字画像コードセット12に登録すると共に、スキャン画像11から抽出した文字画像「外」を対応付けて登録する。   For example, the capturing unit 211 acquires the character image “outside” described at the top of the scanned image 11. The set creation unit 212 collates the acquired character image “outside” with each dictionary image of the character pattern dictionary 21. Since the acquired character image “outside” matches the gothic dictionary image “outside”, the set creation unit 212 identifies the corresponding character code “8A4F”. The set creation unit 212 registers the character code “8A4F” in the character image code set 12 and registers the character image “outside” extracted from the scanned image 11 in association with each other.

次に、図8を用いて電子化処理サーバ10が文字画像コードセット12を作成するまでの流れについて説明する。図8は、実施例1に係る文字画像コードセット12の作成手順を示すフローチャート図である。図8に示すように、取込部211は、画像記憶部221に記憶されているスキャン画像11を取込む(ステップS10)。セット作成部212は、スキャン画像11をレイアウト解析し(ステップS11)、スキャン画像11において文字列が記載されている範囲を特定する。セット作成部212は、スキャン画像11に含まれる文字列の先頭から順に文字画像k(t)を抽出する(ステップS12)。このとき、セット作成部212は、スキャン画像11の末尾まで抽出し終えたか判断し(ステップS13)、終了していた場合(ステップS13Yes)、処理を終了させる。セット作成部212は、スキャン画像11に抽出すべき文字画像が残っていた場合(ステップS13No)、この文字画像k(t)を、文字パターン辞書21に含まれる各辞書画像にそれぞれ照合し、文字画像k(t)に一致する辞書画像を探す(ステップS14)。   Next, a flow until the computerization server 10 creates the character image code set 12 will be described with reference to FIG. FIG. 8 is a flowchart illustrating a procedure for creating the character image code set 12 according to the first embodiment. As illustrated in FIG. 8, the capturing unit 211 captures the scanned image 11 stored in the image storage unit 221 (step S10). The set creation unit 212 performs layout analysis on the scanned image 11 (step S11), and specifies a range in which a character string is described in the scanned image 11. The set creation unit 212 extracts character images k (t) in order from the beginning of the character string included in the scanned image 11 (step S12). At this time, the set creation unit 212 determines whether extraction to the end of the scanned image 11 has been completed (step S13), and if it has been completed (step S13 Yes), the process is terminated. When the character image to be extracted remains in the scanned image 11 (No in step S13), the set creation unit 212 collates this character image k (t) with each dictionary image included in the character pattern dictionary 21, and sets the character image. A dictionary image matching the image k (t) is searched (step S14).

セット作成部212は、文字画像k(t)に対応する辞書画像がなかった場合(ステップS14No)、エラー処理をする(ステップS15)。例えば、セット作成部212は、スキャン画像11で文字コードを特定できなかった文字画像の部分を網掛けし、さらに、テキストボックスを表示して不明な文字画像に係るテキストを入力させてもよい。   If there is no dictionary image corresponding to the character image k (t) (step S14 No), the set creation unit 212 performs error processing (step S15). For example, the set creation unit 212 may shade the portion of the character image for which the character code could not be specified in the scan image 11 and further display a text box to input text related to the unknown character image.

一方、セット作成部212は、文字画像k(t)に対応する辞書画像がある場合(ステップS14Yes)、文字画像k(t)が文字画像コードセット12に登録されているかを確認する(ステップS16)。次に、セット作成部212は、文字画像k(t)が文字画像コードセット12に登録されていない場合(ステップS16No)、当該スキャン画像11の文字画像を、文字コードに対応付けて文字画像コードセット12に登録する(ステップS17)。なお、セット作成部212は、ステップS16での確認により、文字画像の重複登録を避けている。   On the other hand, when there is a dictionary image corresponding to the character image k (t) (Yes in step S14), the set creation unit 212 confirms whether the character image k (t) is registered in the character image code set 12 (step S16). ). Next, when the character image k (t) is not registered in the character image code set 12 (No in step S16), the set creation unit 212 associates the character image of the scanned image 11 with the character code and sets the character image code. Register in the set 12 (step S17). Note that the set creation unit 212 avoids overlapping registration of character images based on the confirmation in step S16.

一方、セット作成部212は、文字画像k(t)が登録されていた場合(ステップS16Yes)、ステップS12に戻り、tに1を加算し、スキャン画像11から次の文字画像k(t)(t←t+1)を抽出する。   On the other hand, if the character image k (t) has been registered (Yes in step S16), the set creating unit 212 returns to step S12, adds 1 to t, and then adds the next character image k (t) ( t ← t + 1) is extracted.

セット作成部212は、ステップS12における抽出処理を、ステップS13でスキャン画像11の末尾まで抽出し終えたと判断するまで繰り返す。   The set creation unit 212 repeats the extraction process in step S12 until it is determined in step S13 that extraction to the end of the scanned image 11 has been completed.

[検索装置における処理]
実施例1に係る検索装置13の機能構成の一例について説明する。図9は、実施例1に係る検索装置13の構成を示す機能ブロック図である。図9に示すように、検索装置13は、制御手段310と、記憶手段320とを有する。また、検索装置13は、通信I/F331と、入力手段332と、出力手段333とに接続される。なお、検索装置13は、スマートフォン等の携帯端末、パーソナルコンピュータ、サーバ等である。
[Processing in search device]
An example of a functional configuration of the search device 13 according to the first embodiment will be described. FIG. 9 is a functional block diagram illustrating the configuration of the search device 13 according to the first embodiment. As illustrated in FIG. 9, the search device 13 includes a control unit 310 and a storage unit 320. The search device 13 is connected to a communication I / F 331, an input unit 332, and an output unit 333. The search device 13 is a mobile terminal such as a smartphone, a personal computer, a server, or the like.

また、通信I/F331は、通信網に接続するための任意の通信インターフェースである。検索装置13は、通信I/F331からスキャン画像11および文字画像コードセット12を受信し、スキャン画像11を画像記憶手段321、文字画像コードセット12をセット記憶手段に記憶する。また、入力手段332は、検索装置13がスマートフォン等の携帯端末である場合、タッチパネル等であり、検索装置13がパーソナルコンピュータ等である場合、キーボードやマウス等である。検索対象装置13は、入力手段332から検索対象用語を受け付ける。一方、出力手段333は、検索結果をスマートフォンのモニタ等に出力する。   The communication I / F 331 is an arbitrary communication interface for connecting to a communication network. The search device 13 receives the scanned image 11 and the character image code set 12 from the communication I / F 331, and stores the scanned image 11 in the image storage unit 321 and the character image code set 12 in the set storage unit. The input unit 332 is a touch panel or the like when the search device 13 is a mobile terminal such as a smartphone, and is a keyboard or a mouse when the search device 13 is a personal computer or the like. The search target device 13 receives a search target term from the input unit 332. On the other hand, the output unit 333 outputs the search result to a smartphone monitor or the like.

記憶手段320は、画像記憶手段321と、セット記憶手段322とを有する。記憶手段220は、例えば、RAM(Random access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。   The storage unit 320 includes an image storage unit 321 and a set storage unit 322. The storage unit 220 corresponds to, for example, a semiconductor memory device such as a random access memory (RAM), a read only memory (ROM), or a flash memory, and a storage device such as a hard disk or an optical disk.

記憶手段320が有する画像記憶手段321は、電子化処理サーバ10から送信されたスキャン画像11を記憶し、セット記憶手段322は、文字画像コードセット12を記憶する。なお、スキャン画像11の具体例は図4、文字画像コードセット12の具体例は、図6に示されている。   The image storage unit 321 included in the storage unit 320 stores the scanned image 11 transmitted from the computerization processing server 10, and the set storage unit 322 stores the character image code set 12. A specific example of the scanned image 11 is shown in FIG. 4, and a specific example of the character image code set 12 is shown in FIG.

制御手段310は、取得手段311と、照合手段312とを備える。制御手段310の各機能は、例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。記憶手段210は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。   The control unit 310 includes an acquisition unit 311 and a collation unit 312. Each function of the control unit 310 can be realized, for example, by a CPU (Central Processing Unit) executing a predetermined program. The storage unit 210 corresponds to, for example, a semiconductor memory device such as a random access memory (RAM), a read only memory (ROM), or a flash memory, and a storage device such as a hard disk or an optical disk.

取得手段311は、入力手段332から受け付けた検索対象用語に対応する文字コードを、セット記憶手段332に記憶されている文字画像コードセット12で検索し、当該文字コードに対応する文字画像を取得する。   The acquisition unit 311 searches the character image code set 12 stored in the set storage unit 332 for a character code corresponding to the search target term received from the input unit 332, and acquires a character image corresponding to the character code. .

照合手段312は、取得した文字画像をスキャン画像11に照合する。照合手段312は、画像記憶手段321からスキャン画像11を読み込んでスキャン画像11中の文字列を取得する。照合手段312は、スキャン画像11の文字列の並びに沿って、取得された文字画像を走査させることにより、当該文字画像とスキャン画像11とを照合する。そして、照合手段312は、スキャン画像11に適合したときは、照合したスキャン画像11の部分のページ数と行数とを、当該文字画像を含むセンテンスとともに出力手段333に出力する。   The collation unit 312 collates the acquired character image with the scan image 11. The matching unit 312 reads the scan image 11 from the image storage unit 321 and acquires a character string in the scan image 11. The collation unit 312 collates the character image with the scan image 11 by scanning the acquired character image along the character string of the scan image 11. When the matching unit 312 matches the scanned image 11, the matching unit 312 outputs the number of pages and the number of lines of the verified scanned image 11 together with the sentence including the character image to the output unit 333.

図10を用いて、取得手段311が検索対象用語の入力待ち状態のときに表示される画面について説明する。図10は、検索対象用語の入力待ちの画面を示した図である。検索装置13の表示部14には、検索対象用語入力欄15と、検索ボタン16と、スクロールバー17と、表示領域18とが表示される。検索対象用語入力欄15には、検索しようとする検索対象用語をタッチパネル等により入力することができる。検索ボタン16は、検索対象用語の検索を開始するためのボタンである。なお、検索装置13は、表示領域18が操作されることにより、表示部14の外部にあるスキャン画像11を表示する。また、検索装置13は、スキャン画像11における現在表示領域18に表示している位置をスクロールバー11に示す。   The screen displayed when the acquisition unit 311 is waiting for input of a search target term will be described with reference to FIG. FIG. 10 is a diagram illustrating a screen waiting for input of a search target term. On the display unit 14 of the search device 13, a search target term input field 15, a search button 16, a scroll bar 17, and a display area 18 are displayed. In the search target term input field 15, a search target term to be searched can be input by a touch panel or the like. The search button 16 is a button for starting a search for a search target term. The search device 13 displays the scanned image 11 outside the display unit 14 by operating the display area 18. Further, the search device 13 indicates the position displayed in the current display area 18 in the scan image 11 on the scroll bar 11.

次に、図11を用いて、出力手段333による検索結果の表示について説明する。図12は、検索対象用語の検索結果を表示した状態を示した図である。検索装置13の表示部14には、スクロールバー17と、表示領域18と、検索対象用語表示欄19とが表示される。検索装置13は、検索対象用語表示欄19に検索対象用語を表示し、表示領域18に検索結果を表示する。   Next, display of search results by the output unit 333 will be described with reference to FIG. FIG. 12 is a diagram showing a state in which search results for search target terms are displayed. A scroll bar 17, a display area 18, and a search target term display field 19 are displayed on the display unit 14 of the search device 13. The search device 13 displays the search target term in the search target term display field 19 and displays the search result in the display area 18.

検索装置13は、表示領域18に検索結果として検索対象用語を含むページ数および行数と、検索対象用語を含むセンテンスをセットにしたものを列挙して表示する。また、検索装置13は、表示領域18を操作して画面をスクロールすることにより、表示領域18の外にある検索結果を表示する。なお、検索装置13は、表示領域18に表示されている各検索結果を、スキャン画像11の対応部分にリンクさせ、各検索結果を押下することにより、対応部分を表示するようにしてもよい。   The search device 13 lists and displays the number of pages and lines including the search target term as a search result and a sentence including the search target term as a set in the display area 18. In addition, the search device 13 displays the search results outside the display area 18 by operating the display area 18 and scrolling the screen. The search device 13 may link each search result displayed in the display area 18 to a corresponding portion of the scanned image 11 and display the corresponding portion by pressing each search result.

これにより、ユーザは、スキャン画像11における検索対象用語を含むページ数と行数を確認でき、検索対象用語を含むセンテンスとを、スキャン画像11と同じ表示で閲覧できる。また、検索装置13が、各検索結果を、スキャン画像11の対応部分にリンクさせて表示するようにすれば、ユーザは容易に検索結果の対応部分にたどり着け、使い勝手が向上する。   Thereby, the user can confirm the number of pages and the number of lines including the search target term in the scanned image 11 and can browse the sentence including the search target term in the same display as the scanned image 11. If the search device 13 displays each search result linked to the corresponding portion of the scanned image 11, the user can easily reach the corresponding portion of the search result, and the usability is improved.

例えば、表示領域18は、検索対象用語が「外」である場合、「外」が含まれる位置である「1頁1行」と、「外」を含むセンテンスとをセットにして表示する。また、「外」が含まれる「15頁2行」および「22頁3行」についても、「外」を含むセンテンスとセットで表示される。なお、それ以降の頁については表示部14で画面をスクロールすることにより閲覧できる。   For example, when the search target term is “outside”, the display area 18 displays “one page and one line” where “outside” is included and a sentence including “outside” as a set. Also, “page 15 line 2” and “page 22 line 3” including “outside” are displayed as a set together with the sentence including “outside”. Subsequent pages can be browsed by scrolling the screen on the display unit 14.

次に、図12を用いて、実施例1に係る検索装置13が検索対象用語の検索結果を表示するまでの手順について説明する。図12は、検索装置13が検索対象用語の検索結果を表示するまでの流れを示した図である。検索装置13は、検索対象ボタン16が押下されることにより、検索対象用語を受け付ける。例えば、取得手段311は、検索対象用語入力欄15に「外」という用語が入力され、検索ボタン16が押下されることにより、スキャン画像11に含まれる「外」という用語を受け付ける。   Next, a procedure until the search device 13 according to the first embodiment displays the search result of the search target term will be described with reference to FIG. FIG. 12 is a diagram showing a flow until the search device 13 displays the search result of the search target term. The search device 13 receives a search target term when the search target button 16 is pressed. For example, the acquisition unit 311 receives the term “outside” included in the scanned image 11 by inputting the term “outside” in the search target term input field 15 and pressing the search button 16.

取得手段311は、文字画像コードセット12で、検索対象用語に係る文字コードを検索し、対応する文字画像を取得する。例えば、取得手段311は、検索対象用語が「外」であった場合、「外」の文字コード「8A4F」を文字画像コードセット12で検索する。そして、取得手段311は、文字コード「8A4F」に対応する文字画像「外」を文字画像コードセット12から取得する。   The acquisition unit 311 searches the character image code set 12 for the character code related to the search target term, and acquires the corresponding character image. For example, when the search target term is “outside”, the acquiring unit 311 searches the character image code set 12 for the character code “8A4F” of “outside”. Then, the acquiring unit 311 acquires the character image “outside” corresponding to the character code “8A4F” from the character image code set 12.

例えば、取得手段311は、検索対象用語入力欄15に検索対象用語「外」が入力されている状態で、検索ボタン16が押下されると、文字画像コードセット12で検索対象用語「外」の文字コードに相当する「8A4F」を検索する。そして、取得手段311は、文字コード「8A4F」に対応する文字画像「外」を取得する。   For example, when the search button 16 is pressed in a state where the search target term “outside” is input in the search target term input field 15, the acquiring unit 311 stores the search target term “outside” in the character image code set 12. Search for “8A4F” corresponding to the character code. Then, the acquisition unit 311 acquires the character image “outside” corresponding to the character code “8A4F”.

照合手段312は、文字画像「外」をスキャン画像11の文字列に沿って走査させ、スキャン画像11と照合する。そして、検索装置13は、表示領域18bに検索結果を表示する。例えば、検索装置13は、表示領域18bに1頁1行目に検索対象用語「外」が含まれる旨を、「外」を含むセンテンスと共に表示する。なお、検索装置13は、他のページに含まれている「外」についても列挙して表示する。   The collation unit 312 scans the character image “outside” along the character string of the scan image 11 and collates it with the scan image 11. Then, the search device 13 displays the search result in the display area 18b. For example, the search device 13 displays that the search target term “outside” is included in the first line and the first line in the display area 18 b together with a sentence including “outside”. The search device 13 also lists and displays “outside” included in other pages.

なお、照合手段312は、スキャン画像11の見出し部分、脚注部分の文字列等、本文に記載されている文字と大きさが異なる部分がある場合、適宜、走査させる文字画像を拡大、縮小させて文字列の大きさに調整してから照合してもよい。これにより、照合手段312は、照合の成功率を向上できる。   Note that the collating unit 312 appropriately enlarges or reduces the character image to be scanned when there is a part that is different in size from the text described in the text, such as a character string of a headline part or a footnote part of the scanned image 11. You may collate after adjusting to the size of a character string. Thereby, the collation means 312 can improve the collation success rate.

次に、図13を用いて実施例1に係る検索装置13が検索対象用語の検索結果を表示するまでのフローについて説明する。図13は、実施例1に係る検索装置13が検索対象用語の検索結果を表示するまでの手順を示すフローチャート図である。図13に示すように、取得手段311は、表示部14の検索対象用語入力欄15に検索対象文字が入力されて検索ボタン16が押下されることにより、検索文字を受け付ける(ステップS20)。取得手段311は、検索対象文字に相当する文字コードを文字画像コードセット12から検索し、当該文字コードに対応する文字画像を取得する(ステップS21)。   Next, a flow until the search device 13 according to the first embodiment displays the search result of the search target term will be described with reference to FIG. FIG. 13 is a flowchart illustrating a procedure until the search device 13 according to the first embodiment displays the search result of the search target term. As illustrated in FIG. 13, the acquisition unit 311 receives a search character when the search target character is input to the search target term input field 15 of the display unit 14 and the search button 16 is pressed (step S20). The acquisition unit 311 searches the character image code set 12 for a character code corresponding to the search target character, and acquires a character image corresponding to the character code (step S21).

次に、照合手段312は、取得した文字画像をスキャン画像11に照合させる(ステップS22)。照合手段312は、スキャン画像11の文字列の並びに沿って文字画像を走査させることにより、スキャン画像11に照合させる。照合手段312は、スキャン画像11の終端まで文字画像を走査したと判断した場合(ステップS23Yes)、走査を終了し、処理を終了する。   Next, the collation means 312 collates the acquired character image with the scanned image 11 (step S22). The collation unit 312 collates with the scan image 11 by scanning the character image along the sequence of the character string of the scan image 11. When the collation unit 312 determines that the character image has been scanned up to the end of the scan image 11 (Yes in step S23), the collation unit 312 ends the scan and ends the process.

一方、照合手段312は、走査すべき文字列が残っている場合(ステップS23No)、文字列に沿って文字画像を走査させ、一文字ずつ文字画像に適合するか判定する(ステップS24)。照合手段312は、走査させている文字画像がスキャン画像11の文字画像に適合した場合(ステップS24Yes)、検索結果を出力する(ステップS25)。照合手段312は、スキャン画像11の文字画像に適合しない場合(ステップS24No)、さらに文字画像を走査させ、スキャン画像11の次の文字画像に照合させる。照合手段312は、ステップS23の条件を満たすまで文字画像を走査させる。   On the other hand, when the character string to be scanned remains (No in step S23), the collating unit 312 scans the character image along the character string and determines whether the character image matches the character image (step S24). When the character image being scanned matches the character image of the scanned image 11 (Yes in step S24), the collating unit 312 outputs the search result (step S25). When the matching unit 312 does not match the character image of the scanned image 11 (No in step S24), the matching unit 312 further scans the character image and matches the character image next to the scanned image 11. The collating unit 312 scans the character image until the condition of step S23 is satisfied.

[効果]
上述してきたように、実施形態に係る検索装置13は、記憶手段320と、取得手段311と、照合手段312と、出力手段333とを備える。記憶手段320は、文書からスキャンされたスキャン画像11と、スキャン画像11に含まれる文字画像および該文字画像に対応する文字コードとを対応付けた文字画像コードセット12とを記憶する。取得手段311は、検索対象として指定された検索対象文字に係る文字コードに対応する文字画像を、文字画像コードセットから取得する。照合手段312は、文字画像コードセット12から取得された文字画像を、スキャン画像11と照合する。出力手段333は、照合手段312による照合結果を出力する。
[effect]
As described above, the search device 13 according to the embodiment includes the storage unit 320, the acquisition unit 311, the collation unit 312, and the output unit 333. The storage unit 320 stores a scanned image 11 scanned from a document, and a character image code set 12 in which a character image included in the scanned image 11 and a character code corresponding to the character image are associated with each other. The acquisition unit 311 acquires a character image corresponding to the character code related to the search target character designated as the search target from the character image code set. The collation unit 312 collates the character image acquired from the character image code set 12 with the scan image 11. The output unit 333 outputs the collation result by the collation unit 312.

これにより、実施形態に係る検索装置13は、書籍のスキャン画像11を基に用語検索することができる。また、検索装置13は、スキャン画像11が横書きの場合に限られず、縦書きであっても、用語検索が可能である。   Thereby, the search device 13 according to the embodiment can perform a term search based on the scanned image 11 of the book. In addition, the search device 13 is not limited to the case where the scanned image 11 is written horizontally, and can search for terms even if it is written vertically.

また、実施形態に係る検索装置13において文字画像コードセット12は、全ての文字に対応する文字コードを記憶する文字パターン辞書21から、スキャン画像11に含まれる各文字画像に対応する文字コードを選択し、該選択された文字コードおよび該文字コードに対応する文字画像を、登録することにより作成される。   In the search device 13 according to the embodiment, the character image code set 12 selects a character code corresponding to each character image included in the scanned image 11 from the character pattern dictionary 21 that stores character codes corresponding to all characters. The selected character code and the character image corresponding to the character code are created by registration.

これにより、スキャン画像11に含まれる文字画像のみで文字画像コードセット12を作成するので、文字パターン辞書21を使用する場合に比べて、検索装置13の記憶領域を節約でき、検索処理の処理速度を向上できる。また、文字画像コードセット12に登録される文字画像は、スキャン画像11に含まれる文字画像を基に作成するので、文字パターン辞書21を使用する場合に比べて、照合の成功率を向上できる。   Thereby, since the character image code set 12 is created only from the character image included in the scanned image 11, the storage area of the search device 13 can be saved and the processing speed of the search process can be reduced compared to the case where the character pattern dictionary 21 is used. Can be improved. Further, since the character image registered in the character image code set 12 is created based on the character image included in the scan image 11, the success rate of collation can be improved as compared with the case where the character pattern dictionary 21 is used.

[検索対象用語が複数文字である場合の検索]
次に、検索対象用語が複数文字である場合における検索結果を表示するまでの手順について説明する。取得手段311は、以下の2つの方法のいずれかを使って検索対象用語に係る文字画像をスキャン画像11と照合する。
[Search when the search term is multiple characters]
Next, a procedure for displaying a search result when the search target term is a plurality of characters will be described. The acquisition unit 311 collates the character image related to the search target term with the scan image 11 using one of the following two methods.

第一の方法として、取得手段311は、検索対象文字が複数文字である場合、各検索対象文字に相当する文字コードで文字画像コードセット12を検索し、文字コードに対応する文字画像をそれぞれ取得する。照合手段312は、取得された各文字画像を連結し、文字画像が一文字のときと同様に、連結させた文字画像をスキャン画像11の文字列に沿って走査させる。   As a first method, when there are a plurality of search target characters, the acquisition unit 311 searches the character image code set 12 with a character code corresponding to each search target character, and acquires each character image corresponding to the character code. To do. The collation unit 312 connects the acquired character images, and scans the connected character images along the character string of the scan image 11 in the same manner as when the character image is one character.

照合手段312は、スキャン画像11の文字画像のピッチを取得しておき、抽出した各文字画像を連結するとき、当該ピッチに従い、連結する各文字画像の幅を調整する。これにより、照合手段312は、照合の成功率を向上できる。   The collation unit 312 acquires the pitch of the character image of the scan image 11 and adjusts the width of each character image to be connected according to the pitch when the extracted character images are connected. Thereby, the collation means 312 can improve the collation success rate.

第一の方法の具体例について、図14を用いて説明する。図14は、検索対象文字入力欄15に複数の検索対象文字が入力された場合において、第一の方法で検索対象用語をスキャン画像11に照合する際の流れを示した図である。例えば、取得手段311は、図14の検索対象文字入力欄15に「外国」と入力され、検索ボタン16が押下されると、検索対象用語「外国」を受け付ける。取得手段311は、「外」に対応する文字コード「8A4F」と、「国」に対応する文字コード「8D91」とを、文字画像コードセット12で検索し、文字コードに対応する文字画像「外」および「国」を取得する。   A specific example of the first method will be described with reference to FIG. FIG. 14 is a diagram illustrating a flow when the search target term is collated with the scan image 11 by the first method when a plurality of search target characters are input in the search target character input field 15. For example, when “foreign country” is entered in the search target character input field 15 of FIG. 14 and the search button 16 is pressed, the acquisition unit 311 accepts the search target term “foreign country”. The acquisition unit 311 searches the character image code set 12 for the character code “8A4F” corresponding to “outside” and the character code “8D91” corresponding to “country”, and the character image “outside” corresponding to the character code. ”And“ Country ”.

次に、照合手段312は、「外」「国」の文字画像を、スキャン画像11が縦書きであるのに合わせて縦方向に連結する。また、照合手段312は、「外」「国」の文字画像を、スキャン画像11の文字列の配置ピッチに合わせて連結の幅を調整する。続いて、照合手段312は、縦方向に連結した文字画像「外国」を、スキャン画像11の1行目から、文字画像が一文字のときと同様に、連結させた文字画像をスキャン画像11の文字列に沿って走査させる。なお、照合手段312は、連結させた文字画像がスキャン画像11に適合した場合、検索結果に出力する。   Next, the collation unit 312 connects the character images “outside” and “country” in the vertical direction in accordance with the vertical writing of the scanned image 11. Further, the collation unit 312 adjusts the connection width of the “outside” and “country” character images in accordance with the arrangement pitch of the character strings in the scanned image 11. Subsequently, the collation unit 312 converts the character image “foreign” connected in the vertical direction from the first line of the scan image 11 to the character image of the scan image 11 in the same manner as when the character image is one character. Scan along a row. The collation unit 312 outputs the search result when the connected character image matches the scan image 11.

このように、実施形態に係る検索装置13において取得手段311は、検索対象文字が二以上の文字を含む場合、各検索対象文字に係る文字コードに対応する文字画像を、それぞれ文字画像コードセット12から取得する。また、照合手段312は、各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結することにより作成された文字画像を、スキャン画像11と照合する。   As described above, in the search device 13 according to the embodiment, when the search target character includes two or more characters, the acquisition unit 311 converts the character image corresponding to the character code related to each search target character to the character image code set 12. Get from. Further, the collation unit 312 collates the scanned image 11 with a character image created by concatenating character images corresponding to the character codes related to the search target characters in the order of the character strings.

これにより、検索装置13は、検索対象文字が複数であっても検索対象文字が一文字である場合と同様に照合することができ、検索効率を向上できる。   Thereby, even if there are a plurality of search target characters, the search device 13 can collate as in the case where the search target character is one character, and the search efficiency can be improved.

第二の方法として、取得手段311は、各検索対象文字に相当する文字コードで文字画像コードセット12を検索し、文字コードに対応する文字画像をそれぞれ取得する。照合手段312は、複数の検索対象文字のうち、先頭の検索対象文字のみをスキャン画像11の文字列に沿って走査させる。照合手段312は、先頭の検索対象文字がスキャン画像11に適合した場合、次の検索対象文字を、スキャン画像11の次の文字画像と照合させる。そして、照合手段312は、複数の検索対象文字を順番に照合させ、全ての検索対象文字に適合した場合、検索結果に出力させる。   As a second method, the acquiring unit 311 searches the character image code set 12 with a character code corresponding to each search target character, and acquires a character image corresponding to the character code. The matching unit 312 scans only the first search target character among the plurality of search target characters along the character string of the scan image 11. The collation unit 312 collates the next search target character with the next character image of the scan image 11 when the first search target character matches the scan image 11. And the collation means 312 collates a some search object character in order, and when it matches with all the search object characters, it is made to output to a search result.

第二の方法の具体例について、図15を用いて説明する。図15には、検索対象文字入力欄15に複数の検索対象文字が入力された場合において、第二の方法で検索対象用語をスキャン画像11に照合する際の流れを示した図である。例えば、取得手段311は、「外」に対応する文字コード「8A4F」と、「国」に対応する文字コード「8D91」とを、文字画像コードセット12で検索し、文字コードに対応する文字画像「外」および「国」を取得する。   A specific example of the second method will be described with reference to FIG. FIG. 15 is a diagram illustrating a flow when the search target term is collated with the scan image 11 by the second method when a plurality of search target characters are input in the search target character input field 15. For example, the acquisition unit 311 searches the character image code set 12 for the character code “8A4F” corresponding to “outside” and the character code “8D91” corresponding to “country”, and the character image corresponding to the character code. Get “outside” and “country”.

次に、照合手段312は、先頭の検索対象用語に対応する文字画像「外」を、スキャン画像11の1行目から、スキャン画像11の文字列に沿って走査させる。照合手段312は、文字画像「外」がスキャン画像11に適合する場合、次の検索対象用語に対応する文字画像「国」を、スキャン画像11の次の文字画像と照合する。照合手段312は、文字画像「国」がスキャン画像11に適合する場合、検索結果に出力する。   Next, the matching unit 312 scans the character image “outside” corresponding to the first search target term along the character string of the scan image 11 from the first line of the scan image 11. When the character image “outside” matches the scan image 11, the collation unit 312 collates the character image “country” corresponding to the next search target term with the character image next to the scan image 11. When the character image “country” matches the scan image 11, the collation unit 312 outputs the search result.

一方、照合手段312は、文字画像「国」がスキャン画像11に適合しない場合、文字画像「外」を、スキャン画像11のその文字画像から走査させる。照合手段312は、文字画像「外」を走査させ、スキャン画像11に適合した場合、同様に文字画像「国」をスキャン画像11の次の文字画像と照合させる。照合手段312は、上記操作をスキャン画像の末尾まで繰り返す。   On the other hand, the collation unit 312 scans the character image “outside” from the character image of the scan image 11 when the character image “country” does not match the scan image 11. When the matching unit 312 scans the character image “outside” and matches the scanned image 11, the matching unit 312 similarly matches the character image “country” with the next character image of the scanned image 11. The collation unit 312 repeats the above operation until the end of the scanned image.

このように、実施形態に係る検索装置13において取得手段311は、検索対象文字が二以上の文字を含む場合、各検索対象文字に係る文字コードに対応する文字画像を、それぞれ前記文字画像コードセット12から取得する。また、照合手段312は、検索対象文字の先頭に係る文字画像と、スキャン画像11とを照合し、一致する場合、検索対象文字の2番目以降に係る文字画像を、検索対象文字の順にスキャン画像11と照合する。   As described above, in the search device 13 according to the embodiment, when the search target character includes two or more characters, the acquisition unit 311 converts the character image corresponding to the character code related to each search target character to the character image code set. 12 from. In addition, the collation unit 312 collates the character image related to the head of the search target character with the scan image 11 and if they match, the character images related to the second and subsequent search target characters are scanned in the order of the search target character. 11 is matched.

これにより、検索装置13は、スキャン画像11に検索対象用語に相当する文字画像が、ある行とその次の行とにまたがって記載されている場合でも、単純な手順で照合できる。   Thereby, even when the character image corresponding to the search target term is described across the certain line and the next line in the scanned image 11, the search device 13 can collate with a simple procedure.

[スキャン画像に複数の書体の文字画像が含まれる場合]
次に、スキャン画像11に複数の書体の文字画像が含まれる場合について説明する。図16は、スキャン画像11に複数の書体の文字画像が含まれる場合における文字画像コードセット12を示した図である。文字画像コードセット12には、スキャン画像11に複数の書体の文字画像を含まれていた場合、同一文字を表す各書体の文字画像は、一の文字コードに対応付けられる。例えば、図16に示したように、文字画像コードセット12は、ゴシック体の文字画像「外」および明朝体の文字画像「外」を、文字コード「8A4F」に対応付ける。また、文字画像コードセット12は、ゴシック体の文字画像「国」および行書体の文字画像「国」を、文字コード「8D91」に対応付ける。
[When the scanned image contains multiple typeface text images]
Next, a case where a scanned image 11 includes a plurality of typeface character images will be described. FIG. 16 is a diagram showing a character image code set 12 when a scanned image 11 includes a plurality of typeface character images. In the character image code set 12, when the scanned image 11 includes character images of a plurality of typefaces, the character images of each typeface representing the same character are associated with one character code. For example, as shown in FIG. 16, the character image code set 12 associates the Gothic character image “outside” and the Mincho character image “outside” with the character code “8A4F”. The character image code set 12 associates the Gothic character image “country” and the line font character image “country” with the character code “8D91”.

これにより、スキャン画像11に複数の書体の文字画像を含む場合においても、文字画像コードセット12が各書体を一の文字コードに対応付けることにより、スキャン画像11を検索する際における照合の成功率を向上できる。   Thereby, even when the scanned image 11 includes character images of a plurality of typefaces, the character image code set 12 associates each typeface with one character code, so that the matching success rate when searching for the scanned image 11 is increased. It can be improved.

なお、図5のように文字パターン辞書21は、複数の書体の辞書画像と文字コードとを対応付けている。このため、電子化処理サーバ10のセット作成部212は、スキャン画像11に文字画像が書体で記載されていても、文字画像に対応する文字コードを文字パターン辞書21により特定できる。   As shown in FIG. 5, the character pattern dictionary 21 associates a plurality of typeface dictionary images with character codes. Therefore, the set creation unit 212 of the computerization processing server 10 can specify the character code corresponding to the character image by using the character pattern dictionary 21 even if the character image is described in the scanned image 11 in a typeface.

このように、実施形態に係る検索装置13において文字画像コードセット12は、同一文字で書体の異なる二以上の文字画像を、一の文字コードに対応付けている。照合手段312は、書体の異なる二以上の文字画像のそれぞれを、スキャン画像11と照合する。   As described above, in the search device 13 according to the embodiment, the character image code set 12 associates two or more character images having the same character and different typefaces with one character code. The collating unit 312 collates each of two or more character images having different fonts with the scanned image 11.

これにより、実施形態に係る検索装置13は、スキャン画像11に複数の書体の文字画像が含まれる場合においても、文字画像コードセット12が各書体の文字画像を用いてスキャン画像を照合することにより、照合の成功率を向上できる。   Thereby, the search device 13 according to the embodiment allows the character image code set 12 to collate the scan image using the character image of each typeface even when the scan image 11 includes a plurality of typeface character images. , The success rate of matching can be improved.

[検索結果の別の表示方法]
次に、検索結果の別の表示方法について説明する。図17は、スキャン画像11において検索対象用語が示されている部分をハイライト表示したときの図である。図17のように、表示部14は、検索対象用語である「外」に係る部分だけをハイライトして表示する。表示部14は、選択ボタン20が押下されることにより、別の「外」を選択状態にする。例えば、表示部14は、右から3つめの「外」が選択されている状態で、さらに選択ボタン20の左側をクリックすると、表示部14の左側外部にある「外」までスクロールして「外」をハイライトして表示する。
[Another way to display search results]
Next, another method for displaying search results will be described. FIG. 17 is a diagram when a portion where the search target term is shown in the scanned image 11 is highlighted. As shown in FIG. 17, the display unit 14 highlights and displays only the portion related to “outside” which is the search target term. When the selection button 20 is pressed, the display unit 14 selects another “outside”. For example, when the third “outside” from the right is selected and the left side of the selection button 20 is further clicked, the display unit 14 scrolls to “outside” outside the left side of the display unit 14, and "Is highlighted.

これにより、スキャン画像11のページ数が少ない場合等において、ユーザは容易に検索対象用語を含む部分を確認でき、ユーザの使い勝手が向上する。   As a result, when the number of pages of the scanned image 11 is small, the user can easily check the portion including the search target term, and the usability of the user is improved.

なお、検索装置13は、実施例1に係る図面に示されたスマートフォン等の携帯端末に限らず、図2に示されたサーバであってもよい。検索装置13がサーバである場合、検索装置13は、検索結果をスマートフォン等に送信し、画面に表示させてもよい。また、検索装置13は、ユーザ記憶領域に検索結果を記憶させ、ユーザが検索結果をダウンロードした際、スマートフォンに表示させてもよい。   In addition, the search device 13 is not limited to the mobile terminal such as the smartphone illustrated in the drawing according to the first embodiment, but may be the server illustrated in FIG. When the search device 13 is a server, the search device 13 may transmit the search result to a smartphone or the like and display it on the screen. Further, the search device 13 may store the search result in the user storage area and display the search result on the smartphone when the user downloads the search result.

10 電子化処理サーバ
11 スキャン画像
12 文字画像コードセット
13 検索装置
14 表示部
310 制御手段
311 取得手段
312 照合手段
320 記憶手段
321 画像記憶手段
322 セット記憶手段
331 通信I/F
332 入力手段
333 出力手段
DESCRIPTION OF SYMBOLS 10 Electronic processing server 11 Scan image 12 Character image code set 13 Searching device 14 Display part 310 Control means 311 Acquisition means 312 Verification means 320 Storage means 321 Image storage means 322 Set storage means 331 Communication I / F
332 input means 333 output means

Claims (6)

文書からスキャンされたスキャン画像と、該スキャン画像に含まれる文字画像および該文字画像に対応する文字コードとを対応付けた文字画像コードセットとを記憶する記憶手段と、
検索対象として指定された検索対象文字に係る文字コードに対応する文字画像を、前記文字画像コードセットから取得する取得手段と、
前記文字画像コードセットから取得された文字画像を、前記スキャン画像と照合する照合手段と、
前記照合手段による照合結果を出力する出力手段と、
を備え
前記取得手段は、前記検索対象文字が二以上の文字を含む場合、各検索対象文字に係る文字コードに対応する文字画像を、それぞれ前記文字画像コードセットから取得し、
前記照合手段は、前記各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結することにより作成された文字画像を、前記スキャン画像と照合し、
前記照合手段は、前記各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結するときに、前記スキャン画像の文字間の幅に合わせて、連結する各文字の幅を調整する
ことを特徴とする検索装置。
Storage means for storing a scanned image scanned from a document, and a character image code set in which a character image included in the scanned image and a character code corresponding to the character image are associated with each other;
An acquisition means for acquiring, from the character image code set, a character image corresponding to a character code related to a search target character designated as a search target;
Collating means for collating the character image acquired from the character image code set with the scanned image;
And output means for outputting a verification result by the verification means,
Equipped with a,
When the search target character includes two or more characters, the acquisition unit acquires a character image corresponding to the character code related to each search target character from the character image code set, respectively.
The collation means collates a character image created by concatenating character images corresponding to character codes related to the search target characters in the order of the character strings, with the scan image,
The collation unit adjusts the width of each character to be coupled in accordance with the width between characters of the scan image when character images corresponding to the character codes related to the search target characters are concatenated in the order of the character strings. The search device characterized by performing.
前記文字画像コードセットは、同一文字で書体の異なる二以上の文字画像を、一の文字コードに対応付けており、
前記照合手段は、前記書体の異なる二以上の文字画像のそれぞれを、前記スキャン画像と照合することを特徴とする請求項1に記載の検索装置。
The character image code set associates two or more character images having the same character and different typefaces with one character code,
The search device according to claim 1, wherein the collating unit collates each of two or more character images having different fonts with the scanned image.
前記取得手段は、前記検索対象文字が二以上の文字を含む場合、各検索対象文字に係る文字コードに対応する文字画像を、それぞれ前記文字画像コードセットから取得し、
前記照合手段は、前記検索対象文字の先頭に係る文字画像と、前記スキャン画像とを照合し、一致する場合、前記検索対象文字の2番目以降に係る文字画像を、前記検索対象文字の順に前記スキャン画像と照合することを特徴とする請求項1または2に記載の検索装置。
When the search target character includes two or more characters, the acquisition unit acquires a character image corresponding to the character code related to each search target character from the character image code set, respectively.
The collating unit collates the character image related to the beginning of the search target character with the scanned image, and if they match, the character image related to the second or subsequent character of the search target character in the order of the search target character. The search device according to claim 1, wherein the search device is collated with a scanned image.
前記文字画像コードセットは、全ての文字に対応する文字コードを記憶する文字パターン辞書から、前記スキャン画像に含まれる各文字画像に対応する文字コードを選択し、該選択された文字コードおよび該文字コードに対応する文字画像を、登録することにより作成されたことを特徴とする請求項1〜のいずれか1項に記載の検索装置。 The character image code set from the character pattern dictionary for storing character codes corresponding to all characters, and select a character code corresponding to each character image included in the scanned image, the selected character code and the character a character image corresponding to the code, the search device according to any one of claims 1 to 3, characterized in that created by registering. コンピュータに、
文書からスキャンされたスキャン画像と、該スキャン画像に含まれる文字画像および該文字画像に対応する文字コードとを対応付けた文字画像コードセットとを保持する保持手順と、
検索対象として指定された検索対象文字に係る文字コードに対応する文字画像を、前記文字画像コードセットから取得する取得手順と、
前記文字画像コードセットから取得された文字画像を、前記スキャン画像と照合する照合手順と、
前記照合手順による照合結果を出力する出力手順と、
を実行させ
前記取得手順は、前記検索対象文字が二以上の文字を含む場合、各検索対象文字に係る文字コードに対応する文字画像を、それぞれ前記文字画像コードセットから取得し、
前記照合手順は、前記各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結することにより作成された文字画像を、前記スキャン画像と照合し、
前記照合手順は、前記各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結するときに、前記スキャン画像の文字間の幅に合わせて、連結する各文字の幅を調整する
ことを特徴とする検索プログラム。
On the computer,
A holding procedure for holding a scanned image scanned from a document and a character image code set in which a character image included in the scanned image and a character code corresponding to the character image are associated;
An acquisition procedure for acquiring a character image corresponding to a character code related to a search target character designated as a search target from the character image code set;
A collation procedure for collating a character image acquired from the character image code set with the scanned image;
An output procedure for outputting a verification result by the verification procedure,
Was executed,
In the acquisition procedure, when the search target character includes two or more characters, a character image corresponding to a character code related to each search target character is acquired from the character image code set, respectively.
The collation procedure collates a character image created by concatenating a character image corresponding to a character code related to each search target character in order of the character string with the scan image,
In the collation procedure, when character images corresponding to character codes related to the search target characters are connected in the order of the character strings, the width of each character to be connected is adjusted in accordance with the width between characters of the scan image. A search program characterized by
コンピュータが、
文書からスキャンされたスキャン画像と、該スキャン画像に含まれる文字画像および該文字画像に対応する文字コードとを対応付けた文字画像コードセットとを保持する保持工程と、
検索対象として指定された検索対象文字に係る文字コードに対応する文字画像を、前記文字画像コードセットから取得する取得工程と、
前記文字画像コードセットから取得された文字画像を、前記スキャン画像と照合する照合工程と、
前記照合工程による照合結果を出力する出力工程と、
を実行し、
前記取得工程は、前記検索対象文字が二以上の文字を含む場合、各検索対象文字に係る文字コードに対応する文字画像を、それぞれ前記文字画像コードセットから取得し、
前記照合工程は、前記各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結することにより作成された文字画像を、前記スキャン画像と照合し、
前記照合工程は、前記各検索対象文字に係る文字コードに対応する文字画像を前記文字列の順に連結するときに、前記スキャン画像の文字間の幅に合わせて、連結する各文字の幅を調整する
ことを特徴とする検索方法。
Computer
Holding a scan image scanned from a document, and a character image code set in which a character image included in the scan image and a character code corresponding to the character image are associated;
An acquisition step of acquiring a character image corresponding to a character code related to a search target character designated as a search target from the character image code set;
A collation step of collating the character image acquired from the character image code set with the scan image;
An output step of outputting the verification result by the verification step,
The execution,
In the acquisition step, when the search target character includes two or more characters, a character image corresponding to a character code related to each search target character is acquired from the character image code set, respectively.
The collation step collates a character image created by concatenating a character image corresponding to a character code related to each search target character in the order of the character string with the scan image,
The collating step adjusts the width of each character to be connected in accordance with the width between characters of the scan image when character images corresponding to the character codes related to the search target characters are connected in the order of the character strings. A search method characterized by:
JP2013060961A 2013-03-22 2013-03-22 SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD Active JP5787925B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013060961A JP5787925B2 (en) 2013-03-22 2013-03-22 SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013060961A JP5787925B2 (en) 2013-03-22 2013-03-22 SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD

Publications (2)

Publication Number Publication Date
JP2014186545A JP2014186545A (en) 2014-10-02
JP5787925B2 true JP5787925B2 (en) 2015-09-30

Family

ID=51834054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013060961A Active JP5787925B2 (en) 2013-03-22 2013-03-22 SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD

Country Status (1)

Country Link
JP (1) JP5787925B2 (en)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01255987A (en) * 1988-04-06 1989-10-12 Hitachi Ltd Specific character string collating method
JP2887823B2 (en) * 1991-05-23 1999-05-10 富士ゼロックス株式会社 Document recognition device
JP3986098B2 (en) * 1994-08-16 2007-10-03 富士通株式会社 Character string search method and character string search device
JP3405155B2 (en) * 1997-11-07 2003-05-12 松下電器産業株式会社 Document search device
JP2001060197A (en) * 1999-08-20 2001-03-06 Oki Electric Ind Co Ltd Retrieving method for relational data base and recording medium recording program therefor
JP2001266072A (en) * 2000-03-17 2001-09-28 Minolta Co Ltd Device and method for recognizing character
JP3958722B2 (en) * 2003-07-30 2007-08-15 株式会社野村総合研究所 Image data document retrieval system
JP2005301664A (en) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd Image dictionary forming device, encoding device, data file, image dictionary forming method, and program thereof
US8509537B2 (en) * 2010-08-05 2013-08-13 Xerox Corporation Learning weights of fonts for typed samples in handwritten keyword spotting

Also Published As

Publication number Publication date
JP2014186545A (en) 2014-10-02

Similar Documents

Publication Publication Date Title
US10750044B2 (en) Information processing system, information processing apparatus, and method for processing information
US10136017B2 (en) Information processing system, information processing apparatus, and method for processing information
US11151367B2 (en) Image processing apparatus and image processing program
US8244037B2 (en) Image-based data management method and system
US9880989B1 (en) Document annotation service
US20080115046A1 (en) Program, copy and paste processing method, apparatus, and storage medium
US10949662B2 (en) Image processing apparatus
US11749008B2 (en) Image processing apparatus and image processing program
US20090300481A1 (en) Server apparatus, information processing apparatus, data processing method, and storage medium including program
US20150143488A1 (en) Information sharing system and information sharing method
JP2004252944A (en) Program, character input edit method and device, and recording medium
JP7131137B2 (en) Image processing device and image processing program
TW201416884A (en) Font distribution system and method of font distribution
JP6232736B2 (en) Document reading support device, document reading support system, document reading support method and program
JP5787925B2 (en) SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD
CN112463749A (en) File sharing method, device, medium and electronic equipment
US8499235B2 (en) Method of posting content to a web site
JPWO2012053509A1 (en) Input support program, input support apparatus, and input support method
JP6763173B2 (en) Document correction methods, document correction devices, and computer programs
US11379282B2 (en) Recording medium, recording system, recording device, analysis device, and recording method
JP2014186536A (en) Social graph generation device, social graph generation program and social graph generation method
JP2015076698A (en) Image processor and image formation apparatus, and image reader and image formation system
JP2014186546A (en) Information processing device, information processing program, and information processing method
JP5779412B2 (en) Client / server system, client device, server device, comment screen creation method in client / server system, client device program, server device program
JP7287684B2 (en) Reading support system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150728

R150 Certificate of patent or registration of utility model

Ref document number: 5787925

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350