JP5944338B2 - Information processing apparatus, information processing program, and information processing method - Google Patents

Information processing apparatus, information processing program, and information processing method Download PDF

Info

Publication number
JP5944338B2
JP5944338B2 JP2013060966A JP2013060966A JP5944338B2 JP 5944338 B2 JP5944338 B2 JP 5944338B2 JP 2013060966 A JP2013060966 A JP 2013060966A JP 2013060966 A JP2013060966 A JP 2013060966A JP 5944338 B2 JP5944338 B2 JP 5944338B2
Authority
JP
Japan
Prior art keywords
handwritten
data
target sentence
information processing
scanned image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013060966A
Other languages
Japanese (ja)
Other versions
JP2014186546A (en
Inventor
祐 宮崎
祐 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013060966A priority Critical patent/JP5944338B2/en
Publication of JP2014186546A publication Critical patent/JP2014186546A/en
Application granted granted Critical
Publication of JP5944338B2 publication Critical patent/JP5944338B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理プログラム、および情報処理方法に関する。   The present invention relates to an information processing apparatus, an information processing program, and an information processing method.

書籍のスキャン画像を基にテキストデータを作成する書籍の電子化技術が普及している。書籍を電子化するには、まず、書籍をスキャンし、スキャン画像から文字画像を抽出する。この文字画像に対応する文字コードを文字パターン辞書から取得することにより、文字画像をテキストデータに変換する。そうして、スキャン画像を基にテキストデータを作成することにより、書籍を電子ファイル化する。   2. Description of the Related Art Computerization technology for books that creates text data based on scanned images of books has become widespread. In order to digitize a book, first, the book is scanned and a character image is extracted from the scanned image. By obtaining a character code corresponding to the character image from the character pattern dictionary, the character image is converted into text data. Then, by creating text data based on the scanned image, the book is converted into an electronic file.

事業者に電子化を依頼する書籍には、依頼した時点ですでに手書文字が付されている場合がある。例えば、ユーザは学術文献等を読む際に、学術文献で特に重要と考える部分を波線で示したり、「要点」「ポイント」というワードを記載したりして、後で読み返したときに重要な部分が一目で判断できるようにすることがある。このような手書文字は書籍を電子ファイル化する際、ノイズとして削除されるのが通常である。   There are cases in which handwritten characters are already attached to books that are requested to be digitized by business operators at the time of request. For example, when reading a scholarly document, the part that is considered particularly important in the scholarly document is indicated by a wavy line, or the words “main points” and “points” are written, and the important part when reading back later. May be judged at a glance. Such handwritten characters are usually deleted as noise when a book is converted into an electronic file.

特開2011−053889号公報JP 2011-053889 A 特開2009−231172号公報JP 2009-231172 A 特開2009−212655号公報JP 2009-212655 A

しかしながら、書籍を電子化する際に手書文字が有効利用されていない問題がある。   However, there is a problem that handwritten characters are not effectively used when digitizing a book.

開示の技術は、上記に鑑みてなされたものであって、手書文字を有効利用することができる情報処理装置、情報処理プログラム、および情報処理方法を提供することを目的とする。   The disclosed technology has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing program, and an information processing method capable of effectively using handwritten characters.

本願に係る情報処理装置は、スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得する取得手段と、前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶する記憶手段と、を備えたことを特徴とする。 The information processing apparatus according to the present application, the obtaining means the range of handwriting portions included in the scanned image identified using the coordinates corresponding to the scanned image, and acquires the target sentence corresponding to before and after the identified said range , characterized by comprising the scan picture image, information identifying the scope, and a storage means for storing in association with the Target sentence.

開示の技術の実施態様によれば、手書文字を有効利用することができるという効果を奏する。   According to the embodiment of the disclosed technology, there is an effect that handwritten characters can be effectively used.

図1は、実施例1に係る手書データを取得し、対象文章を投稿用のWebページに投稿するまでの処理の流れを説明するための図である。FIG. 1 is a diagram for explaining a flow of processing from acquiring handwritten data according to the first embodiment to posting a target sentence on a Web page for posting. 図2は、書籍の電子化処理システムに係る構成の一例を示した図である。FIG. 2 is a diagram showing an example of a configuration relating to a book electronic processing system. 図3は、電子化処理サーバの構成を示す機能ブロック図である。FIG. 3 is a functional block diagram showing the configuration of the electronic processing server. 図4は、画像データの一例を示した図である。FIG. 4 is a diagram illustrating an example of image data. 図5は、テキストデータの一例を示した図である。FIG. 5 is a diagram showing an example of text data. 図6は、手書データの一例を示した図である。FIG. 6 is a diagram showing an example of handwritten data. 図7は、画像データから各手書データを作成するまでの流れを示したフロー図である。FIG. 7 is a flowchart showing a flow from creation of each handwriting data from image data. 図8は、スキャン画像から投稿用のWebページへ遷移する様子を示した図である。FIG. 8 is a diagram showing a transition from a scanned image to a posting Web page. 図9は、対象文章にハッシュタグを付した場合の手書データの一例を示す図である。FIG. 9 is a diagram illustrating an example of handwriting data when a hash tag is attached to the target sentence. 図10は、端末が投稿サイトの入力欄にハッシュタグを設定し、対象文章を入力したときの一例を示した図である。FIG. 10 is a diagram illustrating an example when the terminal sets a hash tag in the input field of the posting site and inputs a target sentence.

以下に、本願に係る情報処理装置、情報処理プログラム、および情報処理方法を実施するための実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る検索装置、検索プログラム、および検索方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。   Hereinafter, embodiments for carrying out an information processing apparatus, an information processing program, and an information processing method according to the present application will be described in detail with reference to the drawings. Note that the search device, search program, and search method according to the present application are not limited by this embodiment. In the following embodiments, the same portions are denoted by the same reference numerals, and redundant description is omitted. Each embodiment can be appropriately combined within a range in which processing contents do not contradict each other.

[処理の概要]
まず、図1を用いて、実施例1に係る表示処理について説明する。図1は、手書データを取得し、対象文章を投稿用のWebページに投稿するまでの処理の流れを説明するための図である。情報処理サーバ200は、主に、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する処理と、スキャン画像11および対象文章を対応付けて記憶する処理とをおこなう。以下、より具体的に説明する。
[Process overview]
First, display processing according to the first embodiment will be described with reference to FIG. FIG. 1 is a diagram for explaining the flow of processing from acquiring handwritten data to posting a target sentence on a posting Web page. The information processing server 200 mainly performs processing for acquiring target texts corresponding to before and after the handwritten portion included in the scanned image 11 and processing for storing the scanned images 11 and the target text in association with each other. More specific description will be given below.

まず、情報処理サーバ200は、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する。そのために、情報処理サーバ200は、最初に、スキャナ等によって読み込まれた画像データ221aを受け付け、手書文字もしくは手書符号が記載された箇所を手書文字データとして取得する。例えば、情報処理サーバ200は、画像データ221aに記載された「為替レート」という用語の下の部分に下線が引かれ、その下に「ポイント」という文字が手書きで記載されているので、この手書箇所をまとめて長方形で囲んで抽出する。そして、情報処理サーバ200は、手書箇所を抽出する際、手書箇所が記された画像データ221に対応するページ数「3」と、手書箇所を長方形で囲んだときの左上および右下の座標「(90,80)−(130,85)」とを、手書文字データと関連付け、さらに手書箇所ごとにシーケンシャルに与えられる手書ID「1」を関連付ける。   First, the information processing server 200 acquires target sentences corresponding to before and after the handwritten part included in the scanned image 11. For this purpose, the information processing server 200 first receives the image data 221a read by a scanner or the like, and acquires a handwritten character or a portion where a handwritten code is written as handwritten character data. For example, the information processing server 200 is underlined in the lower part of the term “exchange rate” described in the image data 221a, and the character “point” is written by hand under it. Extract the book parts by enclosing them in a rectangle. When the information processing server 200 extracts the handwritten portion, the number of pages “3” corresponding to the image data 221 in which the handwritten portion is written, and the upper left and lower right when the handwritten portion is surrounded by a rectangle. The coordinates “(90, 80)-(130, 85)” are associated with the handwritten character data, and further, the handwritten ID “1” given sequentially for each handwritten portion is associated.

次に、情報処理サーバ200は、抽出した手書箇所の前後にある対象文章を取得する。例えば、情報処理サーバ200は、手書箇所があるページ数「3」と、手書箇所に係る座標「(90,80)−(130,85)」とに基づき手書箇所を特定し、手書箇所の前後に対応する対象文章データを取得する。例えば、情報処理サーバ200は、手書箇所に係る行の前後1行を含む、計3行をテキストデータとして取得する。   Next, the information processing server 200 acquires target sentences before and after the extracted handwritten part. For example, the information processing server 200 identifies the handwriting location based on the number of pages with the handwriting location “3” and the coordinates “(90, 80) − (130, 85)” relating to the handwriting location, Get the target sentence data corresponding to before and after the text. For example, the information processing server 200 acquires a total of three lines as text data including one line before and after the line related to the handwritten part.

次に、情報処理サーバ200は、手書データ10をスキャン画像11に対応付けて記憶する。情報処理サーバ200は、対象文章を取得する際に対象文章の行「3−6」を取得する。そして、情報処理サーバ200は、対象文章の行「3−6」と、対象文章のテキストデータとを手書ID「1」に関連付け、手書データ10とする。すなわち、情報処理サーバ200は、先述の手書ID、ページ数、座標、手書文字データと、取得した対象文章の行、および対象文章データを、手書データ10として対応付けて記憶する。   Next, the information processing server 200 stores the handwritten data 10 in association with the scanned image 11. The information processing server 200 acquires the line “3-6” of the target sentence when acquiring the target sentence. Then, the information processing server 200 associates the line “3-6” of the target sentence with the text data of the target sentence with the handwriting ID “1” and sets it as the handwriting data 10. That is, the information processing server 200 stores the handwritten ID, the number of pages, the coordinates, the handwritten character data, the acquired line of the target sentence, and the target sentence data in association with each other as the handwritten data 10.

端末30aは、手書データ10およびスキャン画像11をダウンロードし、表示部31aにスキャン画像11を表示する。端末30aは、スキャン画像11の手書箇所が押下されると、手書データ10を基に手書箇所に対応する対象文章を取得する。そして、端末30aは、手書箇所が押下されたとき、表示部31aが投稿用のWebページに切り替え、表示部31bに遷移する。さらに、端末30bは、投稿用のWebページの入力欄に対象文章を入力する。端末30bは、投稿ボタンの押下を検知すると、対象文章を投稿用のWebページに投稿する。   The terminal 30a downloads the handwritten data 10 and the scanned image 11, and displays the scanned image 11 on the display unit 31a. When the handwritten portion of the scanned image 11 is pressed, the terminal 30a acquires the target sentence corresponding to the handwritten portion based on the handwritten data 10. In the terminal 30a, when the handwritten part is pressed, the display unit 31a switches to the web page for posting, and transitions to the display unit 31b. Furthermore, the terminal 30b inputs the target sentence in the input field of the Web page for posting. When the terminal 30b detects that the posting button is pressed, the terminal 30b posts the target sentence to the posting web page.

このように、情報処理サーバ200は、スキャン画像に含まれる手書箇所の前後に対応する対象文章を取得し、スキャン画像11および対象文章を対応付けて記憶する。スキャン画像11と、対象文章とを対応付けた手書データ10とをダウンロードした端末30は、表示部31aに表示されている手書箇所が押下された際、手書データ10から対象文章を取得し、対象文章を投稿用のWebページの入力欄に入力することができる。このため、ユーザは、表示部31bの投稿用のWebページにおいて、投稿ボタンを選択する等の簡易な操作をするだけで、選択した手書箇所に対応する対象文章を投稿サイトに投稿できる。   As described above, the information processing server 200 acquires the target sentence corresponding to the handwritten part included in the scan image, and stores the scan image 11 and the target sentence in association with each other. The terminal 30 that has downloaded the scan image 11 and the handwritten data 10 in which the target text is associated with each other acquires the target text from the handwritten data 10 when the handwritten location displayed on the display unit 31a is pressed. Then, the target sentence can be input in the input field of the Web page for posting. For this reason, the user can post the target text corresponding to the selected handwritten part to the posting site only by performing a simple operation such as selecting a posting button on the posting Web page of the display unit 31b.

[電子化システムの全体構成]
図2は、電子化システム100の全体構成の一例を示した図である。ユーザ端末101と電子化サーバ110と管理システム120は、図示しないネットワークに接続し、各種の情報を交換する。かかるネットワークの一態様としては、有線または無線を問わず、LAN(Local Area Network)やVPN(Virtual Private Network)、移動体通信網などの任意の通信網が挙げられる。
[Overall configuration of electronic system]
FIG. 2 is a diagram illustrating an example of the overall configuration of the computerized system 100. The user terminal 101, the computerized server 110, and the management system 120 are connected to a network (not shown) and exchange various information. As an aspect of such a network, there is an arbitrary communication network such as a local area network (LAN), a virtual private network (VPN), or a mobile communication network regardless of wired or wireless.

ユーザ端末101は、ユーザが操作する端末装置である。例えば、ユーザ端末101は、デスクトップ型PC(パーソナルコンピュータ)、タブレット型PC、ノート型PCなどの情報処理装置等である。なお、ユーザ端末101は、スマートフォン、PDA(Personal Digital Assistant)、携帯電話機であってもよい。なお、図2の例では、ユーザ端末101として、デスクトップ型PCとスマートフォンをそれぞれ1つ示したが、これはユーザ端末の例示であり、他の種類の端末を使用してもよい。   The user terminal 101 is a terminal device operated by a user. For example, the user terminal 101 is an information processing apparatus such as a desktop PC (personal computer), a tablet PC, or a notebook PC. The user terminal 101 may be a smart phone, a PDA (Personal Digital Assistant), or a mobile phone. In the example of FIG. 2, one desktop PC and one smartphone are shown as the user terminal 101, but this is an example of a user terminal, and other types of terminals may be used.

電子化サーバ110は、書籍の電子化をする事業者の所有するサーバである。電子化サーバ110には、スキャナ等の機器を接続し、スキャンした画像から書籍の電子化を行い、テキストデータ222を作成する。   The electronic server 110 is a server owned by a business operator who digitizes books. A device such as a scanner is connected to the electronic server 110, and the book is digitized from the scanned image to create text data 222.

管理システム120は、各種の管理を行うシステムである。管理システム120は、電子書籍データ等を管理しており、受信サーバ121と、ファイル管理サーバ122と、認証サーバ123と、決済サーバ124とを有する。受信サーバ121とファイル管理サーバ122と認証サーバ123と決済サーバ124は、ネットワークを介して電子化サーバ110に接続されている。また、受信サーバ121は、電子化サーバ110からテキストデータ222、スキャン画像11を受信する。また、ファイル管理サーバ122は、登録されたユーザ毎にユーザ用の記憶領域を有している。   The management system 120 is a system that performs various types of management. The management system 120 manages electronic book data and the like, and includes a receiving server 121, a file management server 122, an authentication server 123, and a settlement server 124. The receiving server 121, the file management server 122, the authentication server 123, and the settlement server 124 are connected to the computerized server 110 via a network. Further, the receiving server 121 receives the text data 222 and the scanned image 11 from the electronic server 110. Further, the file management server 122 has a storage area for a user for each registered user.

次に、電子化システム100が受け付けるユーザの操作、およびユーザの操作に対する電子化システム100の処理について説明する。電子化サーバ110は、事業者Webページ103を提供しており、事業者Webページ103から書籍の電子化の依頼を受け付ける。ユーザは、書籍を電子化する場合、事業者Webページ103から会員登録を行う(1)。事業者Webページ103には、書籍の電子化に関する料金など各種の情報が表示される。   Next, a user operation accepted by the computerization system 100 and a process of the computerization system 100 for the user operation will be described. The digitization server 110 provides a provider web page 103 and accepts a request for digitization of a book from the provider web page 103. When a user digitizes a book, the user performs member registration from the business entity web page 103 (1). Various types of information such as fees related to digitization of books are displayed on the business entity web page 103.

事業者Webページ103は、管理システム120のユーザIDおよびパスワードを入力する入力領域を有しており、ユーザIDおよびパスワードを用いて認証サーバ123によりユーザの認証を行う。ユーザは、事業者Webページ103に管理システム120のユーザIDおよびパスワードを入力してログインする(1)。事業者Webページ103は、入力されたユーザIDおよびパスワードを用いて認証サーバ123によりユーザの認証を行い、認証が得られた場合、書籍の電子化の依頼を受け付ける(2)。事業者Webページ103は、書籍の電子化の依頼を受け付けると、依頼内容を受信サーバ121へ通知する。   The business entity web page 103 has an input area for inputting the user ID and password of the management system 120, and authenticates the user by the authentication server 123 using the user ID and password. The user logs in by entering the user ID and password of the management system 120 on the business entity web page 103 (1). The business entity web page 103 authenticates the user by the authentication server 123 using the input user ID and password, and accepts a request for digitization of the book when the authentication is obtained (2). Upon receiving a book digitization request, the business entity web page 103 notifies the reception server 121 of the request content.

事業者がユーザから発送された書籍を受け付けると(3)、事業者は図示されていないスキャナにより書籍を読み取り、電子化サーバ110はスキャン画像11を取得する。電子化サーバ110は、スキャン画像11に含まれる文字列を取得し、電子化することによりテキストデータに変換する(4)。   When the business operator accepts the book sent from the user (3), the business operator reads the book with a scanner (not shown), and the electronic server 110 acquires the scanned image 11. The computerization server 110 acquires a character string included in the scanned image 11 and converts it into text data by digitizing the character string (4).

電子化サーバ110は、ユーザにより課金を確認すると(5)、スキャン画像11、テキストデータ222を含む電子書籍データ122を受信サーバ121へ送信して、記憶部21の事業者用の記憶領域に書き込む(6)。   When the electronic server 110 confirms the billing by the user (5), the electronic server 110 transmits the electronic book data 122 including the scanned image 11 and the text data 222 to the reception server 121 and writes it in the storage area for the business in the storage unit 21. (6).

受信サーバ121は、事業者用の記憶領域に電子書籍データ112が書き込まれた際、電子書籍データ112を、ファイル管理サーバ122における依頼元のユーザの記憶領域に移動する。これにより、ユーザはユーザ端末101から依頼元のユーザの記憶領域にアクセスすることで、スキャン画像11およびテキストデータ222を閲覧できる(7)。   The receiving server 121 moves the electronic book data 112 to the requesting user's storage area in the file management server 122 when the electronic book data 112 is written in the storage area for the business. Thereby, the user can browse the scanned image 11 and the text data 222 by accessing the storage area of the requesting user from the user terminal 101 (7).

[情報処理サーバにおける処理]
実施例1に係る情報処理サーバ200の機能構成の一例について説明する。図3は、実施例1に係る電子化処理サーバの構成を示す機能ブロック図である。図3に示すように、情報処理サーバ200は、制御部210と、記憶部220とを有する。また、情報処理サーバ200は、入力部201と、通信I/F202とに接続される。なお、先述した図2のファイル管理サーバ122は、情報処理サーバ200の一例である。
[Processing in the information processing server]
An example of a functional configuration of the information processing server 200 according to the first embodiment will be described. FIG. 3 is a functional block diagram illustrating the configuration of the electronic processing server according to the first embodiment. As illustrated in FIG. 3, the information processing server 200 includes a control unit 210 and a storage unit 220. The information processing server 200 is connected to the input unit 201 and the communication I / F 202. The file management server 122 of FIG. 2 described above is an example of the information processing server 200.

入力部201は、スキャナ等により取込まれたスキャン画像11を入力するための装置である。入力部201は、書籍の各ページをスキャン画像11として記憶部220に入力する。また、通信I/F202は、NIC(Network Interface Card)等のインターフェースである。通信I/F202は、画像データ221と、テキストデータ222と、手書ID、ページ数、座標、手書文字データ、対象文章の行、および対象文章データを関連付けた手書データ10とを端末30へ送信する。   The input unit 201 is a device for inputting the scanned image 11 captured by a scanner or the like. The input unit 201 inputs each page of the book to the storage unit 220 as the scanned image 11. The communication I / F 202 is an interface such as a NIC (Network Interface Card). The communication I / F 202 transmits image data 221, text data 222, handwriting ID, number of pages, coordinates, handwriting character data, target sentence line, and handwriting data 10 associated with the target sentence data to the terminal 30. Send to.

記憶部220は、各種情報を記憶するデバイスである。記憶部220は、画像データ221と、テキストデータ222と、手書データ10とを有する。記憶部220は、それ以外に、制御部210で実行されるOS(Operating System)や、後述する格納処理を実行するプログラムを含む各種プログラムを記憶する。   The storage unit 220 is a device that stores various types of information. The storage unit 220 includes image data 221, text data 222, and handwritten data 10. In addition, the storage unit 220 stores various programs including an OS (Operating System) executed by the control unit 210 and a program for executing a storage process described later.

記憶部220が有する画像データ221は、スキャン画像11の各ページの画像である。図4は、画像データ221の一例を示した図である。図4のように、記憶部220は、スキャン画像11をページ単位に分割し、各ページの画像を画像データ221として記憶してもよい。記憶部220は、画像データ221を記憶する際、スキャン画像11における画像データ221に対応するページ数を関連付けて記憶してもよい。また、画像データ221には手書箇所が含まれてもよい。なお、記憶部220は、別途、書籍の全ページに係る画像を記憶してもよい。   Image data 221 included in the storage unit 220 is an image of each page of the scanned image 11. FIG. 4 is a diagram illustrating an example of the image data 221. As illustrated in FIG. 4, the storage unit 220 may divide the scanned image 11 into pages and store the image of each page as image data 221. When storing the image data 221, the storage unit 220 may store the number of pages corresponding to the image data 221 in the scanned image 11 in association with each other. The image data 221 may include a handwritten part. In addition, the memory | storage part 220 may memorize | store the image which concerns on all the pages of a book separately.

記憶部220が有するテキストデータ222は、スキャン画像11をテキスト化したものである。図5は、テキストデータ222の一例を示した図である。記憶部220は、スキャン画像11をテキストデータ222に対応付けて記憶する。このため、スキャン画像11およびテキストデータ222を受信した端末30は、テキストデータ222の各文字について、スキャン画像11での位置をそれぞれ特定することができる。このように、スキャン画像11はテキストデータと対応付けられている。   The text data 222 included in the storage unit 220 is obtained by converting the scanned image 11 into text. FIG. 5 is a diagram illustrating an example of the text data 222. The storage unit 220 stores the scanned image 11 in association with the text data 222. For this reason, the terminal 30 that has received the scan image 11 and the text data 222 can specify the position of each character of the text data 222 in the scan image 11. Thus, the scan image 11 is associated with the text data.

記憶部220が有する手書データ10は、スキャン画像11に含まれる各手書箇所の座標等を対応付けたデータである。手書データ10は、手書ID、ページ数、座標、手書文字データ、対象文章の行、および対象文章データを関連付け、さらに、手書箇所ごとにシーケンシャルに与えられる手書IDを関連付ける。記憶部220は、手書IDを主キーに設定し、各手書データ10をデータベースで管理してもよい。なお、情報処理サーバ200は、手書データ10により、座標と手書文字データとが対応付けられているので、スキャン画像11から各手書文字データを取り除くことも可能である。   The handwritten data 10 included in the storage unit 220 is data in which the coordinates and the like of each handwritten part included in the scanned image 11 are associated. The handwriting data 10 associates a handwriting ID, the number of pages, coordinates, handwriting character data, a target sentence line, and target sentence data, and further associates a handwriting ID given sequentially for each handwriting part. The storage unit 220 may set the handwriting ID as a primary key and manage each handwriting data 10 in a database. Note that the information processing server 200 can remove each handwritten character data from the scanned image 11 because the handwriting data 10 associates the coordinates with the handwritten character data.

次に、図6を用いて、手書データ10の各項目について説明する。図6は、手書データ10の一例を示した図である。図6に示すように、手書データ10は、手書ID、頁、座標、手書文字データ、行、および対象文章データを含む。取得部212は、手書箇所ごとにシーケンシャルに番号を付すことにより、「手書ID」を設定する。情報処理サーバ200は、「手書ID」を一意な番号に設定するので、各手書データ10をデータベースで管理する場合に、「手書ID」を各レコードの主キーとすることができる。手書データ10の「頁」は、手書箇所があるページ数である。手書データ10の「座標」は、画像データ221における手書箇所を長方形で囲ったときの左上端の座標と右下端の座標を示す。手書データ10の「手書文字データ」は、「座標」に対応する手書箇所を画像として抜き出したものである。手書データ10の「行」は、画像データ221における対象文章の行である。手書データ10の「対象文章データ」は、スキャン画像11における対象文章の部分をテキストデータとして抜き出したものである。なお、「対象文章データ」は、画像データ221から対象文章に係る部分を画像として抜き出したものであってもよい。   Next, each item of the handwritten data 10 will be described with reference to FIG. FIG. 6 is a diagram showing an example of the handwriting data 10. As shown in FIG. 6, the handwritten data 10 includes handwritten ID, page, coordinates, handwritten character data, line, and target sentence data. The acquisition unit 212 sets a “handwriting ID” by sequentially numbering each handwriting location. Since the information processing server 200 sets the “handwriting ID” to a unique number, when the handwriting data 10 is managed in the database, the “handwriting ID” can be used as the main key of each record. The “page” of the handwritten data 10 is the number of pages with a handwritten part. The “coordinates” of the handwriting data 10 indicate the coordinates of the upper left corner and the lower right corner when the handwritten portion in the image data 221 is enclosed by a rectangle. “Handwritten character data” of the handwritten data 10 is obtained by extracting a handwritten portion corresponding to “coordinates” as an image. The “line” of the handwriting data 10 is a line of the target sentence in the image data 221. The “target sentence data” of the handwritten data 10 is obtained by extracting the portion of the target sentence in the scanned image 11 as text data. The “target sentence data” may be extracted from the image data 221 as a part of the target sentence.

例えば、図6の手書データ10は、図4の手書箇所を示しており、手書ID「1」、手書箇所が記された画像データ221の頁「3」、手書箇所の範囲を示す座標「(90,80)−(130,85)」、手書箇所を画像として抜き出した手書データ、対象文章の行「3−6」、および対象文章をテキストデータとして抜き出した対象文章データが関連付けられている。   For example, the handwritten data 10 in FIG. 6 indicates the handwritten portion in FIG. 4. The handwritten ID “1”, the page “3” of the image data 221 in which the handwritten portion is written, the range of the handwritten portion. "(90,80)-(130,85)" indicating the handwriting, handwritten data extracted from the handwritten part as an image, target sentence line "3-6", and the target sentence extracted from the target sentence as text data Data is associated.

制御部210は、受付部211と、取得部212と、送信部213とを備える。制御部210の各機能は、例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。   The control unit 210 includes a reception unit 211, an acquisition unit 212, and a transmission unit 213. Each function of the control unit 210 can be realized, for example, by a CPU (Central Processing Unit) executing a predetermined program.

制御部210が有する受付部211は、画像データ221を受け付ける。受付部211は、記憶手段220において画像データ221がスキャン画像11の各ページに対応付けられているので、各画像データ221を受け付ける際に、対応するページ数をそれぞれ受け付けてもよい。なお、受付部211は、各画像データ221を受け付ける際、それぞれの画像データ221にページ数を割り振ってもよい。   The receiving unit 211 included in the control unit 210 receives the image data 221. Since the image data 221 is associated with each page of the scan image 11 in the storage unit 220, the accepting unit 211 may accept the corresponding number of pages when accepting each image data 221. The accepting unit 211 may assign the number of pages to each image data 221 when accepting each image data 221.

制御部210が有する取得部212は、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する。取得部212は、まず、受付部211から、そのページに係る画像データ221と、受け付けた画像データ221のページ数とを取得する。取得部212は、次に、画像データ221の上部から下部に向かって、手書箇所を探し、手書箇所を見つけたらシーケンシャルに手書IDを付し、ページ数と、手書箇所の座標と、手書文字データとを対応付ける。なお、手書文字と活字文字とを区別する際には、例えば、スペクトル領域局所ゆらぎ検出法を使用する。手書によるゆらぎを検出し、これを基に手書文字であるか活字文字であるかの判定をおこなう。   The acquisition unit 212 included in the control unit 210 acquires target sentences corresponding to before and after the handwritten portion included in the scanned image 11. First, the acquisition unit 212 acquires the image data 221 related to the page and the number of pages of the received image data 221 from the reception unit 211. Next, the acquisition unit 212 searches for the handwritten part from the upper part to the lower part of the image data 221. When the handwritten part is found, the acquisition part 212 sequentially attaches the handwritten ID, and the number of pages, the coordinates of the handwritten part, Associate handwritten character data. In order to distinguish between handwritten characters and printed characters, for example, a spectral region local fluctuation detection method is used. Fluctuation due to handwriting is detected, and based on this, it is determined whether it is a handwritten character or a printed character.

次に、取得部212は、手書データ10の座標を基にして手書箇所の前後に対応する対象文章を取得する。そのために、取得部212は、まず、画像データ221における手書箇所の位置を、手書データ10に係る「座標」を基にして特定する。   Next, the acquisition unit 212 acquires target sentences corresponding to before and after the handwritten part based on the coordinates of the handwritten data 10. For this purpose, the acquisition unit 212 first specifies the position of the handwritten portion in the image data 221 based on the “coordinates” related to the handwritten data 10.

取得部212は、次に、画像データ221における手書箇所前後に対応する対象文章の範囲を特定する。例えば、取得部212は、手書箇所の上下設定行数の範囲を、対象文章の範囲としてもよい。その場合、取得部212は、画像データ221における対象文章の範囲に記載された文字列を、テキストデータ222で特定し、テキストデータとして対象文章を取得する。このとき、取得部212は、画像データ221における対象文章の行も取得する。そして、取得部212は、手書ID、ページ数、座標、手書文字データ、対象文章の行、および対象文章データを関連付けて手書データ10として記憶部220に記憶する。   Next, the acquisition unit 212 specifies the range of the target sentence corresponding to before and after the handwritten part in the image data 221. For example, the acquisition unit 212 may set the range of the number of lines set in the upper and lower handwritten locations as the range of the target sentence. In that case, the acquisition unit 212 identifies the character string described in the range of the target sentence in the image data 221 with the text data 222, and acquires the target sentence as text data. At this time, the acquisition unit 212 also acquires the line of the target sentence in the image data 221. Then, the acquisition unit 212 associates the handwritten ID, the number of pages, the coordinates, the handwritten character data, the target sentence line, and the target sentence data, and stores them in the storage unit 220 as the handwritten data 10.

また、取得部212は、手書箇所前後の文字数の範囲を対象文章の範囲としてもよい。この場合、取得部212は、まず、取得部212は、画像データ221における手書箇所の位置を、手書データ10に係る「座標」を基にして、画像データ221における手書箇所の位置を特定する。次に、取得部212は、画像データ221における手書箇所の位置からテキストデータ222における手書箇所の位置を特定し、テキストデータ222から手書箇所前後の所定の文字数分の文字列を対象文章として取得する。なお、取得部212は、対象文章を画像データ221における対象文章の部分を、テキストに変換することにより対象文章を取得してもよい。   Moreover, the acquisition part 212 is good also considering the range of the number of characters before and behind a handwritten location as the range of an object sentence. In this case, the acquiring unit 212 first determines the position of the handwritten part in the image data 221 based on the “coordinates” of the handwritten data 10 based on the position of the handwritten part in the image data 221. Identify. Next, the acquisition unit 212 specifies the position of the handwritten portion in the text data 222 from the position of the handwritten portion in the image data 221, and sets a character string corresponding to a predetermined number of characters before and after the handwritten portion from the text data 222. Get as. The acquisition unit 212 may acquire the target sentence by converting the part of the target sentence in the image data 221 into text.

これにより、取得部212は、スキャン画像11に含まれる各手書箇所に対応する対象文章をそれぞれ取得できる。なお、上記では取得部212は、対象文章をテキストデータとして取得する例について説明したが、画像データとして取得してもよい。   Thereby, the acquisition unit 212 can acquire each target sentence corresponding to each handwritten part included in the scanned image 11. In addition, although the acquisition part 212 demonstrated above the example which acquires a target sentence as text data, you may acquire as image data.

制御部210が有する送信部213は、手書データ10と、スキャン画像11とを通信I/F202を介して端末30に送信する。なお、送信部213は、スキャン画像11に対応付けられたテキストデータ222を送信してもよい。   The transmission unit 213 included in the control unit 210 transmits the handwritten data 10 and the scanned image 11 to the terminal 30 via the communication I / F 202. Note that the transmission unit 213 may transmit the text data 222 associated with the scanned image 11.

次は、図7を用いて、画像データ221から各手書箇所に係る、手書文字データおよび対象文章を手書データ10に登録するまでの手順について説明する。図7は、画像データ221から各手書データ10を作成するまでの流れを示したフロー図である。取得部212は、受付部211が受け付けた画像データ221に含まれる手書箇所を、画像データ221の上部から順番に探す(ステップS10)。その処理方法は従来技術であり、たとえば特開2009−212655等で開示されている。取得部212は、画像データ221に手書箇所がなければ(ステップS10No)、処理を終了し、次のページに係る画像データ221の処理を開始する。取得部212は、画像データ221に手書箇所があれば(ステップS10Yes)、その手書箇所を手書文字データとして抽出する(ステップS11)。取得部212は、抽出した手書文字データを、画像データ221に係るページ数、および手書箇所の座標に関連付けて手書データ10に登録する(ステップS12)。さらに、取得部212は、手書箇所の座標に基づき、画像データ221において、手書箇所前後に対応する対象文章の範囲を特定し、対象文章の範囲を基にしてテキストデータ222より対象文章を抽出する(ステップS13)。そして、取得部212は、対象文章の行と、対象文章とを手書データ10とを、同じ手書IDに係る手書データ10に関連付けて登録する(ステップS14)。上記処理は、ステップS10で画像データ221の手書箇所を全て抽出したと判定されるまで繰り返される。   Next, a procedure from registering handwritten character data and target sentences to each handwritten portion from the image data 221 to the handwritten data 10 will be described with reference to FIG. FIG. 7 is a flowchart showing a flow from creation of each handwritten data 10 from the image data 221. The acquisition unit 212 searches for the handwritten portion included in the image data 221 received by the receiving unit 211 in order from the top of the image data 221 (step S10). The processing method is a conventional technique, for example, disclosed in Japanese Patent Application Laid-Open No. 2009-212655. If there is no handwritten part in the image data 221 (step S10 No), the acquisition unit 212 ends the process and starts the process of the image data 221 related to the next page. If there is a handwritten portion in the image data 221 (step S10 Yes), the acquiring unit 212 extracts the handwritten portion as handwritten character data (step S11). The acquisition unit 212 registers the extracted handwritten character data in the handwritten data 10 in association with the number of pages related to the image data 221 and the coordinates of the handwritten location (step S12). Furthermore, the acquisition unit 212 identifies the range of the target sentence corresponding to the handwritten part before and after the handwritten part in the image data 221 based on the coordinates of the handwritten part, and extracts the target sentence from the text data 222 based on the range of the target sentence. Extract (step S13). Then, the acquisition unit 212 registers the line of the target sentence and the target sentence in association with the handwriting data 10 related to the same handwriting ID (step S14). The above process is repeated until it is determined in step S10 that all handwritten portions of the image data 221 have been extracted.

[端末]
図8を用いて、スキャン画像11の画面を操作して、対象文章を投稿用のWebページへ投稿するまでの流れについて説明する。図8は、スキャン画像11から投稿用のWebページへ遷移する様子を示した図である。端末30aは、まず、表示部31aに情報処理サーバからダウンロードしたスキャン画像11を表示する。なお、端末30aは、表示部31aに対して画面をスクロールする操作がなされると、次ページを表示する。
[Terminal]
The flow from the operation of the screen of the scanned image 11 to the posting of the target sentence to the posting Web page will be described with reference to FIG. FIG. 8 is a diagram showing a transition from the scanned image 11 to a posting Web page. First, the terminal 30a displays the scanned image 11 downloaded from the information processing server on the display unit 31a. Note that the terminal 30a displays the next page when an operation of scrolling the screen is performed on the display unit 31a.

端末30aは、「為替レート」の下にある手書箇所が押下されると、これに対応する手書データ10を検索する。まず、端末30aは、現在表示部31aに表示しているスキャン画像のページに対応する手書データ10を探し、押下された位置に係る座標と、手書データ10の「座標」とを比較する。端末30aは、押下された位置に係る座標が手書データ10の「座標」の範囲内であれば、押下された手書箇所に対応する手書データ10と判定する。次に、端末30aは、押下された手書箇所に対応する対象文章データをその手書データ10から取得する。   When the handwritten portion under “Exchange rate” is pressed, the terminal 30a searches for the handwritten data 10 corresponding thereto. First, the terminal 30a searches for the handwritten data 10 corresponding to the page of the scanned image currently displayed on the display unit 31a, and compares the coordinates relating to the pressed position with the “coordinates” of the handwritten data 10. . If the coordinates relating to the pressed position are within the range of “coordinates” of the handwritten data 10, the terminal 30 a determines that the handwritten data 10 corresponds to the pressed handwritten part. Next, the terminal 30a acquires the target sentence data corresponding to the pressed handwritten part from the handwritten data 10.

次に、端末30bは、投稿サイトを表示し、投稿サイトの入力欄41に取得した対象文章を入力する。端末30bは、表示部31bにおいて投稿ボタン42が押下されると、対象文章を投稿する。これにより、ユーザはスキャン画像11から手書箇所を選択し、投稿用のWebページで所定の操作をするだけで、文書の引用文を投稿することができる。すなわち、ユーザは書籍に関する情報を発信する際に、手書箇所に関連する情報を入力する手間を省くことができる。   Next, the terminal 30b displays the posting site and inputs the acquired target sentence in the input field 41 of the posting site. When the posting button 42 is pressed on the display unit 31b, the terminal 30b posts the target sentence. Thereby, the user can post a document quote by simply selecting a handwritten part from the scanned image 11 and performing a predetermined operation on the Web page for posting. That is, the user can save the trouble of inputting information related to the handwritten part when transmitting information about the book.

なお、投稿サイトはユーザ個人のブログのようなものであっても、所定文字数の短文を時系列で投稿できるサイトのようなものであってもよい。情報処理サーバ200は、一度に投稿できる文字数が、所定の文字数に制限されているサイトに対象文章を投稿する場合、取得部212は、対象文章を取得する際に、対象文章として取得する手書箇所前後の文字数を、投稿用のWebページで制限されている文字数に設定し、対象文章として取得してもよい。   The posting site may be a user's personal blog or a site where a short sentence of a predetermined number of characters can be posted in time series. When the information processing server 200 posts the target sentence to a site where the number of characters that can be posted at a time is limited to a predetermined number of characters, the acquisition unit 212 acquires the target sentence as the target sentence when acquiring the target sentence. The number of characters before and after the location may be set to the number of characters restricted on the posting web page and acquired as the target sentence.

[効果]
上述してきたように、実施形態に係る情報処理サーバ200は、取得部212と、記憶部220とを備える。取得部212は、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する。記憶部220は、スキャン画像11および対象文章を対応付けて記憶する。これにより、情報処理サーバ200からスキャン画像11と、スキャン画像11に対応付けられた対象文章とを受信した端末30は、スキャン画像11に記載された手書文字から対象文章を取得することができる。その結果、手書文字を有効利用することができる。
[effect]
As described above, the information processing server 200 according to the embodiment includes the acquisition unit 212 and the storage unit 220. The acquisition unit 212 acquires target sentences corresponding to before and after the handwritten part included in the scanned image 11. The storage unit 220 stores the scan image 11 and the target sentence in association with each other. Thus, the terminal 30 that has received the scanned image 11 and the target sentence associated with the scanned image 11 from the information processing server 200 can acquire the target sentence from the handwritten characters described in the scanned image 11. . As a result, handwritten characters can be used effectively.

また、実施形態に係る情報処理サーバ200において取得部212は、対象文章をスキャン画像11からテキストデータとして取得する。これにより、情報処理サーバ200からスキャン画像11と、テキストデータとして取得された対象文章とを受信した端末30は、簡易な操作で対象文章を投稿Webサイトの入力欄に記入することができ、対象文章を手入力しなくても投稿できるようになる。   In the information processing server 200 according to the embodiment, the acquisition unit 212 acquires the target sentence from the scan image 11 as text data. Accordingly, the terminal 30 that has received the scanned image 11 and the target sentence acquired as text data from the information processing server 200 can enter the target sentence in the input column of the posting website with a simple operation. You will be able to post without manually entering text.

[ハッシュタグを付す処理]
上記、第一の実施形態では、手書データ10によりスキャン画像11と対象文章とを関連付けたが、ハッシュタグの機能を有する投稿Webサイトで使用するためのハッシュタグを、手書データ10によりさらに関連付けてもよい。そこで、第2の実施形態では、手書データ10にハッシュタグを含めた例について説明する。なお、第2の実施形態に係る情報処理サーバ200の構成は、制御部210に、抽出部を含ませたものである。
[Process to attach hash tag]
In the first embodiment, the scan image 11 and the target sentence are associated with the handwriting data 10. However, a hashtag for use on a posting website having a hashtag function is further added to the handwriting data 10. You may associate. Therefore, in the second embodiment, an example in which a hash tag is included in the handwritten data 10 will be described. Note that the configuration of the information processing server 200 according to the second embodiment is such that the control unit 210 includes an extraction unit.

情報処理サーバ200は、制御部210にさらに抽出部を含んでもよい。手書箇所により指定されたスキャン画像中の指定文字列をハッシュタグとして抽出し、「ハッシュタグ」を手書データ10に関連付ける。例えば、図4において、抽出部は、画像データ221の手書箇所により「為替レート」の部分を強調しているので、「為替レート」に対応する文字列をテキストデータ222から抽出する。そして、抽出部は、抽出した「為替レート」を手書データ10の「ハッシュタグ」の欄に設定し、「ハッシュタグ」を手書データ10と関連付ける。   The information processing server 200 may further include an extraction unit in the control unit 210. The designated character string in the scanned image designated by the handwritten part is extracted as a hash tag, and the “hash tag” is associated with the handwritten data 10. For example, in FIG. 4, the extraction unit emphasizes the “exchange rate” portion by the handwritten part of the image data 221, and therefore extracts a character string corresponding to the “exchange rate” from the text data 222. Then, the extraction unit sets the extracted “exchange rate” in the “hash tag” field of the handwritten data 10 and associates the “hash tag” with the handwritten data 10.

例えば、抽出部は、手書データ10の「座標」に示された(90,80)−(130,85)の範囲の上部にある文字列「為替レート」を指定文字列とし、手書データ10に係る「ハッシュタグ」に設定する。   For example, the extraction unit sets the character string “exchange rate” in the upper part of the range of (90, 80) − (130, 85) indicated by “coordinates” of the handwriting data 10 as the designated character string, and the handwriting data 10 is set to “hash tag”.

情報処理サーバ200から手書データ10を受信した端末30は、投稿サイトに投稿する際に対象文章にハッシュタグを付すことができる。図9は、対象文章にハッシュタグを付した場合の手書データ10の一例である。情報処理サーバ200は、手書箇所が指定している指定文字列をハッシュタグに設定する。例えば、図4において情報処理サーバ200は、画像データ221の「為替レート」の下に手書箇所があるので、手書箇所が指定している指定文字列は「為替レート」である。   The terminal 30 that has received the handwritten data 10 from the information processing server 200 can attach a hash tag to the target sentence when posting to the posting site. FIG. 9 is an example of the handwriting data 10 when a hash tag is attached to the target sentence. The information processing server 200 sets the designated character string designated by the handwritten part in the hash tag. For example, in FIG. 4, since the information processing server 200 has a handwritten portion under “Exchange rate” in the image data 221, the designated character string designated by the handwritten portion is “Exchange rate”.

図10は、端末30が投稿サイトの入力欄にハッシュタグを設定し、対象文章を入力したときの一例を示した図である。端末30は、情報処理サーバ200から当該手書データ10を受信し、対象文章を投稿する際に、手書データ10の「ハッシュタグ」を、投稿用のWebページにおいてハッシュタグに設定して対象文章を投稿することができる。例えば、投稿サイトの入力欄41に「# 為替レート」を対象文章の先頭に付して、半角の空白文字の後に対象文章「政策がデフレ・・・」を入力する。これにより、ユーザが重要と認識して直接手書きを付した部分をハッシュタグに設定して対象文章を投稿でき、投稿サイトを利用する他のユーザがハッシュタグを基に対象文章にたどり着くことが可能となる。   FIG. 10 is a diagram illustrating an example when the terminal 30 sets a hash tag in the input field of the posting site and inputs a target sentence. When the terminal 30 receives the handwritten data 10 from the information processing server 200 and posts the target text, the terminal 30 sets the “hash tag” of the handwritten data 10 as a hash tag on the posting Web page You can post a sentence. For example, “# exchange rate” is added to the head of the target sentence in the input field 41 of the posting site, and the target sentence “policy is deflation ...” is input after a single-byte space character. This makes it possible to post the target sentence by setting the part that the user recognizes as important and directly handwritten to the hash tag, and other users using the posting site can reach the target sentence based on the hash tag It becomes.

なお、情報処理サーバ200において抽出部は、一つの手書データ10につきハッシュタグを複数設定してもよい。例えば、抽出部は、対象文章として取得したテキストデータから重要な用語を複数抽出し、それぞれをハッシュタグに設定する。これにより、ユーザが対象文章を投稿した投稿サイトで他のユーザが対象文章へ、よりたどり着きやすくすることが可能となる。   In the information processing server 200, the extraction unit may set a plurality of hash tags for one handwritten data 10. For example, the extraction unit extracts a plurality of important terms from text data acquired as the target sentence, and sets each of them as a hash tag. This makes it easier for other users to reach the target sentence at the posting site where the user has posted the target sentence.

なお、実施例1において、情報処理サーバ200は、対象文章をテキストデータとして取得したが、画像データとして取得してもよい。これにより、ユーザは、手書箇所を含めた画像データを、対象文章として自己が開設したブログ等に公開することができる。   In the first embodiment, the information processing server 200 acquires the target sentence as text data, but may acquire it as image data. Thereby, the user can publish image data including a handwritten part as a target sentence on a blog or the like opened by the user.

なお、図2のファイル管理サーバ122は、情報処理サーバ200の一例であると説明したが、図2の電子化サーバ110が情報処理サーバ200の一例であってもよい。   2 has been described as an example of the information processing server 200, the computerized server 110 in FIG. 2 may be an example of the information processing server 200.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. However, these are merely examples, and various modifications, including the aspects described in the disclosure section of the invention, based on the knowledge of those skilled in the art, It is possible to implement the present invention in other forms with improvements.

また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、受付手段は、受付部や受付回路に読み替えることができる。   Further, the “means” described in the claims can be read as “section (module, unit)” or “circuit”. For example, the reception unit can be read as a reception unit or a reception circuit.

10 手書データ
11 スキャン画像
200 情報処理サーバ
201 入力部
202 通信I/F
210 制御部
211 受付部
212 取得部
213 送信部
220 記憶部
221 画像データ
222 テキストデータ
10 Handwritten data 11 Scanned image 200 Information processing server 201 Input unit 202 Communication I / F
210 Control Unit 211 Reception Unit 212 Acquisition Unit 213 Transmission Unit 220 Storage Unit 221 Image Data 222 Text Data

Claims (5)

スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得する取得手段と、
前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶する記憶手段と、
前記手書箇所により指定された前記スキャン画像中の指定文字列をハッシュタグとして抽出する抽出手段とを備え、
前記記憶手段は、前記ハッシュタグを前記対象文章に対応付けて記憶する、
ことを特徴とする情報処理装置。
An acquisition unit that specifies a range of a handwritten portion included in a scan image using coordinates corresponding to the scan image, and acquires target sentences corresponding to before and after the specified range;
Storage means for storing the scanned image, information for specifying the range, and the target sentence in association with each other;
An extraction means for extracting a designated character string in the scanned image designated by the handwritten location as a hash tag,
The storage means stores the hash tag in association with the target sentence.
An information processing apparatus characterized by that.
前記取得手段は、前記対象文章を、前記手書箇所を含む画像データとして取得することを特徴とする請求項1に記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the acquisition unit acquires the target sentence as image data including the handwritten part. 前記取得手段は、前記対象文章を前記スキャン画像からテキストデータとして取得することを特徴とする請求項1に記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the acquisition unit acquires the target sentence as text data from the scanned image. コンピュータが実行する情報処理方法であって、
スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得し、
前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶し、
前記手書箇所により指定された前記スキャン画像中の指定文字列をハッシュタグとして抽出し、
前記ハッシュタグを前記対象文章に対応付けて記憶する、
処理を実行することを特徴とする情報処理方法。
An information processing method executed by a computer,
Specify the range of the handwritten part included in the scanned image using the coordinates corresponding to the scanned image, obtain the target sentence corresponding to before and after the identified range,
Storing the scanned image, the information specifying the range, and the target sentence in association with each other ;
Extract a designated character string in the scanned image designated by the handwritten location as a hash tag,
Storing the hash tag in association with the target sentence;
An information processing method characterized by executing processing.
コンピュータに、
スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得し、
前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶し、
前記手書箇所により指定された前記スキャン画像中の指定文字列をハッシュタグとして抽出し、
前記ハッシュタグを前記対象文章に対応付けて記憶する、
処理を実行させることを特徴とする情報処理プログラム。
On the computer,
Specify the range of the handwritten part included in the scanned image using the coordinates corresponding to the scanned image, obtain the target sentence corresponding to before and after the identified range,
Storing the scanned image, the information specifying the range, and the target sentence in association with each other ;
Extract a designated character string in the scanned image designated by the handwritten location as a hash tag,
Storing the hash tag in association with the target sentence;
An information processing program for executing a process.
JP2013060966A 2013-03-22 2013-03-22 Information processing apparatus, information processing program, and information processing method Active JP5944338B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013060966A JP5944338B2 (en) 2013-03-22 2013-03-22 Information processing apparatus, information processing program, and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013060966A JP5944338B2 (en) 2013-03-22 2013-03-22 Information processing apparatus, information processing program, and information processing method

Publications (2)

Publication Number Publication Date
JP2014186546A JP2014186546A (en) 2014-10-02
JP5944338B2 true JP5944338B2 (en) 2016-07-05

Family

ID=51834055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013060966A Active JP5944338B2 (en) 2013-03-22 2013-03-22 Information processing apparatus, information processing program, and information processing method

Country Status (1)

Country Link
JP (1) JP5944338B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6246146B2 (en) * 2015-02-22 2017-12-13 株式会社オプティム Electronic book terminal, information sharing method, and program for electronic book terminal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236360A (en) * 2000-02-24 2001-08-31 Sharp Corp Electronic book display device and storage medium with recorded electronic book display program
US20030004991A1 (en) * 2001-06-29 2003-01-02 Keskar Dhananjay V. Correlating handwritten annotations to a document
JP2004240597A (en) * 2003-02-05 2004-08-26 Fuji Xerox Co Ltd Display control method, information display processing system, client's terminal, management server, and program
JP4733415B2 (en) * 2005-04-05 2011-07-27 シャープ株式会社 Electronic document display apparatus and method, and computer program
US8014040B2 (en) * 2006-04-21 2011-09-06 Microsoft Corporation Dynamic scanner system
US20100188674A1 (en) * 2009-01-26 2010-07-29 Kabushiki Kaisha Toshiba Added image processing system, image processing apparatus, and added image getting-in method
JP4934181B2 (en) * 2009-01-26 2012-05-16 株式会社東芝 Additional image processing system, image forming apparatus, and additional image adding method
JP2013008109A (en) * 2011-06-22 2013-01-10 Yamaha Corp Document contribution support system, portable terminal device and document contribution support program
JP2013037419A (en) * 2011-08-04 2013-02-21 Dainippon Printing Co Ltd Handwritten information reflection system, handwritten information reflection method, and program

Also Published As

Publication number Publication date
JP2014186546A (en) 2014-10-02

Similar Documents

Publication Publication Date Title
US8385589B2 (en) Web-based content detection in images, extraction and recognition
CN104852895B (en) The system and method for accessing external web services are provided for multi-function peripheral
US8244037B2 (en) Image-based data management method and system
US11151367B2 (en) Image processing apparatus and image processing program
JP6880763B2 (en) Information analysis system, information analysis method
US9749322B2 (en) Information sharing system and information sharing method
JP2016143165A (en) Information processing apparatus, method, and program
US11749008B2 (en) Image processing apparatus and image processing program
CN111310750B (en) Information processing method, device, computing equipment and medium
JP6387704B2 (en) Information processing system, information processing method, terminal device, and program
US20080252934A1 (en) Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
JP2009075637A (en) Data management system, data providing system, and program
JP5944338B2 (en) Information processing apparatus, information processing program, and information processing method
JP7390071B2 (en) Document processing devices, document processing methods, and programs
TWI688868B (en) System, non-transitory computer readable medium and method for extracting information and retrieving contact information using the same
US11729331B2 (en) Service providing system to generate duplicated application and transmit it to the electronic device for display on a display, information processing method, and non-transitory recording medium
JPWO2012053509A1 (en) Input support program, input support apparatus, and input support method
EP3933678A1 (en) Information processing system, data output system, image processing method, and carrier means
JP3669627B2 (en) Database construction method and apparatus, database construction processing program to be executed by computer, and computer readable recording medium recording database construction processing program to be executed by computer
JP2014186536A (en) Social graph generation device, social graph generation program and social graph generation method
JP5787925B2 (en) SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD
JP2014063457A (en) Annotation management system, and program for making computer execute the same
JP2001094711A (en) Document image processing unit and document image processing method
JP2014186463A (en) Related information extraction device, related information extraction method, and related information extraction program
JP7007609B2 (en) Information processing equipment, control method of information processing equipment, program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160525

R150 Certificate of patent or registration of utility model

Ref document number: 5944338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250