WO2015189941A1

WO2015189941A1 - 情報処理装置、情報処理方法、および、プログラム

Info

Publication number: WO2015189941A1
Application number: PCT/JP2014/065508
Authority: WO
Inventors: 康広光原; 克夫深沢; 真樹稲見
Original assignee: 株式会社Pfu
Priority date: 2014-06-11
Filing date: 2014-06-11
Publication date: 2015-12-17

Abstract

　本発明は、手書画像から、少なくとも手書図形を認識し、図形認識処理ステップにて認識された手書図形に基づいて、当該手書図形に当てはまるシンボルを認識し、認識されたシンボルに関するシンボル図形データに、当該シンボルを表すタグを付与し、シンボルに関するシンボル図形データ、および、タグを表示させる。

Description

情報処理装置、情報処理方法、および、プログラム

　本発明は、情報処理装置、情報処理方法、および、プログラムに関する。

　従来から、手書きの文字および図形を活用する技術が開示されている。

　ここで、ホワイトボードまたは紙に記入された手書文字および手書図形を複合データ形式に変換する技術が開示されている（特許文献１を参照）。

特許第４３４００７６号公報

　しかしながら、従来の変換システム（特許文献１等）においては、文字図形データのそれぞれ正式または略式の組み合わせのグループ化、および、そのグループを含む組み合わせのグループ化処理を有するものの、文字図形データの組み合わせからシンボルを自動認識し、シンボルを構成する文字図形データの塊をグループ化し、そのシンボルを表すタグを付与することができないという問題点を有していた。

　本発明は、上記問題点に鑑みてなされたもので、手書図形画像から、シンボルを自動認識し、これに意味を持たせることで、手書図形画像の検索や分類仕分けを行うことができる情報処理装置、情報処理方法、および、プログラムを提供することを目的とする。

　このような目的を達成するため、本発明に係る情報処理装置は、手書画像から、少なくとも手書図形を認識する図形認識処理手段と、前記図形認識処理手段により認識された前記手書図形に基づいて、当該手書図形に当てはまるシンボルを認識するシンボル認識手段と、前記シンボル認識手段により認識された前記シンボルに関するシンボル図形データに、当該シンボルを表すタグを付与するタグ付与手段と、前記シンボルに関する前記シンボル図形データ、および、前記タグを表示させるシンボル表示手段と、を備えたことを特徴とする。

　また、本発明に係る情報処理方法は、手書画像から、少なくとも手書図形を認識する図形認識処理ステップと、前記図形認識処理ステップにて認識された前記手書図形に基づいて、当該手書図形に当てはまるシンボルを認識するシンボル認識ステップと、前記シンボル認識ステップにて認識された前記シンボルに関するシンボル図形データに、当該シンボルを表すタグを付与するタグ付与ステップと、前記シンボルに関する前記シンボル図形データ、および、前記タグを表示させるシンボル表示ステップと、を含むことを特徴とする。

　また、本発明に係るプログラムは、手書画像から、少なくとも手書図形を認識する図形認識処理ステップと、前記図形認識処理ステップにて認識された前記手書図形に基づいて、当該手書図形に当てはまるシンボルを認識するシンボル認識ステップと、前記シンボル認識ステップにて認識された前記シンボルに関するシンボル図形データに、当該シンボルを表すタグを付与するタグ付与ステップと、前記シンボルに関する前記シンボル図形データ、および、前記タグを表示させるシンボル表示ステップと、を実行させることを特徴とする。

　この発明によれば、文字を含まない図形だけのイメージであっても、図形データの分類を決定し仕分けを行うことができる。

図１は、本実施形態の概要を示すシステムブロック図である。図２は、本実施形態に係る情報処理装置の構成の一例を示すハードウェア構成図である。図３は、本実施形態に係る情報処理装置の構成の一例を示すハードウェア構成図である。図４は、本実施形態の情報処理装置における処理の一例を示すフローチャートである。図５は、本実施形態における非文字・非線画領域の一例を示す図である。図６は、本実施形態におけるストローク抽出の一例を示す図である。図７は、本実施形態における長ストローク分離の一例を示す図である。図８は、本実施形態におけるユーザ文字認識の一例を示す図である。図９は、本実施形態におけるユーザ文字認識の一例を示す図である。図１０は、本実施形態におけるユーザ文字認識の一例を示す図である。図１１は、本実施形態における手書文字認識の一例を示す図である。図１２は、本実施形態における手書文字認識の一例を示す図である。図１３は、本実施形態における手書文字認識の一例を示す図である。図１４は、本実施形態における手書文字認識の一例を示す図である。図１５は、本実施形態の情報処理装置における処理の一例を示すフローチャートである。図１６は、本実施形態の情報処理装置における処理の一例を示すフローチャートである。図１７は、本実施形態における引き出し線先端の矢印の判別の一例を示す図である。図１８は、本実施形態の情報処理装置における処理の一例を示すフローチャートである。図１９は、本実施形態の情報処理装置における処理の一例を示すフローチャートである。図２０は、本実施形態の特徴データの一例を示す図である。図２１は、本実施形態におけるシンボル認識辞書の一例を示す図である。図２２は、本実施形態におけるシンボル選択の一例を示す図である。図２３は、本実施形態におけるレイアウト変更の一例を示す図である。図２４は、本実施形態におけるレイアウト変更の一例を示す図である。

　以下に、本発明に係る情報処理装置、情報処理方法、および、プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本発明が限定されるものではない。

［本発明の実施形態の概要］
　以下、本発明の実施形態の概要について図１を参照して説明し、その後、本実施形態の構成および処理等について詳細に説明する。図１は、本実施形態の概要を示すシステムブロック図である。本実施形態は、概略的に、以下の基本的特徴を有する。なお、図１において、点線で囲んだ部分は、システム（情報処理装置）外の部分である。

　すなわち、本実施形態の情報処理装置は、紙またはホワイトボードの手書画像を入力するために、カメラで撮影したホワイトボードの手書画像、または、スキャナインターフェース（Ｉ／Ｆ）を介してスキャナで読み取った紙の手書画像を取得する（ステップＳ１）。

　そして、情報処理装置は、カメラ入力の場合はスキャナ入力とは異なり撮影環境により画質にばらつきがでるため、カメラで撮影したホワイトボードの手書画像に対して、ホワイトボードの切り出し、および／または、明るさの補正などのカメラ画像処理を行い、スキャナで読み取った手書画像と同等程度に画質を改善する（ステップＳ２）。

　そして、情報処理装置は、入力した手書画像に対してメディア分離処理によって、文字のみが存在する画像（手書文字画像）、図形のみが存在する画像（手書図形画像）、および、写真や塗りつぶしなどそれ以外の画像に分別する（ステップＳ３）。

　そして、情報処理装置は、手書文字画像に対してはフリー（フリーピッチ）手書文字認識を行い、画像内容のテキスト化を行う（ステップＳ４）。この際、情報処理装置は、手書文字画像として分別した画像に対して文字か否かの判断も行い、文字ではない画像（非文字画像）を分離して図形抽出処理に送る。

　また、情報処理装置は、手書図形画像に対する図形抽出処理においては、メディア分離処理によって分別された手書図形画像と、フリー手書処理が出力した非文字画像との２つを受け取り、内部で合成した後、円や直線などの図形抽出を行う（ステップＳ５）。

　そして、情報処理装置は、文字認識結果と図形抽出結果とを元にシンボル認識を行い、元の手書画像に記載されている手書図形画像をシンボルごとにグループ化して、それらのグループに「自動車」または「カメラ」などの意味情報を与える（ステップＳ６）。ここで、情報処理装置は、与えた意味情報に基づいて、元の手書図形画像を、該当するイラストデータに置き換えることも可能である。

　そして、情報処理装置は、以上の処理によって得られた文字、図形、シンボル、およびそれ以外の画像データを、アプリケーションにて画面表示および認識結果の確認などを行う（ステップＳ７）。

　そして、情報処理装置は、これらの画像データをＭｉｃｒｏｓｏｆｔ（登録商標）　ＰｏｗｅｒＰｏｉｎｔ（登録商標）のような複合データ形式に変換し、外部アプリにエクスポートする（ステップＳ８）。

［本実施形態の構成］
　以下、本発明の実施形態に係る情報処理装置１００の構成の一例について図２および図３を参照して説明し、その後、本実施形態の処理等について詳細に説明する。但し、以下に示す実施形態は、本発明の技術思想を具体化するための情報処理装置１００を例示するものであって、本発明をこの情報処理装置１００に特定することを意図するものではなく、請求の範囲に含まれるその他の実施形態の情報処理装置１００にも等しく適用し得るものである。例えば、本実施形態で例示する情報処理装置１００における機能分散の形態は以下に限られず、同様の効果や機能を奏し得る範囲において、任意の単位で機能的または物理的に分散・統合して構成することができる。図２および図３は、本実施形態に係る情報処理装置１００の構成の一例を示すハードウェア構成図である。

　図２に示すように、本実施形態の情報処理装置（コンピュータ）１００は、概略的に、画像入力デバイス２００と通信可能に接続して構成される。ここで、通信には、一例として、ネットワーク３００（図示せず）を介した有線・無線通信等の遠隔通信等を含む。また、これら情報処理装置１００の各部は任意の通信路を介して通信可能に接続されている。

　ここで、画像入力デバイス２００は、イメージスキャナ等の画像読取装置のほか、デジタルカメラ等の撮影デバイスであってもよい。本実施形態において、画像読取装置は、手挿入給紙方式（連送給紙機構（ＣＤＦ）方式）のドキュメントスキャナ装置、自動給紙機構方式（ＡＤＦ方式）のドキュメントスキャナ装置、フラットベッド式のドキュメントスキャナ装置、または、オーバーヘッド型画像読取装置等であってもよい。

　まず、図２に示すように、情報処理装置１００は、概略的に、制御部１０２と、記憶部１０６と、入出力部１１２（ディスプレイ１１２－１、マウス１１２－２、および、キーボード１１２－３等）と、を備えて構成される。また、情報処理装置１００は、更に、入出力部１１２と制御部１０２とを接続する入出力インターフェース部（図示せず）を備えていてもよい。

　また、情報処理装置１００は、更に、通信インターフェース部（図示せず）を備えていてもよく、通信インターフェース部を介して、外部装置（例えば、画像入力デバイス２００等）と相互に通信可能に接続されていてもよい。通信インターフェース部は、通信回線および／または電話回線等に接続されるアンテナおよび／またはルータ等の通信装置に接続されるインターフェースであり情報処理装置１００とネットワーク３００との間における通信制御を行う機能を有していてもよい。ここで、通信インターフェース部は、ＮＩＣ等であってもよい。また、これら各部は任意の通信路を介して通信可能に接続されている。なお、制御部１０２は、入出力部１１２、入出力インターフェース部、および、通信インターフェース部を制御してもよい。

　ここで、記憶部１０６は、各種のデータベース、テーブル、および／または、ファイル（画像データベース１０６ａ、および、シンボル認識辞書データベース１０６ｂ等）などを格納する。記憶部１０６は、ストレージ手段であり、例えばＲＡＭ・ＲＯＭ等のメモリ、ハードディスクのような固定ディスク装置、フレキシブルディスク、および／または、光ディスク等を用いることができる。記憶部１０６には、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）に命令を与え各種処理を行うためのコンピュータプログラム等が記録されている。

　これら記憶部１０６の各構成要素のうち、画像データベース１０６ａは、画像を記憶する。ここで、画像は、画像入力デバイス２００にて取得されたものであってもよい。また、画像は、ネットワーク３００を介して外部装置等からダウンロードしたものであってもよい。

　また、画像データベース１０６ａは、手書画像、手書文字画像、手書図形画像、手書画像の部分画像、手書画像に含まれる単純画像、手書画像の部分画像同士を結合した結合画像、非文字・非線画領域に関するその他画像、文字・線画画像、長ストローク画像、長ストローク除去画像、単純文字画像、非文字画像、手書図形に当てはまるシンボルに関するシンボル図形データ、シンボルを表すタグ、手書文字に関する文字データ、および／または、複合データ形式（例えば、Ｍｉｃｒｏｓｏｆｔ（登録商標）　ＰｏｗｅｒＰｏｉｎｔ（登録商標）等）の複合データ等を記憶してもよい。

　また、シンボル認識辞書データベース１０６ｂは、シンボル毎に特徴データ、名称、および、カテゴリデータを含むシンボル認識辞書を記憶する。

　また、入出力部１１２は、データの入出力（Ｉ／Ｏ）を行う。ここで、入出力部１１２は、例えば、キー入力部、タッチパネル、コントロールパッド（例えば、タッチパッド、および、ゲームパッド等）、マウス１１２－２、キーボード１１２－３、および、マイク等であってもよい。また、入出力部１１２は、アプリケーション等の表示画面を表示する表示部（例えば、液晶または有機ＥＬ等から構成されるディスプレイ１１２－１、モニタ、および、タッチパネル等）であってもよい。また、入出力部１１２は、音声情報を音声として出力する音声出力部（例えば、スピーカ等）であってもよい。

　また、制御部１０２は、情報処理装置１００を統括的に制御するＣＰＵ等からなる。制御部１０２は、制御プログラムと各種の処理手順等を規定したプログラムと所要データとを格納するための内部メモリを有し、これらプログラムに基づいて種々の処理を実行するための情報処理を行う。

　ここで、制御部１０２は、大別して、画像取得部１０２ａ、画像表示部１０２ｂ、図形認識処理部１０２ｃ、シンボル認識部１０２ｄ、シンボル候補表示部１０２ｅ、タグ付与部１０２ｆ、シンボル表示部１０２ｇ、検索部１０２ｈ、グループ化部１０２ｉ、編集部１０２ｊ、修正部１０２ｋ、および、変換部１０２ｍを備える。

　画像取得部１０２ａは、画像を取得する。ここで、画像取得部１０２ａは、手書画像を取得してもよい。また、画像取得部１０２ａは、画像入力デバイス２００にて取得された画像を取得してもよい。また、画像取得部１０２ａは、画像入力デバイス２００にて読み取られた画像を取得してもよい。また、画像取得部１０２ａは、画像入力デバイス２００にて撮像された画像を取得してもよい。また、画像取得部１０２ａは、画像等を画像データベース１０６ａに格納してもよい。

　ここで、画像取得部１０２ａは、媒体（原稿）を画像入力デバイス２００にて読取らせ、画像を取得してもよい。すなわち、画像取得部１０２ａは、画像入力デバイス２００を制御して、画像を取得してもよい。また、画像取得部１０２ａは、取得した画像に画像処理（例えば、射影変換処理、画像切り出し処理、および／または、明るさ補正処理等）を行ってもよい。

　画像表示部１０２ｂは、画像を表示させる。ここで、画像表示部１０２ｂは、手書画像を表示させてもよい。また、画像表示部１０２ｂは、画像データベース１０６ａに記憶された画像を表示させてもよい。また、画像表示部１０２ｂは、画像（手書画像、手書文字画像、および／または、手書図形画像等）を入出力部１１２に表示させてもよい。

　図形認識処理部１０２ｃは、手書画像から、少なくとも手書図形を認識する。また、図形認識処理部１０２ｃは、更に、手書画像から、手書文字を認識してもよい。また、図形認識処理部１０２ｃは、画像表示部１０２ｂにより表示された手書画像に対して所定操作により認識範囲が決定された場合、当該認識範囲に対応する手書画像を手書文字画像と認定して、当該手書文字画像から手書文字を認識してもよい。ここで、所定操作は、なぞる操作であってもよい。

　また、図形認識処理部１０２ｃは、手書画像の部分画像が手書文字画像か手書図形画像か判別できない場合、部分画像を複数の単純画像に分離し、周辺に手書文字と認識されるものが無い単純画像、および、部分画像に対して文字認識を実行して明らかに文字と認識できない部分画像を、手書図形画像とみなし、判別済みの手書図形画像に結合し、結合画像から手書図形を認識してもよい。

　すなわち、図形認識処理部１０２ｃは、手書文字図形画像に記された手書文字列および手書図形を自動認識してもよい。また、図形認識処理部１０２ｃは、表示画面とタブレットが一体化した機器を用いた場合、画面に表示された文字図形データのうち、未認識の箇所、または、誤認識の箇所の文字図形イメージを、指またはペンでなぞって認識範囲を決定し、文字認識してもよい。

　シンボル認識部１０２ｄは、手書図形に当てはまるシンボルを認識する。ここで、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより認識された手書図形に基づいて、当該手書図形に当てはまるシンボルを認識してもよい。また、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより認識された手書文字および手書図形に基づいて、当該手書図形に当てはまるシンボルを認識してもよい。

　また、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより認識された手書図形に基づいて、当該手書図形に当てはまる複数のシンボル候補を取得し、複数のシンボル候補から１つのシンボル候補を選択して、当該シンボル候補をシンボルと認識してもよい。また、シンボル認識部１０２ｄは、シンボル候補表示部１０２ｅにより表示された複数のシンボル候補から１つのシンボル候補が選択された場合、選択されたシンボル候補をシンボルと認識してもよい。

　また、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより手書画像全体から認識された手書文字のコンテキストを識別することで、当該手書図形に当てはまるシンボルを認識してもよい。また、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより手書図形と認識された手書図形画像周囲に、手書文字と認識された手書文字画像がある場合、手書文字に基づいて、当該手書図形に当てはまるシンボルを認識してもよい。

　また、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより認識された手書図形に基づいて、当該手書図形に当てはまる複数のシンボル候補を取得し、シンボル認識辞書データベース１０６ｂに記憶されたシンボル認識辞書に基づいて、複数のシンボル候補から１つのシンボル候補を選択して、当該シンボル候補をシンボルと認識してもよい。

　すなわち、シンボル認識部１０２ｄは、自動認識された文字図形データの組み合わせから、上位概念となるシンボルを自動認識してもよい。また、シンボル認識部１０２ｄは、複数シンボル候補から１つのシンボルを自動選択していてもよい。

　シンボル候補表示部１０２ｅは、シンボル候補を表示させる。ここで、シンボル候補表示部１０２ｅは、シンボル認識部１０２ｄにより取得された複数のシンボル候補を入出力部１１２に表示させる。

　タグ付与部１０２ｆは、シンボル認識部１０２ｄにより認識されたシンボルに関するシンボル図形データに、当該シンボルを表すタグを付与する。すなわち、タグ付与部１０２ｆは、自動認識されたシンボルを構成する文字図形データの塊にそのシンボルを表すタグを付与してもよい。

　シンボル表示部１０２ｇは、シンボルに関するシンボル図形データ、および／または、タグを表示させる。ここで、シンボル表示部１０２ｇは、更に、手書文字に関する文字データを表示させてもよい。すなわち、シンボル表示部１０２ｇは、文字図形データ、または、シンボルを構成する文字図形データの塊とそのタグとをそれぞれ表示してもよい。また、シンボル表示部１０２ｇは、複合データ形式に変換されたシンボル図形データ、文字データ、および／または、タグを表示してもよい。

　検索部１０２ｈは、キーワードに基づいて、文字データ、および／または、シンボルを表すタグを検索する。ここで、検索部１０２ｈは、キーワードが指定された場合、当該キーワードに基づいて、文字データ、および／または、シンボルを表すタグを検索してもよい。すなわち、検索部１０２ｈは、ユーザの指定した検索キーにより、文字およびシンボルを表すタグを検索してもよい。これにより、手書文字図形データを検索すること、または、当該文字図形データの分類を決定し仕分けを行うことができる。

　グループ化部１０２ｉは、複数の構成をグループにグループ化する。グループ化部１０２ｉは、シンボル表示部１０２ｇにより表示されたシンボルに係る文字データと、シンボルに関するシンボル図形データと、に基づいて構成されるグループにグループ化してもよい。また、グループ化部１０２ｉは、シンボル表示部１０２ｇにより表示されたシンボルに係る手書文字に関する手書文字画像と、シンボルに対応する手書図形に関する手書図形画像と、に基づいて構成されるグループにグループ化してもよい。

　編集部１０２ｊは、グループの各構成に対して編集指示が入力された場合、グループ単位で編集を行う。ここで、編集は、移動、拡縮、回転、および／または、削除等であってもよい。すなわち、編集部１０２ｊは、シンボルを構成する文字図形データの塊をグループ化し、マウス、ペンまたは指などを使って、グループ単位で移動や拡縮、回転、および／または、削除などの編集が行えるようにしてもよい。

　修正部１０２ｋは、シンボル表示部１０２ｇにより表示されたシンボル図形データ、文字データ、および／または、タグに対して、修正指示が入力された場合、当該修正指示に基づいて、シンボル図形データ、文字データ、および／または、タグを修正する。すなわち、修正部１０２ｋは、表示された文字図形データ、および／または、シンボルを構成する文字図形データの塊とそのタグを修正してもよい。また、修正部１０２ｋは、確認修正において、他の候補に変更するユーザーインターフェースとして機能してもよい。

　変換部１０２ｍは、シンボルに関するシンボル図形データ、文字データ、および／または、タグを、複合データ形式に変換する。すなわち、変換部１０２ｍは、文字図形データ、シンボルを構成する文字図形データの塊とそのタグとを、テキストおよび／または図形等を含む複合データ形式に変換してもよい。

　また、図３に示すように、情報処理装置（コンピュータ）１００は、概略的に、画像入力デバイス（デジタルカメラ）２００と通信可能に接続され、入出力部１１２（タブレット一体型ディスプレイ１１２－４）と、を備えて構成されてもよい。例えば、本実施形態において、情報処理装置１００は、デジタルカメラ２００を筐体内部に内蔵し、一体型ディスプレイ（タッチパネル）１１２を備えた、近年普及しているカメラ付きタブレットＰＣとして構成されてもよい。

［本実施形態の処理］
　上述した構成の情報処理装置１００で実行される処理の一例について、図４乃至図２４を参照して説明する。

［メディア分離処理］
　まず、本実施形態におけるファイル一覧表示処理の一例について、図４乃至図１４を参照して説明する。図４は、本実施形態の情報処理装置１００における処理の一例を示すフローチャートである。

　図４に示すように、まず、図形認識処理部１０２ｃは、画像取得部１０２ａにより取得された手書画像から、文字でも線画でもない領域（非文字・非線画領域）を認識し、元の手書画像から非文字・非線画領域（例えば、写真または塗りつぶし領域等）と文字・線画画像とを分離する（ステップＳＡ－１）。

　ここで、本実施形態における非文字・非線画領域の分離方法としては、例えば、手書画像全体を二値化した後、各画素に対して線幅を測定し、線幅が閾値を越える領域、または、線幅の統計量（分散等）が閾値を越える領域を、非文字・非線画領域と認識し、手書画像から非文字・非線画領域を分離する（除く）ことで実現してもよい。

　そして、図形認識処理部１０２ｃは、分離した非文字・非線画領域に関するその他画像を取得し（ステップＳＡ－１：その他（写真、塗りつぶしなど））、処理を終了する。

　一方、図形認識処理部１０２ｃは、分離した文字・線画画像を取得し（ステップＳＡ－１：文字・線画画像）、処理をステップＳＡ－２に移行させる。

　ここで、図５を参照して本実施形態における非文字・非線画領域の一例について説明する。図５は、本実施形態における非文字・非線画領域の一例を示す図である。

　図５に示すように、本実施形態における非文字・非線画領域とは、点線で囲まれたような塗りつぶし領域であってもよい。

　図４に戻り、図形認識処理部１０２ｃは、文字・線画画像全体をベクトル化（ベクトルデータ化）することで、ベクトルデータを取得する（ステップＳＡ－２）。ここで、ベクトル化は、画像全体を細線化した後、細線化の点列を折れ線近似する方法を使用してもよい。例えば、ベクトル化は、田村秀行（監修）の「コンピュータ画像処理入門」および「コンピュータ画像処理：応用実践編２」（ともに総研出版）等に記載された手法を用いてもよい。

　そして、図形認識処理部１０２ｃは、ベクトルデータの追跡に基づいて、文字・線画画像から、ストローク抽出を行う（ステップＳＡ－３）。ここで、ストローク抽出は、ベクトルデータの追跡に基づくものであり、ベクトルの端点から追跡を開始して、ベクトルの分岐点では、最も角度の小さいペアを接続してもよい。これにより、ヒトが書いた手書線１本を、１本のストロークとして表すことができる。

　ここで、図６を参照して、本実施形態におけるストローク抽出の一例について説明する。図６は、本実施形態におけるストローク抽出の一例を示す図である。

　図６では、（１）－（４）の４本のストロークが抽出しており、ヒトが書いた横線に対応する（１）のストロークを抽出している。

　図４に戻り、図形認識処理部１０２ｃは、抽出したストロークのうち、文字サイズよりも大きいもの（長ストローク画像）を文字・線画画像から分離（長ストローク分離）する（ステップＳＡ－４）。これは、画像中で、文字と図形とが接触している場合に、文字を読み取るためである。このように、長い線分を分離（消去）することで、引き出し線または囲み枠と接触した文字を読み取ることが可能となる。

　そして、図形認識処理部１０２ｃは、分離した長ストローク画像を取得し（ステップＳＡ－４：長ストローク画像）、処理をステップＳＡ－７に移行させる。

　一方、図形認識処理部１０２ｃは、長ストローク画像を分離した長ストローク除去画像を取得し（ステップＳＡ－４：長ストローク除去画像）、処理をステップＳＡ－５に移行させる。

　ここで、図７を参照して、本実施形態における長ストローク分離の一例について説明する。図７は、本実施形態における長ストローク分離の一例を示す図である。

　図７左図に示す画像中の右端の縦線を長ストロークと見なし、図７右図に示すように、長ストローク画像を分離してもよい。ここで、長ストローク分離により、図形が文字と見なされるようになる場合があるが、このような図形は、文字認識処理の中でさらに判別を行って、図形であると認識し直してもよい。

　図４に戻り、図形認識処理部１０２ｃは、長ストローク除去画像に対し、ラベリングを行う（ステップＳＡ－５）。

　そして、図形認識処理部１０２ｃは、文字サイズ以下（小サイズ）とラベリングした孤立領域と、それ以外（小サイズ以外）とラベリングした領域とを別の画像に分離する（ステップＳＡ－６）。ここで、本実施形態において、文字サイズ（小サイズ）以下とラベリングした孤立領域が、手書文字の候補となるものであり、これを手書文字認識処理の入力としている。

　そして、図形認識処理部１０２ｃは、小サイズ以外とラベリングした領域を取得し（ステップＳＡ－６：小サイズ以外）、処理をステップＳＡ－７に移行させる。

　そして、図形認識処理部１０２ｃは、長ストローク画像、および、小サイズ以外とラベリングした領域に基づく画像を合成し（ステップＳＡ－７）、処理をステップＳＡ－１２に移行させる。

　一方、図形認識処理部１０２ｃは、小サイズとラベリングした孤立領域を取得し（ステップＳＡ－６：小サイズ（文字画像））、処理をステップＳＡ－８に移行させる。

　そして、図形認識処理部１０２ｃは、フリー手書文字認識処理において、小サイズとラベリングした孤立領域に対し、文字列抽出を行う（ステップＳＡ－８）。

　そして、図形認識処理部１０２ｃは、抽出した文字列に関する単純文字画像と、単純画像とを分離する（ステップＳＡ－９）。

　そして、図形認識処理部１０２ｃは、分離した単純画像を取得し（ステップＳＡ－９：単純画像）、処理をステップＳＡ－１２に移行させる。

　そして、図形認識処理部１０２ｃは、長ストローク画像および小サイズ以外とラベリングした領域に基づく画像と、単純画像とに基づく手書図形画像（図形画像）を合成し（ステップＳＡ－１２）、処理を終了する。

　一方、図形認識処理部１０２ｃは、分離した単純文字画像を取得し（ステップＳＡ－９：単純文字画像）、単純文字画像に対して文字認識を行う（ステップＳＡ－１０）。

　ここで、図８乃至図１０を参照して、本実施形態におけるユーザ文字認識の一例について説明する。図８乃至図１０は、本実施形態におけるユーザ文字認識の一例を示す図である。

　図８に示すように、画像表示部１０２ｂにより入出力部（タッチパネル）１１２に表示された手書画像に対して、ユーザは、認識したい手書画像の場所を指でなぞる。

　それにより、図９に示すように、画像表示部１０２ｂは、ユーザにより指でなぞられた領域にある手書画像の色を変更させる。そして、図形認識処理部１０２ｃは、認識箇所に対応する手書画像を手書文字画像と認定して、当該手書文字画像から手書文字を認識する。

　そして、図１０に示すように、画像表示部１０２ｂは、図形認識処理部１０２ｃにより認識された手書文字に関する文字データをタッチパネル１１２に表示させ、ユーザが問題ないと判断して領域内を指でタップした場合、図形認識処理部１０２ｃは、文字認識を確定させてもよい。

　また、ユーザが領域外をタップした場合、図形認識処理部１０２ｃは、文字認識をキャンセルしてもよい。このように、本実施形態においては、文字を再認識するときにＵＩを利用し、ユーザが指でなぞることで直感的に再認識を行うことを可能としている。

　図４に戻り、図形認識処理部１０２ｃは、単純文字画像に対する文字認識に基づいて、単純文字画像から非文字画像と手書文字画像（文字画像）との分離を行う（ステップＳＡ－１１）。

　そして、図形認識処理部１０２ｃは、分離した非文字画像を手書図形画像（図形画像）として取得し（ステップＳＡ－１１：非文字画像）、処理を終了する。

　一方、図形認識処理部１０２ｃは、分離した文字画像を最終的な文字認識結果として取得し（ステップＳＡ－１１：文字画像）、処理を終了する。このように、本実施形態においては、文字以外の画像の再分離を行ってもよい。

　ここで、図１１乃至図１４を参照して、本実施形態における手書文字認識の一例について説明する。図１１乃至図１４は、本実施形態における手書文字認識の一例を示す図である。

　図１１に示すように、長ストローク除去画像に対し、ラベリングすることにより、小サイズ（文字）とラベリングした領域と、それ以外（小サイズ以外）とラベリングした領域とを分離している。なお、図１１において、太字で表されている部分が、小サイズ（文字）とラベリングした領域である。

　そして、図１２に示すように、文字以外のものを誤読しないように、小サイズ（文字）とラベリングした領域（点線領域）に対して文字列抽出を行う。ここで、文字列抽出は、閾値以内の距離にあるラベルを統合する方法であってもよい。この際、元の画像にある円および罫線などを超えて統合しないようにすれば、誤統合を減らすことが可能となる。

　そして、図１３に示すように、文字数が１文字、且つ、１ストロークで表現できる文字（図１２の点線領域から点線を除去した領域）は、非文字と認識している。また、図１４に示すように、ＯＣＲ等の文字認識により、文字認識結果の得点が低く、明らかに文字ではないと判断されたもの（図１３の点線領域から点線を除去した領域）も、非文字と認識している。

［図形抽出処理］
　次に、本実施形態における図形抽出処理の一例について、図１５を参照して説明する。図１５は、本実施形態の情報処理装置１００における処理の一例を示すフローチャートである。

　図１５に示すように、まず、図形認識処理部１０２ｃは、図形画像をベクトル化（ベクトルデータ化）することで、ベクトルデータを取得する（ステップＳＢ－１）。

　そして、図形認識処理部１０２ｃは、ベクトルデータの追跡に基づいて、図形画像から、ストローク抽出を行う（ステップＳＢ－２）。

　そして、図形認識処理部１０２ｃは、ベクトルデータを使って直線の抽出を行う（ステップＳＢ－３）。ここで、図形認識処理部１０２ｃは、ベクトルデータの並びに対し最小二乗法をかけることで直線の判別を行うことで、直線の抽出を行ってもよい。

　そして、図形認識処理部１０２ｃは、更に、ベクトルデータを使って円の抽出を行うことで、図形データを取得し（ステップＳＢ－４）、処理を終了する。ここで、図形認識処理部１０２ｃは、ベクトルデータの並びに対し最小二乗法をかけることで円の判別を行うことで、円の抽出を行ってもよい。

［シンボル分離処理］
　更に、本実施形態におけるシンボル分離処理の一例について、図１６および図１７を参照して説明する。図１６は、本実施形態の情報処理装置１００における処理の一例を示すフローチャートである。

　図１６に示すように、まず、シンボル認識部１０２ｄは、図形認識処理部１０２ｃにより取得された図形データから、引き出し線図形データと引き出し線以外図形データとを分離する（ステップＳＣ－１）。

　そして、シンボル認識部１０２ｄは、分離した引き出し線図形データを、明らかにシンボル化する対象とならないもの、すなわち、シンボル以外の要素として取得し（ステップＳＣ－１：引き出し線）、処理を終了する。

　一方、シンボル認識部１０２ｄは、分離した引き出し線以外図形データを取得し（ステップＳＣ－１：引き出し線以外）、処理をステップＳＣ－２に移行させる。

　ここで、引き出し線の判別には、例えば、「１本のストロークで構成される」、「ストローク長が閾値以上」、または、「ストローク端の片方または両端が矢印となっている」という条件を使用して判別してもよい。ここで、矢印の判別には、例えば、ストローク先端に長さが閾値以内のベクトルがあり、且つ、ストローク先端となす角度が閾値以内のときに矢印の線と判別してもよい。

　ここで、図１７を参照して、本実施形態における引き出し線先端の矢印の判別の一例について説明する。図１７は、本実施形態における引き出し線先端の矢印の判別の一例を示す図である。

　図１７に示すように、本実施形態においては、引き出し線先端のベクトルデータを用いて、引き出し線と矢頭とのなす角度θ、および、矢頭の長さＬに基づいて、矢印の判別を行ってもよい。

　図１６に戻り、シンボル認識部１０２ｄは、引き出し線以外図形データにはその他の要素（表など）が書かれている場合もあるため、必要に応じてそれらの要素（その他要素）を認識し、その他要素と残り図形データとを分離する（ステップＳＣ－２）。

　そして、シンボル認識部１０２ｄは、分離したその他要素を、シンボル以外の要素として取得し（ステップＳＣ－２：その他要素）、処理を終了する。

　一方、シンボル認識部１０２ｄは、分離した残り図形データを取得し（ステップＳＣ－２：残り）、処理をステップＳＣ－３に移行させる。

　そして、シンボル認識部１０２ｄは、残り図形データに対し、ストロークごとに統合を繰り返すことで、残り図形データをグループ化（統合処理）する（ステップＳＣ－３）。ここで、統合処理は、閾値以内の距離にあるストローク同士を、グループ化したときの縦横サイズが上限を超えるまで結合していく方法であってもよい。また、本実施形態において、線画は、他の図形と接触することが多いため、ラベル単位ではなくストローク単位で結合してもよい。

　そして、シンボル認識部１０２ｄは、残り図形データのグループ化（統合処理）に成功した場合、グループ化した残り図形データをシンボル候補として取得し（ステップＳＣ－３：シンボル候補（グループ化した図形データ））、処理を終了する。

　一方、シンボル認識部１０２ｄは、残り図形データのグループ化（統合処理）に失敗した場合、グループ化に失敗した残り図形データをシンボル以外の要素として取得し（ステップＳＣ－３：統合失敗した要素）、処理を終了する。

　このように、本実施形態におけるシンボル分離処理では、まず与えられた図形画像の中から明らかにシンボルでないものを分離した後、文字列抽出と同様の手法でシンボルを構成する図形をグループ化してもよい。

［シンボル認識処理］
　更に、本実施形態におけるシンボル認識処理の一例について、図１８乃至図２４を参照して説明する。図１８は、本実施形態の情報処理装置１００における処理の一例を示すフローチャートである。

　図１８に示すように、シンボル認識部１０２ｄは、シンボル候補であるグループ化した残り図形データの特徴計算（特徴抽出）を行う（ステップＳＤ－１）。

　ここで、図１９を参照して、本実施形態における特徴抽出処理の一例について説明する。図１９は、本実施形態の情報処理装置１００における処理の一例を示すフローチャートである。

　図１９に示すように、まず、シンボル認識部１０２ｄは、グループ化した残り図形データに対して、ベクトルデータを使った傾き補正を行う（ステップＳＥ－１）。これにより、傾きの影響を抑えて精度を上げることができる。

　そして、シンボル認識部１０２ｄは、グループ化した残り図形データの外形サイズを正規化する（ステップＳＥ－２）。

　そして、シンボル認識部１０２ｄは、グループ化した残り図形データを画像に変換する（ステップＳＥ－３）。

　そして、シンボル認識部１０２ｄは、変換画像に対して特徴抽出を行い（ステップＳＥ－４）、処理を終了する。このように、本実施形態においては、図形データを画像に戻してマッチングしてもよい。

　図１８に戻り、シンボル認識部１０２ｄは、シンボル認識辞書データベース１０６ｂに記憶されたシンボル認識辞書（シンボルに関する情報）と、特徴計算で算出した特徴データと、の照合によるパターンマッチ処理を行う（ステップＳＤ－２）。なお、本実施形態においては、シンボルを１文字とみなし、文字認識と同様の距離計算を行ってもよい。

　ここで、図２０を参照して、本実施形態のシンボル認識（パターンマッチ）のための特徴データの一例について説明する。図２０は、本実施形態の特徴データの一例を示す図である。

　図２０に示すように、本実施形態における特徴データは、図形を構成する線分の長さを方向ごとに分けて特徴としたものであり、併せて、ベクトルの角度、交差点の数、および、含まれる円の数を特徴としている。ここで、本実施形態においては、これら特徴データに対して、シンボル認識辞書との距離計算を行い、もっとも近いものから順に結果としてもよい。

　また、図２１を参照して、本実施形態におけるシンボル認識辞書の一例について説明する。図２１は、本実施形態におけるシンボル認識辞書の一例を示す図である。

　図２１に示すように、本実施形態におけるシンボル認識辞書は、特徴データ、シンボル名称、および、シンボルカテゴリの３つの要素からなり、これを認識したいシンボルの数だけ登録している。ここで、本実施形態においては、シンボル認識の際、入力画像のシンボルから得られた特徴と、辞書に格納されている特徴すべてと距離計算を行い、距離の小さい順にシンボル名称を得てもよい。

　ここで、本実施形態における距離計算は、例えば、入力特徴と辞書特徴とのユークリッド距離を求めることで行ってもよい。この際、距離が閾値を越えるシンボルは、棄却し、距離が閾値以内のものだけを距離値の小さい順に並べてシンボル候補としてもよい。また、本実施形態においては、辞書に登録されている全てのシンボルの距離値が閾値を越える場合、合致するシンボル無しと見なしてもよい。

　また、特徴データは、グループ化した図形から求めた特徴であり、シンボル名称は、その図形の名称であり、シンボル認識の結果となるものであってもよい。また、シンボルカテゴリは、そのシンボルが使用される場面を現す情報であってもよい。ここで、本実施形態においては、認識した紙またはホワイトボードに対し、記入内容のカテゴリが与えられた場合、そのカテゴリをシンボルカテゴリに含むシンボルの順位を上げてもよい。これは、シンボル候補を求めた後、シンボルカテゴリへの合致数の多い順に再度ソートを行うことで実現できる。

　ここで、図２１に示すように、「カメラ」と「日の丸」とは同一の特徴を持つため、図形の情報だけでは区別が付かないが、カテゴリ情報がＩＴと与えられると、「カメラ」が「日の丸」より候補の上位になってもよい。本実施形態においては、このような方法を用いることにより、文字図形画像から、文字認識結果、図形抽出結果、および、シンボル認識結果を得ることができ、これにより元の文字図形画像の検索または編集が可能になる。

　図１８に戻り、シンボル認識部１０２ｄは、グループ化した残り図形データの近傍（周囲）に文字列（手書文字と認識された手書文字画像）がある場合、当該文字列を取り込み、および／または、認識対象（手書画像全体）から認識される手書文字のコンテキストを識別し、当該コンテキストを取り込む（ステップＳＤ－３）。

　そして、シンボル認識部１０２ｄは、取り込んだ文字列、および／または、コンテキストに基づいて、グループ化した残り図形データに当てはまるシンボルを１つ選択する最終判断を行うことで、シンボル認識結果を取得し（ステップＳＤ－４）、処理を終了する。

　例えば、本実施形態においては、手書図形である絵の近傍に「テレビ」という文字があれば、テレビの絵と見なしてもよい。また、本実施形態においては、文字を「テレビ」ではなく「テレヒ」または「テレービ」のように一部誤読していても、手書図形である絵が「テレビ」に類似していれば、文字を「テレビ」とみなし、かつ、手書図形をテレビの絵とみなしてもよい。これによって、文字または図形があいまいであっても、正しい文字およびシンボルを出力することができる。また、本実施形態においては、手書画像全体における文字認識結果において、医療用語が多ければ、医療関係のシンボルに絞り込んで識別してもよい。

　ここで、図２２を参照して、本実施形態におけるシンボル選択の一例について説明する。図２２は、本実施形態におけるシンボル選択の一例を示す図である。

　図２２に示すように、本実施形態においては、シンボル自動選択を行い、得られたシンボル認識結果（シンボルデータ）の候補のうち、１位候補（カメラ）が入力画像におけるシンボルであると自動認識してもよい。そして、図２２において、ユーザが意図しないシンボル認識結果（カメラ）が得られた場合、画面上に表示された他の候補（日の丸）を、ユーザが選択することで、自動認識結果を変更するようにしてもよい。

　このように、本実施形態においては、基本的なパターンマッチ処理を行い、図形が単純で、認識結果の候補が多数になった場合、絞込みを行うことによりグループ化した図形からシンボル認識を行ってもよい。これにより、あいまいな形であっても正しいシンボルを出力することができる。

　ここで、図２３および図２４を参照して、本実施形態におけるレイアウト変更の一例について説明する。図２３および図２４は、本実施形態におけるレイアウト変更の一例を示す図である。

　図２３に示す手書画像は、シンボル認識まで行っているため、抽出したシンボル毎に手書図形画像および／または手書文字画像がグループ化されている。それにより、図２４に示すように、パソコンの絵がユーザによりマウスでドラッグされた場合、パソコンの絵の手書図形画像だけを独立して移動させることができる。

　このように、本実施形態においては、画面上に表示された文字画像および／または図形画像をシンボル単位で移動させることができる。これにより、本実施形態においては、元の入力データのレイアウト変更が可能となる。ここで、本実施形態においては、ユーザ操作に連動させてベクトルデータを移動可能としてもよく、ベクトルデータに対応する元画像のイメージを求めることも容易であるので、イメージデータをシンボル単位で移動可能としてもよい。

　近年、情報入力ツールとして、スマートフォンまたはタブレットなどのオンライン入力は、広く普及しているが、紙またはホワイトボードへの手書き記入も、広く使われており、今後も活用されていくと予想される。

　しかしながら、従来、これら紙またはホワイトボードに書かれた情報の活用手段として、画像でキャプチャして保存する方法が一般的であった。したがって、画像での保存では、編集および検索等の利活用がしにくいため、紙またはホワイトボードに書かれた情報は、証拠保存としての意味しかなく、情報として活用がされていなかった。

　そこで、本実施形態においては、紙またはホワイトボードに記入された手書きの文字図形を活用するための新たな手段を提供することで、これまで活用できなかった情報の利活用を可能としている。

　また、従来、紙またはホワイトボードに手書きされた情報は、スキャナまたはカメラでイメージに変換することで電子的に保存することが一般的であり、検索のためにタグ付けするには、オペレータによる手作業が必要であった。

　そこで、本実施形態においては、文字と図形とを両方記入されたものから、手書文字の文字認識だけでなく、文字以外の記入内容についてもタグ付けした電子データに変換することで、従来技術の課題を解決している。例えば、本実施形態においては、車の絵とカメラの絵とが記入されたものから、「自動車」および「カメラ」を電子的に検索することができるようにしている。

　また、従来から、検索以外に、手書き記入の内容を元に新たな資料を作成したいという用途があったが、手書き記入の文字図形を編集可能な形式に変換する手段が存在しなかった。そこで、本実施形態においては、例えば、単に図形を円や直線などのプリミティブに変換することではなく、テレビなどの書かれている絵をひとつの塊として認識することができ、塊単位に移動や拡大縮小などができるようにする手段を提供している。

　また、本実施形態においては、キーボードおよびマウスが接続されないことが一般的な可搬型の端末（スマートフォンなど）において、乱雑な記入もある手書きの文字図形データに対して、キーボードおよびマウス無しに認識範囲をユーザが指定して認識させることができる。また、本実施形態においては、手書きの文字図形イメージを、人間が手作業で再作成するよりも効率的に、複合データ形式の電子データに変換できる。

　また、本実施形態においては、ユーザが検索文字列を指定することで、その文字列が含まれる手書文字図形イメージおよび該当箇所を検索することができる。これにより、本実施形態においては、記入された文字だけではなく、シンボルも検索対象とすることができ、文字図形イメージの活用範囲を広げることができる。

　また、本実施形態においては、手書きの文字図形イメージを、単に複合データ形式の電子データに変換できるだけではなく、文字図形データの組み合わせから、シンボルを自動認識し、これに意味を持たせ、図形データだけでも手書きの文字図形イメージの検索または分類仕分けを行うことができるようにしている。

［他の実施形態］
　さて、これまで本発明の実施形態について説明したが、本発明は、上述した実施形態以外にも、請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。

　例えば、情報処理装置１００は、スタンドアローンの形態で処理を行ってもよく、クライアント端末（情報処理装置１００とは別筐体である）からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。

　また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。

　このほか、明細書中および図面中で示した処理手順、制御手順、具体的名称、各処理の登録データもしくは検索条件等のパラメータを含む情報、画面例、または、データベース構成については、特記する場合を除いて任意に変更することができる。

　また、情報処理装置１００、および、画像入力デバイス２００に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。

　例えば、情報処理装置１００、および、画像入力デバイス２００の各装置が備える処理機能、特に制御部１０２にて行われる各処理機能については、その全部または任意の一部を、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）および当該ＣＰＵにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて情報処理装置１００に機械的に読み取られる。すなわち、ＲＯＭまたはＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）などの記憶部１０６などには、ＯＳ（Ｏｐｅｒａｔｉｎｇ　Ｓｙｓｔｅｍ）と協働してＣＰＵに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、ＲＡＭにロードされることによって実行され、ＣＰＵと協働して制御部を構成する。

　また、このコンピュータプログラムは、情報処理装置１００、および、画像入力デバイス２００に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。

　また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、ＵＳＢメモリ、ＳＤカード、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、および、Ｂｌｕ－ｒａｙ（登録商標）　Ｄｉｓｃ等の任意の「可搬用の物理媒体」を含むものとする。

　また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、ＯＳ（Ｏｐｅｒａｔｉｎｇ　Ｓｙｓｔｅｍ）に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。

　記憶部１０６に格納される各種のデータベース等（画像データベース１０６ａ、および、シンボル認識辞書データベース１０６ｂ）は、ＲＡＭもしくはＲＯＭ等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および／または、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および／または、ウェブページ用ファイル等を格納してもよい。

　また、情報処理装置１００は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、情報処理装置１００は、該情報処理装置に本発明の方法を実現させるソフトウェア（プログラム、データ等を含む）を実装することにより実現してもよい。

　更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。

　以上のように、本発明に係る手書図形画像から、シンボルを自動認識し、これに意味を持たせることで、手書図形画像の検索や分類仕分けを行うことができる情報処理装置、情報処理方法、および、プログラムは、産業上の多くの分野、特にスキャナまたはカメラで読み込んだ画像を扱う画像処理分野で実施することができ、極めて有用である。

　１００　情報処理装置
　１０２　制御部
　１０２ａ　画像取得部
　１０２ｂ　画像表示部
　１０２ｃ　図形認識処理部
　１０２ｄ　シンボル認識部
　１０２ｅ　シンボル候補表示部
　１０２ｆ　タグ付与部
　１０２ｇ　シンボル表示部
　１０２ｈ　検索部
　１０２ｉ　グループ化部
　１０２ｊ　編集部
　１０２ｋ　修正部
　１０２ｍ　変換部
　１０６　記憶部
　１０６ａ　画像データベース
　１０６ｂ　シンボル認識辞書データベース
　１１２　入出力部
　２００　画像入力デバイス
　３００　ネットワーク

Claims

　手書画像から、少なくとも手書図形を認識する図形認識処理手段と、
　前記図形認識処理手段により認識された前記手書図形に基づいて、当該手書図形に当てはまるシンボルを認識するシンボル認識手段と、
　前記シンボル認識手段により認識された前記シンボルに関するシンボル図形データに、当該シンボルを表すタグを付与するタグ付与手段と、
　前記シンボルに関する前記シンボル図形データ、および前記タグを表示させるシンボル表示手段と、
　を備えたことを特徴とする、情報処理装置。
　前記図形認識処理手段は、
　更に、前記手書画像から、手書文字を認識し、
　前記シンボル認識手段は、
　前記図形認識処理手段により認識された前記手書文字および前記手書図形に基づいて、当該手書図形に当てはまる前記シンボルを認識し、
　前記シンボル表示手段は、
　更に、前記手書文字に関する文字データを表示させる、請求項１に記載の情報処理装置。
　キーワードに基づいて、前記文字データ、および／または、前記シンボルを表す前記タグを検索する検索手段、
　を更に備えた、請求項２に記載の情報処理装置。
　前記手書画像を表示させる画像表示手段、
　を更に備え、
　前記図形認識処理手段は、
　前記画像表示手段により表示された前記手書画像に対して所定操作により認識範囲が決定された場合、当該認識範囲に対応する前記手書画像を手書文字画像と認定して、当該手書文字画像から前記手書文字を認識する、請求項２または３に記載の情報処理装置。
　前記シンボル表示手段により表示された前記シンボルに係る前記文字データと、前記シンボルに関する前記シンボル図形データと、に基づいて構成されるグループにグループ化するグループ化手段と、
　前記グループの各構成に対して編集指示が入力された場合、前記グループ単位で編集を行う編集手段と、
　を更に備えた、請求項２乃至４のいずれか一つに記載の情報処理装置。
　前記手書画像を表示させる画像表示手段、
　を更に備え、
　前記画像表示手段により表示された前記シンボルに係る前記手書文字に関する手書文字画像と、前記シンボルに対応する前記手書図形に関する手書図形画像と、に基づいて構成されるグループにグループ化するグループ化手段と、
　前記グループの各構成に対して編集指示が入力された場合、前記グループ単位で編集を行う編集手段と、
　を更に備えた、請求項２または３に記載の情報処理装置。
　前記シンボル認識手段は、
　前記図形認識処理手段により認識された前記手書図形に基づいて、当該手書図形に当てはまる複数のシンボル候補を取得し、前記複数のシンボル候補から１つの前記シンボル候補を選択して、当該シンボル候補を前記シンボルと認識する、請求項１乃至６のいずれか一つに記載の情報処理装置。
　前記シンボル認識手段により取得された複数の前記シンボル候補を表示させるシンボル候補表示手段、
　を更に備え、
　前記シンボル認識手段は、
　前記シンボル候補表示手段により表示された前記複数のシンボル候補から１つの前記シンボル候補が選択された場合、選択された前記シンボル候補を前記シンボルと認識する、請求項７に記載の情報処理装置。
　前記シンボル表示手段により表示された前記シンボル図形データ、および／または、前記タグに対して、修正指示が入力された場合、当該修正指示に基づいて、前記シンボル図形データ、および／または、前記タグを修正する修正手段、
　を更に備えた、請求項１乃至８のいずれか一つに記載の情報処理装置。
　前記シンボルに関する前記シンボル図形データ、および／または、前記タグを、複合データ形式に変換する変換手段、
　を更に備えた、請求項１乃至９のいずれか一つに記載の情報処理装置。
　前記図形認識処理手段は、
　前記手書画像の部分画像が手書文字画像か手書図形画像か判別できない場合、前記部分画像を複数の単純画像に分離し、周辺に前記手書文字と認識されるものが無い前記単純画像、および、前記部分画像に対して文字認識を実行して明らかに文字と認識できない前記部分画像を、前記手書図形画像とみなし、判別済みの前記手書図形画像に結合し、結合画像から前記手書図形を認識する、請求項１または２に記載の情報処理装置。
　前記シンボル認識手段は、
　前記図形認識処理手段により前記手書画像全体から認識された前記手書文字のコンテキストを識別することで、当該手書図形に当てはまるシンボルを認識する、請求項２乃至６のいずれか一つに記載の情報処理装置。
　前記シンボル認識手段は、
　前記図形認識処理手段により前記手書図形と認識された手書図形画像周囲に、前記手書文字と認識された手書文字画像がある場合、前記手書文字に基づいて、当該手書図形に当てはまるシンボルを認識する、請求項２に記載の情報処理装置。
　前記検索手段は、
　前記キーワードが指定された場合、当該キーワードに基づいて、前記文字データ、および／または、前記シンボルを表す前記タグを検索する、請求項３に記載の情報処理装置。
　前記シンボル毎に特徴データ、名称、および、カテゴリデータを含むシンボル認識辞書を記憶するシンボル認識辞書記憶手段、
　を更に備え、
　前記シンボル認識手段は、
　前記図形認識処理手段により認識された前記手書図形に基づいて、当該手書図形に当てはまる複数の前記シンボル候補を取得し、前記シンボル認識辞書記憶手段に記憶された前記シンボル認識辞書に基づいて、前記複数のシンボル候補から１つの前記シンボル候補を選択して、当該シンボル候補を前記シンボルと認識する、請求項７に記載の情報処理装置。
　手書画像から、少なくとも手書図形を認識する図形認識処理ステップと、
　前記図形認識処理ステップにて認識された前記手書図形に基づいて、当該手書図形に当てはまるシンボルを認識するシンボル認識ステップと、
　前記シンボル認識ステップにて認識された前記シンボルに関するシンボル図形データに、当該シンボルを表すタグを付与するタグ付与ステップと、
　前記シンボルに関する前記シンボル図形データ、および、前記タグを表示させるシンボル表示ステップと、
　を含むことを特徴とする、情報処理方法。
　手書画像から、少なくとも手書図形を認識する図形認識処理ステップと、
　前記図形認識処理ステップにて認識された前記手書図形に基づいて、当該手書図形に当てはまるシンボルを認識するシンボル認識ステップと、
　前記シンボル認識ステップにて認識された前記シンボルに関するシンボル図形データに、当該シンボルを表すタグを付与するタグ付与ステップと、
　前記シンボルに関する前記シンボル図形データ、および、前記タグを表示させるシンボル表示ステップと、
　を実行させるためのプログラム。