JP2015099566A - 特徴算出装置、方法及びプログラム - Google Patents

特徴算出装置、方法及びプログラム Download PDF

Info

Publication number
JP2015099566A
JP2015099566A JP2013240278A JP2013240278A JP2015099566A JP 2015099566 A JP2015099566 A JP 2015099566A JP 2013240278 A JP2013240278 A JP 2013240278A JP 2013240278 A JP2013240278 A JP 2013240278A JP 2015099566 A JP2015099566 A JP 2015099566A
Authority
JP
Japan
Prior art keywords
stroke
strokes
feature
peripheral
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013240278A
Other languages
English (en)
Inventor
雄土 山地
Yuto Yamaji
雄土 山地
智行 柴田
Satoyuki Shibata
智行 柴田
洋次郎 登内
Yojiro Touchi
洋次郎 登内
三原 功雄
Isao Mihara
功雄 三原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013240278A priority Critical patent/JP2015099566A/ja
Priority to US14/546,930 priority patent/US20150139547A1/en
Priority to CN201410664412.5A priority patent/CN104657071A/zh
Publication of JP2015099566A publication Critical patent/JP2015099566A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction

Abstract

【課題】ストロークが属するクラスに関する特徴量に、ストロークに固有の特徴量を用いることができる特徴算出装置、方法及びプログラムを提供する。【解決手段】実施形態の特徴算出装置は、取得部と、第1算出部と、抽出部と、第2算出部と、統合部と、を備える。取得部は、ユーザが手書きした複数のストロークを取得する。第1算出部は、ストローク毎に、当該ストロークの特徴に関するストローク特徴量を算出する。抽出部は、ストローク毎に、複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する。第2算出部は、ストローク毎に、当該ストロークと1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する。統合部は、ストローク毎に、ストローク特徴量と組合せ特徴量とを統合した統合特徴量を生成する。【選択図】図1

Description

本発明の実施形態は、特徴算出装置、方法及びプログラムに関する。
ユーザが手書きすることで順次入力されるストロークの集合を空間的又は時間的まとまりで構造化し、構造化した構造単位で、当該構造に帰属するストロークが属するクラス(例えば、文字を構成する文字ストロークであるか図形などの非文字を構成する非文字ストロークであるかなど)を識別する技術が知られている。
特許第4745758号公報
Akshay Bhat, Tracy Hammond: "Using entropy to distinguish shape versus text in hand-drawn diagrams", IJCAI'09 Proceedings of the 21st international jont conference on Artifical intelligence, 2009.
しかしながら、上述したような従来技術では、ストロークが属するクラスの識別に、当該ストロークが帰属する構造の特徴を利用しており、当該ストロークに固有の特徴を利用しているわけではない。
本発明が解決しようとする課題は、ストロークが属するクラスに関する特徴量に、ストロークに固有の特徴量を用いることができる特徴算出装置、方法及びプログラムを提供することである。
実施形態の特徴算出装置は、取得部と、第1算出部と、抽出部と、第2算出部と、統合部と、を備える。取得部は、ユーザが手書きした複数のストロークを取得する。第1算出部は、前記ストローク毎に、当該ストロークの特徴に関するストローク特徴量を算出する。抽出部は、前記ストローク毎に、前記複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する。第2算出部は、前記ストローク毎に、当該ストロークと前記1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する。統合部は、前記ストローク毎に、前記ストローク特徴量と前記組合せ特徴量とを統合した統合特徴量を生成する。
第1実施形態の特徴算出装置の例を示す構成図。 第1実施形態のストローク特徴量の例の説明図。 第1実施形態のストロークの方向密度ヒストグラムの例を示す図。 第1実施形態のウィンドウを用いたストローク抽出手法の例の説明図。 第1実施形態のウィンドウを用いたストローク抽出手法の例の説明図。 第1実施形態のウィンドウの形状及びサイズの例の説明図。 第1実施形態のウィンドウの形状及びサイズの例の説明図。 第1実施形態のウィンドウの形状及びサイズの例の説明図。 第1実施形態のウィンドウの形状及びサイズの例の説明図。 第1実施形態のフィルタリング手法の例の説明図。 第1実施形態のフィルタリング手法の例の説明図。 第1実施形態の形状の類似度の算出手法の例の説明図。 第1実施形態の形状の類似度の算出手法の例の説明図。 第1実施形態の特定値の例の説明図。 第1実施形態の識別処理例を示すフローチャート図。 第2実施形態の特徴算出装置の例を示す構成図。 第2実施形態の学習処理例を示すフローチャート図。 第3実施形態の特徴算出装置の例を示す構成図。 第4実施形態の特徴算出装置の例を示す構成図。 各実施形態及び変形例の特徴算出装置のハードウェア構成例を示す図。
以下、添付図面を参照しながら、実施形態を詳細に説明する。
(第1実施形態)
図1は、第1実施形態の特徴算出装置10の一例を示す構成図である。図1に示すように、特徴算出装置10は、入力部11と、取得部13と、ストローク記憶部15と、第1算出部17と、抽出部19と、第2算出部21と、統合部23と、辞書データ記憶部25と、識別部27と、出力部29とを、備える。
入力部11は、例えば、タッチパネル、タッチパッド、マウス、及び電子ペンなどの手書き入力可能な入力装置により実現できる。取得部13、第1算出部17、抽出部19、第2算出部21、統合部23、識別部27、及び出力部29は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。ストローク記憶部15及び辞書データ記憶部25は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、ROM(Read Only Memory)、及びRAM(Random Access Memory)などの磁気的、光学的、又は電気的に記憶可能な記憶装置により実現できる。
入力部11は、ユーザが手書きしたストロークを特徴算出装置10に順次入力することで、複数のストロークを特徴算出装置10に入力する。複数のストロークは、例えば、ユーザが手書きした文字や非文字(例えば、図形等)などのデータである手書きデータが該当する。
第1実施形態では、入力部11はタッチパネルであり、ユーザがスタイラスペンや指を用いてタッチパネル上で文字や図形を手書きすることにより、複数のストロークを入力することを想定しているが、これに限定されるものではない。例えば、入力部11をタッチパッド、マウス、及び電子ペンなどで実現してもよい。
ストロークは、ユーザが手書した文字や図形などの1画、即ち、スタイラスペンや指がタッチパネルの入力面に接してから離れるまで(ペンダウンからペンアップまで)の軌跡を示すデータであり、例えば、スタイラスペンや指と入力面との接点の時系列の座標値として表すことができる。
例えば、複数のストロークが第1ストローク〜第3ストロークである場合、第1ストロークは{(x(1,1),y(1,1))、(x(1,2),y(1,2))、…、(x(1,N(1)),y(1,N(1)))}、第2ストロークは{(x(2,1),y(2,1))、(x(2,2),y(2,2))、…、(x(2,N(2)),y(2,N(2)))}、第3ストロークは{(x(3,1),y(3,1))、(x(3,2),y(3,2))、…、(x(3,N(3)),y(3,N(3)))}と表すことができる。N(i)は、第iストロークのサンプリング時のサンプリング点数を示す。
なお、入力部11は、複数のストロークが記述されるページ(タッチパネルの表示面に表示されたページ)のページ情報を、複数のストロークそれぞれに付与して特徴算出装置10に入力してもよい。ページ情報は、例えば、ページを識別するページ識別情報などが該当する。
取得部13は、入力部11から入力された複数のストロークを取得し、ストローク記憶部15に記憶する。
第1算出部17は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、当該ストロークの特徴に関するストローク特徴量を算出する。例えば、第1算出部17は、特徴算出装置10が有する図示せぬアプリケーションなどにより、統合特徴量算出命令が発行されると、ストローク記憶部15に記憶された複数のストロークを順次取得し、ストローク毎にストローク特徴量を算出する。なお、ストローク記憶部15に記憶されたストロークにページ情報が付与されている場合、アプリケーションは、ページ単位で統合特徴量算出命令を発行することが可能である。
ストローク特徴量は、詳細には、ストロークの形状に関する特徴量であり、例えば、長さ、曲率総和、主成分方向、外接矩形面積、外接矩形長、外接矩形縦横比、始点・終点距離、方向密度ヒストグラム、及び屈曲点数などの少なくともいずれかが挙げられる。
図2は、第1実施形態のストローク特徴量の一例の説明図である。図2では、ストローク50の形状を例にとり、ストローク50のストローク特徴量を説明する。なお、ストローク50は、単一(一画)のストロークである。
長さは、ストローク50の場合、ストローク50の長さである。曲率総和は、ストローク50の場合、ストローク50の曲率の総和である。主成分方向は、ストローク50の場合、方向51である。外接矩形面積は、ストローク50の場合、外接矩形52の面積である。外接矩形長は、ストローク50の場合、外接矩形52の長さである。外接矩形縦横比は、ストローク50の場合、外接矩形52の縦横比である。始点・終点距離は、ストローク50の場合、始点53から終点54の直線距離である。屈曲点数は、ストローク50の場合、屈曲点55〜58の数、即ち、4点である。方向密度ヒストグラムは、ストローク50の場合、図3に示すヒストグラムである。
第1実施形態では、第1算出部17は、取得部13により取得されたストローク毎に、当該ストロークの形状の1以上の特徴量を算出し、算出した1以上の特徴量を並べた特徴量ベクトルをストローク特徴量とするものとするが、これに限定されるものではない。
なお第1算出部17は、ストローク特徴量を算出する前に、ストロークを一定の座標の数で表現するようにリサンプリングしてもよい。また第1算出部17は、ストロークを分割し、分割したストロークの各々について、ストローク特徴量を算出してもよい。ストロークの分割には、例えば、屈曲点などを利用すればよい。
また第1算出部17は、算出したストローク特徴量を正規化してもよい。例えば、第1算出部17は、ストローク特徴量として長さを算出している場合、算出した複数のストロークの長さのうちの最大値又は中央値などで、複数のストロークそれぞれの長さを除算し、ストローク特徴量を正規化してもよい。なお、この正規化手法は、長さ以外のストローク特徴量の正規化にも適用できる。また例えば、第1算出部17は、ストローク特徴量として外接矩形面積を算出している場合、算出した複数のストロークの外接矩形面積の総和を算出し、算出した外接矩形面積の総和を外接矩形面積(ストローク特徴量)の正規化に用いてもよい。なお、この正規化手法は、外接矩形面積だけでなく、外接矩形長や外接矩形縦横比などの正規化にも適用できる。
抽出部19は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、取得部13により取得された複数のストローク(ストローク記憶部15に記憶された複数のストローク)から当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する。例えば、抽出部19は、前述の図示せぬアプリケーションなどにより、統合特徴量算出命令が発行されると、ストローク記憶部15に記憶された複数のストロークを順次取得し、ストローク毎に1以上の周辺ストロークを抽出する。
1以上の周辺ストロークは、例えば、複数のストロークのうち対象ストロークとの距離が所定距離内の1以上のストロークである。対象ストロークとは、複数のストロークのうち1以上の周辺ストロークを抽出する対象となるストロークである。距離は、空間的距離及び時系列的距離の少なくとも一方であればよい。
例えば、抽出部19は、距離が空間的距離の場合、対象ストロークを包含するウィンドウを生成し、1以上の周辺ストロークとして、複数のストロークのうち当該ウィンドウに含まれる1以上のストロークを抽出する。なお抽出部19は、ストロークの一部でもウィンドウに含まれていれば、当該ストロークを抽出する。
図4及び図5は、第1実施形態のウィンドウを用いたストローク抽出手法の一例の説明図であり、図4はストローク抽出前、図5はストローク抽出後を示す。図4に示す例では、抽出部19が、対象ストローク61を中心にウィンドウ63を生成しており、ストローク64〜66のうちストローク64、65がウィンドウ63内に含まれている。このため、図5に示すように、抽出部19は、対象ストローク61の1以上の周辺ストロークとして、ストローク64、65を抽出している。
図4及び図5に示す例では、ウィンドウの形状を円としたが、これに限定されず、矩形としてもよいし、対象ストロークの形状に基づく形状としてもよい。
また抽出部19は、ウィンドウのサイズを固定サイズとしてもよいし、対象ストロークのサイズ、対象ストロークが存在するページ(対象ストロークが記述されるページ)のサイズ、又は複数のストロークの外接矩形の合計サイズに基づいて、ウィンドウのサイズを決定してもよい。
図6〜図9は、第1実施形態のウィンドウの形状及びサイズの一例の説明図である。例えば、抽出部19は、図6に示すように、ストローク71の各々の座標をストローク71の外側へN1倍膨張させた形状81をウィンドウとしてもよい。また例えば、抽出部19は、図7に示すように、ストローク71の外接矩形72を、N2倍拡大させた形状82をウィンドウとしてもよいし、N3ピクセル拡大した形状82をウィンドウとしてもよい。また例えば、抽出部19は、図8に示すように、取得部13により取得された複数のストロークの外接矩形面積の総和75をN4倍縮小した形状85をウィンドウとしてもよい。また例えば、抽出部19は、図9に示すように、複数のストロークが記述されるページ76のページサイズをN4倍縮小した形状86をウィンドウとしてもよい。この場合、特徴算出装置10は、ページ76のページサイズを予め記憶しているものとする。
また抽出部19は、ウィンドウの中心座標が、対象ストロークの重心点、対象ストロークの始点、対象ストロークの終点、又は対象ストロークの外接矩形の中心点に一致するように、ウィンドウを生成してもよい。
また抽出部19は、対象ストロークの近傍空間を複数に分割し、分割した複数の近傍空間それぞれにウィンドウを生成してもよいし、対象ストロークを構成する座標それぞれにウィンドウを生成してもよい。
また抽出部19は、対象ストロークに対し、サイズの異なる複数のウィンドウを生成してもよい。
また例えば、抽出部19は、距離が空間的距離の場合、対象ストロークと複数のストロークそれぞれとの空間的距離を算出し、1以上の周辺ストロークとして、複数のストロークの中から対象ストロークとの空間的距離が短い順にN本のストロークを抽出するようにしてもよい。この場合、空間的距離は、例えば、ストローク間の重心距離や端点距離などが挙げられる。
また例えば、抽出部19は、距離が時系列的距離の場合、1以上の周辺ストロークとして、複数のストロークの中から対象ストロークを基準に一定秒数内に特徴算出装置10に入力されたストロークを抽出するようにしてもよい。
また例えば、抽出部19は、距離が時系列的距離の場合、対象ストロークと複数のストロークそれぞれとの時系列的距離を算出し、1以上の周辺ストロークとして、複数のストロークの中から対象ストロークとの時系列的距離が短い順にN本のストロークを抽出するようにしてもよい。
また例えば、抽出部19は、領域基準、空間的距離基準、又は時系列的距離に基づいて、複数のストロークをグループ化し、1以上の周辺ストロークとして、対象ストロークが含まれるグループのストロークを抽出するようにしてもよい。
なお抽出部19は、上述した抽出手法を組み合わせて1以上の周辺ストロークを抽出してもよい。例えば、抽出部19は、複数のストロークから時系列的距離の手法でストロークを抽出した後に、当該抽出したストロークから空間的距離の手法でストロークを更に抽出することで1以上の周辺ストロークを抽出してもよいし、複数のストロークから空間的距離の手法でストロークを抽出した後に、当該抽出したストロークから時系列的距離の手法でストロークを更に抽出することで1以上の周辺ストロークを抽出してもよい。また例えば、抽出部19は、時系列的距離の手法と空間的距離の手法を併用し、時系列的距離の手法で抽出したストロークと空間的距離の手法で抽出したストロークとを、1以上の周辺ストロークとしてもよい。
また抽出部19は、上述した抽出手法で抽出したストロークをフィルタリングしたものを1以上の周辺ストロークとしてもよい。
例えば抽出部19は、1以上の周辺ストロークとして、複数のストロークの中から、対象ストロークとの距離が所定距離内かつ対象ストロークとの形状の類似度が閾値以上の1以上のストロークを抽出してもよい。つまり、抽出部19は、複数のストロークの中から対象ストロークとの距離が所定距離内のストロークを抽出し、抽出したストロークを対象ストロークとの形状の類似度でフィルタリングしたものを1以上の周辺ストロークとしてもよい。
形状の類似度は、例えば、両ストロークの長さの類似度、主成分方向の類似度、曲率の類似度、外接矩形面積の類似度、外接矩形長の類似度、屈曲点数の類似度、及び方向角度密度ヒストグラムの類似度などの少なくともいずれかが挙げられる。
図10及び図11は、第1実施形態のフィルタリング手法の一例の説明図であり、図10はフィルタリング前、図11はフィルタリング後を示す。図10に示す例では、抽出部19が、対象ストローク91を中心にウィンドウ92を生成しており、ストローク93〜95がウィンドウ92内に含まれている。なお、対象ストローク91、ストローク94、95は、文字を構成する文字ストロークであり、ストローク93は、図形など文字以外を構成する非文字ストロークである。また、ストローク94、95では、説明の便宜上、単一の文字ストロークではなく、複数の文字ストロークに対し、符号を付しているが、対象ストローク91との類所度の算出は、ストローク94、95の各ストロークに対して行われる。
一般的に、文字ストローク同士は類似度が高く、文字ストロークと非文字ストロークとは類似度が低くなるため、この場合、抽出部19は、図11に示すように、対象ストローク91の1以上の周辺ストロークとして、ストローク93〜95のうち、対象ストローク91との類似度が閾値以上のストローク94、95をフィルタリングして抽出する。
このように、対象ストロークとの形状の類似度でフィルタリングして1以上の周辺ストロークを抽出すれば、1以上の周辺ストロークに対象ストロークが属するクラスと異なるクラスのストロークが混在してしまうことが防ぎやすくなる。クラスは、文字、図、表、絵(例えば、ラフスケッチ)、及びその他の少なくともいずれかが挙げられるが、少なくとも文字と非文字とを大別できればよい。
第2算出部21は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、当該ストローク(対象ストローク)と抽出部19により抽出された1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する。
組合せ特徴量は、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの関係を示す第1特徴量を含む。また、組合せ特徴量は、対象ストロークの形状に関する特徴量と1以上の周辺ストロークそれぞれの形状に関する特徴量との総和である総和値を用いた第2特徴量を含む。
第1特徴量は、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの形状の類似度、及び対象ストロークと1以上の周辺ストロークの少なくともいずれかとの位置関係を特定する特定値の少なくとも一方である。
形状の類似度は、例えば、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの長さ、曲率総和、主成分方向、外接矩形面積、外接矩形長、外接矩形縦横比、始点・終点距離、方向密度ヒストグラム、及び屈曲点数の少なくともいずれかの類似度である。つまり、形状の類似度は、例えば、対象ストロークのストローク特徴量と1以上の周辺ストロークの少なくともいずれかのストローク特徴量との類似度とすることができる。
例えば、第2算出部21は、対象ストロークのストローク特徴量と1以上の周辺ストロークそれぞれのストローク特徴量とを、除算したり、減算したりするなど比較して、1以上の形状の類似度を算出する。
図12及び図13は、第1実施形態の形状の類似度の算出手法の一例の説明図である。図12に示すように、対象ストローク103の周辺ストロークが、周辺ストローク101、102、104であるとする。この場合、第2算出部21は、図13に示すように、対象ストローク103のストローク特徴量と周辺ストローク101、102、104それぞれのストローク特徴量とを比較して、対象ストローク103のストローク特徴量と周辺ストローク101、102、104それぞれのストローク特徴量との形状の類似度を算出する。
特定値は、例えば、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの外接矩形の重なり率、重心距離、重心距離の方向、端点距離、端点距離の方向、及び交差点数の少なくともいずれかである。
図14は、第1実施形態の特定値の一例の説明図である。図14では、対象ストローク111と周辺ストローク121を例にとり、対象ストローク111と周辺ストローク121との特定値を説明する。
外接矩形の重なり率は、対象ストローク111及び周辺ストローク121の場合、対象ストローク111の外接矩形112の面積と周辺ストローク121の外接矩形122の面積との総和に対する外接矩形112と外接矩形122との重複部分の面積の割合である。重心距離は、対象ストローク111及び周辺ストローク121の場合、対象ストローク111の重心点113と周辺ストローク121の重心点123との直線距離であり、重心距離の方向は、当該直線距離の方向である。端点距離は、対象ストローク111及び周辺ストローク121の場合、対象ストローク111の端点114と周辺ストローク121の端点124との直線距離であり、端点距離の方向は、当該直線距離の方向である。交差点数は、対象ストローク111及び周辺ストローク121の場合、交差点131の数、即ち、1点である。
第1実施形態では、第2算出部21は、対象ストロークの第1特徴量を算出する場合、周辺ストローク毎に当該対象ストロークとの形状の類似度及び特定値の組を算出し、算出した周辺ストローク数分の形状の類似度及び特定値の組を第1特徴量とするものとするが、第1特徴量は、これに限定されるものではない。
例えば、第1特徴量を、周辺ストローク数分の形状の類似度及び特定値の組のうちの一定数としてもよいし、最大値の組としてもよいし、最小値の組としてもよいし、中央値の組としてもよいし、周辺ストローク数分の組の総和としてもよい。
なお、抽出部19が対象ストロークに対し複数のウィンドウを生成し、ウィンドウ毎に1以上の周辺ストロークを抽出している場合、1の周辺ストロークに対し、類似度及び特定値の組が複数算出される場合がある。この場合、第2算出部21は、複数の組の平均値を用いてもよいし、複数の組それぞれに重み付けを行い、重み付け後の複数の組の平均値を用いてもよい。例えば、サイズの異なる複数のウィンドウそれぞれで1以上の周辺ストロークを抽出している場合、第2算出部21は、サイズの小さいウィンドウで抽出された周辺ストローク程、重みを大きくすれば、対象ストロークに近い周辺ストロークを重視した形状の類似度及び特定値の組とすることができる。
第2特徴量は、例えば、組合せの外接矩形長に対する対象ストロークの長さと1以上の周辺ストロークそれぞれの長さとの総和の比、対象ストローク及び1以上の周辺ストロークの方向密度ヒストグラムの総和値、及び組合せの外接矩形面積に対する対象ストロークの外接矩形面積と1以上の周辺ストロークそれぞれの外接矩形面積との総和の比の少なくともいずれかである。
なお、抽出部19が対象ストロークに対し複数のウィンドウを生成し、ウィンドウ毎に1以上の周辺ストロークを抽出している場合、1の周辺ストロークに対し、複数の長さ、複数の方向密度ヒストグラム、又は複数の外接矩形面積が算出される場合がある。この場合、第2算出部21は、複数の長さそれぞれ、複数の方向密度ヒストグラムそれぞれ、又は複数の外接矩形面積それぞれに重み付けを行い、重み付け後の複数の長さ、複数の方向密度ヒストグラム、又は複数の外接矩形面積の平均値を用いてもよい。例えば、サイズの異なる複数のウィンドウそれぞれで1以上の周辺ストロークを抽出している場合、第2算出部21は、サイズの小さいウィンドウで抽出された周辺ストローク程、重みを大きくすれば、対象ストロークに近い周辺ストロークを重視した長さ、方向密度ヒストグラム、又は外接矩形面積とすることができる。
第1実施形態では、第2算出部21は、対象ストローク毎に、算出した第1特徴量と第2特徴量とを並べた特徴量ベクトルを組合せ特徴量とするものとするが、これに限定されるものではない。
統合部23は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、第1算出部17により算出されたストローク特徴量と第2算出部21により算出された組合せ特徴量とを統合した統合特徴量を生成する。
第1実施形態では、統合部23は、ストローク特徴量と組合せ特徴量とを並べた特徴量ベクトルを統合特徴量とするものとするが、これに限定されるものではない。
辞書データ記憶部25は、辞書データを記憶する。辞書データは、複数のサンプルストロークの統合特徴量とクラス毎の正解データとを用いて学習された学習結果であり、複数のサンプルストロークの統合特徴量それぞれがいずれのクラスに属するかを示す。クラスは、前述したとおり、文字、図、表、絵、及びその他の少なくともいずれかが挙げられるが、少なくとも文字と非文字とを大別できればよい。
識別部27は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、統合部23により統合された統合特徴量を用いて、当該ストロークが属するクラスを識別する。具体的には、識別部27は、辞書データ記憶部25から辞書データを読み込み、読み込んだ辞書データ及び統合部23により統合された統合特徴量を用いて、ストロークが属するクラスを識別する。識別部27は、例えば、ニューラルネットワーク(多層パーセプトロン)、サポートベクターマシーン、及びAdaBoostなどの識別器により実現できる。
出力部29は、識別部27の識別結果、即ち、ストロークが属するクラスを出力する。
図15は、第1実施形態の特徴算出装置10で行われる識別処理の手順の流れの一例を示すフローチャート図である。
まず、取得部13は、入力部11から入力された複数のストロークを取得し、ストローク記憶部15に記憶する(ステップS101)。
続いて、第1算出部17は、ストローク記憶部15に記憶されたストローク毎に、当該ストロークの特徴に関するストローク特徴量を算出する(ステップS103)。
続いて、抽出部19は、ストローク記憶部15に記憶されたストローク毎に、ストローク記憶部15に記憶された複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する(ステップS105)。
続いて、第2算出部21は、ストローク記憶部15に記憶されたストローク毎に、当該ストロークと抽出部19により抽出された1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する(ステップS107)。
続いて、統合部23は、ストローク記憶部15に記憶されたストローク毎に、第1算出部17により算出されたストローク特徴量と第2算出部21により算出された組合せ特徴量とを統合した統合特徴量を生成する(ステップS109)。
続いて、識別部27は、ストローク記憶部15に記憶されたストローク毎に、統合部23により統合された統合特徴量を用いて、当該ストロークが属するクラスを識別する(ステップS111)。
続いて、出力部29は、識別部27の識別結果、即ち、ストロークが属するクラスを出力する(ステップS113)。
以上のように第1実施形態では、ストロークの特徴量として、ストロークの特徴に関するストローク特徴量と、当該ストロークの周囲に存在する1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量と、を統合した統合特徴量を算出する。
ここで、組合せ特徴量は、当該ストロークに固有の特徴量であるが、当該ストロークだけでなく、1以上の周辺ストロークの特徴も加味されたものであるため、当該ストロークが属するクラスに関する特徴量として利用できる。
このため第1実施形態によれば、ストロークが属するクラスに関する特徴量に、ストロークに固有の特徴量を用いることができる。
また第1実施形態によれば、統合特徴量、即ち、ストロークに固有の特徴量を用いてストロークが属するクラスの識別を行うため、クラスの識別精度を向上させることができる。
従って、第1実施形態の特徴算出装置10を、例えば、ユーザが手書きした手書き図形が、文字、図形、表、及び絵などのいずれであるかを識別して、整形する整形装置などに適用すると、識別精度を向上させた整形装置の提供が可能となる。
(第2実施形態)
第2実施形態では、統合特徴量を用いて学習する例について説明する。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
図16は、第2実施形態の特徴算出装置210の一例を示す構成図である。図16に示すように、第2実施形態の特徴算出装置210は、識別部27及び出力部29を備えず、正解データ記憶部233及び学習部235を備える点で、第1実施形態と相違する。
正解データ記憶部233は、クラス毎の正解データを記憶する。
学習部235は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、統合部23により統合された統合特徴量を用いて、当該ストロークが属するクラスを学習する。具体的には、学習部235は、正解データ記憶部233から正解データを読み込み、読み込んだ正解データ及び統合部23により統合された統合特徴量を用いて、当該ストロークが属するクラスを学習し、学習結果を辞書データ記憶部25に記憶する。
なお、学習部235の学習手法には、公知の学習手法を用いることがきる。例えば、学習結果(辞書データ)を用いる識別器がニューラルネットワークであれば、学習部235は、誤差逆伝搬法によって学習を行うことができる。
図17は、第2実施形態の特徴算出装置210で行われる学習処理の手順の流れの一例を示すフローチャート図である。
まず、ステップS201〜ステップS209までの処理は、図15に示すフローチャートのステップS101〜ステップS109までの処理と同様である。
続いて、学習部235は、ストローク記憶部15に記憶されたストローク毎に、統合部23により統合された統合特徴量を用いて、当該ストロークが属するクラスを学習し(ステップS211)、学習結果を辞書データ記憶部25に記憶する(ステップS213)。
第2実施形態によれば、統合特徴量、即ち、ストロークに固有の特徴量を用いてストロークが属するクラスの学習を行うため、クラスの学習精度を向上させることができる。
(第3実施形態)
第3実施形態では、周辺ストロークを抽出する際に文書情報も抽出し、組合せ特徴量に抽出した文書情報も含める例について説明する。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
図18は、第3実施形態の特徴算出装置310の一例を示す構成図である。図18に示すように、第3実施形態の特徴算出装置310は、文書データ記憶部318、抽出部319、及び第2算出部321が、第1実施形態と相違する。
なお、第3実施形態では、ユーザは、白紙のページに対してストロークを入力するのではなく、文書情報が記述されたページに対してストロークを入力するものとする。
文書データ記憶部318は、文書データを記憶する。文書データは、ページに記述された文書情報であり、例えば、文字情報、図表情報、及びレイアウト情報などを含む。なお、文書データが画像データである場合は、OCR(Optical Character Reader)などを用いて文書情報を復元しておけばよい。なお、文書データは、動画データなど他のコンテンツデータであってもよい。
抽出部319は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出するとともに、当該ストロークの周囲に存在する文書情報を抽出する。
第2算出部321は、取得部13により取得されたストローク毎(ストローク記憶部15に記憶されたストローク毎)に、当該ストローク(対象ストローク)、抽出部319により抽出された1以上の周辺ストローク、及び抽出部319により抽出された文書情報の組合せの特徴に関する組合せ特徴量を算出する。
一般的に、文書に手書きで情報を加える場面では、強調部分や修正部分を指示する記号(丸囲い、下線引き、引き出し線、挿入記号、及び取り消し線など)などの非文字ストロークは、文書の情報にかぶせるように手書きされ、コメントや注釈などの文字ストロークは、読み取りやすいように空白部分に手書きされる。このため識別部27は、辞書データを用いた識別結果に加え、上述したような内容(ストロークが文字領域に存在するか、空白領域に存在するかなど)を更に加味して、ストロークが属するクラスを識別すればよい。
従って、第3実施形態の特徴算出装置310を、例えば、ストロークを強調部分や修正部分など意味ごとに識別し、表示に反映させる情報処理装置などに適用すると、識別精度を向上させた情報処理装置の提供が可能となる。
(第4実施形態)
第4実施形態では、周辺ストロークを抽出する際に文書情報も抽出し、組合せ特徴量に抽出した文書情報も含める例について説明する。以下では、第2実施形態との相違点の説明を主に行い、第2実施形態と同様の機能を有する構成要素については、第2実施形態と同様の名称・符号を付し、その説明を省略する。
図19は、第4実施形態の特徴算出装置410の一例を示す構成図である。図19に示すように、第4実施形態の特徴算出装置410は、文書データ記憶部318、抽出部319、及び第2算出部321が、第2実施形態と相違する。
但し、文書データ記憶部318、抽出部319、及び第2算出部321については、第3実施形態で説明したとおりなので、ここでは、説明を省略する。
(変形例)
上記各実施形態では、特徴算出装置がストローク記憶部及び辞書データ記憶部などの各記憶部を備える例について説明したが、これに限定されるものではなく、例えば、クラウド上に設けるなど、特徴算出装置の外部に設けるようにしてもよい。
また、上記各実施形態を適宜組み合わせるようにしてもよい。例えば、上記第1実施形態と上記第2実施形態とを組み合わせてもよいし、上記第3実施形態と上記第4実施形態とを組み合わせてもよい。
(ハードウェア構成)
図20は、上記各実施形態及び変形例の特徴算出装置のハードウェア構成の一例を示す図である。上記各実施形態及び変形例の特徴算出装置は、CPUなどの制御装置901と、ROMやRAMなどの記憶装置902と、HDDなどの外部記憶装置903と、ディスプレイなどの表示装置904と、キーボードやマウスなどの入力装置905と、通信インタフェースなどの通信装置906と、を備えており、通常のコンピュータを利用したハードウェア構成となっている。
上記各実施形態及び変形例の特徴算出装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
また、上記各実施形態及び変形例の特徴算出装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記各実施形態及び変形例の特徴算出装置で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、上記各実施形態及び変形例の特徴算出装置で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。
上記各実施形態及び変形例の特徴算出装置で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、CPUがHDDからプログラムをRAM上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
なお、本発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。
例えば、上記各実施形態のフローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更し、複数同時に実施し、あるいは実施毎に異なった順序で実施してもよい。
以上のように、上記各実施形態及び変形例によれば、ストロークが属するクラスに関する特徴量に、ストロークに固有の特徴量を用いることができる。
例えば、これまで確率伝搬(HMM)や、構造とし用いるストロークなどから関係性を記述していた。例えば、単一のストロークに固有(特に形状)の特徴量を用いる手法(参考:Distinguishing Text from Graphics in On-line Handwritten Ink, bishop et al.)などもその一例である。これらに対し、ストローク固有の特徴量に加え、周辺に存在するストロークを含めた特徴量を用いることが可能になり、より識別性を有することが可能になる。また、ストローク間の関係性を連続的に記述して、当該ストロークの識別にその関係性が用いることができる。
10、210、310,410 特徴算出装置
11 入力部
13 取得部
15 ストローク記憶部
17 第1算出部
19、319 抽出部
21、321 第2算出部
23 統合部
25 辞書データ記憶部
27 識別部
29 出力部
233 正解データ記憶部
235 学習部
318 文書データ記憶部

Claims (20)

  1. ユーザが手書きした複数のストロークを取得する取得部と、
    前記ストローク毎に、当該ストロークの特徴に関するストローク特徴量を算出する第1算出部と、
    前記ストローク毎に、前記複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する抽出部と、
    前記ストローク毎に、当該ストロークと前記1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する第2算出部と、
    前記ストローク毎に、前記ストローク特徴量と前記組合せ特徴量とを統合した統合特徴量を生成する統合部と、
    を備える特徴算出装置。
  2. 前記組合せ特徴量は、前記ストロークと前記1以上の周辺ストロークの少なくともいずれかとの関係を示す第1特徴量を含む請求項1に記載の特徴算出装置。
  3. 前記第1特徴量は、前記ストロークと前記1以上の周辺ストロークの少なくともいずれかとの形状の類似度、及び前記ストロークと前記1以上の周辺ストロークの少なくともいずれかとの位置関係を特定する特定値の少なくとも一方である請求項2に記載の特徴算出装置。
  4. 前記形状の類似度は、前記ストロークと前記1以上の周辺ストロークの少なくともいずれかとの長さ、曲率総和、主成分方向、外接矩形面積、外接矩形長、外接矩形縦横比、始点・終点距離、方向密度ヒストグラム、及び屈曲点数の少なくともいずれかの類似度である請求項3に記載の特徴算出装置。
  5. 前記特定値は、前記ストロークと前記1以上の周辺ストロークの少なくともいずれかとの外接矩形の重なり率、重心距離、重心距離の方向、端点距離、端点距離の方向、及び交差点数の少なくともいずれかである請求項3に記載の特徴算出装置。
  6. 前記組合せ特徴量は、前記ストロークの形状に関する特徴量と前記1以上の周辺ストロークそれぞれの形状に関する特徴量との総和である総和値を用いた第2特徴量を含む請求項1に記載の特徴算出装置。
  7. 前記第2特徴量は、前記組合せの外接矩形長に対する前記ストロークの長さと前記1以上の周辺ストロークそれぞれの長さとの総和の比、前記ストローク及び前記1以上の周辺ストロークの方向密度ヒストグラムの総和値、及び前記組合せの外接矩形面積に対する前記ストロークの外接矩形面積と前記1以上の周辺ストロークそれぞれの外接矩形面積との総和の比の少なくともいずれかである請求項6に記載の特徴算出装置。
  8. 前記1以上の周辺ストロークは、前記複数のストロークのうち前記ストロークとの距離が所定距離内の1以上のストロークである請求項1に記載の特徴算出装置。
  9. 前記距離は、空間的距離及び時系列的距離の少なくとも一方である請求項8に記載の特徴算出装置。
  10. 前記抽出部は、前記距離が空間的距離の場合、前記ストロークを包含するウィンドウを生成し、前記1以上の周辺ストロークとして、前記複数のストロークのうち前記ウィンドウに含まれる1以上のストロークを抽出する請求項9に記載の特徴算出装置。
  11. 前記抽出部は、前記ストロークのサイズ、前記ストロークが存在するページのサイズ、又は前記複数のストロークの外接矩形の合計サイズに基づいて、前記ウィンドウのサイズを決定する請求項10に記載の特徴算出装置。
  12. 前記抽出部は、領域基準、空間的距離基準、又は時系列的距離に基づいて、前記複数のストロークをグループ化し、前記1以上の周辺ストロークとして、前記ストロークが含まれるグループのストロークを抽出する請求項1に記載の特徴算出装置。
  13. 前記1以上の周辺ストロークは、前記複数のストロークのうち前記ストロークとの距離が所定距離内、かつ前記ストロークとの形状の類似度が閾値以上の1以上のストロークである請求項1に記載の特徴算出装置。
  14. 前記ストローク特徴量は、前記ストロークの形状に関する特徴量である請求項1に記載の特徴算出装置。
  15. 前記ストローク毎に、前記統合特徴量を用いて、当該ストロークが属するクラスを識別する識別部を更に備える請求項1に記載の特徴算出装置。
  16. 前記クラスは、文字、図、表、絵、及びその他の少なくともいずれかである請求項15に記載の特徴算出装置。
  17. 前記ストローク毎に、前記統合特徴量を用いて、当該ストロークが属するクラスを学習する学習部を更に備える請求項1に記載の特徴算出装置。
  18. 前記抽出部は、前記ストローク毎に、前記複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出するとともに当該ストロークの周囲に存在する文書情報を抽出し、
    前記組合せ特徴量は、前記ストローク、前記1以上の周辺ストローク、及び前記文書情報の組合せの特徴に関する特徴量である請求項1に記載の特徴算出装置。
  19. ユーザが手書きした複数のストロークを取得する取得ステップと、
    前記ストローク毎に、当該ストロークの特徴に関するストローク特徴量を算出する第1算出ステップと、
    前記ストローク毎に、前記複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する抽出ステップと、
    前記ストローク毎に、当該ストロークと前記1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する第2算出ステップと、
    前記ストローク毎に、前記ストローク特徴量と前記組合せ特徴量とを統合した統合特徴量を生成する統合ステップと、
    を含む特徴算出方法。
  20. ユーザが手書きした複数のストロークを取得する取得ステップと、
    前記ストローク毎に、当該ストロークの特徴に関するストローク特徴量を算出する第1算出ステップと、
    前記ストローク毎に、前記複数のストロークから当該ストロークの周囲に存在する1以上の周辺ストロークを抽出する抽出ステップと、
    前記ストローク毎に、当該ストロークと前記1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出する第2算出ステップと、
    前記ストローク毎に、前記ストローク特徴量と前記組合せ特徴量とを統合した統合特徴量を生成する統合ステップと、
    をコンピュータに実行させるためのプログラム。
JP2013240278A 2013-11-20 2013-11-20 特徴算出装置、方法及びプログラム Pending JP2015099566A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013240278A JP2015099566A (ja) 2013-11-20 2013-11-20 特徴算出装置、方法及びプログラム
US14/546,930 US20150139547A1 (en) 2013-11-20 2014-11-18 Feature calculation device and method and computer program product
CN201410664412.5A CN104657071A (zh) 2013-11-20 2014-11-19 特征计算装置以及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013240278A JP2015099566A (ja) 2013-11-20 2013-11-20 特徴算出装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2015099566A true JP2015099566A (ja) 2015-05-28

Family

ID=53173380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013240278A Pending JP2015099566A (ja) 2013-11-20 2013-11-20 特徴算出装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US20150139547A1 (ja)
JP (1) JP2015099566A (ja)
CN (1) CN104657071A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015141260A1 (ja) * 2014-03-17 2015-09-24 株式会社河合楽器製作所 手書き音楽記号認識装置およびプログラム
US9361515B2 (en) * 2014-04-18 2016-06-07 Xerox Corporation Distance based binary classifier of handwritten words
JP6352695B2 (ja) * 2014-06-19 2018-07-04 株式会社東芝 文字検出装置、方法およびプログラム
JP2018022343A (ja) * 2016-08-03 2018-02-08 株式会社東芝 画像処理装置、および画像処理方法
US10573033B2 (en) * 2017-12-19 2020-02-25 Adobe Inc. Selective editing of brushstrokes in a digital graphical image based on direction

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6694056B1 (en) * 1999-10-15 2004-02-17 Matsushita Electric Industrial Co., Ltd. Character input apparatus/method and computer-readable storage medium
JP3974359B2 (ja) * 2000-10-31 2007-09-12 株式会社東芝 オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
JP4560062B2 (ja) * 2007-03-29 2010-10-13 株式会社東芝 筆跡判定装置、方法およびプログラム
CN101354749B (zh) * 2007-07-24 2013-01-09 夏普株式会社 字典制作方法、手写输入方法和设备
CN101290659B (zh) * 2008-05-29 2011-06-01 宁波新然电子信息科技发展有限公司 基于组合分类器的手写识别方法
CN103080878B (zh) * 2010-08-24 2017-03-29 诺基亚技术有限公司 用于将重叠手写的笔画分割成一组或多组的方法和装置
CN102208039B (zh) * 2011-06-01 2013-02-20 汉王科技股份有限公司 一种多语言混合手写文本行的识别方法及装置

Also Published As

Publication number Publication date
CN104657071A (zh) 2015-05-27
US20150139547A1 (en) 2015-05-21

Similar Documents

Publication Publication Date Title
US10664695B2 (en) System and method for managing digital ink typesetting
Namboodiri et al. Online handwritten script recognition
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
Al-Helali et al. Arabic online handwriting recognition (aohr) a survey
US9904847B2 (en) System for recognizing multiple object input and method and product for same
CN108701215B (zh) 用于识别多对象结构的系统和方法
US11687618B2 (en) System and method for processing text handwriting in a free handwriting mode
JP5717691B2 (ja) 手書き文字検索装置、方法及びプログラム
CN108369637B (zh) 用于美化数字墨水的系统和方法
JP2015099566A (ja) 特徴算出装置、方法及びプログラム
CN114365075A (zh) 用于选择图形对象的方法和对应装置
Halder et al. Content independent writer identification on Bangla Script: a document level approach
Sen et al. Application of structural and topological features to recognize online handwritten Bangla characters
JP2013246732A (ja) 手書き文書検索装置、方法及びプログラム
EP3491580A1 (en) System and method for beautifying superimposed digital ink
JP2007188512A (ja) 文字認識方法、文字認識プログラム及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US11393231B2 (en) System and method for text line extraction
Singh et al. A bilingual (Gurmukhi-Roman) online handwriting identification and recognition system
US20230096728A1 (en) System and method for text line and text block extraction
JP7448132B2 (ja) 手書きの構造分解
Hakro et al. A Study of Sindhi Related and Arabic Script Adapted languages Recognition
CN115311674A (zh) 手写处理方法、装置、电子设备和可读存储介质
JP6582464B2 (ja) 情報入力装置、およびプログラム
CN107912062B (zh) 叠覆手写的系统和方法
JP6030172B2 (ja) 手書き文字検索装置、方法及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102