JP5455546B2 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP5455546B2
JP5455546B2 JP2009240635A JP2009240635A JP5455546B2 JP 5455546 B2 JP5455546 B2 JP 5455546B2 JP 2009240635 A JP2009240635 A JP 2009240635A JP 2009240635 A JP2009240635 A JP 2009240635A JP 5455546 B2 JP5455546 B2 JP 5455546B2
Authority
JP
Japan
Prior art keywords
information
determined
vowel
analysis
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009240635A
Other languages
English (en)
Other versions
JP2011086248A (ja
Inventor
智宏 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009240635A priority Critical patent/JP5455546B2/ja
Publication of JP2011086248A publication Critical patent/JP2011086248A/ja
Application granted granted Critical
Publication of JP5455546B2 publication Critical patent/JP5455546B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置及び情報処理方法に関する。
近年、デジタルカメラ及びマルチメディア制作ソフトの普及に伴い、プロだけでなく、一般的な人でも撮影した写真を使用して観賞価値の高いマルチメディアデータに変換することが可能になっている。この作業を行う際、ユーザーは、マルチメディア制作ソフトに対して何らかの指示を出し、撮影した写真をユーザーの意図したマルチメディアデータに変換を行っている(特許文献1参照)。
特開2007−96816号公報
しかしながら、従来のマルチメディア制作ソフトがユーザーから受け付ける指示は複雑であり、一般的な人がマルチメディア制作ソフトを使いこなすことは難しかった。また、従来のマルチメディア制作ソフトで制作されたマルチメディアデータは、製作者の意図が入りすぎることにより、一般的な人がマルチメディアデータを制作した場合、観賞価値が低くなることがあった。
本発明はこのような問題点に鑑みなされたもので、複雑な作業を行わなくても、観賞価値の高いマルチメディアデータを制作可能にすることを目的とする。
そこで、本発明の情報処理装置は、入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析手段と、前記解析手段で決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析手段で決定された母音情報に対応する子音情報を決定し、前記解析手段で決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定手段と、前記決定手段で決定した語句を前記人物画像に付加する付加手段と、を有する。
本発明によれば、複雑な作業を行わなくても、観賞価値の高いマルチメディアデータを制作可能にすることができる。
フォトアルバムプリントシステムのシステム構成の一例を示す図である。 PCのハードウェア構成の一例を示す図である。 フォトアルバムプリントシステムの機能構成の一例を示す図である。 画像編集処理の一例を示すフローチャートである。 ステップ301の解析処理により生成された人物−母音テーブルの一例を示す図である。 ステップ302の決定処理により生成された人物−言葉テーブルの一例を示す図である。 ステップ301の解析処理の詳細を示すフローチャートである。 唇の形から母音判定を行なう処理の一例を示すフローチャートである。 比率情報テーブルの一例を示す図である。 母音発音時の唇の形と、唇を含む口の縦の長さ/唇を含まない口の縦の長さ/口の横の長さと、の関係を示す図である。 ステップ302の決定処理の一例を示すフローチャートである。 子音推定テーブルの一例を示す図である。 語句変換処理の一例を示すフローチャートである。 修飾文字数決定用テーブルの一例を示す図である。 修飾文字決定用テーブルの一例を示す図である。 ステップ303の付加処理の一例を示すフローチャートである。 ステップ1106を説明するための図である。 ステップ301の解析処理の一例を示すフローチャートである。 人物情報テーブルの一例を示す図である。 ステップ302の決定処理の一例を示すフローチャートである。 語句推定テーブルの一例を示す図である。 人物‐語句テーブルの一例を示す図である。 ステップ302の決定処理の一例を示すフローチャートである。 ステップ1706、1707の処理に使用するユーザーインターフェースの一例を示す図である。 語句集の一例を示す図である。
以下、本発明の実施形態について図面に基づいて説明する。
<実施形態1>
図1は、フォトアルバムプリントシステムのシステム構成の一例を示す図である。
本実施形態では、フォトアルバムプリントシステムは、PC1台(101)と、プリンタ1台(102)との構成となっているが、分散出力等を考え、複数のプリンタを含むよう構成してもよい。また、複数のPCからジョブを受け付け、1つのプリンタ上でフォトアルバムとして仕立て、出力する形式としてもよい。さらに以下に示す実施形態の処理はPC側で行うことも、プリンタ側で行うこともできる。なお、PC及びプリンタは、情報処理装置(コンピュータ)の一例である。
次に、PCのハードウェア構成について図2を用いて説明する。
図2は、PCのハードウェア構成の一例を示す図である。
PCのハードウェアは、様々な接続方法や、様々なバスやインターフェースを有した構成が一般に知られており、ここで紹介するハードウェア構成は一例である。
点線で囲まれた部分がマザーボードであり、CPUは、キャッシュメモリを介してノースブリッジ、サウスブリッジと通信しながら、このPCのソフトウェア全体を制御している。ここで、ノースブリッジとサウスブリッジとのデータのやり取りやPC内部でのデータ一次保存のためメモリ(RAM)が使用されている。
次にノースブリッジは、汎用PCIバスを持っており、オプション(後付け)でSCSI外部装置等を接続することができる。ノースブリッジは、ディスプレイを表示させるためのグラフィックコントローラにも接続されている。
更に、サウスブリッジは、別の汎用PCIバスを持っており、こちらには、NICを介してネットワーク接続が可能となっている。また、サウスブリッジは、IDEバスも持っており、PCの制御ソフトウェアを初め、様々なデータを格納しておくハードディスクドライブ(HDD)が接続される。また、サウスブリッジには、PCのインストール時等のデータ読み出しや大量データのデータ保存(アーカイブ)等に役立つCD−ROM(又は、CD−R、CD−R/W)ドライブ等が接続される。また、USBポートは、USBメモリに代表されるUSB外部装置にアクセスすることが可能になる。
そして、I/O部を経由してキーボードやマウス或いは、フレキシブルディスク(F/Dドライブ)につながって、データの入出力を行うこともできる。
PCのCPUは、プログラムに基づき処理を実行することによってPCの機能、又はPCが後述する処理を実行するとした場合の、後述するフローチャートの各ステップに係る処理が実行される。
なお、後述するフォトアルバムプリントシステムの機能及び後述するフローチャートの各ステップに係る処理は、PCのCPUがプログラムに基づき処理を実行することによって実現されるものとして説明する。しかしながら、上述したように、プリンタのCPUがプリンタのメモリ等の記憶装置に記憶されているプログラムに基づき処理を実行することによって、以下の機能及び処理が実現されてもよい。
図3は、フォトアルバムプリントシステムの機能構成の一例を示す図である。画像入力部2001は、フォトアルバムに使用する画像の入力を受け付ける。画像編集部2002は、画像の編集処理をする。画像レイアウト部2003は、画像群をアルバム上にレイアウトする処理を行う。レイアウト表示部2004は、画像レイアウト部2003でレイアウトされたフォトアルバムをモニタに表示する。出力部2005は、レイアウト処理の終わったフォトアルバムデータの出力を行う。
本実施形態は画像編集部2002に関するものであり、画像編集部2002内の処理についてのみ言及する。
図4は、画像編集処理の一例を示すフローチャートである。CPUが、この図4に示すフローチャートの処理を1枚以上の写真画像に施し、フォトアルバム用のコメント付き画像を生成し、コメント付き画像をレイアウトして、プリントするのが本実施形態である。
ステップ301の解析処理では、CPUは、人物画像を入力として受け取り、1枚の画像中の人物一人一人に対して母音情報を算出する。図5は、ステップ301の解析処理により生成された人物−母音テーブルの一例を示す図である。なお、人物−母音テーブルは、例えば、RAMに作成される。
ステップ302の決定処理では、CPUは、ステップ301の解析処理の結果、生成された人物−母音情報テーブルを基に、各人物に対して言葉を推定する。図6は、ステップ302の決定処理により生成された人物−言葉テーブルの一例を示す図である。なお、人物−言葉テーブルは、例えば、RAMに作成される。
ステップ303の付加処理では、CPUは、ステップ302の決定処理で生成された人物−言葉テーブルを基に、各人物に対して言葉画像を付加する。
次にステップ301の解析処理の詳細を説明する。図7は、ステップ301の解析処理の詳細を示すフローチャートである。
まず、CPUは、人物画像入力で人物の入った画像入力を受け付ける(ステップ601)。次に、CPUは、画像中の人数計算を行う(ステップ602)。画像中の人数計算では、CPUは、画像中の顔の数を検出して計算する。画像中における顔の検出方法については様々な方法が考えられるが、例えばCPUは、特開2002−183731号公報、特開2004−062565号公報に開示されている技術を用いることができる。
画像中の人数計算を行った後は、CPUは、母音判定処理の終わっていない1つの顔領域を人物画像中より取得し(ステップ603)、その人物に対して人物IDを付加し(ステップ604)、その唇領域を抜き出す(ステップ605)。CPUは、人物IDを、ID同士が衝突しないように割振る。例えば、CPUは、衝突が起きないという保証が得られるまでIDをインクリメントする等して、IDを割振る。
次に、CPUは、唇の形から母音判定を行い、母音情報を決定する(ステップ606)。母音判定処理については後述する。次に、CPUは、ステップ604で算出した人物IDと、ステップ606で決定した母音情報と、を関連付けて人物母音テーブル(図5)に格納する(ステップ607)。
次に、CPUは、ステップ602で求めた人数から処理した人数を引き、0より大きい場合は(ステップ608においてyes)、ステップ603の処理へ戻り、0の場合は(ステップ608においてno)、ステップ301の解析処理を終了する。
次に母音判定処理の一例を説明する。図8は、唇の形から母音判定を行なう処理の一例を示すフローチャートである。
まず、CPUは、ステップ605で取得した唇領域から、唇を含む口の縦の長さXと、唇を含まない口の縦の長さYと、口の横の長さZと、を求める(ステップ2101)。次に、CPUは、予め内部データとして記憶しているテンプレートとなる母音発音時の、唇を含む口の縦の長さと、唇を含まない口の縦の長さと、口の横の長さと、の比率情報を比率情報テーブルから取得する。図9は、比率情報テーブルの一例を示す図である。比率情報テーブルは、例えばHDD等に格納されている。図10は、母音発音時の唇の形と、唇を含む口の縦の長さ/唇を含まない口の縦の長さ/口の横の長さと、の関係を示す図である。2301が唇を含む口の縦の長さであり、2302が唇を含まない口の縦の長さであり、2303が口の横の長さである。母音"a"の比率をXa:Ya:Zaとすると、比較対照の唇の形と、"a"発音時のテンプレートと、の類似度Saを、CPUは、
√(X/Y − Xa/Ya)2+(Y/Z − Ya/Za)2+(Z/X − Za/Xa)2
の式で求めることができる。同様にCPUは、類似度Si,Su,Se,Soを求め(ステップ2102)、値の一番小さい類似度を求め、その類似度を計算するのに使用した母音を近似母音とする(ステップ2103)。
次にステップ302の決定処理の詳細を説明する。図11は、ステップ302の決定処理の一例を示すフローチャートである。まず、CPUは、ステップ301の解析処理で生成した人物‐母音テーブルを取得する(ステップ701)。次に、CPUは、母音情報から子音情報を求める子音推定テーブルを取得する(ステップ702)。ここで、図12は、子音推定テーブルの一例を示す図である。母音情報と子音情報とが対応付けられた子音推定テーブルは、子音情報推定データの一例であり、例えばHDD等に格納されている。子音推定テーブルは、ある母音に対して何%の確率で子音が選択されるかを示したテーブルである。図12の例では、母音"a"が入力された場合、2%の確率で"K"が、1%の確率で"S"が、5%の確率で"T"が(後省略)母音の後にくる子音として選択されることを示している。
次に、CPUは、ステップ701で取得した人物‐母音テーブルから話し言葉変換処理を行っていない列を一列、取得する(ステップ703)。次に、CPUは、ステップ703で取得した人物‐母音テーブルの一列から取得した母音情報と、ステップ702で取得した子音推定テーブルと、に基づいて、前記母音情報に対応する子音(子音情報)を決定する(ステップ704)。次に、CPUは、母音情報と、ステップ704で決定した子音情報と、を使用して語句に変換する(ステップ705)。語句に変換する処理は後述する。
次に、CPUは、ステップ703で取得した人物‐母音テーブルの一列から取得した人物IDと、ステップ705で取得した語句と、を人物‐語句テーブル(図6)に保存する(ステップ706)。次に、CPUは、人物‐母音テーブルの全ての列を処理したかどうかを確認し、全ての列の処理が終わっていない場合(ステップ707においてno)、ステップ703へ戻る。CPUは、人物‐母音テーブルの全ての列の処理が終わった場合(ステップ707においてyes)、ステップ302の決定処理を終える。
次にステップ705の語句変換処理の詳細を説明する。図13は、語句変換処理の一例を示すフローチャートである。
まず、CPUは、ステップ704で使用した母音情報と、ステップ704で決定した子音情報と、から文字を生成する(ステップ801)。次に、CPUは、図14に示す修飾文字数決定用テーブルを取得する(ステップ802)。図14は、修飾文字数決定用テーブルの一例を示す図である。修飾文字数決定用テーブルは、例えばHDD等に格納されている。修飾文字数決定用テーブルは、ステップ801で生成した文字に対し、最終的に生成する語句の文字数を決定するための確率を示したテーブルである。ここで、語句とは、一文字、又は複数文字の意味をなさない文字列等を含む。図14の例の場合、文字が"あ"の場合、58%の確率で3文字の語句を生成することを示している。
CPUは、ステップ801で生成した文字と、ステップ802で取得した修飾文字数決定用テーブルと、に基づいて、修飾文字数を決定する(ステップ803)。
次に、CPUは、修飾文字決定用テーブルを取得する(ステップ804)。図15は、修飾文字決定用テーブルの一例を示す図である。修飾文字決定用テーブルは、例えばHDD等に格納されている。修飾文字決定用テーブルは、各文字の次に来る文字の確率を示したテーブルである。図15の例の場合、"あ"の次には7%の確率で"!"が選ばれることを示している。テーブル中の"End"は、語句の終わりを示す。
次に、CPUは、ステップ801で生成した文字と、ステップ804で取得した装飾文字決定用テーブルと、を使用して修飾文字を決める(ステップ805)。CPUは、決定した修飾文字の文字数がステップ802で決定した文字数以内である場合、もしくは修飾文字決定用テーブルで"End"以外が選択された場合(ステップ806においてyes)、ステップ805の処理を繰り返す。CPUは、決定した修飾文字の文字数がステップ802で決定した文字数になった場合、もしくはステップ805で"End"が選択された場合(ステップ806においてno)、ステップ705の語句変換処理を終了する。
次にステップ303の付加処理の詳細を説明する。図16は、ステップ303の付加処理の一例を示すフローチャートである。まず、CPUは、ステップ301の解析処理で解析した画像と同じ画像を取得する(ステップ1101)。次に、CPUは、ステップ302の決定処理で生成した人物‐語句テーブルを取得する(ステップ1102)。次に、CPUは、人物‐語句テーブルから付加処理を行なっていない人物IDを取得する(1103)。
次に、CPUは、ステップ1101で取得した画像から、ステップ1103で取得した人物IDと合致する人物を選び出し、選び出した人物の口元領域の座標を得る(ステップ1104)。人物IDと合致する人物を画像から選び出す方法は、上述のステップ603及びステップ604処理と同じ処理を行えば、間違いなく該当する人物を選び出せる。
次に、CPUは、処理を行なっている人物IDに対する言葉が、既に処理済の人物IDの言葉と同じかどうかを人物‐言葉テーブルを用いて判定する(ステップ1105)。既に処理済の人物IDの語句と異なる場合(ステップ1105においてno)、CPUは、語句を入れた吹き出し画像を生成し、顔領域と重ならないように吹き出し画像を合成する位置を決める(ステップ1107)。また、CPUは、吹き出しから吹出し元を口元近くに来るように吹き出し画像を変形する(ステップ1107)。そして、CPUは、吹き出し画像をステップ1101で取得した画像に合成する(ステップ1107)。吹き出しを生成し合成する技術は、例えば特開2007−4677公報に開示されている技術等を用いることができる。既に処理済の人物IDの語句と同じ場合(ステップ1105においてyes)、CPUは、既に画像に合成された同じ語句の吹き出しから吹出し元を処理中の人物IDの口元にも向けるようにする(ステップ1106)。図17は、ステップ1106を説明するための図である。
次に、CPUは、人物‐語句テーブルにまだ処理の終わっていない人物IDがあるかを確認する(ステップ1108)。CPUは、ある場合(ステップ1108においてyes)、ステップ1103へ戻り、無い場合(ステップ1108においてno)、ステップ303の付加処理を終了する。
以上、本実施形態によれば、複雑な作業を行わなくても、観賞価値の高いマルチメディアデータを制作可能にすることができる。
<実施形態2>
本実施形態のハードウェア構成、システム構成は実施形態1と同じである。
本実施形態では、CPUは、実施形態1で述べたステップ301の解析処理において、人物の唇の形だけでなく、他の情報を画像から取得することにより、実施形態1より観賞価値の高い語句を付加することが可能となる。実施形態2では、CPUは、画像ヘッダに含まれる場所情報/時間情報と顔領域から計算される人物の年齢情報とを使用するが、画像から得られる情報であればどんな情報でもよい。
実施形態2におけるステップ301の解析処理を詳細に述べる。図18は、ステップ301の解析処理の一例を示すフローチャートである。
まず、CPUは、人物画像を取得する(ステップ1201)。次に、CPUは、取得した人物画像のメタ情報から撮影した場所情報と時間情報とを取得する(ステップ1202)。次に、CPUは、画像中の人数を計算する(ステップ1203)。
次に、CPUは、解析の終わっていない画像の顔領域を取得する(ステップ1204)。次に、CPUは、ステップ1204で取得した顔領域の人物IDを計算する(1205)。ステップ1203、1204、1205の各処理は、実施形態1の各処理と同じである。
次に、CPUは、ステップ1205で取得した顔情報から年齢を計算する(ステップ1206)。計算の方法は、特開2005−250712公報で公開されている技術が使用可能である。次に、CPUは、顔領域より唇領域を取得して(ステップ1207)、唇の形から母音判定を行う(ステップ1208)。ステップ1207、1208の各処理は、実施形態1の各処理と同様である。
次に、CPUは、ステップ1202で得られた場所/時間情報と、ステップ1205で得られた人物IDと、ステップ1206で得られた年齢情報と、ステップ1208で得られた母音情報と、を図19で示す人物情報テーブルに保存する(ステップ1209)。図19は、人物情報テーブルの一例を示す図である。
次に、CPUは、ステップ1203で算出した人数から処理した人数を引き0より大きい場合(ステップ1210においてyes)、ステップ1204の処理へ戻り、0の場合、(ステップ1210においてno)、ステップ301の解析処理を終了する。
次に実施形態2におけるステップ302の決定処理の詳細を説明する。図20は、ステップ302の決定処理の一例を示すフローチャートである。まず、CPUは、ステップ301の解析処理で生成した人物情報テーブルを取得する(ステップ1401)。次に、CPUは、語句推定テーブルを取得する(ステップ1402)。語句推定データの一例である語句推定テーブルは、例えばHDD等に格納されている。図21は、語句推定テーブルの一例を示す図である。図21に示されるように、語句推定テーブルとは、人物情報テーブルの情報(場所・時間・年齢・母音)を語句に変換するためのテーブルである。
次に、CPUは、人物情報テーブルから処理の終わっていない人物情報を1つ取得する(ステップ1403)。次に、CPUは、取得した人物情報から語句推定テーブルを用いて、語句へ変換する(ステップ1404)。次に、CPUは、ステップ1404で求めた語句と、人物IDと、を人物‐語句テーブルに保存する(ステップ1405)。人物‐語句テーブルは、例えばRAMに作成される。
図22は、人物‐語句テーブルの一例を示す図である。次に、CPUは、人物情報テーブルの全ての人物情報を処理したかどうかを確認し、処理していない場合(S1406においてno)、ステップ1403へ戻り、処理した場合(S1406においてyes)、ステップ302の決定処理を終了する。
以上、本実施形態によれば、人物の唇の形だけでなく、他の情報を画像から取得することにより、実施形態1より観賞価値の高い語句を付加することが可能となる。
なお、本実施形態では、前記他の情報の一例として、メタ情報の場所/時間情報及び顔領域より計算した年齢を例に説明を行った。しかしながら、前記他の情報の一例として、メタ情報の場所/時間情報だけであってもよいし、顔領域より計算した年齢だけあってもよい。
<実施形態3>
本実施形態のハードウェア構成、システム構成は実施形態1と同じである。
本実施形態では、実施形態1及び実施形態2で述べたステップ302の決定処理において、CPUは、複数の選択肢をユーザーへ提示し、ユーザーの指示により画像を修飾する語句を決定することを可能にする。
実施形態3におけるステップ302の決定処理の詳細を説明する。図23は、ステップ302の決定処理の一例を示すフローチャートである。まず、CPUは、語句集を取得する(ステップ1701)。語句集とは画像を装飾する語句を集めたものである。各語句には、ステップ301の解析処理で解析対象となっている要素(母音、年齢、場所、時間等)が結び付けられている。
次に、CPUは、ステップ301の解析処理で得た人物情報テーブルを取得する(ステップ1702)。次に、CPUは、人物情報テーブルの中で処理の終わっていない人物情報を取得する(ステップ1703)。次に、CPUは、その人物に対してコメントを自動付加するか、ユーザー選択にするかをユーザーへ問い合わせる(ステップ1704)。ユーザーの選択操作等に基づいて、CPUが、自動付加と判定した場合(ステップ1704においてyes)、語句集と人物情報とから語句を決定する(ステップ1705)。この処理は、ステップ1404と同じ処理である。
ユーザーの選択操作等に基づいて、CPUが、ユーザー選択と判定した場合(ステップ1704においてno)、語句集と人物情報とから、語句候補を複数選び出し、語句候補一覧を作成する(ステップ1706)。ステップ1706については後述する。そして、CPUは、作成した語句候補一覧を含む画面等を表示し、前記画面等を介したユーザーの選択操作等に基づいて語句を決定する(ステップ1707)。図24は、ステップ1706、1707の処理に使用するユーザーインターフェースの一例を示す図である。
語句が決定した後、CPUは、人物IDと語句とを人物‐語句テーブルに保存する(ステップ1708)。次に、CPUは、人物情報テーブルの中で未処理の人物がある場合(ステップ1709においてno)、ステップ1703へ戻り、全ての人物の処理が終了した場合(ステップ1709においてyes)、ステップ302の決定処理を終える。
図25は、語句集の一例を示す図である。語句集には、語句と各語句に関連する情報とが含まれている。語句集は、例えばHDD等に格納されている。CPUは、ステップ1703で取得した人物情報のうち全てを満たす語句をこの語句集を使用して決定する。例えば、人物情報の年齢が"11"、母音が"a"であった場合、語句集の中から年齢情報部分で"11"が該当し、かつ母音情報部分で"a"が該当する語句が全て選択される。図にある一覧の場合、このケースでは、"がんばれ〜"と"最高です"が選択される。
以上、本実施形態によれば、複数の選択肢をユーザーへ提示し、ユーザーの指示により画像を修飾する語句を決定することができる。
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
101 PC:102 プリンタ

Claims (15)

  1. 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析手段と、
    前記解析手段で決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析手段で決定された母音情報に対応する子音情報を決定し、前記解析手段で決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定手段と、
    前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
    を有する、情報処理装置。
  2. 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域より人物の年齢を計算する解析手段と、
    前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報と、メタ情報と年齢と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報に対応する語句を決定する決定手段と、
    前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
    を有する、情報処理装置。
  3. 前記付加手段は、前記決定手段で決定された語句を含む吹き出し画像を前記人物画像に付加する、請求項1又は2記載の情報処理装置。
  4. 入力された人物画像に複数の人物が写っており、前記決定手段で決定された語句が複数の人物で同じ場合、前記付加手段は、前記語句を含む吹き出し画像の吹き出し元が、前記複数の人物の人物画像の口にくるよう、前記吹き出し画像を付加する、請求項3記載の情報処理装置。
  5. 前記解析手段は、前記人物画像のメタ情報を取得し、前記人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定し、
    前記決定手段は、前記解析手段で取得されたメタ情報及び前記解析手段で決定された母音情報と、メタ情報と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析手段で取得されたメタ情報及び前記解析手段で決定された母音情報に対応する語句を決定する、請求項1記載の情報処理装置。
  6. 前記決定手段は、前記解析手段での解析の結果と、前記語句推定データと、に基づいて、語句候補の一覧を作成し、ユーザーに提示し、ユーザーの選択に基づいて、語句を決定する、請求項5記載の情報処理装置。
  7. 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析ステップと、
    前記解析ステップで決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析ステップで決定された母音情報に対応する子音情報を決定し、前記解析ステップで決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定ステップと、
    前記決定ステップで決定した語句を前記人物画像に付加する付加ステップと、
    を含む、情報処理方法。
  8. 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域より人物の年齢を計算する解析ステップと、
    前記解析ステップで取得されたメタ情報及び前記解析ステップで計算された年齢及び前記解析ステップで決定された母音情報と、メタ情報と年齢と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析ステップで取得されたメタ情報及び前記解析ステップで計算された年齢及び前記解析ステップで決定された母音情報に対応する語句を決定する決定ステップと、
    前記決定ステップで決定した語句を前記人物画像に付加する付加ステップと、
    を含む、情報処理方法。
  9. 前記付加ステップでは、前記決定ステップで決定された語句を含む吹き出し画像を前記人物画像に付加する、請求項7又は8記載の情報処理方法。
  10. 入力された人物画像に複数の人物が写っており、前記決定ステップで決定された語句が複数の人物で同じ場合、前記付加ステップでは、前記語句を含む吹き出し画像の吹き出し元が、前記複数の人物の人物画像の口にくるよう、前記吹き出し画像を付加する、請求項9記載の情報処理方法。
  11. 前記解析ステップでは、前記人物画像のメタ情報を取得し、前記人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定し、
    前記決定ステップでは、前記解析ステップで取得されたメタ情報及び前記解析ステップで決定された母音情報と、メタ情報と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析ステップで取得されたメタ情報及び前記解析ステップで決定された母音情報に対応する語句を決定する、請求項7記載の情報処理方法。
  12. 前記決定ステップでは、前記解析ステップでの解析の結果と、前記語句推定データと、に基づいて、語句候補の一覧を作成し、ユーザーに提示し、ユーザーの選択に基づいて、語句を決定する、請求項11記載の情報処理方法。
  13. コンピュータを、
    入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析手段と、
    前記解析手段で決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析手段で決定された母音情報に対応する子音情報を決定し、前記解析手段で決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定手段と、
    前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
    して機能させるプログラム。
  14. コンピュータを、
    入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域より人物の年齢を計算する解析手段と、
    前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報と、メタ情報と年齢と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報に対応する語句を決定する決定手段と、
    前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
    して機能させるプログラム。
  15. 請求項13又は14に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
JP2009240635A 2009-10-19 2009-10-19 情報処理装置及び情報処理方法 Expired - Fee Related JP5455546B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009240635A JP5455546B2 (ja) 2009-10-19 2009-10-19 情報処理装置及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009240635A JP5455546B2 (ja) 2009-10-19 2009-10-19 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2011086248A JP2011086248A (ja) 2011-04-28
JP5455546B2 true JP5455546B2 (ja) 2014-03-26

Family

ID=44079123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009240635A Expired - Fee Related JP5455546B2 (ja) 2009-10-19 2009-10-19 情報処理装置及び情報処理方法

Country Status (1)

Country Link
JP (1) JP5455546B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7187986B2 (ja) * 2018-10-31 2022-12-13 京セラドキュメントソリューションズ株式会社 情報処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4226237B2 (ja) * 2001-09-11 2009-02-18 日本放送協会 漫画生成装置及び漫画生成プログラム
JP2005108079A (ja) * 2003-10-01 2005-04-21 Sharp Corp かな文字入力装置、かな文字入力方法、プログラムおよび記録媒体
JP2005196481A (ja) * 2004-01-07 2005-07-21 Fuji Xerox Co Ltd 画像形成装置、画像形成方法、およびプログラム
JP2010176224A (ja) * 2009-01-27 2010-08-12 Nikon Corp 画像処理装置およびデジタルカメラ

Also Published As

Publication number Publication date
JP2011086248A (ja) 2011-04-28

Similar Documents

Publication Publication Date Title
JP5014449B2 (ja) 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム
JP4087400B2 (ja) 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム
US7515770B2 (en) Information processing method and apparatus
JP2003241790A (ja) 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム
JP5353835B2 (ja) 情報処理プログラムおよび情報処理装置
JP2007256714A (ja) 字幕修正装置
US8595614B2 (en) Document generating apparatus, document generating method, computer program and recording medium
US10304439B2 (en) Image processing device, animation display method and computer readable medium
EP3407173B1 (en) Input display control device, input display control method, and input display system
KR101756836B1 (ko) 음성데이터를 이용한 문서생성 방법 및 시스템과, 이를 구비한 화상형성장치
TW200842662A (en) Stroke number input
Choe et al. Language-specific effects on automatic speech recognition errors for world Englishes
JP5455546B2 (ja) 情報処理装置及び情報処理方法
JP2006276903A (ja) 文書処理装置
JP5790372B2 (ja) テキスト入力支援システム、テキスト挿入方法、サーバおよびプログラム
JP2008305278A (ja) データ処理装置およびこれを備えた店頭端末機、データ処理プログラム
JP3537753B2 (ja) 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2007096816A (ja) 画像合成装置、画像合成プログラム、および画像合成プログラム記憶媒体
JPH06251005A (ja) レポート情報入出力システム
Liu et al. F0-related head movement in blind versus sighted speakers
JP2017167433A (ja) サマリ生成装置、サマリ生成方法及びサマリ生成プログラム
JP2004227255A (ja) 文書解析装置
JPWO2020116001A1 (ja) 情報処理装置および情報処理方法
JPH09325787A (ja) 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
JP2019079545A (ja) 表示制御装置、入力表示システム、表示制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140107

R151 Written notification of patent or utility model registration

Ref document number: 5455546

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees