JP5455546B2 - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP5455546B2 JP5455546B2 JP2009240635A JP2009240635A JP5455546B2 JP 5455546 B2 JP5455546 B2 JP 5455546B2 JP 2009240635 A JP2009240635 A JP 2009240635A JP 2009240635 A JP2009240635 A JP 2009240635A JP 5455546 B2 JP5455546 B2 JP 5455546B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- determined
- vowel
- analysis
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
図1は、フォトアルバムプリントシステムのシステム構成の一例を示す図である。
本実施形態では、フォトアルバムプリントシステムは、PC1台(101)と、プリンタ1台(102)との構成となっているが、分散出力等を考え、複数のプリンタを含むよう構成してもよい。また、複数のPCからジョブを受け付け、1つのプリンタ上でフォトアルバムとして仕立て、出力する形式としてもよい。さらに以下に示す実施形態の処理はPC側で行うことも、プリンタ側で行うこともできる。なお、PC及びプリンタは、情報処理装置(コンピュータ)の一例である。
図2は、PCのハードウェア構成の一例を示す図である。
PCのハードウェアは、様々な接続方法や、様々なバスやインターフェースを有した構成が一般に知られており、ここで紹介するハードウェア構成は一例である。
点線で囲まれた部分がマザーボードであり、CPUは、キャッシュメモリを介してノースブリッジ、サウスブリッジと通信しながら、このPCのソフトウェア全体を制御している。ここで、ノースブリッジとサウスブリッジとのデータのやり取りやPC内部でのデータ一次保存のためメモリ(RAM)が使用されている。
次にノースブリッジは、汎用PCIバスを持っており、オプション(後付け)でSCSI外部装置等を接続することができる。ノースブリッジは、ディスプレイを表示させるためのグラフィックコントローラにも接続されている。
更に、サウスブリッジは、別の汎用PCIバスを持っており、こちらには、NICを介してネットワーク接続が可能となっている。また、サウスブリッジは、IDEバスも持っており、PCの制御ソフトウェアを初め、様々なデータを格納しておくハードディスクドライブ(HDD)が接続される。また、サウスブリッジには、PCのインストール時等のデータ読み出しや大量データのデータ保存(アーカイブ)等に役立つCD−ROM(又は、CD−R、CD−R/W)ドライブ等が接続される。また、USBポートは、USBメモリに代表されるUSB外部装置にアクセスすることが可能になる。
そして、I/O部を経由してキーボードやマウス或いは、フレキシブルディスク(F/Dドライブ)につながって、データの入出力を行うこともできる。
なお、後述するフォトアルバムプリントシステムの機能及び後述するフローチャートの各ステップに係る処理は、PCのCPUがプログラムに基づき処理を実行することによって実現されるものとして説明する。しかしながら、上述したように、プリンタのCPUがプリンタのメモリ等の記憶装置に記憶されているプログラムに基づき処理を実行することによって、以下の機能及び処理が実現されてもよい。
本実施形態は画像編集部2002に関するものであり、画像編集部2002内の処理についてのみ言及する。
ステップ301の解析処理では、CPUは、人物画像を入力として受け取り、1枚の画像中の人物一人一人に対して母音情報を算出する。図5は、ステップ301の解析処理により生成された人物−母音テーブルの一例を示す図である。なお、人物−母音テーブルは、例えば、RAMに作成される。
ステップ302の決定処理では、CPUは、ステップ301の解析処理の結果、生成された人物−母音情報テーブルを基に、各人物に対して言葉を推定する。図6は、ステップ302の決定処理により生成された人物−言葉テーブルの一例を示す図である。なお、人物−言葉テーブルは、例えば、RAMに作成される。
ステップ303の付加処理では、CPUは、ステップ302の決定処理で生成された人物−言葉テーブルを基に、各人物に対して言葉画像を付加する。
まず、CPUは、人物画像入力で人物の入った画像入力を受け付ける(ステップ601)。次に、CPUは、画像中の人数計算を行う(ステップ602)。画像中の人数計算では、CPUは、画像中の顔の数を検出して計算する。画像中における顔の検出方法については様々な方法が考えられるが、例えばCPUは、特開2002−183731号公報、特開2004−062565号公報に開示されている技術を用いることができる。
画像中の人数計算を行った後は、CPUは、母音判定処理の終わっていない1つの顔領域を人物画像中より取得し(ステップ603)、その人物に対して人物IDを付加し(ステップ604)、その唇領域を抜き出す(ステップ605)。CPUは、人物IDを、ID同士が衝突しないように割振る。例えば、CPUは、衝突が起きないという保証が得られるまでIDをインクリメントする等して、IDを割振る。
次に、CPUは、ステップ602で求めた人数から処理した人数を引き、0より大きい場合は(ステップ608においてyes)、ステップ603の処理へ戻り、0の場合は(ステップ608においてno)、ステップ301の解析処理を終了する。
まず、CPUは、ステップ605で取得した唇領域から、唇を含む口の縦の長さXと、唇を含まない口の縦の長さYと、口の横の長さZと、を求める(ステップ2101)。次に、CPUは、予め内部データとして記憶しているテンプレートとなる母音発音時の、唇を含む口の縦の長さと、唇を含まない口の縦の長さと、口の横の長さと、の比率情報を比率情報テーブルから取得する。図9は、比率情報テーブルの一例を示す図である。比率情報テーブルは、例えばHDD等に格納されている。図10は、母音発音時の唇の形と、唇を含む口の縦の長さ/唇を含まない口の縦の長さ/口の横の長さと、の関係を示す図である。2301が唇を含む口の縦の長さであり、2302が唇を含まない口の縦の長さであり、2303が口の横の長さである。母音"a"の比率をXa:Ya:Zaとすると、比較対照の唇の形と、"a"発音時のテンプレートと、の類似度Saを、CPUは、
√(X/Y − Xa/Ya)2+(Y/Z − Ya/Za)2+(Z/X − Za/Xa)2
の式で求めることができる。同様にCPUは、類似度Si,Su,Se,Soを求め(ステップ2102)、値の一番小さい類似度を求め、その類似度を計算するのに使用した母音を近似母音とする(ステップ2103)。
まず、CPUは、ステップ704で使用した母音情報と、ステップ704で決定した子音情報と、から文字を生成する(ステップ801)。次に、CPUは、図14に示す修飾文字数決定用テーブルを取得する(ステップ802)。図14は、修飾文字数決定用テーブルの一例を示す図である。修飾文字数決定用テーブルは、例えばHDD等に格納されている。修飾文字数決定用テーブルは、ステップ801で生成した文字に対し、最終的に生成する語句の文字数を決定するための確率を示したテーブルである。ここで、語句とは、一文字、又は複数文字の意味をなさない文字列等を含む。図14の例の場合、文字が"あ"の場合、58%の確率で3文字の語句を生成することを示している。
CPUは、ステップ801で生成した文字と、ステップ802で取得した修飾文字数決定用テーブルと、に基づいて、修飾文字数を決定する(ステップ803)。
次に、CPUは、ステップ801で生成した文字と、ステップ804で取得した装飾文字決定用テーブルと、を使用して修飾文字を決める(ステップ805)。CPUは、決定した修飾文字の文字数がステップ802で決定した文字数以内である場合、もしくは修飾文字決定用テーブルで"End"以外が選択された場合(ステップ806においてyes)、ステップ805の処理を繰り返す。CPUは、決定した修飾文字の文字数がステップ802で決定した文字数になった場合、もしくはステップ805で"End"が選択された場合(ステップ806においてno)、ステップ705の語句変換処理を終了する。
次に、CPUは、処理を行なっている人物IDに対する言葉が、既に処理済の人物IDの言葉と同じかどうかを人物‐言葉テーブルを用いて判定する(ステップ1105)。既に処理済の人物IDの語句と異なる場合(ステップ1105においてno)、CPUは、語句を入れた吹き出し画像を生成し、顔領域と重ならないように吹き出し画像を合成する位置を決める(ステップ1107)。また、CPUは、吹き出しから吹出し元を口元近くに来るように吹き出し画像を変形する(ステップ1107)。そして、CPUは、吹き出し画像をステップ1101で取得した画像に合成する(ステップ1107)。吹き出しを生成し合成する技術は、例えば特開2007−4677公報に開示されている技術等を用いることができる。既に処理済の人物IDの語句と同じ場合(ステップ1105においてyes)、CPUは、既に画像に合成された同じ語句の吹き出しから吹出し元を処理中の人物IDの口元にも向けるようにする(ステップ1106)。図17は、ステップ1106を説明するための図である。
本実施形態のハードウェア構成、システム構成は実施形態1と同じである。
本実施形態では、CPUは、実施形態1で述べたステップ301の解析処理において、人物の唇の形だけでなく、他の情報を画像から取得することにより、実施形態1より観賞価値の高い語句を付加することが可能となる。実施形態2では、CPUは、画像ヘッダに含まれる場所情報/時間情報と顔領域から計算される人物の年齢情報とを使用するが、画像から得られる情報であればどんな情報でもよい。
まず、CPUは、人物画像を取得する(ステップ1201)。次に、CPUは、取得した人物画像のメタ情報から撮影した場所情報と時間情報とを取得する(ステップ1202)。次に、CPUは、画像中の人数を計算する(ステップ1203)。
次に、CPUは、解析の終わっていない画像の顔領域を取得する(ステップ1204)。次に、CPUは、ステップ1204で取得した顔領域の人物IDを計算する(1205)。ステップ1203、1204、1205の各処理は、実施形態1の各処理と同じである。
次に、CPUは、ステップ1202で得られた場所/時間情報と、ステップ1205で得られた人物IDと、ステップ1206で得られた年齢情報と、ステップ1208で得られた母音情報と、を図19で示す人物情報テーブルに保存する(ステップ1209)。図19は、人物情報テーブルの一例を示す図である。
次に、CPUは、ステップ1203で算出した人数から処理した人数を引き0より大きい場合(ステップ1210においてyes)、ステップ1204の処理へ戻り、0の場合、(ステップ1210においてno)、ステップ301の解析処理を終了する。
図22は、人物‐語句テーブルの一例を示す図である。次に、CPUは、人物情報テーブルの全ての人物情報を処理したかどうかを確認し、処理していない場合(S1406においてno)、ステップ1403へ戻り、処理した場合(S1406においてyes)、ステップ302の決定処理を終了する。
なお、本実施形態では、前記他の情報の一例として、メタ情報の場所/時間情報及び顔領域より計算した年齢を例に説明を行った。しかしながら、前記他の情報の一例として、メタ情報の場所/時間情報だけであってもよいし、顔領域より計算した年齢だけあってもよい。
本実施形態のハードウェア構成、システム構成は実施形態1と同じである。
本実施形態では、実施形態1及び実施形態2で述べたステップ302の決定処理において、CPUは、複数の選択肢をユーザーへ提示し、ユーザーの指示により画像を修飾する語句を決定することを可能にする。
実施形態3におけるステップ302の決定処理の詳細を説明する。図23は、ステップ302の決定処理の一例を示すフローチャートである。まず、CPUは、語句集を取得する(ステップ1701)。語句集とは画像を装飾する語句を集めたものである。各語句には、ステップ301の解析処理で解析対象となっている要素(母音、年齢、場所、時間等)が結び付けられている。
語句が決定した後、CPUは、人物IDと語句とを人物‐語句テーブルに保存する(ステップ1708)。次に、CPUは、人物情報テーブルの中で未処理の人物がある場合(ステップ1709においてno)、ステップ1703へ戻り、全ての人物の処理が終了した場合(ステップ1709においてyes)、ステップ302の決定処理を終える。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (15)
- 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析手段と、
前記解析手段で決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析手段で決定された母音情報に対応する子音情報を決定し、前記解析手段で決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定手段と、
前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
を有する、情報処理装置。 - 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域より人物の年齢を計算する解析手段と、
前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報と、メタ情報と年齢と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報に対応する語句を決定する決定手段と、
前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
を有する、情報処理装置。 - 前記付加手段は、前記決定手段で決定された語句を含む吹き出し画像を前記人物画像に付加する、請求項1又は2記載の情報処理装置。
- 入力された人物画像に複数の人物が写っており、前記決定手段で決定された語句が複数の人物で同じ場合、前記付加手段は、前記語句を含む吹き出し画像の吹き出し元が、前記複数の人物の人物画像の口にくるよう、前記吹き出し画像を付加する、請求項3記載の情報処理装置。
- 前記解析手段は、前記人物画像のメタ情報を取得し、前記人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定し、
前記決定手段は、前記解析手段で取得されたメタ情報及び前記解析手段で決定された母音情報と、メタ情報と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析手段で取得されたメタ情報及び前記解析手段で決定された母音情報に対応する語句を決定する、請求項1記載の情報処理装置。 - 前記決定手段は、前記解析手段での解析の結果と、前記語句推定データと、に基づいて、語句候補の一覧を作成し、ユーザーに提示し、ユーザーの選択に基づいて、語句を決定する、請求項5記載の情報処理装置。
- 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析ステップと、
前記解析ステップで決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析ステップで決定された母音情報に対応する子音情報を決定し、前記解析ステップで決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定ステップと、
前記決定ステップで決定した語句を前記人物画像に付加する付加ステップと、
を含む、情報処理方法。 - 入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域より人物の年齢を計算する解析ステップと、
前記解析ステップで取得されたメタ情報及び前記解析ステップで計算された年齢及び前記解析ステップで決定された母音情報と、メタ情報と年齢と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析ステップで取得されたメタ情報及び前記解析ステップで計算された年齢及び前記解析ステップで決定された母音情報に対応する語句を決定する決定ステップと、
前記決定ステップで決定した語句を前記人物画像に付加する付加ステップと、
を含む、情報処理方法。 - 前記付加ステップでは、前記決定ステップで決定された語句を含む吹き出し画像を前記人物画像に付加する、請求項7又は8記載の情報処理方法。
- 入力された人物画像に複数の人物が写っており、前記決定ステップで決定された語句が複数の人物で同じ場合、前記付加ステップでは、前記語句を含む吹き出し画像の吹き出し元が、前記複数の人物の人物画像の口にくるよう、前記吹き出し画像を付加する、請求項9記載の情報処理方法。
- 前記解析ステップでは、前記人物画像のメタ情報を取得し、前記人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定し、
前記決定ステップでは、前記解析ステップで取得されたメタ情報及び前記解析ステップで決定された母音情報と、メタ情報と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析ステップで取得されたメタ情報及び前記解析ステップで決定された母音情報に対応する語句を決定する、請求項7記載の情報処理方法。 - 前記決定ステップでは、前記解析ステップでの解析の結果と、前記語句推定データと、に基づいて、語句候補の一覧を作成し、ユーザーに提示し、ユーザーの選択に基づいて、語句を決定する、請求項11記載の情報処理方法。
- コンピュータを、
入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域の唇の形から母音情報を決定する解析手段と、
前記解析手段で決定された母音情報と、母音情報と子音情報とが対応付けられた子音情報推定データと、に基づいて前記解析手段で決定された母音情報に対応する子音情報を決定し、前記解析手段で決定された母音情報と、前記決定した子音情報と、に基づいて、語句を決定する決定手段と、
前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
して機能させるプログラム。 - コンピュータを、
入力された人物画像を解析し、人物画像中より顔領域を検出し、検出した顔領域より人物の年齢を計算する解析手段と、
前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報と、メタ情報と年齢と母音情報と語句とが対応付けられた語句推定データと、に基づいて、前記解析手段で取得されたメタ情報及び前記解析手段で計算された年齢及び前記解析手段で決定された母音情報に対応する語句を決定する決定手段と、
前記決定手段で決定した語句を前記人物画像に付加する付加手段と、
して機能させるプログラム。 - 請求項13又は14に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009240635A JP5455546B2 (ja) | 2009-10-19 | 2009-10-19 | 情報処理装置及び情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009240635A JP5455546B2 (ja) | 2009-10-19 | 2009-10-19 | 情報処理装置及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011086248A JP2011086248A (ja) | 2011-04-28 |
JP5455546B2 true JP5455546B2 (ja) | 2014-03-26 |
Family
ID=44079123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009240635A Expired - Fee Related JP5455546B2 (ja) | 2009-10-19 | 2009-10-19 | 情報処理装置及び情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5455546B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7187986B2 (ja) * | 2018-10-31 | 2022-12-13 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4226237B2 (ja) * | 2001-09-11 | 2009-02-18 | 日本放送協会 | 漫画生成装置及び漫画生成プログラム |
JP2005108079A (ja) * | 2003-10-01 | 2005-04-21 | Sharp Corp | かな文字入力装置、かな文字入力方法、プログラムおよび記録媒体 |
JP2005196481A (ja) * | 2004-01-07 | 2005-07-21 | Fuji Xerox Co Ltd | 画像形成装置、画像形成方法、およびプログラム |
JP2010176224A (ja) * | 2009-01-27 | 2010-08-12 | Nikon Corp | 画像処理装置およびデジタルカメラ |
-
2009
- 2009-10-19 JP JP2009240635A patent/JP5455546B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011086248A (ja) | 2011-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5014449B2 (ja) | 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム | |
JP4087400B2 (ja) | 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム | |
US7515770B2 (en) | Information processing method and apparatus | |
JP2003241790A (ja) | 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム | |
JP5353835B2 (ja) | 情報処理プログラムおよび情報処理装置 | |
JP2007256714A (ja) | 字幕修正装置 | |
US8595614B2 (en) | Document generating apparatus, document generating method, computer program and recording medium | |
US10304439B2 (en) | Image processing device, animation display method and computer readable medium | |
EP3407173B1 (en) | Input display control device, input display control method, and input display system | |
KR101756836B1 (ko) | 음성데이터를 이용한 문서생성 방법 및 시스템과, 이를 구비한 화상형성장치 | |
TW200842662A (en) | Stroke number input | |
Choe et al. | Language-specific effects on automatic speech recognition errors for world Englishes | |
JP5455546B2 (ja) | 情報処理装置及び情報処理方法 | |
JP2006276903A (ja) | 文書処理装置 | |
JP5790372B2 (ja) | テキスト入力支援システム、テキスト挿入方法、サーバおよびプログラム | |
JP2008305278A (ja) | データ処理装置およびこれを備えた店頭端末機、データ処理プログラム | |
JP3537753B2 (ja) | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 | |
JP2007096816A (ja) | 画像合成装置、画像合成プログラム、および画像合成プログラム記憶媒体 | |
JPH06251005A (ja) | レポート情報入出力システム | |
Liu et al. | F0-related head movement in blind versus sighted speakers | |
JP2017167433A (ja) | サマリ生成装置、サマリ生成方法及びサマリ生成プログラム | |
JP2004227255A (ja) | 文書解析装置 | |
JPWO2020116001A1 (ja) | 情報処理装置および情報処理方法 | |
JPH09325787A (ja) | 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置 | |
JP2019079545A (ja) | 表示制御装置、入力表示システム、表示制御方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121019 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140107 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5455546 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |