JPH10261099A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH10261099A
JPH10261099A JP6271697A JP6271697A JPH10261099A JP H10261099 A JPH10261099 A JP H10261099A JP 6271697 A JP6271697 A JP 6271697A JP 6271697 A JP6271697 A JP 6271697A JP H10261099 A JPH10261099 A JP H10261099A
Authority
JP
Japan
Prior art keywords
image
balloon
data
character
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP6271697A
Other languages
English (en)
Inventor
Tetsukazu Nakae
哲一 仲江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP6271697A priority Critical patent/JPH10261099A/ja
Publication of JPH10261099A publication Critical patent/JPH10261099A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Digital Computer Display Output (AREA)
  • Studio Circuits (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 極めて簡単な操作で各種の「吹き出し」態様
を入力することができる画像処理装置を実現する。 【解決手段】 音声入力した時の平均音量および平均音
程に対応して「吹き出し」の形状を選定すると共に、こ
の選定された「吹き出し」の中に表示する文字色および
その大きさを平均音量および平均音程に基づいて選択
し、この選択された文字色およびその大きさに従って、
音声認識されたメッセージを「吹き出し」中に文字表示
するので、極めて簡単な操作で各種の「吹き出し」態様
を入力することが可能になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、イラスト
風の似顔絵を電子的に作成して表示する電子手帳や電子
玩具、あるいはページャー等に用いて好適な画像処理装
置に関する。
【0002】
【従来の技術】近年、イラスト風の似顔絵(以下、これ
を顔画像と称す)を電子的に作成して表示する電子手帳
や電子玩具、あるいはページャー等が知られている。こ
の種の製品にあっては、「目」、「鼻」、「口」や「輪
郭」等の顔の各部位を描画する各種パーツ画像データを
ROMに登録しておき、これらの中から各部位毎にパー
ツ画像データを選択して読み出し、所望の容貌の顔画像
を形成する画像処理装置が具備されている。
【0003】ところで、近年では、この画像処理装置が
作成した顔画像にメッセージを添えて画面表示する態様
も案出されている。例えば、ページャーに適用した場
合、発信人の似顔絵として作成された顔画像に、伝言す
べきメッセージ文を吹き出し形式で表示することが提案
されている。なお、この吹き出し形式によるメッセージ
文の表示とは、漫画やアニメなどで多用される表現形式
として知られており、あたかも顔画像からメッセージが
発せられているように見える、という視覚的な効果を狙
っている。
【0004】
【発明が解決しようとする課題】さて、上述した従来の
画像処理装置にあっては、作成した顔画像について吹き
出し形式によるメッセージ文を表示させる場合、マウス
やキーボードあるいはキーパッド等の入力操作子を用い
て「吹出し」の形状を選択したり、選択した「吹出し」
の内部に表示する文字やその大きさ・形状を一々指定し
なければならず、操作が煩わしいという問題がある。そ
こで本発明は、このような事情に鑑みてなされたもの
で、極めて簡単な操作で各種の「吹き出し」態様を入力
することができる画像処理装置を提供することを目的と
している。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の発明では、入力される音声に対応
した形態の吹き出し画像を形成する吹き出し画像形成手
段と、入力される音声を言語認識し、認識された言語を
それぞれ文字画像に変換する文字画像形成手段と、この
文字画像形成手段により形成された文字画像の表示態様
を、入力される音声に応じて異ならせて前記吹き出し画
像中に表示する表示制御手段とを具備することを特徴と
する。
【0006】また、請求項2に記載の発明では、各種形
態の吹き出しを形成する複数の吹き出し画像データを記
憶する吹き出し画像記憶手段と、入力される音声の音量
に対応付けられた吹き出し画像データを、前記吹き出し
画像記憶手段から読み出して吹き出し画像を形成する吹
き出し画像形成手段と、入力される音声を言語認識し、
認識された言語をそれぞれ文字画像に変換する文字画像
形成手段と、この文字画像形成手段により形成された文
字画像の表示態様を、入力される音声の音量に応じて異
ならせて前記吹き出し画像中に表示する表示制御手段と
を具備することを特徴としている。
【0007】さらに、請求項3に記載の発明では、各種
形態の吹き出しを形成する複数の吹き出し画像データを
記憶する吹き出し画像記憶手段と、入力される音声の音
程に対応付けられた吹き出し画像データを、前記吹き出
し画像記憶手段から読み出して吹き出し画像を形成する
吹き出し画像形成手段と、入力される音声を言語認識
し、認識された言語をそれぞれ文字画像に変換する文字
画像形成手段と、この文字画像形成手段により形成され
た文字画像の表示態様を、入力される音声の音程に応じ
て異ならせて前記吹き出し画像中に表示する表示制御手
段とを具備することを特徴としている。
【0008】請求項4に記載の発明では、各種形態の吹
き出しを形成する複数の吹き出し画像データを記憶する
吹き出し画像記憶手段と、入力される音声の音量および
音程に対応付けられた吹き出し画像データを、前記吹き
出し画像記憶手段から読み出して吹き出し画像を形成す
る吹き出し画像形成手段と、入力される音声を言語認識
し、認識された言語をそれぞれ文字画像に変換する文字
画像形成手段と、この文字画像形成手段により形成され
た文字画像の表示態様を、入力される音声の音量および
音程に応じて異ならせて前記吹き出し画像中に表示する
表示制御手段とを具備することを特徴とする。
【0009】上記請求項1〜4のいずれかに従属する請
求項5に記載の発明によれば、前記表示制御手段が異な
らせる表示態様は、文字画像の大きさおよび表示色のい
ずれか一方、あるいは両方であることを特徴とする。ま
た、請求項2〜4のいずれかに従属する請求項6に記載
の発明によれば、前記表示制御手段は、音量あるいは音
程のいずれか一方、もしくは両方に応じて1語毎の文字
画像の大きさを可変制御することを特徴とする。
【0010】本発明では、吹き出し画像形成手段が入力
される音声に対応した形態の吹き出し画像を形成し、文
字画像形成手段が入力される音声を言語認識し、認識さ
れた言語をそれぞれ文字画像に変換すると、表示制御手
段が文字画像の表示態様を、入力される音声に応じて異
ならせて前記吹き出し画像中に表示する。これにより、
音声入力という極めて簡単な操作で各種の「吹き出し」
態様を入力することが可能となる。また、入力される音
声の内容によっては、「吹き出し」態様で感情表現する
ことも可能になる。
【0011】
【発明の実施の形態】本発明による画像処理装置は、イ
ラスト風の似顔絵を電子的に作成して表示する電子手帳
や電子玩具、あるいはページャー、PDA(携帯情報端
末)などに適用され得る。以下では、本発明の実施の形
態である画像処理装置を、実施例として図面を参照して
説明する。
【0012】A.実施例の構成 (1)全体構成 図1は、本発明の実施例による画像処理装置1の全体構
成を示すブロック図である。この画像処理装置1は、後
述する構成要素10〜19に基づき生成されるコンポジ
ットビデオ信号SVを、ディスプレイ装置2に供給す
る。ディスプレイ装置2は、例えば通常のテレビジョン
受像機、あるいはVDT(ビデオ・ディスプレイ・ター
ミナル)であり、画像処理装置1側から供給されるコン
ポジットビデオ信号SVに応じた画像を画面表示する。
【0013】画像処理装置1において、10は、電源ス
イッチや動作モード切り替えスイッチ等の各種操作スイ
ッチを備えるコントローラであり、ユーザーのスイッチ
操作に応じた操作信号を発生する。11はコントローラ
10が発生する操作信号に応じて装置各部を制御するC
PUであり、その動作については後述する。なお、CP
U11は図示されていないDMAコントローラ等の周辺
装置を含み、DMA転送し得るように構成されている。
12はROMであり、CPU11にロードされる各種プ
ログラムの他、顔画像や吹き出し画像(後述する)を表
示するための画像データや、データテーブルが記憶され
ており、そのメモリ構成については後述する。
【0014】13はCPU11のワークエリアとして用
いられるRAMであり、各種レジスタ・フラグデータを
一時記憶する記憶エリアの他、後述する音量データ、音
程データおよび音声認識データを格納する記憶エリアを
備えている。このRAM13のメモリ構成については追
って述べる。14はCPU11の指示の下に表示制御す
るビデオ・ディスプレイ・プロセッサ(以下、VDPと
称す)であり、VRAM15にDMA転送される各種画
像データを表示データ(RGBデータ)に変換して出力
する。
【0015】VRAM15は、CPU11の指示により
RAM13側からDMA転送される顔画像や吹き出し画
像を形成する画像データを一時記憶する。16はエンコ
ーダであり、上述したVDP14から出力される表示デ
ータ(RGBデータ)をコンポジットビデオ信号SV
変換して出力し、ディスプレイ装置2に供給する。17
は音声入力時に使用するマイクロフォンである。18は
マイクロフォン17から出力されるユーザーの音声信号
を所定のサンプリング周波数でサンプリングしてなる音
声データを発生するA/D変換器である。
【0016】19は、上記A/D変換器18から供給さ
れる音声データに基づき、音声認識、音量検出および音
程検出の各処理を施し、その結果をCPU11に出力す
るデジタル・シグナル・プロセッサ(以下、DSPと略
称する)である。このDSP19は、内部メモリに格納
されるマイクロプログラムに基づき、音声認識部19
a、音量検出部19bおよび音程検出部19cの各機能
を具現する。
【0017】音声認識部19aは、ユーザーが発した音
声について、音素あるいは音節などの認識単位毎に、パ
ーコール分析等の手法により特徴パラメータを抽出し、
この抽出した時系列の特徴パラメータからなる入力パタ
ーンを、予め登録される各単語毎の標準パターン群につ
いてパターンマッチングさせ、最も類似度の高い標準パ
ターンに対応付けられた単語あるいは文節を音声認識結
果として出力する。また、音量検出部19bおよび音程
検出部19cでは、こうした音声認識を行っている過程
で、A/D変換器18より出力される音声データから時
系列の振幅値および発声ピッチを抽出して出力する。
【0018】上記構成によれば、コントローラ10の操
作に応じて選択されたパーツ画像により所望の容貌の顔
画像が形成される一方、この形成された顔画像に付随し
て表示される「吹き出し」の形状や、この「吹き出し」
内部に表示する文字およびその大きさ・表示色がユーザ
ーの音声入力により自動的に決定されて吹き出し表示が
行われる。つまり、本発明では、ユーザーが発する音声
に従って各様な「吹き出し」態様を実現することを要旨
としている。
【0019】(2)ROM12のメモリ構成 次に、図2を参照して上述したROM12のメモリ構成
について説明する。図2において、KGは顔画像データ
記憶エリアであり、「髪」、「輪郭」、「目」、「鼻」
および「口」等の顔の各部位毎に複数種の画像データが
格納されている。したがって、ユーザーが「髪」、「輪
郭」、「目」、「鼻」および「口」等の顔の各部位毎に
所望の画像データを選択することで、各様な容貌あるい
は表情の顔画像を形成し得るようになっている。
【0020】FGは、吹き出し画像データ記憶エリアで
あり、各種形状の吹き出し枠を描画する吹き出し画像デ
ータFG(1)〜FG(N)から構成される。これら吹
き出し画像データFG(1)〜FG(N)は、後述する
吹き出し形状選択テーブルFSTにより指定される。F
T(1)〜FT(N)は、それぞれ吹き出し枠内に表示
する文字の形状や大きさを指定する文字種変換テーブル
である。すなわち、音声入力されたメッセージ(文字
列)を、後述する音声表示モード処理によって吹き出し
枠内に表示する際に、これら文字種変換テーブルFT
(1)〜FT(N)を参照し、当該メッセージを形成す
る各文字の形状や大きさを指定する。これら文字種変換
テーブルFT(1)〜FT(N)は、後述する文字種選
択テーブルMSTにより指定される。
【0021】吹き出し形状選択テーブルFSTは、後述
する音量平均データおよび音程平均データに対応させて
上述した吹き出し画像データFG(1)〜FG(N)の
いずれかを選択するための2次元データテーブルであ
る。すなわち、このテーブルFSTでは、音声入力され
るメッセージの音量および音程に対応した形状の「吹き
出し」を選択するものであり、例えば、怒鳴るように音
声入力されたメッセージの場合、その音量および音程に
基づき、周縁がジグザグ状の吹き出し画像を選択する。
このようにすると、吹き出しの形状で”怒った”情感を
表現することが出来る。
【0022】CSTは文字色選択テーブルであり、上記
テーブルFSTと同様に、音量平均データおよび音程平
均データを読み出しアドレスとして、各種文字色を指定
する色コード変換テーブル(所謂、カラールックアップ
テーブル)をアサインしておき、音声入力されるメッセ
ージの音量および音程に対応した色コード変換テーブル
を用いて吹き出し内部に表示する文字色を指定する。文
字種選択テーブルMSTは、音量平均データおよび音程
平均データに対応させて上述した文字種変換テーブルF
T(1)〜FT(N)のいずれかを選択するための2次
元データテーブルである。この文字種選択テーブルMS
Tは、音声認識された単語毎に文字種変換テーブルFT
(1)〜FT(N)のいずれかを選択する。
【0023】(3)RAM13のレジスタ構成 次に、図3を参照してRAM13のレジスタ構成につい
て説明する。図において、レジスタVAADDは、デー
タエリアVADに格納される音量データVAD(1)〜
VAD(N)のいずれかを指定するアドレスポインタレ
ジスタである。データエリアVADに格納される音量デ
ータVAD(1)〜VAD(N)は、前述したDSP1
9の音量検出部19b(図1参照)から出力されるデー
タである。また、レジスタVFADDは、データエリア
VFDに格納される音程データVFD(1)〜VFD
(N)のいずれかを指定するアドレスポインタレジスタ
である。この音程データVFD(1)〜VFD(N)
は、DSP19の音程検出部19cが発生するデータで
ある。さらに、レジスタVNADDは、データエリアV
NDに格納される認識データVND(1)〜VND
(N)のいずれかを指定するアドレスポインタレジスタ
である。認識データVFD(1)〜VFD(N)とは、
DSP19の音声認識部19aが認識した単語を表わす
データである。
【0024】VAREG,VNREGおよびVFREG
は、テンポラリレジスタであり、DSP19側から出力
される上記音量データVAD、音声認識データVNDお
よび音程データVFDを、それぞれ一時記憶する。Nは
データ個数を保持するレジスタ、SVFは音程データV
FD(1)〜VFD(N)の累算値を保持するレジスタ
である。また、同様に、SVAは音量データVAD
(1)〜VAD(N)の累算値を保持するレジスタであ
る。VAおよびVNは、上記レジスタSVA、SVFに
それぞれ格納された累算値を、レジスタNのデータ個数
で除算した結果となる平均音量データ、平均音程データ
を保持するレジスタである。
【0025】B.実施例の動作 次に、図4〜図14を参照して実施例の動作について説
明する。以下では、動作主体であるCPU11が実行す
る「メインルーチン」、「音声入力モード処理ルーチ
ン」および「音声表示モード処理ルーチン」について順
次説明して行く。
【0026】(1)メインルーチンの動作 まず、実施例に電源が投入されると、CPU11はRO
M12から対応する制御プログラムを読み出してロード
し、図4に示すステップSA1に処理を進める。ステッ
プSA1では、RAM13の各種レジスタ/フラグ類を
初期化する一方、VDP14およびDSP19に対して
内部レジスタの初期化を指示する。そして、イニシャラ
イズ完了後に、CPU11はステップSA2に処理を進
め、現在どの処理モードに設定されているかを判断す
る。
【0027】ここで、ユーザー操作により「入力モー
ド」が選択されると、ステップSA3を介して後述する
「音声入力モード処理ルーチン」を実行し、一方、「表
示モード」が選択されると、ステップSA4を介して後
述する「音声表示モード処理ルーチン」実行する。そし
て、いずれかのモード処理が完了すると、再びステップ
SA2に処理を戻す。
【0028】(2)音声入力モード処理ルーチンの動作 上記ステップSA3を介して音声入力モード処理ルーチ
ンが実行されると、CPU11は図5に示すステップS
B1に処理を進め、前述したアドレスポインタレジスタ
VNADD,VFADDおよびVAADDをゼロリセッ
トする。そして、次のステップSB2に処理を進める
と、DSP19から出力される音量データVAD、音声
認識データVNDおよび音程データVFDを、それぞれ
一時記憶するテンポラリレジスタVAREG,VNRE
GおよびVFREGをゼロリセットする。
【0029】次いで、ステップSB3に進むと、CPU
11はDSP19に対して音声入力の開始を指示する。
これにより、DSP19では、マイクロフォン17およ
びA/D変換器18を介して入力される音声データに基
づき、前述した音声認識部19a、音量検出部19bお
よび音程検出部19cがそれぞれ音声認識、音量検出お
よび音程検出する。そして、ステップSB4では、音程
検出部19cが出力する音程データVFDをテンポラリ
レジスタVFREGにストアし、続くステップSB5で
は、音量検出部19bが出力する音量データVADをテ
ンポラリレジスタVAREGにストアする。
【0030】続いて、ステップSB6では、音声認識部
19aにおいてなされるパターンマッチングにより、入
力された音声が単語として認識されるまで待機する。そ
して、認識が終了すると、ステップSB6の判断結果が
「YES」となり、次のステップSB7に処理を進め
る。ステップSB7では、認識結果となる音声認識デー
タVNDをテンポラリレジスタVNREGにストアす
る。次いで、ステップSB8〜SB10では、テンポラ
リレジスタVNREG,VFREGおよびVAREGに
それぞれ格納された音声認識データVND、音程データ
VFDおよび音量データVADを、アドレスポインタレ
ジスタVNADD,VFADDおよびVAADDに対応
させて各々、データエリアVND,VFDおよびVAD
にストアする。
【0031】この後、図6に示すステップSB11〜S
B13に処理を進め、データエリアVND,VFDおよ
びVADの格納アドレスを歩進させるべくアドレスポイ
ンタレジスタVNADD,VFADDおよびVAADD
を1インクリメントする。そして、ステップSB14で
は、動作モード切り替えスイッチの操作により現モード
(音声入力モード)を強制終了するか否かを判断する。
ここで、当該スイッチが操作されない時には、判断結果
が「NO」となり、ステップSB15に進む。ステップ
SB15では、アドレスポインタレジスタVNADDの
値が、レジスタNに格納されるデータ個数を超えたか否
かを判断する。
【0032】データ個数を超えていない場合には、上記
ステップSB15の判断結果が「NO」となり、前述し
たステップSB3(図5参照)に処理を戻し、再びDS
P19側から出力される音声認識データVND、音程デ
ータVFDおよび音量データVADを取込むが、データ
個数を超えた時には、判断結果が「YES」となり、ス
テップSB16に処理を進め、音声表示モード(後述す
る)に遷移する。なお、上述のステップSB14の判断
結果が「YES」の場合、つまり、動作モード切り替え
スイッチの操作により現モード(音声入力モード)が強
制終了された時には、一意的にステップSB16に進
み、音声表示モードに遷移する。
【0033】(3)音声表示モード処理ルーチンの動作 さて、上述した音声入力モード処理によって、データエ
リアVND,VFDおよびVADにそれぞれ音声認識デ
ータVND(1)〜VND(N)、音程データVFD
(1)〜VFD(N)および音量データVAD(1)〜
VAD(N)が格納された場合、あるいは動作モード切
り替えスイッチの操作により音声入力モードが強制終了
された場合には、CPU11はステップSA4(図4参
照)を介して図7に示す音声表示モード処理ルーチンを
実行してステップSC1に処理を進める。
【0034】ステップSC1では、上述した音声入力モ
ード処理によってデータエリアVADに格納された音量
データVAD(1)〜VAD(N)を累算し、その累算
結果を、レジスタNに格納されるデータ個数で除算して
平均音量データをレジスタVAにストアする音量平均算
出処理を実行する。以下、この音量平均算出処理ルーチ
ンの動作について図9を参照して詳述する。
【0035】<音量平均算出処理ルーチンの動作>CP
U11の処理がステップSC1に進むと、図9に示す音
量平均算出処理ルーチンが実行され、ステップSD1に
処理を進める。ステップSD1では、レジスタSVAを
ゼロリセットする一方、レジスタVAADDに「1」を
セットし、続くステップSD2では、このアドレスポイ
ンタレジスタVNADDがデータエリアVADにおいて
指し示す音量データVAD(1)をレジスタSVAにス
トアする。
【0036】次いで、ステップSD3では、アドレスポ
インタレジスタVNADDの値を1インクリメントして
歩進させ、次のステップSD4では、この歩進されたア
ドレスポインタレジスタVNADDの値がレジスタNに
格納されるデータ個数より大であるか否か、つまり、全
ての音量データVADについて累算したかどうかを判断
する。ここで、全ての音量データVADについて累算が
完了していない時には、判断結果が「NO」となり、上
述のステップSD2に処理を戻し、以後、全ての音量デ
ータVADを累算する迄、ステップSD2〜SD4を繰
り返す。
【0037】そして、累算が完了すると、ステップSD
4の判断結果が「YES」となり、次のステップSD5
に処理を進め、レジスタSVAに確保された音量データ
VAD(1)〜VAD(N)の累算値を、レジスタNの
データ個数で除算し、これにより得られる平均音量デー
タをレジスタVAにストアする。
【0038】この後、CPU11は音量平均算出処理ル
ーチンを完了して音声表示モード処理ルーチンに復帰
し、図7に示すステップSC2に処理を進める。ステッ
プSC2では、上記ステップSC1と同様に、データエ
リアVFDに格納された音程データVFD(1)〜VF
D(N)の累算値をレジスタNに格納されるデータ個数
で除算して得る平均音程データを、レジスタVFにスト
アする音程平均算出処理を実行する。以下、この音程平
均算出処理ルーチンの動作について図10を参照して詳
述する。
【0039】<音程平均算出処理ルーチンの動作>CP
U11の処理がステップSC2に進むと、図10に示す
音程平均算出処理ルーチンが実行され、ステップSE1
に処理を進める。ステップSE1では、レジスタSVF
をゼロリセットする一方、レジスタVFADDに「1」
をセットし、続くステップSE2では、このアドレスポ
インタレジスタVFADDがデータエリアVFDにおい
て指し示す音程データVFD(1)をレジスタSVFに
ストアする。
【0040】次いで、ステップSE3では、アドレスポ
インタレジスタVFADDの値を1インクリメントして
歩進させ、次のステップSE4では、この歩進されたア
ドレスポインタレジスタVFADDの値がレジスタNに
格納されるデータ個数より大であるか否か、つまり、全
ての音程データVFDについて累算したかどうかを判断
する。ここで、累算が完了していない時には、判断結果
が「NO」となり、上述のステップSE2に処理を戻
し、以後、全ての音程データVFDを累算する迄、ステ
ップSE2〜SE4を繰り返す。そして、累算が完了す
ると、ステップSE4の判断結果が「YES」となり、
次のステップSE5に処理を進め、レジスタSVFに確
保された音程データVFD(1)〜VFD(N)の累算
値をレジスタNのデータ個数で除算し、これにより得ら
れる平均音程データをレジスタVFにストアする。
【0041】この後、CPU11は音程平均算出処理ル
ーチンを完了して音声表示モード処理ルーチンに復帰
し、図7に示すステップSC3に処理を進める。ステッ
プSC3では、ユーザー操作により指定された顔画像デ
ータを、ROM12の記憶エリアKGより読み出し、V
RAM15へDMA転送する。なお、VRAM15にD
MA転送された顔画像データは、ディスプレイ装置2の
垂直帰線期間中において、VDP14で表示データ(R
GBデータ)に変換された後、エンコーダ16がこの表
示データ(RGBデータ)をコンポジットビデオ信号S
Vに変換してディスプレイ装置2に供給する。この結
果、顔画像がディスプレイ装置2に画面表示される。
【0042】次いで、ステップSC4では、レジスタV
FおよびレジスタVAに格納した平均音量データおよび
平均音程データに基づき、前述した吹き出し形状選択テ
ーブルFSTを参照し、吹き出し画像データFG(1)
〜FG(N)のいずれかを指定する。そして、次のステ
ップSC5では、指定された吹き出し画像データFGを
ROM12から読み出してVRAM15にDMA転送す
る。この結果、音声入力されたメッセージの音量および
音程に対応した形状の「吹き出し」が画面表示される。
【0043】次に、ステップSC6に進むと、CPU1
1はレジスタVFおよびレジスタVAに格納される平均
音量データおよび平均音程データを読み出しアドレスと
して、前述した文字色選択テーブルCSTから対応する
色コード変換テーブル(所謂、カラールックアップテー
ブル)を選択し、続くステップSC7では、この選択し
た色コード変換テーブルをVDP14にセットする。こ
れにより、VDP14では、音声入力されたメッセージ
の音量および音程に対応した色コード変換テーブルを用
いて、吹き出し内部に表示される文字色を指定する。
【0044】そして、図8に示すステップSC8に進む
と、レジスタVFおよびレジスタVAに格納される平均
音量データおよび平均音程データに基づき、前述した文
字種選択テーブルMSTを参照して文字種変換テーブル
FT(1)〜FT(N)のいずれかを選択する。次い
で、ステップSC9では、アドレスポインタレジスタV
NADDを「1」にリセットし、続くステップSC10
では、上記レジスタVNADDに対応する音声認識デー
タをデータエリアVND(図3参照)から読み出す一
方、読み出した音声認識データを、上述のステップSC
8にて選択された文字種変換テーブルFTにより文字画
像データに変換する。
【0045】こうして音声認識された単語が、音声入力
時の音量および音程に応じた文字画像に変換されると、
CPU11はステップSC11に処理を進め、変換され
た文字画像データをVRAM15にDMA転送する。そ
して、次のステップSC12では、次の音声認識データ
をデータエリアVNDから読み出すべく、アドレスポイ
ンタレジスタVNADDを1インリメントして歩進させ
る。続いて、ステップSC13では、歩進されたアドレ
スポインタレジスタVNADDの値がレジスタNの値よ
り大きいか否か、つまり、全ての音声認識データを読み
出したか否かを判断する。
【0046】ここで、全ての音声認識データを読み出し
ていない時には、判断結果が「NO」となり、ステップ
SC9に処理を戻し、上述した過程を繰り返す。一方、
全ての音声認識データを文字画像データに変換し終えた
場合には、判断結果が「YES」となり、ステップSC
14に処理を進める。ステップSC14では、ユーザー
によって動作モード切り替えスイッチが操作され、現モ
ード(音声表示モード)が強制終了される迄待機し、動
作モード切り替えスイッチが操作された時点で、次のス
テップSC15に進み、音声入力モードへ遷移する。
【0047】このように、音声表示モード処理によれ
ば、音声入力した時の平均音量および平均音程に対応し
て「吹き出し」の形状を選定すると共に、この選定され
た「吹き出し」の中に表示する文字色およびその大きさ
を平均音量および平均音程に基づいて選択し、この選択
された文字色およびその大きさに従って、音声認識され
たメッセージを「吹き出し」中に文字表示するので、極
めて簡単な操作で各種の「吹き出し」態様を入力するこ
とが可能になる。したがって、例えば、音量および音程
共に大きくして「いっしょにあそぼうよ」なるメッセー
ジを音声入力した場合、図11に図示する一例のよう
に、活発な気質を表現する「吹き出し」の形状となり、
その「吹き出し」の中の文字も大きく表示される。これ
に対し、例えば、音量および音程を低くして同様のメッ
セージを音声入力した場合には、図12の一例のよう
に、大人しさを表現する「吹き出し」の形状となり、そ
の中の文字も小さく表示される。
【0048】なお、本実施例では、音声入力した時の平
均音量および平均音程に対応して吹き出し形状や、文字
色およびその大きさを決定したが、これに限らず種々変
形が可能である。例えば、音声認識した単語毎の音量お
よび音程に応じて吹き出し内に表示される文字の大きさ
を異ならせることも出来る。これは、例えば、最初に音
量が大きく、次第に音量が下がっていくようなメッセー
ジを音声入力した場合に、吹き出し内に表示する文字の
大きさを徐々に小さくするよう文字種変換テーブルFT
(1)〜FT(N)を選択することで実現し得る。
【0049】また、この実施例では、音声入力により吹
き出し態様を異ならせているが、これに限らず、例え
ば、顔画像の表情を変化させることも可能である。つま
り、怒鳴るように音声入力した時には、それに対応して
吹き出し態様と顔画像とを怒った感情を表現するよう画
面表示する。このようにすることで、感情表現力が一層
向上する。さらに、上述した実施例では、吹き出し表示
位置を固定としているが、これに替えて、例えば、音声
入力時の音量や音程に応じて表示位置を変化させる態様
とすることもできる。
【0050】
【発明の効果】本発明によれば、吹き出し画像形成手段
が入力される音声に対応した形態の吹き出し画像を形成
し、文字画像形成手段が入力される音声を言語認識し、
認識された言語をそれぞれ文字画像に変換すると、表示
制御手段が文字画像の表示態様を、入力される音声に応
じて異ならせて前記吹き出し画像中に表示するので、音
声入力という極めて簡単な操作で各種の「吹き出し」態
様を入力することができる。また、入力される音声の内
容によっては、「吹き出し」態様で感情表現することも
できる。
【図面の簡単な説明】
【図1】本発明による実施例の構成を示すブロック図で
ある。
【図2】ROM12のメモリ構成を示すメモリマップで
ある。
【図3】RAM13のメモリ構成を示すメモリマップで
ある。
【図4】メインルーチンの動作を示すフローチャートで
ある。
【図5】音声入力モード処理ルーチンの動作を示すフロ
ーチャートである。
【図6】音声入力モード処理ルーチンの動作を示すフロ
ーチャートである。
【図7】音声表示モード処理ルーチンの動作を示すフロ
ーチャートである。
【図8】音声表示モード処理ルーチンの動作を示すフロ
ーチャートである。
【図9】音量平均算出処理ルーチンの動作を示すフロー
チャートである。
【図10】音程平均算出処理ルーチンの動作を示すフロ
ーチャートである。
【図11】吹き出し表示の一態様を示す図である。
【図12】吹き出し表示の一態様を示す図である。
【符号の説明】
10 コントローラ 11 CPU(吹き出し画像形成手段、文字画像形成手
段、表示制御手段) 12 ROM(吹き出し画像形成手段、文字画像形成手
段) 13 RAM(吹き出し画像形成手段、文字画像形成手
段) 14 VDP(吹き出し画像形成手段、文字画像形成手
段、表示制御手段) 15 VRAM 16 エンコーダ 17 マイクロフォン 18 A/D変換器 19 DSP(吹き出し画像形成手段、文字画像形成手
段) 19a 音声認識部 19b 音量検出部 19c 音程検出部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力される音声に対応した形態の吹き出
    し画像を形成する吹き出し画像形成手段と、 入力される音声を言語認識し、認識された言語をそれぞ
    れ文字画像に変換する文字画像形成手段と、 この文字画像形成手段により形成された文字画像の表示
    態様を、入力される音声に応じて異ならせて前記吹き出
    し画像中に表示する表示制御手段とを具備することを特
    徴とする画像処理装置。
  2. 【請求項2】 各種形態の吹き出しを形成する複数の吹
    き出し画像データを記憶する吹き出し画像記憶手段と、 入力される音声の音量に対応付けられた吹き出し画像デ
    ータを、前記吹き出し画像記憶手段から読み出して吹き
    出し画像を形成する吹き出し画像形成手段と、 入力される音声を言語認識し、認識された言語をそれぞ
    れ文字画像に変換する文字画像形成手段と、 この文字画像形成手段により形成された文字画像の表示
    態様を、入力される音声の音量に応じて異ならせて前記
    吹き出し画像中に表示する表示制御手段とを具備するこ
    とを特徴とする画像処理装置。
  3. 【請求項3】 各種形態の吹き出しを形成する複数の吹
    き出し画像データを記憶する吹き出し画像記憶手段と、 入力される音声の音程に対応付けられた吹き出し画像デ
    ータを、前記吹き出し画像記憶手段から読み出して吹き
    出し画像を形成する吹き出し画像形成手段と、 入力される音声を言語認識し、認識された言語をそれぞ
    れ文字画像に変換する文字画像形成手段と、 この文字画像形成手段により形成された文字画像の表示
    態様を、入力される音声の音程に応じて異ならせて前記
    吹き出し画像中に表示する表示制御手段とを具備するこ
    とを特徴とする画像処理装置。
  4. 【請求項4】 各種形態の吹き出しを形成する複数の吹
    き出し画像データを記憶する吹き出し画像記憶手段と、 入力される音声の音量および音程に対応付けられた吹き
    出し画像データを、前記吹き出し画像記憶手段から読み
    出して吹き出し画像を形成する吹き出し画像形成手段
    と、 入力される音声を言語認識し、認識された言語をそれぞ
    れ文字画像に変換する文字画像形成手段と、 この文字画像形成手段により形成された文字画像の表示
    態様を、入力される音声の音量および音程に応じて異な
    らせて前記吹き出し画像中に表示する表示制御手段とを
    具備することを特徴とする画像処理装置。
  5. 【請求項5】 前記表示制御手段が異ならせる表示態様
    は、文字画像の大きさおよび表示色のいずれか一方、あ
    るいは両方であることを特徴とする請求項1〜4のいず
    れかに記載の画像処理装置。
  6. 【請求項6】 前記表示制御手段は、音量あるいは音程
    のいずれか一方、もしくは両方に応じて1語毎の文字画
    像の大きさを可変制御することを特徴とする請求項2〜
    4のいずれかに記載の画像処理装置。
JP6271697A 1997-03-17 1997-03-17 画像処理装置 Abandoned JPH10261099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6271697A JPH10261099A (ja) 1997-03-17 1997-03-17 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6271697A JPH10261099A (ja) 1997-03-17 1997-03-17 画像処理装置

Publications (1)

Publication Number Publication Date
JPH10261099A true JPH10261099A (ja) 1998-09-29

Family

ID=13208352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6271697A Abandoned JPH10261099A (ja) 1997-03-17 1997-03-17 画像処理装置

Country Status (1)

Country Link
JP (1) JPH10261099A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215533A (ja) * 2001-01-24 2002-08-02 Victor Co Of Japan Ltd コミック自動生成装置
JP2002247531A (ja) * 2001-02-14 2002-08-30 Sharp Corp 画像処理システム
JP2003085572A (ja) * 2001-09-11 2003-03-20 Nippon Hoso Kyokai <Nhk> 漫画生成装置及び漫画生成プログラム
JP2004126786A (ja) * 2002-09-30 2004-04-22 Konami Co Ltd 通信装置、プログラム、ならびに通信方法
WO2006092935A1 (ja) * 2005-03-03 2006-09-08 Konami Digital Entertainment Co., Ltd. ゲーム装置、ゲーム装置の制御方法及び情報記憶媒体
JP2010157192A (ja) * 2009-01-05 2010-07-15 Nintendo Co Ltd 描画処理プログラムおよび情報処理装置
JP2013008031A (ja) * 2011-06-24 2013-01-10 Honda Motor Co Ltd 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム
JPWO2014097748A1 (ja) * 2012-12-18 2017-01-12 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 特定の話者の音声を加工するための方法、並びに、その電子装置システム及び電子装置用プログラム
JP2017018414A (ja) * 2015-07-13 2017-01-26 株式会社コロプラ ユーザ入力支援のためのコンピュータ・プログラム
JP2020121165A (ja) * 2020-04-21 2020-08-13 株式会社コロプラ ユーザ入力支援のためのコンピュータ・プログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215533A (ja) * 2001-01-24 2002-08-02 Victor Co Of Japan Ltd コミック自動生成装置
JP2002247531A (ja) * 2001-02-14 2002-08-30 Sharp Corp 画像処理システム
JP2003085572A (ja) * 2001-09-11 2003-03-20 Nippon Hoso Kyokai <Nhk> 漫画生成装置及び漫画生成プログラム
US7546536B2 (en) 2002-09-30 2009-06-09 Konami Digital Entertainment Co., Ltd. Communication device, communication method, and computer usable medium
JP2004126786A (ja) * 2002-09-30 2004-04-22 Konami Co Ltd 通信装置、プログラム、ならびに通信方法
KR100935570B1 (ko) * 2005-03-03 2010-01-07 가부시키가이샤 코나미 데지타루 엔타테인멘토 게임 장치, 게임 장치의 제어 방법 및 정보 기억 매체
WO2006092935A1 (ja) * 2005-03-03 2006-09-08 Konami Digital Entertainment Co., Ltd. ゲーム装置、ゲーム装置の制御方法及び情報記憶媒体
US8147329B2 (en) 2005-03-03 2012-04-03 Konami Digital Entertainment Co., Ltd. Game device, control method for the game device, and information storage medium
JP2010157192A (ja) * 2009-01-05 2010-07-15 Nintendo Co Ltd 描画処理プログラムおよび情報処理装置
JP2013008031A (ja) * 2011-06-24 2013-01-10 Honda Motor Co Ltd 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム
JPWO2014097748A1 (ja) * 2012-12-18 2017-01-12 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 特定の話者の音声を加工するための方法、並びに、その電子装置システム及び電子装置用プログラム
JP2017018414A (ja) * 2015-07-13 2017-01-26 株式会社コロプラ ユーザ入力支援のためのコンピュータ・プログラム
JP2020121165A (ja) * 2020-04-21 2020-08-13 株式会社コロプラ ユーザ入力支援のためのコンピュータ・プログラム

Similar Documents

Publication Publication Date Title
JP3248981B2 (ja) 計算機
JP3083640B2 (ja) 音声合成方法および装置
JPH09138767A (ja) 感情表現の通信装置
JPH10261099A (ja) 画像処理装置
CN110148399A (zh) 一种智能设备的控制方法、装置、设备及介质
JP6711044B2 (ja) 画像処理装置、表示装置、アニメーション生成方法及びプログラム
KR20000005183A (ko) 이미지 합성방법 및 장치
CN114464180A (zh) 一种智能设备及智能语音交互方法
JPH05232856A (ja) 音声視覚化方法および装置ならびにそれを用いた語学学習装置
JPH07181992A (ja) 文書読上げ装置及び方法
JP2003018462A (ja) 文字挿入装置および文字挿入方法
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JP6256379B2 (ja) 表示制御装置、表示制御方法、及びプログラム
JP3501488B2 (ja) 音声認識装置及び方法
JPH077335B2 (ja) 会話型文章読み上げ装置
JPWO2020089961A1 (ja) 音声処理装置、およびプログラム
JPH08272388A (ja) 音声合成装置及びその方法
JP2013195928A (ja) 音声素片切出装置
JP2005309173A (ja) 音声合成制御装置、その方法、そのプログラムおよび音声合成用データ生成装置
JP2018196922A (ja) ロボット制御システム
JP2003296753A (ja) 聴覚障害者用対話システム
JP2003141547A (ja) 手話翻訳装置および手話翻訳方法
JPH07244496A (ja) テキスト朗読装置
KR102400626B1 (ko) 전용 캐릭터를 활용한 다중언어 동시 교육 시스템 및 그 실행 방법
JPH0877152A (ja) 音声合成装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060202

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20060214