JP3073176U - 音声ドライブ動画面用イメージデータ生成装置 - Google Patents

音声ドライブ動画面用イメージデータ生成装置

Info

Publication number
JP3073176U
JP3073176U JP2000003130U JP2000003130U JP3073176U JP 3073176 U JP3073176 U JP 3073176U JP 2000003130 U JP2000003130 U JP 2000003130U JP 2000003130 U JP2000003130 U JP 2000003130U JP 3073176 U JP3073176 U JP 3073176U
Authority
JP
Japan
Prior art keywords
image
mouth
change
image data
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000003130U
Other languages
English (en)
Inventor
嘉朗 秋山
Original Assignee
秋山 英彦
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 秋山 英彦 filed Critical 秋山 英彦
Priority to JP2000003130U priority Critical patent/JP3073176U/ja
Application granted granted Critical
Publication of JP3073176U publication Critical patent/JP3073176U/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【目的】 少ないまたは1つの顔の画像のみを準備する
だけで十分であり、送信時に多量のデータを送る必要の
ないような電話装置もしくは独立した画像生成装置を構
成することができる音声ドライブ動画面用イメージデー
タ生成装置を提供する。 【構成】 発声者の特定の音声に対応する口の状態変化
の代表例を予めサンプリングして格納するサンプリング
格納手段と、発声者の顔の1つの画像を読み込む読み込
み手段と、該読み込み手段に読み込んだ画像の口に対し
て前記サンプリング格納手段に格納された口の状態変化
に基づいて画像の口に対して変更を加える変更追加手段
と、該変更追加手段で変更された口の状態を格納する格
納手段と、を設ける。

Description

【考案の詳細な説明】
【0001】
【考案の属する技術分野】
本考案は、音声ドライブ動画面用イメージデータ生成装置に関し、特に、携帯電 話、パソコン通信等に用いるのに適した音声ドライブ動画面用イメージデータ生 成装置に関する。
【0002】
【従来の技術】
一般に提供されている音声ドライブ画像付き電話装置もしくはテレビ会議電話 装置などのいわゆるテレビ会議で用いられる技術では、双方向に発信者両方の画 像と音声を送受信するようになっている。この技術では、テレビ会議等への出席 者の画像を送るために、双方にカメラを備える必要がある。このため、カメラを 備えることなしに発信者の顔の画像を双方に送信するようにした表示装置付きの 電話装置を用いることは困難である。
【0003】 このことを解決するために、本考案者は、発信側の装置から基本的な顔画像の データを予め受信側の装置に送信しておいて、あとで送信される発声者の音素を 音声認識機能によって認識し、そのデータによって顔画像の動きを受信側の装置 で音声と共に視聴し得るようにした技術を提案している(登録実用新案第306 2080号 )。
【0004】
【発明が解決しようとする課題】
この登録実用新案の考案では、少なくともいくつか音声の音素に対応する顔( 実質的には、顔全体)の画像のパターンを予め準備し、電話装置もしくは通信事 業者のサーバ等のメモリに格納する必要があり、また、その中の1つの方法では 、送信毎に、画像を送る必要がある。この結果、電話装置もしくはサーバ等は大 容量のメモリを備える必要であり、送信時に多量のデータを送る必要がある。
【0005】 したがって、本考案の目的は、少ないまたは1つの顔の画像のみを準備するだ けで十分であり、送信時に多量のデータを送る必要のないように電話装置を構成 することができる音声ドライブ動画面用イメージデータ生成装置を提供すること にある。
【0006】
【課題を解決するための手段】
前述の目的を達成するために、本考案は、発声者が複数の特定の音声を発声し たとき、発声者の顔の画像を読み込む読み込み手段と、該読み込み手段に読み込 んだ画像から音声に対応する口の状態変化を抽出する変化抽出手段と、前記変化 抽出手段で抽出した口の状態を格納する状態格納手段と、を有することを特徴と する音声ドライブ動画面用イメージデータ生成装置を採用するものである。
【0007】 本考案は、また、発声者が音声を発声したときの発声者の顔の画像を読み込む 手段と、該読み込み手段に読み込んだ画像から特定の音声に対応する画像だけを 選択する画像選択手段と、該画像選択手段で選択した画像から音声に対応する口 の状態変化を抽出する変化抽出手段と、前記変化抽出手段で抽出した口の状態を 格納する状態格納手段と、を有することを特徴とする音声ドライブ動画面用イメ ージデータ生成装置を採用するものである。
【0008】 本考案は、さらに、発声者の特定の音声に対応する口の状態変化の代表例を予 めサンプリングして格納するサンプリング格納手段と、発声者の顔の1つの画像 を読み込む読み込み手段と、該読み込み手段に読み込んだ画像の口に対して前記 サンプリング格納手段に格納された口の状態変化に基づいて画像の口に対して変 更を加える変更追加手段と、該変更追加手段で変更された口の状態を格納する格 納手段と、を有することを特徴とする音声ドライブ動画面用イメージデータ生成 装置を採用するものである。
【0009】 ここで、本考案は、前記口の状態変化は唇の輪郭の変化で表すことが好ましく 、また、前記特定の音声が母音であることが好ましい。
【0010】 さらに、本考案は、前述の音声ドライブ動画面用イメージデータ生成装置を用 いた電話装置において、音声を感知する感知手段と、該感知手段で感知した特定 の音に対して識別する音声識別手段と、前記音声識別手段で識別した特定の音に 対応する口の状態変化に基づいて発声者の顔の画像を表示する表示手段と、を有 することを特徴とする電話装置を採用するものである。
【0011】
【考案の実施の形態】
次に、本考案の実施例を図面を参照して説明する。図1は、本考案の実施例1 および2の音声ドライブ動画面用イメージデータ生成装置の動作の流れを示すフ ローチャートである。図2は、本考案の実施例3の音声ドライブ動画面用イメー ジデータ生成装置の動作の流れを示すフローチャートである。図3は、実施例3 で用いられるサンプリング工程を説明するための図である。図4は、本考案の音 声ドライブ動画面用イメージデータ生成装置を電話装置に適用したときの動作の 流れを示すフローチャートである。
【0012】 最初に、本考案の基本的原理を説明すると、顔の表情は、笑ったり、怒ったり 泣いたり、話したりするとき等に色々と変化する。電話装置で相手の顔を見なが ら話す際には、話をするときの相手の顔の表情の基本的変化がわかればほぼ十分 であるので、本考案では、話をするときの顔の表情で特に変化する部分、少なく とも口の部分(さらに、唇の状態の変化)に着目し、口の部分の変化を含む顔の 画像データを生成するものである。
【0013】 そして、口の部分の変化は、音声中の母音(日本語では、あ、い、う、え、お )が共通であれば、ほぼ同様に変化するので、基本的には、音声中の母音を識別 し、その母音に合った顔の表情を出力するようにしたものである。しかし、母音以 外の音(例えば、笑い声等)も合わせて識別してもよいものである。
【0014】 また、口部分の画像中の座標軸上の位置決めは、パターンマッチングや射影処理 法に基づいて得られた顔の輪郭に対する口の中央部分を基準とし、唇の輪郭を発 声音素、少なくとも各母音ごとに決定する。以下、図面を参照して詳細に説明する 。
【0015】 (実施例1) 最初に、図1を参照する。電話装置の使用者に、特定の音(例えば、特に母音 を発生してもらい(ステップS1)、そのときの顔の表情をカメラ(特に、デジタル カメラ)によって撮影し、画像データとしてメモリに格納する(即ち、画像読み込み を行う)(ステップS2)。
【0016】 次に、顔の画像データから唇の輪郭を抽出し(ステップS3)、その輪郭をデ ータとして格納する(ステップS4)。
【0017】 (実施例2) 引き続き、図1を参照すると、電話装置の使用者に、ある適当な文章を発声し てもらい(ステップS11)、発声時の顔の表情を画像として読み込み(ステッ プS12)、その画像の中から特定の音、例えば、母音に対応する画像を選択す る(ステップS13)。その後、前述したステップ3、ステップ4が行われる。
【0018】 (実施例3) 最初に、特定の音声に対応する唇の輪郭を得るために、特に音声ドライブ電話 装置の使用者に限られず、複数の適当な人が選ばれて発声が行われ、特定の音声 に対応する顔の表情のサンプリングが行われる(ステップS21)。ここで、図 3を参照すると、母音に対応する唇の輪郭の代表的なサンプルが表されている。 このようなサンプルを得て、それを唇の輪郭のデータとして読み込む(ステップ S22)。
【0019】 次に、電話装置の使用者の顔の表情の画像が読み込まれ、ステップS22で得 られた唇のデータで、特定の音声に対応する顔の画像が作成され(ステップS2 3)、格納される(ステップS24)。
【0020】 次に、前述のようにして生成された画像データを用いる電話装置の動作の流れ を説明する。図4を参照すると、電話装置での通話の際に、音声が感知されるの を待って(ステップS31)、音声を感知すると、音声を識別する(ステップS 32)。音声を認識すると、その音声(特に、母音)に対応する唇の輪郭のデー タを読み出し(ステップS33)、唇の輪郭のデータに基づいて電話装置の表示 画面に顔の画像の一部として表示する。
【0021】 (他の実施例) 前述の説明は、電話装置内で、口、詳細には、唇の輪郭の変化状態に対応して 顔の画像を作成しているが、音声ドライブ動画面用イメージデータ生成装置内で 、口、詳細には、唇の輪郭の変化状態に対応して顔の画像を作成し、メモリに格納 し、電話装置では、特定の音声に応じて顔の画像を読み出して表示してもよい。
【0022】 前述の実施例においては、基本的な顔画像原画として、カメラにより撮影され たものを述べているが、使用者の顔を代表するイラスト、似顔絵、アニメーション 画、横顔等を原画面の1つとして採用してもよい。
【0023】 また、本考案の装置を電話装置の一部として備えても、電話装置とは独立した 画像生成装置で用いてもよい。
【0024】
【考案の効果】
以上説明したように、本考案によれば、少ないまたは1つの顔の画像のみを準 備するだけで十分であり、送信時に多量のデータを送る必要のないように携帯電 話を構成することができる音声ドライブ動画面用イメージデータ生成装置が得ら れる。
【図面の簡単な説明】
【図1】図1は、本考案の実施例1および2の音声ドラ
イブ動画面用イメージデータ生成装置の動作の流れを示
すフローチャートである。
【図2】図2は、本考案の実施例3の音声ドライブ動画
面用イメージデータ生成装置の動作の流れを示すフロー
チャートである。
【図3】図3は、実施例3で用いられるサンプリング工
程を説明するための図である。
【図4】図4は、本考案の音声ドライブ動画面用イメー
ジデータ生成装置を携帯電話に適用したときの動作の流
れを示すフローチャートである。

Claims (11)

    【実用新案登録請求の範囲】
  1. 【請求項1】 発声者が複数の特定の音声を発声した
    とき、発声者の顔の画像を読み込む読み込み手段と、該
    読み込み手段に読み込んだ画像から音声に対応する口の
    状態変化を抽出する変化抽出手段と、前記変化抽出手段
    で抽出した口の状態を格納する状態格納手段と、を有す
    ることを特徴とする音声ドライブ動画面用イメージデー
    タ生成装置。
  2. 【請求項2】 発声者が音声を発声したときの発声者の
    顔の画像を読み込む手段と、該読み込み手段に読み込ん
    だ画像から特定の音声に対応する画像だけを選択する画
    像選択手段と、該画像選択手段で選択した画像から音声
    に対応する口の状態変化を抽出する変化抽出手段と、前
    記変化抽出手段で抽出した口の状態を格納する状態格納
    手段と、を有することを特徴とする音声ドライブ動画面
    用イメージデータ生成装置。
  3. 【請求項3】 発声者の特定の音声に対応する口の状態
    変化の代表例を予めサンプリングして格納するサンプリ
    ング格納手段と、発声者の顔の1つの画像を読み込む読
    み込み手段と、該読み込み手段に読み込んだ画像の口に
    対して前記サンプリング格納手段に格納された口の状態
    変化に基づいて画像の口に対して変更を加える変更追加
    手段と、該変更追加手段で変更された口の状態を格納す
    る格納手段と、を有することを特徴とする音声ドライブ
    動画面用イメージデータ生成装置。
  4. 【請求項4】 請求項1ないし3のいずれか1つに記載
    の音声ドライブ動画面用イメージデータ生成装置におい
    て、前記口の状態を格納する手段は、顔の輪郭に対する
    口の中心位置を座標軸上で口の輪郭から決定し、格納す
    ることを特徴とする音声ドライブ動画面用イメージデー
    タ生成装置。
  5. 【請求項5】 請求項1ないし3のいずれか1つに記載
    の音声ドライブ動画面用イメージデータ生成装置におい
    て、前記口の状態変化は唇の輪郭の変化で表すことを特
    徴とする音声ドライブ動画面用イメージデータ生成装
    置。
  6. 【請求項6】 請求項1ないし3のいずれか1つに記載
    の音声ドライブ動画面用イメージデータ生成装置におい
    て、前記特定の音声が母音であることを特徴とする音声
    ドライブ動画面用イメージデータ生成装置。
  7. 【請求項7】 請求項1ないし6のいずれか1つに記載
    の音声ドライブ動画面用イメージデータ生成装置を用い
    る電話装置において、音声を感知する感知手段と、該感
    知手段で感知した特定の音に対して識別する音声識別手
    段と、前記音声識別手段で識別した特定の音に対応する
    口の状態変化に基づいて発声者の顔の画像を表示する表
    示手段と、を有することを特徴とする電話装置。
  8. 【請求項8】 発声者が複数の特定の音声を発声したと
    き、発声者の顔の画像を読み込む読み込み手段と、該読
    み込み手段で読み込んだ顔の画像を格納する状態格納手
    段と、を有することを特徴とする音声ドライブ動画面用
    イメージデータ生成装置。
  9. 【請求項9】 発声者が音声を発生したときの発生者の
    顔の画像を読み込む手段と、該読み込み手段に読み込ん
    だ画像から特定の音声に対応する顔の画像だけを選択す
    る画像選択手段と、前記画像選択手段で選択した顔の画
    像を格納する状態格納手段と、を有することを特徴とす
    る音声ドライブ動画面用イメージデータ生成装置。
  10. 【請求項10】 請求項8または9記載の音声ドライブ
    動画面用イメージデータ生成装置において、前記特定の
    音声が母音であることを特徴とする音声ドライブ動画面
    用イメージデータ生成装置。
  11. 【請求項11】 請求項8ないし10のいずれか1つに
    記載の音声ドライブ動画面用イメージデータ生成装置を
    用いる電話装置において、音声を感知する感知手段と、
    該感知手段で感知した特定の音に対して識別する音声識
    別手段と、前記音声識別手段で識別した特定の音に対応
    する発声者の顔を画像を表示する表示手段と、を有する
    ことを特徴とする電話装置。
JP2000003130U 2000-05-11 2000-05-11 音声ドライブ動画面用イメージデータ生成装置 Expired - Fee Related JP3073176U (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000003130U JP3073176U (ja) 2000-05-11 2000-05-11 音声ドライブ動画面用イメージデータ生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000003130U JP3073176U (ja) 2000-05-11 2000-05-11 音声ドライブ動画面用イメージデータ生成装置

Publications (1)

Publication Number Publication Date
JP3073176U true JP3073176U (ja) 2000-11-14

Family

ID=43206419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000003130U Expired - Fee Related JP3073176U (ja) 2000-05-11 2000-05-11 音声ドライブ動画面用イメージデータ生成装置

Country Status (1)

Country Link
JP (1) JP3073176U (ja)

Similar Documents

Publication Publication Date Title
CN110446000B (zh) 一种生成对话人物形象的方法和装置
EP2210214B1 (en) Automatic identifying
CN111294463B (zh) 一种智能应答方法及系统
JP2007147762A (ja) 発話者予測装置および発話者予測方法
JP4761568B2 (ja) 会話支援装置
WO2019206186A1 (zh) 唇语识别方法及其装置、增强现实设备以及存储介质
JP7279494B2 (ja) 会議支援装置、および会議支援システム
JP2019220848A (ja) データ処理装置、データ処理方法及びプログラム
CN113194203A (zh) 一种用于听障人士的沟通系统、接听拨打方法及通讯系统
CN116129931B (zh) 一种视听结合的语音分离模型搭建方法及语音分离方法
JP2003125086A (ja) 発信の作成者を確かめるシステムコンポーネントを有する通信システム
JP2003037826A (ja) 代理画像表示装置およびテレビ電話装置
JP2010034695A (ja) 音声応答装置及び方法
JP2006235712A (ja) 会話収録装置
JP3073176U (ja) 音声ドライブ動画面用イメージデータ生成装置
CN109616116A (zh) 通话系统及其通话方法
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
US11848026B2 (en) Performing artificial intelligence sign language translation services in a video relay service environment
KR100849027B1 (ko) 음성 신호에 대한 립싱크 동기화 방법 및 장치
JP2001319241A (ja) 音声ドライブ動画面用イメージデータ生成装置
KR20050079125A (ko) 휴대단말기의 대기화면과 벨신호 설정장치 및 방법
JP2000333150A (ja) テレビ会議システム
JP5495612B2 (ja) カメラ制御装置及び方法
JP2001357414A (ja) アニメーション通信方法およびシステム並びにそれに用いる端末装置
CN111091807A (zh) 语音合成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees