JPH11353468A - 発話速度計測システム、方法および記録媒体 - Google Patents

発話速度計測システム、方法および記録媒体

Info

Publication number
JPH11353468A
JPH11353468A JP10163796A JP16379698A JPH11353468A JP H11353468 A JPH11353468 A JP H11353468A JP 10163796 A JP10163796 A JP 10163796A JP 16379698 A JP16379698 A JP 16379698A JP H11353468 A JPH11353468 A JP H11353468A
Authority
JP
Japan
Prior art keywords
time
lip
utterance
mora
movement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10163796A
Other languages
English (en)
Other versions
JP4017748B2 (ja
Inventor
Akira Nakamura
章 中村
Masato Fujii
真人 藤井
Hajime Sonehara
源 曽根原
Kazuhisa Iguchi
和久 井口
Yuji Nojiri
裕司 野尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP16379698A priority Critical patent/JP4017748B2/ja
Publication of JPH11353468A publication Critical patent/JPH11353468A/ja
Application granted granted Critical
Publication of JP4017748B2 publication Critical patent/JP4017748B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

(57)【要約】 【課題】 雑音の影響を受けることなく発話速度を計測
する。 【解決手段】 映像の中の発声者の唇の動きからモーラ
(音節)の変化を検出する。このために唇の特徴点の移
動軌跡を動き検出部4により検出し、モーラの変化時に
現れる特徴点の大きな移動軌跡の変化すなわち、動きベ
クトルの変化を発話検出部5で検出する。モーラの変化
の回数がモーラ数カウンター6により計数され、その計
数結果が発話速度に換算される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、発話された音声の
発話速度を計測する発話計測システム、方法および記録
媒体に関する。
【0002】
【従来の技術】従来、発話速度計測システムとしては音
声認識の手法を使用して発話速度を測定するシステム
(特開平7−295588号公報)が提案されている。
このシステムでは入力音声中の母音を音声認識により検
出し、所望の時間区間内に検出した母音数を音節数に換
算する。その音節数を時間区間の値で除した値を発話速
度の計測値としている。
【0003】
【発明が解決しようとする課題】しかしながら、計測対
象の音声が発声されている環境下に雑音や他人の音声、
音響が混入すると、音声のS/N比が音声認識にとって
良好なものとならない場合がある。さらに曖昧に発声さ
れた場合なども音声認識を行うことが困難となる。この
ような状態では極端な場合、発話速度を測定することが
困難となる。
【0004】そこで、本発明の目的は、このような点に
鑑みて、映像の唇の動きから発話速度を計測することに
より音声の発声環境に影響されない発話速度計測システ
ム、方法および記録媒体を提供することにある。
【0005】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、発話時の唇の動きを撮影
した映像の中の、前記唇上の特徴点の移動量を時系列的
に検出する位置検出手段と、該位置検出手段により検出
された隣接の2つの時点の移動量の変化を算出し、当該
算出結果が予め定めた範囲を超える時点をモーラの変化
の時点として検出するモーラ検出手段と、該モーラの検
出手段によりモーラの変化が検出される所定時間内での
回数を計数する計数手段と、該計数手段により計数され
た計数結果を発話速度に換算する演算処理手段とを具え
たことを特徴とする。
【0006】請求項2の発明は、請求項1に記載の発話
速度計測システムにおいて、前記映像をカラーの映像信
号の形態で入力する入力手段と、当該入力されたカラー
の映像信号を輝度信号に変換して前記位置検出手段に供
給する信号処理手段とをさらに具えたことを特徴とす
る。
【0007】請求項3の発明は、請求項1に記載の発話
速度計測システムにおいて、前記唇の特徴点は前記唇の
水平および垂直方向のそれぞれの方向の1つの端点であ
ることを特徴とする。
【0008】請求項4の発明は、請求項1に記載の発話
速度計測システムにおいて、前記特徴点は、水平方向お
よび垂直方向の移動量の検出のために当該水平方向およ
び垂直方向に対応して2つ用意されていることを特徴と
する。
【0009】請求項5の発明は、発話時の唇の動きを撮
影した映像の中の、前記唇上の特徴点の移動量を時系列
的に検出し、隣接の2つの時点について当該検出された
移動量の変化を算出し、当該算出結果が予め定めた範囲
を超える時点をモーラの変化の時点として検出し、該モ
ーラの変化が検出される所定時間内での回数を計数し、
当該計数された計数結果を発話速度に換算することを特
徴とする。
【0010】請求項6の発明は、請求項5に記載の発話
速度計測方法において、前記映像をカラーの映像信号の
形態で入力し、当該入力されたカラーの映像信号を輝度
信号に変換して前記特徴点の移動量を検出することを特
徴とする。
【0011】請求項7の発明は、請求項5に記載の発話
速度計測方法において、前記唇の特徴点は前記唇の水平
および垂直方向のそれぞれの方向の1つの端点であるこ
とを特徴とする。
【0012】請求項8の発明は、請求項5に記載の発話
速度計測方法において、前記特徴点は、水平方向および
垂直方向の移動量の検出のために当該水平方向および垂
直方向に対応して2つ用意されていることを特徴とす
る。
【0013】請求項9の発明は、コンピュータにより実
行するプログラムを記録した記録媒体において、前記プ
ログラムは、発話時の唇の動きを撮影した映像の中の、
前記唇上の特徴点の移動量を時系列的に検出するステッ
プと、隣接の2つの時点について当該検出された移動量
の変化を算出するステップと、当該算出結果が予め定め
た範囲を超える時点をモーラの変化の時点として検出す
るステップと、該モーラの変化が検出される所定時間内
での回数を計数するステップと、当該計数された計数結
果を発話速度に換算するステップとを具えたことを特徴
とする。
【0014】請求項10の発明は、請求項9に記載の記
録媒体において、前記映像をカラーの映像信号の形態で
入力するステップと、当該入力されたカラーの映像信号
を輝度信号に変換して前記特徴点の移動量を検出するス
テップをさらに具えたことを特徴とする。
【0015】請求項11の発明は、請求項9に記載の記
録媒体において、前記唇の特徴点は前記唇の水平および
垂直方向のそれぞれの方向の1つの端点であることを特
徴とする。
【0016】請求項12の発明は、請求項9に記載の記
録媒体において、前記特徴点は、水平方向および垂直方
向の移動量の検出のために当該水平方向および垂直方向
に対応して2つ用意されていることを特徴とする。
【0017】
【発明の実施の形態】以下、図面に示す実施例に基づい
て本発明の実施形態を詳細に説明する。
【0018】図1は本発明を適用した発話速度計測シス
テムのシステム構成を示す。発話音声にあわせて撮影す
る映像はハイビジョン、NTSC、PAL等の各方向に
適応可能であるが、ここでは、ハイビジョンについての
場合を示す。
【0019】図1において、A/D変換部1はハイビジ
ョンテレビ信号をデジタル処理可能なデジタル信号にア
ナログ/デジタル変換する。
【0020】動きベクトル検出部10は、後述の前処理
部2、画像抜きだし部3、動き検出部4および発話検出
部5を有する。モーラ数カウンター部6は、動きベクト
ル検出部10により検出されたモーラの所定時間あたり
の個数を計数する。
【0021】動きベクトル検出部10の各構成部2〜5
およびモーラ数カウンター6の処理は情報処理装置がプ
ログラムを実行することにより実現される。情報処理装
置としては、パーソナルコンピュータ等の汎用コンピュ
ータや、メモリとデジタルプロセッサ等を有するデジタ
ル回路等を使用することができる。
【0022】このようなシステム構成におけるシステム
動作を次に説明する。
【0023】(a)唇の動きを撮影した映像(例えば、
ニュースなどのようなバストショットで撮影された映像
の)を外部から発明速度計測システムに入力する。
【0024】(b)映像をRGB4:4:4フォーマッ
トでA/D変換部1においてA/D変換する。
【0025】(c)変換された映像から、唇の動きベク
トルを検出するための前処理を前処理部2で行う。具体
的には映像(信号)からマトリクスによる動きベクトル
検出用の照度信号に変換する。
【0026】(d)前処理部2で前処理されて転送さ
れ、唇の動きを伴った映像から、唇の近傍の画像を画像
抜きだし部3において、抜きだす。
【0027】(e)例えば、勾配法に基づく初期偏位ベ
クトル(例えば、候補ベクトル:8種、ブロックサイ
ズ:8画素、8ライン)を用いた反復勾配法(例えば、
最大反復回数:2回、ブロックサイズ:8画素、8ライ
ン、特願平9−249134号、テレビジョン学会誌V
ol.48,No.1,pp84−94(1994)、
NHK技研R&D,No.26,1993年9月参照)
により、唇の近傍の動きベクトルを動き検出部4におい
て求める。
【0028】(f)発話検出部5において、唇の上下方
向の動きベクトル、および左右方向の動きベクトルのベ
クトルを検出する。上下方向の動きベクトル、および左
右方向の動きベクトルがある一定値以上の変化を示した
場合、1モーラを発生したことになる。発話検出部5で
は、左右、上下方向の動きベクトルを取得すると共にし
きい値を比較し、唇の動きから1モーラ毎の発声を検出
する。(唇の上下方向の動きベクトルの定義内容を図2
に、左右方向の動きベクトルの定義内容を図3に示す。
また、唇の上下方向、および左右方向の動きベクトルの
変化例を図4に示す。) (g)発話検出部5により1モーラの発声を検出する毎
にモーラ数カウンター6にてモーラ数を計数する。一定
単位時間毎にモーラ数カウンター6の計数結果を不図示
の除算器により単位時間(例えば、秒)当たりで除算
し、単位時間(例えば、秒)当たり平均和速(例えば、
モーラ/秒)に換算する。
【0029】図2に、唇の上下(垂直)方向の動きベク
トルの定義方法を示す。無音状態(何も発声せず、口を
結んでいる状態)の場合の唇の中央部あるいは上端部を
始点とし、この点(上唇)が上に上がる(開いた)方向
のベクトルを「上下方向の動きベクトル」とし、aaで
あらわす。このベクトルaaは始点を0ベクトルとし
て、上方向が(+)のベクトルである。
【0030】図3に、唇の左右(水平)方向の動きベク
トルの定義方法を示す。無音状態(何も発声せず、口を
結んでいる状態)における、唇の左端(もしくは右端)
を始点として、この点が、外側へ延びる方向を「左右方
向の動きベクトル」とし、bbであらわす。このベクト
ルbbは、始点を0ベクトルとして、外側方向が(+)
のベクトルであり、内側方向が(−)のベクトルであ
る。
【0031】図4は、“あいうえお”と連続で発声した
場合、唇の上下方向の動きベクトル量(上の図)と左右
方向の動きベクトル(下の図)の関係を示した例であ
る。
【0032】このグラフで、 (1)無音(何も発声していない状態)の場合の唇の上
下方向の動きベクトルをaa0 、左右方向の動きベクト
ルをbb0 とする。
【0033】(2)/あ/と発声した場合の唇の上下方
向の動きベクトルをaa1 とする。このときの、左右方
向の動きベクトルをbb1 とする。この場合、全体の唇
の変位SS1
【0034】
【数1】SS1 =aa1 +bb1 と定義する。
【0035】(3)同様に、/い/と発声した場合の唇
の上下方向の動きベクトルをaa2 とする。このとき
の、左右方向の動きベクトルをbb2 とする。この場
合、全体の唇の変位SS2 は、
【0036】
【数2】SS2 =aa2 +bb2 (4)ここで、n番目に発声された単音節における、唇
の変動:MMn
【0037】
【数3】MMn =SSn −SSn-1 と定義すると、発声が、/あ/から/い/に変化する場
合の、唇の変動:MM2は、
【0038】
【数4】MMn =SS2 −SS1 となる。
【0039】ここで、MM2 がある閾値より大きい場
合、1モーラを発声したことになる。この閾値は唇の動
きを撮した映像や、個人差によって差があり、事前に設
定する。発話検出に際し、唇の上下方向の動きベクトル
に加え、左右方向の動きベクトルも勘案することによ
り、例えば、/い//う/と発声した場合、唇の上下方
向の動きベクトルは、aa2 、aa3 となり、
【0040】
【数5】
【0041】の関係があり、発話を検出しにくいが、左
右方向の動きベクトル(bb)も、発話検出のパラメー
タとして導入することにより、正確に発話検出が可能と
なる。
【0042】上述の発話速度計測処理をコンピュータで
実行するための具体的処理内容を説明しておく。映像発
生源、たとえば、テレビジョン、ビデオテープレコー
ダ、ビデオカメラ等で撮影された発話者の唇の映像は、
デジタル変換された後、コンピュータ内のメモリあるい
はハードディスク記憶装置に取り込まれる。映像ここで
は動画像は、複数のフレーム(1画面の静止画像)から
構成されるので、各静止画像の唇の特徴点、本実施形態
では、無音状態の唇の端点位置を検出する。唇の映像
は、たとえば輪郭部を検出したり、背景を除去する画像
処理により得られるので、このようにして取得した唇の
上記特徴点の画面上の位置を検出する。各静止画面から
検出された特徴点の位置情報はメモリに一時格納され
る。この位置情報に基づき上述の反復勾配法等の画像分
析手法により、唇の特徴点の動きベクトルを計算する。
発話の内容(モーラ)が異なると、唇の特徴点の移動軌
跡が大きく変化するので、図4に示すように上下、左右
方向の動きベクトルも変化する。そこで、現時点の動き
ベクトルの値と、隣接する過去の時点の動きベクトルの
値の差分値(この場合、移動量についての差)を取得
し、その差分値をしきい値と比較する。発話内容が変化
した場合には、上記差分値は閾値よりも大きくなるの
で、この時点をたとえば、これまで発声された音節の終
わりおよびこれから発声されようとする音節の始まりと
決定することができる。この音節の区切れが検出される
回数を計数することが上述のモーラの個数を計数するこ
とになる。一定時間(たとえば、1秒)毎にモーラの個
数を計数すると計数値は0(ゼロ)にリセットされて、
以後、計数処理は繰り返し行われる。計数されたモーラ
数を上記一定時間の値で除すと単位時間当たりのモーラ
数、すなわち、発話速度が得られる。
【0043】以上の処理を汎用コンピュータにより実現
するためには構成部2〜6の機能毎の処理ステップを規
定したプログラムを用意しておけばよく、当業者であれ
ば、本明細書に基づき容易にプログラムを作成できるで
あろう。
【0044】このプログラムは発話速度計測システムの
ハード構成に好適な記録媒体に記録しておけばよい。発
話速度計測システムを汎用コンピュータで実現する場合
には、上記プログラムをCDROMやフロッピーディス
クに記録しておき、汎用コンピュータのハードディスク
に実装すればよい。また、発話速度計測システムを、単
体(CPU,メモリ)等で構成する場合には、ROMな
どの不揮発性メモリに記憶するとよい。
【0045】本実施例の他に次の形態を実施することが
できる。
【0046】1)上述の実施形態では、映像のみで発話
速度を計測する例であったが、音声に基づいて発話速度
を計測するシステムと切り替え使用してもよい。この切
り替えはキーボードからの手動により行ってもよいし、
音声のS/N比の値に応じて自動切換えすることが考え
られる。
【0047】2)唇の動きを検出すために用意する特徴
点は、上述の実施形態のように形状的に定まる点(端
点、中央の点)の他に、最大輝度を有する点等の特徴点
を使用することができる。
【0048】3)上述の形態では、水平方向と垂直方向
のそれぞれに特徴点を用意したが、唇の中央部や水平方
向以外の特徴点を最大輝度により決定する場合には、特
徴点は1つでよい。この場合には、移動方向と移動量の
それぞれについての許容範囲以上の変化の有無を検出す
ることになる。
【0049】4)話者を特定者に限定する場合には特徴
点の移動量を、特徴点の位置の変化として取り扱うこと
ができる。この場合には、ベクトルの変化(差分値)を
閾値と比較する代わりに、特徴点の位置がある特定の位
置から、他の特定の位置に移動したか否かを判定する。
ただし、この場合には、不特定話者の唇の動きを分析で
きないという欠点がある。
【0050】5)上述の実施形態では発話速度計測シス
テムに入力する映像信号はアナログのカラー映像信号を
説明したが、モノクロの映像信号でもよい。この場合に
は、カラー映像信号を輝度信号に変換する前処理は不要
となる。さらに、デジタル映像信号の形態で入力を行っ
てもよく、映像信号の形態に好適な入力インターフェー
スを用意するとよい。
【0051】6)本願出願人は、音声の発話速度を変更
可能なシステムを提案しているが、本実施形態の発話速
度計測システムと組み合わせると、映像から計測した発
話速度がある範囲に到達した場合には、音声信号の発話
速度を自動的に好適な速度に変更することも可能とな
る。
【0052】
【発明の効果】以上、説明したように、請求項1、5、
9の発明では、唇の映像上の特徴点の移動量、換言する
と、特徴点の位置の軌跡に基づいて、モーラが変化する
時点を検出し、変化するモーラの個数を計数することで
発話速度を計測する。したがって、音声を分析すること
なく、映像信号のみで、発話速度を計測することが可能
であり、音楽会場等雑音が混在する環境下での発話者の
発話速度を精度よく、計測することができる。また、映
像音声メディア、テレビ電話、テレビジョン中継の映像
伝送媒体を介して発話者と離れた遠隔地でも発話速度を
計測することができる。また、発声者が曖昧な発声を行
なっても、上記発明では、モーラの変化を唇の変化で検
出するので、曖昧な音声の影響を受けない。
【0053】請求項2、6,10の発明では、映像をた
とえば、NTSC等のどのカラーの映像信号の形態で入
力することによりテレビ受像機、テープレコーダ、ビデ
オカメラ等既存のカラー映像発生源により取得した映像
の発話速度を計測することができる。
【0054】請求項3、7,11の発明では、唇の特徴
点を前記唇の水平および垂直方向のそれぞれの方向の1
つの端点とすることにより、唇の形が変形しても、端点
の位置の変化を追跡することで、唇の動きを検出するこ
とができる。また、画像処理上、端点は、画素位置の比
較のみで簡単に検出できるので、計測処理自体の短縮化
に寄与することができる。
【0055】特徴点が1つの場合には特徴点の位置が2
次元空間上の座標値で表されるので、移動量の計算が複
雑になる。請求項4、8、12の発明では特徴点を、水
平方向および垂直方向に対応して2つ用意することによ
り、1次元空間上の(直線上の)位置だけを取り扱えば
よいので、計算量が減少し、計測処理が短縮化される。
【図面の簡単な説明】
【図1】本発明実施形態のシステム構成を示すブロック
図である。
【図2】唇の上下方向の動きベクトルの定義を説明する
ための説明図である。
【図3】唇の左右方向の動きべクテルの定義を説明する
ための説明図である。
【図4】本発明実施例の動きベクトルの変化例を示す説
明図である。
【符号の説明】
1 A/D変換器 2 前処理部 3 画像抜きだし部 4 動き検出部 5 発話検出部 6 モーラ数カウンター 10 動きベクトル検出部
フロントページの続き (72)発明者 井口 和久 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 (72)発明者 野尻 裕司 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 発話時の唇の動きを撮影した映像の中
    の、前記唇上の特徴点の移動量を時系列的に検出する位
    置検出手段と、 該位置検出手段により検出された隣接の2つの時点の移
    動量の変化を算出し、当該算出結果が予め定めた範囲を
    超える時点をモーラの変化の時点として検出するモーラ
    検出手段と、 該モーラの検出手段によりモーラの変化が検出される所
    定時間内での回数を計数する計数手段と、 該計数手段により計数された計数結果を発話速度に換算
    する演算処理手段とを具えたことを特徴とする発話速度
    計測システム。
  2. 【請求項2】 請求項1に記載の発話速度計測システム
    において、前記映像をカラーの映像信号の形態で入力す
    る入力手段と、当該入力されたカラーの映像信号を輝度
    信号に変換して前記位置検出手段に供給する信号処理手
    段とをさらに具えたことを特徴とする発話速度計測シス
    テム。
  3. 【請求項3】 請求項1に記載の発話速度計測システム
    において、前記唇の特徴点は前記唇の水平および垂直方
    向のそれぞれの方向の1つの端点であることを特徴とす
    る発話速度計測システム。
  4. 【請求項4】 請求項1に記載の発話速度計測システム
    において、前記特徴点は、水平方向および垂直方向の移
    動量の検出のために当該水平方向および垂直方向に対応
    して2つ用意されていることを特徴とする発話速度計測
    システム。
  5. 【請求項5】 発話時の唇の動きを撮影した映像の中
    の、前記唇上の特徴点の移動量を時系列的に検出し、 隣接の2つの時点について当該検出された移動量の変化
    を算出し、 当該算出結果が予め定めた範囲を超える時点をモーラの
    変化の時点として検出し、 該モーラの変化が検出される所定時間内での回数を計数
    し、 当該計数された計数結果を発話速度に換算することを特
    徴とする発話速度計測方法。
  6. 【請求項6】 請求項5に記載の発話速度計測方法にお
    いて、前記映像をカラーの映像信号の形態で入力し、当
    該入力されたカラーの映像信号を輝度信号に変換して前
    記特徴点の移動量を検出することを特徴とする発話速度
    計測方法。
  7. 【請求項7】 請求項5に記載の発話速度計測方法にお
    いて、前記唇の特徴点は前記唇の水平および垂直方向の
    それぞれの方向の1つの端点であることを特徴とする発
    話速度計測方法。
  8. 【請求項8】 請求項5に記載の発話速度計測方法にお
    いて、前記特徴点は、水平方向および垂直方向の移動量
    の検出のために当該水平方向および垂直方向に対応して
    2つ用意されていることを特徴とする発話速度計測方
    法。
  9. 【請求項9】 コンピュータにより実行するプログラム
    を記録した記録媒体において、前記プログラムは、 発話時の唇の動きを撮影した映像の中の、前記唇上の特
    徴点の移動量を時系列的に検出するステップと、 隣接の2つの時点について当該検出された移動量の変化
    を算出するステップと、 当該算出結果が予め定めた範囲を超える時点をモーラの
    変化の時点として検出するステップと、 該モーラの変化が検出される所定時間内での回数を計数
    するステップと、 当該計数された計数結果を発話速度に換算するステップ
    とを具えたことを特徴とする記録媒体。
  10. 【請求項10】 請求項9に記載の記録媒体において、
    前記映像をカラーの映像信号の形態で入力するステップ
    と、当該入力されたカラーの映像信号を輝度信号に変換
    して前記特徴点の移動量を検出するステップをさらに具
    えたことを特徴とする記録媒体。
  11. 【請求項11】 請求項9に記載の記録媒体において、
    前記唇の特徴点は前記唇の水平および垂直方向のそれぞ
    れの方向の1つの端点であることを特徴とする記録媒
    体。
  12. 【請求項12】 請求項9に記載の記録媒体において、
    前記特徴点は、水平方向および垂直方向の移動量の検出
    のために当該水平方向および垂直方向に対応して2つ用
    意されていることを特徴とする記録媒体。
JP16379698A 1998-06-11 1998-06-11 発話速度計測システム、方法および記録媒体 Expired - Fee Related JP4017748B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16379698A JP4017748B2 (ja) 1998-06-11 1998-06-11 発話速度計測システム、方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16379698A JP4017748B2 (ja) 1998-06-11 1998-06-11 発話速度計測システム、方法および記録媒体

Publications (2)

Publication Number Publication Date
JPH11353468A true JPH11353468A (ja) 1999-12-24
JP4017748B2 JP4017748B2 (ja) 2007-12-05

Family

ID=15780876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16379698A Expired - Fee Related JP4017748B2 (ja) 1998-06-11 1998-06-11 発話速度計測システム、方法および記録媒体

Country Status (1)

Country Link
JP (1) JP4017748B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165153A (ja) * 2000-11-27 2002-06-07 Asaka Co Ltd 映像/音声ずれ補正方法及び装置
WO2004090867A1 (ja) * 2003-04-09 2004-10-21 Toyota Jidosha Kabushiki Kaisha 変化情報認識装置および変化情報認識方法
WO2018130273A1 (en) * 2017-01-11 2018-07-19 Telefonaktiebolaget Lm Ericsson (Publ) Displaying text to a user of a computing device
JP2019060921A (ja) * 2017-09-25 2019-04-18 富士ゼロックス株式会社 情報処理装置、及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165153A (ja) * 2000-11-27 2002-06-07 Asaka Co Ltd 映像/音声ずれ補正方法及び装置
WO2004090867A1 (ja) * 2003-04-09 2004-10-21 Toyota Jidosha Kabushiki Kaisha 変化情報認識装置および変化情報認識方法
US7302086B2 (en) 2003-04-09 2007-11-27 Toyota Jidosha Kabushiki Kaisha Change information recognition apparatus and change information recognition method
US7508959B2 (en) 2003-04-09 2009-03-24 Toyota Jidosha Kabushiki Kaisha Change information recognition apparatus and change information recognition method
WO2018130273A1 (en) * 2017-01-11 2018-07-19 Telefonaktiebolaget Lm Ericsson (Publ) Displaying text to a user of a computing device
JP2019060921A (ja) * 2017-09-25 2019-04-18 富士ゼロックス株式会社 情報処理装置、及びプログラム

Also Published As

Publication number Publication date
JP4017748B2 (ja) 2007-12-05

Similar Documents

Publication Publication Date Title
JP4286860B2 (ja) 動作内容判定装置
JP6464449B2 (ja) 音源分離装置、及び音源分離方法
CA1263187A (en) Image encoding and synthesis
US7480446B2 (en) Variable rate video playback with synchronized audio
KR100820141B1 (ko) 음성 구간 검출 장치 및 방법 그리고 음성 인식 시스템
US20110050939A1 (en) Image processing apparatus, image processing method, program, and electronic device
US6633844B1 (en) Late integration in audio-visual continuous speech recognition
US5625704A (en) Speaker recognition using spatiotemporal cues
EP1555635A1 (en) Image processing apparatus, method and program
Kumar et al. Profile view lip reading
JP2012003326A (ja) 情報処理装置、情報処理方法、およびプログラム
EP1081960A1 (en) Signal processing method and video/voice processing device
JP4715738B2 (ja) 発話検出装置及び発話検出方法
JP2007156493A (ja) 音声区間検出装置及び方法並びに音声認識システム
CN109348277B (zh) 运动像素视频特效添加方法、装置、终端设备及存储介质
CN113077470B (zh) 一种横竖屏转换画面的裁剪方法、系统、装置及介质
Iwano et al. Bimodal speech recognition using lip movement measured by optical-flow analysis
Yoshinaga et al. Audio-visual speech recognition using lip movement extracted from side-face images
JP4281338B2 (ja) 画像検出装置及び画像検出方法
US20040022448A1 (en) Image processor
JP2003348528A (ja) 代表画像選択方法,代表画像選択装置,代表画像選択プログラムおよび代表画像選択プログラムの記録媒体
KR20170129676A (ko) 영상 정보를 기반으로 음성 구간을 검출하는 방법 및 장치
JPH11353468A (ja) 発話速度計測システム、方法および記録媒体
CN113939871A (zh) 讲话区间检测装置、讲话区间检测方法及讲话区间检测程序
JP3377463B2 (ja) 映像/音声ずれ補正システム、方法および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070814

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070919

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140928

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees