JPH0434500A - 会議場音声処理装置 - Google Patents

会議場音声処理装置

Info

Publication number
JPH0434500A
JPH0434500A JP2140849A JP14084990A JPH0434500A JP H0434500 A JPH0434500 A JP H0434500A JP 2140849 A JP2140849 A JP 2140849A JP 14084990 A JP14084990 A JP 14084990A JP H0434500 A JPH0434500 A JP H0434500A
Authority
JP
Japan
Prior art keywords
data
input
section
audio data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2140849A
Other languages
English (en)
Other versions
JP2657258B2 (ja
Inventor
Yasuhito Hayashi
泰仁 林
Naofumi Inmaki
印牧 直文
Kazunori Shimamura
和典 島村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2140849A priority Critical patent/JP2657258B2/ja
Publication of JPH0434500A publication Critical patent/JPH0434500A/ja
Application granted granted Critical
Publication of JP2657258B2 publication Critical patent/JP2657258B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、例えば会議において発言者ごとに入力され
た音声データを蓄積し、その後、特定の発言者のみの音
声データを出力するために用いられる音声処理装置に関
する。
「従来の技術」 従来の複数話者の音声データを蓄積する方式は、音声デ
ータ入力部対応に、各別のメモリ(トラック)に格納す
る方式と、音声データ入力部からの音声データを混合し
たものを単数のメモリに格納する方式とに大別される。
前者の方式は、音声データ入力部の個数によって線形的
に蓄積ハードウェア量が増大するという問題があった。
一方、後者の方式は、蓄積ハードウェア量が、音声デー
タ入力部の数には影響されず一定しており、蓄積装置の
利用効率がよいという利点がある反面、話者ごとに音声
データを再生するには、音声認識処理や声紋照合処理を
組み合わせて、有音単位に話者の識別子をつける方法が
考えられるが、これを実現する回路が複雑化するととも
にハードウェア量が増大するという問題があった。しか
もこのようにしても複数話者が同時に発言した状態の音
声データに対しては話者ごとに個別処理をすることがで
きない。
この発明の目的は、ハードウェア量を増大させずに、複
数話者による入力音声データから、特定話者のみの音声
データを出力することが可能な音声データ処理装置を提
供することにある。
「課題を解決するための手段」 この発明によれば各音声データ入力部から入力された音
声データはそれぞれ各別の音声データ有音抽出部により
有音区間データが抽出され、これら各有音区間データは
音声データ蓄積部に蓄積されると共に、その蓄積された
有音区間データの蓄積メモリアドレス情報とその有音区
間データの開始時刻を示す時間情報とが音声データ入力
部の識別子ごとに音声区間管理情報蓄積部に記憶され、
出力すべき音声データが入力された入力部を示す情報が
入力されると、これに応じたその入力部識別子の時間情
報と蓄積メモリアドレス情報とが読み出され、その読み
出された時間情報の内容にもどすとき、その読み出され
た蓄積メモリアドレス情報から有音区間データが読み出
され、その読み出された有音区間データが音声出力部へ
供給されて音声として出力される。
「実施例」 第1図にこの発明の実施例の構成を示す。マイクロホン
、テープレコーダなどのn個の音声入力装置100は、
n個の音声データ有音抽出部110にそれぞれ接続され
、n個の音声データ有音抽出部110は、音声データ蓄
積処理部120に接続され、音声データ蓄積処理部12
0はm個の音声出力部130に接続され、m個の音声出
力部130はそれぞれm個のスピーカなどの音声出力装
置140にそれぞれ接続され、音声データ蓄積処理部1
20には音声データ表示制御部150および音声データ
並行処理部170が接続され、音声データ表示制御部1
50に、画像表示装置160が接続される。
音声データ有音抽出部110の具体例を第2図に示す、
これは音声入力部111、有音/無音判定部112、音
声データ抽出用蓄積部113、区切り符号付加部114
、無音部分時間測定部115および無音時間しきい値入
力部116からなる。
音声データ蓄積処理部120は例えば第3図に示すよう
に、時間情報測定部121、音声データ処理部122お
よびデータ蓄積部123とからなり、データ蓄積部12
3は、有音区間管理情報蓄積部1231と音声データ蓄
積部1232とよりなる。
第2図において、音声入力装置100を介して入力され
た音声データは、音声データ有音抽出部110内の音声
入力部111に入力され、この音声データに対し、有音
/無音判定部112において、音圧レヘル等により有音
、無音の判定が行われ、有音から無音、無音から有音に
変化した場合には、それぞれ、無音検出信号、有音検出
信号が音声データ抽出用蓄積部113、区切り符号付加
部114および無音部分時間測定部115に対しそれぞ
れ送出される。音声データ抽出用蓄積部113は、音声
入力開始以障、最初の有音検出信号を受信した時点から
、その音声データの第一次蓄積を行う。音声データ抽出
用蓄積部113がその処理中において、有音/無音判定
部112から無音検出信号を区切り符号付加部114が
受信した場合、区切り符号付加部114は音声データ抽
出用蓄積部113に対し、有音区間終了を示す仮区切り
符号を送出し、その時点の入力箇所に仮区切り符号を付
加する。一方、この無音検出信号により無音部分時間測
定部115が起動され、仮区切り符号付加時から、次の
有音検出信号を受信するまでの時間を計測する。
次の有音検出信号受信時に、無音部分時間測定部115
は、仮区切り符号付加時から、次の有音検出信号受信ま
での時間と、無音時間しきい値入力部116からあらか
しめ入力された無音時間しきい値Ttkとを比較し、こ
の時間が無音時間しきい値Tいをこえない場合には、こ
の無音部分は、有音区間中のデータに分類し、仮区切り
符号をはずして、引続き、データ蓄積を行う。仮区切り
符号付加時から、次の有音検出信号を受信するまでの時
間が無音時間しきい値Tthをこえた場合には、仮区切
り符号を本図切り符号に変更する。この時、音声データ
抽出用蓄積部113に記憶された本図切り符号以前の音
声データを有音区間とする。本図切り符号以降のデータ
については、無音区間とし、冗長な情報として、蓄積デ
ータを破棄する。
この処理の後、音声データ抽出用蓄積部113は有音区
間の音声データ有音声データ蓄積処理部120に送信す
る。
第3回において、音声データ蓄積処理部120内の音声
データ処理部122は入力された有音区間音声データを
、データ蓄積部123中の音声データ蓄積部1232に
蓄積する。また、音声データ処理部122は、この蓄積
処理と並行して、有音区間音声データを受信した信号線
により、音声入力のあった入力部111を判定すると同
時に、時間情報測定部121よりその有音区間音声デー
タの開始時刻を示す時間情報(例えば、この音声処理装
置の入力(起動)開始からの経過時間)を読みだし、ど
の入力部111からの入力であるかを示す入力部識別子
、時間情報およびその有音区間音声データが音声データ
蓄積部1232へ記憶された場所を示す蓄積メモリアド
レス情報有音声データの管理情報として、データ蓄積部
123中の有音区関管理情報蓄積部1231に蓄積する
以上説明した、有音区間の抽出ならびに、n個の音声デ
ータ入力部111に応じた識別子の付加を伴ったデータ
蓄積を、n個の音声人力装置に応した各音声データ有音
抽出部110ならびに音声データ蓄積処理部120にお
いて、音声データ並行制御部170の管理のもとに、並
行して行う。
音声データの出力時には、音声データ並行制御部170
を介して、音声データ処理部122に対し、出力すべき
音声データが入力された入力部番号および出力すべき出
力部番号の指示信号を送出する。音声データ処理部12
2は、この指示信号を受けると、有音区間管理情報蓄積
部1231内の音声データの管理情報を参照し、指示さ
れた入力部に対応する入力部識別子で管理される音声デ
ータのみを、その時間情報内容の順に従って、その蓄積
メモリアドレス情報から音声データ蓄積部1232の音
声データを読み出して、入力された出力部番号の指示に
従った複数または単数の音声出力部130に送出し、対
応する音声出力装置140より音声出力がなされる。複
数の入力部から入力された蓄積音声データを一音声出力
装置から同時に出力することも、−人力部からの音声を
複数音声出力装置に出力することも、音声データ並行処
理部170における指示により可能である。
このようにして時間的にばらばらに発言された複数話者
の音声を記憶し、その記憶から指定した特定話者の音声
のみを読み出して音声出力することができる。
第4回に、データ蓄積部123Gこ蓄積された、複数の
音声データ入力部からの入力音声データの時間軸上の存
在状況を単数の画像表示装置160に表示した画面表示
例を示す。この場合は時間情報測定部121の情報を利
用し、音声出力開始時からの経過時間と、管理情報に記
憶されている入力開始からの経過時間とを対応させて一
致した音声データを読み出すと共にその入力部識別子に
より入力部を区別する。この例では5分間分の音声デー
タの有音、無音の別を30秒ごとに区切って表示した例
であり、図中のハツチング部分は有音区間データ、ハン
チング部分の間の白い部分は無音区間を示しており、ハ
ツチングのテクスチャの違いにより、入力部の違いを識
別しており、有音区間音声データは、音声データ入力部
1】1aからの有音区間データ400と、音声データ人
力部111bからの有音区間データ410と、音声デー
タ入力部111cからの有音区間データ420とからな
っている場合である。音声データ表示制御部150は、
有音区間データに関し、音声データの管理情報である時
間情報および、入力部識別子に従って、画像表示装置1
60に表示された時間軸上に、入力部対応の音声データ
を、表示色、テクスチャ等をかえることによって、区別
して表示する。
第5図は、第4回においての表示において、複数入力部
からの音声データが時間軸503上で重複した場合の表
示例を示す図であり、510.520.530の二側を
示している。即ち音声データ入力部111aからの有音
区間データ501、音声データ入力部111bからの有
音区間データ502とが、状態例500に示すように一
部時間的に重なった入力状態にある場合に対し、表示例
510は、重複区間を、先に人力が開始された音声デー
タ入力部111aからの有音区間データ501を示すテ
クスチャで表示する例であり、表示例520は、重複区
間を、後に入力が開始された音声データ入力部111b
からの有音区間データ502を示すテクスチャで表示す
る例であり、表示例530は、重複区間を、音声データ
入力部111aからの有音区間データ501を示すテク
スチャと、後に入力が開始された音声データ入力部11
1bからの有音区間データ502を示すテクスチャとを
、表示上でも重畳させて表示する例である。特に、表示
例530は、複数話者の音声の重複状況が明確に示され
ている。
上述において音声データ蓄積部1232に蓄積する有音
区間音声データに対し区切り符号を付けることなく、有
音区間音声データの蓄積の終わりを示すメモリアドレス
情報も音声データ管理情報として記憶しておいてもよい
「発明の効果」 以上説明したように、この発明によれば、複数の音声入
力部からの入力音声に対し、入力部対応に音声データの
有音区間ごとに、時間情報の他に、入力部識別子及びメ
モリアドレスを管理情報として蓄積し、音声データは有
音区間音声データのみを蓄積しているから、蓄積装置の
規模は比較的小さくてよく、しかも話者側に分離して音
声を出力することが可能であり、音声入力時に、複数話
者の発言が重なった場合にも、特定話者のみの音声出力
が可能である。また急変わり等で話者を区別した音声デ
ータの時間的経過を画面表示することにより、各話者の
発言の順序、発言の回数、発言の時間などを容易に読み
取ることができる。しかも音声認識等の複雑な処理を行
わないためハードウェア量の大幅な増大を伴わすに、行
うことが可能である。
【図面の簡単な説明】
第1図はこの発明の実施例の全体構成例を示すブロック
図、第2図は音声データ有音抽出部の構成例を示すブロ
ック図、第3図は、音声データ蓄積処理部の構成例を示
すフロック図、第4図は画像表示装置の表示画面例を示
す図、第5図は複数人力音声重複時の音声データ画面表
示例を示す図である。 特許出願人 日本電信電話株式会社

Claims (2)

    【特許請求の範囲】
  1. (1)複数の音声データ入力部から入力された音声デー
    タからそれぞれ有音区間のデータを抽出する音声データ
    有音抽出部と、 上記抽出した有音区間データの開始時刻を示す時間情報
    を検出する手段と、 上記抽出した各有音区間データを蓄積する音声データ蓄
    積部と、 上記各有音区間データごとにその入力部に対応する入力
    部識別子と、その有音区間データの上記時間情報と、そ
    の有音区間が蓄積されている蓄積メモリアドレス情報と
    が記憶される有音区間管理情報蓄積部と、 出力すべき音声データが入力された入力部を示す情報が
    入力されると、これに応じたその入力部識別子の時間情
    報と蓄積メモリアドレス情報とを上記有音区間管理情報
    蓄積部から読み出し、その読みを出した時間情報内容に
    もとずき、その読み出した蓄積メモリアドレス情報から
    上記音声データ蓄積部の有音区間データを読み出す手段
    と、その読み出された有音区間データが供給されて音声
    として出力する音声出力部とを具備する音声処理装置。
  2. (2)上記有音区間管理情報蓄積部に記憶されている情
    報に基づき、上記音声データ蓄積部に蓄積されている音
    声データについて音声データ入力部を区別して、有音区
    間データの継続状況および時間的重複状況が表示される
    画像表示装置を具備することを特徴とする請求項1記載
    の音声処理装置。
JP2140849A 1990-05-30 1990-05-30 会議場音声処理装置 Expired - Lifetime JP2657258B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2140849A JP2657258B2 (ja) 1990-05-30 1990-05-30 会議場音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2140849A JP2657258B2 (ja) 1990-05-30 1990-05-30 会議場音声処理装置

Publications (2)

Publication Number Publication Date
JPH0434500A true JPH0434500A (ja) 1992-02-05
JP2657258B2 JP2657258B2 (ja) 1997-09-24

Family

ID=15278164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2140849A Expired - Lifetime JP2657258B2 (ja) 1990-05-30 1990-05-30 会議場音声処理装置

Country Status (1)

Country Link
JP (1) JP2657258B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07271664A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd 情報記録再生装置
JP2007286198A (ja) * 2006-04-13 2007-11-01 Toyota Motor Corp 音声合成出力装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63140756U (ja) * 1987-03-06 1988-09-16

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63140756U (ja) * 1987-03-06 1988-09-16

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07271664A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd 情報記録再生装置
JP2007286198A (ja) * 2006-04-13 2007-11-01 Toyota Motor Corp 音声合成出力装置

Also Published As

Publication number Publication date
JP2657258B2 (ja) 1997-09-24

Similar Documents

Publication Publication Date Title
US7844454B2 (en) Apparatus and method for providing voice recognition for multiple speakers
US7130404B2 (en) Apparatus and method for providing advanced communication conferencing operations
JP5533854B2 (ja) 音声認識処理システム、および音声認識処理方法
JP2005055668A (ja) 音声処理装置
JPS6395532A (ja) 音声ガイダンス出力制御方法
CN110808062B (zh) 混合语音分离方法和装置
JPH0434500A (ja) 会議場音声処理装置
JPS5852698A (ja) 音声認識処理システム
JPH02210500A (ja) 標準パターン登録方式
JP2000333150A (ja) テレビ会議システム
JP2625682B2 (ja) 音声区間の始端検出装置
JP4133120B2 (ja) 回答文検索装置、回答文検索方法及びプログラム
JP3360978B2 (ja) 音声認識装置
JPS645320B2 (ja)
JP3201327B2 (ja) 録音再生装置
US20210312908A1 (en) Learning data generation device, learning data generation method and non-transitory computer readable recording medium
JP2673961B2 (ja) 音声編集装置
JPH05344214A (ja) ガイダンス出力装置
JPH07210186A (ja) 音声登録装置
JP3636896B2 (ja) 音声信号加算装置
JPS63274251A (ja) 自動呼出装置
JP2022071960A (ja) 発言切り分けシステムとその方法
JPS60205600A (ja) 音声認識装置
JPH0828776B2 (ja) 会議通話制御方法
JPS63180105A (ja) プログラマブルコントロ−ラ

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100606

Year of fee payment: 13

EXPY Cancellation because of completion of term