JPH08153118A - 音声データ処理装置 - Google Patents

音声データ処理装置

Info

Publication number
JPH08153118A
JPH08153118A JP6296714A JP29671494A JPH08153118A JP H08153118 A JPH08153118 A JP H08153118A JP 6296714 A JP6296714 A JP 6296714A JP 29671494 A JP29671494 A JP 29671494A JP H08153118 A JPH08153118 A JP H08153118A
Authority
JP
Japan
Prior art keywords
voice data
speaker
audio data
voice
speech data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6296714A
Other languages
English (en)
Inventor
Masabumi Matsumura
正文 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6296714A priority Critical patent/JPH08153118A/ja
Publication of JPH08153118A publication Critical patent/JPH08153118A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】取扱者の必要とする音声データを容易かつ効率
的に音声データを検索し再生することを可能とする音声
データ処理装置を提供する。 【構成】音声データを入力する入力部3と、この入力さ
れた音声データをセンテンス単位に分割する分割部4
と、このセンテンス単位に分割された音声データそれぞ
れの時間情報を取得し、上記センテンス単位に分割され
た音声データそれぞれから話者を識別するためのパラメ
ータを抽出し、上記抽出されたパラメータを所定の許容
範囲内でグループ化し、このグループそれぞれに話者識
別情報を割り振る解析部5と、上記センテンス単位に分
割された音声データそれぞれを上記時間情報及び話者識
別情報を含む所定の属性情報を付加して格納する格納部
6とを具備し、入力した音声データを解析して音声デー
タベース10を構築することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声データ処理装置に
係り、特に簡単な構成を付加することにより取扱者の必
要とする音声データを容易かつ効率的に検索し再生する
ことを可能とする音声データ処理装置に関する。
【0002】
【従来の技術】従来の音声データ処理装置において、取
扱者が所望する音声データを検索する場合、時間情報を
基準として検索する、即ち、例えば開始からの経過時間
等により検索する、又は音声の区切りを検出することに
より検索する、即ち、例えばカウンタ等により検索す
る、のいずれかの方法により行っていた。
【0003】また、音声データを音声として再生する場
合、従来の音声データ処理装置においては、単純に時間
軸に沿った再生を行えるのみであった。しかし、音声デ
ータを検索する際のキーとして、時間情報や音声の区切
り等では極めて抽象的であり、取扱者が所望するデータ
を効率良く、かつ的確に検索することは困難であった。
また、単純に時間軸に沿った再生のみでは、音声データ
の取扱上不十分であり、操作性がよいとはいえなかっ
た。
【0004】
【発明が解決しようとする課題】上述したように、従来
の音声データ処理装置において、取扱者が所望する音声
データを検索する場合には、時間情報を基準として検索
する、又は音声の区切りを検出することにより検索す
る、といった方法によっていたため、取扱者が所望する
データを効率良く、かつ的確に検索することが困難であ
るといった問題があった。
【0005】また、音声データを音声として再生する場
合、単純に時間軸に沿って順次再生するのみであったた
めに、音声データの取扱上不十分であり、あまり操作性
が良くないといった問題があった。
【0006】本発明は上記実情に鑑みなされたものであ
り、簡単な構成を付加することにより取扱者の必要とす
る音声データを容易かつ効率的に音声データを検索し再
生することを可能とする音声データ処理装置を提供する
ことを目的とする。
【0007】
【課題を解決するための手段】本発明は、音声データを
入力する手段と、この入力された音声データをセンテン
ス単位に分割する手段と、このセンテンス単位に分割さ
れた音声データそれぞれの時間情報を取得する手段と、
上記センテンス単位に分割された音声データそれぞれか
ら話者を識別するためのパラメータを抽出する手段と、
上記抽出されたパラメータを所定の許容範囲内でグルー
プ化し、このグループそれぞれに話者識別情報を割り振
る手段と、上記センテンス単位に分割された音声データ
それぞれを上記時間情報及び話者識別情報を含む所定の
属性情報を付加して格納する手段とを具備し、入力した
音声データを解析して音声データベースを構築すること
を特徴とする。
【0008】また、本発明は、上記時間情報が、音声デ
ータの発生した実時刻、又は基準とする位置からの相対
時間により構成されることを特徴とする。また、本発明
は、上記格納されたセンテンス単位の音声データそれぞ
れを上記所定の属性情報に基づいて所定のイメージで時
間軸に対応させて表示する手段を具備し、上記表示する
時間軸を移動させることにより話者単位に音声データの
検索を行うことを特徴とする。
【0009】また、本発明は、上記グループ化されたパ
ラメータから標準とするパラメータを算出し、個人辞書
を作成する手段を具備してなることを特徴とする。ま
た、本発明は、上記格納されたセンテンス単位の音声デ
ータを時間軸に沿った順に、又は逆の順に再生する手段
を具備してなることを特徴とする。
【0010】また、本発明は、上記再生手段が、指定さ
れた話者の音声データを選択して再生する手段を具備し
てなることを特徴とする。また、本発明は、上記再生手
段が、所定倍の速度で再生する手段を具備してなること
を特徴とする。
【0011】
【作用】本発明の構成によれば、入力手段が音声データ
を入力し、分割手段がこの入力された音声データをセン
テンス単位に分割する。この分割は、例えば、音声信号
の有無を監視する等により無音部分の消去とともに行わ
れる。
【0012】このセンテンス単位に分割された音声デー
タは、時間情報取得手段により音声データの発生した実
時刻、又は基準とする位置からの相対時間等の時間情報
が取得され、また、抽出手段により話者を識別するため
の各種パラメータが抽出される。ここでの抽出作業とし
ては、ケプストラム分析、線形予測分析、PARCOR
分析等が挙げられる。
【0013】そして、話者識別情報割振手段が、この各
種パラメータを所定の許容範囲内でグループ化し、この
グループそれぞれに識別番号等の話者識別情報を割り振
り、格納手段が、センテンス単位に分割された音声デー
タを時間情報及び話者識別情報とともに格納する。
【0014】これにより、音声データを入力するのみで
自動的に各種属性情報をもつセンテンス単位の音声デー
タベースが構築されることになる。また、本発明の構成
によれば、個人辞書作成手段が、グループ化されたパラ
メータ群から標準とするパラメータを算出し、個人辞書
を作成する。
【0015】従来の個人辞書は、所定量の音声データを
サンプルとして入力し、このサンプル音声データから以
後その話者の識別に使用するパラメータを抽出すること
により作成していた。しかし、この方法では、標準的な
パラメータを抽出したとはいえず、場合によっては、話
者認識処理に支障を与えてしまうこともある。一方、本
発明の構成によれば、入力した音声データ全てから標準
的なパラメータを算出するため、即ち、入力した音声デ
ータ全てをサンプルとして標準的なパラメータを算出す
るため、より信頼性の高いパラメータをもつ個人辞書を
作成することができることとなる。
【0016】また、本発明の構成によれば、このセンテ
ンス単位に分割された音声データを所定の属性情報に基
づいて、例えば図3に示すような表示イメージ14によ
り時間軸に対応させて表示する。そして、取扱者は、時
間軸を移動させることにより音声データを検索する。
【0017】これにより、話者別センテンス単位の検索
が視覚的に行えるようになり、効率的かつ的確な音声デ
ータの検索を実現する。また、本発明の構成によれば、
再生手段が、このセンテンス単位に分割された音声デー
タを、時間軸に沿った順に、又は逆の順に再生してい
く。この再生は、全ての音声データについて、又は取扱
者の話者指定に従って選択した音声データについて行わ
れ、さらに、指定により速度を制御して行う。これによ
り、取扱者は、音声を再生しながらの音声データの検索
についても、効率的に行うことが可能となる。
【0018】
【実施例】以下図面を参照して本発明の一実施例を説明
する。図1は、同実施例に係る音声データ処理装置の概
略構成を示す図である。同実施例に係る音声データ処理
装置は、図1に示すように、制御部2、入力部3、分割
部4、解析部5、格納部6、表示部7、検索部8、及び
再生部9を備えてなり、格納部6は音声データベース1
0及び個人辞書ファイル13を有している。また、この
音声データベース10は、話者辞書ファイル11と音声
データファイル12とで構成されている。
【0019】この音声データ処理装置1は、制御部2に
より装置全体の制御が行われる。いま、入力部3から音
声データが入力されたとすると、分割部4は、この入力
された音声データの音声信号を監視して、その有無を検
知することにより無音部分を削除していくとともに、図
2の(a)に示すように、音声データをセンテンス単位
に分割する。
【0020】また、解析部5は、分割部4によりセンテ
ンス単位に分割された音声データそれぞれを解析して、
その音声データの発生した時刻、又は基準とする位置か
らの相対時間等の時間情報を取得し、また、話者を識別
するための各種パラメータをケプストラム分析、線形予
測分析、PARCOR分析等により抽出し、さらに、こ
れらのパラメータを所定の許容範囲内でグループ化して
このパラメータ群から標準とするパラメータを算出する
とともに、このグループそれぞれに識別番号等の話者識
別情報を割り振る。
【0021】そして、格納部6は、このセンテンス単位
に分割された音声データそれぞれを解析部5にて取得し
た時間情報及び話者識別情報とともに図2の(b)に示
すようなフォーマットで音声データベースの音声データ
ファイル12に格納し、算出された標準パラメータを話
者辞書11及び個人辞書ファイル13に格納する。
【0022】この話者辞書11と音声データファイル1
2とは音声データが入力される度に対として作成され、
話者辞書11は、対応する音声データファイル12の話
者目次として使用される。また、標準パラメータの個人
辞書ファイル13への格納は、当該話者の標準パラメー
タが、個人辞書ファイル13に未格納の場合のみ行われ
る。
【0023】ここで、図4を参照して同実施例に係る音
声データの処理原理を説明する。図4は同実施例に係る
音声データの処理原理を説明するためのフローチャート
である。
【0024】音声データを入力すると、まず、この音声
データを音声データファイルF1に格納する(図4のス
テップS1)。次に、この音声データファイルF1から
音声データを順次読み出し、無音部分の消去を行い無音
部消去後音声データファイルF2に格納する(図4のス
テップS2)。そして、この無音部消去後音声データフ
ァイルF2から無音部分消去後の音声データを順次読み
出し、今度はセンテンス単位に分割してセンテンス単位
音声データファイルF3に格納する(図4のステップS
3)。
【0025】これにより、まず、センテンス単位に分割
された音声データファイルが作成されることになる。次
に、このセンテンス単位音声データファイルF3からセ
ンテンス単位に分割された音声データを順次読み出し、
線形予測分析(図4のステップS4)及びPARCOR
分析(図4のステップS5)を行い、線形予測係数ファ
イルF4とPARCOR係数ファイルF5とを作成す
る。
【0026】この線形予測係数ファイルF4は、LPC
ケプストラム計算に使用され(図4のステップS6)、
この計算によりケプストラムファイルF6が作成される
(図4のステップF6)。一方、PARCOR係数ファ
イルF5は、5母音のPARCOR係数辞書F7ととも
に母音抽出に使用され(図4のステップS7)、これに
より母音抽出ファイルF8が作成される。
【0027】そして、このケプストラムファイルF6と
母音抽出ファイルF8とにより、話者分類が行われ(図
4のステップS8)、話者分類データファイルF9が作
成される。
【0028】これにより、話者別の属性データファイル
が作成されることになる。一方、音声データの検索処理
として、表示による検索を行う場合に、表示部7に表示
する時間軸に対応する音声データを、検索部8が格納部
6の音声データファイル12から検索し、これにより検
索された音声データを、例えば図3に示したようなイメ
ージで表示する。そして、取扱者は、画面上に表示する
時間軸を移動させることにより、視覚的に音声データを
話者別センテンス単位に検索作業を行う。
【0029】また、音声データを再生する場合には、指
定された話者の音声データを検索部8が格納部6の音声
データファイル11から検索し、これにより検索された
音声データを再生部9が再生する。この再生部9は、取
扱者の指定により時間軸に沿った順に、又は逆の順に音
声データを再生し、また、所定倍の速度で音声データの
再生を行う。
【0030】次に、図5乃至図9を参照して同実施例の
動作を説明する。まず、図5を参照して音声データを入
力し音声データベースを構築する際の動作を説明する。
【0031】図5は音声データを入力し音声データベー
スを構築する際の動作を説明するためのフローチャート
である。まず、入力部3が、録音された音声を音声デー
タとして取り込み(図5のステップA1)、分割部4
が、この取り込んだ音声データを図2の(a)に示した
ように、センテンス単位に分割する(図5のステップA
2)。この分割処理は、入力された音声データの音声信
号を監視して、その有無を検知することにより行われ、
この結果、無音部分の削除も行われることになる。
【0032】次に、解析部5が、このセンテンス単位に
分割された音声データそれぞれの音声データの発生した
時刻、又は基準とする位置からの相対時間等の時間情報
を取得する(図5のステップA3)。そして、解析部5
は、ケプストラム分析、線形予測分析、PARCOR分
析等の解析を実施し(図5のステップA4)、その音声
データについて、話者識別のためのパラメータを抽出す
る(図5のステップA5)。
【0033】また、このパラメータの抽出時に、予め所
定の許容範囲を設定しておき、この音声データが、初め
て認識された話者の音声データであると判断された場合
には、新たに識別番号を採番して割り振り、既に認識さ
れている話者の音声データであると判断された場合に
は、採番済みの番号を割り振る等により話者識別情報を
関連付けておく。
【0034】そして、格納部6が、図2の(b)に示し
たように、音声データを時間情報及び話者識別情報とと
もに音声データファイル12に格納する(図5のステッ
プA6)。
【0035】これにより、音声データを入力するのみ
で、自動的に話者別センテンス単位の音声データベース
が構築されることになる。次に、図6を参照して話者辞
書を作成する際の動作を説明する。
【0036】図6は話者辞書を作成する際の動作を説明
するためのフローチャートである。ここでは、まず、音
声データベースを構築したときに付加された話者識別情
報に着目し、同一の話者識別情報をもつ音声データすべ
てについて、平均や、分散等の解析を行い(図6のステ
ップB1)、その話者の標準的なパラメータを算出する
(図6のステップB2)。そして、この算出された標準
パラメータの分、即ち、識別番号の割り振り数分、音声
データファイル11に対応した話者辞書ファイル11を
作成、登録し(図6のステップB3)、作成された音声
データベースの話者目次として関連付ける(図6のステ
ップB4)。
【0037】次に、この話者辞書ファイル11に登録さ
れた標準パラメータが、個人辞書ファイル13に登録済
みか否かを判定し(図6のステップB5)、既に登録さ
れていた場合には(図6のステップB5のY)、個人辞
書ファイル13にもつ話者名を話者辞書ファイル11の
該当標準パラメータに付加する(図6のステップB
6)。
【0038】一方、未登録であった場合には(図6のス
テップB5のN)、取扱者により指定される話者名を話
者辞書ファイル11の該当標準パラメータに付加し(図
6のステップB7)、この標準パラメータを指定された
話者名とともに個人辞書ファイル13に登録する(図6
のステップB8)。
【0039】これにより、既に取扱済みの話者の音声デ
ータについては、話者名等の再登録を必要とせず、例え
ば図3に示したような検索表示画面を展開した際に、話
者目次として自動的に話者名が表示されることになる。
【0040】また、この話者辞書ファイル11を使用す
れば、取扱者が任意の話者(例えば自分)の音声をサン
プル入力することにより、そのサンプル入力された話者
の音声データのみを検索し再生することも可能となる。
このときの動作を図7を参照して説明する。
【0041】図7はサンプル音声により音声データを検
索する際の動作を説明するフローチャートである。ま
ず、取扱者が任意の音声を音声データとしてサンプル入
力する(図7のステップC1)、解析部5が、この音声
データを解析して各種パラメータを抽出する(図7のス
テップC2)。そして、この抽出したパラメータを検索
キーとして、検索部8が、話者辞書ファイル11を検索
する(図7のステップC3)。
【0042】ここで、このパラメータが検索された場合
(図7のステップC4のY)、検索部8は、この話者辞
書ファイル11に格納された話者識別情報と同一の話者
識別情報をもつ音声データのみを音声データファイル1
2から選択して呈示する(図7のステップC5)。
【0043】このように、話者辞書を具備することによ
り、音声データの検索が音声をサンプル入力することに
より可能となる。次に、図8及び図9を参照して音声デ
ータを検索し再生する際の動作を説明する。
【0044】図8は音声データを検索し再生する際の動
作を説明するためのフローチャート、図9は検索表示画
面を示す図である。取扱者が選択ボタン15を操作する
ことにより再生速度を設定し、選択単位を設定すると
(図8のステップD1〜D2)、音声データ処理装置1
の制御部2は、まず指定単位を判断し(図8のステップ
D3)、センテンス単位が指定されていた場合には、取
扱者による操作ボタン16の操作に従って(図8のステ
ップD4)、センテンス単位に順次再生していく(図8
のステップD5)。
【0045】一方、話者単位が指定されていた場合に
は、取扱者による操作ボタン16の操作に従って(図8
のステップD6)、話者単位に順次再生していく(図8
のステップD7)。これにより、操作性は飛躍的に向上
し、取扱者は効率的に再生を行うことが可能となる。
【0046】
【発明の効果】以上詳記したように本発明によれば、音
声データを入力するのみで自動的に各種属性情報をもつ
センテンス単位の音声データベースが構築されるととも
に、信頼性の高い個人辞書が構築される。
【0047】これにより、取扱者は話者別センテンス単
位の検索が視覚的に行えるようになり、効率的かつ的確
な音声データの検索を実現する。また、再生処理におい
ても、センテンス単位、又は話者単位で早送り再生や巻
き戻し再生が行えるため、その操作性は飛躍的に向上す
る。即ち、これらの機能により、取扱者の労力を大幅に
軽減し、処理効率を大幅に向上させることが可能とな
る。
【図面の簡単な説明】
【図1】本発明の実施例に係る音声データ処理装置の概
略構成を示す図。
【図2】図2の(a)は音声データをセンテンス単位に
分割することを説明するための概念図、図2の(b)
は、各センテンスのデータフォーマットを示す図。
【図3】同実施例に係る音声データを所定のイメージで
時間軸に対応させて表示する例を示した図。
【図4】同実施例に係る音声データの処理原理を説明す
るためのフローチャート。
【図5】同実施例に係る音声データを入力し音声データ
ベースを構築する際の動作を説明するためのフローチャ
ート。
【図6】同実施例に係る話者辞書を作成する際の動作を
説明するためのフローチャート。
【図7】同実施例に係る音声により音声データを検索す
る際の動作を説明するフローチャート。
【図8】同実施例に係る音声データを検索する際の動作
を説明するためのフローチャート。
【図9】同実施例に係る検索表示画面を示す図。
【符号の説明】
1…音声データ処理装置、2…制御部、3…入力部、4
…分割部、5…解析部、6…格納部、7…表示部、8…
検索部、9…再生部、10…音声データベース、11…
話者辞書ファイル、12…音声データファイル、13…
個人辞書ファイル、14,14a,14b,14c…音
声データ、15…選択ボタン、16…操作ボタン。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声データを入力する手段と、この入力
    された音声データをセンテンス単位に分割する手段と、
    このセンテンス単位に分割された音声データそれぞれの
    時間情報を取得する手段と、上記センテンス単位に分割
    された音声データそれぞれから話者を識別するためのパ
    ラメータを抽出する手段と、上記抽出されたパラメータ
    を所定の許容範囲内でグループ化し、このグループそれ
    ぞれに話者識別情報を割り振る手段と、上記センテンス
    単位に分割された音声データそれぞれを上記時間情報及
    び話者識別情報を含む所定の属性情報を付加して格納す
    る手段とを具備し、入力した音声データを解析して音声
    データベースを構築することを特徴とする音声データ処
    理装置。
  2. 【請求項2】 上記時間情報は、音声データの発生した
    実時刻、又は基準とする位置からの相対時間により構成
    されることを特徴とする請求項1記載の音声データ処理
    装置。
  3. 【請求項3】 上記格納されたセンテンス単位の音声デ
    ータそれぞれを上記所定の属性情報に基づいて所定のイ
    メージで時間軸に対応させて表示する手段を具備し、上
    記表示する時間軸を移動させることにより視覚的に音声
    データの検索を行うことを特徴とする請求項1記載の音
    声データ処理装置。
  4. 【請求項4】 上記グループ化されたパラメータ群から
    標準とするパラメータを算出し、個人辞書を作成する手
    段を具備してなることを特徴とする請求項1記載の音声
    データ処理装置。
  5. 【請求項5】 上記格納されたセンテンス単位の音声デ
    ータを時間軸に沿った順に、又は逆の順に再生する手段
    を具備してなることを特徴とする請求項1記載の音声デ
    ータ処理装置。
  6. 【請求項6】 上記再生手段は、指定された話者の音声
    データのみを選択して再生する手段を具備してなること
    を特徴とする請求項5記載の音声データ処理装置。
  7. 【請求項7】 上記再生手段は、所定倍の速度で再生す
    る手段を具備してなることを特徴とする請求項5記載の
    音声データ処理装置。
JP6296714A 1994-11-30 1994-11-30 音声データ処理装置 Pending JPH08153118A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6296714A JPH08153118A (ja) 1994-11-30 1994-11-30 音声データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6296714A JPH08153118A (ja) 1994-11-30 1994-11-30 音声データ処理装置

Publications (1)

Publication Number Publication Date
JPH08153118A true JPH08153118A (ja) 1996-06-11

Family

ID=17837142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6296714A Pending JPH08153118A (ja) 1994-11-30 1994-11-30 音声データ処理装置

Country Status (1)

Country Link
JP (1) JPH08153118A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007243438A (ja) * 2006-03-07 2007-09-20 Nippon Hoso Kyokai <Nhk> 提示情報出力装置
JP2009088602A (ja) * 2007-09-27 2009-04-23 Toshiba Corp 電子機器および表示処理方法
JP2012090337A (ja) * 2012-01-13 2012-05-10 Toshiba Corp 電子機器および表示処理方法
JP5959771B2 (ja) * 2014-06-27 2016-08-02 株式会社東芝 電子機器、方法およびプログラム
WO2016165346A1 (zh) * 2015-09-16 2016-10-20 中兴通讯股份有限公司 存储和播放音频文件的方法和装置
WO2021085687A1 (ko) * 2019-10-31 2021-05-06 주식회사 엘솔루 복수의 화자들에 대한 전사 데이터를 생성 및 관리하는 방법 및 이를 수행하는 전사 장치

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007243438A (ja) * 2006-03-07 2007-09-20 Nippon Hoso Kyokai <Nhk> 提示情報出力装置
JP2009088602A (ja) * 2007-09-27 2009-04-23 Toshiba Corp 電子機器および表示処理方法
US8326623B2 (en) 2007-09-27 2012-12-04 Kabushiki Kaisha Toshiba Electronic apparatus and display process method
US8935169B2 (en) 2007-09-27 2015-01-13 Kabushiki Kaisha Toshiba Electronic apparatus and display process
JP2012090337A (ja) * 2012-01-13 2012-05-10 Toshiba Corp 電子機器および表示処理方法
JP5959771B2 (ja) * 2014-06-27 2016-08-02 株式会社東芝 電子機器、方法およびプログラム
US10592198B2 (en) 2014-06-27 2020-03-17 Toshiba Client Solutions CO., LTD. Audio recording/playback device
WO2016165346A1 (zh) * 2015-09-16 2016-10-20 中兴通讯股份有限公司 存储和播放音频文件的方法和装置
WO2021085687A1 (ko) * 2019-10-31 2021-05-06 주식회사 엘솔루 복수의 화자들에 대한 전사 데이터를 생성 및 관리하는 방법 및 이를 수행하는 전사 장치

Similar Documents

Publication Publication Date Title
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
US7440900B2 (en) Voice message processing system and method
TWI554984B (zh) 電子裝置
JP3065924B2 (ja) 音声注釈方法、テキスト入力ストリームの音声注釈を機能強化するための方法および装置
JP2004533756A (ja) 自動コンテンツ分析及びマルチメデイア・プレゼンテーションの表示
JPWO2005069171A1 (ja) 文書対応付け装置、および文書対応付け方法
JPH06110945A (ja) 音楽データベース作成装置及びその検索装置
CN102549652A (zh) 信息检索装置、信息检索方法及导航系统
KR20030065051A (ko) 대화 포커스 추적 기능을 가진 음성명령 해석장치 및 방법
JPH08286693A (ja) 情報処理装置
JP3437617B2 (ja) 時系列データ記録再生装置
JP2822525B2 (ja) 記録媒体の再生装置及び再生方法並びに検索方法
JPH08153118A (ja) 音声データ処理装置
US6058239A (en) Video catalog with vocal tags
KR20060100646A (ko) 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템
JPH03291752A (ja) データ検索装置
US20060084047A1 (en) System and method of segmented language learning
JP3615309B2 (ja) データ検索装置および方法、情報記憶媒体
JPH1125112A (ja) 対話音声処理方法及び装置、記録媒体
KR101770551B1 (ko) 영상 매칭 장치 및 그 방법
JPH0981590A (ja) マルチメディア情報検索装置
JP2011113426A (ja) 辞書作成装置,辞書作成プログラムおよび辞書作成方法
JP2555009B2 (ja) 音声フアイル装置
JP2002014751A (ja) オンラインヘルプシステム
JPH1165901A (ja) 情報記憶装置及び情報記憶検索装置及び情報記憶方法