JP2000214878A - 音声情報処理装置 - Google Patents

音声情報処理装置

Info

Publication number
JP2000214878A
JP2000214878A JP11014251A JP1425199A JP2000214878A JP 2000214878 A JP2000214878 A JP 2000214878A JP 11014251 A JP11014251 A JP 11014251A JP 1425199 A JP1425199 A JP 1425199A JP 2000214878 A JP2000214878 A JP 2000214878A
Authority
JP
Japan
Prior art keywords
data
sound
recording
information processing
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11014251A
Other languages
English (en)
Inventor
Masaaki Horikawa
昌明 堀川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11014251A priority Critical patent/JP2000214878A/ja
Publication of JP2000214878A publication Critical patent/JP2000214878A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

(57)【要約】 【課題】 音声中よりグループ分けやタイトル付け用の
キーワードを検出・認識し、このキーワードからグルー
プ名やタイトル名を判断するようにして録音データの管
理の自動化をはかった音声情報処理装置を提供するこ
と。 【解決手段】 音声の内容を記録し、これを再生するた
めの音声録再機能を有する音声情報処理装置であって、
音声入力部1より入力された音声よりグループ分け及び
タイトル付け用のデータ管理情報を検出、認識する音声
認識部3と、入力された音声を録音データとして記録
し、前記音声認識部3のデータ管理情報認識結果に基づ
いて管理するデータ記憶部8と、音声認識用パターンデ
ータ及びデータ管理用のキーワードを記憶する認識デー
タ記憶部7とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声の内容をテー
プやディスク等に記録し、これを検索、再生するための
音声録再機能を有する音声情報処理装置に関し、特に、
記録情報を自動的にグループ分け等することができる音
声情報処理装置に関する。
【0002】
【従来の技術】従来の音声情報処理装置として、操作に
よりインデックスが記録された位置付近に記録されてい
る音声に含まれるキーワードを音声認識により抽出し、
そのキーワードが記録されている位置とキーワードとを
テープ・ヘッダに記録しておくことで、キーワードを基
にキーワード記録位置からの再生が可能なものがある
(特開平5−314740号公報参照)。
【0003】
【発明が解決しようとする課題】上記の音声情報処理装
置では、録音された記録内容内のキーワードの位置を検
出し、その部分から頭出し再生を行うものであるが、録
音内容の管理は別途行う必要がある。つまり、入力した
音声を記録管理する際、音声中にキーワードが出てきた
とき、音声データ中のキーワードの位置付近にインデッ
クスを記録しておき、録音内容を確認するときは、キー
ワードが録音されている音声データの位置から再生する
ものである。したがって、データを再確認したい場合の
選択が複雑であり、また、グループ分けやタイトル付け
の等の管理情報の変更が困難である、という問題があっ
た。
【0004】本発明は上述の点に着目してなされたもの
で、音声中よりグループ分けやタイトル付け用のキーワ
ードを検出・認識し、このキーワードからグループ名や
タイトル名を判断するようにして録音データの管理の自
動化をはかり、上記の問題を解消した音声情報処理装置
を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明の音声情報処理装
置は、録音開始から録音終了までを単位とする録音デー
タを管理するものであって、録音される又は録音されて
いる音声を認識して文字列を抽出する文字抽出手段と、
該文字抽出手段によって抽出される文字列をデータ管理
情報として前記録音データを管理するデータ管理手段と
を備えるものである。
【0006】また、前記データ管理手段は、前記データ
管理情報によって前記録音データをグループ分けするも
のであることで、録音音声に基づいて録音データをグル
ープ分けすることができる。さらに、前記データ管理手
段は、前記データ管理情報によって前記録音データにタ
イトルを付けるものであることで、録音音声に基づいて
録音データにタイトルを付けることができる。
【0007】また、前記文字抽出手段は、前記録音デー
タの録音開始直後の音声を認識して文字列を抽出するも
のであることで、特別な文字列認識開始のきっかけを必
要とせずに、録音開始直後に文字列認識を開始すること
ができる。また、前記データ管理情報を修正する修正手
段を備えることで、認識誤りを正したり、データ管理情
報の統合等の編集をすることができる。
【0008】また、前記文字抽出手段は、認識する文字
列の候補を記憶する認識データ記憶手段を備えるもので
あることで、認識の精度を向上することができる。ま
た、前記文字抽出手段は、前記認識データ記憶手段に記
憶されている文字列の追加及び削除をすることができる
ものであることで、ユーザの用途に適応した多様な文字
列の認識をすることができる。
【0009】
【発明の実施の形態】以下、本発明の音声情報処理装置
の一実施の形態について、図面を参照して説明する。図
1は本発明の音声情報処理装置の一実施の形態を示すブ
ロック図であって、1はマイクロホン等の音声入力部、
2はA/D変換回路であって、音声入力部1より入力さ
れたアナログ音声信号はA/D変換回路2においてデジ
タル信号に変換され、CPU4に入力する。音声認識部
3は入力された音声信号と認識データ記憶部7に記憶さ
れている認識データとを比較して、グループ名、タイト
ル名等を認識して、データ管理情報として出力するもの
である。データ記憶部8は入力された音声信号をデータ
管理情報に基づいて記憶するものである。
【0010】表示部5は、データ管理情報を表示し、入
力装置6によりデータの入力及び修正をすることができ
るようになっている。11はスピーカ等の音声出力部で
あって、入力装置6によって選択された録音内容を出力
するものである。上記動作は全てCPU4により制御さ
れ、そのプログラムはROM/RAM9に格納されてい
る。
【0011】次に、図2のフロー図及び図3の音声デー
タ図を参照しながら上記装置の動作を具体的に説明す
る。図3は音声データの例であって、録音内容の最初に
グループ名、タイトル名等のデータ管理情報を追加し、
この音声データを装置に録音するものである。すなわ
ち、これから記録しようとする音声に対して録音開始部
aでグループ名を録音内容の前に音声入力する(図2ス
テップS1)。
【0012】音声入力部1より入力された上記の録音内
容は、A/D変換回路2でデジタル信号に変換され、デ
ータ記憶部8に記憶・録音されると共に、音声認識部3
によりグループ名部が検出され(ステップS2)、グル
ープ名が認識されて(ステップS3)、グループ名が判
定され(ステップS4)、表示部5に表示される。次い
で、同様の動作で、タイトル名部が検出され(ステップ
S5)、タイトル名が認識されて(ステップS6)、タ
イトル名が判定され(ステップS7)、表示部5に表示
される。
【0013】上記グループ名及びタイトル名の認識は、
入力されたグループ名及びタイトル名の音声データから
解析した音声特徴パターンと、予め認識データ記憶部7
に記憶されているグループ名及びタイトル名に対応した
キーワードの音声特徴パターンとを比較し、最も特徴パ
ターンが近いものをキーワードから候補として選択する
ことにより、グループ名及びタイトル名として識別す
る。具体的には、例えば入力音声信号に周波数分析処理
等を実施して特徴パターンを算出し、認識データ記憶部
7に記憶されているグループ名、タイトル名に対応する
キーワードの音声特徴パターンと比較し、マッチング結
果の高いものを結果として出力する。なお、音声認識の
方法は多数知られており、本発明の装置においては音声
認識の手法は任意である。
【0014】認識されたデータ管理情報(グループ名・
タイトル名)を基に、図4に示すように、グループ
(1)、(2)、‥‥‥、(N)、タイトル(1)、(2)、‥‥
‥、(n)、録音内容(1)、(2)等のデータ管理構造を構
築し、これらのデータ管理情報と認識データ記憶部7に
録音記憶されている音声内容格納位置(アドレス)とを
対応させる(ステップS8)(図5参照)。これで録音
を終了する(ステップS9)。
【0015】以上の動作により、入力された音声(録音
内容)より自動的にデータのグループ分け及びタイトル
付けを行うことが可能となる。次に、データ管理情報の
修正について、データ管理情報認識後、表示部5にグル
ープ名・タイトル名を文字情報として表示して、それが
適切な管理情報でなければ、音声認識部でのマッチング
結果が次に高い順に選択するかもしくは入力装置により
修正する。
【0016】音声認識に使用するグループ名・タイトル
名に対応するキーワード情報については、予め汎用的な
キーワードと対応する音声特徴パターンを登録しておく
ことで、任意のグループ名・タイトル名に対応すること
が可能であるが、使用者がよく使用するキーワード等が
ある場合もしくはキーワードを追加したい場合について
は、下記対応により追加できる。
【0017】(1)入力装置6によりキーワードを入力
する(文字情報)。なお、表示部5で確認することがで
きる。(2)音声入力部1よりキーワードに対応する音
声信号を入力し、音声認識部3により周波数分析等が実
施され、特徴パターンを算出する。 (3)以上の確認結果が良好であれば、キーワードと対
応する音声の特徴パターンを認識データ記憶部7に追加
する。
【0018】以上の動作により、入力録音する音声が、
例えば次の(1)、(2)のようなメッセージであると
する。 (1)「会議 A企画会議 ただいまよりA企画会議を
開催します・・」 (2)「約束 7月20日 集合場所はB駅です・・〕 図5に示すように、上記(1)では、「会議」というグ
ループ名と、「A企画会議」というタイトル名が認識さ
れ、また、上記(2)では、「約束」というグループ名
と、7月20日というタイトル名が認識され、各々デー
タ記憶部8に録音内容が記憶された位置に対応して管理
される。なお、本発明は上記実施の形態に限定されるも
のではない。
【0019】録音内容の開始部にデータ管理情報を追加
しても、録音終了時に追加してもよい。また、録音内容
の任意の場所にデータ管理情報を追加し、認識スイッチ
等を備え、スイッチのオンにより動作するようにしても
よい。また、グループ名が必要なければ省略した構造あ
るいはグループ名を2段以上の構造にしてもよい。
【0020】認識されたグループ名・タイトル名が登録
されているグループ名・タイトル名と相違する場合に
は、新しいグループ名を設けてそのグループに属させ、
又は、新しいタイトル名を設けてそのタイトル名を付け
るようにしてもよい。グループ名・タイトル名の認識
は、音声入力の際に実行しつつ、録音してもよいし、一
旦録音した後に、改めて認識実行してもよい。
【0021】
【発明の効果】以上、詳述したように、本発明によれ
ば、装置に記録(録音)される音声から文字列を認識
し、さらに、データ管理情報(グループ名・タイトル
名)を検出、認識することにより、自動的にグループ分
けやタイトル付けを行うことができ、したがって、記録
した音声データの管理を容易に行うことができる。ま
た、記録したデータ内容について、グループ名・タイト
ル名により内容を推定することが可能なため、データを
再確認したい場合に選択が容易となる。
【図面の簡単な説明】
【図1】本発明の音声情報処理装置の実施の形態を示す
ブロック図である。
【図2】データ管理情報の認識フロー図である。
【図3】データ管理情報が追加された音声データの説明
図である。
【図4】データ管理構造の説明図である。
【図5】データ管理構造の具体例の説明図である。
【符号の説明】
1 音声入力部 3 音声認識部 5 表示部 6 入力装置 7 認識データ記憶部 8 データ記憶部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 録音開始から録音終了までを単位とする
    録音データを管理する音声情報処理装置において、録音
    される又は録音されている音声を認識して文字又は文字
    列(以下単に「文字列」という)を抽出する文字抽出手
    段と、該文字抽出手段によって抽出される文字列をデー
    タ管理情報として前記録音データを管理するデータ管理
    手段とを備えることを特徴とする音声情報処理装置。
  2. 【請求項2】 前記データ管理手段は、前記データ管理
    情報によって前記録音データをグループ分けするもので
    あることを特徴とする請求項1記載の音声情報処理装
    置。
  3. 【請求項3】 前記データ管理手段は、前記データ管理
    情報によって前記録音データにタイトルを付けるもので
    あることを特徴とする請求項1記載の音声情報処理装
    置。
  4. 【請求項4】 前記文字抽出手段は、前記録音データの
    録音開始直後の音声を認識して文字列を抽出するもので
    あることを特徴とする請求項1記載の音声情報処理装
    置。
  5. 【請求項5】 前記データ管理情報を修正する修正手段
    を備えることを特徴とする請求項1記載の音声情報処理
    装置。
  6. 【請求項6】 前記文字抽出手段は、認識する文字列の
    候補を記憶する認識データ記憶手段を備えるものである
    ことを特徴とする請求項1記載の音声情報処理装置。
  7. 【請求項7】 前記文字抽出手段は、前記認識データ記
    憶手段に記憶されている文字列の追加及び削除をするこ
    とができるものであることを特徴とする請求項6記載の
    音声情報処理装置。
JP11014251A 1999-01-22 1999-01-22 音声情報処理装置 Pending JP2000214878A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11014251A JP2000214878A (ja) 1999-01-22 1999-01-22 音声情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11014251A JP2000214878A (ja) 1999-01-22 1999-01-22 音声情報処理装置

Publications (1)

Publication Number Publication Date
JP2000214878A true JP2000214878A (ja) 2000-08-04

Family

ID=11855882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11014251A Pending JP2000214878A (ja) 1999-01-22 1999-01-22 音声情報処理装置

Country Status (1)

Country Link
JP (1) JP2000214878A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011158856A (ja) * 2010-02-04 2011-08-18 Nakayo Telecommun Inc 録音装置およびインデックス情報付与方法
CN110808039A (zh) * 2018-07-18 2020-02-18 株式会社东芝 信息处理装置、信息处理方法以及记录介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011158856A (ja) * 2010-02-04 2011-08-18 Nakayo Telecommun Inc 録音装置およびインデックス情報付与方法
CN110808039A (zh) * 2018-07-18 2020-02-18 株式会社东芝 信息处理装置、信息处理方法以及记录介质
CN110808039B (zh) * 2018-07-18 2023-12-01 株式会社东芝 信息处理装置、信息处理方法以及记录介质

Similar Documents

Publication Publication Date Title
JP4145796B2 (ja) テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム
JP4389330B2 (ja) 演奏位置検出方法および楽譜表示装置
US8150687B2 (en) Recognizing speech, and processing data
US20090204399A1 (en) Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program
US20080208574A1 (en) Name synthesis
US7624016B2 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
US20110093263A1 (en) Automated Video Captioning
JP2011059313A (ja) 情報検索装置,情報検索方法及びナビゲーションシステム
JP2010060850A (ja) 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム
JP2014222290A (ja) 議事録記録装置、議事録記録方法及びプログラム
JP2001005481A (ja) 音声メッセージ中のキーセグメントにスポットをあてる方法。
JP2008032825A (ja) 発言者表示システム、発言者表示方法および発言者表示プログラム
JP3437617B2 (ja) 時系列データ記録再生装置
JPWO2010146869A1 (ja) 編集支援システム、編集支援方法および編集支援プログラム
EP1501073A1 (en) Information playback apparatus, information playback method, and computer readable medium therefor
JP2000214878A (ja) 音声情報処理装置
JP2003162293A (ja) 音声認識装置及び方法
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7180747B2 (ja) 編集支援プログラム、編集支援方法、及び編集支援装置
JPS63149699A (ja) 音声入出力装置
JP2002215184A (ja) 音声認識装置、及びプログラム
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system
JP2009204872A (ja) 音声認識用辞書生成システム
JPH01114898A (ja) データ検索装置
KR100285502B1 (ko) 음성 데이터베이스 구축방법