JP2000200096A - ディジタル情報再生装置 - Google Patents

ディジタル情報再生装置

Info

Publication number
JP2000200096A
JP2000200096A JP11001865A JP186599A JP2000200096A JP 2000200096 A JP2000200096 A JP 2000200096A JP 11001865 A JP11001865 A JP 11001865A JP 186599 A JP186599 A JP 186599A JP 2000200096 A JP2000200096 A JP 2000200096A
Authority
JP
Japan
Prior art keywords
program
audio
voice
processing
digital information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11001865A
Other languages
English (en)
Inventor
Takayuki Hiekata
孝之 稗方
Koji Morita
孝司 森田
Toshiro Yamashita
俊郎 山下
Tetsuya Takahashi
哲也 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP11001865A priority Critical patent/JP2000200096A/ja
Publication of JP2000200096A publication Critical patent/JP2000200096A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 専用ICを共用するなどして再生装置に音声
認識機能を付加した従来のディジタル情報再生装置で
は,採用しうる音声認識の手法が限られてしまい,音声
認識手法を拡張して音声認識の認識精度を向上させよう
とすると,結局そのためハードウェアを追加することに
なり,装置の小型化及び低コスト化を十分に図ることが
できない。 【解決手段】 本発明は,汎用の演算手段により音声に
含まれる音声情報を抽出する抽出処理を含む音声処理プ
ログラムを実行して,音声入力手段から入力された音声
から上記音声情報を抽出し,抽出された上記音声情報に
基づいて,ディジタル情報を再生するための再生プログ
ラムの実行を制御するか,又は装置の制御を行うための
制御信号を生成することにより,音声認識機能の付加に
伴う部品増とコストの増大とを抑えつつ,容易に音声認
識の手法などを変更することを図ったものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,ディジタル情報再
生装置に係り,詳しくは,入力された音声に含まれる音
声情報を抽出してディジタル情報の再生を含む装置の制
御を行うディジタル情報再生装置に関するものである。
【0002】
【従来の技術】近年,記録媒体の小型化や実装技術の向
上などに伴い,符号化されたディジタル情報,例えばデ
ィジタル音響情報を再生するディジタル情報再生装置の
高機能化及び小型化が進んでいる。特に,携帯用装置の
小型化は著しいが,装置の小型化を行うと,使用する機
能を選択するためのスイッチなどの配置が困難となる。
そこで,上記のような小型のディジタル情報再生装置で
は,使用者の発声した声を認識して機能を選択させる手
法が注目されている。このような,使用者の発声した声
を認識して機能を選択させるディジタル情報再生装置
は,例えば特開平10−13245号公報に記載されて
いる。上記公報に記載の装置では,マイクから時系列に
入力されたアナログ信号は,ディジタル化された後,A
TRACエンコーダに供給されて圧縮符号化される。A
TRACエンコーダから出力されたデータは,誤り訂正
処理が施された後,磁気ヘッドによりミニディスクに書
き込まれる。これにより録音が可能である。ところで,
上記ATRACエンコーダには,変形DCT変換を行う
MDCT回路が含まれているが,上記公報に記載の装置
では,このMDCT回路を利用して音声認識が行われ
る。即ち,MDCT回路から出力される周波数領域のデ
ータが,音声認識回路に供給され,開始や停止などの操
作に対応した周波数スペクトラムのパターンを含む辞書
情報と対比され,「かいし」や「ていし」といった音声
コマンドが含まれているか否かが判断され,音声コマン
ドが含まれている場合には,それに基づいて装置の制御
が行われる。このように上記公報に記載の装置では,音
声認識に録音用のMDCT回路を利用することにより,
音声認識に必要な回路構成が簡素化され,製造コストの
低減が図られている。
【0003】
【発明が解決しようとする課題】しかしながら,上記公
報に記載の技術のように,専用ICを共用するなどして
音声認識機能を付加する場合,採用しうる音声認識の手
法が限られてしまう。音声認識手法を拡張して音声認識
の認識精度を向上させようとするならば,結局そのため
のハードウェアを追加することになり,装置の小型化及
び低コスト化を十分に図ることができない。本発明は,
このような従来の技術における課題を解決するために,
ディジタル情報再生装置を改良し,プログラムに従って
演算処理を行う演算手段が,音声に含まれる音声情報を
抽出する抽出処理を含む音声処理プログラムを実行し
て,音声入力手段から入力された音声から上記音声情報
を抽出し,抽出された上記音声情報に基づいて,ディジ
タル情報を再生するための再生プログラムの実行を制御
するか,又は装置の制御を行うための制御信号を生成す
ることにより,音声認識機能の付加に伴う部品増とコス
トの増大とを抑えつつ,容易に音声認識の手法などを変
更することができるディジタル情報再生装置を提供する
ことを目的とするものである。また,ディジタル情報再
生装置を使用する特定話者の音声認識を行う場合には,
音声認識の手法が同じであっても,辞書の変更及び拡張
が可能であれば,認識精度を向上させることができる。
そこで,本発明の他の目的の一つは,辞書の変更及び拡
張が容易なディジタル情報再生装置を提供することであ
る。また,音声認識や音響情報などの符号化の手法は近
年においても種々開発が続けられており,これを迅速に
導入することができれば,新しい音声認識手法を用いて
認識精度を向上させたり,必要な記憶容量を増加させる
ことなく音質を向上させたりすることができる。そこ
で,本発明の他の目的の一つは,外部装置から音声処理
プログラムや再生プログラムなどを迅速且つ容易に導入
しうるようにすることである。
【0004】また,本発明に係るディジタル情報再生装
置において,音声処理プログラムと再生プログラムを同
時に実行した場合,それだけ演算手段の処理量が増大し
て消費電力も増大してしまう。そこで,本発明の他の目
的の一つは,使用者から指定されたときにだけ例えば音
声処理プログラムを実行させることにより,音声処理プ
ログラムと再生プログラムを同時に実行させる時間を短
縮して消費電力を低下させるとともに,音声抽出処理を
確実に行わせることができるディジタル情報再生装置を
提供することである。さらに,音声処理プログラムと再
生プログラムをDSPなどの演算手段により同時に実行
させた場合,上記演算手段の処理能力が不足する恐れが
ある。また,この不足を補償するために,高速な演算手
段を導入すると,コストが増大してしまう。そこで,本
発明の他の目的の一つは,例えばステレオ信号の再生を
一時的に片方のチャンネルのみにするなどして再生プロ
グラムの実行に必要な演算手段の処理能力を低下させ,
上記音声処理プログラムの実行に必要な演算手段の処理
能力を確保することにより,低速な演算手段を用いて音
声抽出処理を行ってコスト増大を防止することのできる
ディジタル情報再生装置を提供することである。さら
に,音声処理プログラムと再生プログラムを同時に実行
する場合,DSPが内蔵する処理用のメモリなどが不足
する恐れがある。そこで,本発明の他の目的の一つは,
音声処理プログラムを再生プログラムと同時に実行する
ときに,演算手段が備える処理用の記憶手段の容量が不
足するときに,上記再生プログラムの実行に必要な容量
を低下させ,上記音声処理プログラムの実行に必要な容
量を確保することにより,上記処理用の記憶手段の容量
を比較的低容量に抑えながら音声認識機能を付加するこ
とができ,製造コストの増大を抑えることができる。ま
た,音声認識の手法を改善したり,辞書を拡張したりし
て認識精度を向上させたとしても,音声認識の誤りを全
てなくすことは困難である。そこで,本発明の他の目的
の一つは,音声から音声情報が抽出されると,それを確
認する内容の音声を合成して出力することにより,誤操
作の実行を防止することができるディジタル情報再生装
置を提供することである。
【0005】
【課題を解決するための手段】上記目的を達成するため
に,請求項1に係る発明は,入力された音声に含まれる
音声情報を抽出してディジタル情報の再生を含む装置の
制御を行うための複数の処理手段を備えたディジタル情
報再生装置において,上記複数の処理手段は,プログラ
ムに従って演算処理を行う演算手段と,上記ディジタル
情報を再生するための再生プログラムを記憶する再生プ
ログラム記憶手段と,音声に含まれる音声情報を抽出す
る抽出処理を含む音声処理を行うための音声処理プログ
ラムを記憶する音声処理プログラム記憶手段と,上記演
算手段に音声を入力するための音声入力手段とを含み,
上記演算手段が,上記音声処理プログラム記憶手段に記
憶された上記音声処理プログラムを実行して,上記音声
入力手段から入力された音声から上記音声情報を抽出
し,抽出された上記音声情報に基づいて,上記再生プロ
グラム記憶手段に記憶された再生プログラムの実行を制
御するか,又は装置の制御を行うための制御信号を生成
してなることを特徴とするディジタル情報再生装置とし
て構成されている。また,請求項2に係る発明は,上記
請求項1に記載のディジタル情報再生装置において,上
記再生プログラム記憶手段,及び音声処理プログラム記
憶手段のいずれか一方又は両方が,上記演算手段に接続
された書き換え可能な記憶手段であることをその要旨と
する。また,請求項3に係る発明は,上記請求項2に記
載のディジタル情報再生装置において,上記演算手段が
上記音声処理プログラムを実行して上記音声情報を抽出
する際に用いる辞書情報が,上記音声処理プログラム記
憶手段,又は上記演算手段に接続された書き換え可能な
他の記憶手段に記憶されてなることをその要旨とする。
また,請求項4に係る発明は,上記請求項1〜3のいず
れか1項に記載のディジタル情報再生装置において,上
記演算手段が,外部装置と通信する通信手段に接続され
ており,上記再生プログラム及び音声処理プログラムの
いずれか一方又は両方を上記通信手段により受信してな
ることをその要旨とする。また,請求項5に係る発明
は,上記請求項1〜4のいずれか1項に記載のディジタ
ル情報再生装置において,上記再生プログラム及び上記
音声処理プログラムのいずれか一方又は両方を上記演算
手段により実行させる指示を行うための操作手段を具備
してなることをその要旨とする。
【0006】また,請求項6に係る発明は,上記請求項
1〜5のいずれか1項に記載のディジタル情報再生装置
において,上記演算手段が,上記音声処理プログラムを
上記再生プログラムと同時に実行するときに,その実行
に必要な能力が上記演算手段の処理能力を越える場合に
は,上記再生プログラムの実行に必要な能力を低下さ
せ,上記音声処理プログラムの実行に必要な能力を確保
してなることをその要旨とする。また,請求項7に係る
発明は,上記請求項6に記載のディジタル情報再生装置
において,上記ディジタル情報が,一対のディジタル音
響信号を含むステレオ情報であって,上記スレテオ情報
のうち一つのディジタル音響信号の再生を停止すること
により上記再生プログラムの実行に必要な能力を低下さ
せてなることをその要旨とする。また,請求項8に係る
発明は,上記請求項1〜7のいずれか1項に記載のディ
ジタル情報再生装置において,上記演算手段が,上記音
声処理プログラムを上記再生プログラムと同時に実行す
るときに,上記演算手段が備える処理用の記憶手段の容
量が不足するときに,上記再生プログラムの実行に必要
な容量を低下させ,上記音声処理プログラムの実行に必
要な容量を確保してなることをその要旨とする。また,
請求項9に係る発明は,上記請求項1〜8のいずれか1
項に記載のディジタル情報再生装置において,上記音声
処理プログラムが上記音声情報の抽出とともに音声の合
成も行うものであって,上記演算手段による上記音声処
理プログラムの実行により,上記音声情報が抽出された
場合には,上記音声処理プログラムが上記音声情報の内
容を確認するための確認情報を音声合成して出力させて
なるをその要旨とする。
【0007】上記請求項1〜9のいずれか1項に記載の
ディジタル情報再生装置によれば,プログラムに従って
演算処理を行う演算手段が,音声に含まれる音声情報を
抽出する抽出処理を含む音声処理プログラムを実行し
て,音声入力手段から入力された音声から上記音声情報
を抽出し,抽出された上記音声情報に基づいて,ディジ
タル情報を再生するための再生プログラムの実行を制御
するか,又は装置の制御を行うための制御信号を生成す
ることにより,音声認識機能の付加に伴う部品増とコス
トの増大とを抑えながら,容易に音声認識の手法などを
変更することができる。しかも,上記請求項3に記載の
ディジタル情報再生装置によれば,音声情報が抽出され
る際に用いられる辞書情報が書き換え可能な記憶手段に
記憶されているため,容易に辞書を変更したり拡張した
りすることができ,音声認識の手法を変更することな
く,使用者に合わせて認識精度を向上させることができ
る。また,上記請求項4に記載のディジタル情報再生装
置によれば,通信手段を用いて再生プログラム及び音声
処理プログラムのいずれか一方又は両方を外部装置から
受信することができ,認識精度の優れた音声処理プログ
ラムや圧縮効率の良い再生プログラムを迅速且つ容易に
導入することができる。
【0008】また,上記請求項5に記載のディジタル情
報再生装置によれば,操作手段により指示されたときに
のみ例えば音声処理プログラムが実行されるため,音声
処理プログラムと再生プログラムを同時に実行させる時
間を短縮して消費電力を低下させるとともに,音声抽出
処理を確実に行わせることができる。また,上記請求項
6又は7に記載のディジタル情報再生装置によれば,例
えばステレオ信号の再生を一時的に片方のチャンネルの
みに限るなどして再生プログラムの実行に必要な演算手
段の処理能力を低下させ,上記音声処理プログラムの実
行に必要な演算手段の処理能力を確保することにより,
低速な演算手段を用いて音声抽出処理と再生処理とを同
時に実行することが可能となり,製造コストの増大を防
止することができる。また,上記請求項8に記載のディ
ジタル情報再生装置によれば,音声処理プログラムを再
生プログラムと同時に実行するときに,演算手段が備え
る処理用の記憶手段の容量が不足する場合に,上記再生
プログラムの実行に必要な容量が低下させられ,音声処
理プログラムの実行に必要な容量が確保されるため,比
較的低容量の処理用の記憶手段を用いることにより,製
造コストの増大を防止することができる。また,上記請
求項9に記載のディジタル情報再生装置によれば,入力
された音声から音声情報が抽出されると,それを確認す
る内容の確認情報が音声合成され出力されるため,誤操
作の実行を確実に防止することができる。
【0009】
【発明の実施の形態】以下,添付図面を参照して,本発
明の実施の形態につき説明し,本発明の理解に供する。
尚,以下の実施の形態は,本発明の具体的な一例であっ
て,本発明の技術的範囲を限定する性格のものではな
い。ここに,図1は本発明の一実施の形態に係るディジ
タル情報再生装置の概略構成を示す図である。まず,本
発明の一実施の形態に係るディジタル情報再生装置は,
例えば音楽や音声といった音響情報が符号化されたディ
ジタル音響情報を再生するための携帯を目的とした小型
ディジタル音響情報再生装置として具体化されるもので
あって,図1に示す如く,バス10を介して接続された
フラッシュメモリ11,LCDモジュール12などの周
辺デバイスを制御するためのマイコン13と,上記マイ
コン13とホストポートインターフェースを介して接続
され所定のプログラムに従って演算処理を行うDSP
(演算手段の一例)14と,マイク(音声入力手段の一
例)15と,マイク15から入力されたアナログ音声を
ディジタル化し上記DSP14に供給するA/D変換器
16と,上記DSP14から出力されたディジタル信号
をアナログ信号に変換するためのD/A変換器17と,
上記D/A変換器16からのアナログ電気信号を音響信
号に変換して出力するヘッドフォン18と,フラッシュ
メモリ11,LCDモジュール12,マイコン13,D
SP16など装置を駆動するためのバッテリ19とを備
える。また,上記DSP14は,RAMやROMなどの
メモリと演算処理用のプロセッサなどが1チップに集積
化されたICであり,上記DSP14により実行される
プログラムなどが記憶される書き換え可能なメモリ14
1が接続されている。上記メモリ141には,例えばデ
ィジタル情報を再生するための再生プログラムと,音声
に含まれる音声情報を抽出する抽出処理を含む音声処理
を行うための音声処理プログラムと,上記音声処理プロ
グラムが用いる辞書情報が記憶されており,本発明にお
ける再生プログラム記憶手段及び音声処理プログラム記
憶手段に相当する。
【0010】次に,上記ディジタル情報再生装置の詳細
について説明する。上記ディジタル情報再生装置におい
て,使用者が音楽などを試聴しようと「再生」といった
音声情報を含む発声を行うと,その声はマイク15によ
り取り込まれる。ここで,上記音声情報とは,音楽など
のディジタル情報に関して再生,早送り,停止,巻き戻
しといった処理を装置に行わせたり,マイコン13にL
CDモジュールのバックライトを点灯させるなど装置を
制御させたりするための情報である。上記マイク15か
ら取り込まれた音声は,A/D変換器16によりディジ
タル化されてDSP14に供給される。上記DSP14
では,メモリ141から音声処理プログラムが読み出さ
れて常時実行されており,まず上記マイク15からの入
力信号に音声が含まれているか否かが検出される。この
音声の有無の検出は,例えば上記マイク15からの入力
信号の雑音レベルを予め検出しておき,信号対雑音比が
所定値以上になったときに音声が含まれるとして行うこ
とができる。そして,音声が含まれていると検出された
場合には,上記メモリ141に予め記憶され上記「再
生」などの処理に対応したスペクトルパターンなどを含
む辞書情報を参照しながら,上記マイク15からの入力
信号に類似する上記処理が音声情報として抽出される。
上記DSP14の音声処理プログラムの実行により,上
記マイク15からの入力信号に基づいて例えば「再生」
という音声情報が抽出されると,次に「再生」という音
声情報の内容を確認するための例えば「再生を実行しま
す」という確認情報が,上記音声処理プログラムに従っ
て上記DSP16により音声合成される。上記DSP1
6により生成された確認情報は,D/A変換器17によ
りアナログ電気信号に変換された後,スピーカ18によ
り音響信号に変換されて出力される。スピーカ18から
出力された「再生を実行します」という確認情報を聞い
た使用者が,「ハイ」と発声すると,この音声がマイク
15により取り込まれる。そして,上記「再生」の場合
と同様に,上記DSP16の音声処理プログラムの実行
により「ハイ」という音声情報が抽出されると,上記メ
モリ141からディジタル情報を再生するための再生プ
ログラムが読み出されて上記DSP14により実行され
る。尚,例えばスピーカから確認情報を送出した後,
「いいえ」という確認情報を否定する内容の音声情報が
使用者により発声され上記DSP16により抽出された
場合には,もう一度音声情報を入力するよう使用者に促
して,抽出処理が再実行される。その際,再度入力され
た音声情報に基づいて上記メモリ141に記憶されてい
る辞書情報の優先順位などを更新したり,辞書情報の内
容を新たに作成したりしてもよい。これにより,使用者
の特性に合わせた辞書情報を構築することができる。さ
らに,異なる音声認識手法が採用された複数の音声処理
プログラムが上記メモリ141に複数記憶されている場
合には,異なる音声処理プログラムを実行して再度音声
情報の抽出を行うようにしてもよい。そして,上記DS
P14の再生プログラムの実行により生成されたディジ
タル信号は,D/A変換器17に出力されて,アナログ
信号に変換される。上記D/A変換器17から出力され
たアナログ電気信号は,オーディオジャックを介してス
ピーカ18に供給され,スピーカ18により音響信号に
変換され出力される。このようにして使用者は,スイッ
チなどを全く操作することなく,音楽の試聴などディジ
タル信号の再生を行うことができ,筐体が小型であって
も,多くの機能を簡便に使用者に提供することができ
る。
【0011】また,上記「再生」の場合と異なり,例え
ばLCDモジュール12のバックライトをオフする旨を
表す「バックライトオフ」といった発声を使用者が行っ
た場合には,上記DSP14の音声処理プログラムの実
行により「バックライトオフ」という音声情報が抽出さ
れると,上記DSP14において再生プログラムの実行
は行われず,上記DSP14によりバックライトをオフ
するための制御信号が生成されマイコン13に送出され
る。上記制御信号がマイコン13に供給されると,バス
10を介してLCDモジュール12が制御され,LCD
モジュールのバックライトがオフされる。ところで,上
記音声処理プログラムと上記再生プログラムを同時に実
行させようとすると,例えば図2(a)及び図3(a)
に示す如く,上記DSP14の処理能力や上記DSP1
4が利用する処理用のメモリの容量(上記DSP14が
内蔵するRAMなど)が不足する場合がある。この場合
には,例えば図2(b)及び図3(b)に示す如く,D
SP14による再生プログラムの実行を一時的に停止さ
せて,上記音声処理プログラムを実行するための上記D
SP14の処理能力や処理用メモリの容量を確保するよ
うにする。これにより,高速なDSPや大容量の処理用
メモリを備える必要がなくなり,装置の製造コストの増
大を抑えることができる。さらに,例えばディジタル情
報がステレオ音響信号である場合には,例えば図4
(a)及び(b)に示す如く,上記DSP14の再生プ
ログラムの実行により再生する信号を片方のチャンネル
のみに限ることにより,上記再生プログラムの実行に必
要な上記DSP14の処理能力を低下させ,上記音声処
理プログラムの実行に必要な上記DSP14の処理能力
を確保するようにしてもよい。尚,上記DSP14によ
る再生プログラムの実行を一時停止させる場合には,着
脱可能に接続されたフラッシュメモリなどに上記再生プ
ログラムの実行状態を一時的に退避させ,上記再生プロ
グラムの実行を再開する場合には,上記フラッシュメモ
リから上記処理用メモリに上記再生プログラムの実行状
態を転送するようにしてもよい。
【0012】このように本実施の形態に係るディジタル
情報再生装置によれば,プログラムに従って演算処理を
行うDSPが,音声処理プログラムを実行して,マイク
から入力された音声から上記音声情報を抽出し,抽出さ
れた上記音声情報に基づいて,ディジタル情報を再生す
るための再生プログラムの実行を制御するか,又は装置
の制御を行うための制御信号を生成することにより,音
声認識機能の付加に伴う部品増とコストの増大とを抑え
ながら,容易に音声認識の手法などを変更することがで
きる。これにより,装置が小型化されても多くの機能を
簡便に使用者に提供することができる。しかも,音声情
報が抽出される際に用いられる辞書情報が書き換え可能
なメモリに記憶されているため,容易に辞書を変更した
り拡張したりすることができ,音声認識の手法を変更す
ることなく,使用者の合わせて認識精度を向上させるこ
とができる。さらに,例えばステレオ信号の再生を一時
的に片方のチャンネルのみに限るなどして再生プログラ
ムの実行に必要なDSPの処理能力を低下させて,上記
音声処理プログラムの実行に必要な演算手段の処理能力
を確保することにより,低速な演算手段を用いて音声抽
出処理と再生処理とを同時に実行することが可能とな
り,コスト増大を防止することができる。さらに,音声
処理プログラムを再生プログラムと同時に実行するとき
に,DSPが用いる処理用のメモリの容量が不足すると
きに,上記再生プログラムの実行に必要な容量が低下さ
せられ,音声処理プログラムの実行に必要な容量が確保
されるため,比較的低容量の処理用の記憶手段を用いる
ことにより,コストを増大を防止することができる。さ
らに,入力された音声から音声情報が抽出されると,そ
れを確認する内容の確認情報が音声合成され出力される
ため,誤操作の実行を確実に防止することができる。
【0013】
【実施例】上記実施の形態では,音声処理プログラム及
び再生プログラムが上記DSP14に接続された外付け
のメモリ141に記憶されていたが,これに限られるも
のではなく,上記DSP14に内蔵されたメモリに上記
音声処理プログラム及び再生プログラムのいずれか一方
又は両方を記憶するようにしてもよい。さらに,上記実
施の形態では,予め上記メモリ141に音声処理プログ
ラム及び再生プログラムが記憶されていたが,これに限
られるものではなく,例えば再生するディジタル情報の
圧縮符号化形式に対応した再生プログラムが上記メモリ
141などに記憶されていない場合には,例えば図5に
示す如く,外部装置と通信するための外部I/O20を
バス10に接続し,上記外部I/O20により当該圧縮
符号化形式に対応した再生プログラムを受信して,受信
した再生プログラムを上記DSP14により実行するよ
うにしてもよい。もちろん,音声処理プログラムについ
ても,上記外部I/O20により受信されたものを上記
DSP14により実行するようにしてもよい。尚,上記
外部I/O20及びマイコン11による外部I/Oを用
いた通信処理が本発明における通信手段に相当する。さ
らに,上記音声処理プログラムや再生プログラムが記憶
された着脱可能なメモリを装着して,当該メモリから上
記DSPの内蔵RAMなどに随時転送したり,メモリ1
41に転送したりするようにしてもよい。このようなデ
ィジタル情報再生装置も本発明におけるディジタル情報
再生装置の一例である。
【0014】また,音声処理プログラムは上記DSP1
4により常時実行されていたが,これに限られるもので
はなく,例えば図6に示す如く,上記DSP14により
実行するプログラムを使用者が指定するための入力ボタ
ン(操作手段の一例)21を少数設けておき,対応する
入力ボタン21が押されたときにのみ,上記音声処理プ
ログラム及び再生プログラムのいずれか一方又は両方を
上記DSP14により実行するようにしてもよい。例え
ば,ある入力ボタン21が押されたときにのみ,上記音
声処理プログラムを上記DSP14により実行するよう
にすれば,入力された音声のどの時点からどの時点まで
に音声情報が含まれているか否かを上記入力ボタン21
の押圧により判別することが可能となり,これにより音
声情報の抽出をより確実に行うことができる。さらに,
上記音声処理プログラム及び上記再生プログラムのいず
れか一方又は両方を不必要に実行することがなくなるた
め,結果として比較的低速なDSPを用いることも可能
となり,装置の製造コストの増大を抑えることができ
る。尚,上記入力ボタン21は,本体装置に設けてもよ
いが,ヘッドフォンやイヤホンなどが出力部として接続
されている場合には,上記ヘッドフォンやイヤホンなど
に設けた方が,操作性がよく好ましい。このようなディ
ジタル情報再生装置も本発明におけるディジタル情報再
生装置の一例である。
【0015】また,上記実施の形態では,DSPにより
音声処理プログラムが再生プログラムと同時に実行され
たときに,音声処理プログラムを実行するための上記D
SPの処理能力が不足する場合には,上記DSPによる
上記再生プログラムの実行にあたってステレオ信号の再
生を一時的に片方のチャンネルのみに限ることによっ
て,上記再生プログラムの実行に必要な処理能力を低下
させ,上記音声処理プログラムの実行に必要な処理能力
を確保していたが,これに限られるものではなく,例え
ば上記DSPによる上記再生プログラムの実行にあたっ
て再生するデータを間引くことにより上記再生プログラ
ムの実行に必要な処理能力を低下させるようにしてもよ
い。このようなディジタル情報再生装置も本発明におけ
るディジタル情報再生装置の一例である。また,上記実
施の形態では,本発明を音響情報を再生する装置に適用
したが,これに限られるものではなく,例えば映像情報
や文字情報などのディジタル情報を再生する装置に本発
明を適用することも可能である。また,上記実施の形態
では,音声処理プログラムは音声認識及び音声合成を行
うためのものであったが,これに限られるものではな
く,音声認識のみを行ったり,ディジタル情報を再生し
ない場合に辞書情報を学習するなどの機能を備えた音声
処理プログラムを用いてもよい。このようなディジタル
情報再生装置も本発明におけるディジタル情報再生装置
の一例である。
【0016】
【発明の効果】以上説明した通り,上記請求項1〜9の
いずれか1項に記載のディジタル情報再生装置によれ
ば,プログラムに従って演算処理を行う演算手段が,音
声に含まれる音声情報を抽出する抽出処理を含む音声処
理プログラムを実行して,音声入力手段から入力された
音声から上記音声情報を抽出し,抽出された上記音声情
報に基づいて,ディジタル情報を再生するための再生プ
ログラムの実行を制御するか,又は装置の制御を行うた
めの制御信号を生成することにより,音声認識機能の付
加に伴う部品増とコストの増大とを抑えながら,容易に
音声認識の手法などを変更することができる。その結
果,装置が小型化されても,多くの機能を簡便に使用者
に提供することができる。しかも,上記請求項3に記載
のディジタル情報再生装置によれば,音声情報が抽出さ
れる際に用いられる辞書情報が書き換え可能な記憶手段
に記憶されているため,容易に辞書を変更したり拡張し
たりすることができ,音声認識の手法を変更することな
く,使用者に合わせて認識精度を向上させることができ
る。また,上記請求項4に記載のディジタル情報再生装
置によれば,通信手段を用いて再生プログラム及び音声
処理プログラムのいずれか一方又は両方を外部装置から
受信することができ,認識精度の優れた音声処理プログ
ラムや圧縮効率の良い再生プログラムを迅速且つ容易に
導入することができる。
【0017】また,上記請求項5に記載のディジタル情
報再生装置によれば,操作手段により指示されたときに
のみ例えば音声処理プログラムが実行されるため,音声
処理プログラムと再生プログラムを同時に実行させる時
間を短縮して消費電力を低下させるとともに,音声抽出
処理を確実に行わせることができる。また,上記請求項
6又は7に記載のディジタル情報再生装置によれば,例
えばステレオ信号の再生を一時的に片方のチャンネルの
みに限るなどして再生プログラムの実行に必要な演算手
段の処理能力を低下させ,上記音声処理プログラムの実
行に必要な演算手段の処理能力を確保することにより,
低速な演算手段を用いて音声抽出処理と再生処理とを同
時に実行することが可能となり,製造コストの増大を防
止することができる。また,上記請求項8に記載のディ
ジタル情報再生装置によれば,音声処理プログラムを再
生プログラムと同時に実行するときに,演算手段が備え
る処理用の記憶手段の容量が不足する場合に,上記再生
プログラムの実行に必要な容量が低下させられ,音声処
理プログラムの実行に必要な容量が確保されるため,比
較的低容量の処理用の記憶手段を用いることにより,製
造コストの増大を防止することができる。また,上記請
求項9に記載のディジタル情報再生装置によれば,入力
された音声から音声情報が抽出されると,それを確認す
る内容の確認情報が音声合成され出力されるため,誤操
作の実行を確実に防止することができる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態に係るディジタル情報
再生装置の概略構成を示す図。
【図2】 上記ディジタル情報再生装置において2つの
プログラムを同時に実行させた場合の処理能力の不足を
説明するための図。
【図3】 上記ディジタル情報再生装置において2つの
プログラムを同時に実行させた場合のメモリ容量の不足
を説明するための図。
【図4】 上記ディジタル情報再生装置において再生プ
ログラムの実行に必要なDSPの処理能力を低下させる
ことを説明するための図。
【図5】 本発明の一実施例に係るディジタル情報再生
装置の概略構成を示す図。
【図6】 本発明の他の実施例に係るディジタル情報再
生装置の概略構成を示す図。
【符号の説明】
14…DSP 141…メモリ 20…外部I/O 21…入力ボタン
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 9/18 J (72)発明者 山下 俊郎 兵庫県神戸市西区高塚台1丁目5番5号 株式会社神戸製鋼所神戸総合技術研究所内 (72)発明者 高橋 哲也 兵庫県神戸市西区高塚台1丁目5番5号 株式会社神戸製鋼所神戸総合技術研究所内 Fターム(参考) 5D015 KK01 KK04 LL09 5D045 AB01 AB26 AB30 DB01 9A001 BB06 DD15 HH15 HH17 HH18 KK43

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声に含まれる音声情報を抽
    出してディジタル情報の再生を含む装置の制御を行うた
    めの複数の処理手段を備えたディジタル情報再生装置に
    おいて,上記複数の処理手段は,プログラムに従って演
    算処理を行う演算手段と,上記ディジタル情報を再生す
    るための再生プログラムを記憶する再生プログラム記憶
    手段と,音声に含まれる音声情報を抽出する抽出処理を
    含む音声処理を行うための音声処理プログラムを記憶す
    る音声処理プログラム記憶手段と,上記演算手段に音声
    を入力するための音声入力手段とを含み,上記演算手段
    が,上記音声処理プログラム記憶手段に記憶された上記
    音声処理プログラムを実行して,上記音声入力手段から
    入力された音声から上記音声情報を抽出し,抽出された
    上記音声情報に基づいて,上記再生プログラム記憶手段
    に記憶された再生プログラムの実行を制御するか,又は
    装置の制御を行うための制御信号を生成してなることを
    特徴とするディジタル情報再生装置。
  2. 【請求項2】 上記再生プログラム記憶手段,及び音声
    処理プログラム記憶手段のいずれか一方又は両方が,上
    記演算手段に接続された書き換え可能な記憶手段である
    請求項1に記載のディジタル情報再生装置。
  3. 【請求項3】 上記演算手段が上記音声処理プログラム
    を実行して上記音声情報を抽出する際に用いる辞書情報
    が,上記音声処理プログラム記憶手段,又は上記演算手
    段に接続された書き換え可能な他の記憶手段に記憶され
    てなる請求項2に記載のディジタル情報再生装置。
  4. 【請求項4】 上記演算手段が,外部装置と通信する通
    信手段に接続されており,上記再生プログラム及び音声
    処理プログラムのいずれか一方又は両方を上記通信手段
    により受信してなる請求項1〜3のいずれか1項に記載
    のディジタル情報再生装置。
  5. 【請求項5】 上記再生プログラム及び上記音声処理プ
    ログラムのいずれか一方又は両方を上記演算手段により
    実行させる指示を行うための操作手段を具備してなる請
    求項1〜4のいずれか1項に記載のディジタル情報再生
    装置。
  6. 【請求項6】 上記演算手段が,上記音声処理プログラ
    ムを上記再生プログラムと同時に実行するときに,その
    実行に必要な能力が上記演算手段の処理能力を越える場
    合には,上記再生プログラムの実行に必要な能力を低下
    させ,上記音声処理プログラムの実行に必要な能力を確
    保してなる請求項1〜5のいずれか1項に記載のディジ
    タル情報再生装置。
  7. 【請求項7】 上記ディジタル情報が,一対のディジタ
    ル音響信号を含むステレオ情報であって,上記ステレオ
    情報のうち一つのディジタル音響信号の再生を停止する
    ことにより上記再生プログラムの実行に必要な能力を低
    下させてなる請求項6に記載のディジタル情報再生装
    置。
  8. 【請求項8】 上記演算手段が,上記音声処理プログラ
    ムを上記再生プログラムと同時に実行するときに,上記
    演算手段が備える処理用の記憶手段の容量が不足すると
    きに,上記再生プログラムの実行に必要な容量を低下さ
    せ,上記音声処理プログラムの実行に必要な容量を確保
    してなる請求項1〜7のいずれか1項に記載のディジタ
    ル情報再生装置。
  9. 【請求項9】 上記音声処理プログラムが上記音声情報
    の抽出とともに音声の合成も行うものであって,上記演
    算手段による上記音声処理プログラムの実行により,上
    記音声情報が抽出された場合には,上記音声処理プログ
    ラムが上記音声情報の内容を確認するための確認情報を
    音声合成して出力させてなる請求項1〜8のいずれか1
    項に記載のディジタル情報再生装置。
JP11001865A 1999-01-07 1999-01-07 ディジタル情報再生装置 Pending JP2000200096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11001865A JP2000200096A (ja) 1999-01-07 1999-01-07 ディジタル情報再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11001865A JP2000200096A (ja) 1999-01-07 1999-01-07 ディジタル情報再生装置

Publications (1)

Publication Number Publication Date
JP2000200096A true JP2000200096A (ja) 2000-07-18

Family

ID=11513453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11001865A Pending JP2000200096A (ja) 1999-01-07 1999-01-07 ディジタル情報再生装置

Country Status (1)

Country Link
JP (1) JP2000200096A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100386264B1 (ko) * 2000-12-29 2003-06-02 엘지전자 주식회사 음성인식 가입자 장치
JP2006208600A (ja) * 2005-01-26 2006-08-10 Brother Ind Ltd 音声合成装置及び音声合成方法
JP2009527789A (ja) * 2006-02-23 2009-07-30 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100386264B1 (ko) * 2000-12-29 2003-06-02 엘지전자 주식회사 음성인식 가입자 장치
JP2006208600A (ja) * 2005-01-26 2006-08-10 Brother Ind Ltd 音声合成装置及び音声合成方法
JP2009527789A (ja) * 2006-02-23 2009-07-30 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置

Similar Documents

Publication Publication Date Title
CN104247280A (zh) 话音控制的通信连接
JP2013200423A (ja) 音声対話支援装置、方法、およびプログラム
WO2017154282A1 (ja) 音声処理装置および音声処理方法
JP2002149428A (ja) オーディオ信号処理装置およびオーディオ信号処理装置の内部データ書き換え方法
KR100609171B1 (ko) 이어폰의 기능 키를 이용한 음악 재생 제어 장치 및 방법
JP2000200096A (ja) ディジタル情報再生装置
JP2006023773A (ja) 音声処理システム
CN102332293A (zh) 一种车载数字音乐播放器
CN101242440A (zh) 一种带语音复读功能的手机
KR101551968B1 (ko) 차량에 적용된 미디어를 통한 음원 정보 제공 방법
US20080021705A1 (en) Speech processing apparatus and control method therefor
TWI475557B (zh) 音訊處理裝置
JP4143487B2 (ja) 時系列情報制御システム及びその方法並びに時系列情報制御プログラム
JP6143824B2 (ja) 音声対話支援装置、方法、およびプログラム
JP4146949B2 (ja) 音声処理装置
US20080005540A1 (en) Electronic Apparatus, Method for Generating Digital Signal, Digital Signal Recording Medium, and Signal Processing Apparatus
JP4284601B2 (ja) オーディオ信号処理装置および方法、記録媒体、並びにプログラム
JP2000020091A (ja) 音声記録再生装置
JP4985562B2 (ja) 録音装置、方法及びプログラム
JP2000214866A (ja) 小型音響情報処理装置
CN113038312A (zh) 基于智能语音人机交互的dsp音频处理系统和方法
KR20020083544A (ko) 디지털 신호처리부를 이용한 멀티 포맷 씨디플레이어 및그 제어방법
JP2002175095A (ja) 発音学習システム
JP2004235979A (ja) 音入出力装置および音入出力方法
JP5899865B2 (ja) 音響信号加工装置及びプログラム