JP2008058452A - 音声情報認証装置及び音声情報認証方法 - Google Patents

音声情報認証装置及び音声情報認証方法 Download PDF

Info

Publication number
JP2008058452A
JP2008058452A JP2006233163A JP2006233163A JP2008058452A JP 2008058452 A JP2008058452 A JP 2008058452A JP 2006233163 A JP2006233163 A JP 2006233163A JP 2006233163 A JP2006233163 A JP 2006233163A JP 2008058452 A JP2008058452 A JP 2008058452A
Authority
JP
Japan
Prior art keywords
voice information
voice
registered
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006233163A
Other languages
English (en)
Inventor
Yukito Wada
幸人 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP2006233163A priority Critical patent/JP2008058452A/ja
Publication of JP2008058452A publication Critical patent/JP2008058452A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】音声が経年変化しても利用者の手間をかけることなく登録音声情報を更新し且つセキュリティの向上を図る。
【解決手段】音声情報認証装置10によれば、利用者の日常的な音声情報に基づいて参照用音声情報を収集し、該参照用音声情報に基づいて検出した声質の変化に対応するように登録音声情報を補正し、該補正済登録音声情報と入力された音声情報が一致しているか否かを判定するようにしたことから、利用者は登録音声情報を一度登録するだけで、経年変化に応じた再登録を行う必要がなくなる。また、登録音声情報の更新も自動的に行われることから、利用者に手間をかけることを防止できる。さらに、登録音声情報の再登録を排除することで、パスワード等が他人に知られることを防止することができる。
【選択図】図1

Description

本発明は、入力手段から入力した音声情報と登録音声情報記憶手段に予め記憶している登録音声情報が一致しているか否かを判定した判定結果に基づいて前記音声情報の認証を行う音声情報認証装置、音声情報認証方法等の技術分野に関する。
パーソナル・コンピュータ(パソコン)、携帯電話機等の電気機器は、従来から本人確認方法として暗証番号、キーワード等の予め定められた認証情報を入力し、該認証情報が予め登録している登録情報と一致する場合に、本人であると判断するようにしたものが一般に知られている。そして、特許文献1に示すように、認証情報を音声情報に置き換えたものも知られている。
特開2001−265385公報
しかしながら、音声は経年変化するために登録音声データを更新する必要があり、特許文献1の話者認識装置は、基準となる登録音声データと似ている度合いを示す照合スコアを求めて、そのスコアが低かったり、前回との差が大きい場合に更新の必要ありと判定し、話者からの更新の同意があったときに、登録音声データを今回入力された音声データに更新するため、利用者はそのときに「更新する/しない」を決定しなければならず、手間がかかるという問題があった。また、更新する際には登録音声データを再度入力する必要があり、他人に聞かれる可能性があるため、セキュリティを低下させる可能性があった。本発明が解決しようとする課題は、上記した問題が一例として挙げられる。
よって本発明は、上述した問題点に鑑み、音声が経年変化しても利用者の手間をかけることなく登録音声情報を更新し且つセキュリティの向上を図ることができる音声情報認証装置及び音声情報認証方法を提供することを課題としている。
上記課題を解決するため本発明によりなされた請求項1記載の音声情報認証装置は、利用者の音声認証に用いられる登録音声情報を記憶する登録音声情報記憶手段と、音声情報を入力する入力手段と、前記入力手段から入力した音声情報と前記登録音声情報記憶手段の記憶している登録音声情報が一致しているか否かを判定する判定手段と、を有する音声情報認証装置において、前記入力手段から入力した前記利用者の日常的な音声情報に基づいて参照用音声情報を収集する参照用音声情報収集手段と、前記参照用音声情報収集手段が収集した参照用音声情報に基づいて声質の変化を検出する声質変化検出手段と、前記声質変化検出手段が検出した声質の変化に対応するように前記登録音声情報記憶手段の記憶している登録音声情報を補正する登録音声情報補正手段と、を有し、そして、前記判定手段は、前記登録音声情報補正手段が補正した補正済登録音声情報と前記音声情報が一致しているか否かの判定を行う手段であることを特徴とする。
上記課題を解決するため本発明によりなされた請求項5記載の音声情報認証方法は、入力手段から入力した音声情報と登録音声情報記憶手段に予め記憶している利用者の登録音声情報が一致しているか否かを判定した判定結果に基づいて前記音声情報の認証を行う音声認証方法において、前記入力手段から入力した前記利用者に関する音声情報に基づいて参照用音声情報を収集する参照用音声情報収集過程と、前記収集した参照用音声情報に基づいて声質の変化を検出する声質変化検出過程と、前記検出した声質の変化に対応するように前記登録音声情報記憶手段の記憶している登録音声情報を補正する登録音声情報補正過程と、前記補正した補正済登録音声情報と前記音声情報が一致しているか否かの判定を行う判定過程と、を有することを特徴とする。
以下、本発明に係る音声情報認証装置及び音声情報認証方法の一最良の形態を、図1の図面を参照して以下に説明する。なお、図1は本発明に係る音声情報認証装置の基本構成の一例を示す構成図である。
図1において、音声情報認証装置10は、音声認証用の登録音声情報を記憶する登録音声情報記憶手段15と、音声情報を入力する入力手段14と、前記入力手段14から入力した音声情報と前記登録音声情報記憶手段15の記憶している登録音声情報が一致しているか否かを判定する判定手段11aと、を有する音声情報認証装置10において、前記入力手段14から入力した音声情報に基づいて参照用音声情報を収集する参照用音声情報収集手段11bと、前記参照用音声情報収集手段11bが収集した参照用音声情報に基づいて声質の変化を検出する声質変化検出手段11cと、前記声質変化検出手段11cが検出した声質の変化に対応するように前記登録音声情報記憶手段15の記憶している登録音声情報を補正する登録音声情報補正手段11dと、を有し、そして、前記判定手段11aは、前記登録音声情報補正手段11dが補正した補正済登録音声情報と前記音声情報が一致しているか否かの判定を行う手段となっている。
この音声情報認証装置10によれば、入力手段14から入力した利用者に関する音声情報に基づいて参照用音声情報が参照用音声情報収集手段11bによって収集されると、それらの参照用音声情報に基づいて利用者の声質の変化を声質変化検出手段11cによって検出する。そして、その検出した声質の変化に対応するように、登録音声情報記憶手段15の記憶している登録音声情報が登録音声情報補正手段11dによって補正される。その後、その補正済登録音声情報と入力された音声情報が一致しているか否かが判定手段11aによって判定されるので、利用者の声質の経年変化に対応することができる。
また、音声情報認証方法は、入力手段14から入力した音声情報と登録音声情報記憶手段15に予め記憶している利用者の登録音声情報が一致しているか否かを判定した判定結果に基づいて前記音声情報の認証を行う音声認証方法において、前記入力手段14から入力した前記利用者の日常的な音声情報に基づいて参照用音声情報を収集する参照用音声情報収集過程と、前記収集した参照用音声情報に基づいて声質の変化を検出する声質変化検出過程と、前記検出した声質の変化に対応するように前記登録音声情報記憶手段15の記憶している登録音声情報を補正する登録音声情報補正過程と、前記補正した補正済登録音声情報と前記音声情報が一致しているか否かの判定を行う判定過程と、を有している。
この音声情報認証方法によれば、入力手段14から入力した利用者に関する音声情報に基づいて参照用音声情報を常日頃から収集し、その参照用音声情報に基づいて利用者に関する声質の変化の検出を行う。そして、検出した声質の変化に対応するように、登録音声情報記憶手段15の記憶している登録音声情報を補正し、その後は補正済登録音声情報と入力された音声情報が一致しているか否かを判定して音声情報の認証を行うようにしたので、利用者の声質の経年変化に対応することができる。
以上説明した音声情報認証装置10及び音声情報認証方法によれば、利用者の日常的な音声情報に基づいて参照用音声情報を収集し、該参照用音声情報に基づいて検出した声質の変化に対応するように登録音声情報を補正し、該補正済登録音声情報と入力された音声情報が一致しているか否かを判定するようにしたことから、利用者は登録音声情報を一度登録するだけで、経年変化に応じた再登録を行う必要がなくなる。また、登録音声情報の更新も自動的に行われることから、利用者に手間をかけることを防止できる。さらに、登録音声情報の再登録を排除することで、パスワード等が他人に知られることを防止することができる。よって、音声が経年変化しても利用者の手間をかけることなく登録音声情報を更新し且つセキュリティの向上を図ることができる。
また、音声情報認証装置10は、前記参照用音声情報収集手段11bは、前記入力手段14から入力した音声情報と前記登録音声情報記憶手段15が記憶している登録音声情報との一致度に対応した区分に分けて前記参照用音声情報を収集する手段であり、前記声質変化検出手段11cは、前記参照用音声情報収集手段11bが収集した参照用音声情報のうち一致度の高い参照用音声情報に基づいて声質の変化を検出する手段になっている。
この音声情報認証装置10によれば、入力手段14から入力した音声情報と登録音声情報との一致度に対応した区分に分けて参照用音声情報を収集し、一致度の高い参照用音声情報の予め定められた所定量を超える増加を声質の変化と検出するので、声質の経年変化の検出精度を向上させることができるため、利用者の体調不良、声のかれ等による影響を受けることなく、登録音声情報を適切に補正することができる。
また、音声情報認証装置10は、前記参照用音声情報収集手段11bは、前記参照用音声情報収集手段11bは、前記入力手段14から入力した音声情報のうち前記登録音声情報記憶手段15が記憶している登録音声情報との一致度が予め定められた所定値以上の前記音声情報に基づいて前記参照用音声情報を収集する手段になっている。
この音声情報認証装置10によれば、入力手段14から入力した音声情報のうち、登録音声情報との一致度が予め定められた所定値以上の音声情報に基づいて参照用音声情報を収集するようにしたことから、利用者が使用する日常的な音声情報に基づいて参照用音声情報を収集しても、声質が明らかにおかしい音声情報は排除されるため、声質の変化を正確に検出することができる。
次に、上述した音声情報認証装置及び音声情報認証方法を、音声認識機能を有するカーナビゲーション装置に適用する場合の実施例を、図2乃至図4の図面を参照して以下に説明する。なお、上述した図1に示す基本構成のところで説明したものと同一あるいは相当する部分には同一符号を付して説明する。
図2において、カーナビゲーション装置10は、周知であるように車両に搭載されており、上述した音声情報認証装置に相当している。カーナビゲーション装置10は、制御部11と、表示部12と、操作部13と、入力手段としての音声入力部14と、記憶部15と、を有している。そして、制御部11には、表示部12、操作部13、音声入力部14、記憶部15等が接続されている。なお、本実施例では、音声情報認証装置をカーナビゲーション装置10で実現していることから、制御部11には、図示しない速度センサ、GPS(Global Positioning System)受信機、光学ドライブ等が接続されており、各種信号が入力される。
制御部11は、カーナビゲーション装置10全体の制御を司り、周知である中央演算処理装置(CPU)等が用いられる。なお、CPUには、該CPUのためのプログラム等を格納した読み出し専用のメモリであるROM、各種のデータを格納するとともにCPUの処理作業に必要なエリアを有する読み出し書き込み自在のメモリであるRAM等が接続されている。
表示部12は、例えば、周知のLCD(Liquid Crystal Display)等の各種表示装置が用いられる。この表示部12は、制御部11の制御によって、例えば、地図画像や車両の現在地点、これに重畳された検索経路(ルート)、この検索経路に関連する経路案内、経由地点等が表示される。
操作部13は、検索条件やルート設定等の指令入力用の各種キースイッチ等の入力装置を有する。そして、操作部13は、入力装置における入力に応じた入力信号を制御部11に入力する。
音声入力部14は、利用者が発話した音声に応じた音波を音声信号(電気信号)に変換するマイクロフォンを有している。音声入力部14は、変換した音声信号を制御部11に出力する。そして、制御部11は、入力された音声信号を音声情報として取り込んで、記憶部15に記憶する。
記憶部15は、登録音声情報記憶手段に相当し、例えばハードディスク装置、大容量メモリ等が用いられており、図3に示すように、音声情報認証プログラムF1、音声情報データベースF2等の各種情報を記憶している。
音声情報認証プログラムF1は、制御部11に実行されることで、該制御部11(コンピュータ)を上述した請求項中の判定手段、参照用音声情報収集手段、声質変化検出手段、登録音声情報補正手段、及び、認証情報入力手段等の各種手段として機能させるためのプログラムを有している。
音声情報データベースF2は、登録音声情報F21と、通常時参照用音声情報F22と、異常時参照用音声情報F23と、を有している。そして、登録音声情報F21は、利用者の音声認証に用いられる情報であり、パスワードの内容を示すパスワードデータとその発した声の特徴を示す音声データとを有している。例えば、登録音声情報F21として、「質問:犬の名前は?」と「答え:ラッキー」というようなパスワードデータと音声データを有して構成される。
また、音声データの一例としては、ケプストラムによるデータを用いることができる。なお、ケプストラムとは、音声波形のパワースペクトルを対数に変換し、さらに逆フーリエ変換した結果を指している。そして、登録音声情報F21は、経年変化に対応するように補正されることで、補正済登録音声情報となる。
通常時参照用音声情報F22は、カーナビゲーション装置10の音声認識機能に応じて音声入力部14から取り込んだ、例えば「自宅へ帰る」、「トラックアップ」、「ここへ行く」などの日常的な音声情報のうち、登録音声情報F21との一致度が予め設定された通常使用範囲に相当する音声情報が時系列的に複数格納される。そして、通常時参照用音声情報F22は、音声に対応する発話内容データとその声の特徴を示す上述した音声データを有している。このように通常時参照用音声情報F22は、音声データとして利用者の声の変化の傾向(ピッチの変化、声帯の変化により声が低くなった)等から声質の変化を検出することができる、つまり、日常的な音声情報を学習して声質の変化を検出することができる構成となっている。
異常時参照用音声情報F23は、利用者の体調不良の可能性等を考慮するための情報であり、上述した音声認識機能に応じて音声入力部14から取り込んだ日常的な音声情報のうち、登録音声情報F21との一致度が予め定められた異常使用範囲に相当する音声情報が時系列的に複数格納される。異常時参照用音声情報F23の構成については、通常時参照用音声情報F22とほぼ同一の構成となっている。
なお、本実施例では、上述した通常使用範囲を80%以上、異常使用範囲80〜40%のそれぞれの一致度と設定している。そして、一致度が40%よりも低い音声情報については捨てている。つまり、音声認識機能としては問題がない音声情報であっても、声質の変化を検出する上では好ましくないため、参考にしないことで声質変化の検出精度を向上させているが、精度的に問題がない場合はその音声情報を用いるようにしても差し支えない。
次に、図2に示す制御部11が実行する音声情報認証処理の一例を、図4のフローチャートを参照して以下に説明する。
制御部11は、音声情報認証プログラムF1を実行すると、ステップS11において、音声情報データベースF2に登録音声情報が存在するか否かに基づいて、音声パスワードが登録されているか否かを判定する。登録されていると判定した場合(S11でY)、ステップS15に進む。一方、音声パスワードが登録されていないと判定した場合(S11でN)、ステップS12に進む。
ステップS12において、登録画面を表示するための登録画面情報を表示部12に出力することで、表示部12に登録画面を表示させ、ステップS13において、音声入力部14からの音声信号の入力の有無に基づいて、音声パスワードが発せられたか否かが判定される。発せられていないと判定した場合(S13でN)、この判定処理を繰り返すことで、音声パスワードが発せられるのを待つ。一方、音声パスワードが発せられたと判定した場合(S13でY)、ステップS14において、その入力された音声信号に基づいてパスワードデータ等を有する登録音声情報F21が生成されて音声情報データベースF2に格納され、その後ステップS15に進む。
ステップS15において、カーナビゲーション装置10の通常時における不特定多数の人からの音声入力に応じて動作する通常使用を開始し、ステップS16において、記憶部15に記憶されている音声認識使用フラグのフラグ状態に基づいて、音声認識を使用するか否かを判定する。音声認識を使用しないと判定した場合(S16でN)、ステップS22に進む。一方、音声認識を使用すると判定した場合(S16でY)、ステップS17に進む。
ステップS17において、音声入力部14から入力された音声情報と登録音声情報F21の音声データとの声質の一致度合いが80%以上であるか否かを判定する。80%以上であると判定した場合(S17でY)、ステップS18に進む。
ステップS18(参照用音声情報収集手段)において、その音声情報を通常時参照用音声情報F22として音声情報データベースF2に保存(格納)することで記憶部15に記憶し、ステップS19(声質変化検出手段、登録音声情報補正手段)において、収集した通常時参照用音声情報F22と登録音声情報F21の比較結果に基づいて声質(声紋、ピッチ、ケプストラムデータなど)の変化を検出し、その検出した変化後の声質となるように登録音声情報F21の音声データ等を補正し、その後ステップS22に進む。
また、ステップS17で声質の一致度が80%以上ではないと判定した場合(S17でN)、ステップS20において、声質の一致度合いが40%以上〜80%未満であるか否かを判定する。40%以上〜80%未満ではないと判定した場合(S20でN)、ステップS22に進む。一方、40%以上〜80%未満であると判定した場合(S20でY)、このように声質の一致度が低いため、参照用音声情報の保存を行わずに、ステップS21に進む。
ステップS21において、その音声情報を異常時参照用音声情報F23として音声情報データベースF2に保存(格納)することで記憶部15に記憶し、その後ステップS22に進む。なお、詳細な説明は省略するが、異常時参照用音声情報F23はその個数が所定個数以上等の格納率が増した場合、通常時参照用音声情報F22との情報の入れ替えを行い、声質の変化により正確に対応する構成となっている。
ステップS22において、終了するか否かを判定する。終了しないと判定した場合(S22でN)、ステップS15に戻り、一連の処理を繰り返す。一方、終了すると判定した場合(S22でY)、処理を終了する。
次に、パスワードの解除、車の盗難等に応じて、図2に示す制御部11が実行するパスワード解除処理の一例を、図5のフローチャートを参照して以下に説明する。
制御部11は、音声情報認証プログラムF1を実行に応じて利用者からパスワード解除が要求されると、ステップS31において、音声によるパスワードの入力を促すパスワード画面を表示するためのパスワード画面情報を表示部12に出力することで、表示部12にパスワード画面を表示させ、ステップS32に進む。
ステップS32において、音声入力部14から音声情報が入力されたか否かを判定する。入力されていないと判定した場合(S32でN)、ステップS40に進む。一方、入力されたと判定した場合(S32でY)、ステップS33に進む。
ステップS33(判定手段)において、その音声情報に基づいて、発せられた言葉が登録音声情報F21として登録されたパスワードデータが示す言葉と同じであるか否かを判定する。同じではないと判定した場合(S33でN)、ステップS40に進む。一方、同じであると判定した場合(S33でY)、ステップS34に進む。
ステップS34(判定手段)において、その音声情報に基づいて、発せられた声質が登録音声情報F21として登録された音声データが示す音質と同等であるか否かを判定する。同等であると判定した場合(S34でY)、ステップS38に進む。一方、同等ではないと判定した場合(S34でN)、ステップS35に進む。
ステップS35(判定手段)において、その発せられた声質が異常時参照用音声情報F23が示す声質と同等であるか否かを判定する。同等であると判定した場合(S35でY)、ステップS36において、手入力による別のセキュリティ処理を実行し、その後ステップS37に進む。なお、セキュリティ処理は、図示しない入力装置等によって利用者を識別するためのデータを入力させ、予め登録した登録データと等しいときに解除を行うものである。
ステップS37において、セキュリティ処理によって解除できたか否かを判定する。解除できたと判定した場合(S37でY)、ステップS38において、カーナビゲーション装置10におけるロックの解除を要求し、処理を終了する。
一方、ステップS37で解除できなかったと判定した場合(S37でN)、ステップS39において、本人ではないことを警報する警報画面を表示するための警報画面情報を表示部12に出力することで、表示部12に警報画面を表示させ、その後ステップS31に戻り、一連の処理を繰り返す。
次に、上述したカーナビゲーション装置10における音声情報認証装置としての動作(作用)の一例を、図6〜7の図面を参照して以下に説明する。
利用者は、カーナビゲーション装置10を購入して車両に搭載すると、初期設定としてパスワードを音声によってカーナビゲーション装置10に登録する。カーナビゲーション装置10は、そのパスワードを登録音声情報F21として記憶部15に記憶する。その後、カーナビゲーション装置10は、利用者からパスワードに対応する音声情報が入力されたとき、その音声情報の認証を行い、認証された時にパスワードを解除する。
カーナビゲーション装置10は、通常の音声認識機能を使用するために利用者から音声入力部14を介して音声情報が入力されると、その音声情報と登録音声情報等との一致度が所定の一致度である場合、その一致度に対応する通常参照用音声情報F22又は異常時参照用音声情報F23に区分して収集し、記憶部15に時系列的に記憶する。そして、通常参照用音声情報F22に基づいて利用者の声質の変化を検出し、該声質の変化に対応するように登録音声情報F21を補正することになる。
例えば、図6に示すように、「自宅に帰る」という参照用音声情報の登録当時における音声データがグラフG1に示す周波数特性となっており、5年後がグラフG2に示す周波数特性となっている。その結果、周波数帯Rの値が経年変化によって低下して声質が変化したとする。この場合、その周波数帯Rに対応する登録音声情報F21の音声データを下げるように補正することになる。その結果、図7のグラフG3に示すように、登録時のケプストラムデータD1から現在のケプストラムデータD2に年を経る毎に徐徐に低くなるように補正されることになる。よって、図7に示すように、パスワード解除時の実際の入力データDは、登録時のケプストラムデータD1と比較すると認証されないが、現在の補正済のケプストラムデータD2と比較すると近いために認証されるので、経年変化が生じても誤認証を防止することができる。
以上説明したカーナビゲーション装置10によれば、利用者の日常的な音声情報に基づいて通常時参照用音声情報F22又は異常時参照用音声情報F23を収集し、それらの参照用音声情報に基づいて検出した声質の変化に対応するように登録音声情報F21を補正し、該補正済登録音声情報F21と入力された音声情報が一致しているか否かを判定するようにしたことから、利用者は登録音声情報F21を一度登録するだけで、経年変化に応じた再登録を行う必要がなくなる。また、登録音声情報F21の更新も自動的に行われることから、利用者に手間をかけることを防止できる。さらに、登録音声情報F21の再登録作業を排除することで、パスワード等が他人に知られることを防止することができる。よって、音声が経年変化しても利用者の手間をかけることなく登録音声情報F21を更新し且つセキュリティの向上を図ることができる。
また、音声入力部14から入力した音声情報と登録音声情報F21との一致度に対応した区分に分けて通常時参照用音声情報F22又は異常時参照用音声情報F23を収集し、一致度の高い通常時参照用音声情報F22の予め定められた所定量を超える増加を声質の変化と検出するので、声質の経年変化の検出精度を向上させることができるため、登録音声情報F21を適切に補正することができる。
さらに、音声入力部14から入力した音声情報のうち、登録音声情報F21との一致度が予め定められた所定値以上の音声情報に基づいて通常時参照用音声情報F22又は異常時参照用音声情報F23を収集するようにしたことから、利用者が使用する日常的な音声情報に基づいて参照用音声情報F21を収集しても、声質が明らかにおかしい音声情報は排除されるため、声質の変化を正確に検出することができる。
また、異常時参照用音声情報F23を収集することで、利用者が風邪をひく等で一時的に声質が変化したときに対応する異常時参照用音声情報F23を収集できるため、経年変化とそれ以外での声質の変化との違いを判別することが可能となり、声質の変化をより正確に検出することができる。さらに、異常時参照用音声情報F23に基づいて、利用者の体調不良等を検出することが可能となるため、利用者の体調に気を使った案内(例えば、頻繁に休憩を促す、「体調は大丈夫ですか」と問いかけるなど)を行うことができる。
さらに、上述した実施例では、通常時参照用音声情報F22を収集すると、その声質の変化を検出して登録音声情報F21を補正する場合について説明したが、異常時参照用音声情報F23を所定個数収集したときに声質が変化したと見なして登録音声情報F21を補正するなど種々異なる実施形態とすることができる。
また、上述した本実施例では、音声情報認証装置をカーナビゲーション装置10で実現する場合について説明したが、本発明はこれに限定するものではなく、カーオーディオ装置、パーソナル・コンピュータ(パソコン)、携帯電話機等の音声認識を使用した各種機器で実現することもできる。
その他、本発明の実施の際の具体的な構成および手順は、本発明の目的を達成できる範囲で他の構成などに適宜変更できる。
本発明に係る音声情報認証装置の基本構成の一例を示す構成図である。 本発明の音声情報認証装置を適用したカーナビゲーション装置の概略構成の一例を示す構成図である。 図2中に記憶部に記憶される音声情報認証プログラムと音声情報データベースの一例を示す図である。 図2中の制御部が実行する音声情報認証処理の処理概要の一例を示すフローチャートである。 図2中の制御部が実行するパスワード解除処理の処理概要の一例を示すフローチャートである。 音声の経年変化の一例を示すグラフである。 登録音声情報の補正例を説明するためのグラフである。
符号の説明
10 音声情報認証装置(カーナビゲーション装置)
11a 判定手段(制御部)
11b 参照用音声情報収集手段(制御部)
11c 声質変化検出手段(制御部)
11d 登録音声情報補正手段(制御部)
12 表示部
13 操作部
14 入力手段(音声入力部)
15 登録音声情報記憶手段(記憶部)

Claims (4)

  1. 利用者の音声認証に用いられる登録音声情報を記憶する登録音声情報記憶手段と、音声情報を入力する入力手段と、前記入力手段から入力した音声情報と前記登録音声情報記憶手段の記憶している登録音声情報が一致しているか否かを判定する判定手段と、を有する音声情報認証装置において、
    前記入力手段から入力した前記利用者の日常的な音声情報に基づいて参照用音声情報を収集する参照用音声情報収集手段と、
    前記参照用音声情報収集手段が収集した参照用音声情報に基づいて声質の変化を検出する声質変化検出手段と、
    前記声質変化検出手段が検出した声質の変化に対応するように前記登録音声情報記憶手段の記憶している登録音声情報を補正する登録音声情報補正手段と、
    を有し、そして、
    前記判定手段は、前記登録音声情報補正手段が補正した補正済登録音声情報と前記音声情報が一致しているか否かの判定を行う手段であることを特徴とする音声情報認証装置。
  2. 前記参照用音声情報収集手段は、前記入力手段から入力した音声情報と前記登録音声情報記憶手段が記憶している登録音声情報との一致度に対応した区分に分けて前記参照用音声情報を収集する手段であり、
    前記声質変化検出手段は、前記参照用音声情報収集手段が収集した参照用音声情報のうち一致度の高い参照用音声情報に基づいて声質の変化を検出する手段であることを特徴とする請求項1に記載の音声情報認証装置。
  3. 前記参照用音声情報収集手段は、前記入力手段から入力した音声情報のうち前記登録音声情報記憶手段が記憶している登録音声情報との一致度が予め定められた所定値以上の前記音声情報に基づいて前記参照用音声情報を収集する手段であることを特徴とする請求項1又は2に記載の音声情報認証装置。
  4. 入力手段から入力した音声情報と登録音声情報記憶手段に予め記憶している利用者の登録音声情報が一致しているか否かを判定した判定結果に基づいて前記音声情報の認証を行う音声認証方法において、
    前記入力手段から入力した前記利用者の日常的な音声情報に基づいて参照用音声情報を収集する参照用音声情報収集過程と、
    前記収集した参照用音声情報に基づいて声質の変化を検出する声質変化検出過程と、
    前記検出した声質の変化に対応するように前記登録音声情報記憶手段の記憶している登録音声情報を補正する登録音声情報補正過程と、
    前記補正した補正済登録音声情報と前記音声情報が一致しているか否かの判定を行う判定過程と、
    を有することを特徴とする音声情報認証方法。
JP2006233163A 2006-08-30 2006-08-30 音声情報認証装置及び音声情報認証方法 Pending JP2008058452A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006233163A JP2008058452A (ja) 2006-08-30 2006-08-30 音声情報認証装置及び音声情報認証方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006233163A JP2008058452A (ja) 2006-08-30 2006-08-30 音声情報認証装置及び音声情報認証方法

Publications (1)

Publication Number Publication Date
JP2008058452A true JP2008058452A (ja) 2008-03-13

Family

ID=39241289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006233163A Pending JP2008058452A (ja) 2006-08-30 2006-08-30 音声情報認証装置及び音声情報認証方法

Country Status (1)

Country Link
JP (1) JP2008058452A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017068243A (ja) * 2014-06-24 2017-04-06 グーグル インコーポレイテッド 発話者の検証のための動的な閾値
CN113327617A (zh) * 2021-05-17 2021-08-31 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
CN113327618A (zh) * 2021-05-17 2021-08-31 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
US11200904B2 (en) 2018-05-25 2021-12-14 Samsung Electronics Co., Ltd. Electronic apparatus, controlling method and computer readable medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0580792A (ja) * 1991-09-20 1993-04-02 Mitsubishi Electric Corp 確率演算装置及び確率演算方法
JP2001265385A (ja) * 2000-03-15 2001-09-28 Omron Corp 話者認識装置
JP2001338295A (ja) * 2000-05-26 2001-12-07 Wens Network Kk 生態情報による本人認証システム
JP2006017936A (ja) * 2004-06-30 2006-01-19 Sharp Corp 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0580792A (ja) * 1991-09-20 1993-04-02 Mitsubishi Electric Corp 確率演算装置及び確率演算方法
JP2001265385A (ja) * 2000-03-15 2001-09-28 Omron Corp 話者認識装置
JP2001338295A (ja) * 2000-05-26 2001-12-07 Wens Network Kk 生態情報による本人認証システム
JP2006017936A (ja) * 2004-06-30 2006-01-19 Sharp Corp 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
河井 恒: "音声合成用大規模音声コーパスにおける声質時期差の検討", 電子情報通信学会技術研究報告, vol. 102, no. 292, JPN6011010108, 23 August 2002 (2002-08-23), JP, ISSN: 0001857004 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017068243A (ja) * 2014-06-24 2017-04-06 グーグル インコーポレイテッド 発話者の検証のための動的な閾値
US9972323B2 (en) 2014-06-24 2018-05-15 Google Llc Dynamic threshold for speaker verification
US11200904B2 (en) 2018-05-25 2021-12-14 Samsung Electronics Co., Ltd. Electronic apparatus, controlling method and computer readable medium
CN113327617A (zh) * 2021-05-17 2021-08-31 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
CN113327618A (zh) * 2021-05-17 2021-08-31 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
CN113327617B (zh) * 2021-05-17 2024-04-19 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
CN113327618B (zh) * 2021-05-17 2024-04-19 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US9087515B2 (en) Determining navigation destination target in a situation of repeated speech recognition errors
JP4757158B2 (ja) 音信号処理方法、音信号処理装置及びコンピュータプログラム
CN104252864B (zh) 实时语音分析方法和系统
JP5229234B2 (ja) 非音声区間検出方法及び非音声区間検出装置
US6937982B2 (en) Speech recognition apparatus and method using two opposite words
US20110178804A1 (en) Voice recognition device
US7310602B2 (en) Navigation apparatus
JP5151102B2 (ja) 音声認証装置、音声認証方法およびプログラム
US8626506B2 (en) Method and system for dynamic nametag scoring
JP2004061576A (ja) 音声制御装置
JP2008076881A (ja) 音声認識方法、音声認識装置及びコンピュータプログラム
US20040206228A1 (en) Music data selection apparatus, music data selection method, and information recording medium on which music data selection program is computer-readably recorded
US8374868B2 (en) Method of recognizing speech
US20140074473A1 (en) Navigation apparatus
JP4940887B2 (ja) 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
JP2008058452A (ja) 音声情報認証装置及び音声情報認証方法
US20120004908A1 (en) Voice recognition terminal
JP3718088B2 (ja) 音声認識修正方式
JP2019124976A (ja) リコメンド装置、リコメンド方法、及びリコメンドプログラム
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP2009075249A (ja) 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム
JP5151103B2 (ja) 音声認証装置、音声認証方法およびプログラム
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
JP4178931B2 (ja) 音声認識装置
JP2010107614A (ja) 音声案内応答方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712