JP5646675B2 - 情報処理装置及び方法 - Google Patents

情報処理装置及び方法 Download PDF

Info

Publication number
JP5646675B2
JP5646675B2 JP2013056509A JP2013056509A JP5646675B2 JP 5646675 B2 JP5646675 B2 JP 5646675B2 JP 2013056509 A JP2013056509 A JP 2013056509A JP 2013056509 A JP2013056509 A JP 2013056509A JP 5646675 B2 JP5646675 B2 JP 5646675B2
Authority
JP
Japan
Prior art keywords
character string
authentication
user
utterance
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013056509A
Other languages
English (en)
Other versions
JP2014182270A (ja
Inventor
江森 正
正 江森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013056509A priority Critical patent/JP5646675B2/ja
Publication of JP2014182270A publication Critical patent/JP2014182270A/ja
Application granted granted Critical
Publication of JP5646675B2 publication Critical patent/JP5646675B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声認証に関する。
ユーザの本人性を音声の特徴で認証する技術は、音声認証などと呼ばれる。音声認証は例えば、事前に登録した音声の情報と、認証時に入力された音声とを照合し、その一致度を表すスコア等が所定値以上なら本人であると認証するものである。
認証のため事前に音声を登録する際は、例えば、システムまたは本人が決める一または二以上のフレーズすなわち文字列を本人に発話してもらい、その音声データを分析し、メルケプストラムなどの特徴量として、あるいはそれらから十分統計量を計算し混合正規分布のモデルとするなどとして、特徴を表す音声の情報として保存する。
認証時に発話してもらうフレーズについては、登録時と同じフレーズを用いる態様(フレーズ登録型などとも呼ぶ)と、異なるフレーズを用いる態様がある。後者の例としては、アクセス毎にパスワードとして異なるフレーズを装置側から指定する技術がある(例えば、特許文献1参照)。
特開2002−269047号
ところで、登録時と認証時で同じフレーズを用いるフレーズ登録型では、照合精度は優れるものの、認証時の発話内容を録音され再生されると、認証が不正に突破されるセキュリティリスクがあった。また、ユーザが他の何らかのパスワードをフレーズに流用していると、立ち聞きされただけでもセキュリティリスクが生じる問題もあった。
一方、アクセス毎にパスワードとして異なるフレーズを装置側から指定する技術では(例えば、特許文献1)、録音による不正への耐性には優れるが、登録時と認証時で異なるフレーズとなるため、そもそもの認証精度が低下する問題があった。
上記の課題をふまえ、本発明の目的は、音声認証における認証精度とセキュリティリスク低減の両立である。
上記の目的をふまえ、本発明の一態様(1)である情報処理装置は、ユーザによる第1文字列の発話を受け付け、ユーザと、前記第1文字列と、発話された音声の情報である登録特徴と、を対応付けてユーザ情報記憶手段に記憶させる事前登録手段と、第2文字列の候補を複数記憶している候補記憶手段と、認証の対象とするユーザについて、前記候補のうち、前記ユーザ情報記憶手段に記憶されている第1文字列に含まれる文字を所定以上含むものを選択して前記第2文字列を決定する対象決定手段と、決定された第2文字列を提示し発話を受け付ける認証時受付手段と、前記認証時受付手段により受け付けられた発話である認証時発話と、前記ユーザ情報記憶手段に記憶されている前記登録特徴と、に基づいてユーザを認証する認証手段と、を備えたことを特徴とする。
本発明の他の態様(6)である情報処理方法は、上記態様を方法のカテゴリで捉えたもので、ユーザによる第1文字列の発話を受け付け、ユーザと、前記第1文字列と、発話された音声の情報である登録特徴と、を対応付けてユーザ情報記憶手段に記憶させる事前登録処理と、認証の対象とするユーザについて、候補記憶手段に記憶されている複数の第2文字列の候補のうち前記ユーザ情報記憶手段に記憶されている第1文字列に含まれる文字を所定以上含むものを選択して前記第2文字列を決定する対象決定処理と、決定された第2文字列を提示し発話を受け付ける認証時受付処理と、前記認証時受付処理により受け付けられた認証時発話と、前記ユーザ情報記憶手段に記憶されている前記登録特徴と、に基づいてユーザを認証する認証処理と、をコンピュータが実行することを特徴とする。
本発明の他の態様(3)は、上記いずれかの態様において、前記対象決定手段は、前記第1文字列と前記候補が母音、「Wa」、「Ya」、「Yu」及び「Yo」を共通して含む量を他の要素より相対的に大きなウェイトで評価して前記第2文字列を選択することを特徴とする。
本発明の他の態様(4)は、上記いずれかの態様において、前記対象決定手段は、前記第1文字列と前記候補が要素の種類の並びを共通して含む量に基づいて前記第2文字列を決定することを特徴とする。
本発明の他の態様(5)は、上記いずれかの態様において、前記第1文字列と前記候補が共通して含む母音が連続する量に基づいて前記第2文字列を選択することを特徴とする。
本発明の他の態様(6)は、上記いずれかの態様において、前記対象決定手段は、前記第1文字列と前記候補が共通して含む要素の種類の多さに基づいて前記第2文字列を選択することを特徴とする。
本発明によれば、音声認証における認証精度とセキュリティリスク低減の両立が可能となる。
本発明の実施形態について構成を示す機能ブロック図。 本発明の実施形態におけるデータの例を示す図。 本発明の実施形態におけるデータの例を示す図。 本発明の実施形態における処理手順を示すフローチャート。 本発明の実施形態における第1文字列と第2文字列の関係を示す概念図。
次に、本発明を実施するための形態(「実施形態」と呼ぶ)について図に沿って例示する。なお、背景技術や課題などで既に述べた内容と共通の前提事項は適宜省略する。
〔1.構成〕
図1は、本実施形態の構成図である。音声認証サーバ1(単に「サーバ1」とも呼ぶこととする)は、通信ネットワークN(インターネット、携帯電話網など)を介し、サービス提供サーバ2を利用する端末Tのユーザの本人性を音声認証する情報処理装置である。
サーバ1は、コンピュータの構成として、CPUなどの演算制御部6と、主メモリや補助記憶装置等の記憶装置7と、通信ネットワークNとの通信装置8(通信機器や通信アダプタなど)と、を有する。他の装置(端末T、サービス提供サーバ2)も、仕様は異なるが同様にコンピュータの構成を有する(図示省略)。
端末Tは、実際にはユーザ数に応じて多数存在し、スマートフォン、タブレットPCなどの携帯情報端末や、デスクトップその他のパーソナルコンピュータなどである。サーバ1では、記憶装置7に記憶されている図示しないコンピュータプログラムを演算制御部6が実行することで、図1に示す各要素を実現する。
実現される要素のうち、情報の記憶手段は、端末T内のいわゆるローカル記憶に限らず、ネットワーク・コンピューティング(クラウド)などによるリモート記憶でもよい。また、本出願に示す記憶手段は、説明の便宜に合わせた単位で示す主なものであり、実際は、情報の記憶に付随する入出力や管理などの機能を含めたり、構成の単位を分割または一体化したり、ワークエリアなど他の記憶手段を適宜用いてよい。
なお、図中(例えば図1)の矢印は、データや制御などの流れについて主要な方向を補助的に示すもので、他の流れの否定や方向の限定を意味するものではない。また、記憶手段以外の各手段は、以下に説明するような情報処理の機能・作用を実現・実行する処理手段であるが、これらは説明の便宜による機能単位で、実際のハードウェア要素やソフトウェアモジュールとの一致は問わない。
記憶手段のうち、ユーザ情報記憶手段25は、音声認証のためのユーザ毎の情報を記憶する手段である(例えば図2)。候補記憶手段65は、認証時にユーザに発話してもらう第2文字列の候補を複数記憶している手段である(例えば図3)。
〔2.作用〕
図4は、上記のように構成されたサーバ1の動作手順のうち、特に本発明に関する部分として、事前の登録と、認証と、を示すフローチャートである。すなわち、サービス提供サーバ2に利用のためブラウザやアプリケーションプログラム(「アプリ」とも呼ぶ)などでアクセスした端末Tは、初回は、音声認証のための事前の登録のため(ステップS12からS14)、登録後は音声認証のため(ステップS15からS20)、それぞれ音声認証サーバ1へリダイレクトされる。
本実施形態によるユーザの音声認証は、発話者が、本人がID入力などで主張する人物であるか否かの認証であり、事前の登録を前提とする(ステップS12からS14)。
〔2−1.登録時の動作〕
登録を行う際は(ステップS11:「登録」)、事前登録手段20が、ユーザによる第1文字列(「登録テキスト」と呼ぶこととする)の発話を受け付ける(ステップS12)。
また、事前登録手段20は、ユーザと(具体的にはユーザの識別情報と)、発話された登録テキストと、発話された音声から抽出する音声の情報(本出願において「登録特徴」と呼ぶこととする)と(ステップS13)、を対応付けてユーザ情報記憶手段25に記憶させる(ステップS14)。登録時に登録のためのサンプルとして発話された音声は「登録音声」とも呼ぶこととする。
ここで、登録テキストは、ユーザに登録音声を発話してもらうための文字列で、予めシステムに登録されているものでも、あるいはユーザによって独自に決められたものでもよい。
ユーザが決める登録テキストについては、事前にユーザが文字入力したうえでそれを発話してもよいし、ユーザの発話から音声認識で取得してもよい。例えば、登録テキストが「わたくしわすずきです やふーかぶしきがいしゃにきんむしています すきなたべものはりんごです」であったとする(図5(1))。
発話された音声の情報である登録特徴は例えば特徴量であり、より具体的には、ユーザ毎かつ音素ごとの統計情報などである。音声認証に用いる特徴量など登録特徴については、既知の技術を用いてよいが、例えば、事前登録手段20は、音声特徴分析部21及び音素統計情報計算部23を備える。このうち、音声特徴分析部21は、音声データを一定間隔ごとに分析し特徴量を抽出する部分である。
特徴量としては、メルケプストラム係数や、それらの時間方向の変化量などが挙げられる。また、一定間隔は、10ミリ秒程度に設定することが多く、この間隔で区切られた時間幅をフレームと呼ぶ。
音素統計情報計算部23は、特徴量と、登録テキストから得られる音素と、のアライメント(対応関係を表す情報)を、一般背景モデルに蓄積された情報を用いて計算し、音素ごとの特徴量の統計情報を抽出し、抽出したユーザごとかつ音素ごとの統計情報をユーザ情報記憶手段25に記憶させる。
一般背景モデルは、大量の音声データとそれらの発話内容を表したテキスト情報を用いて計算された音素毎の統計情報やモデル等を蓄積したものである。これらの情報の例として、HMM(隠れマルコフモデル:Hidden Markov Model)や、GMM(混合ガウス分布モデル:Gaussian mixture model)等が挙げられる。
また、音素は、音声認証における照合の単位で、本実施形態では説明の便宜上、登録テキストが「わたくしわ」の場合、音節である「わ」「た」「く」「し」を音素と仮定するが、実際にはより細分化された単位などを用いる。
統計情報は、音素単位の特徴量の統計結果で、例えば「わ」の発声の長さが50ミリ秒だった場合、特徴量は10ミリ秒を単位とする5回表れることになり、5回分の特徴量に関する平均や分散、出現回数等に当たる。
〔2−2.照合テキストの決定〕
認証時には(ステップS11:「認証」)、まず、対象決定手段30が、認証の対象とするユーザについて、ユーザ情報記憶手段25に記憶されている登録テキストの一部分を選択して、発話してもらう第2文字列(「照合テキスト」と呼ぶこととする)を決定する(ステップS15)。具体的には、対象決定手段30が、候補記憶手段65に予め記憶されている第2文字列の複数の候補から、最適な文字列を第2文字列として決定する。
第2文字列を決定する基準は、例えば、登録テキストに含まれる文字が多く含まれるものである。この場合、対象決定手段30は、候補のうち、登録テキストに含まれる文字を所定以上含むものを第2文字列として選択する。
例えば、図3に例示する複数の候補C1〜C3のうち、上記の登録テキスト中の文字を最も多く含むのは、候補C1の「われわれわやふーのおんせいにんしょうしすてむです」である(図5(2))。
候補毎に文字数が異なる場合、「最も多く含む」基準は、登録テキストと共通の文字数でもよいし、候補の文字数中で登録テキストと共通の文字が占める割合でもよい。例えば、図5(2)に示す候補C1は、24文字中15文字が共通であり、その数、文字数中の割合ともに、他の候補C2、C3と比べ最多である。
なお、図5(1)の登録テキストと、それに基づく図5(2)の照合テキストは、共通する文字を下線と太字で強調して示している。また、図5中の矢印は、登録テキストと共通する文字を照合テキストが多く含む関係のうち、一部分を説明のために示すものである。なお、図5に示す共通する文字は、厳密に正しいものではなく説明のための概念的例示にすぎない。
また、登録テキストと候補との間で共通する要素のバラエティの多さ(例えば音種の数)を、照合テキストを選ぶ基準として、単独で又は他の基準と組み合わせて用いてもよい。図3に示す候補C1からC3のなかでは、この音種の数の点でも候補C1が照合テキストとして最適となる(図5(2)から(4))。
上記は一例であり、照合テキストを決定する基準にはさまざまなバリエーションがあり得る。例えば、対象決定手段30は、登録テキストと候補が、母音、「Wa」、「Ya」、「Yu」及び「Yo」を共通して含む量を他の要素より相対的に大きなウェイトで評価して第2文字列を選択してもよい。ウェイトの例は、母音、「Wa」、「Ya」、「Yu」及び「Yo」を共通して含む候補の個所数を、他の要素と比べ2倍にカウント(ダブルカウント)するなどである。
この基準による場合も、候補C1(図5(2))は、長音を母音とみなすと、ダブルカウント対象が5カ所あり、共通する要素数が15文字+5で20文字相当となるので、他の候補C2(母音「い」2カ所で13文字相当)、候補C3(無しで10文字相当のまま)をさらに引き離すことになる。
また、対象決定手段30は、登録テキストと候補が、要素の種類の並びを共通して含む量に基づいて第2文字列を選択してもよい。要素の種類の一例は、個別の音素であり、図5(1)及び(2)の例では、「やふー」や「です」のように複数の要素が並びまで共通の個所数を、大きなウェイトでカウントし他の基準と組み合わせて基準とする候補毎のスコアに加味したり、単独で基準とする。
種類の他の例は、音素を構成する子音の共通性で、例えば「か」と「き」はともに子音が「k」なので、「かき」は「k−k」という子音の並びとなり、子音の並びが同じ「かこ」や「こく」などと共通する要素としてカウントしたり大きなウェイトで評価する。並びは2つに限らず3つ以上でもよい。
同様に、種類の他の例は、母音の共通性であり、例えば「たこ」と「かこ」はともに母音が「a−o」の並びで、共通する要素としてカウントしたり大きなウェイトで評価する。種類の他の例は、子音又は母音の別であり、例えば、図5(1)2行目の「して」と、3行目の「すき」はともに子音を含む点で共通する。
また、対象決定手段30は、登録テキストと候補が、共通して含む母音が連続する量に基づいて第2文字列を選択してもよい。例えば、図5(1)の登録テキストと図5(2)の照合テキストで共通する「やふー」は、発音は「yahuu」となり母音「u」が連続するので、このような個所数を相対的に大きなウェイトで評価しスコア比較などで発話対象を選択する。
〔2−3.発話の受付と認証〕
続いて、認証時受付手段40は、決定された発話対象である照合テキストを提示して発話を受け付け(ステップS16)、認証手段50が、認証時受付手段40により受け付けられた発話(「認証時発話」とも呼ぶこととする)から抽出する特徴量と(ステップS17)、ユーザ情報記憶手段25に記憶されている登録特徴と、の照合に基づいてユーザを認証する(ステップS18)。
具体的には、認証時受付手段40は、音声特徴分析部21と同様に、照合テキストに応じて発話された認証時発話の音声を分析し、フレームごとの特徴量を抽出する。
また、認証手段50は、照合テキストに応じた認証時発話のうち、登録テキストに含まれていない文字に対応する部分については一般背景モデル、含まれている文字に対応する部分についてはユーザ情報記憶手段25に記憶されている登録特徴のうち照合テキストに含まれている文字に対応する部分を用いて、照合テキストと特徴量のアライメントを計算し、登録テキストに含まれている部分のスコアを抽出する。
アライメントは、照合テキスト中の各文字と、時間的な位置との関係であり、照合テキストに応じて発話された音声から抽出されたフレームごとの特徴量(特徴ベクトル)を、末尾側から登録テキストに対応する特徴量の統計情報と照合比較し、登録テキストに含まれる部分の差の小ささをフレームごとにスコア化する。
そして、スコアのフレームあたりの平均値が予め設定された値より大きい場合には(ステップS18:「YES」)、発話者は本人である旨の肯定的な認証結果を返し(ステップS19)、それ以外の場合は(ステップS18:「NO」)、否定的な認証結果を返す(ステップS20)。照合結果は、本人であるか否かを1か0かのように出力するほか、本人である確率や確信度などの数字やレベル区分などで出力してもよい。
〔3.効果〕
(1)以上のように、本実施形態では、登録時に発話された登録テキスト(例えば図5(1))の一部分を、認証時に選択して発話を求めることにより(例えば図5(2))、認証精度とセキュリティリスク低減を両立できる。
(2)また、本実施形態では、予め用意された候補のうち、事前登録時に発話された登録テキストに含まれる文字を多く含むものを発話対象とする第2文字列(照合テキスト)として用いることにより(図5)、照合対象の文字が増えて認証精度が向上し、フレーズ登録型に近い認証精度が期待できる。
(3)また、本実施形態では、登録テキストをもとに候補から、個人差が表れやすい母音、「Wa」、「Ya」、「Yu」及び「Yo」を重視して候補から発話対象を決定することにより(例えば図4)、認証精度が一層向上する。
(4)また、本実施形態では、登録テキストをもとに候補から、要素の種類の並びが共通するという比較しやすい部分の量をもとに発話対象を決定することにより、認証精度が一層向上する。
(5)また、本実施形態では、登録テキストをもとに候補から、母音の連続という個人差が表れやすい部分の量をもとに発話対象を決定することにより、認証精度が一層向上する。
(6)また、本実施形態では、登録テキストをもとに候補から、共通する要素の種類の多さをもとに発話対象を決定することにより、特徴の照合が多面的となり、認証精度が一層向上する。
〔4.他の実施形態〕
なお、上記実施形態や図の内容は例示に過ぎず、各要素の有無や配置、処理の順序や内容などは適宜変更可能である。このため、本発明は、以下に例示する変形例やそれ以外の他の実施形態も含むものである。
例えば、決定される発話対象は、登録テキストの一部を含むものに限らず、登録テキストの一部のみ(1文字、1音節、1文節など)でもよく、発話対象を決定する際における登録テキストの一部の選択は、ランダムでも規則的でもよい。また、候補から照合テキストを選択する場合、全ての要素(文字、音素、音節など)を均等なウェイトで評価してもよい。
また、本発明の各態様は、明記しない他のカテゴリ(方法、プログラム、端末を含むシステムなど)としても把握できる。方法やプログラムのカテゴリでは、装置のカテゴリで示した「手段」を「処理」や「ステップ」のように適宜読み替えるものとする。また、「手段」の全部又は任意の一部を「部」(ユニット、セクション、モジュール等)と読み替えることができる。
また、実施形態に示した処理やステップについても、順序を変更したり、いくつかをまとめて実行しもしくは一部分ずつ分けて実行するなど変更可能である。また、個々の手段、処理やステップを実現、実行するハードウェア要素などは共通でもよいし、手段、処理やステップごとにもしくはタイミングごとに異なってもよい。
また、本出願で示す個々の手段は、外部のサーバが提供している機能をAPI(アプリケーションプログラムインタフェース)やネットワーク・コンピューティング(いわゆるクラウドなど)で呼び出して実現してもよい。さらに、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず物理的な電子回路など他の情報処理機構で実現してもよい。
C1〜C3 候補
1 音声認証サーバ
2 サービス提供サーバ
6 演算制御部
7 記憶装置
8 通信装置
20 事前登録手段
21 音声特徴分析部
23 音素統計情報計算部
25 ユーザ情報記憶手段
30 対象決定手段
40 認証時受付手段
50 認証手段
65 候補記憶手段
N 通信ネットワーク
T 端末

Claims (6)

  1. ユーザによる第1文字列の発話を受け付け、ユーザと、前記第1文字列と、発話された音声の情報である登録特徴と、を対応付けてユーザ情報記憶手段に記憶させる事前登録手段と、
    第2文字列の候補を複数記憶している候補記憶手段と、
    認証の対象とするユーザについて、前記候補のうち、前記ユーザ情報記憶手段に記憶されている第1文字列に含まれる文字を所定以上含むものを選択して前記第2文字列を決定する対象決定手段と、
    決定された前記第2文字列を提示し発話を受け付ける認証時受付手段と、
    前記認証時受付手段により受け付けられた発話である認証時発話と、前記ユーザ情報記憶手段に記憶されている前記登録特徴と、に基づいてユーザを認証する認証手段と、
    を備えたことを特徴とする情報処理装置。
  2. 前記対象決定手段は、前記第1文字列と前記候補が母音、「Wa」、「Ya」、「Yu」及び「Yo」を共通して含む量を他の要素より相対的に大きなウェイトで評価して前記第2文字列を決定することを特徴とする請求項1記載の情報処理装置。
  3. 前記対象決定手段は、前記第1文字列と前記候補が要素の種類の並びを共通して含む量に基づいて前記第2文字列を決定することを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記対象決定手段は、前記第1文字列と前記候補が共通して含む母音が連続する量に基づいて前記第2文字列を決定することを特徴とする請求項1からのいずれか一項に記載の情報処理装置。
  5. 前記対象決定手段は、前記第1文字列と前記候補が共通して含む要素の種類の多さに基づいて前記第2文字列を決定することを特徴とする請求項1からのいずれか一項に記載の情報処理装置。
  6. ユーザによる第1文字列の発話を受け付け、ユーザと、前記第1文字列と、発話された音声の情報である登録特徴と、を対応付けてユーザ情報記憶手段に記憶させる事前登録処理と、
    認証の対象とするユーザについて、候補記憶手段に記憶されている複数の第2文字列の候補のうち前記ユーザ情報記憶手段に記憶されている第1文字列に含まれる文字を所定以上含むものを選択して前記第2文字列を決定する対象決定処理と、
    決定された前記第2文字列を提示し発話を受け付ける認証時受付処理と、
    前記認証時受付処理により受け付けられた発話である認証時発話と、前記ユーザ情報記憶手段に記憶されている前記登録特徴と、に基づいてユーザを認証する認証処理と、
    をコンピュータが実行することを特徴とする情報処理方法。
JP2013056509A 2013-03-19 2013-03-19 情報処理装置及び方法 Active JP5646675B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013056509A JP5646675B2 (ja) 2013-03-19 2013-03-19 情報処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013056509A JP5646675B2 (ja) 2013-03-19 2013-03-19 情報処理装置及び方法

Publications (2)

Publication Number Publication Date
JP2014182270A JP2014182270A (ja) 2014-09-29
JP5646675B2 true JP5646675B2 (ja) 2014-12-24

Family

ID=51701029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013056509A Active JP5646675B2 (ja) 2013-03-19 2013-03-19 情報処理装置及び方法

Country Status (1)

Country Link
JP (1) JP5646675B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6686585B2 (ja) * 2016-03-18 2020-04-22 日本電気株式会社 チケット有効性判定システム、チケット有効性判定方法、チケット有効性判定プログラム、チケット有効性判定プログラムを記憶する記憶媒体
DE112019006868T5 (de) 2019-02-15 2021-11-04 Sony Group Corporation Datenverarbeitungseinrichtung und datenverarbeitungsverfahren
JP7339116B2 (ja) * 2019-10-11 2023-09-05 グローリー株式会社 音声認証装置、音声認証システム、および音声認証方法
KR20220082258A (ko) 2020-12-10 2022-06-17 삼성전자주식회사 전자 장치 및 전자 장치에서 기억 서비스를 제공하는 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5953900A (ja) * 1982-09-21 1984-03-28 シャープ株式会社 音声認識方法
JPS63157199A (ja) * 1986-12-22 1988-06-30 株式会社東芝 話者照合装置
JPH11249683A (ja) * 1998-03-06 1999-09-17 Sharp Corp 音声入力装置
JP2000099090A (ja) * 1998-09-22 2000-04-07 Kdd Corp 記号列を用いた話者認識方法
JP3818063B2 (ja) * 2001-01-25 2006-09-06 松下電器産業株式会社 個人認証装置
JP2002269047A (ja) * 2001-03-07 2002-09-20 Nec Eng Ltd 音声ユーザ認証システム
JP4245948B2 (ja) * 2003-03-27 2009-04-02 富士通株式会社 音声認証装置、音声認証方法及び音声認証プログラム
US8065147B2 (en) * 2006-09-21 2011-11-22 Nuance Communications, Inc. Gramma generation for password recognition

Also Published As

Publication number Publication date
JP2014182270A (ja) 2014-09-29

Similar Documents

Publication Publication Date Title
JP6394709B2 (ja) 話者識別装置および話者識別用の登録音声の特徴量登録方法
CN108463849B (zh) 一种计算机实现的方法和计算系统
CN109587360B (zh) 电子装置、应对话术推荐方法和计算机可读存储介质
US7689418B2 (en) Method and system for non-intrusive speaker verification using behavior models
CN107665705B (zh) 语音关键词识别方法、装置、设备及计算机可读存储介质
US6490560B1 (en) Method and system for non-intrusive speaker verification using behavior models
US7421387B2 (en) Dynamic N-best algorithm to reduce recognition errors
CN107077848B (zh) 用于执行说话人识别的方法、计算机系统和程序产品
US20170236520A1 (en) Generating Models for Text-Dependent Speaker Verification
WO2017162053A1 (zh) 一种身份认证的方法和装置
EP2879130A1 (en) Methods and systems for splitting a digital signal
US10630680B2 (en) System and method for optimizing matched voice biometric passphrases
JP5646675B2 (ja) 情報処理装置及び方法
CN110581927A (zh) 通话内容的处理及提示方法、装置
CN110491375B (zh) 一种目标语种检测的方法和装置
US20050187767A1 (en) Dynamic N-best algorithm to reduce speech recognition errors
JP7266448B2 (ja) 話者認識方法、話者認識装置、及び話者認識プログラム
JP4143541B2 (ja) 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム
US11416593B2 (en) Electronic device, control method for electronic device, and control program for electronic device
JP6996627B2 (ja) 情報処理装置、制御方法、及びプログラム
WO2006027844A1 (ja) 話者照合装置
JP2004295586A (ja) 音声認証装置、音声認証方法及び音声認証プログラム
Laskar et al. Complementing the DTW based speaker verification systems with knowledge of specific regions of interest
JP4604424B2 (ja) 音声認識装置及び方法、並びにプログラム
KR102392992B1 (ko) 음성 인식 기능을 활성화시키는 호출 명령어 설정에 관한 사용자 인터페이싱 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140812

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141105

R150 Certificate of patent or registration of utility model

Ref document number: 5646675

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350