JP7487668B2 - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP7487668B2 JP7487668B2 JP2020572092A JP2020572092A JP7487668B2 JP 7487668 B2 JP7487668 B2 JP 7487668B2 JP 2020572092 A JP2020572092 A JP 2020572092A JP 2020572092 A JP2020572092 A JP 2020572092A JP 7487668 B2 JP7487668 B2 JP 7487668B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- authentication
- control unit
- word
- challenge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 113
- 238000003672 processing method Methods 0.000 title claims description 6
- 230000004044 response Effects 0.000 claims description 126
- 238000000034 method Methods 0.000 claims description 110
- 230000008569 process Effects 0.000 claims description 106
- 201000001432 Coffin-Siris syndrome Diseases 0.000 description 40
- 238000010586 diagram Methods 0.000 description 31
- 238000003058 natural language processing Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 20
- 238000004891 communication Methods 0.000 description 16
- 241001465754 Metazoa Species 0.000 description 11
- IVJYMCMDQOZJPK-UHFFFAOYSA-N FCSS Chemical compound FCSS IVJYMCMDQOZJPK-UHFFFAOYSA-N 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 235000013305 food Nutrition 0.000 description 5
- 102100021066 Fibroblast growth factor receptor substrate 2 Human genes 0.000 description 4
- 101000818410 Homo sapiens Fibroblast growth factor receptor substrate 2 Proteins 0.000 description 4
- 101100478969 Oryza sativa subsp. japonica SUS2 gene Proteins 0.000 description 4
- 101100004663 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BRR2 gene Proteins 0.000 description 4
- 101100504519 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GLE1 gene Proteins 0.000 description 4
- 241000287486 Spheniscidae Species 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 101150012619 FCS1 gene Proteins 0.000 description 3
- 101100150875 Oryza sativa subsp. japonica SUS1 gene Proteins 0.000 description 3
- 241000282376 Panthera tigris Species 0.000 description 3
- 241000270666 Testudines Species 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 101710131373 Calpain small subunit 1 Proteins 0.000 description 2
- 102100029318 Chondroitin sulfate synthase 1 Human genes 0.000 description 2
- 201000000233 Coffin-Siris syndrome 1 Diseases 0.000 description 2
- 201000000222 Coffin-Siris syndrome 4 Diseases 0.000 description 2
- 101150084325 FRS1 gene Proteins 0.000 description 2
- 101100364280 Oryza sativa subsp. japonica RSS3 gene Proteins 0.000 description 2
- 101100478972 Oryza sativa subsp. japonica SUS3 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 208000031708 autosomal dominant 16 intellectual disability Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 101100013482 Arabidopsis thaliana FRS5 gene Proteins 0.000 description 1
- 101100013483 Arabidopsis thaliana FRS6 gene Proteins 0.000 description 1
- 102100021064 Fibroblast growth factor receptor substrate 3 Human genes 0.000 description 1
- 101000818396 Homo sapiens Fibroblast growth factor receptor substrate 3 Proteins 0.000 description 1
- 241000269849 Thunnus Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 235000013550 pizza Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2103—Challenge-response
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Description
1.背景
2.実施形態
2.1.システム構成例
2.2.情報処理端末10の機能構成例
2.3.具体例
2.3.1.対話制御例1
2.3.2.対話制御例2
2.3.3.対話制御例3
2.3.4.対話制御例4
2.3.5.対話制御例5
2.3.6.肯定否定判定例
2.4.動作例
2.4.1.音声認証対話動作例
2.4.2.チャレンジ発話文CSSの生成例
2.4.3.ハッシュ種ワードの決定例
2.4.4.フェイク発話FCSを含む音声認証処理例
3.ハードウェア構成例
4.まとめ
まず、本開示に係る背景について説明する。近年、ユーザUの音声発話に基づいて音声認証処理を実行する装置が開発されている。ここでの音声認証処理とは、ユーザが所定のフレーズを発話したか否かに基づく認証処理をいう。
<<2.1.システム構成例>>
まず、図1を参照して、本実施形態に係るシステム構成例について説明する。図1は、本実施形態に係るシステム構成例について説明するための図である。情報処理システムは、情報処理端末10、情報処理サーバ20、およびネットワーク30を備える。
情報処理端末10は、ユーザとの対話を制御し、当該対話におけるユーザの発話に基づく音声認証処理を実行する情報処理装置である。具体的には、情報処理端末10は、チャレンジ発話CSをユーザに出力し、当該チャレンジ発話CSに対するユーザからのレスポンス発話RSに基づいて音声認証処理を実行する。ここで、チャレンジ発話CSは、情報処理端末10による音声認証処理の際に出力される発話である。情報処理端末10は、チャレンジ発話CSに係るチャレンジ発話文CSSの生成を、情報処理端末10自身で実行してもよいし、または後述する情報処理サーバ20に依頼してもよい。情報処理端末10による音声認証処理の詳細については後述する。
情報処理サーバ20は、情報処理端末10からの依頼に基づいて音声認証処理に係る発話文を生成する。音声認証処理に係る発話文は、例えばチャレンジ発話CSに対応するチャレンジ発話文CSSである。例えば、情報処理サーバ20は、汎用の雑談対話サービスの提供が可能なサーバであってよい。
ネットワーク30は、情報処理端末10と情報処理サーバ20との間での情報の有線、または無線の伝送路である。例えば、ネットワーク30は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク30は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網を含んでもよい。
続いて、本実施形態に係る情報処理端末10の機能構成の一例について説明する。図2は、本実施形態に係る情報処理端末10の機能構成の一例について説明するための図である。情報処理端末10は、音声入力部101、音声認識部102、自然言語処理部103、画像入力部104、画像認識部105、認証対話制御部106、音声合成部107、音声出力部108、記憶部109、および通信部110を備える。
音声入力部101は、ユーザによる発話などの音情報を収集する機能を有する。音声入力部101が収集する音情報は、後述する音声認識部102による認識処理に使用される。音声入力部101は、音情報を収集するためのマイクロフォンを備える。
音声認識部102は、音声入力部101が収集したユーザの発話に基づく自動音声認識処理を行い、認識結果として発話文を生成する機能を有する。
自然言語処理部103は、音声認識部102による自動音声認識処理の結果に対する自然言語理解処理を行い、解析結果として、発話の意図やワードの属性、概念などを音声認識部102が生成した発話文に付与する処理を実行する機能を有する。具体的には、自然言語処理部103は、音声認識部102が認識した発話文に対し、発話意図理解(NLU;Natural Language Understanding)処理による発話の意図や、形態素解析処理による発話文が含むそれぞれのワードの属性および単語意味概念辞書の参照によるそれぞれのワードの意味概念の抽出などを行う。自然言語処理部103による自然言語処理の結果は、後述する認証対話制御部106による音声認証処理に使用される。
画像入力部104は、ユーザや周囲状況の画像を撮像する機能を有する。画像入力部104が撮像した画像は、後述する画像認識部105によるユーザ認識や周囲状況の認識に用いられる。本実施形態に係る画像入力部104は、画像を撮像することが可能な撮像装置を備える。なお、上記の画像には、静止画像のほか動画像が含まれる。
画像認識部105は、画像入力部104が撮像した画像に基づく種々の認識処理を行う機能を有する。本実施形態に係る画像認識部105は、例えば、上記の画像からユーザや周辺状況などを認識することができる。ここで、周囲状況は、例えばユーザUと同じ場にいる他者APなどである。画像認識部105による認識処理の結果は、認証対話制御部106による音声認証処理に使用される。
認証対話制御部106は、ユーザとの対話を制御し、当該対話におけるユーザの発話に基づく音声認証処理を実行する機能を有する。具体的には、認証対話制御部106は、チャレンジ発話文CSSを生成して、チャレンジ発話CSとして音声出力部108に出力させ、出力したチャレンジ発話CSに対するユーザからのレスポンス発話RSに基づいて音声認証処理を実行する。なお、以下、チャレンジ発話CSおよびレスポンス発話RSに基づく音声認証を音声認証対話とも称する。
音声合成部107は、認証対話制御部106による制御に基づいて、音声合成を行う機能を有する。
音声出力部108は、認証対話制御部106による制御に基づいて、音声を含む種々の音を出力する機能を有する。音声出力部108は、例えば、チャレンジ発話CSなどの音声認証に係る発話を出力する。音声出力部108は、例えばスピーカやアンプなどの音声出力装置を備える。
記憶部109は、認証対話制御部106による音声認証処理に係る情報を記憶する機能を有する。音声認証処理に係る情報としては、例えば、音声認証に使用されるユーザ個人データやチャレンジ発話文CSSの生成の際に使用されるハッシュ種ワードデータベースなどが挙げられる。ユーザ個人データは、例えばユーザUの予定表に記入されている場所および対応する日付やユーザUの連絡先リストの苗字および名前などの、他者APが把握する可能性が低い情報である。
通信部110は、認証対話制御部106による制御に基づいて、情報処理サーバ20との通信を実行する機能を有する。具体的には、通信部110は、発話文の生成の依頼する情報を情報処理サーバ20に送信し、生成された発話文を情報処理サーバ20から受信する。
[2.3.1.対話制御例1]
続いて、図3~図11を参照して、本実施形態に係る認証対話制御部106による対話制御の具体例について説明する。上述したように、認証対話制御部106は、画像認識部105が認識した他者の存在に基づいて、音声認証処理のセキュリティ強度を決定する。ここでいうセキュリティ強度とは、認証対話制御部106による音声認証の方法が他者に把握されることの困難さをいう。以下、認証対話制御部106による他者の存在に基づく音声認証処理の例について説明する。
上記ではユーザUと同じ場に他者が存在する場合、他者の数に応じて生成されるチャレンジ発話文CSSの長さが変更される例について説明した。ところで、以前の音声認証時にもユーザUと同じ場にいた他者が存在する場合、当該他者が以前のユーザUと情報処理端末10との対話も含めて音声認証情報を推定する可能性がある。他にも、認証対話制御部106は、上記と同様の場合、音声認証対話の際にチャレンジ発話CS以外にフェイク発話FCSを音声出力部108に出力させてもよい。チャレンジ発話CSとフェイク発話FCSとを混ぜることで、他者が音声認証情報を推測することがより困難となる。ここで、フェイク発話FCSとは、対応するフェイク発話文FCSSがハッシュ種ワードを含まない発話をいう。
ところで、上述したチャレンジ発話CSに対するユーザU1からのレスポンス発話RSに基づく音声認証は、必ずしも成功するとは限らない。例えば、ユーザU1がハッシュ種ワードおよびワード関係ルールから、ハッシュ種ワードを連想できなかった状況や、チャレンジ発話CSにおけるハッシュ種ワードに対応する箇所を聞き逃した状況が発生し得る。
上記まではユーザUと同じ場に他者が存在する場合について説明したが、一方で、ユーザUと同じ場に他者が存在しない場合、他者に音声認証情報を聞かれる可能性が無いため、音声認証のセキュリティ強度を下げてもよい。例えば、認証対話制御部106は、画像認識部105が他者を認識しなかった場合、ハッシュ種ワードのみを、チャレンジ発話CSとして音声出力部108に出力させてもよい。
ところで、上記まではハッシュ種属性およびハッシュ値属性が「食べ物」や「動物」などの所謂「上位概念」である例について説明してきた。しかし、ハッシュ種属性およびハッシュ値属性は、例えば情報処理端末10の記憶部109に記憶するユーザUの個人データに基づいて決定されてもよい。
以上、ユーザUと同じ場にいる他者の有無に応じた音声認証処理の具体例について説明した。ところで、音声認証において、情報処理端末10とユーザUとの間で行われる対話は他者にとって自然なやり取りである方が、当該対話内のいずれのタイミングで音声認証情報のやり取りが行われているかが分かりにくくなる。
続いて、図12~図15を参照して、本実施形態に係る認証対話制御部106による音声認証対話制御の動作の流れの一例について説明する。
まず、図12を参照して、本実施形態に係る認証対話制御部106によるチャレンジ発話CSの出力およびレスポンス発話RSに基づく音声認証に係る処理の動作の流れの一例について説明する。図12は、本実施形態に係る認証対話制御部106によるチャレンジ発話CSの出力およびレスポンス発話RSに基づく音声認証に係る処理の動作の流れの一例について説明するための図である。
次に、図13を参照して、本実施形態に係る認証対話制御部106によるチャレンジ発話文CSSの生成処理の流れの一例について説明する。図13は、本実施形態に係る認証対話制御部106によるチャレンジ発話文CSSの生成処理の流れの一例について説明するための図である。
次に、図14を参照して、本実施形態に係る認証対話制御部106によるハッシュ種ワードの決定処理の流れの一例について説明する。図14は、本実施形態に係る認証対話制御部106によるハッシュ種ワードの決定処理の流れの一例について説明するための図である。
次に、図15Aおよび図15Bを参照して、本実施形態に係る認証対話制御部106によるフェイク発話FCSを含む音声認証に係る処理の動作の流れの一例について説明する。図15Aおよび図15Bは、本実施形態に係る認証対話制御部106によるフェイク発話FCSを含む音声認証に係る処理の動作の流れの一例について説明するための図である。
次に、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20に共通するハードウェア構成例について説明する。図16は、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20のハードウェア構成例を示すブロック図である。図16を参照すると、情報処理端末10および情報処理サーバ20は、例えば、プロセッサ871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
プロセッサ871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、ストレージ880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。
ROM872は、プロセッサ871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、プロセッサ871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。プロセッサ871、ROM872、RAM873により認証対話制御部106、音声認識部102、自然言語処理部103、画像認識部105、音声合成部107の機能は実現される。
プロセッサ871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
入力装置878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置878には、マイクロフォンなどの音声入力装置が含まれる。入力装置878により音声入力部101および画像入力部104の機能は実現される。
出力装置879は、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置879は、触覚刺激を出力することが可能な種々の振動デバイスを含む。出力装置879により音声出力部108の機能は実現される。
ストレージ880は、各種のデータを格納するための装置である。ストレージ880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
リムーバブル記録媒体901は、例えば、DVDメディア、Blu-ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。ストレージ880、ドライブ881、リムーバブル記録媒体901等により記憶部109の機能は実現される。
接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS-232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
通信装置883は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。通信装置883により通信部110の機能は実現される。
以上、説明したように、本実施形態に係る情報処理システムは、ユーザの状況に基づいて決定されたセキュリティ強度で音声認証処理を実行する機能を有する。係る機能によれば、ユーザに余計な負荷をかけずに、かつ、十分なセキュリティ性を確保した音声認証処理を実行することが可能となる。
(1)
ユーザとの対話を制御し、前記対話におけるユーザの発話に基づく音声認証処理を実行する認証対話制御部、
を備え、
前記認証対話制御部は、ハッシュ種ワードを含むチャレンジ発話文を生成して、チャレンジ発話として出力させ、出力された前記チャレンジ発話に対する前記ユーザからのレスポンス発話に基づいて認識されたレスポンス発話文がハッシュ値ワードを含むか否かの判定に基づいて、前記音声認証処理を実行し、
前記ハッシュ値ワードは、前記ハッシュ種ワードとの間で、ワード関係ルールにより規定される所定の関係を有する、
情報処理装置。
(2)
前記ハッシュ種ワードは、予め規定された所定の属性であるハッシュ種属性を有し、
前記ハッシュ値ワードは、予め規定された所定の属性であり、かつ、前記ハッシュ種属性との組み合わせが予め規定された、ハッシュ値属性を有する、
前記(1)に記載の情報処理装置。
(3)
前記ワード関係ルールは、前記ハッシュ値ワードの所定番目の文字もしくは音節が、前記ハッシュ種ワードの所定番目の文字もしくは音節と同一であることである、
前記(1)または(2)に記載の情報処理装置。
(4)
前記認証対話制御部は、他者の存在が認識された場合、認識された前記他者の存在に基づいて前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(1)~(3)のいずれか1項に記載の情報処理装置。
(5)
前記認証対話制御部は、認識された前記他者の数に基づいて前記チャレンジ発話文の長さを決定し、決定した前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(4)に記載の情報処理装置。
(6)
前記認証対話制御部は、前記認識された他者の数が多くなるに従って長くする前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(5)に記載の情報処理装置。
(7)
前記認証対話制御部は、前記認識された他者が以前の前記音声認証処理時に認識されていた場合、前記以前の音声認証処理時に生成された前記チャレンジ発話文が含む前記ハッシュ種ワードとは異なる前記ハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(4)~(6)のいずれか1項に記載の情報処理装置。
(8)
前記認証対話制御部は、前記認識された他者が以前の前記音声認証処理時に認識されていない場合、前記以前の音声認証処理時に生成された前記チャレンジ発話文が含む前記ハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(4)~(6)のいずれか1項に記載の情報処理装置。
(9)
前記認証対話制御部は、前記ハッシュ種ワードを含まないフェイク発話文をさらに生成して、フェイク発話として出力させる、
前記(4)~(8)のいずれか1項に記載の情報処理装置。
(10)
前記認証対話制御部は、前記認識された他者の数に基づいて、前記フェイク発話文の数を決定し、前記決定した数の前記フェイク発話文を生成して、それぞれ前記フェイク発話として出力させる、
前記(9)に記載の情報処理装置。
(11)
前記認証対話制御部は、前記チャレンジ発話および前記フェイク発話をランダムな順番で出力させる、
前記(9)または(10)に記載の情報処理装置。
(12)
前記認証対話制御部は、前記音声認証処理のリトライに基づいて、前記チャレンジ発話文の長さを決定し、前記決定した長さの前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(1)~(11)のいずれか1項に記載の情報処理装置。
(13)
前記認証対話制御部は、前記音声認証処理のリトライに基づいて、前記チャレンジ発話文が含む前記ハッシュ種ワードの数を決定し、前記決定した数の前記ハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(1)~(12)のいずれか1項に記載の情報処理装置。
(14)
前記認証対話制御部は、前記ユーザに係るユーザ情報に基づいて、前記ハッシュ種ワードおよび前記ワード関係ルールを決定し、前記決定したハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
前記(1)~(13)のいずれか1項に記載の情報処理装置。
(15)
前記認証対話制御部は、出力された前記フェイク発話に対する前記ユーザからのフェイクレスポンス発話に基づいて認識されたフェイクレスポンス発話文の前記フェイク発話に対する肯定判定もしくは否定判定を実行し、
前記肯定判定もしくは否定判定は、前記チャレンジ発話文および前記フェイク発話文の生成に利用される、
前記(9)~(11)のいずれか1項に記載の情報処理装置。
(16)
ユーザとの対話を制御し、前記対話における前記ユーザの発話に基づく音声認証処理を実行する認証対話制御部、
を備え、
前記認証対話制御部は、認識された前記ユーザの周囲状況に基づいて、実行される前記音声認証処理のセキュリティ強度を決定する、
情報処理装置。
(17)
前記ユーザの周囲状況は、認識された他者の数を含み、
前記認証対話制御部は、認識された前記他者の数に基づいて、前記実行される音声認証処理の前記セキュリティ強度を決定する、
前記(16)に記載の情報処理装置。
(18)
前記ユーザの周囲状況は、前記ユーザの以前の前記ユーザに対する認証処理時に認識された前記他者が存在するか否かを含み、
前記認証対話制御部は、前記ユーザの以前の前記ユーザに対する認証処理時に認識された前記他者が存在するか否かに基づいて、前記実行される音声認証処理の前記セキュリティ強度を決定する、
前記(17)に記載の情報処理装置。
(19)
ユーザとの対話を制御し、前記対話におけるユーザの発話に基づく音声認証処理を実行すること、
を含み、
ハッシュ種ワードを含むチャレンジ発話文を生成して、チャレンジ発話として出力させ、出力された前記チャレンジ発話に対する前記ユーザからのレスポンス発話に基づいて認識されたレスポンス発話文がハッシュ値ワードを含むか否かの判定に基づいて、前記音声認証処理を実行することをさらに含み、
前記ハッシュ値ワードは、前記ハッシュ種ワードとの間で、ワード関係ルールにより規定される所定の関係を有する、
情報処理方法。
(20)
ユーザとの対話を制御し、前記対話における前記ユーザの発話に基づく音声認証処理を実行すること、
を含み、
認識された前記ユーザの周囲状況に基づいて、実行される前記音声認証処理のセキュリティ強度を決定することをさらに含む、
情報処理方法。
101 音声入力部
102 音声認識部
103 自然言語処理部
104 画像入力部
105 画像認識部
106 認証対話制御部
107 音声合成部
108 音声出力部
109 記憶部
110 通信部
20 情報処理サーバ
30 ネットワーク
Claims (15)
- ユーザとの対話を制御し、前記対話におけるユーザの発話に基づく音声認証処理を実行する認証対話制御部、
を備え、
前記認証対話制御部は、ハッシュ種ワードを含むチャレンジ発話文を生成して、チャレンジ発話として出力させ、出力された前記チャレンジ発話に対する前記ユーザからのレスポンス発話に基づいて認識されたレスポンス発話文がハッシュ値ワードを含むか否かの判定に基づいて、前記音声認証処理を実行し、
前記ハッシュ値ワードは、前記ハッシュ種ワードとの間で、ワード関係ルールにより規定される所定の関係を有し、
前記ワード関係ルールは、前記ハッシュ値ワードの所定番目の文字もしくは音節が、前記ハッシュ種ワードの所定番目の文字もしくは音節と同一であることである、
情報処理装置。 - 前記ハッシュ種ワードは、予め規定された所定の属性であるハッシュ種属性を有し、
前記ハッシュ値ワードは、予め規定された所定の属性であり、かつ、前記ハッシュ種属性との組み合わせが予め規定された、ハッシュ値属性を有する、
請求項1に記載の情報処理装置。 - 前記認証対話制御部は、他者の存在が認識された場合、認識された前記他者の存在に基づいて前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項1に記載の情報処理装置。 - 前記認証対話制御部は、認識された前記他者の数に基づいて前記チャレンジ発話文の長さを決定し、決定した前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項3に記載の情報処理装置。 - 前記認証対話制御部は、前記認識された他者の数が多くなるに従って長くする前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項4に記載の情報処理装置。 - 前記認証対話制御部は、前記認識された他者が以前の前記音声認証処理時に認識されていた場合、前記以前の音声認証処理時に生成された前記チャレンジ発話文が含む前記ハッシュ種ワードとは異なる前記ハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項3に記載の情報処理装置。 - 前記認証対話制御部は、前記認識された他者が以前の前記音声認証処理時に認識されていない場合、前記以前の音声認証処理時に生成された前記チャレンジ発話文が含む前記ハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項3に記載の情報処理装置。 - 前記認証対話制御部は、前記ハッシュ種ワードを含まないフェイク発話文をさらに生成して、フェイク発話として出力させる、
請求項3に記載の情報処理装置。 - 前記認証対話制御部は、前記認識された他者の数に基づいて、前記フェイク発話文の数を決定し、前記決定した数の前記フェイク発話文を生成して、それぞれ前記フェイク発話として出力させる、
請求項8に記載の情報処理装置。 - 前記認証対話制御部は、前記チャレンジ発話および前記フェイク発話をランダムな順番で出力させる、
請求項8に記載の情報処理装置。 - 前記認証対話制御部は、前記音声認証処理のリトライに基づいて、前記チャレンジ発話文の長さを決定し、前記決定した長さの前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項1に記載の情報処理装置。 - 前記認証対話制御部は、前記音声認証処理のリトライに基づいて、前記チャレンジ発話文が含む前記ハッシュ種ワードの数を決定し、前記決定した数の前記ハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項1に記載の情報処理装置。 - 前記認証対話制御部は、前記ユーザに係るユーザ情報に基づいて、前記ハッシュ種ワードおよび前記ワード関係ルールを決定し、前記決定したハッシュ種ワードを含む前記チャレンジ発話文を生成して、前記チャレンジ発話として出力させる、
請求項1に記載の情報処理装置。 - 前記認証対話制御部は、出力された前記フェイク発話に対する前記ユーザからのフェイクレスポンス発話に基づいて認識されたフェイクレスポンス発話文に対し、前記フェイク発話に対する肯定判定もしくは否定判定を実行し、
前記肯定判定もしくは否定判定は、前記チャレンジ発話文および前記フェイク発話文の生成に利用される、
請求項8に記載の情報処理装置。 - ユーザとの対話を制御し、前記対話におけるユーザの発話に基づく音声認証処理を実行すること、
を含み、
ハッシュ種ワードを含むチャレンジ発話文を生成して、チャレンジ発話として出力させ、出力された前記チャレンジ発話に対する前記ユーザからのレスポンス発話に基づいて認識されたレスポンス発話文がハッシュ値ワードを含むか否かの判定に基づいて、前記音声認証処理を実行することをさらに含み、
前記ハッシュ値ワードは、前記ハッシュ種ワードとの間で、ワード関係ルールにより規定される所定の関係を有し、
前記ワード関係ルールは、前記ハッシュ値ワードの所定番目の文字もしくは音節が、前記ハッシュ種ワードの所定番目の文字もしくは音節と同一であることである、
情報処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019025766 | 2019-02-15 | ||
JP2019025766 | 2019-02-15 | ||
PCT/JP2019/046783 WO2020166173A1 (ja) | 2019-02-15 | 2019-11-29 | 情報処理装置及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020166173A1 JPWO2020166173A1 (ja) | 2021-12-23 |
JP7487668B2 true JP7487668B2 (ja) | 2024-05-21 |
Family
ID=72044984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020572092A Active JP7487668B2 (ja) | 2019-02-15 | 2019-11-29 | 情報処理装置及び情報処理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220199096A1 (ja) |
JP (1) | JP7487668B2 (ja) |
DE (1) | DE112019006868T5 (ja) |
WO (1) | WO2020166173A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014695A (ja) | 2000-06-28 | 2002-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 対話型本人認証方法および装置 |
JP2007522551A (ja) | 2004-01-30 | 2007-08-09 | 松下電器産業株式会社 | 複数選択チャレンジ−レスポンスユーザ認証システムおよび方法 |
JP2013037512A (ja) | 2011-08-08 | 2013-02-21 | Ricoh Co Ltd | ソーシャルネットワーキングサービスシステム、ソーシャルネットワーキングサービスサーバ及びソーシャルネットワーキングサービスプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130006626A1 (en) * | 2011-06-29 | 2013-01-03 | International Business Machines Corporation | Voice-based telecommunication login |
US9286899B1 (en) * | 2012-09-21 | 2016-03-15 | Amazon Technologies, Inc. | User authentication for devices using voice input or audio signatures |
JP5646675B2 (ja) | 2013-03-19 | 2014-12-24 | ヤフー株式会社 | 情報処理装置及び方法 |
GB2555661A (en) * | 2016-11-07 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Methods and apparatus for biometric authentication in an electronic device |
US10720165B2 (en) * | 2017-01-23 | 2020-07-21 | Qualcomm Incorporated | Keyword voice authentication |
US10885091B1 (en) * | 2017-12-12 | 2021-01-05 | Amazon Technologies, Inc. | System and method for content playback |
KR102443632B1 (ko) * | 2017-12-18 | 2022-09-15 | 삼성전자주식회사 | 전자 장치, 전자 시스템 및 그 제어 방법 |
-
2019
- 2019-11-29 JP JP2020572092A patent/JP7487668B2/ja active Active
- 2019-11-29 DE DE112019006868.7T patent/DE112019006868T5/de not_active Withdrawn
- 2019-11-29 US US17/429,010 patent/US20220199096A1/en active Pending
- 2019-11-29 WO PCT/JP2019/046783 patent/WO2020166173A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014695A (ja) | 2000-06-28 | 2002-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 対話型本人認証方法および装置 |
JP2007522551A (ja) | 2004-01-30 | 2007-08-09 | 松下電器産業株式会社 | 複数選択チャレンジ−レスポンスユーザ認証システムおよび方法 |
JP2013037512A (ja) | 2011-08-08 | 2013-02-21 | Ricoh Co Ltd | ソーシャルネットワーキングサービスシステム、ソーシャルネットワーキングサービスサーバ及びソーシャルネットワーキングサービスプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2020166173A1 (ja) | 2020-08-20 |
DE112019006868T5 (de) | 2021-11-04 |
JPWO2020166173A1 (ja) | 2021-12-23 |
US20220199096A1 (en) | 2022-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210201911A1 (en) | System and method for dynamic facial features for speaker recognition | |
CA3158979C (en) | Headless task completion within digital personal assistants | |
US10650827B2 (en) | Communication method, and electronic device therefor | |
KR102210775B1 (ko) | 인적 상호 증명으로서 말하는 능력을 이용하는 기법 | |
KR102081495B1 (ko) | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 | |
US11580970B2 (en) | System and method for context-enriched attentive memory network with global and local encoding for dialogue breakdown detection | |
US20180286389A1 (en) | Conference system, conference system control method, and program | |
US20180288109A1 (en) | Conference support system, conference support method, program for conference support apparatus, and program for terminal | |
KR20200095719A (ko) | 전자 장치 및 그 제어 방법 | |
US20180286388A1 (en) | Conference support system, conference support method, program for conference support device, and program for terminal | |
JP2019208138A (ja) | 発話認識装置、及びコンピュータプログラム | |
WO2018079294A1 (ja) | 情報処理装置及び情報処理方法 | |
US20240012893A1 (en) | Headphone biometric authentication | |
JP7487668B2 (ja) | 情報処理装置及び情報処理方法 | |
US11940896B2 (en) | Information processing device, information processing method, and program | |
WO2017029850A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2022043901A (ja) | 対話システム、対話ロボット、プログラム、および情報処理方法 | |
WO2019142420A1 (ja) | 情報処理装置および情報処理方法 | |
US20240119930A1 (en) | Artificial intelligence device and operating method thereof | |
TWI835304B (zh) | 人工智能聲控銀行交易系統 | |
WO2019017033A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6931175B2 (ja) | 情報処理装置、情報処理システム、および、プログラム | |
US10916250B2 (en) | Duplicate speech to text display for the deaf | |
US20230370543A1 (en) | Scam communication engagement | |
JP5067435B2 (ja) | 会話管理システムおよび管理サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7487668 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |