JP7259446B2 - 音声処理装置、エージェントシステム、プログラム、および、音声処理方法 - Google Patents
音声処理装置、エージェントシステム、プログラム、および、音声処理方法 Download PDFInfo
- Publication number
- JP7259446B2 JP7259446B2 JP2019052608A JP2019052608A JP7259446B2 JP 7259446 B2 JP7259446 B2 JP 7259446B2 JP 2019052608 A JP2019052608 A JP 2019052608A JP 2019052608 A JP2019052608 A JP 2019052608A JP 7259446 B2 JP7259446 B2 JP 7259446B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- wireless communication
- communication device
- voice data
- authentication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
各図は、本発明を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、本実施形態では、本発明と直接的に関連しない構成や周知な構成については、説明を省略する場合がある。なお、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
図1に示すように、本実施形態のエージェントシステムは、エージェント装置100と、エージェントサーバ300と、アクセスポイント400とを備える。図1に示すモバイル端末200,200-1~200-3の各々は、エージェントシステムが提供するエージェントサービスを利用する利用者が所持する端末である。アクセスポイント400は、例えば、無線LAN(Local Area Network)のルータとすることができるが、これに限定されない。アクセスポイント400は、モバイル端末200,200-1~200-3が、エージェント装置100と通信可能に接続するための、および通信ネットワークを介してエージェントサーバ300と通信可能に接続するための接続点であるが、本発明に必須の構成ではない。図1に示す通信ネットワークは、例えば、インターネットであるが、これに限定されない。
エージェント装置100は、利用者から入力された音声を処理する音声処理装置である。また、エージェント装置100は、利用者からの音声の指示に対する回答を音声で出力する音声入出力端末である。エージェント装置100は、例えば、スマートスピーカや感情認識ヒューマノイドロボットとすることができるが、これらに限定されない。エージェント装置100は、通信ネットワークを介してエージェントサーバ300と通信可能に接続されている。エージェント装置100は、マイク101と、スピーカ102と、音声データ変換部103と、モバイル端末認証部104(無線通信装置認証部)と、エージェントサービスアクセス部105とを備える。
スピーカ102は、音声を出力する。
モバイル端末200は、無線通信装置の例である。モバイル端末200は、例えば、スマートフォンやタブレット端末とすることができるが、これらに限定されない。モバイル端末200は、音声認証部201と、認証データ管理部202とを備える。モバイル端末200-1~200-3は、本発明の特徴部分に関しては、モバイル端末200と同等の機能を備えるため、モバイル端末200についてのみ説明する。
認証データ管理部202は、モバイル端末200の利用者個人がエージェントサービスを利用するための認証データを記憶して管理する。
エージェントサーバ300は、エージェントサービスを提供するサーバであり、例えば、クラウドサーバとすることができる。エージェントサーバ300は、エージェントサービスとして、音声データによる指示と利用者の認証データとから、利用者に合った適切な回答を返すことができる。
図2を参照して、エージェントシステムで実行される処理について説明する。事前に、利用者は、自身のモバイル端末200の音声認証部201に自身の声を音声データとして登録している。登録する声の内容は特に限定されない。また、利用者は、モバイル端末200を持ち歩き、エージェント装置100の付近に移動する。これにより、モバイル端末200は、エージェントシステム使用時には、エージェント装置100と同一のネットワークが占めるエリア(図1に示す通信ネットワークとは異なる)に入る。以降、この同一のネットワークが占めるエリアは、例えば、エージェント装置100から所定距離内となるエージェント装置100の周辺とすることができる。この同一のネットワークを、「特定通信エリア」と呼ぶ場合がある。モバイル端末200が特定通信エリア内に入ると、音声認証部201は、エージェント装置100から取得予定の音声データを受信可能な状態に切り替わる。
以上で、図2の処理が終了する。
本実施形態によれば、エージェント装置100に音声を入力した利用者を認証して、エージェントサービスを実行するように制御することができる。これにより、従来で問題視していた、不特定多数の利用者本人のアカウントをエージェント装置100に登録する処理そのものを省くことができる。
したがって、エージェントサービスを利用する不特定多数の利用者の各々に、当該利用者に紐づいた回答を返すことができる。
(a):AI等による自己学習機能がエージェントサーバ300に搭載されている場合、他人にエージェント装置100から指示を出されることで、本人とは異なる志向の学習がされてしまいノイズになる。しかし、本発明によれば、エージェント装置100が複数あって、各地に点在していた場合に、どのエージェント装置100からエージェントサーバ300へのアクセスがあったとしても、話しかけた本人のアカウントでエージェントサーバ300にアクセスすることができる。このため、自己学習機能にノイズが載らず、本人の指示のみのデータで学習させることができる。
(b):本実施形態のエージェント装置100は、CPU(Central Processing unit)と、メモリと、ハードディスクなどの記憶手段(記億部)と、ネットワークインタフェースとを有するコンピュータとして構成される。このコンピュータは、CPUが、メモリ上に読み込んだプログラムを実行することにより、各種機能が実現される。
(c):例えば、不特定多数のお客様が訪れるショッピングモールの無人のサービスカウンタなどに、本実施形態のエージェント装置100を配置し、お客様からの音声の問合せを受け付け、相応の回答を音声で出力するというエージェントサービスを実現することができる。
101 マイク
102 スピーカ
103 音声データ変換部
104 モバイル端末認証部(無線通信装置認証部)
105 エージェントサービスアクセス部
200 モバイル端末
201 音声認証部
202 認証データ管理部
300 エージェントサーバ
Claims (5)
- 不特定多数の利用者が使用可能な音声処理装置であって、
入力された前記利用者の指示の音声と音声データを相互に変換する音声データ変換部と、
エージェントサーバにアクセスするための認証データを、前記指示をした利用者の無線通信装置から受信する無線通信装置認証部と、
前記音声データ変換部で変換された音声データ、および、前記無線通信装置認証部が受信した認証データを前記エージェントサーバに送信し、前記音声データの指示内容に対する回答を前記エージェントサーバから取得するエージェントサービスアクセス部と、を備え、
前記無線通信装置認証部は、前記音声データを前記音声処理装置の周辺の無線通信装置に送信して前記利用者の認証をさせ、認証が成功した特定の無線通信装置から認証データを受信する、
ことを特徴とする音声処理装置。 - 前記認証データは、一時的に有効なデータである、
ことを特徴とする請求項1に記載の音声処理装置。 - 不特定多数の利用者が使用可能な音声処理装置とエージェントサーバとを備えるエージェントシステムであって、
前記音声処理装置は、
入力された前記利用者の指示の音声と音声データを相互に変換する音声データ変換部と、
前記エージェントサーバにアクセスするための認証データを、前記指示をした利用者の無線通信装置から受信する無線通信装置認証部と、
前記音声データ変換部で変換された音声データ、および、前記無線通信装置認証部が受信した認証データを前記エージェントサーバに送信し、前記音声データの指示内容に対する回答を前記エージェントサーバから取得するエージェントサービスアクセス部と、を備え、
前記無線通信装置認証部は、前記音声データを前記音声処理装置の周辺の無線通信装置に送信して前記利用者の認証をさせ、認証が成功した特定の無線通信装置から認証データを受信する、
ことを特徴とするエージェントシステム。 - 不特定多数の利用者が使用可能な音声処理装置のコンピュータを、
入力された前記利用者の指示の音声と音声データを相互に変換する音声データ変換部、
エージェントサーバにアクセスするための認証データを、前記指示をした利用者の無線通信装置から受信する無線通信装置認証部、
前記音声データ変換部で変換された音声データ、および、前記無線通信装置認証部が受信した認証データを前記エージェントサーバに送信し、前記音声データの指示内容に対する回答を前記エージェントサーバから取得するエージェントサービスアクセス部、として機能させ、
前記無線通信装置認証部は、前記音声データを前記音声処理装置の周辺の無線通信装置に送信して前記利用者の認証をさせ、認証が成功した特定の無線通信装置から認証データを受信する、プログラム。 - 不特定多数の利用者が使用可能な音声処理装置における音声処理方法であって、
前記音声処理装置は、
入力された前記利用者の指示の音声と音声データを相互に変換する音声データ変換ステップと、
エージェントサーバにアクセスするための認証データを、前記指示をした利用者の無線通信装置から受信する無線通信装置認証ステップと、
前記音声データ変換ステップで変換された音声データ、および、前記無線通信装置認証ステップで受信した認証データを前記エージェントサーバに送信し、前記音声データの指示内容に対する回答を前記エージェントサーバから取得するエージェントサービスアクセスステップと、を実行し、
前記無線通信装置認証ステップにおいて、前記音声データを前記音声処理装置の周辺の無線通信装置に送信して前記利用者の認証をさせ、認証が成功した特定の無線通信装置から認証データを受信する、
ことを特徴とする音声処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019052608A JP7259446B2 (ja) | 2019-03-20 | 2019-03-20 | 音声処理装置、エージェントシステム、プログラム、および、音声処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019052608A JP7259446B2 (ja) | 2019-03-20 | 2019-03-20 | 音声処理装置、エージェントシステム、プログラム、および、音声処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020154140A JP2020154140A (ja) | 2020-09-24 |
JP7259446B2 true JP7259446B2 (ja) | 2023-04-18 |
Family
ID=72558808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019052608A Active JP7259446B2 (ja) | 2019-03-20 | 2019-03-20 | 音声処理装置、エージェントシステム、プログラム、および、音声処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7259446B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024182A (ja) | 2000-07-11 | 2002-01-25 | Mitsubishi Electric Corp | ユーザ認証システム |
JP2005321906A (ja) | 2004-05-07 | 2005-11-17 | Yasuhiko Hanjiyo | 音声による入出力をおこなうシステム |
WO2018067531A1 (en) | 2016-10-03 | 2018-04-12 | Google Llc | Multi-user personalization at a voice interface device |
WO2018213415A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Far-field extension for digital assistant services |
-
2019
- 2019-03-20 JP JP2019052608A patent/JP7259446B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024182A (ja) | 2000-07-11 | 2002-01-25 | Mitsubishi Electric Corp | ユーザ認証システム |
JP2005321906A (ja) | 2004-05-07 | 2005-11-17 | Yasuhiko Hanjiyo | 音声による入出力をおこなうシステム |
WO2018067531A1 (en) | 2016-10-03 | 2018-04-12 | Google Llc | Multi-user personalization at a voice interface device |
WO2018213415A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Far-field extension for digital assistant services |
Also Published As
Publication number | Publication date |
---|---|
JP2020154140A (ja) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650824B1 (en) | Computer systems and methods for securing access to content provided by virtual assistants | |
EP4009206A1 (en) | System and method for authenticating a user by voice to grant access to data | |
US9443523B2 (en) | Multi-sample conversational voice verification | |
AU2006306790B2 (en) | System and method of subscription identity authentication utilizing multiple factors | |
US10665244B1 (en) | Leveraging multiple audio channels for authentication | |
CN110178179B (zh) | 用于向电子设备用户认证的语音签名 | |
US11557301B2 (en) | Hotword-based speaker recognition | |
JP2022513977A (ja) | 指定ポイント承認における身元識別方法、装置及びサーバ | |
US10972458B1 (en) | Methods and systems for authentication assistant | |
JP2023521768A (ja) | 受動的かつ継続的なマルチ話者音声生体認証 | |
US10623403B1 (en) | Leveraging multiple audio channels for authentication | |
JP6182170B2 (ja) | セキュリティシステム | |
US20210344660A1 (en) | Techniques to provide sensitive information over a voice connection | |
WO2014011131A2 (en) | A method enabling verification of the user id by means of an interactive voice response system | |
WO2014140970A2 (en) | Voice print tagging of interactive voice response sessions | |
CN110149618B (zh) | 基于声纹授权的智能设备接入方法、装置、设备及介质 | |
KR101424962B1 (ko) | 음성 기반 인증시스템 및 방법 | |
JP7259446B2 (ja) | 音声処理装置、エージェントシステム、プログラム、および、音声処理方法 | |
JP2004139221A (ja) | 認証システム | |
US11676608B2 (en) | Speaker verification using co-location information | |
EP3502938B1 (en) | A conversational registration method for client devices | |
JP2003330493A (ja) | 本人認証方法および本人認証装置 | |
US12010108B2 (en) | Techniques to provide sensitive information over a voice connection | |
US11941097B2 (en) | Method and device for unlocking a user device by voice | |
JP7182842B1 (ja) | プログラム、情報処理装置、情報処理システム及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7259446 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |