JP2020004192A - 通信装置および通信装置を備える音声認識端末装置 - Google Patents

通信装置および通信装置を備える音声認識端末装置 Download PDF

Info

Publication number
JP2020004192A
JP2020004192A JP2018124398A JP2018124398A JP2020004192A JP 2020004192 A JP2020004192 A JP 2020004192A JP 2018124398 A JP2018124398 A JP 2018124398A JP 2018124398 A JP2018124398 A JP 2018124398A JP 2020004192 A JP2020004192 A JP 2020004192A
Authority
JP
Japan
Prior art keywords
service
communication
confidential
server
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018124398A
Other languages
English (en)
Inventor
浦川 康孝
Yasutaka Urakawa
康孝 浦川
柴田 直樹
Naoki Shibata
直樹 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuetrek Co Ltd
Original Assignee
Fuetrek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuetrek Co Ltd filed Critical Fuetrek Co Ltd
Priority to JP2018124398A priority Critical patent/JP2020004192A/ja
Publication of JP2020004192A publication Critical patent/JP2020004192A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】本発明は、機密性の高いオンラインサービス(機密通信サービス)の利用時において高レベルのセキュリティ強度を維持し、機密通信サービスに係る情報の流出を防止することを目的とする。【解決手段】通信装置100は、ユーザの発話に基づく入力情報に予め定められた機密サービスキーワードが含まれるか否かに基づいて複数のサーバから通信対象となる一つの通信対象サーバを判定するサービス判定部120と、入力情報に機密サービスキーワードが含まれる場合にサービス判定部120により通信対象サーバに判定される機密サービスサーバ5a,5bと直接通信が可能な機密サービス通信部103と、を備える。【選択図】図1

Description

本発明は、通信装置および通信装置を備える音声認識端末装置に関する。
現在、高レベルのセキュリティ強度が要求される、機密性の高いオンラインサービス(例えばインターネットバンキング、株式売買等)において、ユーザの情報端末装置(例えばパーソナルコンピュータ)と該オンラインサービスの提供側(例えば金融機関)のサーバとをセキュア通信で接続し、ログインやワンタイムパスワード等による認証が行われている。例えば、特許文献1には、ユーザの肉声に由来する声紋を個人認証のセキュリティの鍵として用いる技術が開示されている。
特開2002−304379号公報
一方で、近年、音声認識技術を用いてユーザが発した音声を解析し、インターネットに接続してユーザが要求するサービスを提供する音声認識端末装置(例えば、スマートフォン、スマートスピーカ等を含むスマート家電および対話式ロボット等)の普及が進んでいる。このような音声認識端末装置では、一般的に音声認識端末装置(または音声認識機能)の提供事業者のサーバにおいて音声認識処理や、認証処理等を行っている。このため、音声認識端末装置において機密性の高いオンラインサービス(機密通信サービス)を利用する場合、機密通信サービスに係る情報が第三者基盤(音声認識、認証用のサーバ)を経由して機密通信サービスの提供側のサーバに送信されることとなる。この場合、第三者基盤と機密通信サービス提供側のサーバとの通信路におけるセキュリティ強度は、第三者基盤に依存することとなり、ユーザの音声認識端末装置と機密通信サービスの提供側のサーバとの間において高いセキュリティ強度を維持することが困難となる。また、第三者基盤から機密通信サービスに係る情報が流出するといった事態が生じるおそれもある。
本発明は、このような点に鑑みてなされたものであり、機密通信サービスの利用時において高レベルのセキュリティ強度を維持し、機密通信サービスに係る情報の流出を防止することができる通信装置、および該通信装置を備えた音声認識端末装置を提供することを目的とする。
上記目的を達成するために、本発明の一態様に係る通信装置は、ユーザの発話に基づく入力情報に予め定められたキーワードが含まれるか否かに基づいて複数のサーバから通信対象となる一つの通信対象サーバを判定する判定部と、前記入力情報に前記キーワードが含まれる場合に前記判定部により前記通信対象サーバに判定される特定サーバと直接通信が可能な通信部と、を備えることを特徴とする。
また、本発明の一態様に係る音声認識端末装置は、本発明の一態様に係る通信装置を備えることを特徴とする。
本発明によれば、機密性の高いオンラインサービス(機密通信サービス)の利用時において高レベルのセキュリティ強度を維持し、機密通信サービスに係る情報の流出を防止することができる。
本発明の第1実施形態の通信装置を備えた音声認識端末装置を含む音声認識サービスシステムの概略構成図である。 本発明の第1実施形態の通信装置を備えていない音声認識端末装置を含む音声認識サービスシステムの概略構成図である。 本発明の第1実施形態の通信サービス実行処理の流れの一例を示すフローチャートである。 本発明の第2実施形態の通信装置を備えた音声認識端末装置を含む音声認識サービスシステムの概略構成図である。
1.第1実施形態
本発明の第1実施形態について、図1から図3を参照して説明する。まず、第1実施形態による通信装置を備えた音声認識端末装置を含む音声認識サービスシステムの構成について図1を用いて説明する。
(1−1)音声認識サービスシステムの構成
図1は、音声認識サービスシステム9の概略構成を示す図である。音声認識サービスシステム9は、音声認識端末装置1のユーザが発話した音声に基づいてインターネットを介した情報検索等の種々の通信サービスをユーザに提供するシステムである。
音声認識サービスシステム9には、本実施形態による通信装置100を備える音声認識端末装置1と、インターネット等のネットワークを介して音声認識端末装置1と接続される音声認識サーバ3と、音声認識サーバ3と接続される通常サービスサーバ300a,300bとが含まれる。また、音声認識サービスシステム9には、インターネット等のネットワークを介して音声認識端末装置1が備える通信装置100と接続される機密サービスサーバ5a,5bが含まれる。
図1に示すように、音声認識サーバ3は、インターネットを介して音声認識端末装置1から送信された音声データ(例えばユーザの発話に基づく音声データ)について音声認識処理を実行するサーバである。音声認識サーバ3は、音声認識エンジン31と意味解析エンジン32とを有するサーバ音声認識部30を備えている。
サーバ音声認識部30は、音声認識端末装置1から音声データを受信すると、音声認識エンジン31において、自動音声認識(ASR:Automatic Speech Recognition)により、音声データを単語として認識する処理を行う。また、サーバ音声認識部30は、意味解析エンジン32において、音声認識エンジン31での音声認識結果(単語)の組み合わせに対して自然言語認識(NLU:Natural Language Understanding)を行い、音声認識結果の意味を解析する。これにより、サーバ音声認識部30において、音声認識端末装置1のユーザの発話内容の意図を解析した結果を示す音声認識処理結果が生成される。
サーバ音声認識部30は、音声認識処理結果に基づいて音声認識端末装置1のユーザが所望する通信サービスを特定すると、特定した通信サービスに対応するサービスサーバに接続して、音声認識処理結果から生成したサービスサーバへの指示内容の情報を含むコマンド(指示データ)を送信する。例えば、ユーザの発話内容が「天気を教えて」というものであった場合、音声認識サーバ3は、ユーザが天気情報を提供するサービスを所望していると特定し、天気情報を提供する通常サービスサーバ300aに対して音声認識処理結果を送信する。これにより、例えばユーザの所望する地域の天気情報が音声認識端末装置1に提供される。
また、例えば、ユーザの発話内容が「今朝のニュースを教えて」というものであった場合、音声認識サーバ3は、ユーザがニュース情報を提供するサービスを所望していると特定し、ニュース情報を提供する通常サービスサーバ300bに対して音声認識処理結果を送信する。これにより、ユーザの所望するニュース情報が音声認識端末装置1に提供される。
このようにして、音声認識サービスシステム9は、音声認識端末装置1に入力されたユーザの発話音声に応じたサービス(例えば、情報検索サービス)を提供できる。なお、図1に示す通常サービスサーバ300a,300bはあくまで一例であって、音声認識サービスシステム9において通信サービスを提供可能なサービスサーバは、通常サービスサーバ300a,300bに限られない。例えば、音声認識サーバ3は、通常サービスサーバ300a,300bの他にも音楽配信サービスを提供するサービスサーバと接続し、ユーザの所望する音楽を音声認識端末装置1に配信することができる。
また、図1に示す音声認識サービスシステム9における、機密サービスサーバ5a,5bは、インターネット接続された音声認識端末装置1に対して高い機密性が要求される通信サービス(以下、「機密通信サービス」と称する場合がある)を提供するサービスサーバである。機密通信サービスの一例として、インターネットを介して銀行口座等の操作が可能なサービス(インターネットバンキング)や証券(株、債券等)の売買に関する処理が可能なサービス(オンライン証券取引)等がある。
図1に示す本実施形態の音声認識サービスシステム9において、機密サービスサーバ5aは所定の銀行(例えばA銀行)における口座操作サービスを提供するサービスサーバである。機密サービスサーバ5aは、音声認識端末装置1から送信された情報に基づいて口座操作処理部50aにおいて口座操作処理を行い、処理結果を音声認識端末装置1に提供することができる。また、機密サービスサーバ5aには、口座操作処理に用いる個人情報データを記憶するサーバ記憶部51aが設けられている。以降、機密サービスサーバ5aが提供する機密通信サービスを「第一機密通信サービス」と称する場合がある。
また、機密サービスサーバ5bは、所定の証券会社(例えばB証券会社)におけるオンライン証券取引サービスを提供するサービスサーバである。機密サービスサーバ5bは、音声認識端末装置1から送信された情報に基づいて証券取引処理部50bにおいて証券取引処理を行い、処理結果を音声認識端末装置1に提供することができる。また、機密サービスサーバ5bには、証券取引処理に用いる個人情報データを記憶するサーバ記憶部51bが設けられている。以降、機密サービスサーバ5bが提供する機密通信サービスを「第二機密通信サービス」と称する場合がある。
図1に示すように、本実施形態による音声認識端末装置1の通信装置100と、機密サービスサーバ5a,5bのそれぞれとは、音声認識サーバ3のような第三者基盤を介さずに接続される。したがって、音声認識端末装置1のユーザは、機密通信サービスの利用時において、第三者基盤を介さずに、機密サービスに係る情報を機密サービスサーバ5a,5bに送信することができる。通信装置100と機密サービスサーバ5a,5bとの通信に関しては後述する。
なお、以下の説明では、例えば情報検索サービスや音楽配信サービス等、機密通信サービス程の高い機密性を要求しないサービスを「通常通信サービス」と称する場合がある。
(1−2)音声認識端末装置の構成
音声認識端末装置1は、例えばスマートフォン、スマートスピーカ、対話式ロボットやスマート家電等の音声認識機能とネットワーク通信機能とを有する装置(例えば、情報端末装置)である。音声認識端末装置1は、収音装置(マイクロフォン等)から入力された音声に基づいて、ユーザが所望する種々のサービスを提供する。
音声認識端末装置1が提供するサービスには、例えば、上述の情報検索サービス等の通常通信サービスやインターネットバンキング等の機密通信サービスのようなインターネットへの接続によるサービス(通信サービス)がある。また、音声認識端末装置1は、例えば家庭内や企業内のLANを利用した家電等のコントロールサービスや、ネットワーク通信機能を利用しないサービス(例えば、アラーム、対話、メモ機能等の非通信サービス)を利用可能な装置であってもよい。
ここで、図1を用いて本実施形態による音声認識端末装置1の各構成を説明する。
図1に示すように、音声認識端末装置1は、音声入力部11と、起動判定部12と、通常サービス通信部13と、通信装置100とを備えている。なお、理解を容易にするため、図1には音声認識端末装置1において本実施形態の説明に必須の構成のみを図示し、その他の構成は図示を省略する。
図1に示す音声入力部11は、音声認識端末装置1の周囲の音声を収音して入力可能な構成であって、一または複数の収音装置(不図示)により形成されている。収音装置は、例えば全指向性(無指向性)マイクロフォンである。ここで、音声入力部11に入力される音声(入力音声)は、例えば音声認識端末装置1のユーザの発話による音声が想定される。音声入力部11は、入力音声を起動判定部12に出力する。起動判定部12に出力される入力音声のデータは、収音装置からアナログ信号として入力された入力音声データ(アナログ音声データ)をアナログ−デジタル(A−D)変換して生成されたデジタル信号(デジタル音声データ)である。
図1に示す起動判定部12は、音声入力部11からユーザの一連の発話に基づく入力音声のデータが入力されると起動判定処理を実行する。起動判定処理は、入力音声のデータに基づいて起動判定部12の後段の構成を起動するか否かを判定する処理である。
具体的には、起動判定処理において起動判定部12は、入力音声に予め定められた起動キーワード(ウェイクワード)が含まれるか否かを判定し、入力音声に起動キーワードが含まれる場合に後段の構成を起動すると判定する。起動判定部12は、入力音声から起動キーワード(例えば「HELLO △△(音声認識端末装置1の販売名称)」等)を検出すると、ユーザに音声認識端末装置1におけるサービス利用の意思があると判定して、起動判定部12の後段の構成(本例では、通信装置100)への入力音声のデータの出力を開始する。これにより、音声認識端末装置1において、ユーザへのサービス提供(本例では、通信サービスの提供)に係る処理が開始される。
図1に示す通信装置100は、起動判定部12から入力された入力音声(ユーザの発話音声を想定)に基づいて、ユーザが所望する通信サービスの種別(通常通信サービスか、または機密通信サービスか)を判定し、判定したサービス種別に応じて、複数のサーバ(本例では、音声認識サーバ3、機密サービスサーバ5a,5b)から通信対象となる一つの通信対象サーバを判定する。これにより、音声認識端末装置1は、通信サービスの種別に応じたサーバとの通信によりユーザに通信サービスを提供することができる。また、通信装置100は、通信対象サーバが機密サービスサーバ5a,5bのいずれかである場合に、機密サービスサーバ5a,5bと直接通信(エンドツーエンド(E2E)での通信)を行う。通信装置100の詳細は後述する。
図1に示す通常サービス通信部13は、通信装置100においてユーザが通常通信サービスの利用を所望していると判定された場合に、通信装置100からの指示(例えば、信号送信)に基づいて音声認識サーバ3に入力音声のデータを送信する。これにより、音声認識サーバ3においてユーザの発話による音声について音声認識処理が実行され、音声認識処理結果が通常サービスサーバ300a,300b等のサービスサーバに送信されて、通常通信サービス(情報検索サービス等)が音声認識端末装置1に提供される。
(1−3)通信装置の構成
次に、図1を用いて音声認識端末装置1が備える通信装置100の各構成について説明する。
図1に示すように、本実施形態による通信装置100は、入力音声(ユーザの発話音声)に基づいて、音声認識サービスシステム9において音声認識端末装置1と通信可能な複数のサーバから一つの通信対象サーバを判定する通信判定部101と、通信装置100における種々の処理に用いられる情報を記憶する記憶部102と、音声認識端末装置1が通信可能な機密サービスサーバ(機密サービスサーバ5a,5b)と直接通信が可能な機密サービス通信部103(第一機密サービス通信部103a、第二機密サービス通信部103b)と、を備える。
図1に示すように、本実施形態による通信装置100は、音声認識端末装置1に内蔵された装置であって、音声認識端末装置1内において通信サービスに係る処理を行う複数の機能ブロックにより構成されている。
以下、図1を参照して、本実施形態による通信装置100の各構成要素について説明する。
(通信判定部)
通信判定部101は、ユーザの発話に基づく入力音声について音声認識処理を実行し、音声認識処理結果に基づいて当該入力音声に予め定められたキーワードが含まれるか否かを判定し、当該判定の結果に基づいて複数のサーバから通信対象となる一つの通信対象サーバを判定する(通信判定処理)。
図1に示すように、通信判定部101は、起動判定部12から入力された入力音声のデータの音声認識処理を行うローカル音声認識部110と、ローカル音声認識部110における音声認識処理の結果に基づいてユーザが所望する通信サービスの種別を判定し、通信サービスの種別に基づいて通信対象サーバを判定するサービス判定部120とを有している。
(ローカル音声認識部)
図1に示すように、ローカル音声認識部110は、音声認識エンジン113と、意味解析エンジン115とを有している。音声認識エンジン113は、上述のサーバ音声認識部30における音声認識エンジン31と同様に自動音声認識(ASR)を実行し、認識結果として単語の組合せを生成して意味解析エンジン115に出力する。また、意味解析エンジン115は、音声認識エンジン113から入力された認識結果(単語の組合せ)について、サーバ音声認識部30における意味解析エンジン32と同様に自然言語認識(NLU)を実行する。ローカル音声認識部110は、音声認識エンジン113および意味解析エンジン115における処理(音声認識処理)を順次実行すると、音声認識処理結果のデータ(音声認識結果データ)をサービス判定部120に出力する。
(サービス判定部)
サービス判定部120は、ユーザの発話に基づく入力音声に予め定められたキーワードが含まれるか否かに基づいて、当該入力音声に対応する通信サービスの種別を判定し(サービス種別判定処理)、判定した通信サービスの種別に基づいて通信対象サーバを判定する(サーバ判定処理)。
サービス種別判定処理において、サービス判定部120は、ローカル音声認識部110から入力された入力音声に基づくデータ(音声認識結果データ)に、機密サービスキーワードが含まれるか否かを判定する。
ここで、機密サービスキーワードは、ユーザが機密通信サービスを利用する意思を有することを示す文字列である。上述のように、本例における機密通信サービスとしては銀行口座の操作やオンラインでの証券取引等が想定されている。したがって、本例における機密サービスキーワードは、例えば銀行名(本例ではA銀行)、「口座」、「残高照会」、「振込」「入金」等の銀行口座の操作を連想させる内容の文字列や、証券会社名(本例ではB証券会社)、「株」、「証券」、「債権」、「株価」等の証券取引を連想させる内容の文字列が想定される。機密サービスキーワードは、記憶部102に記憶された機密サービスキーワードリスト132内に予め登録されている。なお、ここで列挙した機密サービスキーワードはあくまで一例であって、機密サービスキーワードリスト132に登録される機密サービスキーワードはこれらに限られない。
サービス判定処理においてサービス判定部120は、入力音声に基づく音声認識結果データに機密サービスキーワードが含まれると判定すると、入力音声に対応する通信サービスの種別、すなわちユーザが所望する通信サービスの種別が機密通信サービスであると判定する。一方、サービス判定部120は、音声認識結果データに機密サービスキーワードが含まれない場合に、入力音声に対応する通信サービスの種別が通常通信サービスであると判定する。
また、図1に示すように、本実施形態の音声認識サービスシステム9において、音声認識端末装置1の通信装置100が通信可能な機密サービスサーバは複数(機密サービスサーバ5a,5bの2つ)ある。したがって、音声認識端末装置1において機密サービスサーバ5a,5bのそれぞれに対応する複数の種別の機密通信サービスが利用可能である。また、本実施形態では、機密通信サービスの種別ごとに異なる種類の機密サービスキーワードが対応付けられている。
ここで、上述の機密サービスキーワードのうち、銀行口座の操作を連想させる内容の文字列が機密サービスサーバ5aの提供するA銀行における口座操作サービス(第一機密通信サービス)に対応づけられた機密サービスキーワード(第一機密サービスキーワード)である。また、上述の機密サービスキーワードのうち、証券取引を連想させる内容の文字列が機密サービスサーバ5bの提供するB証券会社におけるオンライン証券取引サービス(第二機密通信サービス)に対応づけられた機密サービスキーワード(第二機密サービスキーワード)である。
このため、サービス判定処理においてサービス判定部120は、入力音声に基づく音声認識結果データに含まれる機密サービスキーワードの種類(第一機密サービスキーワードか、第二機密サービスキーワードか)に基づいて、複数の機密通信サービス(第一機密通信サービス、第二機密通信サービス)の種別の中からユーザが所望する一つの機密通信サービスの種別を判定する。
また、サービス判定部120は、サービス判定処理を実行すると、次にサーバ判定処理を実行する。サーバ判定処理においてサービス判定部120は、サービス判定処理の結果(ユーザが所望する通信サービスの種別)に基づいて、音声認識端末装置1と通信可能な複数のサーバ(本例では、図1に示す音声認識サーバ3、機密サービスサーバ5a,5bの3つ)の中から通信対象となる一つの通信対象サーバを判定する。
サーバ判定処理においてサービス判定部120は、ユーザが所望する通信サービスの種別(サービス判定処理結果)が通常通信サービスである場合には、音声認識サーバ3を通信対象サーバに判定する。
また、サーバ判定処理においてサービス判定部120は、ユーザが所望する通信サービスの種別が機密通信サービスである場合には、機密通信サービスの種別(第一機密通信サービスまたは第二機密通信サービス)に基づいて、機密サービスサーバ5a,5bのいずれかを通信対象サーバに判定する。具体的には、サービス判定部120は、ユーザが所望する機密通信サービスの種別が第一機密通信サービスである場合には、機密サービスサーバ5aを通信対象サーバに判定し、ユーザが所望する機密通信サービスの種別が第二機密通信サービスである場合には、機密サービスサーバ5bを通信対象サーバに判定する。
サービス判定部120は、通信サーバ判定処理を実行すると、通信対象サーバに対応する通信部に通信対象サーバとの通信開始を指示する(例えば信号送信)。サービス判定部120は、音声認識サーバ3を通信対象サーバに判定した場合には音声認識端末装置1の通常サービス通信部13に通信開始の指示を行い、機密サービスサーバ5a,5bのいずれかを通信対象サーバに判定した場合には、通信装置100の機密サービス通信部103(第一機密サービス通信部103a、第二機密サービス通信部103b)に通信開始の指示を行う。これにより、音声認識端末装置1または通信装置100と、ユーザが所望する通信サービスに対応する通信対象サーバとの間で通信が開始されて、ユーザは音声認識端末装置1を介して種々の通信サービスを利用することができる。また、サービス判定部120は、機密サービス通信部103に通信開始を指示する際に、音声認識結果データに基づいて指示データを生成し、通信開始の指示信号と合わせて、機密サービス通信部103に出力する。ここで、サービス判定部120が生成する指示データは、例えば機密サービスサーバ5a,5bへの指示内容の情報を含む指示コマンドである。
(記憶部)
図1に示すように、記憶部102は、通信装置100における種々の処理に用いられる情報を記憶する記憶領域である。記憶部102には、機密サービスキーワードリスト132、個人情報リスト152が記憶されている。
機密サービスキーワードリスト132には、サービス判定部120におけるサービス判定処理に用いる機密サービスキーワードがテーブル形式で蓄積されている。機密サービスキーワードリスト132に蓄積されている各キーワードは、機密通信サービスの種別と紐付けられている。例えば、機密サービスキーワードリスト132において、銀行口座の操作を連想させる内容の第一機密サービスキーワードは、第一機密通信サービスと紐付けられている。また、証券取引を連想させる内容の第二機密サービスキーワードは、第二機密通信サービスと紐付けられている。
個人情報リスト152には、機密通信サービスの利用権限を判定する利用権限判定処理に用いられる利用権限データや、第一機密通信サービスにおける銀行口座の操作や、第二機密通信サービスにおけるオンライン証券取引等の実行時において機密サービスサーバ5a,5bにおける認証に用いるID、パスワード(サービス認証データ)といった個人情報が蓄積されている。利用権限判定処理については、後述する。
また、個人情報リスト152には、利用権限データや、サービス認証データ等の他にも、通信装置100の機密サービス通信部103と機密サービスサーバ5a,5bとの間における通信時の認証に用いる通信認証データ(鍵データ)が蓄積されている。鍵データには、機密サービスサーバ5aとの通信の認証に用いる鍵データ(第一鍵データ)と、機密サービスサーバ5bとの通信の認証に用いる鍵データ(第二鍵データ)とがある。個人情報リスト152には、例えばこれらの情報がテーブル形式で蓄積されている。
(機密サービス通信部)
図1に示すように、機密サービス通信部103は、機密サービスサーバ5aと通信を行う第一機密サービス通信部103aと、機密サービスサーバ5bと通信を行う第二機密サービス通信部103bとで構成されている。
第一機密サービス通信部103aは、サービス判定部120のサーバ判定処理において機密サービスサーバ5aが通信対象サーバに判定された場合に、サービス判定部120からの指示に基づいて機密サービスサーバ5aに、入力音声に基づく音声認識結果データから生成された指示データ(機密サービスサーバ5aへの指示内容の情報を含む指示コマンド)を送信する。また、第二機密サービス通信部103bは、サービス判定部120のサーバ判定処理において機密サービスサーバ5bが通信対象サーバに判定された場合に、サービス判定部120からの指示に基づいて機密サービスサーバ5bに、入力音声に基づく指示データ(機密サービスサーバ5bへの指示内容の情報を含む指示コマンド)を送信する。
また、図1に示すように、第一機密サービス通信部103aは、機密サービスサーバ5aと直接通信(E2E)が可能である。また、第二機密サービス通信部103bは、機密サービスサーバ5bと直接通信(E2E)が可能である。
また、本実施形態による通信装置100において、機密サービス通信部103の第一機密サービス通信部103aおよび第二機密サービス通信部103bは、対応する機密サービスサーバ5a,5bとの間で暗号化を伴うプロトコル(例えばSSL:Secure Sockets Layer)を用いた通信を行う。これにより、通信装置100は、機密通信サービスの利用時において、高レベルのセキュリティ強度を維持することができる
このように、音声認識端末装置1における第一、第二機密通信サービスの利用時には、通信装置100の機密サービス通信部103(第一機密サービス通信部103a、第二機密サービス通信部103b)は、音声認識サーバ3を介さずに機密サービスサーバ5a,5bと直接通信を行う。このため、本実施形態において、機密サービスに係る情報は、第三者基盤を経由することなく、通信装置100から機密サービスサーバ5a,5bに送信される。これにより、本実施形態による通信装置100は、機密通信サービスの利用時において機密通信サービスに係る情報の流出を防止することができる。
また、上述のように、本実施形態による通信装置100は、ローカル音声認識部110を有しており、自装置内(ローカル環境)においてユーザの発話に基づく入力音声の音声認識処理(意味解析処理を含む)を実行することができる。これにより、本実施形態では機密通信サービスの利用の際に、音声認識サーバ3のサーバ音声認識部30において音声認識処理を実行する必要がなく、機密通信サービスに係る情報の流出を防止することができる。
このため、通信装置100は、ユーザが機密通信サービスの利用を所望する場合には、ローカル音声認識部110において音声認識処理を実行し、音声認識処理結果である音声認識結果データに基づいてサービス判定部120が生成した指示データを機密サービスサーバ5a,5bに送信することができる。また、一方で、通信装置100は、ユーザが通常通信サービスの利用を所望する場合には通常サービス通信部13に音声認識サーバ3との通信を指示し、通常サービス通信部13は、入力音声のデータを音声認識サーバ3に送信してサーバ音声認識部30において音声認識処理が実行される。このように、通信装置100は、ユーザが所望する通信サービスの種別に基づいて適切な通信対象のサーバを判定することにより、機密通信サービスに係るデータの流出を防止するとともに、通信装置100のローカル音声認識部110における音声認識処理の負荷を軽減することができる。
また、本実施形態による通信装置100を備えることで、音声認識端末装置1も通信装置100と同様の作用・効果を奏する。
(1−4)通常メモリ領域と安全メモリ領域
図1に示すように、本実施形態による音声認識端末装置1が備える通信装置100内には、高度なセキュリティによって外部から保護されたメモリ領域である安全メモリ領域saが設けられている。安全メモリ領域saは、例えばARM社のTrustZone(登録商標)の技術を用いてセキュアな状態(外部からの攻撃や盗聴、改ざん等の干渉を受けない状態)に管理された安全性に優れたメモリ領域である。本実施形態において、利用権限データやサービス認証データおよび鍵データを蓄積している個人情報リスト152が記憶されている記憶部102は、安全メモリ領域saに配置されている。ここで、音声認識端末装置1および通信装置100において、安全メモリ領域sa以外の領域を通常メモリ領域msとする。このように、通信装置100は、通常メモリ領域msと、通常メモリ領域msよりも安全性に優れた安全メモリ領域saとを備えている。また、通信装置100を備えることで、音声認識端末装置1も同様に通常メモリ領域msと安全メモリ領域saとを備える。
記憶部102を安全メモリ領域saに配置することにより、通信装置100は、例えば悪意のあるアプリケーションの作動によって記憶部102に記憶された個人情報リスト152内の個人情報が盗まれる、または改ざんされるといった事態が生じることを防止することができる。このように、本実施形態による通信装置100は、安全メモリ領域saを有することで、機密通信サービスに係る情報の流出をより確実に防止することができる。
(1−5)比較例:通信装置を備えていない構成の音声認識端末装置
次に、図2を用いて、本実施形態による通信装置100を備えていない構成の音声認識端末装置8において通信サービスを利用する例について説明する。図2において、図1に示す音声認識サービスシステム9と同一の作用効果を奏する構成は、図1と同じ符号を付して説明は省略する。
図2に示すように、音声認識端末装置8は、音声入力部11と、起動判定部12xと、通常サービス通信部13xとを備えている。また、音声認識端末装置8は通信装置100を備えていない。
音声認識端末装置8において、音声入力部11から入力されたユーザの発話に基づく入力音声は、起動判定部12xにおいて起動キーワードが含まれると判定されると、通常サービス通信部13xに出力され、通常サービス通信部13xにより音声認識サーバ3に送信される。
音声認識端末装置8は、通信装置100を備えていないため、ローカル音声認識部110を有さず、音声認識サーバ3のサーバ音声認識部30において音声認識処理を実行する。このため、音声認識端末装置8は、通信サービスの利用時には、通信サービスの種別(通常通信サービスまたは機密通信サービス)に関わらず、常に入力音声のデータを音声認識サーバ3に送信する。したがって、音声認識端末装置8は、常に第三者基盤を介して機密サービスサーバ5a,5bと通信を行うこととなる。
このため、音声認識端末装置8における機密サービスの利用時において機密サービスに係る情報の流出のおそれが生じる。また、第三者基盤である音声認識サーバ3と機密サービスサーバ5a,5bとの間における通信路のセキュリティ強度の維持は、音声認識サーバ3を運営する事業者の運営方針に依存することとなる。したがって、音声認識サーバ3と機密サービスサーバ5a,5bとの間にSSLのようなセキュリティ強度の高い通信路が確立されるか否かの保証が困難となる。
また、音声認識端末装置8には、通信装置100を備える音声認識端末装置1のように安全メモリ領域saが設けられていない。このため、音声認識端末装置8は、機密通信サービスに係る情報(例えば、サービス認証データ等)が悪意のあるアプリケーションの作動によって盗まれるといった事態が生じるおそれがある。したがって、音声認識端末装置8は、機密通信サービスに係る情報を安全に保持しかつ流出を防止することが困難である。
以上のように、本実施形態による通信装置100を備えていない音声認識端末装置8では、通信装置100を備える音声認識端末装置1が奏する効果、すなわち高レベルのセキュリティ強度を維持し、機密通信サービスに係る情報の流出を防止する効果を得ることはできない。
(1−6)音声認識端末装置における通信サービス実行処理の流れ
次に、図1を参照しつつ図3を用いて、音声認識端末装置1における通信サービス実行処理の流れの一例を説明する。図3は、通信サービス実行処理の流れの一例を説明するフローチャートである。
(ステップS1)
ステップS1において起動判定部12は、起動キーワードの発話待ち状態、すなわち音声入力部11からのユーザの発話に基づく入力音声の入力を待機している状態となっている。
(ステップS3)
音声入力部11から入力音声が入力されると、ステップS3において起動判定部12は、起動判定処理を実行して起動キーワードが発話されたか否かを判定する。起動判定部12は、入力音声に起動キーワードが含まれると判定すると、通信装置100に起動判定処理の結果に関するデータを出力する。起動判定部12から通信装置100に出力されるデータは、起動キーワードの判定結果を示すデータ(判定結果データ)であってもよいし、入力音声のデータであってもよいし、入力音声のデータと判定結果データとの両方を含んでいてもよい。これにより、通信装置100において、ステップS5以降の通信サービスの提供に係る処理が開始される。また、通信サービスの提供に係る処理が開始されると、起動判定部12を介して、通信装置100に入力音声のデータが出力される。なお、起動判定部12は、通信サービスの実行処理中において、起動判定処理の実行を停止してもよい。例えば、起動判定部12は、通信サービスの提供に係る処理の開始時において、通信サービスの実行処理中であることを示す情報を音声認識端末装置1の所定の記憶領域に記憶してもよい(例えば通信サービス実行フラグをオン状態にセットする)。これにより、起動判定部12は、通信サービスの実行処理中か否かを判断可能であり、通信サービスの実行処理中において起動判定処理の実行を停止することができる。この場合、通信サービスの実行処理中は、入力音声は音声入力部11から起動判定処理を経ずに起動判定部12を経由して通信装置100に出力される。また、起動判定部12は、通信サービスの実行処理中において、起動判定処理の実行を継続してもよい。
一方、起動判定部12は、入力音声に起動キーワードが含まれていないと判定すると、ステップS1の起動キーワードの発話待ちの状態に戻る。
(ステップS5)
ステップS5において、通信装置100における通信判定部101のローカル音声認識部110は、起動判定部12から起動判定処理の結果に関するデータが入力されたことに基づいて、音声認識処理を待機する音声認識待ち状態となっている。ローカル音声認識部110は、音声認識待ち状態において、起動判定部12から入力音声のデータが入力されると、音声認識処理を実行する。ローカル音声認識部110は、音声認識処理を実行すると音声認識処理結果のデータ(音声認識結果データ)をサービス判定部120に出力する。
(ステップS7)
ステップS7においてサービス判定部120は、サービス判定処理を実行し、ユーザが機密サービスキーワードを発話したか、すなわち入力音声に基づく音声認識結果データに機密サービスキーワードが含まれるかを判定する。サービス判定部120は、入力音声に機密サービスキーワードが含まれると判定すると、サーバ判定処理において機密サービスキーワードの種別(第一機密サービスキーワード、または第二機密サービスキーワード)に基づいて機密サービスサーバ5a,5bのいずれかを通信対象サーバに判定する。さらに、サービス判定部120は、通信対象サーバに判定された機密サービスサーバとの通信の開始を指示する信号(通信開始信号)を機密サービス通信部103(第一機密サービス通信部103aまたは第二機密サービス通信部103b)に送信する。これにより、機密サービス通信部103はステップS9の処理に移る。なお、サービス判定部120は、機密サービス通信部103に通信開始信号を送信すると、通信装置100内の通常メモリ領域msにおける所定の記憶領域に通信サービスの実行状態(ステート)を示すステート情報を登録する。例えば機密通信サービスの実行開始時においてサービス判定部120は、実行中の通信サービスが機密通信サービスであることを示すステート情報を登録する。これにより、サービス判定部120は、機密通信サービスが実行中か否かを判断することができる。
一方、ステップS7においてサービス判定部120は、サービス判定処理において入力音声に機密サービスキーワードが含まれていないと判定すると、サーバ判定処理において音声認識サーバ3を通信対象サーバに判定し、通常サービス通信部13に音声認識サーバ3との通信の開始を指示する通信開始信号を出力する。これにより、通常サービス通信部13はステップS13の処理を実行する。なお、サービス判定部120は、通常サービス通信部13に通信開始信号を送信すると、ステート情報として実行中の通信サービスが通常通信サービスであることを示すステート情報を登録する。これにより、サービス判定部120は、通常通信サービスが実行中か否かを判断することができる。
また、本実施形態による通信装置100において、サービス判定部120は、機密サービス通信部103への通信開始の指示の前処理として、入力音声を発話したユーザが機密通信サービスの利用権限を有しているか否かを判定する利用権限判定処理を行う。
具体的には、利用権限判定処理においてサービス判定部120は、音声認識端末装置1が備えるスピーカ等の音声出力部(不図示)を介してユーザに利用権限の判定に用いる情報の発話を求める権限確認メッセージを出力する。例えば、サービス判定部120は、権限確認メッセージとして予め記憶部102に記憶されている質問事項(例えば「母親の旧姓は?」等)を出力する。
サービス判定部120は、権限確認メッセージの出力後に音声入力部11、起動判定部12を介してローカル音声認識部110に入力された入力音声のデータ(権限確認メッセージへの回答音声のデータ)に、予め記憶部102の個人情報リスト152に記憶されている質問の正答(利用権限データ)が含まれていると判定すると、ユーザが機密通信サービスの利用権限を有していると判定する。一方、サービス判定部120は、権限確認メッセージへの回答音声のデータに利用権限データが含まれていないと判定すると、例えば「権限が確認できませんでした。」等の権限エラーメッセージを音声出力部から出力して、機密通信サービスに係る処理を中断する。
なお、本発明において、サービス判定部120による利用権限判定処理の方法はこれに限られない。例えば、サービス判定部120は、音声認証により、機密通信サービスの利用権限を判定してもよい。具体的には、機密サービスキーワードを含む入力音声と予め登録されているサービスの利用権限を有するユーザの音声(利用権限者音声)とを照合し、入力音声と利用権限者音声とが同一人物の音声であるとの照合結果が導出された場合に、入力音声を発話したユーザに機密通信サービスの利用権限があると判定してもよい。
(ステップS9)
ステップS9において機密サービス通信部103(第一機密サービス通信部103aまたは第二機密サービス通信部103b)は、機密サービスサーバ(5a,5bのいずれか)と暗号化を伴うプロトコルを用いた通信(暗号化通信)を行う。
暗号化通信を開始するにあたり、サービス判定部120は、記憶部102の個人情報リスト152から暗号化通信の認証に用いる鍵データ(秘密鍵)を取得して、例えば通信開始の指示信号とともに機密サービス通信部103に出力する(鍵データ取得処理)。具体的には、サービス判定部120は、ユーザが機密通信サービスの利用権限を有しているとの利用権限判定処理の結果が導出された場合に、個人情報リスト152から通信対象サーバに判定された機密サービスサーバ(5a,5bのいずれか)に応じた鍵データ(第一鍵データ、または第二鍵データ)を取得し、機密サービス通信部103に出力する。通信対象サーバが機密サービスサーバ5aである場合、第一機密サービス通信部103aは第一鍵データを用いて暗号化通信の認証を行い、機密サービスサーバ5aとの間で暗号化通信を行う。また、通信対象サーバが機密サービスサーバ5bである場合、第二機密サービス通信部103bは第二鍵データを用いて暗号化通信の認証を行い、機密サービスサーバ5bとの間で暗号化通信を行う。
このようにして、本実施形態による通信装置100は、機密サービスサーバ5a,5bが提供する機密通信サービスを高いセキュリティ強度が保証される通信路経由で利用することを可能にすることができる。
また、機密サービス通信部103が有する各通信部と機密サービスサーバ5a,5bとの暗号化通信が開始されると、機密サービスサーバ5a,5bは、各機密通信サービス(第一機密通信サービス、第二機密通信サービス)の利用開始時における認証処理を行う。このため、機密サービス通信部103は、機密サービスサーバ5a,5bとの通信開始時において、記憶部102の個人情報リスト152に格納されているサービス認証データ(ID,パスワード)を通信対象である機密サービスサーバ(5a,5bのいずれか)に送信する。
具体的には、サービス判定部120が上述の鍵データ取得処理時において、鍵データと合わせて機密通信サービスの種別に応じたサービス認証データを取得して、機密サービス通信部103に出力する。なお、サービス判定部120は、鍵データ取得処理後に、別途サービス認証データを取得するサービス認証データ取得処理を実行してもよい。この場合、サービス判定部120は、例えば、音声出力部(不図示)を介して利用権限判定処理時とは異なる質問をユーザに出力し、ユーザの回答(入力音声)に個人情報リスト152に登録された正答が含まれている場合にサービス認証データを取得してもよい。
このように、本実施形態による通信装置100は、記憶部102に格納されている個人情報リスト152にサービス認証データを登録し、ユーザが発話した質問への回答が正答である場合に、サービス認証データを機密サービスサーバ5a,5bに送信することができる。このため、ユーザはサービス認証データの送信時においてサービス認証データ自体を発話する必要がなく、第三者にサービス認証データを聞かれてしまうことを防止することができる。また、ユーザは長い桁数の文字列で構成されたサービス認証データ(ID、パスワード等)を覚えておく必要がないので、スムーズに機密通信サービスを利用することができる。また、サービス認証データは、安全メモリ領域saに配置された記憶部102の個人情報リストにおいて、例えば暗号化された上で格納されている。このため、通信装置100は、サービス認証データが外部に流出するおそれを大幅に低減することができる。なお、本実施形態による通信装置100において、鍵データ取得処理やサービス認証データの取得処理は、各機密サービスサーバと通信を開始する際にのみに実行されるものであって、通信中においては省略される。機密サービス通信部103が有する各通信部と機密サービスサーバ5a,5bとの通信中は、ローカル音声認識部110での音声認識処理結果(音声認識結果データ)に基づく指示データが通信中の各機密サービスサーバに送信される。
(ステップS11)
ステップS11においてサービス判定部120は、機密通信サービスの利用が終了したか否かの判定を行う。具体的には、サービス判定部120は、機密サービスサーバ(5a,5bのいずれか)から送信された終了指示に基づいて、機密通信サービスの終了契機か否かを判定する。例えば、サービス判定部120は、現在通信中の機密サービスサーバ(5a,5bのいずれか)から、機密通信サービスの終了を示す信号(機密タスク終了信号)が送信されているか否かを判定する。機密タスク終了信号は、機密サービス通信部103に送信され、機密サービス通信部103がサービス判定部120に出力する。サービス判定部120は、機密タスク終了信号が送信されており、機密通信サービスの利用が終了していると判定すると、更に機密タスク終了信号を起動判定部12に出力する。起動判定部12は、タスク終了信号が入力されると通信サービス実行フラグをオフ状態に設定する。これにより、起動判定部12はステップS1の起動キーワードの発話待ち状態に戻る。また、サービス判定部120は、ステップS7において実行した利用権限判定処理において入力音声を発話したユーザに機密通信サービスの利用権限がないとの判定結果を導出して機密通信サービスを中断した場合も、起動判定部12に処理を戻し、起動判定部12がステップS1の起動キーワードの発話待ち状態となる。
一方、ステップS11においてサービス判定部120は、機密タスク終了信号が送信されておらず、機密通信サービスの利用が終了していないと判定すると、処理をローカル音声認識部110に戻す。これにより、ローカル音声認識部110は、ステップS5の音声認識待ち状態となる。
機密通信サービスの実行中(ステップS11のNOからの流れ)においてステップS5の音声認識待ち状態となったローカル音声認識部110は、入力音声が入力されると音声認識処理を実行して、音声認識結果のデータ(音声認識結果データ)をサービス判定部120に出力する。この場合、ステップS7においてサービス判定部120はステート情報に基づいて現在の機密通信サービスの状態が実行中であると判定する。通信サービスの実行中において、サービス判定部120は、ステップS7において機密サービスキーワードの判定を実行せずに、例えば、通信中の機密サービスサーバ(5a,5bのいずれか)からの応答要求に対してユーザが適切な回答をしたか否かを判定する。例えば、サービス判定部120は、機密サービスサーバ5aからの応答要求(例えば「△△円入金しますか?」という問い合わせ)に対してユーザが承諾(例えば「はい」)、または拒絶(例えば「いいえ」)の発話を行った場合に、ユーザが適切な回答をしたと判定して、音声認識結果データから生成した指示データを機密サービス通信部103に出力する。これにより、ステップS9において機密サービス通信部103から通信中の機密サービスサーバに指示データが送信される。
以上、ステップS1からステップS11の処理が、機密通信サービスに係る処理であって、高度なセキュリティ強度が維持された処理(ローカル環境で実行される処理、安全メモリ領域saに記憶されている情報を用いた処理、または暗号化通信における通信処理)となる。
続いて、図3のフローチャートを用いて通常通信サービスに係る処理の流れを説明する。
(ステップS13)
ステップS13において通常サービス通信部13は、サービス判定部120から音声認識サーバ3との通信の開始を指示する通信開始信号を入力されたことに基づいて、音声認識サーバ3に入力音声のデータを送信する。音声認識サーバ3が入力音声データを受信すると、サーバ音声認識部30において入力音声の音声認識処理が実行され、音声認識処理結果に基づいて生成された指示データがユーザの所望するサービスを提供するサービスサーバ(例えば、通常サービスサーバ300a,300bのいずれか)に送信される。このようにして、音声認識端末装置1において通常通信サービスが開始される。
(ステップS15)
ステップS15において通常サービス通信部13は、ユーザが通常通信サービスの終了を所望していることを示す終了コマンドが入力されたか否かを判定する。終了コマンドは、例えばユーザが発話した音声であって、通常通信サービスの終了を示す内容を含む音声である。また、ユーザが発話していない期間(音声入力部11からの入力音声の入力が無い期間)が一定期間以上であることを、終了コマンドとみなしてもよい。
通常サービス通信部13は、終了コマンドが入力されており、通常通信サービスの終了契機であると判定すると、通常通信サービスの実行中であることを示すステート情報を削除して、起動判定部12に処理を戻す。これにより、起動判定部12は、ステップS1の起動キーワードの発話待ちの状態に戻る。一方、通常サービス通信部13は、終了コマンドが入力されておらず、通常通信サービスの終了契機でないと判定すると、ステップS17の処理に移る。
なお、終了コマンドに相当する入力音声は、機密通信サービスの実行中であっても、ステップS7の処理において、通信中の機密サービスサーバからの応答要求に対して適切な回答でないと判断される(ステップS7のNO)。このため、ユーザが機密通信サービスの終了を所望する場合、ステップS15において機密通信サービスを終了することもできる。この場合、通常サービス通信部13は、機密通信サービスの実行中であることを示すステート情報を削除して、起動判定部12に処理を戻す。
(ステップS17)
ステップS17において通常サービス通信部13は、通常通信サービスの処理が終了しているか否かを判定する。具体的には、通常サービス通信部13は、現在通信中である通信対象のサービスサーバ(通常サービスサーバ300a,300bのいずれか)から、通常通信サービスの終了を示す信号(通常タスク終了信号)が送信されているか否かを判定する。通常サービス通信部13は、通常タスク終了信号が送信されており、通常通信サービスの利用が終了していると判定すると、通常通信サービスの実行中であることを示すステート情報を削除して、起動判定部12に処理を戻す。一方、通常サービス通信部13は、通常タスク終了信号が送信されておらず、通常通信サービスの継続中であると判定するとステップS13の処理に戻る。以降、終了コマンドが入力されるか(ステップS15のYES)または通常タスク終了信号が通常サービスサーバから送信される(ステップS17のYES)までは、通常サービス通信部13は、音声入力部11から起動判定部12および通信装置100の通信判定部101を介して入力音声が入力される度に、当該入力音声のデータを音声認識サーバ3に送信する。
なお、終了コマンドの入力を判定する処理(ステップS15)および通常通信サービスの処理の終了を判定する処理(ステップS17)は、通常サービス通信部13ではなく、通信装置100の通信判定部101がサービス判定部120において実行してもよい。
以上、説明したように、本実施形態による通信装置100は、ユーザの発話に基づく入力音声(入力情報の一例)に機密サービスキーワード(予め定められたキーワードの一例)が含まれるか否かに基づいて複数のサーバ(音声認識サーバ3、機密サービスサーバ5a,5b)から通信対象となる一つの通信対象サーバを判定する通信判定部101のサービス判定部(判定部の一例)120と、入力音声に機密サービスキーワードが含まれる場合にサービス判定部120により通信対象サーバに判定される機密サービスサーバ(特定サーバの一例)5a,5bと直接通信が可能な機密サービス通信部103(第一機密サービス通信部103a、第二機密サービス通信部103b)と、を備える。
これにより、通信装置100は、通常通信サービスよりも高いセキュリティ強度が要求される機密通信サービスの利用時に、機密サービスサーバ5a,5bと直接通信(E2Edの通信)を行い、高レベルのセキュリティ強度を維持して機密サービスに係る情報の流出を防止することができる。
また、通信判定部101のローカル音声認識部110は、入力音声(ユーザの発話に基づく音声の一例)について音声認識を実行可能であり、サービス判定部120は、ローカル音声認識部110による音声認識の結果(入力情報の一例)に機密サービスキーワードが含まれるか否かに基づいて入力音声に対応する通信サービスの種別(通常通信サービスまたは機密通信サービス)を判定し、通信サービスの種別に基づいて通信対象サーバを判定し、音声認識の結果に基づいて機密サービスサーバ5a,5bへの指示内容の情報を含む指示データを生成する。さらに、機密サービス通信部103は、この指示データを通信対象サーバである機密サービスサーバ5a,5bのいずれかに送信する。本実施形態による通信装置100は、ローカル環境において音声認識処理を実行することで、機密サービスに係る情報の流出をより確実に防止することができる。
また、通信判定部101のサービス判定部120は、入力音声(入力情報の一例)に機密サービスキーワードが含まれる場合に、入力音声を発話したユーザが機密サービスサーバ5a,5bにより提供される機密通信サービス(特定サービスの一例)の利用権限を有しているか否かの判定を行い、機密サービス通信部103は、サービス判定部120により該ユーザが機密通信サービスの利用権限を有していると判定された場合に機密サービスサーバ5a,5bとの通信を行う。
また、本実施形態による通信装置100は、利用権限の判定に用いる利用権限データを記憶する記憶部102を備え、通信判定部101のサービス判定部120は、入力音声(入力情報の一例)に記憶部102が記憶する個人情報リスト152に格納された利用権限データが含まれる場合に、入力音声を発話したユーザが利用権限を有していると判定する。これにより、利用権限のないユーザが機密通信サービスを利用することを防止し、かつ機密通信サービスに係る情報の流出を防止することができる。
また、機密サービス通信部103は、機密サービスサーバ5a,5bとの間で暗号化を伴うプロトコルを用いた通信を行う。また、当該プロトコルを用いた通信の認証に用いる鍵データ(認証データの一例)は、記憶部102に記憶されている。これにより、通信装置100と機密サービスサーバ5a,5bとの通信において、高いセキュリティ強度を維持することができ、通信中において機密通信サービスに係る情報が盗聴等されることを防止することができる。
また、通信判定部101のサービス判定部120は、入力音声を発話したユーザが機密通信サービスの利用権限を有していると判定した場合に、記憶部102の個人情報リスト152から鍵データを取得可能である。これにより、本実施形態による通信装置100は、機密サービスの利用時におけるセキュリティ強度を向上させることができ、さらに、機密サービスに係る情報の流出を防止することができる。
また、本実施形態による通信装置100は、通常メモリ領域ms(第一メモリ領域の一例)と、通常メモリ領域msよりも安全性に優れた安全メモリ領域sa(第二メモリ領域の一例)と、を備え、機密通信サービスに係る情報(機密サービスキーワードリスト132、個人情報リスト152)を記憶する記憶部102は、安全メモリ領域saに設けられている。これにより、通信装置100は、記憶部102の個人情報リスト152に記憶されている機密通信サービスに係る情報の流出をより確実に防止することができる。
また、本実施形態において通信装置100が通信可能な機密サービスサーバは複数(機密サービスサーバ5a,5bの2つ)あり、通信装置100は、機密サービスサーバのそれぞれに対応する複数の通信部(第一機密サービス通信部103a、第二機密サービス通信部103b)を有する機密サービス通信部103を備えている。また、複数の機密サービスサーバのそれぞれに対応する複数の機密通信サービスの種別(第一機密通信サービス、第二機密通信サービス)があり、複数の機密通信サービスの種別ごとに異なる種類の機密サービスキーワード(第一機密サービスキーワード、第二機密サービスキーワード)が対応付けられている。また、通信判定部101のサービス判定部120は、入力音声(入力情報の一例)に含まれる機密サービスキーワードの種類に基づいて複数の機密通信サービスの種別の中から一つの種別を判定し、判定した該種別に基づいて、機密サービスサーバ5a,5bのうち通信対象サーバとなる一つの機密サービスサーバを判定する。
また、本実施形態による音声認識端末装置1には、上述した作用効果を奏する本実施形態による通信装置100を備えている。これにより、音声認識端末装置1は、通信装置100と同様の作用効果を奏する。
また、機密通信サービスの提供事業者(本例ではA銀行、B証券会社)は、通信装置100を備える音声認識端末装置1に機密通信サービスを提供する際に、既存の機密通信サービスのシステムを利用したままで、高レベルのセキュリティ強度が維持され、機密通信サービスに係る情報の流出を防止するという効果を得られる。すなわち、機密通信サービスの提供事業者は、セキュリティ強度の維持や情報流出の防止のために新たに音声認識用のサーバを設ける等の設備投資費用や、既存システムのバージョンアップ等の開発作業の負荷を負わずに、高レベルのセキュリティ強度を有する環境において、機密通信サービスを提供することができる。
(第一実施形態の変形例)
上記実施形態において、音声認識端末装置1が通信装置100を内蔵している例を説明したが、本発明はこれに限られない。例えば、通信装置100は、音声認識端末装置1とは別個のハードウェア装置であって、所定のインターフェースによって音声認識端末装置1と接続される構成であってもよい。
また、通信装置100がハードウェア装置として構成される場合、通常サービス通信部13が通信装置100に設けられていてもよい。
また、通信装置100のうち、例えば、ローカル音声認識部110のみが別個のハードウェア(ローカル音声認識装置)として構成されていてもよい。この場合、ローカル音声認識装置はマイクロフォン等の収音装置を備え、この収音装置から入力された音声について音声認識処理を実行する構成であってもよいし、所定のインターフェースによって接続された音声認識端末装置1の音声入力部11から入力された入力音声について音声認識処理を実行する構成であってもよい。
また、上記実施形態において、サービス判定部120は、入力音声に機密サービスキーワードが含まれるか否かによって通信サービスの種別を判定し(サービス判定処理)、通信サービスの種別に基づいて一つの通信対象サーバを判定する(サーバ判定処理)としたが、本発明はこれに限られない。例えば、サービス判定部120の前段の処理として入力音声を所定の情報(例えば、信号情報(デジタル信号等)やテキスト情報等)に変換する処理が実行され、この情報(入力情報)がサービス判定部120に入力される場合には、サービス判定部120は、入力情報に基づいて、サービス判定処理を実行する。つまり、サービス判定部120は、ユーザの発話に基づく入力情報(入力音声、ローカル音声認識部110における音声認識結果データ、信号情報、テキスト情報等)に機密サービスキーワードが含まれるか否かに基づいて一つの通信対象サーバを判定可能であればよい。
また、サービス判定部120は、利用権限判定処理において、入力情報の元となる発話をしたユーザが機密通信サービスの利用権限を有しているか否かを判定すればよい。
また、上記実施形態において、音声認識端末装置1の起動判定部12において起動キーワードに基づく起動判定処理を行い、これにより、後段の処理(通信装置100での処理)を起動するか否かを判定したが本発明はこれに限られない。例えば、通信装置100は、起動判定部12による起動判定処理なしに、常にローカル音声認識部110が音声認識待ち状態となっており、音声入力部11から入力音声が入力されると機密サービスキーワードの判定を行うように構成されていてもよい。
また、音声認識端末装置1は周囲の撮影が可能な撮影装置(カメラ等)を備え、起動判定部12は、ユーザが特定の動作(ジェスチャー)をしたか否かによって後段の処理を起動するか否かを判定してもよい。
また、上記実施形態において、通信装置100と直接通信可能な機密サービスサーバは2つであったが、本発明において、機密サービスサーバの数はこれに限られない。通信装置100と直接通信可能な機密サービスサーバは1つでもよいし、3以上であってもよい。また、機密サービス通信部103は、通信装置100が直接通信可能な機密サービスサーバと対応する数の機密サービス通信部で構成されていればよい。また、個人情報リスト152には、各機密サービスサーバに対応する鍵データを有していればよい。
また、音声認識端末装置1は、機密サービス通信部103が機密サービスサーバと通信中であることをユーザに通知する通知部を備えていてもよい。通知部は、例えば文字や記号等の画像を表示可能な表示装置であってもよいし、LEDランプ等の照明装置であってもよい。通知部が照明装置として構成される場合、例えば通常通信サービスの利用時(音声認識サーバ3との通信中)と機密通信サービスの利用時(機密サービスサーバとの通信中)とでLEDランプの表示色を変更する。これにより、ユーザに現在利用中の通信サービスの種別を通知することができる。
また、音声認識端末装置1は、音声出力部(不図示)において機密通信サービスの実行中であることを示すメッセージ(例えば「セキュアな通信を実行しています」等)を出力してもよい。
また、通信装置100における機密サービスキーワードの判定処理(ステップS7のサービス判定処理)には、判定学習期間が設けられていてもよい。例えば、サービス判定部120は、ローカル音声認識部110における入力音声の音声認識処理結果について、機密サービスキーワードが含まれているか否かが明確でない場合には、音声出力部(不図示)において、「セキュアな通信を実行しますか?」といった確認メッセージを出力する。これに対し、ユーザから承諾を示す入力音声(例えば「はい」)が入力されるか否かによって、サービス判定部120は、機密サービスキーワードの判定処理を最適化し、処理精度を向上させるようになっていてもよい。
また、図3に示すように、ステップS7におけるサービス判定処理(通常通信サービスか機密通信サービスかの判定)はステップS5におけるローカル音声認識部110でのお音声認識処理後に実行される。このため、本来であればローカル環境での音声認識処理が不要な通常通信サービスの開始遅延が生じ得る。そこで、サービス判定部120は、機密サービスキーワードが含まれるか否かの判定処理の完了を待たずに、ユーザが機密通信サービスの利用を所望していないことを示す文字列(例えば、天気等)が音声認識処理結果に含まれることを確認した時点で、通信サービスの種別を通常通信サービスと判定してステップS13に処理を進めてもよい。これにより、通常通信サービスの開始遅延を防止することができる。また、ユーザが機密通信サービスの利用を所望していないことを示す文字列は、例えば通常サービスキーワードリストとしてまとめて記憶部102に記憶されていてもよい。
また、音声認識端末装置1または通信装置100が撮影装置(カメラ)を備えている場合、通信装置100のサービス判定部120は、撮影装置によって撮影されたユーザの映像と入力音声とを組み合わせて機密通信サービスの利用権限の判定を行ってもよい。これにより、通信装置100は、本来は機密通信サービスの利用権限を有しない人物による、なりすまし行為を防止することができる。
また、上記実施形態において、安全メモリ領域saに記憶部102が配置されているとしたが、本発明はこれに限られない。例えば、記憶部102に加えて、通信判定部101のローカル音声認識部110、サービス判定部120および機密サービス通信部103の少なくともいずれかが安全メモリ領域saに配置されていてもよい。これにより、通信装置100における機密通信サービスに係る処理がすべてセキュアな状態で実行されることとなる。
また、音声認識端末装置1に通信装置100が内蔵される場合、音声認識端末装置1に通常メモリ領域ms(第三メモリ領域の一例)よりも安全性に優れた安全メモリ領域sa(第四メモリ領域の一例)が設けられ、通信装置100に該当する機能ブロックである通信判定部101、記憶部102および機密サービス通信部103が音声認識端末装置1の安全メモリ領域saに配置される構成であってもよい。
また、上記実施形態において、通信装置100が通常通信サービスと、高いセキュリティ強度による通信が要求される機密通信サービスというサービス種別に応じて、通信対象とするサーバを判定する処理を実行するとしたが、本発明はこれに限られない。例えば、通信装置100は、通信サービス種別(通常通信サービスか機密通信サービスか)に応じて通信対象サーバを判定する処理を応用して、ユーザが音声認識端末装置1を用いて、インターネットを介して商品の購入をする際に、商品の種類によって通信対象とするサーバを判定する処理(商品購入時サーバ判定処理)を行ってもよい。
すなわち、通信装置100は、通信判定部101においてユーザの発話に基づく入力音声に特定の商品名(予め定められたキーワードの一例)が含まれるか否かに基づいて複数のサーバ(通常商品購入サーバ、特定商品購入サーバ)から通信対象となる一つの通信対象サーバを判定し、機密サービス通信部に代えて特定商品購入サーバ通信部において、入力音声に特定の商品名が含まれる場合に通信判定部101により通信対象サーバに判定される特定商品購入サーバ(特定サーバの一例)と通信してもよい。
これにより、通信装置100は、特定の商品購入の際に、音声認識端末装置1が自動的に通信する商品購入サーバ(例えば、音声認識端末装置1のメーカにより選定された通常商品購入サーバ)以外の特定商品購入サーバと通信することができる。また、この場合、音声認識端末装置1またはハードウェアとして構成された通信装置100のユーザは、音声認識端末装置1のアプリケーション、または通信装置100と接続可能な所定の情報処理装置によって、任意の特定商品名の登録を行うことができる。これにより、通信装置100、または通信装置100を備えた音声認識端末装置1のユーザは、任意の特定商品を、通常商品購入サーバ以外のサーバが提供する商品購入システムから購入することができる。
2.第2実施形態
次に、本発明の第2実施形態による通信装置および音声認識端末装置について図4を用いて説明する。図4は、第2実施形態による通信装置を備える音声認識端末装置2を含む音声認識サービスシステム90の概略構成図である。図4に示すように、本実施形態において、音声認識サービスシステム90は、音声認識端末装置2が備える通信装置200と機密サービスサーバ5a,5bとの間に機密音声認識サーバ6a,6bが設けられている点で第1実施形態における音声認識サービスシステム9と異なる。
なお、音声認識サービスシステム90において、第1実施形態による音声認識サービスシステム9と同一の作用効果を有する構成は、図1に示す音声認識サービスシステム9と同一の符号を付し、詳細な説明は省略する。
図4に示すように、機密音声認識サーバ6aは、音声認識サーバ3のサーバ音声認識部30と同様の音声認識処理を行う機密サーバ音声認識部60aを備えている。機密サーバ音声認識部60aは、機密音声認識エンジン61と、機密意味解析エンジン62とを有している。機密音声認識エンジン61は、上述のサーバ音声認識部30における音声認識エンジン31と同様に自動音声認識(ASR)を実行し、機密意味解析エンジン62は、機密音声認識エンジン61から入力された認識結果(単語の組合せ)について、サーバ音声認識部30における意味解析エンジン32と同様に自然言語認識(NLU)を実行する。また、機密音声認識サーバ6bは、機密サーバ音声認識部60aと同様に音声認識処理を実行する機密サーバ音声認識部60bを備えている。機密音声認識サーバ6aは、機密サーバ音声認識部60aでの音声認識処理結果のデータ(音声認識結果データ)から生成した指示データを機密サービスサーバ5aに送信し、機密音声認識サーバ6bは、機密サーバ音声認識部60bでの音声認識処理結果のデータから生成した指示データを機密サービスサーバ5bに送信する。
また、音声認識サービスシステム90における機密音声認識サーバ6aは、機密サービスサーバ5aを有する第一機密サービスの提供事業者(例えば、A銀行)が管轄するサーバである。このため、機密音声認識サーバ6aと機密サービスサーバ5aとの間には、高レベルのセキュリティ強度を維持した通信路(例えばSSLによる通信)の確立が保証される。また、音声認識サービスシステム90における機密音声認識サーバ6bは、機密サービスサーバ5bを有する第二機密サービスの提供事業者(例えば、B証券会社)が管轄するサーバである。このため、機密音声認識サーバ6bと機密サービスサーバ5bとの間にも、高レベルのセキュリティ強度を維持した通信路の確立が保証される。
図4に示すように、本実施形態において、通信装置200が機密通信サービスの実行時において直接通信(E2Eでの通信)を行うサーバは、機密音声認識サーバ6a,6bのいずれかとなる。すなわち、本実施形態による通信装置200において、機密サービス通信部203を構成する第一機密サービス通信部203aは機密音声認識サーバ6aと暗号化プロトコルを用いた直接通信を行い、第二機密サービス通信部203bは機密音声認識サーバ6bと暗号化プロトコルを用いた直接通信を行う。
また、上記第1実施形態とは異なり、本実施形態では、機密通信サービスに係る音声認識処理を通信装置200のローカル環境(ローカル音声認識部210)ではなく、機密音声認識サーバ6a,6bにおいて実行する。このため、通信装置200において、サービス判定部220が入力音声(入力情報の一例)に機密サービスキーワードが含まれるか否かに基づいて入力音声に対応する通信サービスの種別を判定し、通信サービスの種別に基づいて通信対象サーバ(例えば機密音声認識サーバ6a,6bのいずれか)を判定すると、第一機密サービス通信部203a、第二機密サービス通信部203bは、対応する機密音声認識サーバ6a,6bに入力音声(入力情報の一例)として、ユーザが発話した音声(音声認識処理実行前の音声)のデータを送信する。したがって、本実施形態における通信装置200のローカル音声認識部210は、上記ステップS7でのサービス判定時における機密サービスキーワードが含まれるか否かの判断時にのみ、入力音声の音声認識処理を実行する。
機密通信サービスの実行時において、機密音声認識サーバ6a,6bで音声認識処理を実行することで、通信装置200は、処理負荷を軽減することができる。また、機密音声認識サーバ6a,6bは、機密通信サービスの提供事業者の管轄するサーバであり、上述のように通信装置200との間、および機密サービスサーバ5a,5bとの間にセキュリティ強度の高い通信路が確立されている。したがって、通信装置200は、機密通信サービスの実行時において機密音声認識サーバ6a,6bと直接通信を行うことで、高レベルのセキュリティ強度を維持し機密通信サービスに係る情報の流出を防止することができる。
また、サーバにおける音声認識処理は、ローカル環境での音声認識処理に比べて処理の最適化がされ易く、音声認識処理の精度が高くなっている。したがって、機密音声認識サーバ6a,6bと直接通信可能な通信装置200および通信装置200を備える音声認識端末装置2は、高精度の音声認識処理による機密通信サービスをユーザに提供することができる。
なお、通信装置200の通信判定部201は、上記第1実施形態と同様に、機密通信サービスの実行時においてサービス判定処理、およびサーバ判定処理、利用権限判定処理、鍵データ取得処理を実行する。ただし、サーバ判定処理において通信判定部201のサービス判定部220は、通信対象となる機密サービスサーバではなく、通信対象となる機密音声認識サーバ(6a,6bのいずれか)を判定する。
このように、本実施形態において、機密通信サービスは、通信装置200を備える音声認識端末装置2と機密通信サービスを提供する事業者との2者間における高レベルのセキュリティ強度を用いたサービスとなる。
(第2実施形態の変形例)
上記第2実施形態において、通信装置200が、機密音声認識サーバ6a,6bを介して機密サービスサーバ5a,5bと通信を行う例を説明したが、本発明はこれに限られない。例えば、通信装置200は、機密音声認識サーバを介して機密サービスサーバと通信を行うケースと、上記第1実施形態のように機密サービスサーバと直接通信を行うケースの両方を実行可能に構成されていてもよい。仮に、通信装置200は、A銀行の機密サービスサーバ5aと直接通信を行い、B証券会社の機密サービスサーバ5bとは機密音声認識サーバ6bを介して通信を行う構成であるとする。この場合、通信装置200のサービス判定部220は、機密通信サービスの種別が第一機密通信サービスであるときには通信対象サーバを機密サービスサーバ5aに判定し、第一機密サービス通信部203aから機密サービスサーバ5aに指示データを送信させる。一方、サービス判定部220は、機密通信サービスの種別が第二機密通信サービスであるときには、通信対象サーバを機密音声認識サーバ6bに判定し、第二機密サービス通信部203bから機密音声認識サーバ6bにユーザが発話した音声のデータ(入力音声)を送信させる。
これにより、通信装置200は、機密通信サービスの提供事業者によるサービスの提供方法に合わせて通信対象サーバを判定し、高レベルのセキュリティ強度を維持することができる。
以上、各実施形態により本発明を説明したが、本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらす全ての実施形態をも含む。さらに、本発明の範囲は、請求項により画される発明の特徴の組み合わせに限定されるものではなく、全ての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
1、2 音声認識端末装置
3 音声認識サーバ
5a、5b 機密サービスサーバ
6a、6b 機密音声認識サーバ
9、90 音声認識サービスシステム
11 音声入力部
12 起動判定部
13 通常サービス通信部
100、200 通信装置
102 記憶部
101、201 通信判定部
103、203 機密サービス通信部
103a、203a 第一機密サービス通信部
103b、203b 第二機密サービス通信部
110 ローカル音声認識部
120、220 サービス判定部
300a、300b 通常サービスサーバ
ms 通常メモリ領域
sa 安全メモリ領域

Claims (11)

  1. ユーザの発話に基づく入力情報に予め定められたキーワードが含まれるか否かに基づいて複数のサーバから通信対象となる一つの通信対象サーバを判定する判定部と、
    前記入力情報に前記キーワードが含まれる場合に前記判定部により前記通信対象サーバに判定される特定サーバと直接通信が可能な通信部と、
    を備えることを特徴とする通信装置。
  2. ユーザの発話に基づく音声について音声認識を実行可能な音声認識部を備え、
    前記入力情報は、前記音声認識部による音声認識の結果を含み、
    前記判定部は、前記音声認識の結果である前記入力情報に前記キーワードが含まれるか否かに基づいて前記入力情報に対応するサービスの種別を判定し、該サービスの種別に基づいて前記通信対象サーバを判定し、前記入力情報に基づいて前記特定サーバへの指示内容を含む指示データを生成し、
    前記通信部は、前記指示データを前記特定サーバに送信すること
    を特徴とする請求項1に記載の通信装置。
  3. 前記入力情報は、ユーザが発話した音声を含み、
    前記判定部は、前記入力情報に前記キーワードが含まれるか否かに基づいて前記入力情報に対応するサービスの種別を判定し、前記サービスの種別に基づいて前記通信対象サーバを判定し、
    前記通信部は、前記入力情報としてユーザが発話した音声のデータを前記特定サーバに送信すること
    を特徴とする請求項1又は2に記載の通信装置。
  4. 前記判定部は、前記入力情報に前記キーワードが含まれる場合に、前記入力情報の元となる発話をしたユーザが前記特定サーバにより提供される特定サービスの利用権限を有しているか否かの判定を行い、
    前記通信部は、前記判定部により該ユーザが前記利用権限を有していると判定された場合に前記特定サーバとの通信を行うこと
    を特徴とする請求項1から3のいずれか1項に記載の通信装置。
  5. 前記利用権限の判定に用いる利用権限データを記憶する記憶部を備え、
    前記判定部は、前記入力情報に前記記憶部が記憶する前記利用権限データが含まれる場合に、前記入力情報の元となる発話をしたユーザが前記利用権限を有していると判定すること
    を特徴とする請求項4記載の通信装置。
  6. 前記通信部は、前記特定サーバとの間で暗号化を伴うプロトコルを用いた通信を行い、
    前記プロトコルを用いた通信の認証に用いる認証データは、前記記憶部に記憶されていること
    を特徴とする請求項5に記載の通信装置。
  7. 前記判定部は、ユーザが前記利用権限を有していると判定した場合に、前記記憶部から前記認証データを取得可能であること
    を特徴とする請求項6記載の通信装置。
  8. 第一メモリ領域と、
    前記第一メモリ領域よりも安全性に優れた第二メモリ領域と、
    を備え、
    前記記憶部は、前記第二メモリ領域に設けられていること
    を特徴とする請求項5から7のいずれか1項に記載の通信装置。
  9. 前記判定部および前記通信部のうち少なくとも一方は、前記第二メモリ領域に設けられていること
    を特徴とする請求項8に記載の通信装置。
  10. 前記特定サーバは複数あり、
    前記特定サーバのそれぞれに対応する複数の前記通信部を備え、
    前記複数の特定サーバのそれぞれが提供する特定サービスに応じた複数の特定サービス種別があり、
    前記複数の特定サービス種別ごとに異なる種類の前記キーワードが対応付けられており、
    前記判定部は、前記入力情報に含まれる前記キーワードの種類に基づいて前記複数の特定サービス種別の中から一つの種別を判定し、判定した該種別に基づいて、前記通信対象サーバとなる一つの前記特定サーバを判定すること
    を特徴とする請求項1から9のいずれか1項に記載の通信装置。
  11. 請求項1から請求項10のいずれか1項に記載の通信装置を備えること
    を特徴とする音声認識端末装置。
JP2018124398A 2018-06-29 2018-06-29 通信装置および通信装置を備える音声認識端末装置 Pending JP2020004192A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018124398A JP2020004192A (ja) 2018-06-29 2018-06-29 通信装置および通信装置を備える音声認識端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018124398A JP2020004192A (ja) 2018-06-29 2018-06-29 通信装置および通信装置を備える音声認識端末装置

Publications (1)

Publication Number Publication Date
JP2020004192A true JP2020004192A (ja) 2020-01-09

Family

ID=69100121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018124398A Pending JP2020004192A (ja) 2018-06-29 2018-06-29 通信装置および通信装置を備える音声認識端末装置

Country Status (1)

Country Link
JP (1) JP2020004192A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274596A (zh) * 2020-01-23 2020-06-12 百度在线网络技术(北京)有限公司 设备交互方法、权限管理方法、交互设备及用户端
JP2021184532A (ja) * 2020-05-21 2021-12-02 Necパーソナルコンピュータ株式会社 ネットワークシステム、ホスト装置、及びネットワーク制御方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008544327A (ja) * 2005-06-22 2008-12-04 マイクロソフト コーポレーション セキュア情報のための音声認識システム
JP2015064785A (ja) * 2013-09-25 2015-04-09 Necエンジニアリング株式会社 コンソール、ネットワーク間接続装置制御方法、及び、コンソール接続システム
JP2016095383A (ja) * 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
WO2016145992A1 (zh) * 2015-03-13 2016-09-22 阿里巴巴集团控股有限公司 一种在通信软件中通过语音启动业务的方法及相应装置
US20180061418A1 (en) * 2016-08-31 2018-03-01 Bose Corporation Accessing multiple virtual personal assistants (vpa) from a single device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008544327A (ja) * 2005-06-22 2008-12-04 マイクロソフト コーポレーション セキュア情報のための音声認識システム
JP2015064785A (ja) * 2013-09-25 2015-04-09 Necエンジニアリング株式会社 コンソール、ネットワーク間接続装置制御方法、及び、コンソール接続システム
JP2016095383A (ja) * 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
WO2016145992A1 (zh) * 2015-03-13 2016-09-22 阿里巴巴集团控股有限公司 一种在通信软件中通过语音启动业务的方法及相应装置
US20180061418A1 (en) * 2016-08-31 2018-03-01 Bose Corporation Accessing multiple virtual personal assistants (vpa) from a single device

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274596A (zh) * 2020-01-23 2020-06-12 百度在线网络技术(北京)有限公司 设备交互方法、权限管理方法、交互设备及用户端
JP2021117972A (ja) * 2020-01-23 2021-08-10 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド デバイス対話方法、権限管理方法、対話型デバイスおよびクライアント
JP7143378B2 (ja) 2020-01-23 2022-09-28 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド デバイス対話方法、権限管理方法、対話型デバイスおよびクライアント
CN111274596B (zh) * 2020-01-23 2023-03-14 百度在线网络技术(北京)有限公司 设备交互方法、权限管理方法、交互设备及用户端
JP2021184532A (ja) * 2020-05-21 2021-12-02 Necパーソナルコンピュータ株式会社 ネットワークシステム、ホスト装置、及びネットワーク制御方法
JP7080922B2 (ja) 2020-05-21 2022-06-06 Necパーソナルコンピュータ株式会社 ネットワークシステム、ホスト装置、及びネットワーク制御方法

Similar Documents

Publication Publication Date Title
EP3050051B1 (en) In-call virtual assistants
JP6093040B2 (ja) サービスを提供するための装置、方法、コンピュータプログラム及び記憶媒体
US11777918B2 (en) Dynamic and cryptographically secure augmentation of participants in programmatically established chatbot sessions
US20160042748A1 (en) Voice application architecture
US10249296B1 (en) Application discovery and selection in language-based systems
US11818282B2 (en) Non-verbal sensitive data authentication
US20200265842A1 (en) Cross account access for a virtual personal assistant via voice printing
US10255914B2 (en) Digital concierge and method
US9014347B2 (en) Voice print tagging of interactive voice response sessions
CN109087639A (zh) 用于语音识别的方法、装置、电子设备及计算机可读介质
US11374976B2 (en) System for authentication of resource actions based on multi-channel input
US11909917B2 (en) Methods, apparatuses, and systems for dynamically navigating interactive communication systems
JP2020518053A (ja) パーソナルボイスアシスタント認証
US11349988B1 (en) Establishing a voice authentication credential
WO2021047197A1 (zh) 一种语音处理方法、装置、设备和计算机存储介质
US10666793B1 (en) Secure call center communications
US11283806B2 (en) Adaptive security system
US10079935B1 (en) Managing sensitive information transfer between parties in a telephone conversation
JP2020004192A (ja) 通信装置および通信装置を備える音声認識端末装置
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
WO2016124008A1 (zh) 一种语音控制方法、装置及系统
WO2023091171A1 (en) Shared assistant profiles verified via speaker identification
WO2024116401A1 (ja) 認証システム、認証方法、及び、プログラム
JP2021048482A (ja) 情報処理システム、情報処理方法、及び情報処理プログラム
TWI745804B (zh) 以互動式信息存取金融服務的方法與系統

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221018