JP6555838B1 - 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。 - Google Patents

音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。 Download PDF

Info

Publication number
JP6555838B1
JP6555838B1 JP2018237446A JP2018237446A JP6555838B1 JP 6555838 B1 JP6555838 B1 JP 6555838B1 JP 2018237446 A JP2018237446 A JP 2018237446A JP 2018237446 A JP2018237446 A JP 2018237446A JP 6555838 B1 JP6555838 B1 JP 6555838B1
Authority
JP
Japan
Prior art keywords
chatbot
server device
text
answer
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018237446A
Other languages
English (en)
Other versions
JP2020098308A (ja
Inventor
敏秀 金
敏秀 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JE International Corp
Original Assignee
JE International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JE International Corp filed Critical JE International Corp
Priority to JP2018237446A priority Critical patent/JP6555838B1/ja
Application granted granted Critical
Publication of JP6555838B1 publication Critical patent/JP6555838B1/ja
Priority to PCT/JP2019/042493 priority patent/WO2020129419A1/ja
Priority to TW108139504A priority patent/TW202028992A/zh
Publication of JP2020098308A publication Critical patent/JP2020098308A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/066Format adaptation, e.g. format conversion or compression

Abstract

【課題】AIチャットボットサーバー装置に既に蓄えられた知識を用いて、スマートスピーカーが質問に対して答弁することができる音声問合せシステム等を提供する。【解決手段】システムは、スマートスピーカー運用サーバー装置と、チャットボットポータルサーバー装置とを含む。スマートスピーカー運用サーバー装置は、質問音声を質問テキストに変換する音声認識部と、質問テキストをチャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、受信した答弁テキストを答弁音声に変換する音声合成部とを備える。チャットボットポータルサーバー装置は、チャットボットサーバー装置ごとの特徴を保持するチャットボット特定用データ管理部と、前記チャットボットサーバー装置ごとの特徴と、質問テキストの特徴とから、質問テキストに適合するチャットボットポータルサーバー装置を特定するチャットボット特定部とを備える。【選択図】図1

Description

本発明は、音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラムに関する。
現在、多くの種類のスマートスピーカー(「AIスピーカー」とも呼ばれる。「AI」は人工知能を意味する。)が販売され、実用されている。スマートスピーカーは、人の音声を取得し、取得した音声に対する応答を音声として出力したり、取得した音声に対応する動作(例えば、外部の電気電子機器等の制御)を行ったりするものである。
例えば、非特許文献1には、スマートスピーカーの技術の概略が示されている。
また、現在、AIチャットボットが実用化されている。AIチャットボットは、人工知能等を用いて、入力される入力テキストデータに対して適切な応答である出力テキストデータを出力するものである。AIチャットボットは、例えば、企業や店舗等が提供する商品やサービスに関する豊富な情報を持ち、それらの企業や店舗等の顧客からの質問に応える目的で広く使用されている。AIチャットボットの利用により、企業や店舗等は、顧客に対して役に立つ高品質な情報を、少ないコストで提供することに成功している。
例えば、特許文献1には、機械学習処理により入力テキストと応答テキストとの関係を学習し、学習結果である知識データに基づいて入力テキストに適した応答テキストを生成するチャットボットサーバー装置が記載されている。
特許第6218057号公報
「スマートスピーカー」,フリー百科事典「ウィキペディア(Wikipedia)」,[online],平成30年(西暦2018年)12月07日更新,[平成30年(西暦2018年)12月07日検索],インターネット<URL:https://ja.wikipedia.org/wiki/%E3%82%B9%E3%83%9E%E3%83%BC%E3%83%88%E3%82%B9%E3%83%94%E3%83%BC%E3%82%AB%E3%83%BC>
しかしながら、従来技術によるスマートスピーカーが対応可能な知識の分野あるいは量には、限りがある。様々な分野の、具体的かつ詳細な事項にスマートスピーカーが対応できることが望ましいが、スマートスピーカーを支える現状のバックボーンのシステムにおいて、特定の分野の、詳細な知識を蓄積することは容易ではない。また、機械学習を行うための学習データを準備することや、膨大な量の学習データを用いて限られた計算資源で学習処理を行うことは非常に困難である。
一方で、AIチャットボットは、様々な企業等で導入され、知識の蓄積が進んでいる。しかしながら、従来のスマートスピーカーの技術で、これらAIチャットボットに蓄積された知識を利用するしくみがない。
本発明は、上記の課題認識に基づいて行なわれたものであり、AIチャットボットサーバー装置に既に蓄えられた知識を用いて、スマートスピーカーが質問に対して答弁することができる技術を提供しようとするものである。本発明は、そういった技術を用いて構成される音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラムを提供しようとするものである。
[1]上記の課題を解決するため、本発明の一態様による音声問合せシステムは、次の通りである。即ち、音声を入出力する機能を有する端末装置と、前記端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、前記端末装置から渡された質問に対する答弁を出力するチャットボットサーバー装置と、前記質問に適合する前記チャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、を含んで構成される音声問合せシステムであって、前記端末装置は、音声による質問である質問音声を取得する音声入力部と、前記質問音声を前記スマートスピーカー運用サーバー装置に送信するとともに、前記質問音声に対応する答弁音声を前記スマートスピーカー運用サーバー装置から受信する音声伝達部と、前記答弁音声を音声として出力する音声出力部と、を具備するものであり、前記スマートスピーカー運用サーバー装置は、前記端末装置から送信された前記質問音声を質問テキストに変換する音声認識部と、前記質問テキストを前記チャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、を具備するものであり、前記チャットボットポータルサーバー装置は、複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持するチャットボット特定用データ管理部と、前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力するチャットボット特定部と、を具備するものであり、前記チャットボットサーバー装置は、前記質問テキストと前記答弁テキストとの関係について機械学習済みであるモデルを備え、外部から受信する前記質問テキストと前記モデルとから、前記質問テキストに対応する前記答弁テキストを推論し出力する答弁推論部、を具備するものである。
[2]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記チャットボットポータルサーバー装置は、前記チャットボット特定部によって特定された前記チャットボットサーバー装置に対して、スマートスピーカー運用サーバー装置から受信した前記質問テキストを送信する質問送信部、をさらに具備する、ものである。
[3]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記チャットボットポータルサーバー装置は、前記チャットボット特定部によって出力される前記チャットボット情報を、前記スマートスピーカー運用サーバー装置に送信するチャットボット情報送信部、をさらに具備するものであり、スマートスピーカー運用サーバー装置は、前記チャットボットポータルサーバー装置の前記チャットボット情報送信部から送信された前記チャットボット情報に含まれる特定の前記チャットボットサーバー装置の所在情報に基づいて、前記音声認識部から出力された前記質問テキストを、特定の前記チャットボットサーバー装置に送信するチャットボットサーバー転送部、をさらに具備するものである。
[4]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記スマートスピーカー運用サーバー装置は、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、をさらに具備し、前記スマートスピーカー運用サーバー装置の前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、ものである。
[5]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[6]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記スマートスピーカー運用サーバー装置は、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定するチャットボットポータルサーバー転送決定部、をさらに具備し、前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[7]また、本発明の一態様は、音声を入出力する機能を有する端末装置と、前記端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、前記端末装置から渡された質問に対する答弁を出力するチャットボットサーバー装置と、前記質問に適合する前記チャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、を用いた音声問合せ処理方法であって、前記端末装置では、音声入力部が音声による質問である質問音声を取得し、音声伝達部が、前記質問音声を前記スマートスピーカー運用サーバー装置に送信するとともに、前記質問音声に対応する答弁音声を前記スマートスピーカー運用サーバー装置から受信し、音声出力部が、前記答弁音声を音声として出力する、ものであり、前記スマートスピーカー運用サーバー装置では、音声認識部が、前記端末装置から送信された前記質問音声を質問テキストに変換し、チャットボットポータルサーバー転送部が、前記質問テキストを前記チャットボットポータルサーバー装置に送信し、答弁受信部が、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信し、音声合成部が、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する、ものであり、前記チャットボットポータルサーバー装置では、チャットボット特定用データ管理部が、複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持し、チャットボット特定部が、前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力する、ものであり、前記チャットボットサーバー装置では、答弁推論部が、前記質問テキストと前記答弁テキストとの関係について機械学習済みであるモデルを備え、外部から受信する前記質問テキストと前記モデルとから、前記質問テキストに対応する前記答弁テキストを推論し出力する、ものである。
[8]また、本発明の一態様は、上記の音声問合せ処理方法であって、前記スマートスピーカー運用サーバー装置では、第2答弁推論部が、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力し、前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換するものであり、前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[9]また、本発明の一態様は、上記の音声問合せ処理方法であって、前記スマートスピーカー運用サーバー装置では、チャットボットポータルサーバー転送決定部が、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定し、前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[10]また、本発明の一態様による音声問合せシステムは、音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、質問に適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、を含んで構成される音声問合せシステムであって、前記スマートスピーカー運用サーバー装置は、前記端末装置から送信された質問音声を質問テキストに変換する音声認識部と、前記質問テキストを前記チャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、を具備するものであり、前記チャットボットポータルサーバー装置は、複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持するチャットボット特定用データ管理部と、前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力するチャットボット特定部と、を具備するものである。
[11]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記チャットボットポータルサーバー装置は、前記チャットボット特定部によって特定された前記チャットボットサーバー装置に対して、スマートスピーカー運用サーバー装置から受信した前記質問テキストを送信する質問送信部、をさらに具備するものである。
[12]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記チャットボットポータルサーバー装置は、前記チャットボット特定部によって出力される前記チャットボット情報を、前記スマートスピーカー運用サーバー装置に送信するチャットボット情報送信部、をさらに具備するものであり、スマートスピーカー運用サーバー装置は、前記チャットボットポータルサーバー装置の前記チャットボット情報送信部から送信された前記チャットボット情報に含まれる特定の前記チャットボットサーバー装置の所在情報に基づいて、前記音声認識部から出力された前記質問テキストを、特定の前記チャットボットサーバー装置に送信するチャットボットサーバー転送部、をさらに具備するものである。
[13]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記スマートスピーカー運用サーバー装置は、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、をさらに具備し、前記スマートスピーカー運用サーバー装置の前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、ものである。
[14]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[15]また、本発明の一態様は、上記の音声問合せシステムにおいて、前記スマートスピーカー運用サーバー装置は、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定するチャットボットポータルサーバー転送決定部、をさらに具備し、前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[16]また、本発明の一態様は、音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、質問に適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、を用いた音声問合せ処理方法であって、前記スマートスピーカー運用サーバー装置では、音声認識部が、前記端末装置から送信された質問音声を質問テキストに変換し、チャットボットポータルサーバー転送部が、前記質問テキストを前記チャットボットポータルサーバー装置に送信し、答弁受信部が、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信し、音声合成部が、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する、ものであり、前記チャットボットポータルサーバー装置では、チャットボット特定用データ管理部が、複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持し、チャットボット特定部が、前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力する、ものである。
[17]また、本発明の一態様は、上記の音声問合せ処理方法において、前記スマートスピーカー運用サーバー装置では、第2答弁推論部が、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力し、前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換するものであり、前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[18]また、本発明の一態様は、上記の音声問合せ処理方法において、前記スマートスピーカー運用サーバー装置では、チャットボットポータルサーバー転送決定部が、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定し、前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[19]また、本発明の一態様によるスマートスピーカー運用サーバー装置は、音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置であって、前記端末装置から送信された質問音声を質問テキストに変換する音声認識部と、前記質問テキストを、前記質問テキストに適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、を具備するものである。
[20]また、本発明の一態様は、上記のスマートスピーカー運用サーバー装置において、前記チャットボットポータルサーバー装置から送信されるチャットボット情報に含まれる、特定の前記チャットボットサーバー装置の所在情報に基づいて、前記音声認識部から出力された前記質問テキストを、特定の前記チャットボットサーバー装置に送信するチャットボットサーバー転送部、をさらに具備する、ものである。
[21]また、本発明の一態様は、上記のスマートスピーカー運用サーバー装置において、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、をさらに具備し、前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に送信されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、ものである。
[22]また、本発明の一態様は、上記のスマートスピーカー運用サーバー装置において、前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[23]また、本発明の一態様は、上記のスマートスピーカー運用サーバー装置において、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定するチャットボットポータルサーバー転送決定部、をさらに具備し、前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、ものである。
[24]また、本発明の一態様は、コンピューターを、音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置であって、前記端末装置から送信された質問音声を質問テキストに変換する音声認識部と、前記質問テキストを、前記質問テキストに適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、を具備するスマートスピーカー運用サーバー装置として機能させるためのプログラムである。
[25]また、本発明の一態様によるチャットボットポータルサーバー装置は、複数のチャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持するチャットボット特定用データ管理部と、音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置から送信された質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力するチャットボット特定部と、を具備するものである。
[26]また、本発明の一態様は、上記のチャットボットポータルサーバー装置において、前記チャットボット特定部によって特定された前記チャットボットサーバー装置に対して、スマートスピーカー運用サーバー装置から受信した前記質問テキストを送信する質問送信部、をさらに具備する、ものである。
[27]また、本発明の一態様は、上記のチャットボットポータルサーバー装置において、前記チャットボットポータルサーバー装置は、前記チャットボット特定部によって出力される前記チャットボット情報を、前記スマートスピーカー運用サーバー装置に送信するチャットボット情報送信部、をさらに具備する、ものである。
[28]また、本発明の一態様は、コンピューターを、複数のチャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持するチャットボット特定用データ管理部と、音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置から送信された質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力するチャットボット特定部と、を具備するチャットボットポータルサーバー装置として機能させるためのプログラムである。
本発明によれば、スマートスピーカーで取得された音声による質問に対して、スマートスピーカー運用サーバー装置が持つ知識(学習モデル)だけではなく、数多くのチャットボットサーバー装置が持つ知識(学習モデル)を利用した答弁を行える。数多くのチャットボットサーバー装置それぞれが、分散して学習処理を行い、知識を蓄積することができる。スマートスピーカーは、狭い分野の詳細な事項に関する音声による質問に対しても、知識に基づいて音声で答弁することが可能と案る。
本発明の第1実施形態による音声問合せシステムの概略構成を示した構成図である。 第1実施形態によるスマートスピーカーの概略機能構成を示す機能ブロック図である。 第1実施形態によるスマートスピーカー運用サーバー装置の概略機能構成を示す機能ブロック図である。 第1実施形態によるチャットボットポータルサーバー装置の概略機能構成を示す機能ブロック図である。 第1実施形態によるチャットボットサーバー装置の概略機能構成を示す機能ブロック図である。 第1実施形態による音声問合せシステムが実現する音声による問い合わせ処理の流れを示したシーケンス図(その1)である。 第1実施形態による音声問合せシステムが実現する音声による問い合わせ処理の流れを示したシーケンス図(その2)である。 本発明の第2実施形態による音声問合せシステムの概略構成を示す構成図である。 第2実施形態によるスマートスピーカー運用サーバー装置の概略機能構成を示すブロック図である。 第2実施形態によるチャットボットポータルサーバー装置の概略機能構成を示すブロック図である。 第2実施形態による音声問合せシステムが実現する音声による問い合わせ処理の流れを示したシーケンス図(その1)である。 第2実施形態による音声問合せシステムが実現する音声による問い合わせ処理の流れを示したシーケンス図(その2)である。
[第1実施形態]
次に、本発明の実施形態について、図面を参照しながら説明する。
図1は、本実施形態による音声問合せシステムの概略構成を示す構成図である。図示するように、音声問合せシステム9は、スマートスピーカー1(端末装置)と、スマートスピーカー運用サーバー装置2と、チャットボットポータルサーバー装置3と、チャットボットサーバー装置4A,4B,4C,・・・とを含んで構成される。スマートスピーカー1を「端末装置」と呼ぶ場合もある。チャットボットサーバー装置4A,4B,4C,・・・の各々を「チャットボットサーバー装置4」と呼ぶ場合もある。
音声問合せシステム9を構成する各装置の機能は、例えば、電子回路を用いて実現される。また、各装置の機能の一部が、コンピューターおよびプログラムを用いて実現されてもよい。
示した構成図において、音声問合せシステム9は、1台のスマートスピーカー1と、1台のスマートスピーカー運用サーバー装置2と、1台のチャットボットポータルサーバー装置3と、3台のチャットボットサーバー装置4とを含んでいる。実際には、音声問合せシステム9を構成する各装置の台数は、ここに例示した台数に限定されず、任意である。
スマートスピーカー1は、ユーザーからの音声による質問を取得し、その質問に対する音声による答弁を行うものである。スマートスピーカー1は、「AIスピーカー」とも呼ばれる。なお、スマートスピーカー1は、質問に対する答弁を出力するだけでなく、ユーザーからの音声による指令を解釈し、その指令の内容を実行する場合もある。ここで、指令とは、例えば、家電製品(テレビ受像機、照明器具、パーソナルコンピューター、空調器具、調理器具等)のスイッチをオンあるいはオフしたりするものである。また、指令とは、例えば、それらの家電製品の動作を制御したりする(例えば、空調装置の設定温度を上げたり下げたりする)ものである。
スマートスピーカー運用サーバー装置2は、スマートスピーカー1が稼働するために必要な機能を提供するサーバー装置である。
チャットボットポータルサーバー装置3は、スマートスピーカー1から渡される質問の内容に応じて、あらかじめ蓄積しておいた情報(知識)に基づき、質問に適したチャットボットサーバー装置4を特定する。チャットボットポータルサーバー装置3は、特定されたチャットボットサーバー装置4の所在情報(例えば、URL(ユニフォーム・リソース・ロケーター)等)を予め記憶している。この所在情報を用いることにより、特定されたチャットボットサーバー装置4にアクセスすることが可能となる。つまり、チャットボットポータルサーバー装置3は、多数のチャットボットサーバー装置4へのポータルとして機能する。
チャットボットサーバー装置4A,4B,4C,・・・の各々は、質問を外部から受信し、受信した質問を基に最適な答弁を推定し、質問の送信元に対して推定結果である答弁を送信する。
音声問合せシステム9を構成する各装置は、通信ネットワーク(例えば、インターネットや無線LAN(ローカルエリアネットワーク)等)により相互に接続される。これにより、装置間で通信を行い、データを送受信することが可能である。各装置の内部の機能構成を次に説明する。
図2は、本実施形態におけるスマートスピーカーの概略機能構成を示す機能ブロック図である。図示するように、スマートスピーカー1は、マイクロフォン11(音声入力部)と、音声伝達部12と、スピーカー13(音声出力部)とを含んで構成される。
マイクロフォン11は、外部から音声を取得し、電気信号として出力する。マイクロフォン11は、取得した音声の信号を音声伝達部12に渡す。
マイクロフォン11を、「音声入力部」とも呼ぶ。
音声伝達部12は、マイクロフォン11から渡された音声を、スマートスピーカー運用サーバー装置2に送信する。このとき、音声伝達部12は、適宜、音声を符号化して送信する。また、音声伝達部12は、スマートスピーカー運用サーバー装置2から音声を受信し、受信した音声をスピーカー13に渡す。このとき、音声伝達部12は、適宜、音声を復号してスピーカー13に渡す。
スピーカー13は、音声伝達部12から電気信号として渡された音声を、空気等の媒体の振動として外部に出力する。スピーカー13は、空気を振動させるタイプのものの他に、例えば、骨伝導タイプのスピーカー等であってもよい。
スピーカー13を、「音声出力部」とも呼ぶ。
上記の構成により、スマートスピーカー1は、例えばユーザーが音声として発話した質問を、スマートスピーカー運用サーバー装置2に送る。また、スマートスピーカー1は、スマートスピーカー運用サーバー装置2から、音声信号による答弁を受け取り、音声として出力する。この答弁は、スマートスピーカー運用サーバー装置2に送った質問に対応する答弁である。つまり、マイクロフォン11から音声伝達部12に渡される音声の内容は質問であり、音声伝達部12からスピーカー13に渡される音声の内容はその質問に対する答弁である。
スマートスピーカー1自体の機能は従来技術により実現される。本実施形態の従来にない特徴は、質問に対する最適な答弁を導出するためのバックボーン側、即ち、スマートスピーカー運用サーバー装置2と、チャットボットポータルサーバー装置3と、チャットボットサーバー装置4との機能の組み合わせにある。
図3は、本実施形態におけるスマートスピーカー運用サーバー装置の概略機能構成を示す機能ブロック図である。図示するように、スマートスピーカー運用サーバー装置2は、音声受信部21と、音声認識部22と、答弁推論部23と、チャットボットポータルサーバー転送決定部24と、チャットボットポータルサーバー転送部25と、答弁受信部26と、音声合成部27と、音声送信部28とを含んで構成される。
なお、答弁推論部23を「第2答弁推論部」と呼んでもよい。
音声受信部21は、スマートスピーカー1から音声を受信する。音声受信部21は、受信した音声を音声認識部22に渡す。
音声認識部22は、音声受信部21から渡された音声をテキストに変換して出力する。即ち、音声認識部22は音声認識処理を行う。音声認識部22は、音声認識の結果であるテキスト(質問)(「質問テキスト」とも呼ぶ)を答弁推論部23に渡す。
答弁推論部23は、音声認識部22からテキスト(質問)を受け取る。答弁推論部23は、そのテキストを基に、予め蓄積された知識を用いて、適切な答弁を推論する。答弁推論部23は、答弁を推論するために、AI(人工知能)の手法を用いる。つまり、答弁推論部23は、質問と答弁の関係について学習済みのモデル(第2モデル)を記憶しており、音声認識部から渡されるテキスト(質問)にそのモデルを適用することによって、推論結果であるテキスト(答弁)(「答弁テキスト」とも呼ぶ。特に、答弁推論部23による推論結果である「テキスト(答弁)」を「第2答弁テキスト」とも呼ぶ。)を出力する。答弁推論部23は、推論結果であるテキスト(答弁)をチャットボットポータルサーバー転送決定部24に渡す。答弁推論部23は、テキスト(答弁)とともに、テキスト(答弁)の適合度を表す数値データをあわせてチャットボットポータルサーバー転送決定部24に渡してもよい。適合度は、推論の処理の過程で得られるものであり、テキスト(答弁)がテキスト(質問)に適合している度合いを表す。機械学習済みのモデルに基づいてテキスト(答弁)の推論処理を行うとき、答弁推論部23は、複数のテキスト(答弁)の候補それぞれについて、適合度を算出する。
この答弁推論部23自体の機能は、従来技術によって実現可能である。
チャットボットポータルサーバー転送決定部24は、答弁推論部23からテキスト(答弁)を受け取り、テキスト(質問)をチャットボットポータルサーバー装置3に転送するか否かを決定する。一例として、チャットボットポータルサーバー転送決定部24は、答弁推論部23から渡されるテキスト(答弁)の適合度と所定の閾値とを比較する。テキスト(答弁)の適合度がその閾値よりも低い場合(閾値未満である場合)に、テキスト(質問)をチャットボットポータルサーバー装置3に転送するよう決定する。テキスト(答弁)の適合度が当該閾値以上である場合には、チャットボットポータルサーバー転送決定部24は、テキスト(質問)をチャットボットポータルサーバー装置3に転送(送信)しないよう決定する。即ち、この場合、チャットボットポータルサーバー転送決定部24は、チャットボットポータルサーバー転送部25に、テキスト(質問)をチャットボットポータルサーバー装置3に転送することを抑止させる。テキスト(質問)をチャットボットポータルサーバー装置1に転送しないよう決定した場合には、チャットボットポータルサーバー転送決定部24は、答弁推論部23から出力されたテキスト(答弁)を音声合成部27に渡す。つまり、答弁推論部23から出力されたテキスト(答弁)の適合度が当該閾値以上である場合には、答弁推論部23から出力されたテキスト(答弁)が、そのまま、スマートスピーカー1側への応答のために用いられる。
チャットボットポータルサーバー転送部25は、上記のチャットボットポータルサーバー転送決定部24がテキスト(質問)をチャットボットポータルサーバー装置3に転送することを決定した場合に、テキスト(質問)をチャットボットポータルサーバー装置3に転送する。また、チャットボットポータルサーバー転送部25は、上記のチャットボットポータルサーバー転送決定部24がテキスト(質問)をチャットボットポータルサーバー装置3に転送(送信)しないよう決定した場合に、テキスト(質問)をチャットボットポータルサーバー装置3に転送することを抑止する。
答弁受信部26は、チャットボットポータルサーバー装置3からテキスト(答弁)を受信する。このテキスト(答弁)は、チャットボットポータルサーバー転送部25が送信したテキスト(質問)に対応してチャットボットポータルサーバー装置3から送信されるものである。
上記のチャットボットポータルサーバー転送決定部24は、答弁受信部26がチャットボットポータルサーバー装置3から受信したテキスト(答弁)を音声合成部27に渡す。ただし、テキスト(質問)をチャットボットポータルサーバー装置3に転送しないことを決定した場合には、チャットボットポータルサーバー転送決定部24は、答弁推論部23から出力されたテキスト(答弁)を音声合成部27に渡す。
音声合成部27は、チャットボットポータルサーバー転送決定部24から渡されたテキスト(答弁)を基に音声を合成する。言い換えれば、音声合成部27は、テキスト(答弁)を音声(答弁)(「答弁音声」とも呼ぶ)に変換する。テキストに基づく音声合成の処理自体は、既存の技術を用いて実現可能である。
音声送信部28は、音声合成部27によって合成された音声(答弁)を、元の音声(質問)(「質問音声」とも呼ぶ)を送信してきたスマートスピーカー1に送信する。これにより、当該音声(答弁)は、スマートスピーカー1側で音声として出力される。
図4は、本実施形態におけるチャットボットポータルサーバー装置の概略機能構成を示す機能ブロック図である。図示するように、チャットボットポータルサーバー装置3は、質問受信部31と、チャットボット特定部32と、チャットボット特定用データ管理部33と、質問送信部34と、答弁受信部35と、答弁送信部36とを含んで構成される。
質問受信部31は、スマートスピーカー運用サーバー装置2から、テキスト(質問)を受信する。質問受信部31は、受信したテキスト(質問)をチャットボット特定部32に渡す。
チャットボット特定部32は、チャットボット特定用データ管理部33が保持する情報を参照することによって、質問受信部31から渡されたテキスト(質問)に適したチャットボットサーバー装置4を特定する。チャットボット特定部32は、特定したチャットボットサーバー装置4の所在情報を、チャットボット特定用データ管理部33から取得する。そして、チャットボット特定部32は、質問受信部31から渡されたテキスト(質問)と、特定されチャットボットサーバー装置4の所在情報とを、質問送信部34に渡す。
より具体的には、チャットボット特定部32は、質問受信部31から渡されたテキスト(質問)の形態素解析処理を行うことによって、テキスト(質問)に含まれる単語の分布を表すベクトル情報を生成する。また、必要に応じて、チャットボット特定部32は、当該テキスト(質問)の構文解析処理を行うことによって、テキスト(質問)に対応する構文木を生成する。そして、チャットボット特定部32は、これらの解析結果(単語の分布を表すベクトルや、構文木)と、チャットボット特定用データ管理部33が保持する、チャットボットサーバー装置4ごとの特徴を表すデータとの適合度を算出する。そして、チャットボット特定部32は、当該テキスト(質問)に対して適合度の高い(例えば、適合度の最も高い)チャットボットサーバー装置4を特定する。一例として、テキスト(質問)は、「渋谷 〇〇食堂のチャーシュー麺の価格は?」などといったものである。なお、チャットボット特定部32は、特定されたチャットボットサーバー装置4の所在情報(URL等)を、チャットボット特定用データ管理部33から読み取る。
チャットボット特定用データ管理部33は、チャットボット特定部32がチャットボットサーバー装置4を特定するために必要な情報を保持し、管理する。個々のチャットボットサーバー装置4は、例えば、企業や、公共機関や、個々の店舗等によって運営される。チャットボット特定用データ管理部33は、チャットボットサーバー装置4は、それらの企業や公共機関や店舗等の特徴を表す用語あるいは文等のデータを保持する。例えば、チャットボット特定用データ管理部33は、企業や公共機関や店舗等の特徴を表す用語として、企業名称、機関名称、店舗名称、所在地情報(住所等)や、業種を表す情報や、提供される商品あるいはサービス等の内容を表す情報を保持する。例えば、チャットボット特定用データ管理部33は、レストランに関して、名称、所在地、電話番号、地域名、料理のメニュー、店の特徴、店主名、シェフ名、営業時間帯、営業日および休業日(曜日等)等の情報を保持する。例えば、チャットボット特定用データ管理部33は、航空会社に関して、会社名称、フライトの発着地(地名、空港名)、便名、フライトに関するサービス内容、フライトの予約に関する情報、チケットのディスカウントに関する情報等を保持する。
なお、チャットボット特定用データ管理部33は、個々のチャットボットサーバー装置4にアクセスするための所在情報(URL等)をも保持し、チャットボット特定部32に提供する。
また、チャットボット特定用データ管理部33は、インターネットの巡回ロボットの技術等を用いて、チャットボットサーバー装置4に関する情報を、適宜、取得し、自己が管理する情報を更新する。
このように、チャットボット特定用データ管理部33は、チャットボットサーバー装置4ごとの特徴を表す情報を保持し、必要に応じて更新する。これにより、チャットボット特定用データ管理部33の情報を参照するチャットボット特定部32は、テキスト(質問)によく適合するチャットボットサーバー装置4を特定することが可能となる。
質問送信部34は、チャットボット特定部32から、対象としているテキスト(質問)と、特定されたチャットボットサーバー装置4の所在情報とを、受け取る。質問送信部34は、当該チャットボットサーバー装置4にアクセスし、受け取ったテキスト(質問)をそのチャットボットサーバー装置4に送信する。
答弁受信部35は、チャットボットサーバー装置4から、テキスト(答弁)を受信する。このテキスト(答弁)は、質問送信部34が送信したテキスト(質問)に対応してチャットボットサーバー装置4側から送信されたものである。答弁受信部35は、受信したテキスト(答弁)を答弁送信部36に渡す。
答弁送信部36は、答弁受信部35からテキスト(答弁)を受け取る。答弁送信部36は、そのテキスト(答弁)を、スマートスピーカー運用サーバー装置2に送信する。答弁送信部36は、テキスト(答弁)をスマートスピーカー運用サーバー装置2に送信する際に、対応する元のテキスト(質問)と関連付けるための情報を付加してもよい。
図5は、本実施形態におけるチャットボットサーバー装置の概略機能構成を示す機能ブロック図である。図示するように、チャットボットサーバー装置4は、質問受信部41と、答弁推論部42と、答弁送信部43とを含んで構成される。
質問受信部41は、外部の装置から、テキスト(質問)を受信する。質問受信部41は、受信したテキスト(質問)を、答弁推論部42に渡す。本実施形態において、質問受信部41は、チャットボットポータルサーバー装置3からテキスト(質問)を受信する。
答弁推論部42は、質問受信部41からテキスト(質問)を受け取る。答弁推論部42は、そのテキストを基に、予め蓄積された知識を用いて、適切な答弁を推論する。答弁推論部42は、答弁を推論するために、AI(人工知能)の手法を用いる。つまり、答弁推論部42は、既に説明した答弁推論部23(スマートスピーカー運用サーバー装置2)と同様の、あるいは類似の技術を用いて、推論処理を行う。なお、答弁推論部42は、当該チャットボットサーバー装置4用の学習データを用いて予め学習して置いたモデルを用いた推論を行う。答弁推論部23は、推論結果であるテキスト(答弁)を出力する。答弁推論部23は、推論結果であるテキスト(答弁)を答弁送信部43に渡す。
この答弁推論部23自体の機能は、従来技術によって実現可能である。
答弁送信部43は、答弁推論部42から渡されたテキスト(答弁)を、外部の装置に送信する。本実施形態において、答弁送信部43は、当該テキスト(答弁)をチャットボットポータルサーバー装置3に返送する。
次に、音声問合せシステム9の全体における処理の流れを説明する。
図6および図7は、本実施形態による音声問合せシステム9が実現する音声による問い合わせ処理の流れを示したシーケンス図である。以下、このシーケンス図に沿ってその手順を説明する。
まず図6のステップS1において、スマートスピーカー1は、ユーザーの発話である音声を取得する。この音声の内容は、所定の分野に関する質問である。
ステップS2において、スマートスピーカー1は、ステップS1で取得した音声(質問)を、スマートスピーカー運用サーバー装置2に送信する。スマートスピーカー運用サーバー装置2は、この音声(質問)を受信する。
ステップS3において、スマートスピーカー運用サーバー装置2は、音声(質問)の音声認識処理を行う。これにより、スマートスピーカー運用サーバー装置2は、音声(質問)をテキスト(質問)に変換する。
ステップS4において、スマートスピーカー運用サーバー装置2は、ステップS3で得られたテキスト(質問)に基づいて、推論処理を行い、テキスト(質問)に対応するテキスト(答弁)を求める。
ステップS5において、スマートスピーカー運用サーバー装置2は、例えばテキスト(質問)とテキスト(答弁)との間の適合度等に基づいて、テキスト(質問)をチャットボットポータルサーバー装置3に転送するか否かを決定する。
ここで、スマートスピーカー運用サーバー装置2がテキスト(質問)をチャットボットポータルサーバー装置3に転送する場合には、引き続き、次のステップS6からの処理を行う。一方、スマートスピーカー運用サーバー装置2がテキスト(質問)をチャットボットポータルサーバー装置3に転送しない場合(つまり、スマートスピーカー運用サーバー装置2自身の推論結果である答弁をスマートスピーカー1に返す場合)には、ステップS6からS11までの処理をスキップして、ステップS12の処理に移る。
ステップS6において、スマートスピーカー運用サーバー装置2は、テキスト(質問)を、チャットボットポータルサーバー装置3に送信する。チャットボットポータルサーバー装置3は、このテキスト(質問)を受信する。
ステップS7において、チャットボットポータルサーバー装置3は、受信したテキスト(質問)に対応する、最適なチャットボットサーバー装置4を特定する。チャットボットポータルサーバー装置3は、特定されたチャットボットサーバー装置4の所在情報を用いて当該チャットボットサーバー装置4にアクセスすることができる。
ステップS8において、チャットボットポータルサーバー装置3は、ステップS8で受信したテキスト(質問)を、特定されたチャットボットサーバー装置4に送信する。チャットボットサーバー装置4は、このテキスト(質問)を受信する。
ステップS9において、ステップS8で受信したテキスト(質問)に基づき、返すべきテキスト(答弁)を推論する。
次に図7に移り、ステップS10において、チャットボットサーバー装置4は、ステップS9における推論処理の結果として得られたテキスト(答弁)を、チャットボットポータルサーバー装置3に送信する。チャットボットポータルサーバー装置3は、このテキスト(答弁)を受信する。
ステップS11において、チャットボットポータルサーバー装置3は、上のステップS10で受信したテキスト(答弁)を、スマートスピーカー運用サーバー装置2に送信する。スマートスピーカー運用サーバー装置2は、このテキスト(答弁)を受信する。
ステップS12において、スマートスピーカー運用サーバー装置2は、得られたテキスト(答弁)を基に、音声合成処理を行う。この処理によって生成される音声は、テキスト(答弁)を読み上げた音声である。なお、音声合成の処理の基となるテキスト(答弁)は、スマートスピーカー運用サーバー装置2が、ステップS4で推論したことによって得られたテキスト(答弁)、あるいはステップS11で受信して得られたテキスト(答弁)である。スマートスピーカー運用サーバー装置2は、テキスト(質問)をステップS6でチャットボットポータルサーバー装置3に転送した場合には、チャットボットポータルサーバー装置3から返されるテキスト(答弁)を基に音声合成処理を行う。スマートスピーカー運用サーバー装置2は、テキスト(質問)をステップS6でチャットボットポータルサーバー装置3に転送しなかった場合には、ステップS4の処理で得られたテキスト(答弁)を基に音声合成処理を行う。
ステップS13において、チャットボットポータルサーバー装置3は、ステップS12で生成した音声(答弁)を、スマートスピーカー1に送信する。スマートスピーカー1は、この音声(答弁)を受信する。
ステップS14において、スマートスピーカー1は、ステップS13で受信した音声(答弁)を再生出力する。これにより、スマートスピーカー1のユーザーは、ステップS1において発話した音声(質問)に対応する音声(答弁)を聴くことができる。
以上説明したように、本実施形態によれば、スマートスピーカー運用サーバー装置2は、テキスト(質問)をチャットボットポータルサーバー装置3に転送する。チャットボットポータルサーバー装置3は、当該テキスト(質問)に適合するチャットボットサーバー装置4を特定する。チャットボットポータルサーバー装置3は、特定されたチャットボットサーバー装置4に、テキスト(質問)を転送する。そして、そのチャットボットサーバー装置4によって推論された結果のテキスト(答弁)をスマートスピーカー1から音声として出力できる。
[第2実施形態]
次に、本発明の第2実施形態について説明する。なお、前実施形態において既に説明した事項については以下において説明を省略する場合がある。ここでは、本実施形態に特有の事項を中心に説明する。
図8は、本実施形態による音声問合せシステムの概略構成を示す構成図である。図示するように、音声問合せシステム109は、スマートスピーカー1と、スマートスピーカー運用サーバー装置102と、チャットボットポータルサーバー装置103と、チャットボットサーバー装置4A,4B,4C,・・・(チャットボットサーバー装置4)とを含んで構成される。
これらのうち、スマートスピーカー1とチャットボットサーバー装置4とは、第1実施形態で説明したそれらと同等の機能を有するものである。一方、スマートスピーカー運用サーバー装置102と、チャットボットポータルサーバー装置103とは、本実施形態に特有の機能を含み、本実施形態に特有の処理を実行し得るものである。
スマートスピーカー1とチャットボットサーバー装置4とのそれぞれの内部の機能構成については、第1実施形態のそれと同様であるため、ここでの詳細な説明を省略する。
スマートスピーカー運用サーバー装置102は、スマートスピーカー1が稼働するために必要な機能を提供するサーバー装置である。第1実施形態におけるスマートスピーカー運用サーバー装置2は、テキスト(質問)をチャットボットポータルサーバー装置3に送信した場合に、そのテキスト(質問)に対応するテキスト(答弁)をチャットボットポータルサーバー装置3から受信していた。これに対して、本実施形態におけるスマートスピーカー運用サーバー装置102は、チャットボットポータルサーバー装置103に送信したテキスト(質問)に対応する、チャットボットサーバー装置4の所在情報を、チャットボットポータルサーバー装置103から受信する。そして、スマートスピーカー運用サーバー装置102は、そのチャットボットサーバー装置4の所在情報を用いて、テキスト(質問)を当該チャットボットサーバー装置4に送信する。そして、そのテキスト(質問)に対応するテキスト(答弁)を、当該チャットボットサーバー装置4から受信する。スマートスピーカー運用サーバー装置102の機能のその他の点は、第1実施形態におけるスマートスピーカー運用サーバー装置2と同様(または類似)である。
チャットボットポータルサーバー装置103は、スマートスピーカー1から渡される質問の内容に応じて、あらかじめ蓄積しておいた情報(知識)に基づき、質問に適したチャットボットサーバー装置4を特定する。第1実施形態におけるチャットボットポータルサーバー装置3は、テキスト(質問)に適したチャットボットサーバー装置4に対して、そのテキスト(質問)を送信していた。これに対して、本実施形態におけるチャットボットポータルサーバー装置103は、特定したチャットボットサーバー装置4の所在情報をスマートスピーカー運用サーバー装置102に返す。これにより、スマートスピーカー運用サーバー装置102は、特定されたチャットボットサーバー装置4にアクセスできるようになる。本実施形態において、チャットボットポータルサーバー装置103自身は、チャットボットサーバー装置4からテキスト(答弁)を受信したり、そのテキスト(答弁)をスマートスピーカー運用サーバー装置102に転送したりすることもない。本実施形態においても、チャットボットポータルサーバー装置103は、多数のチャットボットサーバー装置4へのポータルとして機能する。
図9は、本実施形態によるスマートスピーカー運用サーバー装置の概略機能構成を示すブロック図である。図示するように、スマートスピーカー運用サーバー装置102は、音声受信部21と、音声認識部22と、答弁推論部23と、チャットボットポータルサーバー転送決定部124と、チャットボットポータルサーバー転送部125と、チャットボットサーバー転送部126と、音声合成部27と、音声送信部28とを含んで構成される。これらの各部のうち、音声受信部21と、音声認識部22と、答弁推論部23と、音声合成部27と、音声送信部28の機能は、第1実施形態におけるそれらと同等のものであるので、これら各部の機能についての詳細な説明を省略する。チャットボットポータルサーバー転送決定部124と、チャットボットポータルサーバー転送部125と、チャットボットサーバー転送部126のそれぞれは、本実施形態に特有の機能を含み、特有の処理を実行する。各部の機能は、次に説明する通りである。
チャットボットポータルサーバー転送決定部124は、答弁推論部23からテキスト(答弁)を受け取り、テキスト(質問)をチャットボットポータルサーバー装置103に転送するか否かを決定する。第1実施形態と同様に、チャットボットポータルサーバー転送決定部124は、答弁推論部23から渡されるテキスト(答弁)の適合度と所定の閾値とを比較する。テキスト(答弁)の適合度が所定の閾値よりも低い場合に、テキスト(質問)をチャットボットポータルサーバー装置103に転送するよう決定する。また、テキスト(答弁)の適合度が当該閾値以上である場合には、チャットボットポータルサーバー転送決定部124は、テキスト(質問)をチャットボットポータルサーバー装置103に転送しないよう決定する。テキスト(質問)をチャットボットポータルサーバー装置103に転送しないよう決定した場合には、チャットボットポータルサーバー転送決定部124は、答弁推論部23から出力されたテキスト(答弁)を音声合成部27に渡す。即ち、答弁推論部23から出力されたテキスト(答弁)の適合度が前記閾値以上である場合には、答弁推論部23から出力されたテキスト(答弁)が、そのまま、スマートスピーカー1側への応答のために用いられる。
第1実施形態の場合と異なり、チャットボットポータルサーバー転送決定部124は、チャットボットポータルサーバー転送部125にテキスト(質問)を渡した場合、そのテキスト(質問)に対応するチャットボットサーバー装置4の所在情報を受け取る。そして、チャットボットポータルサーバー転送決定部124は、テキスト(質問)と、チャットボットサーバー装置4の所在情報とを、チャットボットサーバー転送部126に渡す。そして、チャットボットポータルサーバー転送決定部124は、当該テキスト(質問)に対応するテキスト(答弁)を、チャットボットサーバー転送部126から受け取る。以後は、第1実施形態の場合と同様に、チャットボットポータルサーバー転送決定部124は、答弁推論部23から受け取ったテキスト(答弁)またはチャットボットサーバー転送部126から受け取ったテキスト(答弁)のいずれかを、音声合成部27に渡す。
チャットボットポータルサーバー転送部125は、上記のチャットボットポータルサーバー転送決定部124がテキスト(質問)をチャットボットポータルサーバー装置103に転送することを決定した場合に、テキスト(質問)をチャットボットポータルサーバー装置103に送信する。そして、チャットボットポータルサーバー転送部125は、送信したテキスト(質問)に対応するチャットボットサーバー装置4の所在情報を、チャットボットポータルサーバー装置103から受け取る。
チャットボットポータルサーバー転送部125は、一方、上記のチャットボットポータルサーバー転送決定部124がテキスト(質問)をチャットボットポータルサーバー装置103に転送しないよう決定した場合に、テキスト(質問)をチャットボットポータルサーバー装置103に送信することを抑止する。
チャットボットサーバー転送部126は、チャットボットポータルサーバー転送決定部124から、前述のテキスト(質問)と、このテキスト(質問)に対応するチャットボットサーバー装置4の所在情報を受け取る。そして、チャットボットサーバー転送部126は、このチャットボットサーバー装置4の所在情報を用いて、チャットボットサーバー装置4にアクセスする。そして、チャットボットサーバー転送部126は、当該チャットボットサーバー装置4に対して、テキスト(質問)を送信する。そして、チャットボットサーバー転送部126は、このテキスト(質問)への応答であるテキスト(答弁)を、チャットボットサーバー装置4から受信する。チャットボットサーバー転送部126は、受信したテキスト(答弁)を、チャットボットポータルサーバー転送決定部124に渡す。
なお、チャットボットサーバー転送部126は、テキスト(答弁)をチャットボットサーバー装置4から受信するものであるため、「答弁受信部」とも呼ばれる。
図10は、本実施形態によるチャットボットポータルサーバー装置の概略機能構成を示すブロック図である。図示するように、チャットボットポータルサーバー装置103は、質問受信部31と、チャットボット特定部132と、チャットボット特定用データ管理部33と、チャットボット情報送信部137とを含んで構成される。これらのうち、質問受信部31および チャットボット特定用データ管理部33の機能は、第1実施形態におけるそれと同様のものであるので、ここでは、詳細な説明を省略する。一方、チャットボット特定部132は、本実施形態に特有の機能を含む。また、チャットボット情報送信部137は、第1実施形態にはなかった機能である。
チャットボット特定部132は、チャットボット特定部32は、チャットボット特定用データ管理部33が保持する情報を参照することによって、質問受信部31から渡されたテキスト(質問)に適したチャットボットサーバー装置4を特定する。具体的には、チャットボット特定部132は、第1実施形態のチャットボット特定部32と同様の方法を用いて、チャットボットサーバー装置4を特定する。本実施形態において、チャットボットポータルサーバー装置103は、テキスト(質問)をチャットボットサーバー装置4に送信しない。チャットボット特定部132は、特定されたチャットボットサーバー装置4の情報を、チャットボット情報送信部137に渡す。
チャットボット情報送信部137は、チャットボット特定部132からチャットボット情報を受け取る。このチャットボット情報は、特定のチャットボットサーバー装置4にアクセスするために必要な情報を含む。チャットボット情報送信部137は、受け取ったチャットボット情報を、スマートスピーカー運用サーバー装置102に送信する。これにより、スマートスピーカー運用サーバー装置102は、特定されたチャットボットサーバー装置4にアクセスできるようになる。
次に、音声問合せシステム109の全体における処理の流れを説明する。
図11および図12は、本実施形態による音声問合せシステム109における、音声による問い合わせ処理の流れを示したシーケンス図である。以下、このシーケンス図に沿ってその手順を説明する。
まず図11のステップS101からステップS107までの処理の流れは、図6(第1実施形態)に示したステップS101からステップS107までの処理の流れと同様であるため、ここでの説明を省略する。
図11のステップS108において、チャットボットポータルサーバー装置103は、特定されたチャットボットサーバー装置4の所在情報等を含むチャットボット情報を、スマートスピーカー運用サーバー装置102に送信する。スマートスピーカー運用サーバー装置102は、このチャットボット情報を受信する。このチャットボット情報を用いることにより、スマートスピーカー運用サーバー装置102は、特定のチャットボットサーバー装置4にアクセスすることが可能となる。
ステップS109において、スマートスピーカー運用サーバー装置102は、ステップS103で得られているテキスト(質問)を、当該チャットボットサーバー装置4に送信する。チャットボットサーバー装置4は、このテキスト(質問)を受信する。
図12に移って、ステップS110において、チャットボットサーバー装置4は、ステップS109で受信したテキスト(質問)に基づいて、最適な答弁を推論する。推論の結果として、チャットボットサーバー装置4は、テキスト(答弁)を得る。
ステップS111において、チャットボットサーバー装置4は、ステップS110の推論処理で得られたテキスト(答弁)を、スマートスピーカー運用サーバー装置102に送信する。スマートスピーカー運用サーバー装置102は、このテキスト(答弁)を受信する。
ステップS112において、スマートスピーカー運用サーバー装置102は、テキスト(答弁)を基に音声合成処理を行う。ここで用いられるテキスト(答弁)は、ステップS104における推論結果としてられたテキスト、またはステップS110における推論結果としてられたテキストのいずれか一方である。チャットボットサーバー装置4が呼ばれた場合には、ステップS110においてチャットボットサーバー装置4が出力したテキスト(答弁)が用いられる。ステップS112の処理のその他の点は、図7(第1実施形態)のステップS12の処理と同様であるため、ここでは詳細な説明を省略する。
ステップS113およびステップS114における処理は、図7(第1実施形態)のステップS13およびステップS14の処理とそれぞれ同様であるため、ここでは詳細な説明を省略する。
以上説明したように、本実施形態によれば、スマートスピーカー運用サーバー装置102は、テキスト(質問)をチャットボットポータルサーバー装置103に転送する。チャットボットポータルサーバー装置103は、当該テキスト(質問)に適合するチャットボットサーバー装置4を特定する。チャットボットポータルサーバー装置103は、特定されたチャットボットサーバー装置4の情報をスマートスピーカー運用サーバー装置102に渡す。スマートスピーカー運用サーバー装置102は、受け取ったチャットボットサーバー情報に基づいて、チャットボットポータルサーバー装置103によって特定されたチャットボットサーバー装置4にテキスト(質問)を送信する。そして、そのチャットボットサーバー装置4によって推論された結果のテキスト(答弁)をスマートスピーカー1から音声として出力できる。
[変形例]
以上、複数の実施形態について説明したが、さらにそれらの変形例を実施してもよい。以下で変形例について説明する。なお、組み合わせることによって矛盾等が生じない限り、複数の変形例を組み合わせて実施するようにしてもよい。
[第1変形例]
スマートスピーカー1の代わりに、他の装置を同等の位置づけの装置として用いてもよい。例えば、PC(パーソナルコンピューター)や、スマートフォン(スマホ)や、タブレット端末や、スマートウォッチ(腕時計型情報端末装置)や、その他のウェアラブル端末等を、スマートスピーカー1の代替手段として用いてもよい。この場合、これらの代替手段である装置(デバイス)が、既に述べたスマートスピーカー1の機能を有するものとして実施する。
[第2変形例]
第1実施形態および第2実施形態のそれぞれにおいて、スマートスピーカー運用サーバー装置(2,102)が答弁推論部23を持たない、あるいは答弁推論部が機能しないようにしてもよい。この場合、スマートスピーカー運用サーバー装置(2,102)は、テキスト(質問)を基にテキスト(答弁)を推論する処理を行わない。本変形例では、スマートスピーカー運用サーバー装置(2,102)から直接的あるいは間接的に呼び出されたチャットボットサーバー装置4のみが、テキスト(質問)に基づいてテキスト(答弁)を推論する。したがって、スマートスピーカー運用サーバー装置(2,102)内の音声合成部27は、必ず、チャットボットサーバー装置4側から送信されたテキスト(答弁)に基づいて音声合成処理を行う。
[第3変形例]
第1実施形態および第2実施形態のそれぞれにおいて、チャットボットポータルサーバー装置(3,103)がテキスト(質問)に対して適合度の高いチャットボットサーバー装置4を特定することができない場合に、スマートスピーカー運用サーバー装置2の答弁推論部23によって推論された結果であるテキスト(答弁)を、音声合成部27によって音声化するようにしてもよい。例えば、チャットボットポータルサーバー装置(3,103)の処理として、テキスト(質問)とチャットボットサーバー装置4との間の適合度の最大値が所定の閾値に満たない場合に、上記のように、チャットボットサーバー装置4を呼び出すことなく、答弁推論部23の推論結果を音声化して、スマートスピーカー1に送信するようにする。
[第4変形例]
第1実施形態および第2実施形態のそれぞれにおいて、チャットボットポータルサーバー装置(3,103)がテキスト(質問)に対して適合度の高いチャットボットサーバー装置4を特定することができない場合に、スマートスピーカー運用サーバー装置(2,102)は、適切なチャットボットサーバー装置4が存在しないことを示す情報を、スマートスピーカー1側に返すようにしてもよい。例えば、チャットボットポータルサーバー装置(3,103)の処理として、テキスト(質問)とチャットボットサーバー装置4との間の適合度の最大値が所定の閾値に満たない場合に、上記のように、適切なチャットボットサーバー装置4が存在しないことを表す情報(例えば、音声)を、スマートスピーカー運用サーバー装置(2,102)からスマートスピーカー1に返すようにする。
[第5変形例]
第1実施形態および第2実施形態では、スマートスピーカー運用サーバー装置(2,102)内で、音声認識処理(音声認識部22)および音声合成処理(音声合成部27)を行っていた。それを代替する方法として、音声認識処理または音声合成処理の少なくともいずれか一方を、スマートスピーカー1側で行うようにしてもよい。音声認識処理をスマートスピーカー1側で行う場合、スマートスピーカー1は、音声ではなくテキスト(質問)をスマートスピーカー運用サーバー装置(2,102)に対して送信する。音声合成処理をスマートスピーカー1側で行う場合、スマートスピーカー1は、音声ではなくテキスト(答弁)をスマートスピーカー運用サーバー装置(2,102)から受信する。
以上の複数の実施形態(変形例を含む)をまとめると、下記の通りである。
音声問合せシステムは、スマートスピーカー(1,端末装置)と、スマートスピーカー運用サーバー装置(2,102)と、チャットボットポータルサーバー装置(3,103)と、チャットボットサーバー装置(4)とを含んで構成される。この構成のうち、スマートスピーカー運用サーバー装置(2,102)と、チャットボットポータルサーバー装置(3,103)のみで構成されるシステムを「音声問合せシステム」と呼んでもよい。
スマートスピーカー(1,端末装置)は、音声を入出力する機能を有する。これにより、ユーザーは質問等の音声をスマートスピーカー1に投げかけ、その質問に対する答弁等の音声をスマートスピーカー(1)から聞き取ることができる。スマートスピーカー(1)は、マイクロフォン(11,音声入力部)と、音声伝達部12と、スピーカー(13,音声出力部)とを含む。
マイクロフォン(11)は、音声による質問である質問音声を取得する。
音声伝達部(12)は、前記質問音声を前記スマートスピーカー運用サーバー装置(2,102)に送信するとともに、前記質問音声に対応する答弁音声を前記スマートスピーカー運用サーバー装置(2,102)から受信する。
スピーカー(13)は、前記答弁音声を音声として出力する。
スマートスピーカー運用サーバー装置(2,102)は、前記端末装置(1)を稼働させるための機能を実行する。
スマートスピーカー運用サーバー装置(2,102)は、音声認識部(22)と、チャットボットポータルサーバー転送部(25,125)と、答弁受信部(26,チャットボットサーバー転送部126)と、音声合成部(27)とを含む。
音声認識部(22)は、前記端末装置(1)から送信された前記質問音声を質問テキストに変換する。
チャットボットポータルサーバー転送部(25,125)は、前記質問テキストを前記チャットボットポータルサーバー装置(3,103)に送信する。
答弁受信部(26,126)は、前記チャットボットポータルサーバー装置(3,103)に送信された前記質問テキストに対応する答弁テキストを受信する。
音声合成部(27)は、前記答弁受信部(26)が受信した前記答弁テキストを答弁音声に変換する。
チャットボットポータルサーバー装置(3,103)は、前記質問に適合する前記チャットボットサーバー装置(4)を特定するための処理を行う。
チャットボットポータルサーバー装置(3,103)は、チャットボット特定用データ管理部(33)と、チャットボット特定部(32,132)とを含む。
チャットボット特定用データ管理部(33)は、複数の前記チャットボットサーバー装置(4)について、前記チャットボットサーバー装置(4)ごとの特徴を表すデータを保持する。
チャットボット特定部(32,132)は、前記スマートスピーカー運用サーバー装置(2,102)から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部(33)が保持する前記チャットボットサーバー装置(4)ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置(4)を特定する。また、チャットボット特定部(32,132)は、特定された前記チャットボットサーバー装置(4)の所在を表す所在情報を含んだチャットボット情報を出力する。
これにより、チャットボット特定部(32,132)が出力したチャットボット情報を用いて、質問テキストが、特定されたチャットボットサーバー装置(4)に送信され得る。
チャットボットサーバー装置(4)は、前記端末装置(1)から渡された質問に対する答弁を出力する。
チャットボットサーバー装置(4)は、答弁推論部(42)を含む。
答弁推論部(42)は、前記質問テキストと前記答弁テキストとの関係について機械学習済みであるモデルを備え、外部から受信する前記質問テキストと前記モデルとから、前記質問テキストに対応する前記答弁テキストを推論し出力する。
チャットボットポータルサーバー装置(3)は、質問送信部(34)をさらに備えてもよい。
質問送信部(34)は、前記チャットボット特定部(32)によって特定された前記チャットボットサーバー装置(4)に対して、スマートスピーカー運用サーバー装置(2)から受信した前記質問テキストを送信する。このとき、質問送信部(34)は、チャットボット特定部(32)が出力したチャットボット情報から、質問テキストの送信先であるチャットボットサーバー装置(4)の所在情報を得る。
チャットボットポータルサーバー装置(103)は、チャットボット情報送信部(137)をさらに備えてもよい。
チャットボット情報送信部(137)は、前記チャットボット特定部(132)によって出力される前記チャットボット情報を、前記スマートスピーカー運用サーバー装置(102)に送信する。
また、これに対応して、スマートスピーカー運用サーバー装置(102)は、チャットボットサーバー転送部(126)をさらに備える。
チャットボットサーバー転送部(126)は、前記チャットボットポータルサーバー装置(103)の前記チャットボット情報送信部(137)から送信された前記チャットボット情報に含まれる特定の前記チャットボットサーバー装置(4)の所在情報に基づいて、前記音声認識部(22)から出力された前記質問テキストを、特定の前記チャットボットサーバー装置(4)に送信する。
スマートスピーカー運用サーバー装置(2,102)は、答弁推論部(23,第2答弁推論部)をさらに備えてもよい。
答弁推論部(23)は、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部(23)から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する。
この場合、スマートスピーカー運用サーバー装置(2,102)の前記音声合成部(27)は、前記質問テキストが前記チャットボットサーバー装置(4)に転送されなかった場合には、前記答弁テキスト(つまりチャットボットサーバー装置(4)から出力される答弁テキスト)に代えて前記第2答弁テキストを前記答弁音声に変換する。
この構成によると、スマートスピーカー運用サーバー装置(2,102)が適切な答弁を推論できる場合には、その答弁をスマートスピーカー(1)側に返すことができる。スマートスピーカー運用サーバー装置(2,102)が適切な答弁を推論できなかった場合のみに、チャットボットサーバー装置(4)が推論した答弁をスマートスピーカー(1)側に返す。
スマートスピーカー運用サーバー装置(2,102)を、さらに、次のように構成してもよい。
第2答弁推論部(23)は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力する。
前記チャットボットポータルサーバー転送部(25,125)は、前記第2答弁推論部(23)が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置(4)を特定するために前記質問テキストを前記チャットボットポータルサーバー装置(3,103)に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置(3,103)に送信することを抑止する。
スマートスピーカー運用サーバー装置(2,102)は、チャットボットポータルサーバー転送決定部(24,124)を備えていてもよい。
チャットボットポータルサーバー転送決定部(24,124)は、第2答弁推論部(23)が出力した第2答弁テキストの適合度と所定の閾値とを比較する。チャットボットポータルサーバー転送決定部(24,124)は、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定する。
この場合、チャットボットポータルサーバー転送部(25,125)は、チャットボットポータルサーバー転送決定部(24,124)が質問テキストをチャットボットポータルサーバー装置(3,103)に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置(3,103)に送信し、前記チャットボットポータルサーバー転送決定部(24,124)が前記質問テキストを前記チャットボットポータルサーバー装置(3,103)に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置(3,103)に送信することを抑止する。
なお、上述した実施形態(変形例を含む)におけるスマートスピーカー、スマートスピーカー運用サーバー装置、チャットボットポータルサイトサーバー装置、チャットボットサーバー装置といった各装置が有する機能の少なくとも一部をコンピューターで実現することができる。その場合、この機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM、DVD−ROM、USBメモリー等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、一時的に、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態および変形例について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明は、例えば、インターネット等の通信ネットワークを用いた情報提供等に利用することができる。本発明を適用できる業種には制約がない。なお、本発明の利用範囲はここに例示したものには限られない。
1 スマートスピーカー(AIスピーカー,端末装置)
2 スマートスピーカー運用サーバー装置
3 チャットボットポータルサーバー装置
4,4A,4B,4C,・・・ チャットボットサーバー装置
9 音声問合せシステム
11 マイクロフォン(音声入力部)
12 音声伝達部
13 スピーカー(音声出力部)
21 音声受信部
22 音声認識部
23 答弁推論部(第2答弁推論部)
24 チャットボットポータルサーバー転送決定部
25 チャットボットポータルサーバー転送部
26 答弁受信部
27 音声合成部
28 音声送信部
31 質問受信部
32 チャットボット特定部
33 チャットボット特定用データ管理部
34 質問送信部
35 答弁受信部
36 答弁送信部
41 質問受信部
42 答弁推論部
43 答弁送信部
102 スマートスピーカー運用サーバー装置
103 チャットボットポータルサーバー装置
109 音声問合せシステム
124 チャットボットポータルサーバー転送決定部
125 チャットボットポータルサーバー転送部
126 チャットボットサーバー転送部(答弁受信部)
132 チャットボット特定部
137 チャットボット情報送信部

Claims (19)

  1. 音声を入出力する機能を有する端末装置と、
    前記端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、
    前記端末装置から渡された質問に対する答弁を出力するチャットボットサーバー装置と、
    前記質問に適合する前記チャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、
    を含んで構成される音声問合せシステムであって、
    前記端末装置は、
    音声による質問である質問音声を取得する音声入力部と、
    前記質問音声を前記スマートスピーカー運用サーバー装置に送信するとともに、前記質問音声に対応する答弁音声を前記スマートスピーカー運用サーバー装置から受信する音声伝達部と、
    前記答弁音声を音声として出力する音声出力部と、
    を具備するものであり、
    前記スマートスピーカー運用サーバー装置は、
    前記端末装置から送信された前記質問音声を質問テキストに変換する音声認識部と、
    前記質問テキストを前記チャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、
    前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、
    前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、
    を具備するものであり、
    前記チャットボットポータルサーバー装置は、
    複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持するチャットボット特定用データ管理部と、
    前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力するチャットボット特定部と、
    を具備するものであり、
    前記チャットボットサーバー装置は、
    前記質問テキストと前記答弁テキストとの関係について機械学習済みであるモデルを備え、外部から受信する前記質問テキストと前記モデルとから、前記質問テキストに対応する前記答弁テキストを推論し出力する答弁推論部、
    を具備するものであり、
    前記スマートスピーカー運用サーバー装置は、
    前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、
    をさらに具備し、
    前記スマートスピーカー運用サーバー装置の前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、
    音声問合せシステム。
  2. 前記チャットボットポータルサーバー装置は、
    前記チャットボット特定部によって特定された前記チャットボットサーバー装置に対して、スマートスピーカー運用サーバー装置から受信した前記質問テキストを送信する質問送信部、
    をさらに具備する、
    請求項1に記載の音声問合せシステム。
  3. 前記チャットボットポータルサーバー装置は、
    前記チャットボット特定部によって出力される前記チャットボット情報を、前記スマートスピーカー運用サーバー装置に送信するチャットボット情報送信部、
    をさらに具備するものであり、
    スマートスピーカー運用サーバー装置は、
    前記チャットボットポータルサーバー装置の前記チャットボット情報送信部から送信された前記チャットボット情報に含まれる特定の前記チャットボットサーバー装置の所在情報に基づいて、前記音声認識部から出力された前記質問テキストを、特定の前記チャットボットサーバー装置に送信するチャットボットサーバー転送部、
    をさらに具備するものである、
    請求項1に記載の音声問合せシステム。
  4. 前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、
    前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項1から3までのいずれか一項に記載の音声問合せシステム。
  5. 前記スマートスピーカー運用サーバー装置は、
    前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定するチャットボットポータルサーバー転送決定部、
    をさらに具備し、
    前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項4に記載の音声問合せシステム。
  6. 音声を入出力する機能を有する端末装置と、
    前記端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、
    前記端末装置から渡された質問に対する答弁を出力するチャットボットサーバー装置と、
    前記質問に適合する前記チャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、
    を用いた音声問合せ処理方法であって、
    前記端末装置では、
    音声入力部が音声による質問である質問音声を取得し、
    音声伝達部が、前記質問音声を前記スマートスピーカー運用サーバー装置に送信するとともに、前記質問音声に対応する答弁音声を前記スマートスピーカー運用サーバー装置から受信し、
    音声出力部が、前記答弁音声を音声として出力する、
    ものであり、
    前記スマートスピーカー運用サーバー装置では、
    音声認識部が、前記端末装置から送信された前記質問音声を質問テキストに変換し、
    チャットボットポータルサーバー転送部が、前記質問テキストを前記チャットボットポータルサーバー装置に送信し、
    答弁受信部が、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信し、
    音声合成部が、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する、
    ものであり、
    前記チャットボットポータルサーバー装置では、
    チャットボット特定用データ管理部が、複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持し、
    チャットボット特定部が、前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力する、
    ものであり、
    前記チャットボットサーバー装置では、
    答弁推論部が、前記質問テキストと前記答弁テキストとの関係について機械学習済みであるモデルを備え、外部から受信する前記質問テキストと前記モデルとから、前記質問テキストに対応する前記答弁テキストを推論し出力する、
    ものであり、
    前記スマートスピーカー運用サーバー装置では、
    第2答弁推論部が、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力し、
    前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換するものであり、
    前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、
    前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    音声問合せ処理方法。
  7. 前記スマートスピーカー運用サーバー装置では、
    チャットボットポータルサーバー転送決定部が、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定し、
    前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項6に記載の音声問合せ処理方法。
  8. 音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、
    質問に適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、
    を含んで構成される音声問合せシステムであって、
    前記スマートスピーカー運用サーバー装置は、
    前記端末装置から送信された質問音声を質問テキストに変換する音声認識部と、
    前記質問テキストを前記チャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、
    前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、
    前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、
    を具備するものであり、
    前記チャットボットポータルサーバー装置は、
    複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持するチャットボット特定用データ管理部と、
    前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力するチャットボット特定部と、
    を具備するものであり、
    前記スマートスピーカー運用サーバー装置は、
    前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、
    をさらに具備し、
    前記スマートスピーカー運用サーバー装置の前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、
    音声問合せシステム。
  9. 前記チャットボットポータルサーバー装置は、
    前記チャットボット特定部によって特定された前記チャットボットサーバー装置に対して、スマートスピーカー運用サーバー装置から受信した前記質問テキストを送信する質問送信部、
    をさらに具備する、
    請求項8に記載の音声問合せシステム。
  10. 前記チャットボットポータルサーバー装置は、
    前記チャットボット特定部によって出力される前記チャットボット情報を、前記スマートスピーカー運用サーバー装置に送信するチャットボット情報送信部、
    をさらに具備するものであり、
    スマートスピーカー運用サーバー装置は、
    前記チャットボットポータルサーバー装置の前記チャットボット情報送信部から送信された前記チャットボット情報に含まれる特定の前記チャットボットサーバー装置の所在情報に基づいて、前記音声認識部から出力された前記質問テキストを、特定の前記チャットボットサーバー装置に送信するチャットボットサーバー転送部、
    をさらに具備するものである、
    請求項8に記載の音声問合せシステム。
  11. 前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、
    前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項8から10までのいずれか一項に記載の音声問合せシステム。
  12. 前記スマートスピーカー運用サーバー装置は、
    前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定するチャットボットポータルサーバー転送決定部、
    をさらに具備し、
    前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項11に記載の音声問合せシステム。
  13. 音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置と、
    質問に適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置と、
    を用いた音声問合せ処理方法であって、
    前記スマートスピーカー運用サーバー装置では、
    音声認識部が、前記端末装置から送信された質問音声を質問テキストに変換し、
    チャットボットポータルサーバー転送部が、前記質問テキストを前記チャットボットポータルサーバー装置に送信し、
    答弁受信部が、前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信し、
    音声合成部が、前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する、
    ものであり、
    前記チャットボットポータルサーバー装置では、
    チャットボット特定用データ管理部が、複数の前記チャットボットサーバー装置について、前記チャットボットサーバー装置ごとの特徴を表すデータを保持し、
    チャットボット特定部が、前記スマートスピーカー運用サーバー装置から送信された前記質問テキストに基づいて、前記チャットボット特定用データ管理部が保持する前記チャットボットサーバー装置ごとの特徴と、前記質問テキストの特徴とから、前記質問テキストに適合する前記チャットボットサーバー装置を特定するとともに、特定された前記チャットボットサーバー装置の所在を表す所在情報を含んだチャットボット情報を出力する、
    ものであり、
    前記スマートスピーカー運用サーバー装置では、
    第2答弁推論部が、前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力し、
    前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に転送されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換するものであり、
    前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、
    前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    音声問合せ処理方法。
  14. 前記スマートスピーカー運用サーバー装置では、
    チャットボットポータルサーバー転送決定部が、前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定し、
    前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項13に記載の音声問合せ処理方法。
  15. 音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置であって、
    前記端末装置から送信された質問音声を質問テキストに変換する音声認識部と、
    前記質問テキストを、前記質問テキストに適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、
    前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、
    前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、
    を具備し、
    前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、
    をさらに具備し、
    前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に送信されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、
    スマートスピーカー運用サーバー装置。
  16. 前記チャットボットポータルサーバー装置から送信されるチャットボット情報に含まれる、特定の前記チャットボットサーバー装置の所在情報に基づいて、前記音声認識部から出力された前記質問テキストを、特定の前記チャットボットサーバー装置に送信するチャットボットサーバー転送部、
    をさらに具備する、
    請求項15に記載のスマートスピーカー運用サーバー装置。
  17. 前記第2答弁推論部は、前記第2答弁テキストを出力する際に、前記第2答弁テキストの適合度を出力するものであり、
    前記チャットボットポータルサーバー転送部は、前記第2答弁推論部が出力した前記適合度が所定の閾値未満である場合にのみ前記チャットボットサーバー装置を特定するために前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項16に記載のスマートスピーカー運用サーバー装置。
  18. 前記第2答弁テキストの前記適合度と前記所定の閾値とを比較し、前記適合度が当該閾値未満である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定し、前記適合度が当該閾値以上である場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定するチャットボットポータルサーバー転送決定部、
    をさらに具備し、
    前記チャットボットポータルサーバー転送部は、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信するよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信し、前記チャットボットポータルサーバー転送決定部が前記質問テキストを前記チャットボットポータルサーバー装置に送信しないよう決定した場合には前記質問テキストを前記チャットボットポータルサーバー装置に送信することを抑止する、
    請求項17に記載のスマートスピーカー運用サーバー装置。
  19. コンピューターを、
    音声を入出力する機能を有する端末装置を稼働させるための機能を実行するスマートスピーカー運用サーバー装置であって、
    前記端末装置から送信された質問音声を質問テキストに変換する音声認識部と、
    前記質問テキストを、前記質問テキストに適合するチャットボットサーバー装置を特定するための処理を行うチャットボットポータルサーバー装置に送信するチャットボットポータルサーバー転送部と、
    前記チャットボットポータルサーバー装置に送信された前記質問テキストに対応する答弁テキストを受信する答弁受信部と、
    前記答弁受信部が受信した前記答弁テキストを答弁音声に変換する音声合成部と、
    を具備し、
    前記質問テキストと前記答弁テキストとの関係について機械学習済みである第2モデルを備え、前記音声認識部から出力された前記質問テキストと前記第2モデルとから、前記質問テキストに対応する第2答弁テキストを推論し出力する第2答弁推論部、
    をさらに具備し、
    前記音声合成部は、前記質問テキストが前記チャットボットサーバー装置に送信されなかった場合には、前記答弁テキストに代えて前記第2答弁テキストを前記答弁音声に変換する、
    スマートスピーカー運用サーバー装置として機能させるためのプログラム。
JP2018237446A 2018-12-19 2018-12-19 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。 Active JP6555838B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018237446A JP6555838B1 (ja) 2018-12-19 2018-12-19 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。
PCT/JP2019/042493 WO2020129419A1 (ja) 2018-12-19 2019-10-30 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、およびプログラム
TW108139504A TW202028992A (zh) 2018-12-19 2019-10-31 語音查詢系統、語音查詢處理方法、智慧型揚聲器運用伺服器裝置、及程式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018237446A JP6555838B1 (ja) 2018-12-19 2018-12-19 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。

Publications (2)

Publication Number Publication Date
JP6555838B1 true JP6555838B1 (ja) 2019-08-07
JP2020098308A JP2020098308A (ja) 2020-06-25

Family

ID=67539799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018237446A Active JP6555838B1 (ja) 2018-12-19 2018-12-19 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。

Country Status (3)

Country Link
JP (1) JP6555838B1 (ja)
TW (1) TW202028992A (ja)
WO (1) WO2020129419A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023239779A1 (en) * 2022-06-08 2023-12-14 Liveperson, Inc. Ai based hold messaging
CN115410576A (zh) * 2022-08-26 2022-11-29 国网河南省电力公司信息通信公司 一种智能客服系统及智能客服机器人

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58131244A (ja) * 1982-01-27 1983-08-05 プレパイ工業株式会社 排水処理槽の設置方法及び設置装置
JP3734427B2 (ja) * 2001-03-30 2006-01-11 株式会社ジャストシステム 番組関連情報出力装置
JP2003295890A (ja) * 2002-04-04 2003-10-15 Nec Corp 音声認識対話選択装置、音声認識対話システム、音声認識対話選択方法、プログラム
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
CN103339623B (zh) * 2010-09-08 2018-05-25 纽昂斯通讯公司 涉及因特网搜索的方法和设备
JP6389171B2 (ja) * 2013-06-19 2018-09-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声対話方法、及び機器
US10528632B2 (en) * 2016-07-19 2020-01-07 Microsoft Technology Licensing, Llc Systems and methods for responding to an online user query
JP6849964B2 (ja) * 2016-09-05 2021-03-31 株式会社Nextremer 対話制御装置、対話エンジン、管理端末、対話装置、対話制御方法、対話方法、およびプログラム
JP6767046B2 (ja) * 2016-11-08 2020-10-14 国立研究開発法人情報通信研究機構 音声対話システム、音声対話装置、ユーザー端末、および音声対話方法
JP6470246B2 (ja) * 2016-11-15 2019-02-13 ソフトバンク株式会社 ユーザーサポートシステム、ユーザーサポートプログラム及びユーザーサポート方法
JP7055327B2 (ja) * 2017-10-13 2022-04-18 ロボットスタート株式会社 会話収集装置、会話収集システム及び会話収集方法
JP6433614B1 (ja) * 2018-04-16 2018-12-05 Jeインターナショナル株式会社 チャットボット検索システムおよびプログラム

Also Published As

Publication number Publication date
TW202028992A (zh) 2020-08-01
JP2020098308A (ja) 2020-06-25
WO2020129419A1 (ja) 2020-06-25

Similar Documents

Publication Publication Date Title
US11509726B2 (en) Encapsulating and synchronizing state interactions between devices
US20210365482A1 (en) Chat system, chatbot server device, chatbot id management device, chat mediation server device, program, chat method, and chat mediation method
US11682393B2 (en) Method and system for context association and personalization using a wake-word in virtual personal assistants
CN108769745A (zh) 视频播放方法和装置
CN105284107A (zh) 用于提供交互式广告的设备、系统、方法和计算机可读介质
US20200090654A1 (en) Medium selection for providing information corresponding to voice request
CN108648756A (zh) 语音交互方法、装置和系统
KR20030086114A (ko) 아바타 메일 제공시스템 및 방법
JP5441455B2 (ja) ネットワーク基盤のサービス提供システム
JP6555838B1 (ja) 音声問合せシステム、音声問合せ処理方法、スマートスピーカー運用サーバー装置、チャットボットポータルサーバー装置、およびプログラム。
US11050884B2 (en) Intent-driven contact center
JP2004145055A (ja) オーディオ配信システム
JP6255274B2 (ja) 情報処理装置、音声対話装置、および制御プログラム
CN108337556A (zh) 用于播放影音文件的方法和装置
JP2019057093A (ja) 情報処理装置及びプログラム
CN112447179A (zh) 一种语音交互方法、装置、设备及计算机可读存储介质
KR20060102601A (ko) 로봇 컨텐츠 제공 서비스 시스템 및 그 방법
US6640210B1 (en) Customer service operation using wav files
JP6314582B2 (ja) 通信装置、オペレータの選択方法及びプログラム
WO2019176018A1 (ja) Aiスピーカーシステム、aiスピーカーシステムの制御方法、及びプログラム
JP2002268666A (ja) 音声合成装置
KR20220058745A (ko) 대용어를 포함하는 텍스트에 관한 보이스 어시스턴트 서비스를 제공하는 시스템 및 방법
KR20190072249A (ko) 음성 메시지 서비스를 제공하는 단말, 서버 및 방법
JP2019057092A (ja) 情報処理装置及びプログラム
EP3396565A1 (en) Method for supporting the providing of a conversational service, a related conversation supporting device and a related system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181219

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181219

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190708

R150 Certificate of patent or registration of utility model

Ref document number: 6555838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350