JP2019197977A - 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム - Google Patents

問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム Download PDF

Info

Publication number
JP2019197977A
JP2019197977A JP2018090157A JP2018090157A JP2019197977A JP 2019197977 A JP2019197977 A JP 2019197977A JP 2018090157 A JP2018090157 A JP 2018090157A JP 2018090157 A JP2018090157 A JP 2018090157A JP 2019197977 A JP2019197977 A JP 2019197977A
Authority
JP
Japan
Prior art keywords
call
caller
inquiry
content
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018090157A
Other languages
English (en)
Inventor
上田 徹
Toru Ueda
徹 上田
剛士 松下
Takeshi Matsushita
剛士 松下
岩野 裕利
Hirotoshi Iwano
裕利 岩野
新開誠
Makoto Shinkai
誠 新開
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2018090157A priority Critical patent/JP2019197977A/ja
Priority to US16/291,662 priority patent/US20190349480A1/en
Priority to CN201910163743.3A priority patent/CN110475030A/zh
Publication of JP2019197977A publication Critical patent/JP2019197977A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5183Call or contact centers with computer-telephony arrangements
    • H04M3/5191Call or contact centers with computer-telephony arrangements interacting with the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/58Arrangements for transferring received calls from one subscriber to another; Arrangements affording interim conversations between either the calling or the called party and a third party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/58Details of telephonic subscriber devices including a multilanguage function

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】転送された通話における発信者と通話対応者の会話を円滑にするシステムを実現する。【解決手段】システムは、ユーザからの通話の音声に対する音声認識結果に基づいて上記通話におけるユーザの問い合わせに対する応答内容を検索し、上記応答内容を示す音声信号をユーザ端末(1)に送信し、上記通話を端末(200)に転送し、上記問い合わせの内容を示す情報を表示部(230)に表示させる。【選択図】図1

Description

本発明の一態様は、自動音声通話に関する。
利用者との自動音声による通話をオペレータに転送する自動応答システムが従来技術として知られている。
また、チャット機能を用いて利用者と自動会話するシステムが開示されている(特許文献1)。このシステムは、オペレータによる会話への介入が必要と判定した場合に、オペレータによる会話文の入力を受け付けるようになっている。
特開2012−64073号公報
上記特許文献1に記載の技術では、オペレータは、利用者がシステムに伝えた質問内容を自身の端末を用いて確認できる。
しかしながら、利用者との自動音声による通話が自動応答システムによってオペレータに転送された場合、オペレータは、利用者が自動応答システムに伝えた質問や要望等を把握できない。その結果、利用者には質問や要望等を再度伝える手間が生じることになる。
本発明の一態様は、上記課題に鑑みて成されたものであり、その目的は、転送された通話における発信者と通話対応者の会話を円滑にする問い合わせ処理方法およびシステムを実現することにある。
上記の課題を解決するために、本発明に係る問い合わせ処理方法は、発信者からの通話による問い合わせを受け付けるシステムによって実行される問い合わせ処理方法であって、上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定するステップと、特定された上記問い合わせの内容に対する応答内容を検索するステップと、検索された上記応答内容を示す音声信号を上記発信者の端末に送信するステップと、上記検索の結果に基づいて、上記通話を通話対応者の端末に転送するステップと、上記通話対応者の端末に内蔵又は接続された表示部に上記問い合わせの内容を示す情報を表示するステップと、を含む方法である。
上記の課題を解決するために、本発明に係るシステムは、自動音声対話装置と、通話対応者の端末と、を含み、発信者からの通話による問い合わせを受け付けるシステムであって、上記自動音声対話装置は制御部を備え、上記自動音声対話装置の上記制御部は、上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定し、特定された上記問い合わせの内容に対する応答内容を検索し、上記検索の結果に基づいて、上記通話を上記通話対応者の端末に転送することをトリガし、転送された上記通話の接続状態において上記通話対応者の端末が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力し、上記通話対応者の端末は表示部と制御部とを備え、上記通話対応者の端末の上記制御部は、上記自動音声対話装置によってトリガされた上記通話の転送を受け付ける処理を行い、転送された上記通話の接続状態において上記問い合わせの内容を示す情報を上記表示部に表示させる、構成である。
上記の課題を解決するために、本発明に係る端末は、表示部と制御部とを備えている端末であって、上記制御部は、自動音声対話装置によってトリガされた発信者との通話の転送を受け付ける処理を行い、転送された上記通話の接続状態において上記発信者の問い合わせの内容を示す情報を上記表示部に表示させる、構成である。
上記の課題を解決するために、本発明に係る自動音声対話装置は、制御部を備えている自動音声対話装置であって、上記制御部は、発信者との通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記発信者の問い合わせの内容を特定し、特定された上記問い合わせの内容に対する応答内容を検索し、上記検索の結果に基づいて、上記通話を通話対応者の端末に転送することをトリガし、転送された上記通話の接続状態において上記通話対応者の端末が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力する処理を行う、構成である。
上記の課題を解決するために、本発明に係る表示処理方法は、端末によって実行される表示処理方法であって、自動音声対話装置によってトリガされた発信者との通話の転送を受け付ける処理を行うステップと、転送された上記通話の接続状態において上記発信者の問い合わせの内容を示す情報を表示部に表示させるステップと、を含む方法である。
上記の課題を解決するために、本発明に係る通話制御方法は、自動音声対話装置によって実行される通話制御方法であって、発信者との通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記発信者の問い合わせの内容を特定するステップと、特定された上記問い合わせの内容に対する応答内容を検索するステップと、上記検索の結果に基づいて、発信者との通話を通話対応者の端末に転送することをトリガするステップと、転送された上記通話の接続状態において上記通話対応者の端末が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力するステップと、を含む方法である。
本発明の一態様によれば、転送された通話における発信者と通話対応者の会話を円滑にできる。
実施形態1〜3に係る自動音声対話装置およびオペレータ端末の機能ブロック図である。 実施形態1〜3に係るシステムの構成図である。 実施形態1〜3に係るシステムの動作の一例を示すシーケンス図である。 実施形態1〜2に係るシステムとユーザとの会話の一例を示した図である。 実施形態1〜2に係るシステム及びオペレータとユーザとの会話の一例を示した図である。 実施形態1に係るオペレータ端末が表示するオペレーション画面の一例を示した図である。 実施形態2に係るオペレータ端末が表示するオペレーション画面の一例を示した図である。 実施形態3に係る自動音声対話装置による応答シナリオを示す木構造の一部の一例を示すである。 自動音声対話装置およびオペレータ端末として利用可能なコンピュータのハードウェア構成を例示したブロック図である。
〔実施形態1〕
以下、本発明の一実施形態について、図1〜図6に基づいて説明すれば以下の通りである。
本実施形態に係るシステムは、発信者(ユーザ)からの通話による問い合わせを受け付けるシステムである。システムの構成の一例について図1及び図2を参照して説明する。
〔1.システムの構成〕
図1は、本実施形態に係る自動音声対話装置100およびオペレータ端末200の機能ブロック図である。また、図2は、本実施形態に係るシステムの構成図である。
図2に示すように、システムは、自動応答装置10、オペレータ端末制御装置20、表示用データ処理装置30、自動音声対話装置100、記憶装置150、ユーザ端末1、及び、オペレータ端末200を含んでいる。
(自動応答装置10)
自動応答装置10は、ユーザ端末1からの発信を受け付け、自動音声対話装置100とユーザ端末1との通話接続を確立するための処理を行う。自動応答装置10は、自動音声対話装置100からのリクエストにより、自動音声対話装置100によるユーザとの通話を転送する。
(オペレータ端末制御装置20)
オペレータ端末制御装置20は、通話に対応するオペレータの呼び出しを自動応答装置10から受け付けると、複数の候補者の中から適切なオペレータ(通話対応者)を選択し、選択したオペレータのオペレータ端末200に通話を転送する。
(表示用データ処理装置30)
表示用データ処理装置30は、オペレータ端末200がオペレーション画面を生成するために必要な情報を提供する。
(自動音声対話装置100)
自動音声対話装置100は、自律的にユーザとの会話を行う装置である。
図1の(a)に示すように、自動音声対話装置100は、通信インターフェース(通信I/F部)110、及び、制御部120を備えている。
制御部120は、自動音声対話装置100を統括的に制御する。制御部120は、通信処理部121、音声認識・合成処理部122、検索処理部123、及び、記録処理部124として機能する。
通信処理部121は、ユーザ端末1との通話接続を確立するための処理を行う。通信処理部121は、ユーザの発話音声を示す音声信号の受信処理、及び、自動音声対話装置100による応答内容を示す音声信号の送信処理を行う。
また、通信処理部121は、問い合わせに回答できない(即ち、質問を解決できない)と判断する条件(転送条件)に合致した場合、通話をオペレータに転送するように自動応答装置10にリクエストする。
音声認識・合成処理部122は、ユーザの通話音声に対して音声認識処理を行うとともに、ユーザに対して回答する文字列から合成音を生成する。即ち、音声認識・合成処理部122は、ユーザによる発話の度に、発話音声を入力として当該発話の内容を示す文字情報を生成し、検索処理部123で検索された応答内容を示す音声信号を生成する。
検索処理部123は、音声認識結果に基づいて、ユーザによる発話(問い合わせ等)に対する応答内容を後述の知識DB151から検索し、検索した応答内容を音声認識・合成処理部122に転送する。
記録処理部124は、音声認識・合成処理部122が上記文字情報を生成する度に、生成した文字情報を後述の記憶装置(記憶部)150に記録する。
(記憶装置150)
記憶装置150は、オペレーション画面を生成するための情報が格納された各種DBを保持する。
知識DB151は、予め定義された発話内容毎に、発話内容に対応する応答内容が記録されたデータベースである。
会話データ152は、記録処理部124によって記憶装置150に蓄積される文字情報である。会話データ152は、ユーザ毎に、そのユーザの通話の度に記録される。また、会話データ152は、ユーザの電話番号及び/又はID、並びに、ユーザと自動音声対話装置100との通話が開始した時刻と紐づけて記録される。
ユーザDB153は、システムに登録されたユーザの各種情報(電話番号、ID等)が格納されたデータベースである。
その他、記憶装置150は、システムを利用する事業者が取り扱う商品及び/またはサービス(以下、「商品等」と称する)の情報が格納された商品データベース(図示せず)も保持している。また、記憶装置150は、ユーザのIDと電話番号と注文履歴がユーザ毎に記録された購買データベース(図示せず)も保持している。
(オペレータ端末200)
オペレータ端末200は、オペレータがユーザと会話するために使用する端末である。
図1の(b)に示すように、オペレータ端末200は、通信インターフェース(通信I/F部)210、及び、制御部220を備えている。
制御部220は、オペレータ端末200を統括的に制御する。制御部220は、通信処理部221、音声処理部222、画面処理部223、及び、入力処理部224として機能する。
通信処理部221は、ユーザ端末1との通話接続を確立するための処理を行う。通信処理部221は、ユーザの発話音声を示す音声信号の受信処理、及び、オペレータによる応答内容を示す音声信号の送信処理を行う。また、通信処理部221は、オペレーション画面を生成するための情報を受信するための処理を行う。
音声処理部222は、ユーザの発話音声を音声入出力部240から出力する。音声入出力部240はマイクとスピーカから構成される。オペレータの発話音声は音声入出力部240によって取り込まれ、音声処理部222は、オペレータの発話音声を示す音声信号を通信処理部221に供給する。
画面処理部223は、オペレーション画面を生成し、生成したオペレーション画面を表示部(表示装置)230に表示する。画面処理部223は、上記オペレーション画面として、上記問い合わせの内容を示す情報を含むような画面を生成する。
また、画面処理部223は、オペレータによる手操作(例えば、キーボードやマウスによる操作)の内容に応じて、オペレーション画面を更新する処理を行う。
入力処理部224は、手操作受付部250(キーボードやマウス等)による操作の内容を画面処理部223に通知する。
なお、表示部230、音声入出力部240、手操作受付部250のそれぞれは、オペレータ端末200に内蔵されていてもよく、オペレータ端末200とは別の装置であってもよい。
〔2.処理の流れ〕
システムによる処理の流れを図3〜図6を参照しながら説明する。
図3は、システムの動作の一例を示すシーケンス図である。図4は、システムとユーザとの会話の一例を示した図である。図5は、システム及びオペレータとユーザとの会話の一例を示した図である。図6は、オペレータ端末200が表示するオペレーション画面の一例を示した図である。
(S1)
ユーザがユーザ端末1にシステムの電話番号を入力して電話をかけると、ステップS1において、ユーザ端末1と自動応答装置10とは、互いとの回線接続を確立する。
(S2)
ステップS2において、自動応答装置10と自動音声対話装置100とは、互いとの通信接続を確立する。
(S3)
ステップS3において、自動音声対話装置100とユーザとの間で自動音声を利用した対話が行われる。即ち、音声認識・合成処理部122は、ユーザによる発話の度に発話音声に対する音声認識を行い、その結果に基づいて当該発話(問い合わせ)の内容を示す文字情報を生成し、生成した文字情報を記憶部150に記録する。そして、検索処理部123は、生成された当該文字情報に基づいて、当該問い合わせに対する応答内容を知識DB151から検索し、通信処理部221は、検索された当該応答内容を示す音声の信号をユーザ端末1に送信する。
換言すれば、ステップS3は、上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定するステップと、特定された上記問い合わせの内容に対する応答内容を検索するステップと、検索された上記応答内容を示す音声信号を上記発信者の端末に送信するステップと、を含んでいる。
ステップS3において、自動音声対話装置100が問い合わせに回答できた場合(即ち、質問を解決できた場合)、ステップS4以降の処理を行うことなく、ユーザとの通話が終了する。
例えば、図4の会話では、自動音声対話装置100は、「たっぷりイチゴアイスはいつ発売ですか?」という問い合わせに対して「6月1日」である旨の回答ができたので、ステップS4以降の処理を行うことなく、ユーザとの通話が終了する。
(S4)
ステップS4において、検索処理部123は、ユーザの直近の発話内容に対する音声認識結果に基づいて「オペレータに転送します」という応答内容を知識DB151から検索した場合、転送条件に合致したと判定する。
例えば、図5の会話では、自動音声対話装置100は、「たっぷりイチゴアイスはカロリーはどれくらい含まれていますか?」という問い合わせを受けて、「オペレータに転送します」という応答内容を検索するので、転送条件に合致したと判定する。自動音声対話装置100は、問い合わせ内容に対応する応答内容を知識DB151から検索した結果、応答内容が見つからなかった場合(検索が失敗した場合)にも、転送条件に合致したと判定してもよい。
(S5)
ステップS5において、通信処理部221は、「オペレータに転送します」という音声の信号をユーザ端末1に送信する。
(S6)
ステップS6において、通信処理部221は、ユーザの問い合わせの内容を記憶部150(会話データ152)から読み出し、ユーザ識別情報とともに、表示用データ処理装置30に送信する。なお、本実施形態では、ユーザ識別情報は、ユーザの電話番号(例えば、図6における"090-ABCD-EFGH")とユーザIDとで構成されているが、ユーザ識別情報は、ユーザの電話番号及びユーザIDのうちのいずれか一方であってもよい。また、通信処理部221は、ユーザDB153を参照して、電話番号等からユーザの氏名・住所・メールアドレス等のユーザ情報を検索し、その検索結果をユーザ識別情報とともに、表示用データ処理装置30に送信しても構わない。
(S7)
ステップS7において、通信処理部221は、ユーザとの通話をオペレータ端末200に転送することをトリガする。即ち、通信処理部221は、上記通話をオペレータに転送するための転送リクエストを自動応答装置10に送信する。転送リクエストには、ユーザ識別情報が含まれる。
なお、ステップS5〜S7の処理順には特に制限はない。例えば、自動音声対話装置100は、ステップS7、ステップS6、ステップS5の順に処理を実行してもよい。
(S8)
ステップS8において、自動応答装置10は、オペレータを呼び出すための呼び出しリクエストをオペレータ端末制御装置20に送信する。呼び出しリクエストには、ユーザ識別情報が含まれる。
(S9)
ステップS9において、オペレータ端末制御装置20は、複数のオペレータ端末200の中から、1つのオペレータ端末200を選択する。
なお、1つのオペレータ端末200を選択する基準としては任意の基準を採用できる。
例えば、オペレータ端末制御装置20は、手が空いているオペレータのオペレータ端末200の中から、ランダムに、あるいは、ユーザの電話番号をベースに、1つのオペレータ端末200を選択してもよい。
(S10)
ステップS10において、オペレータ端末制御装置20は、ステップS9で選択したオペレータ端末200に対してオペレータを呼び出す信号を送信する。
オペレータが信号に応答する操作を行う、オペレータ端末200とユーザ端末1との間で、転送された通話の接続が確立される。
(S11)
ステップS11において、オペレータ端末制御装置20は、ユーザの問い合わせの内容を送信するように要求するための送信リクエストを、表示用データ処理装置30に送信する。送信リクエストには、ユーザ識別情報が含まれる。
なお、ステップS10〜S11の処理順には特に制限はない。例えば、オペレータ端末制御装置20は、ステップS11、ステップS10の順に処理を実行してもよい。
(S12)
ステップS12において、表示用データ処理装置30は、ユーザの問い合わせの内容を示す情報をオペレータ端末制御装置20に送信する。
(S13)
ステップS13において、オペレータ端末制御装置20は、ユーザの問い合わせの内容を示す情報を、ステップS9で選択したオペレータ端末200に送信する。
(S14)
ステップS14において、画面処理部223は、図6に示すようなオペレーション画面5を生成し、生成したオペレーション画面5を表示部230に表示する。図6に示すように、オペレーション画面5内の所定の領域5aには、上記問い合わせの内容(即ち、今回の通話での問い合わせの内容)を示す情報が示される。
オペレーション画面5は、領域5aの他に、オペレータが発話した内容が音声認識され文字情報として示される領域5b、同じユーザによる過去の通話における問い合わせの内容を示す情報が示される領域5c、商品等に関する情報を検索するためのUI群5d及び5e、並びに、検索された情報が示される領域5fを含んでいる。
なお、画面処理部223は、ユーザの問い合わせの内容を示す情報からキーワードを抽出し、抽出したキーワードを検索語として商品等に関する情報を商品データベースから自動検索し、検査結果を領域5fに表示してもよい。
(S15)
ステップS15において、オペレータは、オペレーション画面5を見ながら、ユーザの問い合わせに対して回答する。
〔3.システムの利点〕
以上のように、本実施形態のシステムは、発信者からの通話による問い合わせを受け付けるシステムである。
自動音声対話装置100(記録処理部124)は、上記問い合わせの内容を示す情報を記憶部150に記録する。また、自動音声対話装置100(検索処理部123)は、上記通話の音声に対する音声認識結果に基づいて、上記問い合わせに対する応答内容を検索する。さらに、自動音声対話装置100(通信処理部121)は、上記応答内容(例えば、「オペレータに転送します」という応答内容)を示す音声信号を発信者の端末1に送信する。
自動応答装置10は、上記通話をオペレータの端末200に転送する。オペレータ端末200(画面処理部223)は、転送された上記通話の接続状態において、上記情報を参照し、領域5aに上記情報を含むオペレーション画面5を表示部230に表示する。
これにより、オペレータは、通話が転送されると、その通話における発信者の問い合わせの内容を即座に把握することができる。
従って、本実施形態に係るシステムは、自動応答装置10から転送された通話における発信者と通話対応者(オペレータ)の会話を円滑にする、と言える。
なお、問い合わせの内容を把握したオペレータは、領域5fに示されている検索結果(通話の内容に関連する関連情報)を参照することによって、問い合わせに対する回答を逸早く得ることができる。即ち、本実施形態に係るシステムは、即座に回答を得られないことによるユーザの苛立ちを抑制することができる。
〔実施形態2〕
本発明の第2の実施形態について、さらに、図7を参照して説明する。
なお便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、説明を省略する。
本実施形態においても図1及び図2に示す構成を用いる。また、本実施形態においても、システムによる処理の流れは、基本的に実施形態1に係るシステムと同様である。ただし、音声認識・合成処理部122及び音声処理部222は以下に示す機能を有し、システムは、一部のステップにおいて当該機能に係る追加の処理を行うようになっている。
即ち、音声認識・合成処理部122は、ユーザ(発信者)の発言を示す音声信号を解析し、ユーザの属性(例えば、年齢、性別、会員種別)及び感情の状態を推定する機能を有する。
音声認識・合成処理部122は、ステップS3において、音声認識結果に基づいてユーザの属性及び/又は感情の状態を推定する。
ステップS6では、ユーザ識別情報、及び、問い合わせ内容に加えてユーザの属性及び/又は感情の状態を示す情報(以下、「属性情報等」と称する)も表示用データ処理装置30に送信される。ステップS12、S13では、ユーザの問い合わせ内容に加えてユーザの属性情報等も送信される。
画面処理部223は、ユーザの電話番号を参照して、通話開始時刻を特定すると共に購買データベースを検索し、ユーザの属性情報等及び通話時間と共に検索結果(ユーザの購買履歴等)を図7のオペレーション画面5’内の領域5gに表示する。
なお、本実施形態では、ステップS6、S12、S13で送信される問い合わせ内容には、ユーザの問い合わせ内容を示す通話音声を録音した録音音声信号と、当該通話音声に対して音声認識処理を施すことにより得られた文字情報と、が含まれている。
また、音声処理部222は、ユーザの問い合わせの内容を示す録音音声を再生する機能を備えている。
即ち、ステップS14及びステップS15において、オペレータが再生ボタン5hを操作すると、音声処理部222は、ステップS13で送信された録音音声信号が示す録音音声を音声入出力部240から出力する。
上記音声認識処理の精度に問題があるために上記文字情報が問い合わせ内容を明瞭に示さない場合であっても、オペレータは、録音音声を再生することでユーザの問い合わせの内容を確認することができる。
なお、オペレーション画面5’は、録音音声の再生速度を調整する(実際の発話よりも速い速度、または遅い速度で再生する)ためのUI部品を備えていてもよい。
〔システムの利点〕
本実施形態に係るシステムは、実施形態1に係るシステムの利点に加えて、以下の利点を有する。
即ち、自動音声対話装置100(音声認識・合成処理部122)は、音声認識結果に基づいて発信者(ユーザ)に関する情報(属性情報等)を取得する。
画面処理部223は、ユーザとの通話の接続状態においてユーザに関する情報(属性情報等や購買履歴)を表示する。
これにより、オペレータは、ユーザに関する情報を参考にして、ユーザとの通話において適切な対応をとることができる。
(付記事項)
オペレータ端末制御装置20を、ステップS9においてユーザに関する情報に基づいて複数の候補者の中からオペレータを選択する、ように構成してもよい。この場合、ステップS7、S8では、ユーザ識別情報に加えてユーザの属性情報等も送信されてもよい。
また、記憶装置150は、各オペレータに関する情報を記録したデータベースを保持するようにしてもよい。オペレータに関する情報は、例えば、オペレータの経験年数、性格、及び、得意分野、並びに、そのオペレータが使用しているオペレータ端末200等を識別するものであってもよい。
ステップS9において、オペレータ端末制御装置20は、ユーザが怒っていることを属性情報等が示す場合、経験年数が一定以上であるオペレータのオペレータ端末200を、データベースを参照して特定し、特定したオペレータ端末200を選択してもよい。さらに/あるいは、オペレータ端末制御装置20は、ユーザが上級会員(優良会員)であることを属性情報等が示す場合に、経験年数が一定以上であるオペレータのオペレータ端末200を選択してもよい。
また、オペレータ端末制御装置20は、ステップS8とステップS9との間に、ステップS11及びステップS12を実行し、ステップS9の後に、ステップS10及びステップS13を実行してもよい。
この場合、オペレータ端末制御装置20は、ステップS9において、ユーザの問い合わせがある話題(例えば、食料品等の商品、ポイントシステム等のサービス)に関する問い合わせであることを特定してもよい。そして、オペレータ端末制御装置20は、当該ある話題に関する問い合わせの対応を得意とするオペレータのオペレータ端末200を、データベースを参照して特定し、特定したオペレータ端末200を選択してもよい。
ユーザの問い合わせがどのような話題に関連しているかについては、問い合わせを示す文字情報に含まれるキーワードと分野別辞書とを比較することで、特定可能である。
〔実施形態3〕
本発明の第3の実施形態について、さらに、図8を参照して説明する。
図8は、自動音声対話装置100による応答シナリオを示す木構造の一部の一例を示すである。
なお便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、説明を省略する。
本実施形態においても図1及び図2に示す構成を用いる。また、本実施形態においても、システムによる処理の流れは、基本的に実施形態1に係るシステムと同様である。ただし、本実施形態に係るシステムは、以下の点において、実施形態1、2の各システムと異なっている。
即ち、音声認識・合成処理部122は、ステップS3において、自動音声対話におけるユーザと自動音声対話装置100との間のやりとりのおおよそ全体を把握できるような文字情報を生成する。
図8の木構造が示す複数(9つ)のシナリオのうち、オペレータに通話が転送されることになる1つのシナリオを例に挙げる。即ち、ユーザが、「どんなお困りですか?」という質問に「画面が映らない」と答え、ランプの色を問い合わせる質問に「点滅」と答え、再起動で改善するかを問い合わせる質問に「再起動で改善しない」と答えるシナリオを例として挙げる。
このシナリオでは、音声認識・合成処理部122は、ステップS3において、自動音声対話装置100による各質問と、各質問に対するユーザの回答の音声認識結果に基づいて、「画面が映らず、ランプが点滅せず、再起動で改善しない」ことを示す文字情報を生成する。
図8の木構造が示す複数のシナリオのうち、オペレータに通話が転送されることになる他の各シナリオについても、基本的に同様のことが言える。
例えば、ユーザが、「どんなお困りですか?」という質問に「画面が映らない」と答え、ランプの色を問い合わせる質問に「紫」と答えた場合、音声認識・合成処理部122は、「画面が映らない」ことを示す文字情報を生成する。
その後、ステップS6、S12、S13では、ステップS3で生成された文字情報が、実施形態1、2における問い合わせ内容を示す文字情報に代えて、送信される。
なお、ユーザの発話内容がどのシナリオにも対応しない場合、ステップS6、S12、S13において、ユーザの発言に対する音声認識結果を示す文字情報がそのまま送信される。
その後、ステップS14において、画面処理部223は、上記文字情報を含むオペレーション画面を表示する。
〔システムの利点〕
上述のように、本実施形態では、音声認識・合成処理部122は、自動音声対話におけるユーザと自動音声対話装置100との間のやりとりのおおよそ全体を把握できるような文字情報を生成する。また、画面処理部223は、ユーザとの通話の接続状態において、当該文字情報を表示する。
従って、本実施形態に係るシステムは、転送された接続状態にある通話におけるユーザの発言として問い合わせの内容のみをオペレーション画面5に表示する実施形態1のシステムに比べて、当該通話における発信者とオペレータとの会話を一層円滑にできる。
〔実施形態1〜3の付記事項〕
会話データ152には、ユーザと自動音声対話装置100との間のやりとりを示す文字情報のみならず、ユーザと通話対応者(実施形態1〜3ではオペレータ)との間のやりとりを示す文字情報が含まれてもよい。この文字情報は、ユーザによる通話対応者に向けた各発言、及び/又は、通話対応者によるユーザに向けた各発言を示すものであってもよい。
この場合、ステップS15において、音声処理部222が、ユーザと通話対応者との間のやりとりを示す文字情報を会話データ152の一部として記憶部150に記録してもよい。
〔実施形態1〜3の変形例〕
(変形例1)
実施形態1〜3では、ユーザと自動音声対話装置100との間の通話は、オペレータに転送される。しかしながら、本発明は実施形態1〜3には限定されない。
例えば、配送業者に対する荷物の配送状況の問い合わせに対応するシステムであって、ユーザと自動音声対話装置100との間の通話がその荷物を配送する運転者(通話対応者)の端末に転送されるシステムも、本発明の範疇に含まれる。この場合、当該運転者の端末が、実施形態1〜3におけるオペレータ端末200(通話対応者の端末)の役割を果たす。
この場合、運転者の端末には、通話の転送を受け入れるか、再び自動音声対話装置100が自動応答を行うことを要求するかを選択するための部品が設けられていてもよい。
また、運転者の端末には、通話の転送を受け入れる操作が行われた後において、再び自動音声対話装置100が自動応答を行うことを要求するための部品が設けられていてもよい。当該部品の操作によって、ユーザの問い合わせに対する回答が完了したことが自動音声対話装置100に示されてもよい。
これらの部品は、ソフトウェアによっても実現してもよいし、ハードウェアによって実現してもよい。
運転者が、再び自動音声対話装置100が自動応答を行うことを要求する操作を行った場合、運転者の端末は、ユーザとの間の通話を自動音声対話装置100に再転送するように、自動応答装置10にリクエストしてもよい。そして、自動応答装置10は、リクエストに基づき、ユーザとの間の通話を自動音声対話装置100に再転送してもよい。
これにより、運転者は、ユーザとの通話を開始(あるいは継続)するか否かを決定することができる。
なお、運転者がユーザの問い合わせに回答した場合には、再転送を受けた自動音声対話装置100は、ユーザの他の問い合わせを受け付け付けるためにユーザとの通話を開始してもよい。あるいは、運転者が通話の転送を受け入れなかった場合には、自動音声対話装置100は、オペレータに通話を転送するように自動応答装置10にリクエストしてもよい。
(変形例2)
実施形態1〜3の各システムは、オペレータがユーザとの会話を通話のみで行うように構成されている。
しかしながら、本発明は、そのような構成には限定されない。
即ち、オペレーション画面は、チャット機能、及び、当該チェット機能にアクセスするためのURL情報をユーザ端末1に送信するユーザインタフェース(UI)部品を備えていてもよい。例えば、当該UI部品は、ユーザ端末1にインストールされている特定のチャットアプリケーションに向けてURL情報を送信するためのUI部品であってもよい。
これにより、オペレータは、ユーザとの会話にチャットと通話を併用することで、ユーザとの会話をより円滑に進めることができる。
例えば、オペレーション画面5、5’の領域5fに示されている「たっぷりイチゴアイス」の詳細な成分情報をユーザが求めた場合、オペレータは、コピーアンドペースト機能を用いて当該成分情報をチャット画面にペーストしてもよい。これにより、オペレータは、詳細な成分情報を素早くユーザに伝えることができる。
なお、チャット機能には、ユーザが過去に話題にした内容と現在話題にしている内容(問い合わせ)とがチャット画面に混在する仕様のものが存在する。
このような仕様のチャット機能のみがユーザとの対話に使用されるシステムにおいては、オペレータは、チャット画面を見て、当該問い合わせの内容をすぐに把握することが難しい場合がある。
本変形例のシステムでは、オペレータは、オペレーション画面でユーザの問い合わせの内容を即座に把握でき、尚且つ、問い合わせの内容を把握してから問い合わせに回答するまでの時間を、チャット機能を用いて短縮することができる。
(変形例3)
実施形態1〜3において、ユーザと自動音声対話装置100との間の通話は、基本的にはオペレータに転送される。
しかしながら、手が空いているオペレータが存在しない場合、ステップS9で、オペレータ端末制御装置20はオペレータを選択できない。この場合、ステップS9で、オペレータ端末制御装置20は、オペレータへの転送が不可能である旨を自動応答装置10に通知する。
自動応答装置10は、この通知を、自動音声対話装置100に転送する。
この場合、通信処理部121は、コールバックリクエストをユーザが入力できる旨、及び、コールバックリクエストが入力された場合には後でオペレータからユーザに電話する旨を、ユーザ端末1に通知することになる。
ユーザがコールバックリクエストを入力すると、ユーザ端末1は、コールバックリクエストを自動音声対話装置100に送信する。記録処理部124は、ユーザ端末1の電話番号、及び、ユーザと自動音声対話装置100との間の通話のやりとりを示す文字情報を、コールバックリクエスト情報の一部として、記憶部150に記録する。
各オペレータ端末200の画面処理部223は、コールバックリクエスト情報を記憶部150から読み出して表示部230に表示する機能を有する。
なお、コールバックリクエスト情報に、コールバックリクエストされた時刻を示す情報を含めてもよい。これにより、各オペレータは、コールバックリクエストが滞留している時間を把握することができ、ひいては、滞留時間の長いコールバックリクエストに優先的に対応することができる。
オペレータが手操作受付部250を用いてコールバックリクエスト情報に含まれる電話番号に電話をかける操作を行い、通話が接続状態になると、画面処理部223は、例えば、図5または図6のオペレーション画面を表示部に表示する。
(変形例4)
実施形態1〜3の各システムは、ユーザ(発信者)が通話で使用する言語とオペレータが通話で使用する言語が同じ言語であることを前提とするシステムであるが、本発明はこれらのシステムには限定されない。
即ち、通話でユーザが使用する言語が通話でオペレータが使用する言語(以下、所定の言語)とは異なる場合においてもユーザの問い合わせに対応できるシステムも、本発明の範囲に含まれる。なお、所定の言語としては、例えば、日本語が挙げられる。
そのようなシステムにおいては、音声認識・合成処理部122は、ユーザの通話音声に対する音声認識処理の結果から、ユーザが通話で使用している言語を特定してもよい。例えば、ユーザが所定の言語以外の言語(例えば、中国語)を通話で使用した場合、音声認識・合成処理部122は、ユーザが通話で使用している言語が中国語であることを特定してもよい。
そして、音声認識・合成処理部122は、ユーザが通話で使用している言語が所定の言語以外の言語であることを特定した場合には、以下の各処理を実行してもよい。
即ち、音声認識・合成処理部122は、当該発話(問い合わせ)の内容を示す文字情報を、ユーザが通話で使用している言語から所定の言語に翻訳してもよい。
そして、音声認識・合成処理部122は、所定の言語に翻訳された文字情報に基づいて、当該問い合わせに対する、所定の言語で記録されている応答内容を、知識DB151から検索してもよい。
さらに、音声認識・合成処理部122は、検索された応答内容を所定の言語からユーザが通話で使用している言語に翻訳し、翻訳後の言語の音声の信号であって当該応答内容を示す音声の信号をユーザ端末1に送信してもよい。
以上のように、音声認識・合成処理部122は、ステップS3において上記の各処理を実行するために翻訳機能を使用するようになっていてもよい。
これにより、ユーザが通話に使用している言語を理解できないオペレータであっても、ユーザとの通話を円滑に進めることができる。
なお、本変形例においては、ステップS6、S12、S13で送信される、ユーザの問い合わせ内容を示す情報は、当該問い合わせ内容を所定の言語によって示した情報である。そのため、ユーザが通話に使用している言語を理解できないオペレータであっても、オペレーション画面を通じてユーザの問い合わせの内容を即座に把握できる。
また、本変形例と変形例2を組み合わせてもよい。
この場合、オペレータ端末200(チャットアプリケーションを実行する制御部220)は、ユーザが所定の言語以外の言語のメッセージをユーザ端末1のチャット画面に入力した場合、そのメッセージを所定の言語に翻訳してもよい。そして、制御部220は、翻訳後のメッセージを表示部230に表示されているチャット画面に表示してもよい。
同様に、ユーザ端末1にインストールされたチャットアプリケーションは、オペレータが入力した所定の言語のメッセージをユーザがチャットで使用する言語に翻訳してもよい。そして、当該チャットアプリケーションは、翻訳後のメッセージをユーザ端末1のチャット画面に表示してもよい。
これにより、ユーザが通話に使用している言語を理解できないオペレータであっても、ユーザとの対話を、通話及びチャットを用いて円滑に進めることができる。また、ユーザが通話に使用している外国語を理解できるオペレータにとっても、通話及びチャットで当該外国語を用いてユーザとコミュニケーションを取った場合に感じる負担感がなくなる、というメリットがある。
〔実施形態4〕
上記各実施形態では、複数のサーバ(自動応答装置10、自動音声対話装置100、オペレータ端末制御装置20、及び、表示用データ処理装置30)を使用したが、これらのサーバの全ての機能を備えた1つのサーバを使用する構成としてもよい。あるいは、上記複数のサーバよりもさらに多くのサーバを用いてもよい。そして、複数のサーバを適用する場合においては、各サーバは、同じ事業者によって管理されていてもよいし、異なる事業者によって管理されていてもよい。
〔実施形態5〕
自動音声対話装置100およびオペレータ端末200の各ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。後者の場合、自動音声対話装置100およびオペレータ端末200のそれぞれを、図9に示すようなコンピュータ(電子計算機)を用いて構成することができる。
図9は、自動音声対話装置100またはオペレータ端末200として利用可能なコンピュータ910の構成を例示したブロック図である。コンピュータ910は、バス911を介して互いに接続された演算装置912と、記憶装置913(主記憶装置及び/又は補助記憶装置)と、入出力インターフェース914と、通信インターフェース915とを備えている。演算装置912および記憶装置913は、それぞれ、例えばプロセッサ(例えばCPU:Central Processing Unit等)、RAM(random access memory)、ハードディスクドライブであってもよい。入出力インターフェース914には、ユーザがコンピュータ910に各種情報を入力するための入力装置920、および、コンピュータ910がユーザに各種情報を出力するための出力装置930が接続される。入力装置920および出力装置930は、コンピュータ910に内蔵されたものであってもよいし、コンピュータ910に接続された(外付けされた)ものであってもよい。例えば、入力装置920は、キーボード、マウス、タッチセンサなどであってもよく、出力装置930は、ディスプレイ、プリンタ、スピーカなどであってもよい。また、タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力装置920および出力装置930の双方の機能を有する装置を適用してもよい。そして、通信インターフェース916は、コンピュータ910が外部の装置と通信するためのインターフェースである。
記憶装置913には、コンピュータ910を自動音声対話装置100またはオペレータ端末200として動作させるための各種のプログラムが格納されている。そして、演算装置912は、補助記憶装置に格納された上記プログラムを主記憶装置上に展開して該プログラムに含まれる命令を実行することによって、コンピュータ910を、自動音声対話装置100またはオペレータ端末200が備える各部として機能させる。なお、補助記憶装置が備える、プログラム等の情報を記録する記録媒体は、コンピュータ読み取り可能な「一時的でない有形の媒体」であればよく、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブル論理回路などであってもよい。また、記録媒体に記録されているプログラムを、主記憶装置上に展開することなく実行可能なコンピュータであれば、主記憶装置を省略してもよい。なお、上記各装置(演算装置912、主記憶装置、補助記憶装置、入出力インターフェース914、通信インターフェース915、入力装置920、および出力装置930)は、それぞれ1つであってもよいし、複数であってもよい。
また、上記プログラムは、コンピュータ910の外部から取得してもよく、この場合、任意の伝送媒体(通信ネットワークや放送波等)を介して取得してもよい。そして、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る問い合わせ処理方法は、発信者からの通話による問い合わせを受け付けるシステムによって実行される問い合わせ処理方法であって、上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定するステップと、特定された上記問い合わせの内容に対する応答内容を検索するステップと、検索された上記応答内容を示す音声信号を上記発信者の端末(ユーザ端末1)に送信するステップと、上記検索の結果に基づいて、上記通話を通話対応者(オペレータ、運転者)の端末に転送するステップと、上記通話対応者の端末に内蔵又は接続された表示部230に上記問い合わせの内容を示す情報を表示するステップと、を含む方法である。
本発明の態様2に係る問い合わせ処理方法は、上記の態様1において、上記通話対応者(運転者)の端末に対する所定のアクションを検出した場合に、当該オペレータ端末200に転送された上記通話を転送元(自動音声対話装置100)に再転送するステップをさらに含む、方法としてもよい。
本発明の態様3に係る問い合わせ処理方法は、上記の態様1または2において、上記通話対応者(オペレータ)の操作(再生ボタン5hの操作)をトリガとして、上記問い合わせの内容を音声再生するステップをさらに含む、方法としてもよい。
本発明の態様4に係る問い合わせ処理方法は、上記の態様1〜3のいずれかにおいて、上記音声認識結果に基づいて、上記通話の内容に関連する関連情報を検索するステップと、当該関連情報を上記通話対応者の端末に表示するステップと、をさらに含む方法としてもよい。
本発明の態様5に係る問い合わせ処理方法は、上記の態様1〜4のいずれかにおいて、上記音声認識結果に基づいて上記発信者に関する情報(属性情報等)を取得するステップと、上記発信者に関する情報に基づいて複数の候補者の中から上記通話対応者を選択するステップと、をさらに含む方法としてもよい。
本発明の態様6に係る問い合わせ処理方法は、上記の態様1〜5のいずれかにおいて、上記音声認識結果に基づいて、上記発信者が上記通話で使用している言語を特定するステップと、上記発信者が上記通話で使用している言語が所定の言語以外の言語である場合に、上記問い合わせの内容を上記所定の言語に翻訳するステップと、をさらに含み、上記発信者が上記通話で使用している言語が上記所定の言語以外の言語である場合、上記検索するステップでは、上記所定の言語に翻訳された上記問い合わせの内容に対する、上記所定の言語で記録された上記応答内容を検索し、上記発信者が上記通話で使用している言語が上記所定の言語以外の言語である場合に、上記応答内容を上記所定の言語から上記発信者が上記通話で使用している言語に翻訳するステップをさらに含み、上記発信者が上記通話で使用している言語が上記所定の言語以外の言語である場合、上記送信するステップでは、上記発信者が上記通話で使用している言語に翻訳された上記応答内容を示す音声信号を上記発信者の端末に送信する、方法としてもよい。
本発明の態様7に係るシステムは、自動音声対話装置100と、通話対応者の端末(オペレータ端末200)と、を含み、発信者からの通話による問い合わせを受け付けるシステムであって、上記自動音声対話装置100は制御部120を備え、上記自動音声対話装置100の上記制御部120は、上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定し、特定された上記問い合わせの内容に対する応答内容を検索し、上記検索の結果に基づいて、上記通話を上記オペレータ端末200に転送することをトリガし、転送された上記通話の接続状態において上記オペレータ端末200が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力し、上記オペレータ端末200は表示部230と制御部220とを備え、上記オペレータ端末200の上記制御部220は、上記自動音声対話装置100によってトリガされた上記通話の転送を受け付ける処理を行い、転送された上記通話の接続状態において上記問い合わせの内容を示す情報を上記表示部230に表示させる、構成である。
本発明の態様8に係る端末(オペレータ端末200)は、表示部230と制御部220とを備えている端末であって、上記制御部220は、自動音声対話装置100によってトリガされた発信者との通話の転送を受け付ける処理を行い、転送された上記通話の接続状態において上記発信者の問い合わせの内容を示す情報を上記表示部230に表示させる、構成である。
本発明の態様9に係る自動音声対話装置100は、制御部110を備えている自動音声対話装置であって、上記制御部110は、発信者との通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記発信者の問い合わせの内容を特定し、特定された上記問い合わせの内容に対する応答内容を検索し、上記検索の結果に基づいて、上記通話を通話対応者の端末(オペレータ端末200)に転送することをトリガし、転送された上記通話の接続状態において上記オペレータ端末200が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力する処理を行う、構成である。
本発明の態様10に係る表示処理方法は、端末(オペレータ端末200)によって実行される表示処理方法であって、自動音声対話装置100によってトリガされた発信者との通話の転送を受け付ける処理を行うステップと、転送された上記通話の接続状態において上記発信者の問い合わせの内容を示す情報を表示部230に表示させるステップと、を含む方法である。
本発明の態様11に係る通話制御方法は、自動音声対話装置100によって実行される通話制御方法であって、発信者との通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記発信者の問い合わせの内容を特定するステップと、特定された上記問い合わせの内容に対する応答内容を検索するステップと、上記検索の結果に基づいて、発信者との通話を通話対応者の端末(オペレータ端末200)に転送することをトリガするステップと、転送された上記通話の接続状態において上記オペレータ端末200が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力するステップと、を含む方法である。
本発明の上記態様に係る端末は、コンピュータによって実現してもよく、この場合には、コンピュータを上記端末が備える各部(ソフトウェア要素)として動作させることにより上記端末をコンピュータにて実現させる制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明の上記態様に係る自動音声対話装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記自動音声対話装置が備える各部(ソフトウェア要素)として動作させることにより上記自動音声対話装置をコンピュータにて実現させる制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1 ユーザ端末(発信者の端末)
100 自動音声対話装置
120 制御部
150 記憶装置(記憶部)
200 オペレータ端末(通話対応者の端末)
220 制御部
230 表示装置(表示部)

Claims (13)

  1. 発信者からの通話による問い合わせを受け付けるシステムによって実行される問い合わせ処理方法であって、
    上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定するステップと、
    特定された上記問い合わせの内容に対する応答内容を検索するステップと、
    検索された上記応答内容を示す音声信号を上記発信者の端末に送信するステップと、
    上記検索の結果に基づいて、上記通話を通話対応者の端末に転送するステップと、
    上記通話対応者の端末に内蔵又は接続された表示部に上記問い合わせの内容を示す情報を表示するステップと、を含むことを特徴とする問い合わせ処理方法。
  2. 上記通話対応者の端末に対する所定のアクションを検出した場合に、当該端末に転送された上記通話を転送元に再転送するステップをさらに含む、ことを特徴とする請求項1に記載の問い合わせ処理方法。
  3. 上記通話対応者の操作をトリガとして、上記問い合わせの内容を音声再生するステップをさらに含む、ことを特徴とする請求項1または2に記載の問い合わせ処理方法。
  4. 上記音声認識結果に基づいて、上記通話の内容に関連する関連情報を検索するステップと、
    当該関連情報を上記通話対応者の端末に表示するステップと、
    をさらに含むことを特徴とする請求項1〜3のいずれか1項に記載の問い合わせ処理方法。
  5. 上記音声認識結果に基づいて上記発信者に関する情報を取得するステップと、
    上記発信者に関する情報に基づいて複数の候補者の中から上記通話対応者を選択するステップと、
    をさらに含むことを特徴とする請求項1〜4のいずれか1項に記載の問い合わせ処理方法。
  6. 上記音声認識結果に基づいて、上記発信者が上記通話で使用している言語を特定するステップと、
    上記発信者が上記通話で使用している言語が所定の言語以外の言語である場合に、上記問い合わせの内容を上記所定の言語に翻訳するステップと、をさらに含み、
    上記発信者が上記通話で使用している言語が上記所定の言語以外の言語である場合、上記検索するステップでは、上記所定の言語に翻訳された上記問い合わせの内容に対する、上記所定の言語で記録された上記応答内容を検索し、
    上記発信者が上記通話で使用している言語が上記所定の言語以外の言語である場合に、上記応答内容を上記所定の言語から上記発信者が上記通話で使用している言語に翻訳するステップをさらに含み、
    上記発信者が上記通話で使用している言語が上記所定の言語以外の言語である場合、上記送信するステップでは、上記発信者が上記通話で使用している言語に翻訳された上記応答内容を示す音声信号を上記発信者の端末に送信する、ことを特徴とする請求項1〜5のいずれか1項に記載の問い合わせ処理方法。
  7. 自動音声対話装置と、通話対応者の端末と、を含み、発信者からの通話による問い合わせを受け付けるシステムであって、
    上記自動音声対話装置は制御部を備え、
    上記自動音声対話装置の上記制御部は、
    上記通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記問い合わせの内容を特定し、
    特定された上記問い合わせの内容に対する応答内容を検索し、
    上記検索の結果に基づいて、上記通話を上記通話対応者の端末に転送することをトリガし、
    転送された上記通話の接続状態において上記通話対応者の端末が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力し、
    上記通話対応者の端末は表示部と制御部とを備え、
    上記通話対応者の端末の上記制御部は、
    上記自動音声対話装置によってトリガされた上記通話の転送を受け付ける処理を行い、
    転送された上記通話の接続状態において上記問い合わせの内容を示す情報を上記表示部に表示させる、
    ことを特徴とするシステム。
  8. 表示部と制御部とを備えている端末であって、
    上記制御部は、
    自動音声対話装置によってトリガされた発信者との通話の転送を受け付ける処理を行い、
    転送された上記通話の接続状態において上記発信者の問い合わせの内容を示す情報を上記表示部に表示させる、ことを特徴とする端末。
  9. 制御部を備えている自動音声対話装置であって、
    上記制御部は、
    発信者との通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記発信者の問い合わせの内容を特定し、
    特定された上記問い合わせの内容に対する応答内容を検索し、
    上記検索の結果に基づいて、上記通話を通話対応者の端末に転送することをトリガし、
    転送された上記通話の接続状態において上記通話対応者の端末が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力する処理を行う、
    ことを特徴とする自動音声対話装置。
  10. 端末によって実行される表示処理方法であって、
    自動音声対話装置によってトリガされた発信者との通話の転送を受け付ける処理を行うステップと、
    転送された上記通話の接続状態において上記発信者の問い合わせの内容を示す情報を表示部に表示させるステップと、
    を含むことを特徴とする表示処理方法。
  11. 自動音声対話装置によって実行される通話制御方法であって、
    発信者との通話を介して取得された上記発信者の発話音声に対する音声認識結果に基づいて、上記発信者の問い合わせの内容を特定するステップと、
    特定された上記問い合わせの内容に対する応答内容を検索するステップと、
    上記検索の結果に基づいて、発信者との通話を通話対応者の端末に転送することをトリガするステップと、
    転送された上記通話の接続状態において上記通話対応者の端末が上記発信者の問い合わせの内容を示す情報を表示できるように、上記問い合わせの内容を出力するステップと、
    を含むことを特徴とする通話制御方法。
  12. 請求項8に記載の端末としてコンピュータを機能させるための制御プログラムであって、上記制御部としてコンピュータを機能させるための制御プログラム。
  13. 請求項9に記載の自動音声対話装置としてコンピュータを機能させるための制御プログラムであって、上記制御部としてコンピュータを機能させるための制御プログラム。
JP2018090157A 2018-05-08 2018-05-08 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム Pending JP2019197977A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018090157A JP2019197977A (ja) 2018-05-08 2018-05-08 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム
US16/291,662 US20190349480A1 (en) 2018-05-08 2019-03-04 Inquiry processing method, system, terminal, automatic voice interactive device, display processing method, telephone call controlling method, and storage medium
CN201910163743.3A CN110475030A (zh) 2018-05-08 2019-03-05 询问处理方法、系统、终端、自动语音对话装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018090157A JP2019197977A (ja) 2018-05-08 2018-05-08 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム

Publications (1)

Publication Number Publication Date
JP2019197977A true JP2019197977A (ja) 2019-11-14

Family

ID=68464370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018090157A Pending JP2019197977A (ja) 2018-05-08 2018-05-08 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム

Country Status (3)

Country Link
US (1) US20190349480A1 (ja)
JP (1) JP2019197977A (ja)
CN (1) CN110475030A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021079895A (ja) * 2019-11-22 2021-05-27 株式会社Mobility Technologies コミュニケーションシステム、コミュニケーション方法及び情報端末
JP2021131826A (ja) * 2020-02-21 2021-09-09 株式会社Pid 情報検索システム、情報検索プログラム、及び情報検索方法
JP7381666B1 (ja) 2022-07-13 2023-11-15 株式会社Nttドコモ 応答装置
JP7526714B2 (ja) 2021-09-17 2024-08-01 株式会社日立ビルシステム 応答方法提案システム、および、応答方法提案方法
JP7556222B2 (ja) 2020-06-25 2024-09-26 富士通株式会社 コールセンタシステム、情報処理装置、チャット履歴表示方法及びチャット履歴表示プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023102912A1 (en) * 2021-12-10 2023-06-15 Lenovo (Beijing) Limited Methods and apparatus of determining format of uplink and downlink transmissions for full duplex time division duplex

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316383A (ja) * 2002-04-22 2003-11-07 It Communications:Kk 音声応答システム
JP2004309965A (ja) * 2003-04-10 2004-11-04 Advanced Media Inc 会議録音・書き起こしシステム
JP2008072404A (ja) * 2006-09-13 2008-03-27 Promise Co Ltd 電話応答システム
JP2008153889A (ja) * 2006-12-15 2008-07-03 Promise Co Ltd 応答業務取次システム
US20100166158A1 (en) * 2008-12-29 2010-07-01 Nortel Networks Limited Method for Analysing an Interactive Voice Response System
CN103795877A (zh) * 2012-10-29 2014-05-14 殷程 智能语音
JP2016103270A (ja) * 2014-11-12 2016-06-02 株式会社アドバンスト・メディア 情報処理システム、受付サーバ、情報処理方法及びプログラム
JP2017152948A (ja) * 2016-02-25 2017-08-31 株式会社三菱東京Ufj銀行 情報提供方法、情報提供プログラム、および情報提供システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6016336A (en) * 1997-11-18 2000-01-18 At&T Corp Interactive voice response system with call trainable routing
US6934377B2 (en) * 2001-09-25 2005-08-23 Bellsouth Intellectual Property Corporation On demand call re-termination
US6771746B2 (en) * 2002-05-16 2004-08-03 Rockwell Electronic Commerce Technologies, Llc Method and apparatus for agent optimization using speech synthesis and recognition
JP4734191B2 (ja) * 2006-07-31 2011-07-27 富士通株式会社 オペレータ支援プログラム、オペレータ支援装置およびオペレータ支援方法
US8675842B2 (en) * 2010-03-30 2014-03-18 Verizon Patent And Licensing Inc. Speech usage and performance tool
US8391464B1 (en) * 2010-06-24 2013-03-05 Nuance Communications, Inc. Customer service system, method, and software program product for responding to queries using natural language understanding
KR102246893B1 (ko) * 2013-12-11 2021-04-30 삼성전자주식회사 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
CN105592237B (zh) * 2014-10-24 2019-02-05 中国移动通信集团公司 一种会话切换的方法、装置及智能客服机器人
CN106598955A (zh) * 2015-10-20 2017-04-26 阿里巴巴集团控股有限公司 语音翻译方法及装置
CN107135247B (zh) * 2017-02-16 2019-11-29 江苏南大电子信息技术股份有限公司 一种人与人工智能协同工作的服务系统及方法
CN107315766A (zh) * 2017-05-16 2017-11-03 广东电网有限责任公司江门供电局 一种集合智能与人工问答的语音问答方法及其装置
CN107704506B (zh) * 2017-08-30 2021-03-30 华为技术有限公司 智能应答的方法和装置
US11183182B2 (en) * 2018-03-07 2021-11-23 Google Llc Systems and methods for voice-based initiation of custom device actions

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316383A (ja) * 2002-04-22 2003-11-07 It Communications:Kk 音声応答システム
JP2004309965A (ja) * 2003-04-10 2004-11-04 Advanced Media Inc 会議録音・書き起こしシステム
JP2008072404A (ja) * 2006-09-13 2008-03-27 Promise Co Ltd 電話応答システム
JP2008153889A (ja) * 2006-12-15 2008-07-03 Promise Co Ltd 応答業務取次システム
US20100166158A1 (en) * 2008-12-29 2010-07-01 Nortel Networks Limited Method for Analysing an Interactive Voice Response System
CN103795877A (zh) * 2012-10-29 2014-05-14 殷程 智能语音
JP2016103270A (ja) * 2014-11-12 2016-06-02 株式会社アドバンスト・メディア 情報処理システム、受付サーバ、情報処理方法及びプログラム
JP2017152948A (ja) * 2016-02-25 2017-08-31 株式会社三菱東京Ufj銀行 情報提供方法、情報提供プログラム、および情報提供システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021079895A (ja) * 2019-11-22 2021-05-27 株式会社Mobility Technologies コミュニケーションシステム、コミュニケーション方法及び情報端末
JP7436184B2 (ja) 2019-11-22 2024-02-21 Go株式会社 コミュニケーションシステム、コミュニケーション方法及び情報端末
JP2021131826A (ja) * 2020-02-21 2021-09-09 株式会社Pid 情報検索システム、情報検索プログラム、及び情報検索方法
JP7023535B2 (ja) 2020-02-21 2022-02-22 株式会社Pid 情報検索システム、情報検索プログラム、及び情報検索方法
JP7556222B2 (ja) 2020-06-25 2024-09-26 富士通株式会社 コールセンタシステム、情報処理装置、チャット履歴表示方法及びチャット履歴表示プログラム
JP7526714B2 (ja) 2021-09-17 2024-08-01 株式会社日立ビルシステム 応答方法提案システム、および、応答方法提案方法
JP7381666B1 (ja) 2022-07-13 2023-11-15 株式会社Nttドコモ 応答装置
JP2024010851A (ja) * 2022-07-13 2024-01-25 株式会社Nttドコモ 応答装置

Also Published As

Publication number Publication date
US20190349480A1 (en) 2019-11-14
CN110475030A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
JP2019197977A (ja) 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム
US10812655B1 (en) Methods and systems for seamless outbound cold calls using virtual agents
US9813495B1 (en) Systems and methods for chat message notification
US20210136205A1 (en) Methods and systems of virtual agent real-time recommendation, suggestion and advertisement
US11762629B2 (en) System and method for providing a response to a user query using a visual assistant
US20210134284A1 (en) Methods and systems for personalized virtual agents to learn from customers
US20210134283A1 (en) Methods and systems of virtual agent real-time recommendation, suggestion and advertisement
US20210133765A1 (en) Methods and systems for socially aware virtual agents
US20210133763A1 (en) Methods and systems for socially aware virtual agents
US20210134282A1 (en) Methods and systems for personalized virtual agents to learn from customers
US20210136204A1 (en) Virtual agents within a cloud-based contact center
US20210136206A1 (en) Virtual agents within a cloud-based contact center
US11336767B2 (en) Methods and apparatus for bypassing holds
US20210136208A1 (en) Methods and systems for virtual agent to understand and detect spammers, fraud calls, and auto dialers
US20210136195A1 (en) Methods and systems for virtual agent to understand and detect spammers, fraud calls, and auto dialers
KR102217301B1 (ko) 개인 일정 및 라이프 스타일을 반영한 인공지능의 컨텍 제어
US20210136209A1 (en) Methods and systems for virtual agents to check caller identity via multi channels
JP2015528678A (ja) 呼分析を学習する方法およびシステム
US20120258769A1 (en) Voice input system and information storage medium storage voice input program
US20240080283A1 (en) Information processing system and information processing method
KR101251697B1 (ko) 다이얼로그 작성 및 실행 프레임워크
JP2019144400A (ja) 制御装置、制御方法及びコンピュータプログラム
US20210133764A1 (en) Methods and systems for virtual agents to check caller identity via multi channels
JP2005292476A (ja) 顧客応対方法及び装置
US20210133533A1 (en) Methods and systems for seamless outbound cold calls using virtual agents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200331

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201006