JP2020003772A - 顧客要求サービスのための音声対話方法及び装置 - Google Patents

顧客要求サービスのための音声対話方法及び装置 Download PDF

Info

Publication number
JP2020003772A
JP2020003772A JP2019046997A JP2019046997A JP2020003772A JP 2020003772 A JP2020003772 A JP 2020003772A JP 2019046997 A JP2019046997 A JP 2019046997A JP 2019046997 A JP2019046997 A JP 2019046997A JP 2020003772 A JP2020003772 A JP 2020003772A
Authority
JP
Japan
Prior art keywords
request
service
client terminal
voice
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019046997A
Other languages
English (en)
Other versions
JP7037517B2 (ja
Inventor
シャンタン チャン
Shang Tang Zhang
シャンタン チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2020003772A publication Critical patent/JP2020003772A/ja
Application granted granted Critical
Publication of JP7037517B2 publication Critical patent/JP7037517B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5183Call or contact centers with computer-telephony arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/10Aspects of automatic or semi-automatic exchanges related to the purpose or context of the telephonic communication
    • H04M2203/1083Aspects of automatic or semi-automatic exchanges related to the purpose or context of the telephonic communication for hotels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】クライアント端末と、サービス管理システムと、顧客との間の対話を実現し顧客の要求を迅速且つ知能的に認識して相応的なサービスを提供することができる顧客要求サービスのための音声対話方法及び装置を提供する。【解決手段】方法は、クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信することと、音声要求指令を音声認識することと、音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、クライアント端末識別子と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信することを含む。【選択図】図1

Description

本発明は、人工知能の技術分野に関し、特に、顧客要求サービスのための音声対話方法及び装置に関する。
従来技術において、顧客がサービスを求める時に、ホテルの部屋内の電話を通してホテルのサービススタッフに連絡する必要がある。しかし、このような過程は、取り扱いが簡単なものではない。顧客は、ホテルの電話番号に慣れていないので、電話をかける前に、サービスカウンターの番号を検索する必要があるため、時間が無駄になる可能性がある。そして、短時間に複数の人がサービスカウンターに同時に電話をかけている場合、回線が混んでいることになり、顧客の問題を速やかに解決できない。また、ホテルの各部屋に電話を設置すること、及び対応する顧客サービス担当者に電話に答えるように手配させることは、ホテルの運営費を増大させる可能性がある。
背景技術に開示された上記の情報は、本発明の背景に対する理解を深めるためのものであり、当業者に知られている従来技術ではない情報も含む可能性がある。
本発明の実施例は、従来技術の一つ又は複数の技術課題を解決するために、顧客要求サービスのための音声対話方法及び装置を提供する。
第1態様において、本発明の実施例は、顧客要求サービスのための音声対話方法であって、
クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信することと、
前記音声要求指令を音声認識することと、
前記音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、前記クライアント端末識別子と前記所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信することと、を含む顧客要求サービスのための音声対話方法を提供する。
第1態様を参照しながら、本発明の実施例は、第1態様の第1の実現形態において、前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックすることを更に含む。
第1態様を参照しながら、本発明の実施例は、第1態様の第2の実現形態において、前記音声要求指令を音声認識することは、
前記音声要求指令を要求テキスト情報に変換することと、
前記要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングすることと、
前記データベースから前記要求テキスト情報と同じ内容の前記合法的テキスト情報がマッチングされた場合に、認識に成功したとすることと、を含む。
第1態様を参照しながら、本発明の実施例は、第1態様の第3の実現形態において、所望のサービス種類に基づいてサービス提供リクエストをサービス管理システムに送信することは、
前記クライアント端末識別子に基づいて対応する部屋の番号を検索することと、
前記部屋の番号と前記所望のサービス種類を含む前記サービス提供リクエストを前記サービス管理システムに送信することと、を含む。
本発明の実施例の第1態様の第1の実現形態を参照しながら、本発明の実施例は、第1態様の第4の実現形態において、前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックすることは、
前記所望のサービス種類に基づいて、フィードバックテキスト情報を生成することと、
フィードバックテキスト情報をフィードバック音声に変換することと、
前記フィードバック音声を前記クライアント端末識別子に対応する前記クライアント端末の音声対話装置に送信することと、を含む。
第2態様において、本発明の実施例は、顧客要求サービスのための音声対話装置であって、
クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信するための受信モジュールと、
前記音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、前記クライアント端末識別子と前記所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信するためのリクエスト送信モジュールと、を備える顧客要求サービスのための音声対話装置を提供する。
1つの可能な設計において、前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックするためのフィードバックモジュールを更に含む。
1つの可能な設計において、前記認識モジュールは、
前記音声要求指令を要求テキスト情報に変換するための第1変換サブモジュールと、
前記要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングするためのマッチングサブモジュールであって、前記データベースから前記要求テキスト情報と同じ内容の前記合法的テキスト情報がマッチングされた場合に、認識に成功したとするマッチングサブモジュールと、を備える。
1つの可能な設計において、前記リクエスト送信モジュールは、
前記クライアント端末識別子に基づいて対応する部屋の番号を検索するための検索サブモジュールと、
前記部屋の番号と前記所望のサービス種類を含む前記サービス提供リクエストを前記サービス管理システムに送信するための第1送信サブモジュールと、を備える。
1つの可能な設計において、前記フィードバックモジュールは、
前記所望のサービス種類に基づいて、フィードバックテキスト情報を生成するための生成サブモジュールと、
フィードバックテキスト情報をフィードバック音声に変換するための第2変換サブモジュールと、
前記フィードバック音声を前記クライアント端末識別子に対応する前記クライアント端末の音声対話装置に送信するための第2送信サブモジュールと、を備える。
第3態様において、本発明の実施例は、顧客要求サービスのための音声対話端末を提供する。
前記機能は、ハードウェアにより実現されてもよく、ハードウェアを通じて対応するソフトウェアを実行することにより実現されてもよい。前記ハードウェア又はソフトウェアは、上記の機能に対応する1つ又は複数のモジュールを含む。
1つの可能な設計において、顧客要求サービスのための音声対話端末の構成は、顧客要求サービスのための音声対話端末に前記第1態様における顧客要求サービスのための音声対話方法を実行させるプログラムを格納するためのメモリと、前記メモリに格納されたプログラムを実行するように配置されるプロセッサと、を備える。顧客要求サービスのための音声対話端末は、他のデバイス又は通信ネットワークとの通信をするための通信インタフェースを含んでもよい。
第4態様において、本発明の実施例は、顧客要求サービスのための音声対話端末に用いられるコンピュータソフトウェア指令を格納するためのコンピュータ可読記憶媒体であって、前記指令は、前記第1態様における顧客要求サービスのための音声対話方法を実行させるための、顧客要求サービスのための音声対話端末に用いられるプログラムを含むコンピュータ可読記憶媒体を提供する。
上記の技術案のうちの一つの技術案は、下記のような利点又は有益な効果を有する。本発明の実施例は、音声対話方式を採用することで、クライアント端末と、サービス管理システムと、顧客との間の対話が実現されたので、顧客の要求を迅速かつ知能的に認識して相応的なサービスを提供することができる。
上記の記載は明細書を説明するためのものに過ぎなく、いかなる方式で限定する意図はない。上述した例示的な態様、実施形態及び特徴のほか、添付図面及び以下の詳細な記載を参照することにより、本発明のさらなる態様、実施形態及び特徴は理解しやすいであろう。
添付図面において、別に限定されない限り、複数の図面における同じ符号は、同一又は類似の部材又は素子を示す。これらの図面は、必ずしも縮尺通りではない。これらの図面では、本発明によるいくつかの実施形態のみが示され、本発明の範囲を限定するものとして解釈されるべきではないことを理解されたい。
本発明の実施形態に係る顧客要求サービスのための音声対話方法を示すフローチャートである。 本発明の実施形態に係るステップS300を示す具体的なフローチャートである。 本発明の実施形態に係るホテルのシナリオに基づく顧客要求サービスのための音声対話を示すブロック図である。 本発明の実施形態に係る顧客要求サービスのための音声対話装置を示す構造模式図。 本発明の実施形態に係る顧客要求サービスのための音声対話端末を示す構造模式図。
以下、単に例示的な実施例の一部を簡単に説明する。記載された実施例は、当業者によって理解され得るように、本発明の精神又は範囲を逸脱しない限り、様々な異なる方法で変形可能である。よって、添付の図面及び説明は、実質的に例示的なものであり、限定的なものではないと見なされる。
本発明の実施例は、顧客要求サービスのための音声対話方法を提供し、図1に示すように、以下のステップを含む。
S100:クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信する。
クライアント端末識別子は、クライアント端末の具体的な位置情報を特定するためのものである。クライアント端末識別子は、顧客要求情報を送信する装置の識別子を含んでもよく、又は、顧客要求情報を送信する顧客の位置の識別子を含んでもよく、或いは、両者を含むことも可能である。クライアント端末は、顧客からの音声を受信するために使用可能であり、オーディオを再生するためにも使用可能である。オーディオとは、顧客にフィードバックされた具体的な内容を含む音声として理解されてもよく、又は、音楽やプロンプトなどのほかのオーディオであってもよい。クライアント端末は、本実施例で説明された機能を実現することができる限り、例えば、スマートスピーカ、スマート音声端末などの任意の音声対話装置を採用することができる。クライアント端末は、顧客の音声要求指令を受信した後に、顧客要求情報を通して自身の識別子と顧客の音声要求指令を制御センターに送信して認識されることができる。制御センターは、1つ又は複数の音声認識機能を備えるサーバを含むことが可能であり、これらのサーバは、ローカルに設置されてもよく、クラウドに設置されてもよい。
S200:音声要求指令を音声認識する。
制御センターは、顧客要求情報を受信した後に、そのクライアント端末識別子に基づいてその音声要求指令の送信元を判定することが可能である。例えば、ホテルの各部屋それぞれに1つのスマートスピーカが設けられると、部屋の番号とスピーカ識別子とが対応関係がある。クライアント端末識別子は、部屋の番号及び/又はスピーカ識別子を含んでもよい。顧客要求情報におけるクライアント端末識別子にはスピーカ識別子が含まれると、スピーカ識別子に基づいて対応する部屋の番号を検索することが可能である。顧客要求情報におけるクライアント端末識別子には部屋の番号が含まれると、部屋の番号に基づいて対応するスピーカ識別子を検索することが可能である。従って、制御センターが顧客要求情報を受信した後に、そのクライアント端末識別子に基づいて、その音声要求指令がどの部屋及び/又はどのスピーカからのものであるかを判定することが可能である。
音声要求指令は、顧客が話した具体的な内容を含むオーディオ情報であると理解することが可能である。例えば、音声要求指令は、「私はスリッパ一足が欲しい」、「私の部屋を掃除してください」、「夕食を私の部屋に送ってください」などのサービス提供リクエストを含むオーディオ情報を含んでもよいが、これに限定されない。制御センターは、音声要求指令を認識することにより、顧客が具体的にどのサービスが欲しいか、即ち所望のサービス種類を得ることが可能である。
S300:音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、クライアント端末識別子と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信する。
一実施例において、制御センターは、サービス提供リクエストに基づいて、認識された所望のサービス種類とクライアント端末識別子を具体的なサービス管理システムに送信する。サービス管理システムは、サービス提供リクエストを受信した後に、クライアント端末に具体的なサービスを提供し、サービススタッフを手配して顧客に相応的なサービスを提供したり、自動サービスを提供したりすることができる。実際のアプリケーションシナリオでは、サービス提供システムの実際の機能に応じて判定することが可能である。例えば、制御センターは、「スリッパ」と「部屋X」をホテルのサービス管理システムに送信する。ホテルのサービス管理システムは、このサービス提供リクエストを受信した後に、番号Xの部屋にスリッパを送るように具体的なスタッフを手配することが可能である。別の例では、制御センターは、「特定人の特定日にAからBへの航空券を予約する」と「部屋X」をホテルのサービス管理システムに送信する。ホテルのサービス管理システムは、このサービス提供リクエストを受信した後に、部屋Xの特定人のために航空券を予約することができる。
制御センターがサービス管理システムに送信したサービス提供リクエストにスピーカ識別子のみが含まれる場合に、サービス管理システムにおいてスピーカ識別子に対応する部屋の番号を検索することも可能である。
一実施例において、この方法は、クライアント端末識別子に基づいて、クライアント端末にサービス提供結果をフィードバックすることを更に含む。クライアント端末へのサービス提供結果のフィードバックは、サービス提供リクエストをサービス管理システムに送信すると同時に行ってもよく、サービス管理システムがサービスの提供を手配した後に行ってもよい。例えば、顧客の音声要求指令における所望のサービス種類が認識されると、相応的なサービスをすることを顧客へ通知する。別の例では、サービス管理システムは、サービス提供リクエストを受信し相応的なサービスを提供するサービススタッフを手配した後に、その結果をクライアント端末にフィードバックして、相応的なサービスをすることを顧客へ通知する。本実施例は、サービス提供結果をフィードバックする具体的なタイミングを限定せず、サービス提供結果の内容に応じて自由に選択することが可能である。例えば、サービス提供リクエストをサービス管理システムに送信すると同時に、「まもなくスリッパを提供いたします」、「まもなく航空券を予約いたします」を送信することが可能である。また、サービス管理システムは、「10時までにスリッパを提供するようにスタッフを手配いたしました」、「航空券は予約済みです」などのサービス提供結果をフィードバックすることが可能である。
また、サービス管理システムの処理の進み状況に基づいて、サービス提供結果をクライアント端末に複数回フィードバックすることが可能である。
1つの具体的な実施例において、クライアント端末識別子に基づいて、クライアント端末にサービス提供結果をフィードバックすることは、
サービス提供リクエストの内容に基づいて、対応するフィードバックテキスト情報を生成することと、
フィードバックテキスト情報をフィードバック音声に変換することと、
フィードバック音声をクライアント端末識別子に対応するクライアント端末の音声対話装置に送信することと、を含む。音声対話装置は、サービス提供結果を顧客に知らせる。
例えば、サービス提供リクエストの内容は、「私は、スリッパ一足が欲しい」であると、生成されたフィードバックテキスト情報は、「スリッパを直ちにあなたの部屋までお届けいたします」である。或いは、生成されたフィードバックテキスト情報は、「お客様からのリクエストを受け取りました。できるだけ早くサービスを手配いたします」である。フィードバックテキスト情報は、具体的なサービス提供リクエストの内容に対する相関応答であってもよく、サービス提供リクエストを受信したことを確認するための単純な応答であってもよい。
一実施例において、音声要求指令を音声認識することは、
音声要求指令を要求テキスト情報に変換することと、
要求テキスト情報と、データベースに記録された合法的テキスト情報とをマッチングすることと、を含む。ここで、合法的テキスト情報は、異なるサービス種類が記録された情報であることを理解されたい。
一実施例において、音声要求指令を音声認識することは、データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされた場合に、認識に成功したとすることを更に含む。
データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされなかった場合に、認識に失敗したとする。
1つの具体的な実施形態において、音声要求指令への音声認識に失敗した場合に、音声認識失敗の結果に基づいて、対応する認識失敗テキスト情報を生成する。認識失敗テキスト情報をフィードバック音声に変換し、クライアント端末識別子に対応するクライアント端末の音声対話装置に送信する。音声対話装置は、認識失敗の結果を顧客に知らせる。
1つの変形可能な実施形態において、音声要求指令への音声認識に失敗した場合に、失敗の結果を顧客にフィードバックするとともに、顧客が正しい音声要求指令を提供するように案内するための相応的な音声プロンプトを与えることも可能である。音声プロンプトは、顧客が選択するために用いられる、データベースにはどの種類のサービスが記録されているかに関する記述情報を含んでもよい。顧客の音声要求指令に応じて、所望のサービスがデータベースに記録されたサービス種類の1つであるか否かを顧客に尋ねることも可能である。
一実施例において、図2に示すように、所望のサービス種類に基づいてサービス提供リクエストをサービス管理システムに送信することは、
S310:部屋内に設置可能なクライアント端末の識別子に基づいて対応する部屋の番号を検索することと、
S320:部屋の番号と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信することと、
S330:サービス管理システムは、所望のサービス種類に基づいて、対応する番号の部屋にサービスを提供することとを含む。
一実施例において、クライアント端末が常に顧客音声を受信する状態にあることを回避するために、クライアント端末をウェイクアップさせるウェイクアップ語を設置することが可能である。顧客が対応するウェイクアップ語を話し出すと、クライアント端末は、顧客が話し出したサービス提供リクエストを受信して認識することができる。例えば、ウェイクアップ語は、「度ちゃん度ちゃん」であってもよい。顧客は、「度ちゃん度ちゃん」と言った後で、自分のサービス要求を話し続けることができる。
図3に示すように、一つの具体的な実施例において、本発明実施例に係る方法は、ホテルシナリオに適用される場合に、具体的に、次の通りである。
ホテルの部屋毎に1つのスマートスピーカを設け、オーディオ装置を顧客の音声サービス要求を受信するためのクライアント端末とする。例えば、部屋001のように、部屋毎に対応する部屋の番号を付ける。デバイス001のように、スマートスピーカ毎にも、唯一のクライアント端末識別子、即ID番号を付ける。そして、各部屋の番号は、部屋内のオーディオ装置のクライアント端末識別子と関連付けられる。クライアント端末識別子に基づいて所在の部屋の番号を検索してもよく、部屋の番号に基づいてその部屋内のスマートスピーカを検索してもよい。
ホテルにチェックインした顧客は、スマートスピーカと音声対話して、自分の要求を表現して、相応的な顧客要求サービスを提供するようにホテルに知らせることができる。顧客は、まずは部屋内のスマートスピーカをウェイクアップさせるようにウェイクアップ語(例えば、ウェイクアップ語は、「度ちゃん度ちゃん」である)を言う。次に、「私は、スリッパ一足が欲しい」と自分の要求を言う。スマートスピーカは、顧客の音声要求指令を受信した後、ホテルのサーバ(例えば、クラウド)に顧客要求情報を送信する。ただし、顧客要求情報には、スマートスピーカのクライアント端末識別子と、スマートスピーカにより処理された音声要求指令とが含まれている。
ホテルサーバは、受信された音声要求指令を音声認識する。音声要求指令を要求テキスト情報に変換し、要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングする。データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされた場合に、認識に成功したとする。認識成功後に、ホテルサーバは、ホテル管理システム(PMS,Property Management System)にサービス提供リクエストを送信する。ここで、ホテル管理システムは、サービス管理システムの一例である。ホテル管理システムは、スマートスピーカのクライアント端末識別子に基づいて、スマートスピーカの所在部屋の番号を検索する。例えば、部屋001の顧客は、スリッパ一足が欲しい。顧客のリクエストに応じて、ホテル管理システムは、具体的なサービスを提供するようにサービススタッフを手配することが可能である。
同時に、顧客管理システムがサーバに応答を送信し、サーバは、サービス提供リクエストの内容に基づいて、対応するフィードバックテキスト情報を生成する。例えば、「わかりました。スリッパ一足をお部屋まで届けるように直ちにサービススタッフを手配しますので、少々お待ちください」。次に、フィードバックテキスト情報を音声ストリーム情報(即ち、フィードバック音声)に合成し、フィードバック音声を部屋001のスマートスピーカに送信する。スマートスピーカは、「わかりました。スリッパ一足をお部屋まで届けるように直ちにサービススタッフを手配しますので、少々お待ちください。」をオーディオの形式で顧客に知らせる。これにより、顧客の要求を満足する。ここで、音声ストリーム情報を合成する過程は、TTS(text to speech、テキストを音声化する)技術を採用可能である。
本発明の実施例は、顧客要求サービスのための音声対話装置であって、図4に示すように、
クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信するための受信モジュール10と、
音声要求指令を音声認識するための認識モジュール20と、
音声要求指令における所望のサービス種類が認識された場合に、所望のサービス種類に基づいて、クライアント端末識別子と所望のサービス種類を含むサービス提供リクエストをサーバ管理システムに送信するためのリクエスト送信モジュール30とを備える、顧客要求サービスのための音声対話装置を提供する。
一実施例において、図4に示すように、この装置は、クライアント端末識別子に基づいて、サービス提供結果をクライアント端末にフィードバックするためのフィードバックモジュール40を更に含む。
一実施例において、認識モジュール20は、
音声要求指令を要求テキスト情報に変換するための第1変換サブモジュールと、
要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングするためのマッチングサブモジュールであって、データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされた場合に、認識に成功したとするマッチングサブモジュールと、を備える。
一実施例において、リクエスト送信モジュール30は、
クライアント端末識別子に基づいて対応する部屋の番号を検索するための検索サブモジュールと、
部屋の番号と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信するための第1送信サブモジュールと、を備える。
一実施例において、フィードバックモジュール40は、
フィードバックテキスト情報をフィードバック音声に変換するための第2変換サブモジュールと、
フィードバック音声をクライアント端末識別子に対応するスピーカに送信するための第2送信サブモジュールと、を備える。
本発明の実施例は、顧客要求サービスのための音声対話端末を提供し、図5に示すように、メモリ910とプロセッサ920を含み、メモリ910には、プロセッサ920により実行可能なコンピュータプログラムが格納されている。プロセッサ920は、コンピュータプログラムを実行すると、上記の実施例における顧客要求サービスのための音声対話方法を実現する。メモリ910とプロセッサ920の数は、1つであってもよく、複数であってもよい。
通信インタフェース930は、メモリ910とプロセッサ920が外部と通信するためのものである。
メモリ910は、高速ランダムアクセスメモリ(RAM)を含んでもよく、不揮発性メモリ(non−volatile memory)、例えば、少なくとも1つの磁気ディスクメモリを含んでもよい。
メモリ910、プロセッサ920、及び通信インタフェース930を独立に実現すると、メモリ910、プロセッサ920、及び通信インタフェース930は、バスを介して互いに接続し、互いに通信を実現することが可能である。バスは、業界標準アーキテクチャ(ISA,Industry Standard Achitecture)バス、周辺コンポーネント相互接続(PCI,Peripheral Component)バス又は拡張業界標準アーキテクチャ(EISA,Extended Industry Standard Component)バスなどである。バスは、アドレスバス、データバス、コントローラバスなどに区別されることが可能である。表現を容易にするために、図5には、一本の太線のみが示されているが、1本のバス又は1種類のバスしかないことを意味しない。
所望により、具体的には、メモリ910、プロセッサ920及び通信インタフェース930が1枚のチップに集積されると、メモリ910、プロセッサ920及び通信インタフェース930は、内部インタフェースを介して互いに通信を実現することが可能である。
本発明の実施例は、コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、該プログラムがプロセッサにより実行されると、上記のいずれかの実施例に記載の顧客要求サービスのための音声対話方法を実現するコンピュータ可読記憶媒体を提供する。
本発明の実施例の技術案は、音声対話方式を採用することで、クライアント端末と、サービス管理システムと、顧客との間の対話が実現されるので、それによってあまり手間をかけずに、顧客の要求を迅速且つ知能的に認識して相応的なサービスを提供することができる。そのようにして、電話装置の設置及び顧客サービススタッフの手配が効果的に低減され、サービスコストが節約されることができる。本発明の実施例の技術案は、顧客経験を向上し、便利且つ迅速に顧客のニーズを満たすことができる。同時に、複数の顧客のニーズを同時に満たすことができ、電話をかけるときに回線が混雑しているという状況を回避することができる。
本発明の実施例は、リアルタイム道路ネットワークデータとドットデータに基づいて特定のエリアのエリアタイプと境界を認識することができるので、現在の期間で認識された領域の種類、境界の実効性及び精度を確保することができる。これに加えて、関心点と関連付けることにより、認識されたエリアタイプを基に、そのエリアへの商業的な解析をより多く実行することが可能であり、適用範囲は幅広い。例えば、ビッグデータマーケティング、サイト選定、売上予測などの様々な異なるニーズに適用できる。
本明細書の記載において、「一実施例」、「いくつかの実施形態」、「例」、「具体的な例」又は「実施例の一部」などの用語は、本発明の実施例や実施形態を参照しながら記載した具体的な特徴、構造、材料又は特徴が本発明の少なくとも1つの実施例や実施形態に含まれることを意味する。そして、記載された具体的な特徴、構造、材料又は特徴は、いずれか一つの又は複数の実施例や実施形態において適切な方法で組み合わせることができる。相互に矛盾が生じない限り、当業者は、本明細書に記載された異なる実施例や実施形態及び異なる実施例や実施形態の特徴を組み合わせて結合することが可能である。
また、「第1」、「第2」という用語は、説明の目的でのみ使用されており、相対的な重要性を指示又は暗示したり、示される技術的特徴の数を暗黙的に指すと解釈されるべきではない。したがって、「第1」、「第2」により限定された特徴は、少なく1つの特徴を含むことを明示的又は暗黙的に示されることが可能である。本発明の記載において、「複数」とは、明確かつ具体的な限定がない限り、2つ又は2つ以上を意味する。
フローチャートにおける、又は本明細書で説明された任意のプロセス又は方法の説明は、特定のロジック機能又はプロセスのステップを実現するための1つ又は複数の実行可能な指令のコードを含むモジュール、セグメント又は一部を表すと理解されることができ、更に、本発明の好ましい実施形態の範囲は、関連機能が実質的に同時に又は逆の順序で実行されてもよく、示され又は説明された順序で実行されなくてもよい追加の実現態様を含むことは、本発明の実施形態が属する当業者によって理解されるべきである。
フローチャートに示されるか、又は本明細書で他の形態で記載されたロジック及び/又はステップは、例えば、ロジック機能を実現するための実行可能な指令の番号付きリストと考えられることが可能であり、如何なるコンピュータ可読媒体に具現化することにより、指令実行装置、デバイス又は設備(例えば、コンピュータによる装置、プロセッサを含む装置、又は、指令実行装置、デバイス又は設備から指令を呼び出して実行することが可能である他の装置)により使用され、又はこれらの指令実行装置、デバイス又は設備と組み合わせて使用されることが可能である。本明細書について、「コンピュータ可読媒体」とは、指令実行装置、デバイス又は設備、又は、これらの指令実行装置、デバイス又は設備と組み合わせて使用するための、プログラムを含み、格納、通信、伝播又は伝送することが可能な任意の装置であってもよい。コンピュータ可読媒体のより具体的な例(完全に網羅されていないリスト)は、1つ又は複数の配線を有する電気接続部(電子機器)、ポータブルコンピュータディスクカートリッジ(磁気機器)、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EEROM又はフラッシュメモリ)、光ファイバー装置、及び携帯用読み出し専用メモリ(CDROM)を含む。なお、コンピュータ可読媒体は、更に、プログラムを印刷することができる用紙又は他の適切な媒体であってもよい。前記プログラムは、例えば、用紙又は他の媒体を光走査し、続いて編集、解釈又は必要に応じて他の適切な形態で処理することにより、電子的に取得され、その後コンピュータメモリに格納されてもよい。
本発明の各部分は、ハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせにより実現されることが可能である。上記実施形態では、複数のステップ又は方法は、メモリに格納され適当な指令実行装置で実行されるソフトウェア又はファームウェアにより実現されることが可能である。例えば、ハードウェアにより実現される場合に、別の実施形態と同様に、データ信号に対してロジック機能を実現するための論理ゲート回路を有する個別論理回路、適当な組合せ論理ゲート回路を有する特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)などの当分野の周知技術のいずれか一つ又はそれらの組み合わせにより実現されることが可能である。
上記実施例の方法に含まれるステップの全部又は一部は、プログラムによって関連ハードウェアを実行させることにより行われることを、当業者にとって理解するであろう。前記プログラムは、1つのコンピュータ可読記憶媒体に格納されることが可能であり、このプログラムが実行されると、方法実施例に含まれるステップの一つ又はそれらの組み合わせを実現する。
また、本発明の各実施例における各機能素子は、1つの処理モジュールに集積されてもよく、各素子は物理的に別々に存在してもよく、あるいは2つ以上の素子が1つのモジュールに集積されてもよい。上記集積モジュールは、ハードウェアの形態又はソフトウェア機能モジュールの形態で実現されてもよい。前記集積モジュールは、ソフトウェア機能モジュールの形態で実現され別々の製品として販売又は使用される場合に、1つのコンピュータ可読記憶媒体に格納されてもよい。前記記憶媒体は、読み出し専用メモリ、磁気ディスク又は光ディスクなどであってもよい。
上述したのは本発明の具体的な実施形態に過ぎなく、本発明の保護範囲はこれらに限定されるものではなく、当業者が本発明に記載された技術的範囲内に容易に想到できる様々な変化又は置換は、いずれも本発明の保護範囲に包含されるものである。従って、本発明の保護範囲は、添付される特許請求の範囲を基準とするものである。
本発明は、人工知能の技術分野に関し、特に、顧客要求サービスのための音声対話方法及び装置に関する。
従来技術において、顧客がサービスを求める時に、ホテルの部屋内の電話を通してホテルのサービススタッフに連絡する必要がある。しかし、このような過程は、取り扱いが簡単なものではない。顧客は、ホテルの電話番号に慣れていないので、電話をかける前に、サービスカウンターの番号を検索する必要があるため、時間が無駄になる可能性がある。そして、短時間に複数の人がサービスカウンターに同時に電話をかけている場合、回線が混んでいることになり、顧客の問題を速やかに解決できない。また、ホテルの各部屋に電話を設置すること、及び対応する顧客サービス担当者に電話に答えるように手配させることは、ホテルの運営費を増大させる可能性がある。
背景技術に開示された上記の情報は、本発明の背景に対する理解を深めるためのものであり、当業者に知られている従来技術ではない情報も含む可能性がある。
本発明の実施例は、従来技術の一つ又は複数の技術課題を解決するために、顧客要求サービスのための音声対話方法及び装置を提供する。
第1態様において、本発明の実施例は、顧客要求サービスのための音声対話方法であって、
クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信することと、
前記音声要求指令を音声認識することと、
前記音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、前記クライアント端末識別子と前記所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信することと、を含む顧客要求サービスのための音声対話方法を提供する。
第1態様を参照しながら、本発明の実施例は、第1態様の第1の実現形態において、前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックすることを更に含む。
第1態様を参照しながら、本発明の実施例は、第1態様の第2の実現形態において、前記音声要求指令を音声認識することは、
前記音声要求指令を要求テキスト情報に変換することと、
前記要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングすることと、
前記データベースから前記要求テキスト情報と同じ内容の前記合法的テキスト情報がマッチングされた場合に、認識に成功したとすることと、を含む。
第1態様を参照しながら、本発明の実施例は、第1態様の第3の実現形態において、所望のサービス種類に基づいてサービス提供リクエストをサービス管理システムに送信することは、
前記クライアント端末識別子に基づいて対応する部屋の番号を検索することと、
前記部屋の番号と前記所望のサービス種類を含む前記サービス提供リクエストを前記サービス管理システムに送信することと、を含む。
本発明の実施例の第1態様の第1の実現形態を参照しながら、本発明の実施例は、第1態様の第4の実現形態において、前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックすることは、
前記所望のサービス種類に基づいて、フィードバックテキスト情報を生成することと、
フィードバックテキスト情報をフィードバック音声に変換することと、
前記フィードバック音声を前記クライアント端末識別子に対応する前記クライアント端末の音声対話装置に送信することと、を含む。
第2態様において、本発明の実施例は、顧客要求サービスのための音声対話装置であって、
クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信するための受信モジュールと、
前記音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、前記クライアント端末識別子と前記所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信するためのリクエスト送信モジュールと、を備える顧客要求サービスのための音声対話装置を提供する。
1つの可能な設計において、前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックするためのフィードバックモジュールを更に含む。
1つの可能な設計において、前記認識モジュールは、
前記音声要求指令を要求テキスト情報に変換するための第1変換サブモジュールと、
前記要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングするためのマッチングサブモジュールであって、前記データベースから前記要求テキスト情報と同じ内容の前記合法的テキスト情報がマッチングされた場合に、認識に成功したとするマッチングサブモジュールと、を備える。
1つの可能な設計において、前記リクエスト送信モジュールは、
前記クライアント端末識別子に基づいて対応する部屋の番号を検索するための検索サブモジュールと、
前記部屋の番号と前記所望のサービス種類を含む前記サービス提供リクエストを前記サービス管理システムに送信するための第1送信サブモジュールと、を備える。
1つの可能な設計において、前記フィードバックモジュールは、
前記所望のサービス種類に基づいて、フィードバックテキスト情報を生成するための生成サブモジュールと、
フィードバックテキスト情報をフィードバック音声に変換するための第2変換サブモジュールと、
前記フィードバック音声を前記クライアント端末識別子に対応する前記クライアント端末の音声対話装置に送信するための第2送信サブモジュールと、を備える。
第3態様において、本発明の実施例は、顧客要求サービスのための音声対話端末を提供する。
前記機能は、ハードウェアにより実現されてもよく、ハードウェアを通じて対応するソフトウェアを実行することにより実現されてもよい。前記ハードウェア又はソフトウェアは、上記の機能に対応する1つ又は複数のモジュールを含む。
1つの可能な設計において、顧客要求サービスのための音声対話端末の構成は、顧客要求サービスのための音声対話端末に前記第1態様における顧客要求サービスのための音声対話方法を実行させるプログラムを格納するためのメモリと、前記メモリに格納されたプログラムを実行するように配置されるプロセッサと、を備える。顧客要求サービスのための音声対話端末は、他のデバイス又は通信ネットワークとの通信をするための通信インタフェースを含んでもよい。
第4態様において、本発明の実施例は、顧客要求サービスのための音声対話端末に用いられるコンピュータソフトウェア指令を格納するためのコンピュータ可読記憶媒体であって、前記指令は、前記第1態様における顧客要求サービスのための音声対話方法を実行させるための、顧客要求サービスのための音声対話端末に用いられるプログラムを含むコンピュータ可読記憶媒体を提供する。
上記の技術案のうちの一つの技術案は、下記のような利点又は有益な効果を有する。本発明の実施例は、音声対話方式を採用することで、クライアント端末と、サービス管理システムと、顧客との間の対話が実現されたので、顧客の要求を迅速かつ知能的に認識して相応的なサービスを提供することができる。
上記の記載は明細書を説明するためのものに過ぎなく、いかなる方式で限定する意図はない。上述した例示的な態様、実施形態及び特徴のほか、添付図面及び以下の詳細な記載を参照することにより、本発明のさらなる態様、実施形態及び特徴は理解しやすいであろう。
添付図面において、別に限定されない限り、複数の図面における同じ符号は、同一又は類似の部材又は素子を示す。これらの図面は、必ずしも縮尺通りではない。これらの図面では、本発明によるいくつかの実施形態のみが示され、本発明の範囲を限定するものとして解釈されるべきではないことを理解されたい。
本発明の実施形態に係る顧客要求サービスのための音声対話方法を示すフローチャートである。 本発明の実施形態に係るステップS300を示す具体的なフローチャートである。 本発明の実施形態に係るホテルのシナリオに基づく顧客要求サービスのための音声対話を示すブロック図である。 本発明の実施形態に係る顧客要求サービスのための音声対話装置を示す構造模式図。 本発明の実施形態に係る顧客要求サービスのための音声対話端末を示す構造模式図。
以下、単に例示的な実施例の一部を簡単に説明する。記載された実施例は、当業者によって理解され得るように、本発明の精神又は範囲を逸脱しない限り、様々な異なる方法で変形可能である。よって、添付の図面及び説明は、実質的に例示的なものであり、限定的なものではないと見なされる。
本発明の実施例は、顧客要求サービスのための音声対話方法を提供し、図1に示すように、以下のステップを含む。
S100:クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信する。
クライアント端末識別子は、クライアント端末の具体的な位置情報を特定するためのものである。クライアント端末識別子は、顧客要求情報を送信する装置の識別子を含んでもよく、又は、顧客要求情報を送信する顧客の位置の識別子を含んでもよく、或いは、両者を含むことも可能である。クライアント端末は、顧客からの音声を受信するために使用可能であり、オーディオを再生するためにも使用可能である。オーディオとは、顧客にフィードバックされた具体的な内容を含む音声として理解されてもよく、又は、音楽やプロンプトなどのほかのオーディオであってもよい。クライアント端末は、本実施例で説明された機能を実現することができる限り、例えば、スマートスピーカ、スマート音声端末などの任意の音声対話装置を採用することができる。クライアント端末は、顧客の音声要求指令を受信した後に、顧客要求情報を通して自身の識別子と顧客の音声要求指令を制御センターに送信して認識されることができる。制御センターは、1つ又は複数の音声認識機能を備えるサーバを含むことが可能であり、これらのサーバは、ローカルに設置されてもよく、クラウドに設置されてもよい。
S200:音声要求指令を音声認識する。
制御センターは、顧客要求情報を受信した後に、そのクライアント端末識別子に基づいてその音声要求指令の送信元を判定することが可能である。例えば、ホテルの各部屋それぞれに1つのスマートスピーカが設けられると、部屋の番号とスピーカ識別子とが対応関係がある。クライアント端末識別子は、部屋の番号及び/又はスピーカ識別子を含んでもよい。顧客要求情報におけるクライアント端末識別子にはスピーカ識別子が含まれると、スピーカ識別子に基づいて対応する部屋の番号を検索することが可能である。顧客要求情報におけるクライアント端末識別子には部屋の番号が含まれると、部屋の番号に基づいて対応するスピーカ識別子を検索することが可能である。従って、制御センターが顧客要求情報を受信した後に、そのクライアント端末識別子に基づいて、その音声要求指令がどの部屋及び/又はどのスピーカからのものであるかを判定することが可能である。
音声要求指令は、顧客が話した具体的な内容を含むオーディオ情報であると理解することが可能である。例えば、音声要求指令は、「私はスリッパ一足が欲しい」、「私の部屋を掃除してください」、「夕食を私の部屋に送ってください」などのサービス提供リクエストを含むオーディオ情報を含んでもよいが、これに限定されない。制御センターは、音声要求指令を認識することにより、顧客が具体的にどのサービスが欲しいか、即ち所望のサービス種類を得ることが可能である。
S300:音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、クライアント端末識別子と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信する。
一実施例において、制御センターは、サービス提供リクエストに基づいて、認識された所望のサービス種類とクライアント端末識別子を具体的なサービス管理システムに送信する。サービス管理システムは、サービス提供リクエストを受信した後に、クライアント端末に具体的なサービスを提供し、サービススタッフを手配して顧客に相応的なサービスを提供したり、自動サービスを提供したりすることができる。実際のアプリケーションシナリオでは、サービス提供システムの実際の機能に応じて判定することが可能である。例えば、制御センターは、「スリッパ」と「部屋X」をホテルのサービス管理システムに送信する。ホテルのサービス管理システムは、このサービス提供リクエストを受信した後に、番号Xの部屋にスリッパを送るように具体的なスタッフを手配することが可能である。別の例では、制御センターは、「特定人の特定日にAからBへの航空券を予約する」と「部屋X」をホテルのサービス管理システムに送信する。ホテルのサービス管理システムは、このサービス提供リクエストを受信した後に、部屋Xの特定人のために航空券を予約することができる。
制御センターがサービス管理システムに送信したサービス提供リクエストにスピーカ識別子のみが含まれる場合に、サービス管理システムにおいてスピーカ識別子に対応する部屋の番号を検索することも可能である。
一実施例において、この方法は、クライアント端末識別子に基づいて、クライアント端末にサービス提供結果をフィードバックすることを更に含む。クライアント端末へのサービス提供結果のフィードバックは、サービス提供リクエストをサービス管理システムに送信すると同時に行ってもよく、サービス管理システムがサービスの提供を手配した後に行ってもよい。例えば、顧客の音声要求指令における所望のサービス種類が認識されると、相応的なサービスをすることを顧客へ通知する。別の例では、サービス管理システムは、サービス提供リクエストを受信し相応的なサービスを提供するサービススタッフを手配した後に、その結果をクライアント端末にフィードバックして、相応的なサービスをすることを顧客へ通知する。本実施例は、サービス提供結果をフィードバックする具体的なタイミングを限定せず、サービス提供結果の内容に応じて自由に選択することが可能である。例えば、サービス提供リクエストをサービス管理システムに送信すると同時に、「まもなくスリッパを提供いたします」、「まもなく航空券を予約いたします」を送信することが可能である。また、サービス管理システムは、「10時までにスリッパを提供するようにスタッフを手配いたしました」、「航空券は予約済みです」などのサービス提供結果をフィードバックすることが可能である。
また、サービス管理システムの処理の進み状況に基づいて、サービス提供結果をクライアント端末に複数回フィードバックすることが可能である。
1つの具体的な実施例において、クライアント端末識別子に基づいて、クライアント端末にサービス提供結果をフィードバックすることは、
サービス提供リクエストの内容に基づいて、対応するフィードバックテキスト情報を生成することと、
フィードバックテキスト情報をフィードバック音声に変換することと、
フィードバック音声をクライアント端末識別子に対応するクライアント端末の音声対話装置に送信することと、を含む。音声対話装置は、サービス提供結果を顧客に知らせる。
例えば、サービス提供リクエストの内容は、「私は、スリッパ一足が欲しい」であると、生成されたフィードバックテキスト情報は、「スリッパを直ちにあなたの部屋までお届けいたします」である。或いは、生成されたフィードバックテキスト情報は、「お客様からのリクエストを受け取りました。できるだけ早くサービスを手配いたします」である。フィードバックテキスト情報は、具体的なサービス提供リクエストの内容に対する相関応答であってもよく、サービス提供リクエストを受信したことを確認するための単純な応答であってもよい。
一実施例において、音声要求指令を音声認識することは、
音声要求指令を要求テキスト情報に変換することと、
要求テキスト情報と、データベースに記録された合法的テキスト情報とをマッチングすることと、を含む。ここで、合法的テキスト情報は、異なるサービス種類が記録された情報であることを理解されたい。
一実施例において、音声要求指令を音声認識することは、データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされた場合に、認識に成功したとすることを更に含む。
データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされなかった場合に、認識に失敗したとする。
1つの具体的な実施形態において、音声要求指令への音声認識に失敗した場合に、音声認識失敗の結果に基づいて、対応する認識失敗テキスト情報を生成する。認識失敗テキスト情報をフィードバック音声に変換し、クライアント端末識別子に対応するクライアント端末の音声対話装置に送信する。音声対話装置は、認識失敗の結果を顧客に知らせる。
1つの変形可能な実施形態において、音声要求指令への音声認識に失敗した場合に、失敗の結果を顧客にフィードバックするとともに、顧客が正しい音声要求指令を提供するように案内するための相応的な音声プロンプトを与えることも可能である。音声プロンプトは、顧客が選択するために用いられる、データベースにはどの種類のサービスが記録されているかに関する記述情報を含んでもよい。顧客の音声要求指令に応じて、所望のサービスがデータベースに記録されたサービス種類の1つであるか否かを顧客に尋ねることも可能である。
一実施例において、図2に示すように、所望のサービス種類に基づいてサービス提供リクエストをサービス管理システムに送信することは、
S310:部屋内に設置可能なクライアント端末の識別子に基づいて対応する部屋の番号を検索することと、
S320:部屋の番号と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信することと、
S330:サービス管理システムは、所望のサービス種類に基づいて、対応する番号の部屋にサービスを提供することとを含む。
一実施例において、クライアント端末が常に顧客音声を受信する状態にあることを回避するために、クライアント端末をウェイクアップさせるウェイクアップ語を設置することが可能である。顧客が対応するウェイクアップ語を話し出すと、クライアント端末は、顧客が話し出したサービス提供リクエストを受信して認識することができる。例えば、ウェイクアップ語は、「度ちゃん度ちゃん」であってもよい。顧客は、「度ちゃん度ちゃん」と言った後で、自分のサービス要求を話し続けることができる。
図3に示すように、一つの具体的な実施例において、本発明実施例に係る方法は、ホテルシナリオに適用される場合に、具体的に、次の通りである。
ホテルの部屋毎に1つのスマートスピーカを設け、オーディオ装置を顧客の音声サービス要求を受信するためのクライアント端末とする。例えば、部屋001のように、部屋毎に対応する部屋の番号を付ける。デバイス001のように、スマートスピーカ毎にも、唯一のクライアント端末識別子、即ID番号を付ける。そして、各部屋の番号は、部屋内のオーディオ装置のクライアント端末識別子と関連付けられる。クライアント端末識別子に基づいて所在の部屋の番号を検索してもよく、部屋の番号に基づいてその部屋内のスマートスピーカを検索してもよい。
ホテルにチェックインした顧客は、スマートスピーカと音声対話して、自分の要求を表現して、相応的な顧客要求サービスを提供するようにホテルに知らせることができる。顧客は、まずは部屋内のスマートスピーカをウェイクアップさせるようにウェイクアップ語(例えば、ウェイクアップ語は、「度ちゃん度ちゃん」である)を言う。次に、「私は、スリッパ一足が欲しい」と自分の要求を言う。スマートスピーカは、顧客の音声要求指令を受信した後、ホテルのサーバ(例えば、クラウド)に顧客要求情報を送信する。ただし、顧客要求情報には、スマートスピーカのクライアント端末識別子と、スマートスピーカにより処理された音声要求指令とが含まれている。
ホテルサーバは、受信された音声要求指令を音声認識する。音声要求指令を要求テキスト情報に変換し、要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングする。データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされた場合に、認識に成功したとする。認識成功後に、ホテルサーバは、ホテル管理システム(PMS,Property Management System)にサービス提供リクエストを送信する。ここで、ホテル管理システムは、サービス管理システムの一例である。ホテル管理システムは、スマートスピーカのクライアント端末識別子に基づいて、スマートスピーカの所在部屋の番号を検索する。例えば、部屋001の顧客は、スリッパ一足が欲しい。顧客のリクエストに応じて、ホテル管理システムは、具体的なサービスを提供するようにサービススタッフを手配することが可能である。
同時に、顧客管理システムがサーバに応答を送信し、サーバは、サービス提供リクエストの内容に基づいて、対応するフィードバックテキスト情報を生成する。例えば、「わかりました。スリッパ一足をお部屋まで届けるように直ちにサービススタッフを手配しますので、少々お待ちください」。次に、フィードバックテキスト情報を音声ストリーム情報(即ち、フィードバック音声)に合成し、フィードバック音声を部屋001のスマートスピーカに送信する。スマートスピーカは、「わかりました。スリッパ一足をお部屋まで届けるように直ちにサービススタッフを手配しますので、少々お待ちください。」をオーディオの形式で顧客に知らせる。これにより、顧客の要求を満足する。ここで、音声ストリーム情報を合成する過程は、TTS(text to speech、テキストを音声化する)技術を採用可能である。
本発明の実施例は、顧客要求サービスのための音声対話装置であって、図4に示すように、
クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信するための受信モジュール10と、
音声要求指令を音声認識するための認識モジュール20と、
音声要求指令における所望のサービス種類が認識された場合に、所望のサービス種類に基づいて、クライアント端末識別子と所望のサービス種類を含むサービス提供リクエストをサーバ管理システムに送信するためのリクエスト送信モジュール30とを備える、顧客要求サービスのための音声対話装置を提供する。
一実施例において、図4に示すように、この装置は、クライアント端末識別子に基づいて、サービス提供結果をクライアント端末にフィードバックするためのフィードバックモジュール40を更に含む。
一実施例において、認識モジュール20は、
音声要求指令を要求テキスト情報に変換するための第1変換サブモジュールと、
要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングするためのマッチングサブモジュールであって、データベースから要求テキスト情報と同じ内容の合法的テキスト情報がマッチングされた場合に、認識に成功したとするマッチングサブモジュールと、を備える。
一実施例において、リクエスト送信モジュール30は、
クライアント端末識別子に基づいて対応する部屋の番号を検索するための検索サブモジュールと、
部屋の番号と所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信するための第1送信サブモジュールと、を備える。
一実施例において、フィードバックモジュール40は、
フィードバックテキスト情報をフィードバック音声に変換するための第2変換サブモジュールと、
フィードバック音声をクライアント端末識別子に対応するスピーカに送信するための第2送信サブモジュールと、を備える。
本発明の実施例は、顧客要求サービスのための音声対話端末を提供し、図5に示すように、メモリ910とプロセッサ920を含み、メモリ910には、プロセッサ920により実行可能なコンピュータプログラムが格納されている。プロセッサ920は、コンピュータプログラムを実行すると、上記の実施例における顧客要求サービスのための音声対話方法を実現する。メモリ910とプロセッサ920の数は、1つであってもよく、複数であってもよい。
通信インタフェース930は、メモリ910とプロセッサ920が外部と通信するためのものである。
メモリ910は、高速ランダムアクセスメモリ(RAM)を含んでもよく、不揮発性メモリ(non−volatile memory)、例えば、少なくとも1つの磁気ディスクメモリを含んでもよい。
メモリ910、プロセッサ920、及び通信インタフェース930を独立に実現すると、メモリ910、プロセッサ920、及び通信インタフェース930は、バスを介して互いに接続し、互いに通信を実現することが可能である。バスは、業界標準アーキテクチャ(ISA,Industry Standard Achitecture)バス、周辺コンポーネント相互接続(PCI,Peripheral Component)バス又は拡張業界標準アーキテクチャ(EISA,Extended Industry Standard Component)バスなどである。バスは、アドレスバス、データバス、コントローラバスなどに区別されることが可能である。表現を容易にするために、図5には、一本の太線のみが示されているが、1本のバス又は1種類のバスしかないことを意味しない。
所望により、具体的には、メモリ910、プロセッサ920及び通信インタフェース930が1枚のチップに集積されると、メモリ910、プロセッサ920及び通信インタフェース930は、内部インタフェースを介して互いに通信を実現することが可能である。
本発明の実施例は、コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、該プログラムがプロセッサにより実行されると、上記のいずれかの実施例に記載の顧客要求サービスのための音声対話方法を実現するコンピュータ可読記憶媒体を提供する。
本発明の実施例の技術案は、音声対話方式を採用することで、クライアント端末と、サービス管理システムと、顧客との間の対話が実現されるので、それによってあまり手間をかけずに、顧客の要求を迅速且つ知能的に認識して相応的なサービスを提供することができる。そのようにして、電話装置の設置及び顧客サービススタッフの手配が効果的に低減され、サービスコストが節約されることができる。本発明の実施例の技術案は、顧客経験を向上し、便利且つ迅速に顧客のニーズを満たすことができる。同時に、複数の顧客のニーズを同時に満たすことができ、電話をかけるときに回線が混雑しているという状況を回避することができる
明細書の記載において、「一実施例」、「いくつかの実施形態」、「例」、「具体的な例」又は「実施例の一部」などの用語は、本発明の実施例や実施形態を参照しながら記載した具体的な特徴、構造、材料又は特徴が本発明の少なくとも1つの実施例や実施形態に含まれることを意味する。そして、記載された具体的な特徴、構造、材料又は特徴は、いずれか一つの又は複数の実施例や実施形態において適切な方法で組み合わせることができる。相互に矛盾が生じない限り、当業者は、本明細書に記載された異なる実施例や実施形態及び異なる実施例や実施形態の特徴を組み合わせて結合することが可能である。
また、「第1」、「第2」という用語は、説明の目的でのみ使用されており、相対的な重要性を指示又は暗示したり、示される技術的特徴の数を暗黙的に指すと解釈されるべきではない。したがって、「第1」、「第2」により限定された特徴は、少なく1つの特徴を含むことを明示的又は暗黙的に示されることが可能である。本発明の記載において、「複数」とは、明確かつ具体的な限定がない限り、2つ又は2つ以上を意味する。
フローチャートにおける、又は本明細書で説明された任意のプロセス又は方法の説明は、特定のロジック機能又はプロセスのステップを実現するための1つ又は複数の実行可能な指令のコードを含むモジュール、セグメント又は一部を表すと理解されることができ、更に、本発明の好ましい実施形態の範囲は、関連機能が実質的に同時に又は逆の順序で実行されてもよく、示され又は説明された順序で実行されなくてもよい追加の実現態様を含むことは、本発明の実施形態が属する当業者によって理解されるべきである。
フローチャートに示されるか、又は本明細書で他の形態で記載されたロジック及び/又はステップは、例えば、ロジック機能を実現するための実行可能な指令の番号付きリストと考えられることが可能であり、如何なるコンピュータ可読媒体に具現化することにより、指令実行装置、デバイス又は設備(例えば、コンピュータによる装置、プロセッサを含む装置、又は、指令実行装置、デバイス又は設備から指令を呼び出して実行することが可能である他の装置)により使用され、又はこれらの指令実行装置、デバイス又は設備と組み合わせて使用されることが可能である。本明細書について、「コンピュータ可読媒体」とは、指令実行装置、デバイス又は設備、又は、これらの指令実行装置、デバイス又は設備と組み合わせて使用するための、プログラムを含み、格納、通信、伝播又は伝送することが可能な任意の装置であってもよい。コンピュータ可読媒体のより具体的な例(完全に網羅されていないリスト)は、1つ又は複数の配線を有する電気接続部(電子機器)、ポータブルコンピュータディスクカートリッジ(磁気機器)、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EEROM又はフラッシュメモリ)、光ファイバー装置、及び携帯用読み出し専用メモリ(CDROM)を含む。なお、コンピュータ可読媒体は、更に、プログラムを印刷することができる用紙又は他の適切な媒体であってもよい。前記プログラムは、例えば、用紙又は他の媒体を光走査し、続いて編集、解釈又は必要に応じて他の適切な形態で処理することにより、電子的に取得され、その後コンピュータメモリに格納されてもよい。
本発明の各部分は、ハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせにより実現されることが可能である。上記実施形態では、複数のステップ又は方法は、メモリに格納され適当な指令実行装置で実行されるソフトウェア又はファームウェアにより実現されることが可能である。例えば、ハードウェアにより実現される場合に、別の実施形態と同様に、データ信号に対してロジック機能を実現するための論理ゲート回路を有する個別論理回路、適当な組合せ論理ゲート回路を有する特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)などの当分野の周知技術のいずれか一つ又はそれらの組み合わせにより実現されることが可能である。
上記実施例の方法に含まれるステップの全部又は一部は、プログラムによって関連ハードウェアを実行させることにより行われることを、当業者にとって理解するであろう。前記プログラムは、1つのコンピュータ可読記憶媒体に格納されることが可能であり、このプログラムが実行されると、方法実施例に含まれるステップの一つ又はそれらの組み合わせを実現する。
また、本発明の各実施例における各機能素子は、1つの処理モジュールに集積されてもよく、各素子は物理的に別々に存在してもよく、あるいは2つ以上の素子が1つのモジュールに集積されてもよい。上記集積モジュールは、ハードウェアの形態又はソフトウェア機能モジュールの形態で実現されてもよい。前記集積モジュールは、ソフトウェア機能モジュールの形態で実現され別々の製品として販売又は使用される場合に、1つのコンピュータ可読記憶媒体に格納されてもよい。前記記憶媒体は、読み出し専用メモリ、磁気ディスク又は光ディスクなどであってもよい。
上述したのは本発明の具体的な実施形態に過ぎなく、本発明の保護範囲はこれらに限定されるものではなく、当業者が本発明に記載された技術的範囲内に容易に想到できる様々な変化又は置換は、いずれも本発明の保護範囲に包含されるものである。従って、本発明の保護範囲は、添付される特許請求の範囲を基準とするものである。

Claims (12)

  1. クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信することと、
    前記音声要求指令を音声認識することと、
    前記音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、前記クライアント端末識別子と前記所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信することと、を含む、
    ことを特徴とする顧客要求サービスのための音声対話方法。
  2. 前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックすることを更に含む、
    ことを特徴とする請求項1に記載の方法。
  3. 前記音声要求指令を音声認識することは、
    前記音声要求指令を要求テキスト情報に変換することと、
    前記要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングすることと、
    前記データベースから前記要求テキスト情報と同じ内容の前記合法的テキスト情報がマッチングされた場合に、認識に成功したとすることと、を含む、
    ことを特徴とする請求項1に記載の方法。
  4. 所望のサービス種類に基づいてサービス提供リクエストをサービス管理システムに送信することは、
    前記クライアント端末識別子に基づいて対応する部屋の番号を検索することと、
    前記部屋の番号と前記所望のサービス種類を含む前記サービス提供リクエストを前記サービス管理システムに送信することと、を含む、
    ことを特徴とする請求項1に記載の方法。
  5. 前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックすることは、
    前記所望のサービス種類に基づいて、フィードバックテキスト情報を生成することと、
    フィードバックテキスト情報をフィードバック音声に変換することと、
    前記フィードバック音声を前記クライアント端末識別子に対応する前記クライアント端末の音声対話装置に送信することと、を含む、
    ことを特徴とする請求項2に記載の方法。
  6. クライアント端末からの、クライアント端末識別子と音声要求指令を含む顧客要求情報を受信するための受信モジュールと、
    前記音声要求指令を音声認識するための認識モジュールと、
    前記音声要求指令における所望のサービス種類が認識された場合、所望のサービス種類に基づいて、前記クライアント端末識別子と前記所望のサービス種類を含むサービス提供リクエストをサービス管理システムに送信するためのリクエスト送信モジュールと、を備える、
    ことを特徴とする顧客要求サービスのための音声対話装置。
  7. 前記クライアント端末識別子に基づいて、サービス提供結果を前記クライアント端末にフィードバックするためのフィードバックモジュールを更に備える
    ことを特徴とする請求項6に記載の装置。
  8. 前記認識モジュールは、
    前記音声要求指令を要求テキスト情報に変換するための第1変換サブモジュールと、
    前記要求テキスト情報とデータベースに記録された合法的テキスト情報とをマッチングするためのマッチングサブモジュールであって、前記データベースから前記要求テキスト情報と同じ内容の前記合法的テキスト情報がマッチングされた場合に、認識に成功したとするマッチングサブモジュールと、を備える、
    ことを特徴とする請求項6に記載の装置。
  9. 前記リクエスト送信モジュールは、
    前記クライアント端末識別子に基づいて対応する部屋の番号を検索するための検索サブモジュールと、
    前記部屋の番号と前記所望のサービス種類を含む前記サービス提供リクエストを前記サービス管理システムに送信するための第1送信サブモジュールと、を備える、
    ことを特徴とする請求項6に記載の装置。
  10. 前記フィードバックモジュールは、
    前記所望のサービス種類に基づいて、フィードバックテキスト情報を生成するための生成サブモジュールと、
    フィードバックテキスト情報をフィードバック音声に変換するための第2変換サブモジュールと、
    前記フィードバック音声を前記クライアント端末識別子に対応する前記クライアント端末の音声対話装置に送信するための第2送信サブモジュールと、を備える、
    ことを特徴とする請求項7に記載の装置。
  11. 顧客要求サービスのための音声対話端末であって、
    1つ又は複数のプロセッサと、
    1つ又は複数のプログラムを格納するための記憶装置と、を備え、
    前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行されると、前記1つ又は複数のプロセッサは、請求項1〜5のいずれか一項に記載の方法を実現する、
    ことを特徴とする顧客要求サービスのための音声対話端末。
  12. コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、
    該プログラムがプロセッサにより実行されると、請求項1〜5のいずれか一項に記載の方法を実現する、
    ことを特徴とするコンピュータ可読記憶媒体。
JP2019046997A 2018-06-29 2019-03-14 顧客要求サービスのための音声対話方法及び装置 Active JP7037517B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810717154.0A CN108932946B (zh) 2018-06-29 2018-06-29 客需服务的语音交互方法和装置
CN201810717154.0 2018-06-29

Publications (2)

Publication Number Publication Date
JP2020003772A true JP2020003772A (ja) 2020-01-09
JP7037517B2 JP7037517B2 (ja) 2022-03-16

Family

ID=64446760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019046997A Active JP7037517B2 (ja) 2018-06-29 2019-03-14 顧客要求サービスのための音声対話方法及び装置

Country Status (3)

Country Link
US (1) US11257492B2 (ja)
JP (1) JP7037517B2 (ja)
CN (1) CN108932946B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684540B (zh) * 2018-12-11 2021-04-06 北京奇点机智科技有限公司 服务信息交互的方法和装置
CN111427992A (zh) 2019-01-10 2020-07-17 华为技术有限公司 对话处理方法及设备
CN111724773A (zh) * 2019-03-22 2020-09-29 北京京东尚科信息技术有限公司 应用开启方法、装置和计算机系统及介质
CN110491374A (zh) * 2019-08-27 2019-11-22 北京明日汇科技管理有限公司 基于神经网络的酒店服务语音交互识别方法及装置
CN111506796A (zh) * 2020-04-09 2020-08-07 北京云迹科技有限公司 一种数据处理方法及装置
CN112581297B (zh) * 2020-12-18 2024-03-12 中国平安人寿保险股份有限公司 基于人工智能的信息推送方法、装置及计算机设备
US11694039B1 (en) * 2021-01-22 2023-07-04 Walgreen Co. Intelligent automated order-based customer dialogue system
CN114070937A (zh) * 2021-11-10 2022-02-18 京东科技信息技术有限公司 多模态的客户咨询方法及相关设备
CN114285816B (zh) * 2021-12-30 2024-02-06 中国电信股份有限公司 语音通话过程中唤起即时消息交互的方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000032140A (ja) * 1998-04-30 2000-01-28 Matsushita Electric Ind Co Ltd 音声認識を用いたロボットホテル従業員
US20050182631A1 (en) * 2004-02-13 2005-08-18 In-Seok Lee Voice message recording and playing method using voice recognition
WO2015029379A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 機器制御方法、表示制御方法及び購入決済方法
JP2016163236A (ja) * 2015-03-03 2016-09-05 ヤフー株式会社 撮影装置、撮影方法および撮影プログラム
JP2017530387A (ja) * 2015-03-20 2017-10-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 人工知能に基づく声紋ログイン方法と装置
US20180167516A1 (en) * 2016-12-13 2018-06-14 Bullhead Innovations Ltd. Universal interface data gate and voice controlled room system

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298324B1 (en) * 1998-01-05 2001-10-02 Microsoft Corporation Speech recognition system with changing grammars and grammar help command
US20020107695A1 (en) * 2001-02-08 2002-08-08 Roth Daniel L. Feedback for unrecognized speech
DE10110977C1 (de) * 2001-03-07 2002-10-10 Siemens Ag Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem
US7788103B2 (en) * 2004-10-18 2010-08-31 Nuance Communications, Inc. Random confirmation in speech based systems
US7953603B2 (en) * 2005-12-21 2011-05-31 International Business Machines Corporation Load balancing based upon speech processing specific factors
US20190279636A1 (en) * 2010-09-20 2019-09-12 Kopin Corporation Context Sensitive Overlays in Voice Controlled Headset Computer Displays
CN103428355B (zh) * 2012-05-24 2016-08-10 上海博泰悦臻电子设备制造有限公司 基于移动终端的语音控制装置及其语音控制方法
AU2012254936A1 (en) * 2012-11-22 2014-06-05 Kenneth James Hough Rental Service Provider Messaging System
CN103944598A (zh) * 2013-01-23 2014-07-23 深圳市亿思达显示科技有限公司 可视语音控制器、无线通讯系统及其通讯方法
WO2015086529A1 (en) * 2013-12-13 2015-06-18 Q-Matic Ab Method, system & computer program product
CN104901863B (zh) * 2014-03-06 2019-03-01 腾讯科技(深圳)有限公司 发送即时提示消息的方法、装置及系统
CN104301522A (zh) * 2014-09-19 2015-01-21 联想(北京)有限公司 通讯中的信息输入方法及通讯终端
CN106155345B (zh) * 2015-05-12 2019-02-26 左莉 交互式呼叫应答系统及其键盘式呼叫应答器以及它们的应用
CN106506568B (zh) * 2015-09-07 2020-12-08 泰康保险集团股份有限公司 信息交互系统
CN105205746A (zh) * 2015-09-15 2015-12-30 深圳市有方科技股份有限公司 一种服务场所的通讯方法、装置及系统
US10095473B2 (en) * 2015-11-03 2018-10-09 Honeywell International Inc. Intent managing system
CN107180635A (zh) * 2016-03-09 2017-09-19 张立秀 一种云端语音服务提供方法及系统
CN105812830B (zh) * 2016-03-11 2018-11-13 传成文化传媒(上海)有限公司 酒店服务内容的推荐方法及系统
JP6710562B2 (ja) * 2016-03-29 2020-06-17 本田技研工業株式会社 受付システム及び受付方法
CN106057204A (zh) * 2016-05-05 2016-10-26 刘世超 一种在线呼叫服务的方法及系统
US20180012595A1 (en) * 2016-07-07 2018-01-11 Intelligently Interactive, Inc. Simple affirmative response operating system
WO2018140420A1 (en) * 2017-01-24 2018-08-02 Honeywell International, Inc. Voice control of an integrated room automation system
CN107092364A (zh) * 2017-04-19 2017-08-25 重庆小雨点小额贷款有限公司 一种信息录入方法以及装置
CN107220292A (zh) * 2017-04-25 2017-09-29 上海庆科信息技术有限公司 智能对话装置、反馈式智能语音控制系统及方法
US10580098B2 (en) * 2017-05-29 2020-03-03 Virtual OnQ Systems, LLC Voice activated hotel room monitor
CN107749866A (zh) * 2017-09-01 2018-03-02 北京佳阳科技有限公司 一种客房服务信息的发送、处理、接收方法及设备
CN107644643A (zh) * 2017-09-27 2018-01-30 安徽硕威智能科技有限公司 一种语音交互系统及方法
CN107993310A (zh) * 2017-10-31 2018-05-04 北京三快在线科技有限公司 自助入住管理系统及方法、电子设备及存储介质
CN107833574B (zh) * 2017-11-16 2021-08-24 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
US10679620B2 (en) * 2018-03-06 2020-06-09 GM Global Technology Operations LLC Speech recognition arbitration logic
CN108986821B (zh) * 2018-08-23 2021-03-23 珠海格力电器股份有限公司 一种设置房间与设备关系的方法和设备
US11151996B2 (en) * 2019-04-16 2021-10-19 International Business Machines Corporation Vocal recognition using generally available speech-to-text systems and user-defined vocal training

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000032140A (ja) * 1998-04-30 2000-01-28 Matsushita Electric Ind Co Ltd 音声認識を用いたロボットホテル従業員
US20050182631A1 (en) * 2004-02-13 2005-08-18 In-Seok Lee Voice message recording and playing method using voice recognition
WO2015029379A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 機器制御方法、表示制御方法及び購入決済方法
JP2016163236A (ja) * 2015-03-03 2016-09-05 ヤフー株式会社 撮影装置、撮影方法および撮影プログラム
JP2017530387A (ja) * 2015-03-20 2017-10-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 人工知能に基づく声紋ログイン方法と装置
US20180167516A1 (en) * 2016-12-13 2018-06-14 Bullhead Innovations Ltd. Universal interface data gate and voice controlled room system

Also Published As

Publication number Publication date
CN108932946B (zh) 2020-03-13
US11257492B2 (en) 2022-02-22
US20200007684A1 (en) 2020-01-02
JP7037517B2 (ja) 2022-03-16
CN108932946A (zh) 2018-12-04

Similar Documents

Publication Publication Date Title
JP2020003772A (ja) 顧客要求サービスのための音声対話方法及び装置
US10121475B2 (en) Computer-implemented system and method for performing distributed speech recognition
US9202247B2 (en) System and method utilizing voice search to locate a product in stores from a phone
US11705118B2 (en) Universal and user-specific command processing
US7751551B2 (en) System and method for speech-enabled call routing
KR102489914B1 (ko) 전자 장치 및 이의 제어 방법
EP3485492A1 (en) Multi-user authentication on a device
US20090304161A1 (en) system and method utilizing voice search to locate a product in stores from a phone
US20160094491A1 (en) Pattern-controlled automated messaging system
TW201034004A (en) Systems and methods for interactively accessing hosted services using voice communications
CN112313930B (zh) 管理保持的方法和装置
JP2024520659A (ja) 対話型通信システムを動的にナビゲートするための方法、装置、及びシステム
JP2019079364A (ja) ロボット制御システム、ロボット制御方法及び統合サーバー装置
CN110489670B (zh) 一种基于多维地图的民生服务移动应用平台系统及其使用方法
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
CN110047473A (zh) 一种人机协作交互方法及系统
CN116016779A (zh) 语音通话翻译辅助方法、系统、计算机设备和存储介质
KR102346110B1 (ko) 인공지능을 이용한 상담 서비스 제공 방법 및 장치
US20230059979A1 (en) Artificial Intelligence Based Smart Device for Contact Centers Solutions
WO2022270603A1 (en) A system and method for delivering domain or use-case switch suggestion for an ongoing conversation
US11348576B1 (en) Universal and user-specific command processing
JP2021096293A (ja) 案内システム、案内システムの制御方法、およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190327

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210423

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210531

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20211223

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220119

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220125

C272 Notice of ex officio correction

Free format text: JAPANESE INTERMEDIATE CODE: C272

Effective date: 20220125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220304

R150 Certificate of patent or registration of utility model

Ref document number: 7037517

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150