JP7004955B2 - サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法 - Google Patents

サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法 Download PDF

Info

Publication number
JP7004955B2
JP7004955B2 JP2017236653A JP2017236653A JP7004955B2 JP 7004955 B2 JP7004955 B2 JP 7004955B2 JP 2017236653 A JP2017236653 A JP 2017236653A JP 2017236653 A JP2017236653 A JP 2017236653A JP 7004955 B2 JP7004955 B2 JP 7004955B2
Authority
JP
Japan
Prior art keywords
service
input
user
items
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017236653A
Other languages
English (en)
Other versions
JP2019105904A (ja
Inventor
功一 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2017236653A priority Critical patent/JP7004955B2/ja
Priority to CN201811383513.XA priority patent/CN109920411A/zh
Priority to US16/198,380 priority patent/US11100924B2/en
Publication of JP2019105904A publication Critical patent/JP2019105904A/ja
Priority to US17/302,645 priority patent/US20210264917A1/en
Application granted granted Critical
Publication of JP7004955B2 publication Critical patent/JP7004955B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/61Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources taking into account QoS or priority requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/024Guidance services
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法に関する。
下記特許文献1には、入力された音声に基づいて音声検索を実行する情報処理装置が開示されている。この特許文献1では、音声検索を実行する際に、これまでに入力された情報では条件が不十分であり、検索を実行することができないときに、不足情報を得るための質問をユーザに対して行い、検索に必要な情報を自動的に補足している。
特開2015-69103号公報
特許文献1では、情報処理装置により提供されるサービスが、音声検索に特定されている。したがって、ユーザは、音声検索を利用する際に、サービスを指定する必要がない。しかしながら、ユーザに提供するサービスが複数種類ある場合には、サービスの提供に必要となる条件はサービスごとに異なることとなる。この場合、ユーザは、サービスを利用する際に、利用するサービスを指定してから発話する必要があり、ユーザの利便性が低下する要因になる。
そこで、本発明は、ユーザの利便性を向上させることができるサービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法を提供することを目的とする。
本発明の一態様に係るサービス提供装置は、音声認識によるサービスを提供する際に必要となる複数の入力項目及び当該入力項目に対する重み係数を、前記サービスごとに記憶する記憶部と、ユーザにより発話された内容に基づいて、当該発話された内容を格納する前記入力項目を特定する特定部と、前記特定された前記入力項目に対し、前記発話された内容を格納する格納部と、前記発話された内容を格納した全ての前記入力項目及び当該入力項目に対応する重み係数に基づいて、前記サービスごとに、スコアを算出する算出部と、前記算出されたスコアが最も高い前記サービスにおいて、まだ前記発話された内容が格納されていない前記入力項目である未入力項目が存在する場合に、当該未入力項目に対する発話を、ユーザに要求する要求部と、を備え、前記要求部は、前記算出されたスコアが最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、入力が必須となる前記入力項目である必須入力項目における前記未入力項目の数が最も少ない前記サービス、又は、前記必須入力項目に対する入力割合が最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する。
上記態様において、前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、サービスごとに設定されている優先度の最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求することとしてもよい。
上記態様において、前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、ユーザが利用する端末の種別ごとに設定されている各前記サービスに対する優先度における最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求することとしてもよい。
上記態様において、ユーザに要求した前記発話に対するユーザからの回答内容が、想定していた回答内容と異なると判定される場合に、前記発話を要求した前記サービスに対応する優先度を、他の前記サービスの優先度よりも低くする調整部をさらに備えることとしてもよい。
上記態様において、前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、ユーザが過去に利用した回数が最も多い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求することとしてもよい。
上記態様において、前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、ユーザの利用日時が現在に最も近い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求することとしてもよい。
上記態様において、前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、全てのユーザを対象にした過去の利用回数が最も多い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求することとしてもよい。
上記態様において、前記必須入力項目の全てに前記発話された内容が格納された前記サービスが存在する場合に、当該サービスをユーザに対して提供する提供部を、さらに備えることとしてもよい。
本発明の他の態様に係るサービス提供プログラムは、コンピュータを、音声認識によるサービスを提供する際に必要となる複数の入力項目及び当該入力項目に対する重み係数を、前記サービスごとに記憶する記憶部、ユーザにより発話された内容に基づいて、当該発話された内容を格納する前記入力項目を特定する特定部、前記特定された前記入力項目に対し、前記発話された内容を格納する格納部、前記発話された内容を格納した全ての前記入力項目及び当該入力項目に対応する重み係数に基づいて、前記サービスごとに、スコアを算出する算出部、前記算出されたスコアが最も高い前記サービスにおいて、まだ前記発話された内容が格納されていない前記入力項目である未入力項目が存在する場合に、当該未入力項目に対する発話を、ユーザに要求する要求部、として機能させ、前記要求部は、前記算出されたスコアが最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、入力が必須となる前記入力項目である必須入力項目における前記未入力項目の数が最も少ない前記サービス、又は、前記必須入力項目に対する入力割合が最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する。
本発明の他の態様に係る音声認識によるサービスを提供する方法は、音声認識によるサービスを提供する方法であって、ユーザにより発話された内容に基づいて、複数ある前記サービスの中から、ユーザの希望に沿う前記サービスとして、入力が必須となる入力項目である必須入力項目における未入力項目の数が最も少ない前記サービス、又は、前記必須入力項目に対する入力割合が最も高い前記サービスのいずれかを選定し、未入力項目に対する発話を、ユーザに要求する。
本発明によれば、ユーザの利便性を向上させることができるサービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法を提供することができる。
実施形態に係るサービス提供装置を含むサービス提供システムの構成を例示する図である。 入力項目情報DBに格納される入力項目情報の内容を例示する図であり、図2(A)は、サービスがスケジュール管理である場合の入力項目情報の内容を例示する図であり、図2(B)は、サービスがナビゲーションである場合の入力項目情報の内容を例示する図である。
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは同一又は同様の構成を有する。
図1を参照し、実施形態に係るサービス提供装置を含むサービス提供システムの構成について説明する。サービス提供システム100は、ユーザが使用する情報端末1と、データセンタ等に配置されるサービス提供装置2及び音声認識装置3とを含む。情報端末1とサービス提供装置2との間、及びサービス提供装置2と音声認識装置3との間は、ネットワークを介して相互に通信できるように構成される。ネットワークは、有線であっても無線であってもよく、有線と無線とを組み合わせてもよい。本実施形態では、例示的に、情報端末1とサービス提供装置2との間は無線ネットワークを含むネットワークを利用し、サービス提供装置2と音声認識装置3との間は有線ネットワークを利用することとする。
図1に示す情報端末1は、スマートフォンに代表される携帯電話を含むタブレット型端末装置である。情報端末1は、物理的な構成として、例えば、CPU(Central Processing Unit)及びメモリを含む制御ユニット、操作部、ディスプレイ、記憶ユニット、通信ユニット等を備えて構成される。CPUがメモリに格納された所定のプログラムを実行することにより、情報端末1に組み込まれた各種機能が実現する。
サービス提供装置2は、機能的な構成として、例えば、特定部21と、格納部22と、算出部23と、要求部24と、提供部25と、調整部26とを有する。サービス提供装置2は、物理的な構成として、例えば、CPU及びメモリを含む制御ユニット、記憶装置、通信装置等を備えて構成される。CPUがメモリに格納された所定のプログラムを実行することにより、特定部21、格納部22、算出部23、要求部24、提供部25及び調整部26の各機能が実現する。各機能の詳細については、後述する。
入力項目情報DB(データベース)27は、音声認識によるサービスを提供する際に必要となる入力項目に関する入力項目情報を、サービスごとに記憶する。上記サービスとして、例えば、スケジュール管理、ナビゲーション、交通情報、天気予報等が該当する。各サービスを提供する際に必要となるコンテンツは、サービス提供装置2のデータベースに格納されている。コンテンツを格納するデータベースとして、例えば、スケジュール管理DB2a、ナビゲーションDB2b、交通情報DB2c、天気予報DB2dがある。
図2に例示するように、入力項目情報DB27は、データ項目として、例えば、項目名称、重み係数、必須該否、格納状況を有する。項目名称は、入力項目を特定する名称を格納する。重み係数は、後述するスコアを算出する際に入力項目に重みを付けるための係数を格納する。必須該否は、サービスを受ける際にその入力項目への入力が必須であるかどうかを示す情報を格納する。格納状況は、入力項目に対し、ユーザにより発話された内容(以下、「発話内容」ともいう。)が格納されたかどうかを示す情報を格納する。
図2を参照して、入力項目情報DB27に格納される入力項目情報の内容を具体的に説明する。図2(A)は、サービスがスケジュール管理である場合の入力項目情報の内容であり、図2(B)は、サービスがナビゲーション(ルート検索)である場合の入力項目情報の内容である。
図2(A)には、スケジュール管理のサービスを受ける際に入力する項目の項目名称として、開始時間、終了時間、目的及び場所が設定されている。開始時間及び終了時間には重み係数としてそれぞれ“3”が設定され、目的には重み係数として“1”が設定され、場所には重み係数として“2”が設定されている。入力項目のうち、開始時間及び終了時間は、スケジュール管理サービスを受ける際に入力が必須となる項目(必須入力項目)として設定されている。また、入力項目のうち、開始時間は、既に発話内容が格納されている項目であることを示し、その他の項目は、まだ発話内容が格納されていない項目(未入力項目)であることを示している。
図2(B)には、ナビゲーションのサービスを受ける際に入力する項目の項目名称として、出発時間、到着時間、出発地、目的地及び移動手段が設定されている。入力項目のうち、出発時間及び到着時間、目的地並びに移動手段には重み係数としてそれぞれ“3”が設定され、出発地には重み係数として“1”が設定されている。入力項目のうち、出発時間及び到着時間、目的地並びに移動手段は、ナビゲーションサービスを受ける際に入力が必須となる項目として設定されている。
2つ以上の項目名称に対して設定される必須諾否の“●”表示は、いずれか一つの項目が必須入力項目になることを表している。図2(B)では、出発時間及び到着時間のうち、いずれか一方に対する入力が必須になることを表している。また、入力項目のうち、出発時間又は到着時間は、既に発話内容が格納されている項目であることを示し、その他の項目は、まだ発話内容が格納されていない項目であることを示している。
図1の説明に戻る。サービス提供装置2の各機能について順に説明する。特定部21は、ユーザにより発話された内容である発話内容を情報端末1から受信し、その発話内容を格納する入力項目を特定する。以下に、入力項目を特定する際の手順を具体的に説明する。
最初に、特定部21は、情報端末1から受信した音声を音声認識装置3に送信する。音声認識装置3は、受信した音声を解析し、テキストに変換したうえで、サービス提供装置2に送信する。音声解析は、公知の音声解析手法を用いて行うことができる。
続いて、特定部21は、音声認識装置3から受信したテキストの発話内容に基づいて、サービスごとに設けられた項目名称のいずれに該当するのかを判定し、発話内容を格納する入力項目を特定する。
格納部22は、特定部21により特定された入力項目に、発話内容を格納する。
算出部23は、発話内容を格納した全ての入力項目及びその入力項目に対応する重み係数に基づいて、サービスごとに、スコアを算出する。以下に、スコアを算出する際の手順について具体例を用いて説明する。
例えば、ユーザの発話内容が“9時から12時まで”である場合、図2(A)に示すスケジュール管理サービスでは、入力項目のうち、開始時間及び終了時間に発話内容が格納される。この場合、開始時間の重み係数である“3”+終了時間の重み係数である“3”=“6”点がスケジュール管理サービスのスコアとなる。一方、図2(B)に示すナビゲーションサービスでは、入力項目のうち、出発時間又は到着時間に発話内容が格納される。この場合、出発時間又は到着時間の重み係数である“3”点がナビゲーションサービスのスコアとなる。
また、例えば、ユーザの発話内容が“12時に名古屋駅まで”である場合、図2(A)に示すスケジュール管理サービスでは、入力項目のうち、終了時間及び場所に発話内容が格納される。この場合、終了時間の重み係数である“3”+場所の重み係数である“2”=“5”点がスケジュール管理サービスのスコアとなる。一方、図2(B)に示すナビゲーションサービスでは、入力項目のうち、到着時間及び目的地に発話内容が格納される。この場合、到着時間の重み係数である“3”+目的地の重み係数である“3”=“6”点がナビゲーションサービスのスコアとなる。
図1に示す要求部24は、算出部23により算出されたスコアが最も高いサービスにおいて、まだ発話内容が格納されていない入力項目である未入力項目が存在する場合に、その未入力項目に対する発話を、ユーザに要求する。以下に、未入力項目に対する発話をユーザに要求する際に、ユーザに対して付与する質問の内容について具体的に説明する。
例えば、スコアが最も高いサービスがスケジュール管理サービスであり、その入力項目のうち目的及び場所が未入力項目である場合には、“どこ(場所)で何をする(目的)のか”という質問をユーザに付与する。また、スコアが最も高いサービスがナビゲーションであり、その入力項目のうち出発地が未入力項目である場合には、“どこから出発するのか”という質問をユーザに付与する。
要求部24は、算出部23により算出されたスコアが最も高いサービスが複数存在する場合に、複数存在するサービスのうち、(a)必須入力項目における未入力項目の数が最も少ないサービス、又は(b)必須入力項目に対する入力割合が最も高いサービス、のいずれかを選択し、選択したサービスの未入力項目に対する発話をユーザに要求する。以下に、上記(a)及び(b)について、具体例を用いて説明する。
(a)例えば、ユーザの発話内容が“9時から”である場合、図2(A)に示すスケジュール管理サービスは、必須入力項目における未入力項目が、終了時間の1項目となり、図2(B)に示すナビゲーションサービスは、必須入力項目における未入力項目が、目的地及び移動手段の2項目となる。この場合、必須入力項目における未入力項目の数が最も少ないサービスは、スケジュール管理サービスとなる。したがって、要求部24は、スケジュール管理サービスの未入力項目に対する発話をユーザに要求する。
(b)例えば、ユーザの発話内容が“12時に名古屋駅まで”である場合、図2(A)に示すスケジュール管理サービスは、必須入力項目に対する入力割合が、1/2=0.5となり、図2(B)に示すナビゲーションサービスは、必須入力項目に対する入力割合が、2/3=0.67となる。この場合、必須入力項目に対する入力割合が最も高いサービスは、ナビゲーションサービスとなる。したがって、要求部24は、ナビゲーション(ルート検索)サービスの未入力項目に対する発話をユーザに要求する。
図1の要求部24は、必須入力項目における未入力項目の数が最も少ないサービスが複数存在する場合、又は必須入力項目に対する入力割合が最も高いサービスが複数存在する場合に、以下の(1)-(5)のいずれかによりサービスを絞り込むことができる。この場合、要求部24は、絞り込んだサービスの未入力項目に対する発話をユーザに要求することとなる。
(1)上記複数存在するサービスのうち、サービスごとに設定される優先度の最も高いサービス。
(2)上記複数存在するサービスのうち、ユーザが過去に利用した回数が最も多いサービス。この(2)は、上記(1)の優先度を設定する前の段階で特に有効となる要件である。
(3)上記複数存在するサービスのうち、ユーザの利用日時が現在に最も近いサービス。この(3)は、上記(1)の優先度を設定する前の段階で特に有効となる要件である。
(4)上記複数存在するサービスのうち、全てのユーザを対象にした過去の利用回数が最も多いサービス。ここで言う全てのユーザには、例えば、ユーザを性別や年齢等の属性により区分した場合に、それぞれの属性に属する全てのユーザと言う場合についても含まれる。
(5)上記複数存在するサービスのうち、ユーザが利用する端末の種別ごとに設定される各サービスに対する優先度の最も高いサービス。例えば、情報端末1の種別がスマートフォンである場合には、スケジュール管理サービスの優先度を、他のサービスの優先度よりも高くする。また、情報端末1の種別がナビゲーション端末である場合には、ルート検索サービスや交通情報サービスの優先度を、他のサービスの優先度よりも高くする。
提供部25は、入力項目の全てに発話内容が格納されたサービスが存在する場合に、そのサービスをユーザに対して提供する。例えば、スケジュール管理サービスの全ての入力項目に発話内容が格納された場合に、ユーザのスケジュール表にスケジュールを登録する。一方、ナビゲーションサービスの全ての入力項目に発話内容が格納された場合には、ユーザの情報端末1に走行ルートを案内するためのナビゲーション画面を表示する。
ここで、必須入力項目の全てに発話内容が格納された場合に、そのサービスをユーザに対して提供することとしてもよい。例えば、スケジュール管理サービスの必須入力項目である開始時間と終了時間とに発話内容が格納された場合に、ユーザのスケジュール表にスケジュールを登録することとしてもよい。また、ナビゲーションサービスの必須入力項目である出発時間又は到着時間と目的地と移動手段とに発話内容が格納された場合に、ユーザの情報端末1に走行ルートを案内するためのナビゲーション画面を表示することとしてもよい。
調整部26は、ユーザからの回答内容が、想定していた回答内容と異なる場合に、想定していたサービスの優先度(例えば上記(1)、(5)の優先度)を、他のサービスの優先度よりも低くする。ユーザからの回答内容が、想定していた回答内容と異なる場合として、例えば、ユーザからの回答内容が、入力項目ごとに予め設定されている回答内容のパターンに含まれない(類似しない)場合や、ユーザからの回答内容が、想定していた入力項目とは異なる入力項目に対する回答内容である場合等が該当する。
前述したように、実施形態におけるサービス提供システム100によれば、ユーザにより発話された内容に基づいて、発話内容を格納する入力項目を特定し、その特定した入力項目に発話内容を格納するとともに、発話内容を格納した全ての入力項目及びその入力項目に対応する重み係数に基づいて、サービスごとにスコアを算出し、その算出したスコアが最も高いサービスに未入力項目が存在する場合に、その未入力項目に対する発話をユーザに要求することができる。
加えて、スコアが最も高いサービスが複数存在する場合には、その複数存在するサービスのうち、必須入力項目における未入力項目の数が最も少ないサービス、又は必須入力項目に対する入力割合が最も高いサービスのいずれかのサービスを選択し、その選択したサービスの未入力項目に対する発話をユーザに要求することができる。
さらに、必須入力項目における未入力項目の数が最も少ないサービスが複数存在する場合、又は必須入力項目に対する入力割合が最も高いサービスが複数存在する場合には、複数存在するサービスのうち、サービスごとに設定されている優先度の最も高いサービス、ユーザが利用する端末の種別ごとに設定されている各サービスに対する優先度における最も高いサービス、ユーザが過去に利用した回数が最も多いサービス、ユーザの利用日時が現在に最も近いサービス、又は全てのユーザを対象にした過去の利用回数が最も多いサービスのいずれかのサービスを選択し、その選択したサービスの未入力項目に対する発話を、ユーザに要求することができる。
そして、必須入力項目の全てに発話された内容が格納されたサービスが存在する場合には、そのサービスをユーザに対して提供することができる。
このように実施形態におけるサービス提供システム100によれば、ユーザの発話内容に基づいて不足項目を特定し、その不足項目に対する発話をユーザに促しながら、ユーザが所望するサービスをシステム側の主導により提供することができる。それゆえ、ユーザの利便性を向上させることが可能となる。
[変形例]
なお、本発明は、前述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。したがって、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、前述した処理の手順は処理内容に矛盾を生じない範囲で任意に順番を変更し、又は並列に実行することができる。
また、前述した実施形態における提供部25がユーザにサービスを提供した後に、ユーザが発話をした場合、その発話内容に基づいて、ユーザに提供するサービスを切り替えることとしてもよい。例えば、スケジュール管理サービスとして、ユーザのスケジュールを登録した後に、ユーザが目的地や移動手段に該当する発話を行った場合には、スケジュール管理サービスよりも、ナビゲーションサービスをユーザが所望していることを想定することができる。したがって、このような場合に、提供部25は、ナビゲーションサービスとして、走行ルートを案内することとしてもよい。
また、前述した実施形態における要求部24は、算出部23により算出されたスコアが最も高いサービスが複数存在する場合に、複数存在するサービスのうち、上記(a)又は上記(b)のいずれかを選択し、選択したサービスの未入力項目に対する発話をユーザに要求しているが、このような処理を行う条件は、スコアが最も高いサービスが複数存在する場合に限定されない。例えば、スコアの内容にかかわらず、複数存在するサービスの中から、上記(a)又は上記(b)のいずれかを、ユーザの希望に沿うサービスとして選択し、選択したサービスの未入力項目に対する発話をユーザに要求することとしてもよい。
また、前述した実施形態におけるサービス提供装置2は、機能的な構成として、特定部21、格納部22、算出部23、要求部24、提供部25及び調整部26を有しているが、これに限定されず、必要に応じて任意の機能を適宜削除することや追加することができる。例えば、提供部25及び調整部26を、サービス提供装置2とは別の装置に組み込むこととしてもよいし、音声認識装置3の音声認識機能を、サービス提供装置2に組み込むこととしてもよい。
1…情報端末、2…サービス提供装置、3…音声認識装置、21…特定部、22…格納部、23…算出部、24…要求部、25…提供部、26…調整部、27…入力項目情報DB、100…サービス提供システム。

Claims (10)

  1. 音声認識によるサービスを提供する際に必要となる複数の入力項目及び当該入力項目に対する重み係数を、前記サービスごとに記憶する記憶部と、
    ユーザにより発話された内容に基づいて、当該発話された内容を格納する前記入力項目を特定する特定部と、
    前記特定された前記入力項目に対し、前記発話された内容を格納する格納部と、
    前記発話された内容を格納した全ての前記入力項目及び当該入力項目に対応する重み係数に基づいて、前記サービスごとに、スコアを算出する算出部と、
    前記算出されたスコアが最も高い前記サービスにおいて、まだ前記発話された内容が格納されていない前記入力項目である未入力項目が存在する場合に、当該未入力項目に対する発話を、ユーザに要求する要求部と、
    を備え、
    前記要求部は、前記算出されたスコアが最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、入力が必須となる前記入力項目である必須入力項目における前記未入力項目の数が最も少ない前記サービス、又は、前記必須入力項目に対する入力割合が最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    サービス提供装置。
  2. 前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、サービスごとに設定されている優先度の最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    請求項1記載のサービス提供装置。
  3. 前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、ユーザが利用する端末の種別ごとに設定されている各前記サービスに対する優先度における最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    請求項1記載のサービス提供装置。
  4. ユーザに要求した前記発話に対するユーザからの回答内容が、想定していた回答内容と異なると判定される場合に、前記発話を要求した前記サービスに対応する優先度を、他の前記サービスの優先度よりも低くする調整部をさらに備える、
    請求項2又は3記載のサービス提供装置。
  5. 前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、ユーザが過去に利用した回数が最も多い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    請求項1記載のサービス提供装置。
  6. 前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、ユーザの利用日時が現在に最も近い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    請求項1記載のサービス提供装置。
  7. 前記要求部は、前記必須入力項目における前記未入力項目の数が最も少ない前記サービスが複数存在する場合、又は前記必須入力項目に対する入力割合が最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、全てのユーザを対象にした過去の利用回数が最も多い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    請求項1記載のサービス提供装置。
  8. 前記必須入力項目の全てに前記発話された内容が格納された前記サービスが存在する場合に、当該サービスをユーザに対して提供する提供部を、さらに備える請求項1から7のいずれか一項に記載のサービス提供装置。
  9. コンピュータを、
    音声認識によるサービスを提供する際に必要となる複数の入力項目及び当該入力項目に対する重み係数を、前記サービスごとに記憶する記憶部、
    ユーザにより発話された内容に基づいて、当該発話された内容を格納する前記入力項目を特定する特定部、
    前記特定された前記入力項目に対し、前記発話された内容を格納する格納部、
    前記発話された内容を格納した全ての前記入力項目及び当該入力項目に対応する重み係数に基づいて、前記サービスごとに、スコアを算出する算出部、
    前記算出されたスコアが最も高い前記サービスにおいて、まだ前記発話された内容が格納されていない前記入力項目である未入力項目が存在する場合に、当該未入力項目に対する発話を、ユーザに要求する要求部、
    として機能させ、
    前記要求部は、前記算出されたスコアが最も高い前記サービスが複数存在する場合に、当該複数存在する前記サービスのうち、入力が必須となる前記入力項目である必須入力項目における前記未入力項目の数が最も少ない前記サービス、又は、前記必須入力項目に対する入力割合が最も高い前記サービスにおいて、前記未入力項目に対する発話を、ユーザに要求する、
    サービス提供プログラム。
  10. プロセッサにより実行される、音声認識によるサービスを提供する方法であって、
    ユーザにより発話された内容に基づいて、複数ある前記サービスの中から、
    ユーザの希望に沿う前記サービスとして、
    入力が必須となる入力項目である必須入力項目における未入力項目の数が最も少ない前記サービス、又は、前記必須入力項目に対する入力割合が最も高い前記サービス
    のいずれかを選定し、
    未入力項目に対する発話を、ユーザに要求する、
    音声認識によるサービスを提供する方法。
JP2017236653A 2017-12-11 2017-12-11 サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法 Active JP7004955B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017236653A JP7004955B2 (ja) 2017-12-11 2017-12-11 サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法
CN201811383513.XA CN109920411A (zh) 2017-12-11 2018-11-20 服务提供装置、存储服务提供程序的非暂时性计算机可读存储介质及服务提供方法
US16/198,380 US11100924B2 (en) 2017-12-11 2018-11-21 Service providing device, non-transitory computer-readable storage medium storing service providing program and service providing method
US17/302,645 US20210264917A1 (en) 2017-12-11 2021-05-08 Service providing device, non-transitory computer-readable storage medium storing service providing program and service providing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017236653A JP7004955B2 (ja) 2017-12-11 2017-12-11 サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法

Publications (2)

Publication Number Publication Date
JP2019105904A JP2019105904A (ja) 2019-06-27
JP7004955B2 true JP7004955B2 (ja) 2022-01-21

Family

ID=66697135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017236653A Active JP7004955B2 (ja) 2017-12-11 2017-12-11 サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法

Country Status (3)

Country Link
US (2) US11100924B2 (ja)
JP (1) JP7004955B2 (ja)
CN (1) CN109920411A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7485448B2 (ja) 2019-06-06 2024-05-16 日本電気株式会社 処理システム、処理方法及びプログラム
JP7132206B2 (ja) * 2019-12-13 2022-09-06 Necプラットフォームズ株式会社 案内システム、案内システムの制御方法、およびプログラム
CN111274351A (zh) * 2020-01-13 2020-06-12 深圳壹账通智能科技有限公司 自动调整用户优先级的方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182273A (ja) 2003-12-17 2005-07-07 Nippon Telegr & Teleph Corp <Ntt> 入力情報特定方法
JP2007114475A (ja) 2005-10-20 2007-05-10 Honda Motor Co Ltd 音声認識機器制御装置
JP2007522488A (ja) 2003-12-23 2007-08-09 ダイムラークライスラー・アクチェンゲゼルシャフト 車両用の制御システム
US20160300573A1 (en) 2015-04-08 2016-10-13 Google Inc. Mapping input to form fields
JP2017059014A (ja) 2015-09-17 2017-03-23 株式会社アイ・ビジネスセンター 解析装置およびデータ検索装置,ならびにこれらの制御方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325597A (ja) * 1994-05-31 1995-12-12 Fuji Xerox Co Ltd 情報入力方法およびその方法を実施するための装置
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
WO2005062295A1 (ja) * 2003-12-05 2005-07-07 Kabushikikaisha Kenwood 機器制御装置、音声認識装置、エージェント装置及び機器制御方法
EP1562180B1 (en) 2004-02-06 2015-04-01 Nuance Communications, Inc. Speech dialogue system and method for controlling an electronic device
US7941154B2 (en) * 2004-04-19 2011-05-10 Telecom Italia S.P.A. Method and system for resource management in communication networks, related network and computer program product therefor
US20060258377A1 (en) 2005-05-11 2006-11-16 General Motors Corporation Method and sysem for customizing vehicle services
JP4197344B2 (ja) * 2006-02-20 2008-12-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声対話システム
CA2747153A1 (en) 2011-07-19 2013-01-19 Suleman Kaheer Natural language processing dialog system for obtaining goods, services or information
US10417037B2 (en) * 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10354677B2 (en) 2013-02-28 2019-07-16 Nuance Communications, Inc. System and method for identification of intent segment(s) in caller-agent conversations
US9384732B2 (en) 2013-03-14 2016-07-05 Microsoft Technology Licensing, Llc Voice command definitions used in launching application with a command
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
DE102014109121B4 (de) * 2013-07-10 2023-05-04 Gm Global Technology Operations, Llc Systeme und Verfahren zur Arbitrierung eines Sprachdialogdienstes
JP2015069103A (ja) 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 情報処理装置、制御方法、及びプログラム
CN104575494A (zh) * 2013-10-16 2015-04-29 中兴通讯股份有限公司 一种语音处理的方法和终端
US9361084B1 (en) * 2013-11-14 2016-06-07 Google Inc. Methods and systems for installing and executing applications
US9767794B2 (en) 2014-08-11 2017-09-19 Nuance Communications, Inc. Dialog flow management in hierarchical task dialogs
JP6624368B2 (ja) * 2014-09-30 2019-12-25 パナソニックIpマネジメント株式会社 接客モニタリングシステム及び接客モニタリング方法
CN107193973B (zh) 2017-05-25 2021-07-20 百度在线网络技术(北京)有限公司 语义解析信息的领域识别方法及装置、设备及可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182273A (ja) 2003-12-17 2005-07-07 Nippon Telegr & Teleph Corp <Ntt> 入力情報特定方法
JP2007522488A (ja) 2003-12-23 2007-08-09 ダイムラークライスラー・アクチェンゲゼルシャフト 車両用の制御システム
JP2007114475A (ja) 2005-10-20 2007-05-10 Honda Motor Co Ltd 音声認識機器制御装置
US20160300573A1 (en) 2015-04-08 2016-10-13 Google Inc. Mapping input to form fields
JP2017059014A (ja) 2015-09-17 2017-03-23 株式会社アイ・ビジネスセンター 解析装置およびデータ検索装置,ならびにこれらの制御方法

Also Published As

Publication number Publication date
CN109920411A (zh) 2019-06-21
JP2019105904A (ja) 2019-06-27
US11100924B2 (en) 2021-08-24
US20190180745A1 (en) 2019-06-13
US20210264917A1 (en) 2021-08-26

Similar Documents

Publication Publication Date Title
US11475490B2 (en) Method and system for vehicle allocation to customers for ride-sharing
JP5958475B2 (ja) 音声認識端末装置、音声認識システム、音声認識方法
JP7004955B2 (ja) サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法
JP6122642B2 (ja) 機能実行システム及び発話例出力方法
JP2013529794A (ja) 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法
JP5616390B2 (ja) 応答生成装置、応答生成方法および応答生成プログラム
CN106992012A (zh) 语音处理方法及电子设备
CN110956955B (zh) 一种语音交互的方法和装置
US20220299335A1 (en) Content-aware navigation instructions
US20210118435A1 (en) Automatic Synchronization for an Offline Virtual Assistant
JP2019159883A (ja) 検索システム、検索方法
JP6563451B2 (ja) 移動支援装置、移動支援システム、移動支援方法及び移動支援プログラム
KR20200024511A (ko) 대화 에이전트의 동작 방법 및 그 장치
JP7274404B2 (ja) 情報提供装置、情報提供方法、およびプログラム
US11113025B2 (en) Interaction management device and non-transitory computer readable recording medium
JP5341548B2 (ja) 音声認識装置
JP6826324B2 (ja) サービス提供装置及びサービス提供プログラム
US20210241755A1 (en) Information-processing device and information-processing method
CN112365153B (zh) 视力障碍者旅游计划制定方法及相关装置
KR102275596B1 (ko) 버스 정류소 기반 여행 정보 제공을 위한 서비스 제공 장치 및 방법
CN112862600A (zh) 银行网点的查询方法及装置、电子设备及存储介质
EP3321820A1 (en) Information processing device and information presentation system
JP2019200546A (ja) エージェントサーバ
JP7406837B2 (ja) 情報処理システム、情報処理プログラム、情報処理装置および情報処理方法
US20240067128A1 (en) Supporting multiple roles in voice-enabled navigation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200624

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211219