JP2022103553A - 情報提供装置、情報提供方法、およびプログラム - Google Patents
情報提供装置、情報提供方法、およびプログラム Download PDFInfo
- Publication number
- JP2022103553A JP2022103553A JP2020218259A JP2020218259A JP2022103553A JP 2022103553 A JP2022103553 A JP 2022103553A JP 2020218259 A JP2020218259 A JP 2020218259A JP 2020218259 A JP2020218259 A JP 2020218259A JP 2022103553 A JP2022103553 A JP 2022103553A
- Authority
- JP
- Japan
- Prior art keywords
- information
- utterance
- unit
- user
- importance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】音声ユーザインターフェースのユーザビリティを向上させること。【解決手段】実施形態の情報提供装置は、ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供する提供部と、前記ユーザの発話情報を取得する発話取得部と、前記ユーザの状況に関する状況情報を取得する状況取得部と、前記発話取得部により取得される発話情報、前記状況取得部により取得される状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定する重要度決定部と、前記重要度決定部により決定された重要度が閾値以上の特徴語を抽出する抽出部と、前記抽出部により抽出された特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する情報生成部と、を備える。【選択図】図1
Description
本発明は、情報提供装置、情報提供方法、およびプログラムに関する。
従来、端末装置が音声ユーザインターフェースを用いて受け付けたユーザの発話内容をサーバに送信し、発話内容に応じた情報をサーバから受信して提供するサービスが知られている。上述のサービスに関して、予め電子書籍の商品の次話情報をコンテンツ表示装置に記憶しておき、ユーザが電子書籍の商品を読了した際に次話情報を提供したり、端末装置がサーバとオフライン状態の時に使用する辞書データを提供する技術が存在する(例えば、特許文献1~4参照)。
ユーザの発話内容や発話に含まれる固有表現等は、ユーザの状況等に応じて変化や流行等によって変化する。しかしながら、情報提供装置が提供する辞書データ等のオフラインデータは、提供先の移動通信機器の記憶容量により制限されるため、オフライン状態において適切な音声認識や充分な情報提供ができない場合があった。そのため、音声ユーザインターフェースのユーザビリティが十分でない場合があった。
本発明の態様は、このような事情を考慮してなされたものであり、音声ユーザインターフェースのユーザビリティを向上させることができる情報提供装置、情報提供方法、およびプログラムを提供することを目的の一つとする。
この発明に係る情報提供装置、情報提供方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係る情報提供装置は、ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供する提供部と、前記ユーザの発話情報を取得する発話取得部と、前記ユーザの状況に関する状況情報を取得する状況取得部と、前記発話取得部により取得される発話情報、前記状況取得部により取得される状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定する重要度決定部と、前記重要度決定部により決定された重要度が閾値以上の特徴語を抽出する抽出部と、前記抽出部により抽出された特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する情報生成部と、を備える情報提供装置である。
(1):この発明の一態様に係る情報提供装置は、ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供する提供部と、前記ユーザの発話情報を取得する発話取得部と、前記ユーザの状況に関する状況情報を取得する状況取得部と、前記発話取得部により取得される発話情報、前記状況取得部により取得される状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定する重要度決定部と、前記重要度決定部により決定された重要度が閾値以上の特徴語を抽出する抽出部と、前記抽出部により抽出された特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する情報生成部と、を備える情報提供装置である。
(2):上記(1)の態様において、前記重要度決定部は、前記ユーザの指向性を示す指向情報に基づいて前記発話情報に含まれる特徴語の重要度を決定するものである。
(3):上記(1)または(2)の態様において、前記発話情報の取得または認識に関するエラーを検知するエラー検知部を更に備え、前記重要度決定部は、前記エラー検知部による検知結果に基づいて前記発話情報に含まれる特徴語の重要度を決定するものである。
(4):上記(3)の態様において、前記重要度決定部は、前記エラー検知部により前記エラーが検知された後に、前記発話取得部により取得された発話情報に含まれる特徴語の重要度を、前記エラーが検知されていない状況で取得された発話情報に含まれる特徴語よりも大きくするものである。
(5):上記(3)または(4)の態様において、前記重要度決定部は、前記エラー検知部により連続して検出された前記エラーの回数に基づいて、前記エラーが検知された後に、前記発話取得部により取得された発話情報に含まれる特徴語の重要度を決定するものである。
(6):上記(3)~(5)のうち何れか一つの態様において、前記エラー検知部は、前記エラーの種類を検知し、前記抽出部は、前記エラー検知部により検出された前記エラーの種類に応じて、前記エラーが検知された後に、前記発話取得部により取得された発話情報に含まれる特徴語の重要度を決定するものである。
(7):上記(6)の態様において、前記エラーの種類は、移動通信機器と通信するネットワークに関するエラーであるネットワークエラー、前記発話情報に含まれる発話の意味が理解できないことを示す意味理解エラー、および前記発話情報の音声認識処理に関するエラーを示す音声認識エラーを含み、前記抽出部は、前記音声認識エラーである場合の前記特徴語の重要度を、前記ネットワークエラーである場合よりも大きくし、前記意味理解エラーである場合の前記特徴語の重要度を、前記音声認識エラーである場合よりも大きくするものである。
(8):上記(1)~(7)のうち何れか一つの態様において、前記重要度決定部は、所定時間における前記発話情報に含まれる同一の特徴語の数に基づいて、前記特徴語の重要度を決定するものである。
(9):本発明の他の態様は、コンピュータが、ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供し、前記ユーザの発話情報を取得し、前記ユーザの状況に関する状況情報を取得し、取得した前記発話情報、前記状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定し、決定した前記重要度が閾値以上の特徴語を抽出し、抽出した前記特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する、情報提供方法である。
(10):本発明の他の態様は、コンピュータに、ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供させ、前記ユーザの発話情報を取得させ、前記ユーザの状況に関する状況情報を取得させ、取得された前記発話情報、前記状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定させ、決定された前記重要度が閾値以上の特徴語を抽出させ、抽出された前記特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成させる、プログラムである。
上記(1)~(10)の態様によれば、音声ユーザインターフェースのユーザビリティを向上させることができる。
以下、図面を参照し、本発明の情報提供装置、情報提供方法、およびプログラムの実施形態について説明する。
図1は、実施形態の情報提供装置100を含む情報提供システム1の構成図である。情報提供システム1は、例えば、情報提供装置100と、ユーザU1が利用する通信端末300と、ユーザU2が利用する車両Mとを備える。これらの構成要素は、ネットワークNWを介して互いに通信可能である。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、電話回線、公衆回線、専用回線、プロバイダ装置、無線基地局等を含む。情報提供システム1には、通信端末300または車両Mのうち、一方または双方が複数含まれてもよい。車両Mは、例えば、エージェント装置500を備える。通信端末300およびエージェント装置500のそれぞれは、「移動通信機器」の一例である。以下では、情報提供システム1において、情報提供装置100と、通信端末300または車両M(エージェント装置500)とがネットワークNWを介してリアルタイムに通信できる状態を「オンライン状態」と称し、リアルタイムに通信できない状態を「オフライン状態」と称するものとする。リアルタイムとは、所定の許容時間を含んでもよく、例えば、通信不可状態から所定時間(例えば、5~10[秒])以内に通信可能状態に復帰した場合は、リアルタイムに通信できる状態であるものとする。オフライン状態は、例えば、通信環境の悪化やネットワークエラー、通信装置(送受信部)の故障等により発生する。
情報提供装置100は、通信端末300とオンライン状態において、通信端末300からユーザU1の発話情報を受け付け、受け付けた発話情報に応じた処理を行い、処理結果を通信端末300に送信する。発話情報には、例えば、問い合わせや要求等が含まれる。処理結果には、例えば、問い合わせや要求に対する回答情報、音声認識等のエラーに関する情報等が含まれる。また、情報提供装置100は、エージェント装置500とオンライン状態において、車両Mに搭載されたエージェント装置500からユーザU2の発話情報を受け付け、受け付けた発話情報に応じて処理を行い、処理結果をエージェント装置500に送信する。また、情報提供装置100は、通信端末300やエージェント装置500が、将来においてオフライン状態になった場合にも、各ユーザU1、U2に情報が提供できるように、事前にオフラインデータを生成し、生成したオフラインデータを通信端末300やエージェント装置500に送信する。将来とは、例えば、現時点から所定時間先の時間までの期間である。所定時間は、固定時間でもよく、ユーザの状況(例えば、位置や移動手段)等によって変更される可変時間でもよい。オフラインデータには、例えば、ユーザの発話内容から特徴語を抽出するときに用いられるユーザ固有の辞書データや、特徴語を含む意味情報に応じた対話データ(回答情報)等が含まれる。情報提供装置100は、例えば、通信端末300およびエージェント装置500と、ネットワークNWを介して互いに通信し、各種データを送受信するクラウドサーバとして機能してもよい。
通信端末300は、例えば、スマートフォンやタブレット端末等の携帯型端末である。通信端末300は、所定周期または所定タイミングで、通信端末300の位置情報やユーザU1により入力された情報、ユーザU1の状況に関する状況情報等を、ネットワークNWを介して情報提供装置100に送信する。ここでの状況情報には、例えば、通信端末300により取得可能なユーザU1に関する情報およびユーザU1(または通信端末300)の周囲の状況等が含まれる。また、通信端末300は、ユーザU1からの発話情報を受け付ける。通信端末300は、情報提供装置100とオンライン状態である場合には、受け付けた発話情報を情報提供装置100に送信し、送信した情報に対する回答情報を受信して表示装置等に出力させる。また、通信端末300は、情報提供装置100とオフライン状態である場合には、受け付けた発話情報に基づいて記憶部に記憶されたオフラインデータを参照し、発話情報に対応する回答情報を生成して表示装置等に出力させる。
エージェント装置500が搭載される車両Mは、例えば、二輪や三輪、四輪等の車両であり、その駆動源は、ディーゼルエンジンやガソリンエンジン等の内燃機関、電動機、或いはこれらの組み合わせである。電動機は、内燃機関に連結された発電機による発電電力、或いは二次電池や燃料電池の放電電力を使用して動作する。また、車両Mは、自動運転車両であってもよい。自動運転とは、例えば、自動的に車両の操舵または速度のうち、一方または双方を制御して運転制御を実行することである。上述した車両の運転制御には、例えば、ACC(Adaptive Cruise Control)や、ALC(Auto Lane Changing)、LKAS(Lane Keeping Assistance System)、TJP(Traffic Jam Pilot)といった種々の運転制御が含まれてよい。また、自動運転車両には、上述の運転制御を実行する自動運転モードと、乗員(運転者)の手動運転によって運転が制御される手動運転モードが存在する。自動運転モードの場合、手動運転モードと比較して乗員に課されるタスクが小さい。乗員に課されるタスクとは、例えば、車両Mの周辺監視や運転操作子への操作(例えば、ステアリングホイールを把持する動作)等である。したがって、自動運転モードの実行中は、例えば乗員は周辺監視を行う必要やステアリングホイールを把持する必要がないため、車両Mの走行中に通信端末300を操作したり、通信端末300やエージェント装置500が画面表示した画像等を閲覧することができる。
エージェント装置500は、所定周期または所定タイミングで、車両M(エージェント装置500)の位置情報やユーザU2により入力された情報、ユーザU2の状況に関する状況情報等を、ネットワークNWを介して情報提供装置100に送信する。ここでの状況情報には、例えば、エージェント装置500または車両Mにより取得可能なユーザU2に関する情報、車両Mに関する情報、またはユーザU2(または車両M)の周囲の状況等が含まれる。車両Mに関する情報には、走行速度や走行距離、走行時間、運転モード(自動運転モード、手動運転モード)等の情報が含まれる。また、エージェント装置500は、車両Mの乗員(例えば、ユーザU2)と対話しユーザU2からの発話情報を受け付ける。エージェント装置500は、情報提供装置100とオンライン状態である場合には、受け付けた発話情報を情報提供装置100に送信し、送信した情報に対する回答情報を受信して表示装置等に出力させる。また、エージェント装置500は、情報提供装置100とオフライン状態である場合には、受け付けた発話情報に基づいて記憶部に記憶されたオフラインデータを参照し、回答情報を生成して表示装置等に出力させる。
[情報提供装置]
情報提供装置100は、例えば、通信部110と、認証部120と、取得部130と、発話解析部140と、エラー検知部150と、重要度決定部160、抽出部170と、オフラインデータ生成部180と、提供部190と、記憶部200とを備える。認証部120、取得部130、発話解析部140、エラー検知部150、重要度決定部160、抽出部170、オフラインデータ生成部180、および提供部190は、それぞれ、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置等に装着されることで情報提供装置100の記憶装置にインストールされてもよい。オフラインデータ生成部180は、「情報生成部」の一例である。
情報提供装置100は、例えば、通信部110と、認証部120と、取得部130と、発話解析部140と、エラー検知部150と、重要度決定部160、抽出部170と、オフラインデータ生成部180と、提供部190と、記憶部200とを備える。認証部120、取得部130、発話解析部140、エラー検知部150、重要度決定部160、抽出部170、オフラインデータ生成部180、および提供部190は、それぞれ、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置等に装着されることで情報提供装置100の記憶装置にインストールされてもよい。オフラインデータ生成部180は、「情報生成部」の一例である。
記憶部200は、上記の各種記憶装置、或いはEEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、またはRAM(Random Access Memory)等により実現されてもよい。記憶部200には、例えば、ユーザ情報DB(Database)210、観点リスト212、オンライン特徴語DB214、オンライン対話DB216、地図情報218、履歴情報220、プログラム、およびその他各種情報が格納される。また、記憶部200に記憶された各種情報やDBのうち、少なくとも一部は通信可能な外部装置に記憶されていてもよい。オンライン特徴語DB214は、「辞書データ」の一例である。
ユーザ情報DB210には、例えば、情報提供装置100が提供するサービスを利用するユーザを識別する情報や認証部120による認証処理に用いられる情報等が含まれる。観点リスト212には、例えば、ユーザの指向情報が含まれる。指向情報は、例えば、ユーザの指向性を示す情報であり、例えば、ユーザの考え方を示す情報や、趣味や好み等を示す情報(嗜好性の情報)、ユーザの習慣やユーザが重視する事項を示す情報等である。
オンライン特徴語DB214は、情報提供装置100と移動通信機器とがオンライン状態において、ユーザの発話から自然言語処理によって特徴語を抽出する際に用いられる。オンライン特徴語DB214には、例えば、予め決められた特徴語が蓄積されると共に、流行等によって生成または変化する特徴語が適宜更新されて蓄積される。例えば、オンライン特徴語DB214は、複数のユーザの発話履歴や、ユーザが個人で行動したり、集団で行動した場合等の場面ごとの発話履歴等に基づいて特徴語が生成されていてもよい。
オンライン対話DB216は、ユーザの発話から自然言語処理によって抽出された特徴語を含む意味情報(例えば、問い合わせ文等)に回答情報(対話内容)が対応付けられた情報である。オンライン対話DB216は、回答情報には、文字情報、音声情報、画像情報が含まれてよい。また、回答情報には、地図情報218と連携することで取得したPOI(Point Of Interest)情報や、店舗や施設等に関する情報(例えば、料金やメニュー、駐車場の情報等)、レビュー(評判)に関する情報等の各種案内情報が含まれてよい。オンライン対話DB216は、複数のDBにより構成されていてもよく、一部のDBが外部装置に記憶されていてもよい。
地図情報218は、例えば、道路を示すリンクと、リンクによって接続されたノードとによって道路形状が表現された情報である。地図情報218は、道路の曲率や車線の情報、位置情報に対応付けられた案内情報が含まれてよい。また、地図情報218は、例えば、車線の中央の情報あるいは車線の境界の情報等を含んでいる。また、地図情報218には、道路情報、交通規制情報、住所情報(住所・郵便番号)、施設情報、電話番号情報等が含まれてよい。地図情報218は、例えば、最新であり且つ広範囲の地図データが格納されている。地図情報218によって、目的地までの経路に関する情報を提供したり、オンライン対話DB216の回答情報に含まれる店舗や施設、地域、場所に関するPOI情報を提供することができる。
履歴情報220には、例えば、ユーザごとに、移動通信機器から取得した発話情報や、発話情報の取得または認識時に検知したエラー情報、ユーザの状況に関する状況情報、発話内容に対する回答情報等の履歴情報が含まれる。また、履歴情報220には、ユーザが一人でいるときの履歴情報(個人履歴)と、ユーザが集団(二以上の人数)でいるときの履歴情報(集団履歴)とが分かれて記憶されていてもよい。集団履歴には、集団に含まれるユーザ以外のメンバーの属性(例えば、家族、チームメイト、ツアー旅行参加者等)の情報が含まれてよい。
通信部110は、ネットワークNWを介して通信端末300、エージェント装置500、その他の外部装置と通信する。また、通信部110は、ネットワークNWを介して移動通信機器と定期的な通信を行い、通信ができない場合にネットワークエラーとしてエラー情報をエラー検知部150に出力する。
認証部120は、情報提供システム1を利用するユーザ(ユーザU1、U2等)に関する情報(ユーザ情報DB210)を登録する。例えば、認証部120は、移動通信機器からユーザ登録要求を受け付けた場合に、ユーザ情報DB210に含まれる各種情報を入力させるための画像を生成して、登録要求を受け付けた移動通信機器に表示させ、移動通信機器から入力されるユーザに関する情報を取得する。そして、認証部120は、移動通信機器から取得したユーザに関する情報を記憶部200のユーザ情報DB210に登録する。
図2は、ユーザ情報DB210の内容について説明するための図である。ユーザ情報DB210は、例えば、情報提供システム1の利用時等にユーザを認証する認証情報に、住所、氏名、年齢、性別、連絡先等の情報が対応付けられたものである。認証情報には、例えば、ユーザを識別する識別情報であるユーザIDやパスワード等が含まれる。また、認証情報には、指紋情報や虹彩情報等の生体認証情報が含まれてもよい。連絡先は、例えば、そのユーザが利用する移動通信機器と情報提供装置100とが通信するためのアドレス情報である。また、連絡先には、ユーザの電話番号やメールアドレス、端末識別情報等が含まれていてもよい。また、ユーザ情報DB210には、ユーザの家族構成や職業等に関する情報が含まれてもよい。情報提供装置100は、連絡先の情報に基づいてユーザの移動通信機器と通信し、各種情報を提供する。
認証部120は、ユーザ情報DB210に基づいて情報提供システム1のサービスを利用するユーザの認証を行う。例えば、認証部120は、移動通信機器から実施形態に係るサービス(情報提供サービス)の利用要求を受け付けたタイミングでユーザの認証を行う。例えば、認証部120は、利用要求を受け付けた場合に、ユーザIDやパスワード等の認証情報を入力する認証画像を生成し、生成した画像を要求のあった移動通信機器に表示させると共に、表示された画像を用いて入力された入力認証情報に基づいてユーザ情報DB210の認証情報を参照し、入力認証情報に合致する認証情報が格納されているか否かによって、サービスの利用を許可するか否かを判定する。例えば、認証部120は、入力認証情報に合致する認証情報がユーザ情報DB210に含まれる場合にはサービスの利用を許可し、合致する情報が含まれていない場合にはサービスの利用を拒否するか、新規登録を行わせるための処理を行う。
また、認証部120は、ユーザの新規登録処理を行う場合に、上述したユーザ情報DB210に関する情報の登録に加えて、観点リスト212に関する情報の登録を受け付けて、受け付けた情報に基づいて観点リスト212の登録を行ってもよい。図3は、観点リスト212の内容について説明するための図である。観点リスト212には、ユーザIDに観点情報が対応付けられている。観点情報には、例えば、ユーザの指向性を示す指向情報が含まれる。指向情報には、例えば、趣味、好きなスポーツ、好きな食べ物、好きな音楽、関心や興味があるもの、その他ユーザを所定のジャンル等で分類できる情報が含まれる。観点リスト212は、ユーザ情報DB210に含まれていてもよい。認証部120は、ユーザからの指示により、ユーザ情報DB210および観点リスト212を更新してもよい。また、観点リスト212は、提供部190が履歴情報220に含まれる情報を用いて統計処理を行い、履歴に含まれる発話に含まれる頻度や回数が閾値以上の単語に対応する観点を観点情報に含めることで生成または更新されてもよい。
取得部130は、情報提供装置100の管理者によって入力された情報や、ネットワークNWに接続された移動通信機器や他の外部装置から送信された各種情報を取得する。取得部130は、例えば、発話取得部132と、状況取得部134とを備える。発話取得部132は、移動通信機器からユーザの発話情報(例えば、音声データ)を取得する。状況取得部134は、移動通信機器からユーザの状況に関する状況情報を取得する。状況情報には、例えば、ユーザの状態や、ユーザに同行する同行者(ユーザが車両Mに乗車している場合には、車両Mの同乗者)、ユーザの周辺状況、ユーザの予定等の情報が含まれる。ユーザの周辺状況には、例えば、ユーザの周辺の天候、気温、湿度等の情報が含まれ、ユーザが車両Mを運転している場合には、道路状況(渋滞の有無、道路形状)等の情報が含まれる。また、ユーザの予定は、例えば、移動通信機器に予め登録されたユーザの予定情報、または他の外部装置(例えば、スケジュールサーバ)に登録された予定情報である。予定情報には、例えば、ユーザの移動または行動する情報が含まれる。また、ユーザの予定には、例えば、車両Mに搭載されたナビゲーション装置に設定された目的地に関する情報が含まれてもよい。
発話解析部140は、発話取得部132により取得された発話情報を解析する。発話解析部140は、例えば、ASR(Automatic Speech Recognition)機能やNLU(Natural Language Understanding)機能を備える。例えば、発話解析部140は、ASR機能として、発話取得部132により取得された発話の音声ストリームから音声区間を検出する。例えば、発話解析部140は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。また、発話解析部140は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声・非音声識別に基づく区間検出を行ってもよく、予め記憶部200等に記憶された音声区間を検出するためのデータベース(不図示)とのマッチング処理により区間検出を行ってもよい。次に、発話解析部140は、検出した音声区間における音声を認識し、音声を文字情報としてテキスト化する。また、発話解析部140は、音声区間における音声の音量が小さかったり、独特の抑揚等によって、音声が認識できなかった場合(文字情報としてテキスト化できなかった場合)、認識エラーとしてエラー情報をエラー検知部150や提供部190に出力する。
また、発話解析部140は、NLU機能として、テキスト化された文字情報に対する自然言語処理を実行し、文字情報の意味や意図を理解する。自然言語処理には、形態素解析、構文解析、意味解析、文脈解析等が含まれる。形態素解析は、例えば、文字情報を、意味を持つ最小の表現要素の単位に分割し、分割した単位(形態素)ごとの品詞等を解析(抽出)する。このとき、発話解析部140は、分割した単語(抽出語)を用いてオンライン特徴語DB214を参照し、システム側で理解可能な特徴語(具体的には、オンライン対話DB216の意味情報に含まれる特徴語に変換されてもよい。構文解析は、例えば、形態素解析により得られた形態素をもとに、文の構造を解析する。意味解析は、例えば、構文解析により得られた構文をもとに、意味や意図を持つまとまりを判別する。文脈解析は、例えば、文単位や文脈単位で意味や意図を解釈する。
また、発話解析部140は、解釈した意味に対応する意味情報(発話情報に対する意図情報)を生成する。例えば、発話情報の解釈結果として、「A駅まで何キロ?」、「A駅までどのくらい走る?」等の意味が解釈された場合、発話解析部140は、標準文字情報「A駅までの距離は?」に置き換えた意味情報を生成する。これにより、その発話情報が現在位置からA駅までの距離を問い合わせているという意図情報を取得することができる。なお、発話解析部140は、意味情報を生成する場合にもオンライン特徴語DB214を参照して単語を変換してもよい。これにより、文字揺らぎがあった場合にもオンライン対話DB216から回答情報を取得しやすくすることができる。また、発話解析部140は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を解釈したり、解釈結果に基づく意味情報を生成してもよい。また、発話解析部140は、予め定義された意図理解モデル等を用いて意味情報を生成してもよい。意図理解モデルは、例えば、発話情報を入力することで、意味情報や意図情報が出力されるためのモデルである。意図理解モデルは、例えば記憶部200等に記憶されてよい。また、意図理解モデルは、発話解析部140による解析結果と正解データ等を用いて更新されてもよい。
なお、発話解析部140は、テキスト化された文字情報に対する自然言語処理を実行して意味情報が生成できなかった場合に意味理解エラーとしてエラー情報をエラー検知部150や提供部190に出力する。意味情報が生成できない場合とは、例えば、上述した形態素解析、構文解析、意味解析、または文脈解析ができない場合や、解釈した意味に対応する意味情報が生成できない場合である。また、発話解析部140は、エラーが生じた解析内容に応じて、意味理解エラーを更に細分化してもよい。また、発話解析部140は、例えば、エラーが検知された後の発話情報に含まれる特徴語や、エラー等によりユーザが言い直した発話情報に含まれる特徴語等を解析してもよい。
エラー検知部150は、通信部110によるネットワークエラー、発話解析部140による音声認識エラーおよび意味理解エラーを検知する。また、エラー検知部150は、他のエラー情報を検知してもよい。
重要度決定部160は、発話解析部140により解析された発話情報や、状況取得部134により取得された状況情報、およびオンライン特徴語DB214に基づいて、発話情報に含まれる特徴語等の重要度を決定する。重要度は、数値であってもよく、レベルや度合を示す指標値であってもよい。更に、重要度決定部160は、上述した情報に加えて観点リスト212を用いて、発話情報や観点リストに含まれる特徴語の重要度を決定してもよい。また、重要度決定部160は、エラー検知部150により検知されたエラーの種類に基づいて、その後に認識された発話内容に含まれる特徴語に対する重要度を決定してもよい。重要度決定部160による機能の詳細については後述する。
抽出部170は、重要度決定部160により決定された重要度に基づいて、ユーザによって重要であると推測される特徴語を抽出する。例えば、抽出部170は、重要度決定部160により決定された重要度が付与された特徴語のうち、重要度が閾値以上の特徴語を抽出する。また、抽出部170は、重要度の大きい順から所定数の特徴語を抽出してもよい。
オフラインデータ生成部180は、所定周期または所定タイミングで、情報提供装置100と移動通信機器とがオフライン状態の場合に使用されるユーザ固有のオフラインデータをユーザごとに生成する。所定タイミングとは、例えば、移動通信機器からオフラインデータの生成指示があったタイミングである。オフラインデータには、例えば、抽出部170により抽出された特徴語と、特徴語または特徴語を含む意味情報に対応付けられた回答情報(対話情報)とが含まれる。回答情報は、オンライン対話DB216から取得される。また、オフラインデータ生成部180は、回答情報に地図情報218から取得した地図情報(例えば、目的地までの経路情報や目的地周辺のPOI情報)等を含めてもよい。また、オフラインデータ生成部180は、エージェント装置500に提供するオフラインデータを生成する場合に、エージェント装置500が搭載された車両Mの運転モードが自動運転モードである場合と、手動運転モードである場合とで、オフラインデータに含まれる回答情報の内容を異ならせてもよい。
提供部190は、移動通信機器に各種情報を提供する。例えば、提供部190は、オンライン状態において、発話解析部140により解析された発話情報に対応する意味情報に基づいてオンライン対話DB216を参照し、合致する意味情報に対応付けられた回答情報を取得する。また、提供部190は、ユーザと対話を行うための音声を生成してもよい。提供部190は、回答情報を、通信部110から移動通信機器に送信させる。また、提供部190は、発話解析部140により認識エラーや意味理解エラー等のエラー情報を取得した場合に、発話内容が認識できなかったこと、または発話の意図が認識できなかったことを示す情報を通信部110から移動通信機器に送信させてもよい。
また、提供部190は、オフラインデータ生成部180によって生成されたユーザごとのオフラインデータを、ユーザ情報DB210等を参照して、そのユーザが使用する移動通信機器に提供する。また、提供部190は、発話情報を送信した移動通信機器が通信端末300であるか、エージェント装置500であるかによって提供する情報の種類や情報量、提供するタイミング等を異ならせてもよい。また、提供部190は、発話情報や、発話情報の取得または認識時に検知したエラー情報、状況情報、回答情報等を、ユーザIDや時刻情報と対応付けて履歴情報220に記憶させる。また、提供部190は、状況情報に基づいて、ユーザが一人でいるか、集団でいるかを判定し、判定結果に基づいて、個人履歴と、集団履歴とを分けて記憶してもよい。また、提供部190は、所定周期または所定タイミングで履歴情報220を用いて観点リスト212を生成または更新してもよい。
[通信端末]
次に、通信端末300の構成について説明する。図4は、実施形態の通信端末300の構成図である。通信端末300は、例えば、端末側通信部310と、入力部320と、ディスプレイ330と、スピーカ340と、マイク350と、端末状況取得部355と、撮像部360と、アプリ実行部370と、出力制御部380と、端末側記憶部390とを備える。端末状況取得部355と、アプリ実行部370と、出力制御部380とは、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置やカードスロット等に装着されることで通信端末300の記憶装置にインストールされてもよい。
次に、通信端末300の構成について説明する。図4は、実施形態の通信端末300の構成図である。通信端末300は、例えば、端末側通信部310と、入力部320と、ディスプレイ330と、スピーカ340と、マイク350と、端末状況取得部355と、撮像部360と、アプリ実行部370と、出力制御部380と、端末側記憶部390とを備える。端末状況取得部355と、アプリ実行部370と、出力制御部380とは、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置やカードスロット等に装着されることで通信端末300の記憶装置にインストールされてもよい。
端末側記憶部390は、上記の各種記憶装置、或いはEEPROM、ROM、RAM等により実現されてもよい。端末側記憶部390には、例えば、情報提供アプリ392、オフラインデータ394、プログラム、その他各種情報が格納される。オフラインデータ394は、情報提供装置100から提供されるデータであり、ユーザU1固有のオフライン特徴語データやオフライン対話データ等が含まれる。
端末側通信部310は、例えば、ネットワークNWを利用して、情報提供装置100、エージェント装置500、その他の外部装置と通信を行う。また、端末側通信部310は、情報提供装置100と定期的に通信等を行い、その結果やエラー情報等から情報提供装置100と、オンライン状態であるか、またはオフライン状態であるかの情報を取得する。取得結果は、アプリ実行部370に出力される。
入力部320は、例えば、各種キーやボタン等の操作によるユーザU1の入力を受け付ける。ディスプレイ330は、例えば、LCD(Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等である。入力部320は、タッチパネルとしてディスプレイ330と一体に構成されていてもよい。ディスプレイ330は、出力制御部380の制御により、実施形態における各種情報を表示する。スピーカ340は、例えば、出力制御部380の制御により、所定の音声を出力する。マイク350は、例えば、出力制御部380の制御により、ユーザU1の音声の入力を受け付ける。
端末状況取得部355は、内蔵されたGPS(Global Positioning System)装置(不図示)により通信端末300の位置情報を取得する。位置情報とは、例えば、二次元の地図座標でもよく、緯度経度情報でもよい。また、端末状況取得部355は、通信端末300の移動方向や移動速度を取得してもよい。また、端末状況取得部355は、通信端末300の周囲の温度や湿度を取得してもよく、外部装置にアクセスして通信端末300の周囲の天候情報を取得してもよい。また、端末状況取得部355は、撮像部360の撮像画像に基づいて、画像に含まれるユーザU1の表情等からユーザU1の状態を認識したり、同行者の有無や人数や種別を認識してもよい。
撮像部360は、例えば、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の固体撮像素子(イメージセンサ)を利用したデジタルカメラである。撮像部360は、例えば、ユーザU1の操作によって、ユーザU1またはユーザU1に同行する同行者の画像を撮像する。
アプリ実行部370は、端末側記憶部390に記憶された情報提供アプリ392が実行されることで実現される。情報提供アプリ392は、マイク350から取得した発話情報(音声データ)を情報提供装置100に送信し、情報提供装置100から提供された回答情報をディスプレイ330に出力させたり、スピーカ340から出力させるように、出力制御部380を制御するアプリケーションプログラムである。回答情報には、例えば、発話情報等に対する回答結果を示す店舗や施設を示す画像や、各店舗や施設に関する画像や音声、目的地までの経路を示す画像や音声が含まれる。また、情報提供アプリ392は、アプリケーションの開始または終了を示す情報や、情報提供装置100からのエラー情報等を、ディスプレイ330またはスピーカ340から出力させてもよい。
情報提供アプリ392は、例えば、ネットワークNWを介して外部装置からダウンロードしたものが通信端末300にインストールされている。情報提供アプリ392は、情報提供装置100の発話解析部140と同様にASR機能やNLU機能を備えている。また、情報提供アプリ392は、ASR機能やNLU機能に加え、ユーザU1と対話を行う対話管理機能、ネットワークNWを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現されてもよい。これらの機能の一部または全部は、AI技術によって実現されてよい。また、これらの機能を行うための構成の一部は、情報提供装置100に搭載されてもよい。
情報提供アプリ392は、認証時に認証画面等をディスプレイ330に表示させたり、入力部320により入力された情報を、端末側通信部310を介して情報提供装置100に送信したりする。また、情報提供アプリ392は、端末状況取得部355により取得された情報や、撮像部360により撮像された画像、情報提供アプリ392により処理された各種情報等を、ネットワークNWを介して情報提供装置100に出力する。
また、情報提供アプリ392は、所定周期または所定のタイミングで情報提供装置100からオフラインデータ394を取得し、取得したオフラインデータ394を端末側記憶部390に記憶させる。情報提供アプリ392は、通信端末300と情報提供装置100とがオフライン状態である場合、またはユーザU1によりオフラインデータ394を使用する指示を受け付けた場合に、ユーザU1からの発話情報等に対して、オフラインデータ394を参照して、問い合わせや要求等に対応する回答を生成し、生成した回答をディスプレイ330やスピーカ340等から出力させる。なお、情報提供アプリ392は、ユーザU1の指示により、オフライン状態だけでなく、オンライン状態であってもオフラインデータ394を用いて回答情報を取得してもよい。これにより、レスポンスタイムを向上させることができると主に、通信データ量を削減することができる。
出力制御部380は、アプリ実行部370の制御により、ディスプレイ330に表示させる画像の内容や表示態様、スピーカ340に出力させる音声の内容や出力態様を制御する。
[車両]
次に、エージェント装置500が搭載された車両Mの概略構成について説明する。図5は、実施形態のエージェント装置500が搭載された車両Mの概略構成の一例を示す図である。図5に示す車両Mには、エージェント装置500と、マイク610と、表示・操作装置620と、スピーカ630と、ナビゲーション装置640と、MPU(Map Positioning Unit)650と、車両機器660と、車載通信装置670と、乗員認識装置690と、自動運転制御装置700とが搭載される。また、スマートフォン等の汎用通信装置680が車室内に持ち込まれ、通信装置として使用される場合がある。汎用通信装置680は、例えば、通信端末300である。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。
次に、エージェント装置500が搭載された車両Mの概略構成について説明する。図5は、実施形態のエージェント装置500が搭載された車両Mの概略構成の一例を示す図である。図5に示す車両Mには、エージェント装置500と、マイク610と、表示・操作装置620と、スピーカ630と、ナビゲーション装置640と、MPU(Map Positioning Unit)650と、車両機器660と、車載通信装置670と、乗員認識装置690と、自動運転制御装置700とが搭載される。また、スマートフォン等の汎用通信装置680が車室内に持ち込まれ、通信装置として使用される場合がある。汎用通信装置680は、例えば、通信端末300である。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。
先にエージェント装置500以外の構成について説明する。マイク610は、車室内で発せられた音声(発話)を収集する収音部である。表示・操作装置620は、画像を表示すると共に、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置620は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置620は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカ630は、例えば、車室内や車外に音声や警報音等を出力する。表示・操作装置620は、エージェント装置500とナビゲーション装置640とで共用されてもよい。
ナビゲーション装置640は、ナビHMI(Human Machine Interface)と、GPS等の位置測位装置と、地図情報を記憶した記憶装置と、経路探索等を行う制御装置(ナビゲーションコントローラ)とを備える。マイク610、表示・操作装置620、およびスピーカ630のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置640は、位置測位装置によって特定された車両Mの位置に基づいて地図情報を参照し、地図情報から車両Mの位置からユーザによって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能な情報提供装置100やナビゲーションサーバにあってもよい。この場合、ナビゲーション装置640は、情報提供装置100やナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置500は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置500は、ハードウェア上は一体に構成される。
MPU650は、例えば、ナビゲーション装置640から提供された地図上経路を複数のブロックに分割し(例えば、車両進行方向に関して100[m]毎に分割し)、ブロックごとに推奨車線を決定する。例えば、MPU650は、左から何番目の車線を走行するといった決定を行う。また、MPU650は、ナビゲーション装置640の記憶装置に記憶された地図情報よりも高精度な地図情報(高精度地図)を用いて推奨車線を決定してもよい。高精度地図は、例えば、MPU650の記憶装置に記憶されていてもよく、ナビゲーション装置640の記憶装置やエージェント装置500の車両側記憶部560に記憶してもよい。高精度地図は、車線の中央の情報あるいは車線の境界の情報、道路形状、交通規制情報、住所情報(住所・郵便番号)等が含まれてよい。
車両機器660は、例えば、カメラ(撮像部)やレーダ装置、LIDAR(Light Detection and Ranging)、物体認識装置である。カメラは、例えば、CCDやCMOS等の固体撮像素子を利用したデジタルカメラである。カメラは、車両Mの任意の箇所に取り付けられる。レーダ装置は、車両Mの周辺にミリ波等の電波を放射すると共に、物体によって反射された電波(反射波)を検出して少なくとも物体の位置(距離および方位)を検出する。LIDARは、車両Mの周辺に光を照射し、散乱光を測定する。LIDARは、発光から受光までの時間に基づいて、対象までの距離を検出する。物体認識装置は、カメラ、レーダ装置、およびLIDARのうち一部または全部による検出結果に対してセンサフュージョン処理を行って、車両Mの周辺に存在する物体の位置、種類、速度等を認識する。物体認識装置は、認識結果をエージェント装置500や自動運転制御装置700に出力する。
また、車両機器660は、例えば、運転操作子や、走行駆動力出力装置、ブレーキ装置、ステアリング装置等を含む。運転操作子は、例えば、アクセルペダル、ブレーキペダル、シフトレバー、ステアリングホイール、異形ステア、ジョイスティックその他の操作子を含む。運転操作子には、操作量あるいは操作の有無を検出するセンサが取り付けられており、その検出結果は、エージェント装置500や自動運転制御装置700、もしくは、走行駆動力出力装置、ブレーキ装置、およびステアリング装置のうち一部または全部に出力される。走行駆動力出力装置は、車両Mが走行するための走行駆動力(トルク)を駆動輪に出力する。ブレーキ装置は、例えば、ブレーキキャリパーと、ブレーキキャリパーに油圧を伝達するシリンダと、シリンダに油圧を発生させる電動モータと、ブレーキECUとを備える。ブレーキECUは、自動運転制御装置700から入力される情報、或いは運転操作子から入力される情報に従って電動モータを制御し、制動操作に応じたブレーキトルクが各車輪に出力されるようにする。ステアリング装置は、例えば、ステアリングECUと、電動モータとを備える。電動モータは、例えば、ラックアンドピニオン機構に力を作用させて転舵輪の向きを変更する。ステアリングECUは、自動運転制御装置700から入力される情報、或いは運転操作子から入力される情報に従って、電動モータを駆動し、転舵輪の向きを変更させる。
車載通信装置670は、例えば、セルラー網やWi-Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。また、車載通信装置670は、情報提供装置100と定期的に通信等を行い、その結果やエラー情報等から情報提供装置100と、オンライン状態であるか、またはオフライン状態であるかの情報を取得する。取得結果は、エージェント装置500に出力される。
乗員認識装置690は、例えば、着座センサ、車室内カメラ、画像認識装置等を含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサ等を含む。車室内カメラは、車室内に設けられたCCDカメラやCMOSカメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとのユーザの有無、ユーザの顔等を認識して、ユーザの着座位置を認識する。また、乗員認識装置690は、予め登録された顔画像とのマッチング処理を行うことで、画像に含まれる運転席や助手席等に着座する同乗者を特定してもよい。また、乗員認識装置690は、車室内カメラの画像に含まれる乗員の表情等から乗員の状態(例えば、疲れている、眠い等)を認識してもよい。
自動運転制御装置700は、自動運転モードにより車両Mを走行させる。自動運転制御装置700は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより処理を行う。自動運転制御装置700の構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め自動運転制御装置700のHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体に格納されており、記憶媒体(非一過性の記憶媒体)がドライブ装置に装着されることで自動運転制御装置700のHDDやフラッシュメモリにインストールされてもよい。
自動運転制御装置700は、車両機器660の物体認識装置を介して入力された情報に基づいて、車両Mの周辺にある物体の位置、および速度、加速度等の状態を認識する。自動運転制御装置700は、原則的にはMPU650により決定された推奨車線を走行し、更に、車両Mの周辺状況に対応できるように、車両Mが自動的に(運転者の操作に依らずに)将来走行する目標軌道を生成する。目標軌道は、例えば、速度要素を含んでいる。例えば、目標軌道は、車両Mの到達すべき地点(軌道点)を順に並べたものとして表現される。
自動運転制御装置700は、目標軌道を生成するにあたり、自動運転のイベントを設定してよい。自動運転のイベントには、定速走行イベント、低速追従走行イベント、車線変更イベント、分岐イベント、合流イベント、テイクオーバーイベント、自動駐車イベント等がある。自動運転制御装置700は、起動させたイベントに応じた目標軌道を生成する。また、自動運転制御装置700は、生成した目標軌道を、予定の時刻通りに車両Mが通過するように、車両機器660の走行駆動力出力装置、ブレーキ装置、およびステアリング装置を制御する。例えば、自動運転制御装置700は、目標軌道(軌道点)に付随する速度要素に基づいて、走行駆動力出力装置またはブレーキ装置を制御したり、目標軌道の曲がり具合に応じて、ステアリング装置を制御する。
次に、エージェント装置500について説明する。エージェント装置500は、例えば、車両Mの乗員(例えば、ユーザU2等)と対話を行い、オンライン状態にはマイク610により取得した乗員からの音声データを情報提供装置100に送信し、情報提供装置100から得られた回答を、音声出力や画像表示の形で乗員に提示する。エージェント装置500は、例えば、管理部520と、エージェント機能部540と、車両側記憶部560とを備える。管理部520は、例えば、音響処理部522と、表示制御部524と、音声制御部526とを備える。図5に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部540と車載通信装置670の間に管理部520が介在するように、任意に改変することができる。
エージェント装置500の車両側記憶部560以外の各構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
車両側記憶部560は、上記の各種記憶装置、或いはEEPROM、ROM、またはRAM等により実現されてもよい。車両側記憶部560には、例えば、オフラインデータ562、プログラム、その他各種情報が格納される。オフラインデータ562は、情報提供装置100から提供されるデータであり、ユーザU2固有のオフライン特徴語データやオフライン対話データ等が含まれる。
管理部520は、OS(Operating System)やミドルウェア等のプログラムが実行されることで機能する。音響処理部522は、車両Mの乗員(例えば、ユーザU2)から受け付けた各種音声のうち、問い合わせや要求等に関する情報を認識するのに適した状態になるように、入力された音に対して音響処理を行う。
表示制御部524は、エージェント機能部540からの指示に応じて、表示・操作装置620等の出力装置に車両Mの乗員からの発話情報に対応する回答情報の画像を生成する。回答情報の画像とは、例えば、問い合わせや要求等に対する回答結果を示す店舗や施設の一覧リストを示す画像や、各店舗や施設に関する画像、目的地までの走行経路を示す画像等である。
音声制御部526は、エージェント機能部540からの指示に応じて、スピーカ630に含まれるスピーカのうち一部または全部に音声を出力させる。音声には、例えば、エージェント画像が乗員と対話を行うための音声や、表示制御部524により画像を表示・操作装置620に出力された画像に対応する音声、回答結果に基づく音声が含まれる。
エージェント機能部540は、管理部520により取得される各種情報に基づいて、車両Mの乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部540は、情報提供装置100の発話解析部140と同様にASR機能やNLU機能を備えていてもよい。また、エージェント機能部540は、ユーザU2と対話を行う対話管理機能、ネットワークNWを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現されてもよい。これらの機能の一部または全部は、AI技術によって実現されてよい。また、これらの機能を行うための構成の一部は、情報提供装置100に搭載されてもよい。
例えば、エージェント機能部540は、音響処理部522により処理された音声ストリームや、ナビゲーション装置640、乗員認識装置690、および車両機器660等から取得した情報、自動運転制御装置700の制御状態等を、車載通信装置670を介して情報提供装置100に送信したり、情報提供装置100から得られる情報を乗員に提供する。また、エージェント機能部540は、汎用通信装置680と連携し、情報提供装置100と通信する機能を備えていてもよい。この場合、エージェント機能部540は、例えば、Bluetooth(登録商標)によって汎用通信装置680とペアリングを行い、エージェント機能部540と汎用通信装置680とを接続させる。また、エージェント機能部540は、USB(Universal Serial Bus)等を利用した有線通信によって汎用通信装置680に接続されるようにしてもよい。
また、エージェント機能部540は、所定周期または所定タイミングで情報提供装置100からオフラインデータを取得した場合に、オフラインデータ562として車両側記憶部560に記憶させる。また、エージェント機能部540は、車載通信装置670や汎用通信装置680における情報提供装置100との通信状況を取得し、通信状態がオフライン状態である場合にマイク610から取得した音声(発話情報)に基づいて、オフラインデータ562を参照し、発話情報に対応する回答情報を取得し、管理部520を介してユーザU2に提供する。これにより、車両M(エージェント装置500)と情報提供装置100とがオフライン状態である場合にも、オフラインデータ562を用いて、ユーザU2に情報を提供することができる。また、エージェント機能部540は、ユーザU2の指示により、オフライン状態だけでなく、オンライン状態であってもオフラインデータ562を用いて回答情報を取得してもよい。これにより、レスポンスタイムを向上させることができると主に、通信データ量を削減することができる。
[重要度の決定とオフラインデータの生成]
次に、情報提供装置100がオフラインデータを提供する一連の流れのうち、特に特徴語に対する重要度の決定およびオフラインデータの生成について具体的に説明する。図6は、情報提供装置がオフラインデータを提供する一連の流れについて説明するための図である。図6の例では、移動通信機器の一例として、車両Mに搭載されたエージェント装置500を用いるものとする。また、図6の例では、既に観点リスト212、オンライン特徴語DB214、オンライン対話DB216、および地図情報218が記憶部200に記憶されているものとする。
次に、情報提供装置100がオフラインデータを提供する一連の流れのうち、特に特徴語に対する重要度の決定およびオフラインデータの生成について具体的に説明する。図6は、情報提供装置がオフラインデータを提供する一連の流れについて説明するための図である。図6の例では、移動通信機器の一例として、車両Mに搭載されたエージェント装置500を用いるものとする。また、図6の例では、既に観点リスト212、オンライン特徴語DB214、オンライン対話DB216、および地図情報218が記憶部200に記憶されているものとする。
図6の例において、情報提供装置100の取得部130は、エージェント装置500とオンライン状態において、エージェント装置500から発話情報および状況情報を取得する。状況取得部134が取得する状況情報には、例えば、乗員認識装置690により認識された乗員状態や同乗者の状況、車両機器660により検出される運転環境、ナビゲーション装置640により設定された予定情報等の情報が含まれる。同乗者の状況には、例えば、同乗者の有無、人数、種別(家族、友人等)が含まれる。運転環境には、例えば、車両Mの走行距離や走行時間、運転モード、車両Mの周辺の天候、気温、温度等の情報が含まれる。予定情報には、例えば、車両Mの目的地の情報やユーザU2の行動に関する情報(例えば、レストランの予約)が含まれる。
発話解析部140は、エージェント装置500から送信された発話情報を解析する。また、発話解析部140は、エラー検知部150等により検知されたエラー情報に基づいて、言い直し判定を行う。図7は、言い直し判定の内容について説明するための図である。図7の例において、“ABC”は、オンライン特徴語DB214やオンライン対話DB216に登録されている特徴語であるものとし、“AAA”、“ABA”は、オンライン特徴語DB214やオンライン対話DB216に登録されておらず装置側で意味が理解できない特徴語であるものとする。例えば、ユーザが1回目に“AAA”と発話した場合、発話解析部140は、発話解析結果を意味理解エラーとしてユーザU2に出力する。また、ユーザが2回目および3回目に“ABA”と発話した場合にも、発話解析部140はそれぞれ意味理解エラーとして解析結果をユーザに出力する。そして、ユーザが4回目に“ABC”と発話し、発話解析結果として特徴語が抽出された場合、発話解析部140は、その前に発話された“AAA”、“ABA”を言い直した特徴語であると判定する。また、発話解析部140は、意味理解エラーに加えて、認識エラーの場合にも同様の言い直し判定処理を行ってもよい。
提供部190は、発話情報や言い直し判定結果を発話履歴として履歴情報220に記憶させる。また、提供部190は、エラー検知部150により検知されたエラー情報を発話エラー履歴として履歴情報220に記憶させ、状況情報も発話履歴等と対応付けて履歴情報220に記憶させる。また、提供部190は、発話情報に対する回答情報を履歴情報220に記憶させてもよい。
重要度決定部160は、履歴情報220やオンライン特徴語DB214に基づいて、発話情報に含まれる特徴語の重要度を決定する。発話情報に含まれる特徴語には、例えば、発話情報に含まれる抽出語だけでなく、オンライン特徴語DB214によって抽出語から変換された特徴語が含まれてもよい。例えば、重要度決定部160は、所定時間における発話情報に含まれる同一の特徴語の数に基づいて、特徴語の重要度を決定する。例えば、重要度決定部160は、数が多い特徴語ほど、その特徴語の重要度を大きくする。これにより、ユーザが言い易い特徴語や、最近使用している流行に合わせた特徴語の重要度を大きくすることができる。
また、重要度決定部160は、オンライン特徴語DB214に含まれる特徴語のうち、更新日が新しい(現時点より所定日数前)の特徴語の重要度を他の特徴語よりも大きくしてもよい。更新日が新しい特徴語は、最近の流行によって追加された可能性が高く、ユーザU2が使用する可能性も高い。したがって、更新日の新しい特徴語の重要度を大きくすることで、将来においてユーザが使用する特徴語をオフラインデータに含め易くすることができる。
また、重要度決定部160は、状況情報に基づいて、同乗者に子供が含まれる場合に、子供が好きなテーマパーク等の施設や子供が好きなレストランに関する特徴語の重要度を、他の特徴語よりも大きくする。また、重要度決定部160は、状況情報に基づいて、乗員状態(ユーザU2の状態)が疲れている状態であると認識されている場合に、休憩できる施設に関する特徴語の重要度を、他の特徴語よりも大きくしてもよい。また、重要度決定部160は、状況情報に基づいて、予定情報に含まれる目的地付近の店舗や施設に関する特徴語の重要度を、他の特徴語よりも大きくしてもよい。
また、重要度決定部160は、個人履歴と集団履歴とを分けて管理している場合に、車両Mに同乗者がいない場合には個人履歴を用い、同乗者がいる場合には集団履歴を用いて発話情報に含まれる特徴語の重要度を決定してもよい。また、重要度決定部160は、ユーザの位置情報や予定情報、個人での行動傾向、集団での行動傾向等に基づいて、将来においてユーザU2が問い合わせる可能性が高い店舗や施設に関する特徴語の重要度を他の特徴語よりも大きくしてもよい。
また、重要度決定部160は、観点リスト212に基づいて、特徴語の重要度を決定してもよい。この場合、重要度決定部160は、例えば、発話解析部140により解析された特徴語のうち、観点リスト212に含まれる指向情報に関連のある特徴語の重要度を、指向情報に関連のない特徴語よりも大きくする。例えば、観点リスト212に含まれるユーザの指向情報に「イタリアン」が含まれる場合、発話情報に含まれる特徴語のうち、イタリアンに関する特徴語(例えば、イタリアンの店舗情報、店のレビュー情報、メニュー、ビザ、パスタに関連する特徴語)の重要度を、他の特徴語よりも大きくする。また、重要度決定部160は、観点リスト212に含まれる観点情報の特徴語に対して、重要度を決定してもよい。この場合、重要度決定部160は、観点情報に含まれる特徴語のうち、ユーザU2の発話内容に含まれる頻度や回数が多いほど、その特徴語の重要度を大きくする。
また、重要度決定部160は、発話解析部140により解析された言い直し判定結果や発話エラー情報に基づいて、特徴語の重要度を設定してもよい。ユーザが言い直しをしてまで音声認識させようとした発話内容は、ユーザが重要視している内容である可能性が高い。したがって、エラーの後に認識された発話情報に含まれる特徴語の重要度を、エラー検知されていない状況で取得された発話情報に含まれる特徴語よりも大きくすることで、ユーザが重要視している特徴語の重要度を大きくすることができる。
図7の例の場合、重要度決定部160は、言い直しにより4回目で認識された特徴語“ABC”の重要度を、他の特徴語よりも大きくする。また、重要度決定部160は、エラー(意味理解エラーまたは認識エラー)となった語(以下、エラーワードと称する)“AAA”および“ABA”を特徴語“ABC”と対応付けて管理してもよい。また、重要度決定部160は、エラーワードに対して重要度を決定してもよい。
また、重要度決定部160は、エラー検知部150により連続して検出されたエラーの回数に基づいて、エラーが検知された後に、解析された発話情報に含まれる特徴語の重要度を決定してもよい。また、重要度決定部160は、言い回しの回数に基づいて、連続して言い直した後に解析された発話情報に含まれる特徴語の重要度を決定してもよい。例えば、重要度決定部160は、エラー回数(言い直した回数)応じて特徴語およびエラーワードの重要度を段階的に大きくしてもよい。例えば、図7の例において、重要度決定部160は、特徴語“ABC”の前に3回連続でエラーを検知している(または言い直している)ため、特徴語“ABC”に対して3回に応じた重要度を設定する。また、図7の例では、エラーワード“AAA”は1回エラーとなり、エラーワード“ABA”は2回エラーとなっている。そのため、重要度決定部160は、エラーワード“ABA”の重要度を、エラーワード“AAA”よりも大きくする。
また、重要度決定部160は、エラーワードを発話した順番に基づいて重要度を決定してもよい。例えば、最初に発話した内容(例えばエラーワード“AAA”)は、ユーザが言い易い、または、よく使用する発話内容である。そのため、重要度決定部160は、最初の発話内容の重要度を、2回目以降にユーザが使用した内容(例えば、エラーワード“ABA”)よりも大きくする。
また、重要度決定部160は、エラー検知部150により検知されたエラーの種類に応じて特徴語の重要度を設定してもよい。図8は、エラー種別に重要度が対応付けられた対応テーブルの一例を示す図である。対応テーブルは、例えば記憶部200に記憶される。図8の例において、重要度は「A」が最も大きく、次に「B」、「C」の順で小さくなるものとする。図8の例では、音声認識エラーである場合の特徴語の重要度をネットワークエラーである場合よりも大きくし、意味理解エラーである場合の特徴語の重要度を、音声認識エラーである場合よりも大きくしている。また、対応テーブルには、他のエラー種別に対する重要度が設定されていてもよい。図7の例では、特徴語“ABC”は、意味理解エラーの後に認識された特徴語であるため、重要度「A」が設定される。このように、エラーの種類に基づいて、対話型情報提供サービスにおける音声ユーザインターフェースとの関連性が高いエラーに関して重要度を大きくすることで、オフラインデータにおける性能の劣化を抑制することができ、音声ユーザインターフェースのユーザビリティを向上させることができる。
また、重要度決定部160は、ユーザU2に情報を提供したタイミングで、ユーザU2がどのようなフォードバック(選択、放置、拒否)をシステム側に返したか、情報を提供したときのユーザの状況(例えば、会話中、自動運転中、手動運転中、個人行動中、集団行動中)等に基づいて、特徴語の重要度を設定してもよい。
重要度決定部160は、上述した一以上の重要度の決定基準を統合的に組み合わせて重要度を決定してもよい。また、重要度決定部160は、重要度を所定の指標値に変換してもよい。また、重要度決定部160は、重要度付き特徴語リストを生成する。重要度付き特徴語リストには、特徴語ごとに重要度が対応付けられている。特徴語には、エラーワードが含まれていてもよい。また、重要度付き特徴リストは、重要度の大きい順または小さい順にソートされていてもよい。
次に、抽出部170は、例えば、重要度付き特徴語リストから、重要度が閾値以上の特徴語、または重要度が大きい順に所定数の特徴語を抽出する。オフラインデータ生成部180は、抽出部170により抽出された特徴語と、オンライン対話DB216、地図情報218等に基づいて、エージェント装置500で使用される情報であるオフラインデータを生成する。
図9は、オフラインデータの一例を示す図である。図9に示すオフラインデータには、例えばオフライン特徴語データと、オフライン対話データと、オフライン意図理解モデルとが含まれる。オフライン特徴語データは、ユーザU2の発話から自然言語処理によって特徴語を抽出する際に用いられる。オフライン特徴語データには、例えば、発話情報に含まれる抽出語に、特徴語が対応付けられている。オフライン特徴語データには、一以上の抽出語に一つの特徴語が対応付けられている。抽出語には、オフライン対話データの意味情報に含まれる特徴語が含まれてもよい。
オフライン対話データには、例えば、特徴語を含む意味情報に回答情報が対応付けられている。回答情報には、エージェント装置500から出力させる対話用の音声情報や、特徴語に対応する画像(静止画像、動画像)等の情報が含まれる。これらの情報は、オンライン対話DB216から取得される。また、回答情報には、地図情報218から取得した特徴語に関連する地図情報(例えば、経路情報)が含まれていてもよい。オフライン意図理解モデルには、例えば、発話情報に意図情報が対応付けられている。オフラインデータ生成部180は、オフライン特徴語データがオンライン特徴語DB214よりもデータ量が少なく、オフライン対話データがオンライン対話DB216よりもデータ量が少なく、オフライン意図理解モデルが意図理解モデルよりもデータ量が少ないオフラインデータを生成する。オフラインデータのデータ量は、例えば、エージェント装置500の車両側記憶部560の空き容量等に基づいて設定される。また、オフラインデータ生成部180は、例えば、オフライン特徴語データのみを含むオフラインデータを生成してもよく、オフライン対話データのみを含むオフラインデータを生成してもよい。
提供部190は、オフラインデータ生成部180により生成されたオフラインデータをエージェント装置500に提供する。これにより、エージェント装置500のオフラインデータ562が生成または更新される。エージェント装置500は、例えば、情報提供装置100とオフライン状態である場合であってもオフラインデータ562を用いてユーザU2により適切な情報を提供することができる。また、ユーザU2に発話履歴に基づいて辞書データを生成および更新することで、ユーザの使用頻度の多い単語や文章を特徴語として認識することができる。したがって、音声ユーザインターフェースのユーザビリティを向上させることができる。
図10は、オフライン状態における情報提供の一例を示す図である。図10の例では、車両Mを運転しているユーザU2と、オフラインデータ562を保持したエージェント装置500との対話の一例を示している。また、図10の例において、エージェント装置500は、情報提供装置100とオフライン状態であるか、またはユーザU2の指示よりオフラインデータ562を用いて対話するよう指示されているものとする。
図10の例において、ユーザU2がオフライン状態のエージェント装置500に「この近くの“AAA”を探して」と発話したとする。ここで、“AAA”は店舗であるものとする。エージェント装置500は、ユーザU2の発話内容を解析し、取得した発話情報から“AAA”という単語を抽出する。次に、エージェント装置500は、抽出語“AAA”を用いて変換辞書データを参照し、抽出語に対応付けられた特徴語として“ABC”を取得し、「近くの“ABC”を検索する」という意味情報を生成する。そして、エージェント装置500は、意味情報に基づいて、オフライン対話データの意味情報を検索し、合致する意味情報に対応付けられた回答情報を取得する。
そして、エージェント装置500は、図10に示すように、回答情報として「この近くの“ABC”は3件です。」等の音声をスピーカ630から出力したり、車両Mの表示・操作装置620に3件のレストランの情報をリスト表示させたり、3件のそれぞれの店舗を地図上に示した地図情報が表示させたりする。また、ユーザU2は、「評価は?」と発話したとする。エージェント装置500は、発話情報を取得し、選択した店舗に対するレビュー情報をオフライン対話データから取得し、「レビュー情報をお知らせします。」等の音声をスピーカ630から出力すると共に、レビュー情報を車両Mの表示・操作装置620に表示させたり、スピーカ630から音声を出力させたりする。このように、オフラインデータに含まれる変換辞書を更新することで、オフライン状態であっても、ユーザにより適切な情報を提供することができる。
上述ではエージェント装置500を用いた例について説明したが、通信端末300についても上述したユーザ固有のオフラインデータを記憶しておくことで、通信端末300が情報提供装置100とオフライン状態であっても、より適切な情報をユーザに提供することができる。また、エージェント装置500および通信端末300がオフラインデータを用いて発話解析等を行う場合に、エラーが発生した場合には、エージェント装置500および通信端末300において、エラー発生情報を一時的に保存しておき、オンライン復帰時に情報提供装置100に送信してもよい。情報提供装置100のオフラインデータ生成部180は、受信したエラー発生情報に基づいて、例えばエラーの内容がオフラインデータの固有のエラー(例えば、オフラインデータに文言が保持されていなかった等)であった場合には、次のオフラインデータの生成時にその内容を含めたデータ更新を行う。これにより、利用内容に合わせて、より適切なデータの更新を行うことができる。更に、オフラインデータ生成部180は、エラー発生情報に基づいて、オフラインデータだけでなく、オンライン特徴語DB214やオンライン対話DB216、意図理解モデル等についてもデータを更新してもよい。
[処理フロー]
次に、実施形態に係る情報提供システムにより実行される処理の流れについて説明する。以下では、情報提供装置100により実行される処理と、移動通信機器の一例であるエージェント装置500により実行される処理とを分けて説明する。また、以下の処理では、情報提供装置100により実行される処理のうち、エージェント装置500とオンライン状態において、エージェント装置500からの発話内容に対してリアルタイムに回答情報を提供する処理(回答情報提供処理)と、所定周期または所定タイミングでオフラインデータを生成してエージェント装置500に提供する処理(オフライン情報提供処理)とについて説明する。また、エージェント装置500の処理では、主にユーザU2との対話によって、ユーザU2に情報を提供する処理を中心として説明する。また、情報提供装置100は、すでにユーザU2のユーザ認証が完了しているものとする。
次に、実施形態に係る情報提供システムにより実行される処理の流れについて説明する。以下では、情報提供装置100により実行される処理と、移動通信機器の一例であるエージェント装置500により実行される処理とを分けて説明する。また、以下の処理では、情報提供装置100により実行される処理のうち、エージェント装置500とオンライン状態において、エージェント装置500からの発話内容に対してリアルタイムに回答情報を提供する処理(回答情報提供処理)と、所定周期または所定タイミングでオフラインデータを生成してエージェント装置500に提供する処理(オフライン情報提供処理)とについて説明する。また、エージェント装置500の処理では、主にユーザU2との対話によって、ユーザU2に情報を提供する処理を中心として説明する。また、情報提供装置100は、すでにユーザU2のユーザ認証が完了しているものとする。
図11は、情報提供装置100により実行される回答情報提供処理の流れの一例を示すフローチャートである。図11の処理は、情報提供装置100とエージェント装置500とがオンライン状態において、発話情報を取得するごとに繰り返し実行されてよい。図11の例において、発話取得部132は、エージェント装置500から送信されるユーザU2の発話情報を取得する(ステップS100)。次に、状況取得部134は、ユーザU2の状況を示す状況情報を取得する(ステップS102)。次に、発話解析部140は、発話取得部132により取得された発話情報を解析する(ステップS104)。また、エラー検知部150は、発話情報の解析時におけるエラー(ネットワークエラー、意味理解エラー、音声認識エラー)を検知する(ステップS106)。次に、提供部190は、発話情報の解析結果等に基づいて回答情報を生成し(ステップS108)、生成した回答情報を、発話情報を送信したエージェント装置500に提供する(ステップS110)。次に、提供部190は、一連の処理の結果を履歴情報220に蓄積させる(ステップS112)。これにより、本フローチャートの処理は終了する。
図12は、情報提供装置100により実行されるオフラインデータ提供処理の流れの一例を示すフローチャートである。図12の処理は、所定周期または所定タイミングで繰り返し実行されてよい。図12の例において、重要度決定部160は、履歴情報220を取得し(ステップS200)、取得した履歴情報220、観点リスト212、およびオンライン特徴語DB214に基づいて、発話情報に含まれる特徴語ごとの重要度を決定する(ステップS202)。次に、抽出部170は、特徴語ごとの重要度に基づいて、オフラインデータに含める特徴語を抽出する(ステップS204)。ステップS204の処理において、抽出部170は、重要度が閾値以上の特徴語をオフラインデータに含める特徴語として抽出する。また、抽出部170は、重要度が大きい順に所定数の特徴語をオフラインデータに含める特徴語として抽出してもよい。
次に、オフラインデータ生成部180は、抽出された特徴語に基づいて、オフラインデータを生成する(ステップS206)。次に、提供部190は、生成されたオフラインデータをエージェント装置500に提供する(ステップS208)。これにより、本フローチャートの処理は、終了する。
図13は、エージェント装置500により実行される処理の一例を示すフローチャートである。図13の処理では、図12の処理により情報提供装置100から提供されたオフラインデータがエージェント装置500の車両側記憶部560に記憶されているものとする。また、車両Mは、エージェント装置500による機能が実行されているものとする。
図13の例において、エージェント装置500は、ユーザU2からの発話情報を取得する(ステップS300)。また、エージェント装置500は、ユーザU2の状況に関する状況情報を取得する(ステップS302)。次に、エージェント装置500は、情報提供装置100とオンライン状態であるか否かを判定する(ステップS304)。オンライン状態であると判定した場合、エージェント装置500は、発話情報および状況情報を情報提供装置100へ送信し(ステップS306)、情報提供装置100から発話情報に対する回答情報を取得する(ステップS308)。また、ステップS304の処理において、オンライン状態ではない(オフライン状態である)と判定された場合、エージェント装置500は、車両側記憶部560に記憶されたオフラインデータ562を参照し、発話情報に対する回答情報を生成する(ステップS310)。ステップS308およびステップS310の処理後、回答情報を出力する(ステップS312)。これにより、本フローチャートの処理は終了する。
[変形例]
実施形態の情報提供装置100が備える機能のうち少なくとも一部は、移動通信機器側で実行されてよい。また、実施形態において、通信端末300を利用するユーザU1が車両Mを運転する場合、情報提供装置100は、通信端末300またはエージェント装置500のうち、一方または双方に情報提供を行ってもよい。この場合、ユーザU1が選択した一方に情報提供を行ってもよく、通信端末300およびエージェント装置500のそれぞれに記憶されたオフラインデータのうち、最新のオフラインデータが蓄積されている一方を用いて情報提供を行ってもよい。また、情報提供装置100は、ユーザU1が車両Mを運転している場合には、通信端末300を操作できないためエージェント装置500に提供し、車両Mが停止中である場合には通信端末300の操作が可能となるため通信端末300に提供してもよい。
実施形態の情報提供装置100が備える機能のうち少なくとも一部は、移動通信機器側で実行されてよい。また、実施形態において、通信端末300を利用するユーザU1が車両Mを運転する場合、情報提供装置100は、通信端末300またはエージェント装置500のうち、一方または双方に情報提供を行ってもよい。この場合、ユーザU1が選択した一方に情報提供を行ってもよく、通信端末300およびエージェント装置500のそれぞれに記憶されたオフラインデータのうち、最新のオフラインデータが蓄積されている一方を用いて情報提供を行ってもよい。また、情報提供装置100は、ユーザU1が車両Mを運転している場合には、通信端末300を操作できないためエージェント装置500に提供し、車両Mが停止中である場合には通信端末300の操作が可能となるため通信端末300に提供してもよい。
以上説明した実施形態によれば、情報提供装置100において、ユーザの移動通信機器(通信端末300、エージェント装置500)から取得した情報に基づいて移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供する提供部190と、ユーザの発話情報を取得する発話取得部132と、ユーザの状況に関する状況情報を取得する状況取得部134と、発話取得部132により取得される発話情報、状況取得部134により取得される状況情報、およびオンライン状態で自然言語処理に使用される辞書データに基づいて、発話情報に含まれる特徴語の重要度を決定する重要度決定部160と、重要度決定部160により決定された重要度が閾値以上の特徴語を抽出する抽出部170と、抽出部170により抽出された特徴語に基づいて移動通信機器とオフライン状態である場合に、移動通信機器で利用される情報(オフラインデータ)を生成するオフラインデータ生成部(情報生成部)と、を備えることにより、音声ユーザインターフェースのユーザビリティを向上させることができる。
例えば、上述した実施形態によれば、オフライン状態やネットワーク状況が劣化している状況においても、オフラインデータを用いてユーザにより適切な情報を提供することができる。また、本実施形態により提供されるオフラインデータにより、オフライン時における計算リソースや、精度およびレスポンスタイムを向上させることができる。
上記説明した実施形態は、以下のように表現することができる。
プログラムを記憶した記憶装置と、
ハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記記憶装置に記憶されたプログラムを実行することにより、
ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供し、
前記ユーザの発話情報を取得し、
前記ユーザの状況に関する状況情報を取得し、
取得した前記発話情報、前記状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定し、
決定した前記重要度が閾値以上の特徴語を抽出し、
抽出した前記特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する、
ように構成されている、情報提供装置。
プログラムを記憶した記憶装置と、
ハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記記憶装置に記憶されたプログラムを実行することにより、
ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供し、
前記ユーザの発話情報を取得し、
前記ユーザの状況に関する状況情報を取得し、
取得した前記発話情報、前記状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定し、
決定した前記重要度が閾値以上の特徴語を抽出し、
抽出した前記特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する、
ように構成されている、情報提供装置。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…情報提供システム、100…情報提供装置、110…通信部、120…認証部、130…取得部、132…発話取得部、134…状況取得部、140…発話解析部、150…エラー検知部、160…重要度決定部、170…抽出部、180…オフラインデータ生成部、190…提供部、300…通信端末、310…端末側通信部、320…入力部、330…ディスプレイ、340、630…スピーカ、350、610…マイク、355…端末状況取得部、360…撮像部、370…アプリ実行部、380…出力制御部、390…端末側記憶部、500…エージェント装置、520…管理部、540…エージェント機能部、560…車両側記憶部、620…表示・操作装置、640…ナビゲーション装置、650…MPU、660…車両機器、670…車載通信装置、680…汎用通信装置、690…乗員認識装置、700…自動運転制御装置、M…車両
Claims (10)
- ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供する提供部と、
前記ユーザの発話情報を取得する発話取得部と、
前記ユーザの状況に関する状況情報を取得する状況取得部と、
前記発話取得部により取得される発話情報、前記状況取得部により取得される状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定する重要度決定部と、
前記重要度決定部により決定された重要度が閾値以上の特徴語を抽出する抽出部と、
前記抽出部により抽出された特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する情報生成部と、
を備える情報提供装置。 - 前記重要度決定部は、前記ユーザの指向性を示す指向情報に基づいて前記発話情報に含まれる特徴語の重要度を決定する、
請求項1に記載の情報提供装置。 - 前記発話情報の取得または認識に関するエラーを検知するエラー検知部を更に備え、
前記重要度決定部は、前記エラー検知部による検知結果に基づいて前記発話情報に含まれる特徴語の重要度を決定する、
請求項1または2に記載の情報提供装置。 - 前記重要度決定部は、前記エラー検知部により前記エラーが検知された後に、前記発話取得部により取得された発話情報に含まれる特徴語の重要度を、前記エラーが検知されていない状況で取得された発話情報に含まれる特徴語よりも大きくする、
請求項3に記載の情報提供装置。 - 前記重要度決定部は、前記エラー検知部により連続して検出された前記エラーの回数に基づいて、前記エラーが検知された後に、前記発話取得部により取得された発話情報に含まれる特徴語の重要度を決定する、
請求項3または4に記載の情報提供装置。 - 前記エラー検知部は、前記エラーの種類を検知し、
前記抽出部は、前記エラー検知部により検出された前記エラーの種類に応じて、前記エラーが検知された後に、前記発話取得部により取得された発話情報に含まれる特徴語の重要度を決定する、
請求項3から5のうち何れか1項に記載の情報提供装置。 - 前記エラーの種類は、移動通信機器と通信するネットワークに関するエラーであるネットワークエラー、前記発話情報に含まれる発話の意味が理解できないことを示す意味理解エラー、および前記発話情報の音声認識処理に関するエラーを示す音声認識エラーを含み、
前記抽出部は、前記音声認識エラーである場合の前記特徴語の重要度を、前記ネットワークエラーである場合よりも大きくし、前記意味理解エラーである場合の前記特徴語の重要度を、前記音声認識エラーである場合よりも大きくする、
請求項6に記載の情報提供装置。 - 前記重要度決定部は、所定時間における前記発話情報に含まれる同一の特徴語の数に基づいて、前記特徴語の重要度を決定する、
請求項1から7のうち何れか1項に記載の情報提供装置。 - コンピュータが、
ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供し、
前記ユーザの発話情報を取得し、
前記ユーザの状況に関する状況情報を取得し、
取得した前記発話情報、前記状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定し、
決定した前記重要度が閾値以上の特徴語を抽出し、
抽出した前記特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成する、
情報提供方法。 - コンピュータに、
ユーザの移動通信機器から取得した情報に基づいて前記移動通信機器に出力させる情報をオンライン状態で前記移動通信機器に提供させ、
前記ユーザの発話情報を取得させ、
前記ユーザの状況に関する状況情報を取得させ、
取得された前記発話情報、前記状況情報、および前記オンライン状態で自然言語処理に使用される辞書データに基づいて、前記発話情報に含まれる特徴語の重要度を決定させ、
決定された前記重要度が閾値以上の特徴語を抽出させ、
抽出された前記特徴語に基づいて前記移動通信機器とオフライン状態である場合に、前記移動通信機器で利用される情報を生成させる、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218259A JP2022103553A (ja) | 2020-12-28 | 2020-12-28 | 情報提供装置、情報提供方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218259A JP2022103553A (ja) | 2020-12-28 | 2020-12-28 | 情報提供装置、情報提供方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022103553A true JP2022103553A (ja) | 2022-07-08 |
Family
ID=82279303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020218259A Pending JP2022103553A (ja) | 2020-12-28 | 2020-12-28 | 情報提供装置、情報提供方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022103553A (ja) |
-
2020
- 2020-12-28 JP JP2020218259A patent/JP2022103553A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102562227B1 (ko) | 대화 시스템, 그를 가지는 차량 및 차량의 제어 방법 | |
US10222226B2 (en) | Navigation systems and associated methods | |
KR102414456B1 (ko) | 대화 시스템, 이를 포함하는 차량 및 유고 정보 처리 방법 | |
KR20190041569A (ko) | 대화 시스템, 이를 포함하는 차량 및 대화 서비스 처리 방법 | |
KR20180086718A (ko) | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 | |
US10861460B2 (en) | Dialogue system, vehicle having the same and dialogue processing method | |
US11380325B2 (en) | Agent device, system, control method of agent device, and storage medium | |
KR20200000155A (ko) | 대화 시스템 및 이를 이용한 차량 | |
KR102403355B1 (ko) | 차량, 그와 통신하는 모바일 기기 및 차량의 제어 방법 | |
JP2009064186A (ja) | 車両用対話システム | |
JP2023127059A (ja) | 車載装置、情報処理方法及びプログラム | |
CN114758653A (zh) | 对话系统、具有对话系统的车辆以及控制对话系统的方法 | |
KR102487669B1 (ko) | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 | |
US20210190528A1 (en) | Information providing device, information providing method, and storage medium | |
CN111746435B (zh) | 信息提供装置、信息提供方法及存储介质 | |
US20220208187A1 (en) | Information processing device, information processing method, and storage medium | |
US20220207447A1 (en) | Information providing device, information providing method, and storage medium | |
CN110562260A (zh) | 对话系统和对话处理方法 | |
JP2022103553A (ja) | 情報提供装置、情報提供方法、およびプログラム | |
CN113168833B (zh) | 用于运行车辆的交互信息系统的方法以及车辆 | |
KR20190031935A (ko) | 대화 시스템과 이를 포함하는 차량 및 모바일 기기와 대화 처리 방법 | |
US20110258228A1 (en) | Information output system, communication terminal, information output method and computer product | |
JP7449852B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN111754288A (zh) | 服务器装置、信息提供系统、信息提供方法及存储介质 | |
US20220208213A1 (en) | Information processing device, information processing method, and storage medium |