<第1実施形態>
図1は、本発明の第1実施形態に係る情報提供システム1の構成図である。第1実施形態の情報提供システム1は、電車やバス等の交通機関の利用者Uに情報を提供するためのコンピュータシステムであり、音声案内システム100と管理装置10とを具備する。音声案内システム100は、電車やバス等の車輌Cに設置され、インターネット等を含む通信網200を介して管理装置10と通信する。管理装置10は、例えば通信網200に接続されたサーバ(例えばウェブサーバ)である。利用者Uは、端末装置30を携帯して車輌Cに乗車する。端末装置30は、例えば携帯電話機やスマートフォン等の可搬型の情報処理装置である。なお、実際には車輌C内の複数の利用者Uが情報提供システム1のサービスを利用し得るが、以下の説明では便宜的に1個の端末装置30に着目する。
車輌Cの運転手や車掌等の案内者OPは、交通機関を案内する音声(以下「案内音声」という)Vを発音する。例えば「駆け込み乗車にご注意ください」「信号待ちで停車しています」等の車輌Cの運行に関する音声が案内音声Vとして発音される。第1実施形態では、事前に用意された複数種の文字列(以下「登録文字列」という)の何れかを案内者OPが選択的に案内音声Vとして発音する場合を想定する。
情報提供システム1は、複数の登録文字列のうち実際に案内者OPが発音した案内音声Vに対応する登録文字列を指定する情報(以下「配信情報」という)Dを端末装置30に送信する。端末装置30は、情報提供システム1から取得した配信情報Dに対応する案内情報を利用者Uに提示する。案内情報は、案内音声Vに関連する情報である。第1実施形態では登録文字列を案内情報として例示する。すなわち、事前に用意された複数の登録文字列のうち配信情報Dで指定される1種類の登録文字列が案内情報として利用者Uに提示される。以上の構成によれば、案内者OPが発音した案内音声Vの発音内容を表す登録文字列が案内情報として利用者Uに提示されるから、例えば案内音声Vの聴取が困難な難聴者が案内音声Vの内容を把握することが可能である。
<音声案内システム100>
図2は、音声案内システム100および管理装置10の構成図である。図2に例示される通り、音声案内システム100は、配信端末20と収音部22と加算部24と放音部26とを含んで構成される。収音部22は、周囲の音響を収音する音響機器(マイクロホン)である。案内者OPは、アナウンスブックに事前に収録された複数種の登録文字列の何れかを例えば交通機関の運行状況に応じて選択的に案内音声Vとして発音する。すなわち、第1実施形態の案内音声Vは、基本的には、案内者OPが内容を任意に決定できるものではなく、事前に用意された既知の内容である。第1実施形態の収音部22は、案内者OPが発音した案内音声Vを収音して、当該案内音声Vの時間波形を表す音声信号SGを生成する。なお、収音部22が生成した音声信号SGをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。
収音部22が生成した音声信号SGは、加算部24を経由して音響信号S1として放音部26に供給される。放音部26は、加算部24から供給される音響信号S1に応じた音響を放音する音響機器(スピーカ)である。例えば音声信号SGが表す案内音声Vが放音部26から利用者Uに放音される。以上の説明から理解される通り、第1実施形態の音声案内システム100は、収音部22が収音した案内音声Vを放音部26から放送する既存の車内放送システムに配信端末20と加算部24とを接続した音響システムである。ただし、音声案内システム100の形態は任意であり、例えば配信端末20の各要素と収音部22と加算部24と放音部26とを単体の装置に搭載することも可能である。
収音部22が生成した音声信号SGは、収音部22と加算部24との間の経路から分岐して配信端末20に供給される。なお、音声信号SGを無線により配信端末20に供給することも可能である。
配信端末20は、収音部22から供給される音声信号SGの案内音声Vに対応した配信情報Dを端末装置30に提供するための機器であり、例えば、携帯電話機やスマートフォン等の可搬型の端末装置で実現される。配信端末20は、図2に例示される通り、制御部210と通信部220とを含んで構成される。通信部220は、通信網200を介して管理装置10と通信する。第1実施形態の通信部220は、通信網200と無線通信する無線通信機器である。
制御部210は、配信端末20の全体的な動作を制御する制御装置(例えばCPU)である。半導体記録媒体や磁気記録媒体等の公知の記録媒体(図示略)に記憶されたプログラムを制御部210が実行することで、案内音声Vに対応した配信情報Dを取得および配信するための複数の機能(音声取得部212,信号処理部214)が実現される。
音声取得部212は、案内音声Vの音声信号SGを収音部22から取得し、通信部220から通信網200を介して管理装置10に送信する。管理装置10は、音声案内システム100から送信された音声信号SGを受信し、当該音声信号SGの案内音声Vに対応する登録文字列を指定する配信情報Dを生成する。管理装置10が生成した配信情報Dは、管理装置10から音声案内システム100に送信される。通信部220は、管理装置10から送信された配信情報Dを通信網200から受信する。
信号処理部214は、通信部220が管理装置10から受信した配信情報Dを含む音響の音響信号SDを生成する。音響信号SDは、配信情報Dを所定の周波数帯域の音響成分として含有する。具体的には、音響信号SDの周波数帯域は、放音部26による放音と端末装置30による収音とが可能な周波数帯域であり、かつ、利用者が通常の環境で聴取する音声(例えば案内音声V)や楽音等の音響の周波数帯域を上回る周波数帯域(例えば18kHz以上かつ20kHz以下)の範囲内に包含される。信号処理部214による音響信号SDの生成には公知の技術が任意に採用され得るが、例えば、拡散符号を利用した配信情報Dの拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行して音響信号SDを生成する構成や、所定の周波数の正弦波等の搬送波を配信情報Dで周波数変調することで音響信号SDを生成する構成が採用され得る。
音声案内システム100の加算部24は、信号処理部214が生成した音響信号SDと、収音部22が生成した音声信号SGとを加算することで音響信号S1を生成する。したがって、案内者OPが発音した案内音声Vとともに配信情報Dの音響成分が放音部26から放音される。以上の説明から理解される通り、第1実施形態の放音部26は、空気振動としての音響(音波)を伝送媒体とする音響通信で配信情報Dを端末装置30に送信する要素(情報送信部)として機能する。すなわち、収音部22が収音した案内音声Vを放音する放音部26が配信情報Dの送信に流用される。なお、音響信号S1をデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
<管理装置10>
管理装置10は、端末装置30に提供される配信情報Dを管理する装置であり、図2に例示される通り、制御部110と記憶部120と通信部130とを具備する。管理装置10は、単体の装置として実現されるほか、相互に別体で構成された複数の装置でも実現され得る。例えば、管理装置10とは別体で記憶部120(クラウドストレージ)を設置し、制御部110が例えば通信網200を介して記憶部120に対する読出/書込を実行することも可能である。すなわち、記憶部120は管理装置10から省略され得る。
制御部110は、管理装置10の全体的な動作を制御する制御装置(例えばCPU)である。通信部130は、通信網200を介して配信端末20と通信する。例えば通信部130は、配信端末20から送信された音声信号SGを受信する。記憶部120は、制御部110が実行するプログラムや制御部110が使用する各種のデータを記憶する。例えば、半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶部120として任意に採用される。第1実施形態の記憶部120は案内テーブルTAを記憶する。
図3は、案内テーブルTAの模式図である。図3に例示される通り、案内テーブルTAは、相異なる案内音声Vの発音内容を表す複数の登録文字列X(X1,X2,……)の各々に配信情報D(D1,D2,……)が対応付けられたデータテーブルである。すなわち、案内者OPが案内音声Vの発音時に参照するアナウンスブックに収録された複数の登録文字列X(案内者OPによる発音が予定される文字列)が案内テーブルTAに登録される。配信情報Dは、各登録文字列Xに一意に付与された識別情報である。
図2の音声解析部112は、通信部130が配信端末20から受信した音声信号SGに対する音声認識で、案内音声Vの発音内容を表す文字列(以下「発話文字列」という)Lを解析する。音声信号SGの音声認識には、例えばHMM(Hidden Markov Model)等の音響モデルと言語的な制約を示す言語モデルとを利用した認識技術等の公知の技術が任意に採用され得る。前述の通り、案内者OPは事前に用意された登録文字列Xを発音するから、理想的には、音声解析部112が音声信号SGから特定する発話文字列Lは、案内テーブルTAに登録された何れかの登録文字列Xと一致する。しかし、実際には、個々の案内者OPに特有の発話の特徴(くせ)や車輌C内の背景雑音等に起因して音声解析部112による解析には誤認識が発生し得る。したがって、発話文字列Lと登録文字列Xとは、相互に類似するけれども必ずしも一致しない場合がある。例えば、案内者OPが「駆け込み乗車にご注意ください」という登録文字列Xを発音しても、実際に音声解析部112が特定する発話文字列Lは、登録文字列Xに類似するけれども完全には一致しない「かきこみ乗車にご注意くらはい」というような内容になり得る。
文字列特定部114は、相異なる案内音声Vについて案内テーブルTAに登録された複数の登録文字列Xのうち音声解析部112が解析した発話文字列Lに類似する登録文字列Xを特定する。具体的には、文字列特定部114は、案内テーブルTAの複数の登録文字列Xの各々について発話文字列Lとの類似度の指標(以下「類似指標」という)を算定し、複数の登録文字列Xのうち類似指標が示す類似度が最大となる1個の登録文字列X(すなわち発話文字列Lに最も類似する登録文字列X)を特定する。類似指標の種類は任意であるが、例えば文字列間の類似性を評価するための編集距離(レーベンシュタイン距離)等の公知の指標が類似指標として任意に採用され得る。文字列特定部114による登録文字列Xの特定は、音声解析部112が解析した発話文字列Lを、当該発話文字列Lに類似する登録文字列Xに補正する処理とも換言され得る。文字列特定部114は、以上の手順で特定した登録文字列Xの配信情報Dを案内テーブルTAから取得し、当該配信情報Dを通信部130から音声案内システム100の配信端末20に送信する。
以上の説明から理解される通り、音声解析部112による誤認識の影響(案内者OPに特有の発話の特徴や収音時の背景雑音の影響)を発話文字列Lから除去した登録文字列Xの配信情報Dが管理装置10から配信端末20に送信される。前述の通り、音声案内システム100では、管理装置10から通信部220が受信した配信情報Dの音響成分と案内音声Vとが放音部26から放音される。案内者OPによる案内音声Vの発話の終了後に音声解析部112による発話文字列Lの解析が完了して登録文字列Xの特定や配信端末20に対する配信情報Dの送信が実行されるから、放音部26からは、案内音声Vの放音から遅延して配信情報Dの音響成分が放音される。
<端末装置30>
図4は、端末装置30の構成図である。図4に例示される通り、端末装置30は、収音部310と制御部320と記憶部330と提示部340とを含んで構成される。制御部320は、端末装置30の全体的な動作を制御する制御装置(例えばCPU)である。記憶部330は、制御部320が実行するプログラムや制御部320が使用する各種のデータを記憶する。第1実施形態では、図4に例示される通り、案内テーブルTBが記憶部330に記憶される。
案内テーブルTBは、相異なる案内音声Vに対応する複数の案内情報G(G1,G2,……)の各々に配信情報D(D1,D2,……)が対応付けられたデータテーブルである。第1実施形態において各案内音声Vに対応する1個の案内情報Gは、当該案内音声Vの発音内容を表す登録文字列Xであり、当該登録文字列Xの配信情報Dが対応付けられる。すなわち、第1実施形態の案内テーブルTBは、管理装置10の記憶部120に記憶される案内テーブルTAと同様の内容である。例えば、半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶部330として任意に採用される。記憶部330に記憶されたプログラムを制御部320が実行することで、案内テーブルTBに登録された案内情報Gを利用者Uに提示するための複数の機能(情報抽出部322および情報管理部324)が実現される。
収音部310は、周囲の音響を収音する音響機器(マイクロホン)であり、配信端末20の放音部26から放音される音響を収音して音響信号S2を生成する。音響信号S2は、配信情報Dの音響成分(音響信号SD)を含有する。なお、収音部310が生成した音響信号S2をアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。
情報抽出部322は、収音部310が生成した音響信号S2の復調で配信情報Dを抽出する。具体的には、情報抽出部322は、音響信号S2のうち配信情報Dを含む周波数帯域の帯域成分を例えば帯域通過フィルタで強調し、配信情報Dの拡散変調に利用された拡散符号を係数とする整合フィルタを通過させることで配信情報Dを抽出する。情報管理部324は、案内テーブルTBの複数の案内情報Gのうち、情報抽出部322が抽出した配信情報Dに対応する案内情報G(登録文字列X)を選択する。
提示部340は、情報管理部324が選択した案内情報Gを端末装置30の利用者Uに提示する。第1実施形態の提示部340は、案内情報Gが示す登録文字列Xを表示する表示装置(例えば液晶表示パネル等)である。以上の説明から理解される通り、案内者OPが発音した案内音声Vの発話内容(発話文字列L)に対応する登録文字列Xが案内情報Gとして提示部340により利用者Uに提示される。例えば、案内音声Vを表す音声信号SGに対する音声認識で「かきこみ乗車にご注意くらはい」という発話文字列Lが特定された場合でも、端末装置30の提示部340には、図5に例示される通り、「駆け込み乗車にご注意ください」という適正な登録文字列Xが案内情報Gとして表示される。利用者Uは、提示部340に提示された案内情報Gを視認することで、案内者OPが発音して放音部26から放音された案内音声Vに関連する案内情報Gを視覚的に確認することが可能である。
図6は、情報提供システム1の全体的な動作の説明図である。案内者OPが1個の登録文字列Xに対応する案内音声Vを発音すると、音声案内システム100の収音部22は、案内音声Vを収音して音声信号SGを生成する(SA1)。収音部22が生成した音声信号SGは、収音部22から放音部26に出力されて放音される一方(SA2)、音声取得部212によって取得されて通信部220から通信網200に送信される(SA3)。
配信端末20から送信された音声信号SGを通信部130が通信網200から受信すると、管理装置10の音声解析部112は、案内音声Vの音声信号SGに対する音声認識で案内音声Vの発音内容を表す発話文字列Lを解析する(SA4)。文字列特定部114は、案内テーブルTAの複数の登録文字列Xから、音声解析部112が解析した発話文字列Lに類似する登録文字列Xを特定する(SA5)。すなわち、発話文字列Lが、当該音声解析部112による誤認識を解消した登録文字列Xに補正される。通信部130は、文字列特定部114が選択した登録文字列Xに対応する配信情報Dを配信端末20に送信する(SA6)。
管理装置10から送信された配信情報Dを通信部220が受信すると、配信端末20の信号処理部214は、配信情報Dを音響成分として含有する音響信号SDを生成する(SA7)。配信端末20の加算部24は、収音部22が生成した音声信号SGと信号処理部214が生成した音響信号SDとを加算することで音響信号S1を生成する(SA8)。放音部26は、音響信号S1に応じた音響を放音する(SA9)。すなわち、収音部22が収音した案内音声Vと、配信情報Dの音響成分が放音部26から放音される。
端末装置30の収音部310は、放音部26から放音された音響を収音して音響信号S2を生成する(SA10)。情報抽出部322は、収音部310が生成した音響信号S2の復調で配信情報Dを抽出する(SA11)。情報管理部324は、情報抽出部322が抽出した配信情報Dに対応する案内情報Gを案内テーブルTBから選択する。提示部340は、情報管理部324が選択した案内情報Gが示す登録文字列Xを表示させることで利用者Uに視覚的に提示する(SA12)。
以上に説明した通り、第1実施形態では、相異なる案内音声Vの発音内容を表す複数の登録文字列Xのうち、案内音声Vの音声信号SGに対する音声認識で音声解析部112が特定した発話文字列Lに類似する登録文字列Xの配信情報Dが端末装置30に送信される。したがって、音声解析部112が解析した発話文字列Lを端末装置30に提供する構成と比較して、音声認識の誤認識の影響を解消した適正な案内情報Gを端末装置30から利用者Uに提供することが可能である。
また、以上の構成では、音声案内システム100の放音部26は、収音部22が収音した案内音声Vと配信情報Dの音響成分とを放音する。すなわち、案内音声Vの放音に用いられる放音部26が、配信情報Dを含む音響の放音に流用されて、空気振動たる音響を伝送媒体とした音響通信で端末装置30に配信情報Dを送信する。したがって、案内音声Vの放音とは別個に配信情報Dを端末装置30に送信する構成と比較して、情報提供システム1の構成を簡素化することが可能である。
他方、音響通信は、電磁波や電波を伝送媒体とする無線通信と比較して伝送量が少ないという傾向がある。したがって、例えば文字列特定部114が特定した登録文字列X自体を放音部26から端末装置30に音響通信で送信することは困難であることが予想される。第1実施形態では、文字列特定部114が特定した登録文字列Xの識別情報が配信情報Dとして放音部26から端末装置30に送信されるから、伝送量が少ない音響通信でも配信情報Dを適正に端末装置30に送信することが可能である。
<第2実施形態>
本発明の第2実施形態について説明する。以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
案内者OPが発音する登録文字列Xとしては、複数の案内音声Vにわたり共通に利用される定型的な部分(以下「定型句」という)と定型句の特定の部分に挿入される可変の部分(以下「挿入句」という)とで構成されるもの(以下「特定登録文字列」という場合がある)が想定される。例えば、図7に例示される通り、車輌Cの行先を利用者Uに報知する「この電車は〇〇行きです」という特定登録文字列Xを想定する。特定登録文字列Xには、挿入区間TK(図7で「〇〇」で示される区間)が設定され、相異なる複数の挿入句Yの何れかが選択的に挿入区間TKに挿入される。挿入句Yは、例えば、駅名や路線名等の固有名詞や乗車(降車)ホームの番号等を示す数詞である。図7では、挿入句Yとして「渋谷」「恵比寿」「目黒」等の駅名が例示されている。
図8は、第2実施形態に係る音声案内システム100および管理装置10の構成図である。図8に例示される通り、管理装置10の記憶部120は、案内テーブルTA1と挿入句テーブルTA2とを記憶する。
図9は、第2実施形態の案内テーブルTA1の模式図である。第2実施形態の案内テーブルTA1は、第1実施形態と同様に、複数の登録文字列X(X1,X2……)の各々に識別情報DX(DX1,DX2……)が対応付けられたデータテーブルである。ただし、第2実施形態の案内テーブルTA1には、挿入区間TKを含まない登録文字列Xのほか、挿入区間TKを含む特定登録文字列Xが登録され得る。特定登録文字列Xの挿入区間TKには、例えば挿入区間TKであることを表象する所定の記号が付加される。識別情報DXは、各登録文字列Xに一意に付与された識別情報である。
図10は、第2実施形態の挿入句テーブルTA2の模式図である。挿入句テーブルTA2は、複数の挿入句Y(Y1,Y2…)の各々に識別情報DY(DY1,DY2…)が対応付けられたデータテーブルである。具体的には、特定登録文字列Xの挿入区間TKに挿入され得る複数の挿入句Yが挿入句テーブルTA2に登録される。識別情報DYは、各挿入句Yに一意に付与された識別情報である
図8の文字列特定部114は、第1実施形態と同様に、案内テーブルTA1に登録された複数の登録文字列Xのうち音声解析部112が解析した発話文字列Lに類似する登録文字列Xを特定する。また、第2実施形態の文字列特定部114は、登録文字列Xが挿入区間TKを含む特定登録文字列Xである場合には、挿入句テーブルTA2に登録された複数の挿入句Yのうち発話文字列Lの対象部分LKに類似する挿入句Yを特定する。発話文字列Lの対象部分LKは、図7に例示される通り、発話文字列Lのうち特定登録文字列Xの挿入区間TKに対応する挿入句の部分である。図11は、第2実施形態の文字列特定部114の動作の説明図である。音声解析部112による発話文字列Lの特定を契機として図9の処理が開始される。
文字列特定部114は、案内テーブルTA1に登録された複数の登録文字列Xのうち発話文字列Lに類似する登録文字列Xを選択する(SB1)。なお、特定登録文字列Xの挿入区間TKと発話文字列Lの対象部分LKとは一致しない。しかし、挿入区間TK以外の定型句は発話文字列Lと登録文字列Xとで類似または一致するから、第1実施形態と同様の類似指標を利用した構成でも、案内者OPが発音した案内音声Vに対応する特定登録文字列Xの類似指標が最大となる可能性が高く、結果的に文字列特定部114は当該特定登録文字列Xを特定し得る。ただし、特定登録文字列Xの挿入区間TKと発話文字列Lの対象部分LKとの相違の影響を低減する観点から、特定登録文字列Xの挿入区間TKと発話文字列Lの対象部分LKとについて重み(類似指標に反映される度合)を低減したうえで当該特定登録文字列Xと発話文字列Lとの類似指標を算定する構成が好適である。すなわち、特定登録文字列Xと発話文字列Lとにおける定型句の類否が優勢に類似指標に反映され、特定登録文字列Xの挿入区間TKと発話文字列Lの対象部分LKとの類否の影響が低減される。したがって、特定登録文字列Xと任意の挿入句Yとの組合せを案内者OPが案内音声Vとして発音した場合に、当該特定登録文字列Xを適正に特定することが可能である。
文字列特定部114は、以上の手順で案内テーブルTA1から特定した登録文字列Xが特定登録文字列Xであるか否か(挿入区間TKの有無)を判定する(SB2)。登録文字列Xが挿入区間TKを含まない場合(SB2:NO)、文字列特定部114は、第1実施形態と同様に、当該登録文字列Xの識別情報DXを配信情報Dとして通信部130から音声案内システム100に送信する(SB3)。配信情報Dは、第1実施形態と同様に音声案内システム100の放音部26から音響通信により端末装置30に送信される。
他方、案内テーブルTA1から特定した登録文字列Xが特定登録文字列Xである場合(SB2:YES)、文字列特定部114は、発話文字列Lの対象部分LKに類似する挿入句Yを挿入句テーブルTA2から特定する(SB4)。具体的には、文字列特定部114は、発話文字列Lのうち特定登録文字列Xの挿入区間TKに対応する対象部分LKを抽出し、挿入句テーブルTA2に登録された複数の挿入句Yの各々について対象部分LKとの類似指標を算定する。類似指標の算定方法は第1実施形態と同様である。そして、文字列特定部114は、類似指標が示す類似度が最大となる1個の挿入句Y(すなわち発話文字列Lの対象部分LKにもっとも類似する挿入句Y)を特定する。
文字列特定部114は、ステップSB1で特定した特定登録文字列Xの識別情報DXとステップSB4で特定した挿入句Yの識別情報DYとを含む配信情報Dを通信部130から音声案内システム100に送信する(SB5)。配信情報Dは、第1実施形態と同様に音声案内システム100の放音部26から音響通信により端末装置30に送信される。以上の説明から理解される通り、第2実施形態の放音部26は、発話文字列Lに類似する特定登録文字列Xと挿入句Yとを示す配信情報Dを端末装置30に送信する。
図12は、第2実施形態における端末装置30の構成図である。図12に例示される通り、第2実施形態の端末装置30の記憶部330には案内テーブルTB1と挿入句テーブルTB2とが記憶される。案内テーブルTB1は、管理装置10の案内テーブルTA1と同様に、複数の登録文字列Xの各々に識別情報DXを対応させたデータテーブルである。挿入句テーブルTB2は、管理装置10の挿入句テーブルTB2と同様に、特定登録文字列Xに挿入され得る複数の挿入句Yの各々に識別情報DYを対応させたデータテーブルである。
情報管理部324は、音声案内システム100が放音した音響から情報抽出部322が抽出した配信情報Dに対応する案内情報Gを生成する。具体的には、特定登録文字列Xの識別情報DXと挿入句Yの識別情報DYとを配信情報Dが包含する場合、当該特定登録文字列Xと当該挿入句Yとを組合せた文字列を案内情報Gとして提示部340に指示する。具体的には、情報管理部324は、識別情報DXに対応する特定登録文字列Xを案内テーブルTB1から選択するともに、識別情報DYに対応する挿入句Yを挿入句テーブルTB2から選択し、挿入句Yを特定登録文字列Xの挿入区間TKに挿入した案内情報Gを生成する。他方、配信情報Dが挿入句Yの識別情報DYを含まない場合(すなわち挿入区間TKを含まない登録文字列Xを文字列特定部114が特定した場合)、情報管理部324は、配信情報D(識別情報DX)が示す登録文字列Xを案内テーブルTB1から案内情報Gとして選択して提示部340に指示する。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、特定登録文字列Xの挿入区間TKに挿入され得る複数の挿入句Yのうち発話文字列Lの対象部分LKに類似する挿入句Yが特定され、特定登録文字列Xと挿入句Yとを示す配信情報Dが端末装置30に送信される。したがって、定型的な文章に相異なる挿入句を挿入した複数の案内音声Vが発話される状況において、案内音声V毎に別個の登録文字列Xを用意することなく、挿入句Yを相違させた各案内音声Vに対応する案内情報Gを端末装置30の利用者に提示することが可能である。
<第3実施形態>
第2実施形態では、挿入句テーブルTB2に登録された複数の挿入句Yのうち発話文字列Lの対象部分LKに類似する挿入句Yを選択した。第3実施形態では、発話文字列Lの対象部分LKと挿入句Yとの類似性に加えて、案内対象である車輌Cの状況(例えば運行状況)を加味して挿入句Yを選択する。
図13は、第3実施形態における音声案内システム100および管理装置10の構成図である。図13に例示される通り、第3実施形態の音声案内システム100の配信端末20は、第1実施形態と同様の要素(制御部210,通信部220)に加えて情報取得部230を具備する。情報取得部230は、車輌Cの状況を表す状況情報Qを生成する。情報取得部230は、例えば車輌Cの位置を測位するGPS(Global Positioning System)等の測位機器を含んで構成され、車輌Cの位置を示す位置情報を状況情報Qとして生成する。情報取得部230が取得した状況情報Qは通信部220から管理装置10に送信される。
第3実施形態の文字列特定部114は、第2実施形態と同様に、特定登録文字列Xについて挿入句Yを選択する。ただし、第3実施形態における挿入句Yの選択には、発話文字列Lとの類似性に加えて、通信部130が配信端末20から受信した状況情報Qが加味される。具体的には、文字列特定部114は、第1に、挿入句テーブルTB2に登録された複数の挿入句Yのうち発話文字列Lの対象部分LKに類似する2以上の挿入句(以下「候補挿入句」という)Yを特定する。例えば、対象部分LKとの類似指標の降順で上位に位置する2以上の挿入句Yや類似指標が閾値を上回る2以上の挿入句Yが候補挿入句Yとして選択される。第2に、文字列特定部114は、複数の候補挿入句Yのうち状況情報Qに応じた1個の挿入句Yを選択する。具体的には、文字列特定部114は、複数の候補挿入句Yのうち状況情報Qが示す車輌Cの位置に近い停車駅の駅名を示す候補挿入句Yを選択する。すなわち、車輌Cの現在の状況のもとで案内者OPが発話する可能性が高いと推定される挿入句Yが複数の候補挿入句Yから選択される。状況情報Qを利用した複数の候補挿入句Yの絞込みが実行されるとも換言され得る。なお、以上の説明では、発話文字列Lとの類似指標に応じた候補挿入句Yの選択後に状況情報Qを利用して挿入句Yを確定したが、状況情報Qを利用した候補挿入句Yの絞込みの実行後に、発話文字列Lとの類似指標に応じた挿入句Yの選択を実行することも可能である。
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、案内音声Vによる案内対象(すなわち車輌C)の状況を示す状況情報Qに応じて挿入句Yが選択されるから、案内対象の実際の状況(すなわち運行状況)を加味した正確な案内情報Gを端末装置30の利用者Uに提示できるという利点がある。
なお、状況情報Qの内容は車輌Cの位置に限定されない。例えば、車輌Cの直前の停車的の駅名と路線とを状況情報Qとして文字列特定部114が取得することも可能である。文字列特定部114は、複数の候補挿入句Yのうち、状況情報Qが示す路線のもとで、当該状況情報Qが示す直前の停車駅の前後の駅の名称を示す候補挿入句Y(すなわち直前の停車駅から案内者OPによる発音の可能性が高いと推定される駅名)を選択する。また、時刻を表す挿入句Yが挿入区間TKに挿入される登録文字列X(例えば「現在、○○時××分です」「午後○○時に到着予定です」等の文字列)を想定すると、現在時刻や車輌Cの運行予定を表す状況情報Qが好適に利用される。
また、文字列特定部114による状況情報Qの取得先は音声案内システム100に限定されない。例えば、複数の車輌Cの運行を統一的に管理する運行管理システムから文字列特定部114が状況情報Qを取得する構成や、管理装置10が各車輌Cの運行を管理する構成も採用され得る。
<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
(1)前述の各形態では、登録文字列Xを案内情報Gとして端末装置30の利用者Uに提示したが、案内情報Gの内容は以上の例示に限定されない。例えば、登録文字列Xを他言語に翻訳した翻訳文を案内情報Gとして端末装置30の利用者Uに提示することも可能である。具体的には、図4の案内テーブルTBの各案内情報G(G1,G2,……)として登録文字列Xの翻訳文が記憶される。以上の構成によれば、案内音声Vの再生後に当該案内音声Vの翻訳文が利用者Uに提示されるから、案内音声Vの言語を理解できない外国人にとって特に便利である。また、登録文字列Xによる案内に関連する情報(例えば停車が予定される地点の周辺の観光情報等)を案内情報Gとして利用者Uに提示することも可能である。
また、前述の各形態では、提示部340が案内情報Gを表示したが、案内情報Gを利用者Uに提示する方法は以上の例示(表示)に限定されない。例えば、案内情報Gの音声を放音するスピーカーやヘッドホンを提示部340として利用することも可能である。
(2)案内音声Vの発話文字列Lが案内テーブルTAの何れの登録文字列Xにも類似しない可能性がある。発話文字列Lが何れの登録文字列Xにも類似しない場合には、音声解析部112が解析した発話文字列L(または当該発話文字列Lの翻訳文)を、通信網200を介して管理装置10から端末装置30に送信することも可能である。なお、発話文字列Lが複数の登録文字列Xの何れにも類似しない場合には、端末装置30に対する配信情報Dの送信を省略することも可能である。
(3)第1実施形態では、登録文字列Xの識別情報を配信情報Dとして端末装置30に送信し、第2実施形態および第3実施形態では、登録文字列Xの識別情報DXと挿入句Yの識別情報DYとを配信情報Dとして端末装置30に送信したが、配信情報Dの内容は以上の例示に限定されない。例えば、登録文字列X自体(または特定登録文字列Xに挿入句Yを挿入した文字列自体)を配信情報Dとして端末装置30に送信することも可能である。
(4)前述の各形態では、発話文字列Lに類似する1個の登録文字列Xを文字列特定部114が特定したが、複数の登録文字列Xが発話文字列Lに同等に類似する(類似指標が相互に近似する)可能性も想定される。以上の事情を考慮すると、発話文字列Lに類似する複数の登録文字列Xの何れかを、音声案内システム100(例えば配信端末20)に対する案内者OPからの指示に応じて選択する構成が好適である。すなわち、案内者OPは、発話文字列Lに類似する複数の登録文字列Xのうち自身が発音した1個の登録文字列Xを選択する。以上の説明では登録文字列Xに着目したが、挿入句Yについても同様に、発話文字列Lの対象部分LKに類似する複数の挿入句Yの何れかを案内者OPが選択する構成も採用され得る。
(5)第3実施形態では、状況情報Qに応じて複数の候補挿入句Yのうち1個の挿入句Yを文字列特定部114が選択する構成を例示した。登録文字列Xについても同様に、複数の登録文字列Xのうち1個の登録文字列Xを状況情報Qに応じて選択する構成としてもよい。例えば、文字列特定部114は、第1に、案内テーブルTB1に登録された複数の登録文字列Xのうち発話文字列Lに類似する2以上の登録文字列Xを候補として特定する。例えば、発話文字列Lとの類似指標の降順で上位に位置する2以上の登録文字列Xや類似指標が閾値を上回る2以上の登録文字列Xが候補として選択される。第2に、文字列特定部114は、複数の登録文字列Xのうち状況情報Qに応じた1個の登録文字列Xを選択する。以上の構成によれば、車輌Cの現在の状況のもとで案内者OPが発話する可能性が高いと推定される登録文字列Xが複数の登録文字列Xから選択される。例えば、状況情報Qからは想定し得ない登録文字列Xを適切に除外することが可能である。例えば、車輌Cが走行中であると状況情報Qから把握される場合に、「駆け込み乗車にご注意ください」という登録文字列Xを候補から除外することが可能である。
(6)前述の各形態では、相互に別体の管理装置10と音声案内システム100とで情報提供システム1を構成したが、音声案内システム100の構成は以上の例示に限定されない。例えば、管理装置10の一部または全部の機能を音声案内システム100(例えば配信端末20)に搭載することも可能である。
(7)前述の各形態では、端末装置30の記憶部330に記憶された複数の案内情報Gを選択的に利用者Uに提示したが、配信情報Dに対応する案内情報Gを利用者Uに提示するための構成は以上の例示に限定されない。例えば、音声案内システム100から取得した配信情報Dを含む配信要求を、複数の案内情報Gを保持する配信装置に対して端末装置30から送信し、配信装置が、複数の案内情報Gのうち配信要求で指定された配信情報Dに対応する案内情報Gを要求元の端末装置30に送信することも可能である。以上の構成によれば、複数の案内情報Gを端末装置30の記憶部330に保持する必要がないという利点がある。他方、前述の各形態の例示のように、端末装置30の記憶部330に記憶された案内情報Gを利用者Uに提示する構成によれば、端末装置30と配信装置との間の通信網を介した通信が不要であるという利点がある。
(8)前述の各形態では、音響を伝送媒体とする音響通信で配信情報Dを端末装置30に送信したが、音声案内システム100から端末装置30に配信情報Dを送信するための通信方式は音響通信に限定されない。例えば、電波や赤外線等の電磁波を伝送媒体とした無線通信で音声案内システム100から端末装置30に配信情報Dを送信することも可能である。以上の例示から理解される通り、配信情報Dの送信には、通信網200が介在しない近距離無線通信が好適であり、音響を伝送媒体とする音響通信や電磁波を伝送媒体とする無線通信は近距離無線通信の例示である。
(9)前述の各形態では、音声案内システム100の放音部26が音響通信で配信情報Dを端末装置30に送信したが、端末装置30に配信情報Dを送信するための構成は以上の例示に限定されない。例えば、管理装置10の通信部130が通信網200を介して端末装置30に配信情報Dを送信(例えばプッシュ配信)する構成としてもよい。以上の説明から理解される通り、「情報送信部」は、文字列特定部114が特定した登録文字列Xを示す配信情報Dを端末装置30に送信する要素として包括的に表現され、前述の各形態における放音部26のほか、通信網200を介して端末装置30に配信情報Dを送信する通信部130も、「情報送信部」の概念に包含される。
(10)前述の各形態では、案内者OPが発音した案内音声Vの音声信号SGと配信情報Dを含む音響信号SDとを配信端末20の外部の加算部24により加算したが、音声信号SGと音響信号SDとを配信端末20にて加算することも可能である。例えば図14に例示される通り、収音部22から放音部26に至る経路が省略される。配信端末20の信号処理部214は、音声取得部212が収音部22から取得した案内音声Vの音声信号SGに配信情報Dの音響信号SDを加算し、加算後の音響信号S1を放音部26に供給する。図14の構成では、例えば音声信号SGを配信端末20に保持し、配信情報Dの生成後に、当該配信情報Dの音響信号SDと保持された音声信号SGとを加算して放音部26に供給する(したがって案内音声Vは案内者OPの発音から遅延して放音部26から放音される)ことも可能である。
(11)以上の各態様に係る情報提供システムは、専用の電子回路で実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。なお、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、以上の各態様に係る情報提供システムの動作方法(情報提供方法)としても本発明は特定される。