JP2020190756A

JP2020190756A - 管理装置およびプログラム

Info

Publication number: JP2020190756A
Application number: JP2020140766A
Authority: JP
Inventors: 岩瀬　裕之; Hiroyuki Iwase; 裕之岩瀬; 優樹瀬戸; Yuki Seto; 貴裕岩田; Takahiro Iwata; 翔太森口; Shota MORIGUCHI; 石田　哲朗; Tetsuro Ishida; 哲朗石田; 友美子越智; Yumiko Ochi
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2020-08-24
Filing date: 2020-08-24
Publication date: 2020-11-26

Abstract

【課題】案内音声に応じた適正な案内情報を利用者に提供する。【解決手段】管理装置１０は、案内音声を収音した音声信号ＳGに対する音声認識で発話文字列Ｌを解析する音声解析部１１２と、相異なる案内音声に対応する複数の登録文字列のうち音声解析部が解析した発話文字列Ｌに類似する登録文字列を特定する文字列特定部１１４と、配信情報Ｄに対応する案内情報を利用者に提示可能な端末装置に、文字列特定部１１４が特定した登録文字列を示す配信情報Ｄを送信する通信部１３０とを具備する。【選択図】図２

Description

本発明は、端末装置の利用者に情報を提供する技術に関する。

発話音声に対する音声認識の結果に応じて各種の情報を利用者に提供する技術が従来から提案されている。例えば、特許文献１には、利用者の発話音声に対する音声認識を実行して、音声認識の結果として特定された目標地点を中心として地図の表示領域や表示縮尺等を指示する構成が開示されている。

特開平０３―１７５４７８号公報

ところで、例えば電車やバス等の交通機関で放送される案内音声を音声認識し、認識結果の文字列やその翻訳文等の案内情報を乗客の端末装置に提供できれば、案内音声の聴取が困難な難聴者や案内音声の言語を理解できない外国人にとって便利である。しかし、完全な音声認識の実現は実際には困難であり、例えば個々の発話者に特有の発話の特徴（くせ）や収音時の背景雑音等に起因して誤認識が発生する場合がある。以上の事情を考慮して、本発明は、案内音声に応じた適正な案内情報を利用者に提供することを目的とする。

以上の課題を解決するために、本発明に係る管理装置は、本発明の一態様に係る管理装置は、案内音声を収音した音声信号に対する音声認識で発話文字列を解析する音声解析部と、相異なる案内音声に対応する複数の登録文字列のうち前記音声解析部が解析した発話文字列に類似する登録文字列を特定する文字列特定部と、配信情報に対応する案内情報を利用者に提示可能な端末装置に、前記文字列特定部が特定した登録文字列を示す配信情報を送信する通信部とを具備する。

また、以上の課題を解決するために、本発明の他の態様に係る情報提供システムは、案内音声を収音して音声信号を生成する収音部と、案内音声の発音内容を表す発話文字列を音声信号に対する音声認識で解析する音声解析部と、相異なる案内音声の発音内容を表す複数の登録文字列のうち音声解析部が解析した発話文字列に類似する登録文字列を特定する文字列特定部と、相異なる案内音声に対応する複数の案内情報のうち配信情報に対応する案内情報を利用者に提示可能な端末装置に、文字列特定部が特定した登録文字列を示す配信情報を送信する情報送信部とを具備する。以上の構成では、相異なる案内音声の発音内容を表す複数の登録文字列のうち、収音部が収音した案内音声の発話文字列に類似する登録文字列を示す配信情報が端末装置に送信されるから、音声解析部が解析した発話文字列を端末装置に提供する構成と比較して、音声認識の誤認識の影響を含まない適正な案内情報を端末装置の利用者に提示することが可能である。

本発明の好適な態様において、配信情報を含む音響の音響信号を生成する信号処理部を具備し、情報送信部は、収音部が収音した案内音声と信号処理部が生成した音響信号の音響とを放音する放音部を含む。以上の構成では、収音部が収音した案内音声を放音する放音部が、配信情報を含む音響の放音（すなわち空気振動たる音響を伝送媒体とする音響通信）に流用される。したがって、案内音声の放音とは別個に配信情報を端末装置に送信する構成と比較して情報提供システムの構成を簡素化することが可能である。なお、文字列特定部が特定した登録文字列の識別情報を情報送信部が配信情報として端末装置に送信する構成によれば、電磁波や電波を伝送媒体とする無線通信と比較して伝送量が少ない傾向がある音響通信でも配信情報を適正に端末装置に送信することが可能である。

本発明の好適な態様において、端末装置は、複数の案内情報を記憶する記憶部と、当該複数の案内情報のうち情報送信部から送信された配信情報に対応する案内情報を利用者に提示する提示部とを具備する。以上の構成では、端末装置の記憶部に記憶された複数の案内情報のうち情報送信部から送信された配信情報に対応する案内情報が当該端末装置の利用者に提示されるから、案内情報を取得するために端末装置が通信網を介した通信を実行する必要がないという利点がある。

本発明の好適な態様において、文字列特定部は、複数の登録文字列のうち発話文字列に類似する登録文字列を特定するとともに、登録文字列に設定された挿入区間に挿入され得る複数の挿入句のうち、発話文字列内で当該挿入区間に対応する部分に類似する挿入句を特定し、情報送信部は、文字列特定部が特定した登録文字列および挿入句を示す配信情報を端末装置に送信する。以上の構成では、登録文字列に設定された挿入区間に挿入され得る複数の挿入句のうち発話文字列において当該挿入区間に対応する部分に類似する挿入句が特定され、登録文字列と挿入句とを示す配信情報が端末装置に送信される。したがって、定型的な文字列に相異なる挿入句を挿入した複数種の案内音声が発話される状況において、案内音声毎に別個の登録文字列を用意することなく、挿入句を相違させた各案内音声に対応する案内情報を端末装置の利用者に提示することが可能である。

本発明の好適な態様において、文字列特定部は、案内音声による案内対象の状況を表す状況情報を参照して挿入句を選択する。以上の構成では、発話文字列との類似性に加えて案内対象の状況も加味して挿入句が選択されるから、案内対象の実際の状況を加味した正確な案内情報を端末装置の利用者に提示できるという利点がある。

本発明の第１実施形態に係る情報提供システムの概略図である。音声案内システムおよび管理装置の構成図である。案内テーブルの模式図である。端末装置の構成図である。案内情報の表示例である。情報提供システムの動作の説明図である。第２実施形態における登録文字列および挿入句の説明図である。第２実施形態における情報提供システムの構成図である。第２実施形態における案内テーブルの模式図である。第２実施形態における挿入句テーブルの模式図である。第２実施形態における文字列特定部の動作のフローチャートである。第２実施形態における端末装置の構成図である。第３実施形態における情報提供システムの構成図である。変形例における情報提供システムの構成図である。

＜第１実施形態＞
図１は、本発明の第１実施形態に係る情報提供システム１の構成図である。第１実施形態の情報提供システム１は、電車やバス等の交通機関の利用者Ｕに情報を提供するためのコンピュータシステムであり、音声案内システム１００と管理装置１０とを具備する。音声案内システム１００は、電車やバス等の車輌Ｃに設置され、インターネット等を含む通信網２００を介して管理装置１０と通信する。管理装置１０は、例えば通信網２００に接続されたサーバ（例えばウェブサーバ）である。利用者Ｕは、端末装置３０を携帯して車輌Ｃに乗車する。端末装置３０は、例えば携帯電話機やスマートフォン等の可搬型の情報処理装置である。なお、実際には車輌Ｃ内の複数の利用者Ｕが情報提供システム１のサービスを利用し得るが、以下の説明では便宜的に１個の端末装置３０に着目する。

車輌Ｃの運転手や車掌等の案内者ＯPは、交通機関を案内する音声（以下「案内音声」という）Ｖを発音する。例えば「駆け込み乗車にご注意ください」「信号待ちで停車しています」等の車輌Ｃの運行に関する音声が案内音声Ｖとして発音される。第１実施形態では、事前に用意された複数種の文字列（以下「登録文字列」という）の何れかを案内者ＯPが選択的に案内音声Ｖとして発音する場合を想定する。

情報提供システム１は、複数の登録文字列のうち実際に案内者ＯPが発音した案内音声Ｖに対応する登録文字列を指定する情報（以下「配信情報」という）Ｄを端末装置３０に送信する。端末装置３０は、情報提供システム１から取得した配信情報Ｄに対応する案内情報を利用者Ｕに提示する。案内情報は、案内音声Ｖに関連する情報である。第１実施形態では登録文字列を案内情報として例示する。すなわち、事前に用意された複数の登録文字列のうち配信情報Ｄで指定される１種類の登録文字列が案内情報として利用者Ｕに提示される。以上の構成によれば、案内者ＯPが発音した案内音声Ｖの発音内容を表す登録文字列が案内情報として利用者Ｕに提示されるから、例えば案内音声Ｖの聴取が困難な難聴者が案内音声Ｖの内容を把握することが可能である。

＜音声案内システム１００＞
図２は、音声案内システム１００および管理装置１０の構成図である。図２に例示される通り、音声案内システム１００は、配信端末２０と収音部２２と加算部２４と放音部２６とを含んで構成される。収音部２２は、周囲の音響を収音する音響機器（マイクロホン）である。案内者ＯPは、アナウンスブックに事前に収録された複数種の登録文字列の何れかを例えば交通機関の運行状況に応じて選択的に案内音声Ｖとして発音する。すなわち、第１実施形態の案内音声Ｖは、基本的には、案内者ＯPが内容を任意に決定できるものではなく、事前に用意された既知の内容である。第１実施形態の収音部２２は、案内者ＯPが発音した案内音声Ｖを収音して、当該案内音声Ｖの時間波形を表す音声信号ＳGを生成する。なお、収音部２２が生成した音声信号ＳGをアナログからデジタルに変換するＡ/Ｄ変換器の図示は便宜的に省略されている。

収音部２２が生成した音声信号ＳGは、加算部２４を経由して音響信号Ｓ1として放音部２６に供給される。放音部２６は、加算部２４から供給される音響信号Ｓ1に応じた音響を放音する音響機器（スピーカ）である。例えば音声信号ＳGが表す案内音声Ｖが放音部２６から利用者Ｕに放音される。以上の説明から理解される通り、第１実施形態の音声案内システム１００は、収音部２２が収音した案内音声Ｖを放音部２６から放送する既存の車内放送システムに配信端末２０と加算部２４とを接続した音響システムである。ただし、音声案内システム１００の形態は任意であり、例えば配信端末２０の各要素と収音部２２と加算部２４と放音部２６とを単体の装置に搭載することも可能である。

収音部２２が生成した音声信号ＳGは、収音部２２と加算部２４との間の経路から分岐して配信端末２０に供給される。なお、音声信号ＳGを無線により配信端末２０に供給することも可能である。

配信端末２０は、収音部２２から供給される音声信号ＳGの案内音声Ｖに対応した配信情報Ｄを端末装置３０に提供するための機器であり、例えば、携帯電話機やスマートフォン等の可搬型の端末装置で実現される。配信端末２０は、図２に例示される通り、制御部２１０と通信部２２０とを含んで構成される。通信部２２０は、通信網２００を介して管理装置１０と通信する。第１実施形態の通信部２２０は、通信網２００と無線通信する無線通信機器である。

制御部２１０は、配信端末２０の全体的な動作を制御する制御装置（例えばＣＰＵ）である。半導体記録媒体や磁気記録媒体等の公知の記録媒体（図示略）に記憶されたプログラムを制御部２１０が実行することで、案内音声Ｖに対応した配信情報Ｄを取得および配信するための複数の機能（音声取得部２１２，信号処理部２１４）が実現される。

音声取得部２１２は、案内音声Ｖの音声信号ＳGを収音部２２から取得し、通信部２２０から通信網２００を介して管理装置１０に送信する。管理装置１０は、音声案内システム１００から送信された音声信号ＳGを受信し、当該音声信号ＳGの案内音声Ｖに対応する登録文字列を指定する配信情報Ｄを生成する。管理装置１０が生成した配信情報Ｄは、管理装置１０から音声案内システム１００に送信される。通信部２２０は、管理装置１０から送信された配信情報Ｄを通信網２００から受信する。

信号処理部２１４は、通信部２２０が管理装置１０から受信した配信情報Ｄを含む音響の音響信号ＳDを生成する。音響信号ＳDは、配信情報Ｄを所定の周波数帯域の音響成分として含有する。具体的には、音響信号ＳDの周波数帯域は、放音部２６による放音と端末装置３０による収音とが可能な周波数帯域であり、かつ、利用者が通常の環境で聴取する音声（例えば案内音声Ｖ）や楽音等の音響の周波数帯域を上回る周波数帯域（例えば１８ｋＨｚ以上かつ２０ｋＨｚ以下）の範囲内に包含される。信号処理部２１４による音響信号ＳDの生成には公知の技術が任意に採用され得るが、例えば、拡散符号を利用した配信情報Ｄの拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行して音響信号ＳDを生成する構成や、所定の周波数の正弦波等の搬送波を配信情報Ｄで周波数変調することで音響信号ＳDを生成する構成が採用され得る。

音声案内システム１００の加算部２４は、信号処理部２１４が生成した音響信号ＳDと、収音部２２が生成した音声信号ＳGとを加算することで音響信号Ｓ1を生成する。したがって、案内者ＯPが発音した案内音声Ｖとともに配信情報Ｄの音響成分が放音部２６から放音される。以上の説明から理解される通り、第１実施形態の放音部２６は、空気振動としての音響（音波）を伝送媒体とする音響通信で配信情報Ｄを端末装置３０に送信する要素（情報送信部）として機能する。すなわち、収音部２２が収音した案内音声Ｖを放音する放音部２６が配信情報Ｄの送信に流用される。なお、音響信号Ｓ1をデジタルからアナログに変換するＤ/Ａ変換器の図示は便宜的に省略されている。

＜管理装置１０＞
管理装置１０は、端末装置３０に提供される配信情報Ｄを管理する装置であり、図２に例示される通り、制御部１１０と記憶部１２０と通信部１３０とを具備する。管理装置１０は、単体の装置として実現されるほか、相互に別体で構成された複数の装置でも実現され得る。例えば、管理装置１０とは別体で記憶部１２０（クラウドストレージ）を設置し、制御部１１０が例えば通信網２００を介して記憶部１２０に対する読出／書込を実行することも可能である。すなわち、記憶部１２０は管理装置１０から省略され得る。

制御部１１０は、管理装置１０の全体的な動作を制御する制御装置（例えばＣＰＵ）である。通信部１３０は、通信網２００を介して配信端末２０と通信する。例えば通信部１３０は、配信端末２０から送信された音声信号ＳGを受信する。記憶部１２０は、制御部１１０が実行するプログラムや制御部１１０が使用する各種のデータを記憶する。例えば、半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶部１２０として任意に採用される。第１実施形態の記憶部１２０は案内テーブルＴAを記憶する。

図３は、案内テーブルＴAの模式図である。図３に例示される通り、案内テーブルＴAは、相異なる案内音声Ｖの発音内容を表す複数の登録文字列Ｘ（Ｘ1，Ｘ2，……）の各々に配信情報Ｄ（Ｄ1，Ｄ2，……）が対応付けられたデータテーブルである。すなわち、案内者ＯPが案内音声Ｖの発音時に参照するアナウンスブックに収録された複数の登録文字列Ｘ（案内者ＯPによる発音が予定される文字列）が案内テーブルＴAに登録される。配信情報Ｄは、各登録文字列Ｘに一意に付与された識別情報である。

図２の音声解析部１１２は、通信部１３０が配信端末２０から受信した音声信号ＳGに対する音声認識で、案内音声Ｖの発音内容を表す文字列（以下「発話文字列」という）Ｌを解析する。音声信号ＳGの音声認識には、例えばＨＭＭ（Hidden Markov Model）等の音響モデルと言語的な制約を示す言語モデルとを利用した認識技術等の公知の技術が任意に採用され得る。前述の通り、案内者ＯPは事前に用意された登録文字列Ｘを発音するから、理想的には、音声解析部１１２が音声信号ＳGから特定する発話文字列Ｌは、案内テーブルＴAに登録された何れかの登録文字列Ｘと一致する。しかし、実際には、個々の案内者ＯPに特有の発話の特徴（くせ）や車輌Ｃ内の背景雑音等に起因して音声解析部１１２による解析には誤認識が発生し得る。したがって、発話文字列Ｌと登録文字列Ｘとは、相互に類似するけれども必ずしも一致しない場合がある。例えば、案内者ＯPが「駆け込み乗車にご注意ください」という登録文字列Ｘを発音しても、実際に音声解析部１１２が特定する発話文字列Ｌは、登録文字列Ｘに類似するけれども完全には一致しない「かきこみ乗車にご注意くらはい」というような内容になり得る。

文字列特定部１１４は、相異なる案内音声Ｖについて案内テーブルＴAに登録された複数の登録文字列Ｘのうち音声解析部１１２が解析した発話文字列Ｌに類似する登録文字列Ｘを特定する。具体的には、文字列特定部１１４は、案内テーブルＴAの複数の登録文字列Ｘの各々について発話文字列Ｌとの類似度の指標（以下「類似指標」という）を算定し、複数の登録文字列Ｘのうち類似指標が示す類似度が最大となる１個の登録文字列Ｘ（すなわち発話文字列Ｌに最も類似する登録文字列Ｘ）を特定する。類似指標の種類は任意であるが、例えば文字列間の類似性を評価するための編集距離（レーベンシュタイン距離）等の公知の指標が類似指標として任意に採用され得る。文字列特定部１１４による登録文字列Ｘの特定は、音声解析部１１２が解析した発話文字列Ｌを、当該発話文字列Ｌに類似する登録文字列Ｘに補正する処理とも換言され得る。文字列特定部１１４は、以上の手順で特定した登録文字列Ｘの配信情報Ｄを案内テーブルＴAから取得し、当該配信情報Ｄを通信部１３０から音声案内システム１００の配信端末２０に送信する。

以上の説明から理解される通り、音声解析部１１２による誤認識の影響（案内者ＯPに特有の発話の特徴や収音時の背景雑音の影響）を発話文字列Ｌから除去した登録文字列Ｘの配信情報Ｄが管理装置１０から配信端末２０に送信される。前述の通り、音声案内システム１００では、管理装置１０から通信部２２０が受信した配信情報Ｄの音響成分と案内音声Ｖとが放音部２６から放音される。案内者ＯPによる案内音声Ｖの発話の終了後に音声解析部１１２による発話文字列Ｌの解析が完了して登録文字列Ｘの特定や配信端末２０に対する配信情報Ｄの送信が実行されるから、放音部２６からは、案内音声Ｖの放音から遅延して配信情報Ｄの音響成分が放音される。

＜端末装置３０＞
図４は、端末装置３０の構成図である。図４に例示される通り、端末装置３０は、収音部３１０と制御部３２０と記憶部３３０と提示部３４０とを含んで構成される。制御部３２０は、端末装置３０の全体的な動作を制御する制御装置（例えばＣＰＵ）である。記憶部３３０は、制御部３２０が実行するプログラムや制御部３２０が使用する各種のデータを記憶する。第１実施形態では、図４に例示される通り、案内テーブルＴBが記憶部３３０に記憶される。

案内テーブルＴBは、相異なる案内音声Ｖに対応する複数の案内情報Ｇ（Ｇ1，Ｇ2，……）の各々に配信情報Ｄ（Ｄ1，Ｄ2，……）が対応付けられたデータテーブルである。第１実施形態において各案内音声Ｖに対応する１個の案内情報Ｇは、当該案内音声Ｖの発音内容を表す登録文字列Ｘであり、当該登録文字列Ｘの配信情報Ｄが対応付けられる。すなわち、第１実施形態の案内テーブルＴBは、管理装置１０の記憶部１２０に記憶される案内テーブルＴAと同様の内容である。例えば、半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶部３３０として任意に採用される。記憶部３３０に記憶されたプログラムを制御部３２０が実行することで、案内テーブルＴBに登録された案内情報Ｇを利用者Ｕに提示するための複数の機能（情報抽出部３２２および情報管理部３２４）が実現される。

収音部３１０は、周囲の音響を収音する音響機器（マイクロホン）であり、配信端末２０の放音部２６から放音される音響を収音して音響信号Ｓ2を生成する。音響信号Ｓ2は、配信情報Ｄの音響成分（音響信号ＳD）を含有する。なお、収音部３１０が生成した音響信号Ｓ2をアナログからデジタルに変換するＡ/Ｄ変換器の図示は便宜的に省略されている。

情報抽出部３２２は、収音部３１０が生成した音響信号Ｓ2の復調で配信情報Ｄを抽出する。具体的には、情報抽出部３２２は、音響信号Ｓ2のうち配信情報Ｄを含む周波数帯域の帯域成分を例えば帯域通過フィルタで強調し、配信情報Ｄの拡散変調に利用された拡散符号を係数とする整合フィルタを通過させることで配信情報Ｄを抽出する。情報管理部３２４は、案内テーブルＴBの複数の案内情報Ｇのうち、情報抽出部３２２が抽出した配信情報Ｄに対応する案内情報Ｇ（登録文字列Ｘ）を選択する。

提示部３４０は、情報管理部３２４が選択した案内情報Ｇを端末装置３０の利用者Ｕに提示する。第１実施形態の提示部３４０は、案内情報Ｇが示す登録文字列Ｘを表示する表示装置（例えば液晶表示パネル等）である。以上の説明から理解される通り、案内者ＯPが発音した案内音声Ｖの発話内容（発話文字列Ｌ）に対応する登録文字列Ｘが案内情報Ｇとして提示部３４０により利用者Ｕに提示される。例えば、案内音声Ｖを表す音声信号ＳGに対する音声認識で「かきこみ乗車にご注意くらはい」という発話文字列Ｌが特定された場合でも、端末装置３０の提示部３４０には、図５に例示される通り、「駆け込み乗車にご注意ください」という適正な登録文字列Ｘが案内情報Ｇとして表示される。利用者Ｕは、提示部３４０に提示された案内情報Ｇを視認することで、案内者ＯPが発音して放音部２６から放音された案内音声Ｖに関連する案内情報Ｇを視覚的に確認することが可能である。

図６は、情報提供システム１の全体的な動作の説明図である。案内者ＯPが１個の登録文字列Ｘに対応する案内音声Ｖを発音すると、音声案内システム１００の収音部２２は、案内音声Ｖを収音して音声信号ＳGを生成する（ＳA1）。収音部２２が生成した音声信号ＳGは、収音部２２から放音部２６に出力されて放音される一方（ＳA2）、音声取得部２１２によって取得されて通信部２２０から通信網２００に送信される（ＳA3）。

配信端末２０から送信された音声信号ＳGを通信部１３０が通信網２００から受信すると、管理装置１０の音声解析部１１２は、案内音声Ｖの音声信号ＳGに対する音声認識で案内音声Ｖの発音内容を表す発話文字列Ｌを解析する（ＳA4）。文字列特定部１１４は、案内テーブルＴAの複数の登録文字列Ｘから、音声解析部１１２が解析した発話文字列Ｌに類似する登録文字列Ｘを特定する（ＳA5）。すなわち、発話文字列Ｌが、当該音声解析部１１２による誤認識を解消した登録文字列Ｘに補正される。通信部１３０は、文字列特定部１１４が選択した登録文字列Ｘに対応する配信情報Ｄを配信端末２０に送信する（ＳA6）。

管理装置１０から送信された配信情報Ｄを通信部２２０が受信すると、配信端末２０の信号処理部２１４は、配信情報Ｄを音響成分として含有する音響信号ＳDを生成する（ＳA7）。配信端末２０の加算部２４は、収音部２２が生成した音声信号ＳGと信号処理部２１４が生成した音響信号ＳDとを加算することで音響信号Ｓ1を生成する（ＳA8）。放音部２６は、音響信号Ｓ1に応じた音響を放音する（ＳA9）。すなわち、収音部２２が収音した案内音声Ｖと、配信情報Ｄの音響成分が放音部２６から放音される。

端末装置３０の収音部３１０は、放音部２６から放音された音響を収音して音響信号Ｓ2を生成する（ＳA10）。情報抽出部３２２は、収音部３１０が生成した音響信号Ｓ2の復調で配信情報Ｄを抽出する（ＳA11）。情報管理部３２４は、情報抽出部３２２が抽出した配信情報Ｄに対応する案内情報Ｇを案内テーブルＴBから選択する。提示部３４０は、情報管理部３２４が選択した案内情報Ｇが示す登録文字列Ｘを表示させることで利用者Ｕに視覚的に提示する（ＳA12）。

以上に説明した通り、第１実施形態では、相異なる案内音声Ｖの発音内容を表す複数の登録文字列Ｘのうち、案内音声Ｖの音声信号ＳGに対する音声認識で音声解析部１１２が特定した発話文字列Ｌに類似する登録文字列Ｘの配信情報Ｄが端末装置３０に送信される。したがって、音声解析部１１２が解析した発話文字列Ｌを端末装置３０に提供する構成と比較して、音声認識の誤認識の影響を解消した適正な案内情報Ｇを端末装置３０から利用者Ｕに提供することが可能である。

また、以上の構成では、音声案内システム１００の放音部２６は、収音部２２が収音した案内音声Ｖと配信情報Ｄの音響成分とを放音する。すなわち、案内音声Ｖの放音に用いられる放音部２６が、配信情報Ｄを含む音響の放音に流用されて、空気振動たる音響を伝送媒体とした音響通信で端末装置３０に配信情報Ｄを送信する。したがって、案内音声Ｖの放音とは別個に配信情報Ｄを端末装置３０に送信する構成と比較して、情報提供システム１の構成を簡素化することが可能である。

他方、音響通信は、電磁波や電波を伝送媒体とする無線通信と比較して伝送量が少ないという傾向がある。したがって、例えば文字列特定部１１４が特定した登録文字列Ｘ自体を放音部２６から端末装置３０に音響通信で送信することは困難であることが予想される。第１実施形態では、文字列特定部１１４が特定した登録文字列Ｘの識別情報が配信情報Ｄとして放音部２６から端末装置３０に送信されるから、伝送量が少ない音響通信でも配信情報Ｄを適正に端末装置３０に送信することが可能である。

＜第２実施形態＞
本発明の第２実施形態について説明する。以下に例示する各形態において作用や機能が第１実施形態と同様である要素については、第１実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。

案内者ＯPが発音する登録文字列Ｘとしては、複数の案内音声Ｖにわたり共通に利用される定型的な部分（以下「定型句」という）と定型句の特定の部分に挿入される可変の部分（以下「挿入句」という）とで構成されるもの（以下「特定登録文字列」という場合がある）が想定される。例えば、図７に例示される通り、車輌Ｃの行先を利用者Ｕに報知する「この電車は〇〇行きです」という特定登録文字列Ｘを想定する。特定登録文字列Ｘには、挿入区間ＴK（図７で「〇〇」で示される区間）が設定され、相異なる複数の挿入句Ｙの何れかが選択的に挿入区間ＴKに挿入される。挿入句Ｙは、例えば、駅名や路線名等の固有名詞や乗車（降車）ホームの番号等を示す数詞である。図７では、挿入句Ｙとして「渋谷」「恵比寿」「目黒」等の駅名が例示されている。

図８は、第２実施形態に係る音声案内システム１００および管理装置１０の構成図である。図８に例示される通り、管理装置１０の記憶部１２０は、案内テーブルＴA1と挿入句テーブルＴA2とを記憶する。

図９は、第２実施形態の案内テーブルＴA1の模式図である。第２実施形態の案内テーブルＴA1は、第１実施形態と同様に、複数の登録文字列Ｘ（Ｘ1,Ｘ2……）の各々に識別情報ＤX（ＤX1,ＤX2……）が対応付けられたデータテーブルである。ただし、第２実施形態の案内テーブルＴA1には、挿入区間ＴKを含まない登録文字列Ｘのほか、挿入区間ＴKを含む特定登録文字列Ｘが登録され得る。特定登録文字列Ｘの挿入区間ＴKには、例えば挿入区間ＴKであることを表象する所定の記号が付加される。識別情報ＤXは、各登録文字列Ｘに一意に付与された識別情報である。

図１０は、第２実施形態の挿入句テーブルＴA2の模式図である。挿入句テーブルＴA2は、複数の挿入句Ｙ（Ｙ1,Ｙ2…）の各々に識別情報ＤY（ＤY1,ＤY2…）が対応付けられたデータテーブルである。具体的には、特定登録文字列Ｘの挿入区間ＴKに挿入され得る複数の挿入句Ｙが挿入句テーブルＴA2に登録される。識別情報ＤYは、各挿入句Ｙに一意に付与された識別情報である

図８の文字列特定部１１４は、第１実施形態と同様に、案内テーブルＴA1に登録された複数の登録文字列Ｘのうち音声解析部１１２が解析した発話文字列Ｌに類似する登録文字列Ｘを特定する。また、第２実施形態の文字列特定部１１４は、登録文字列Ｘが挿入区間ＴKを含む特定登録文字列Ｘである場合には、挿入句テーブルＴA2に登録された複数の挿入句Ｙのうち発話文字列Ｌの対象部分ＬKに類似する挿入句Ｙを特定する。発話文字列Ｌの対象部分ＬKは、図７に例示される通り、発話文字列Ｌのうち特定登録文字列Ｘの挿入区間ＴKに対応する挿入句の部分である。図１１は、第２実施形態の文字列特定部１１４の動作の説明図である。音声解析部１１２による発話文字列Ｌの特定を契機として図９の処理が開始される。

文字列特定部１１４は、案内テーブルＴA1に登録された複数の登録文字列Ｘのうち発話文字列Ｌに類似する登録文字列Ｘを選択する（ＳB1）。なお、特定登録文字列Ｘの挿入区間ＴKと発話文字列Ｌの対象部分ＬKとは一致しない。しかし、挿入区間ＴK以外の定型句は発話文字列Ｌと登録文字列Ｘとで類似または一致するから、第１実施形態と同様の類似指標を利用した構成でも、案内者ＯPが発音した案内音声Ｖに対応する特定登録文字列Ｘの類似指標が最大となる可能性が高く、結果的に文字列特定部１１４は当該特定登録文字列Ｘを特定し得る。ただし、特定登録文字列Ｘの挿入区間ＴKと発話文字列Ｌの対象部分ＬKとの相違の影響を低減する観点から、特定登録文字列Ｘの挿入区間ＴKと発話文字列Ｌの対象部分ＬKとについて重み（類似指標に反映される度合）を低減したうえで当該特定登録文字列Ｘと発話文字列Ｌとの類似指標を算定する構成が好適である。すなわち、特定登録文字列Ｘと発話文字列Ｌとにおける定型句の類否が優勢に類似指標に反映され、特定登録文字列Ｘの挿入区間ＴKと発話文字列Ｌの対象部分ＬKとの類否の影響が低減される。したがって、特定登録文字列Ｘと任意の挿入句Ｙとの組合せを案内者ＯPが案内音声Ｖとして発音した場合に、当該特定登録文字列Ｘを適正に特定することが可能である。

文字列特定部１１４は、以上の手順で案内テーブルＴA1から特定した登録文字列Ｘが特定登録文字列Ｘであるか否か（挿入区間ＴKの有無）を判定する（ＳB2）。登録文字列Ｘが挿入区間ＴKを含まない場合（ＳB2：NO）、文字列特定部１１４は、第１実施形態と同様に、当該登録文字列Ｘの識別情報ＤXを配信情報Ｄとして通信部１３０から音声案内システム１００に送信する（ＳB3）。配信情報Ｄは、第１実施形態と同様に音声案内システム１００の放音部２６から音響通信により端末装置３０に送信される。

他方、案内テーブルＴA1から特定した登録文字列Ｘが特定登録文字列Ｘである場合（ＳB2：YES）、文字列特定部１１４は、発話文字列Ｌの対象部分ＬKに類似する挿入句Ｙを挿入句テーブルＴA2から特定する（ＳB4）。具体的には、文字列特定部１１４は、発話文字列Ｌのうち特定登録文字列Ｘの挿入区間ＴKに対応する対象部分ＬKを抽出し、挿入句テーブルＴA2に登録された複数の挿入句Ｙの各々について対象部分ＬKとの類似指標を算定する。類似指標の算定方法は第１実施形態と同様である。そして、文字列特定部１１４は、類似指標が示す類似度が最大となる１個の挿入句Ｙ（すなわち発話文字列Ｌの対象部分ＬKにもっとも類似する挿入句Ｙ）を特定する。

文字列特定部１１４は、ステップＳB1で特定した特定登録文字列Ｘの識別情報ＤXとステップＳB4で特定した挿入句Ｙの識別情報ＤYとを含む配信情報Ｄを通信部１３０から音声案内システム１００に送信する（ＳB5）。配信情報Ｄは、第１実施形態と同様に音声案内システム１００の放音部２６から音響通信により端末装置３０に送信される。以上の説明から理解される通り、第２実施形態の放音部２６は、発話文字列Ｌに類似する特定登録文字列Ｘと挿入句Ｙとを示す配信情報Ｄを端末装置３０に送信する。

図１２は、第２実施形態における端末装置３０の構成図である。図１２に例示される通り、第２実施形態の端末装置３０の記憶部３３０には案内テーブルＴB1と挿入句テーブルＴB2とが記憶される。案内テーブルＴB1は、管理装置１０の案内テーブルＴA1と同様に、複数の登録文字列Ｘの各々に識別情報ＤXを対応させたデータテーブルである。挿入句テーブルＴB2は、管理装置１０の挿入句テーブルＴB2と同様に、特定登録文字列Ｘに挿入され得る複数の挿入句Ｙの各々に識別情報ＤYを対応させたデータテーブルである。

情報管理部３２４は、音声案内システム１００が放音した音響から情報抽出部３２２が抽出した配信情報Ｄに対応する案内情報Ｇを生成する。具体的には、特定登録文字列Ｘの識別情報ＤXと挿入句Ｙの識別情報ＤYとを配信情報Ｄが包含する場合、当該特定登録文字列Ｘと当該挿入句Ｙとを組合せた文字列を案内情報Ｇとして提示部３４０に指示する。具体的には、情報管理部３２４は、識別情報ＤXに対応する特定登録文字列Ｘを案内テーブルＴB1から選択するともに、識別情報ＤYに対応する挿入句Ｙを挿入句テーブルＴB2から選択し、挿入句Ｙを特定登録文字列Ｘの挿入区間ＴKに挿入した案内情報Ｇを生成する。他方、配信情報Ｄが挿入句Ｙの識別情報ＤYを含まない場合（すなわち挿入区間ＴKを含まない登録文字列Ｘを文字列特定部１１４が特定した場合）、情報管理部３２４は、配信情報Ｄ（識別情報ＤX）が示す登録文字列Ｘを案内テーブルＴB1から案内情報Ｇとして選択して提示部３４０に指示する。

第２実施形態においても第１実施形態と同様の効果が実現される。また、第２実施形態では、特定登録文字列Ｘの挿入区間ＴKに挿入され得る複数の挿入句Ｙのうち発話文字列Ｌの対象部分ＬKに類似する挿入句Ｙが特定され、特定登録文字列Ｘと挿入句Ｙとを示す配信情報Ｄが端末装置３０に送信される。したがって、定型的な文章に相異なる挿入句を挿入した複数の案内音声Ｖが発話される状況において、案内音声Ｖ毎に別個の登録文字列Ｘを用意することなく、挿入句Ｙを相違させた各案内音声Ｖに対応する案内情報Ｇを端末装置３０の利用者に提示することが可能である。

＜第３実施形態＞
第２実施形態では、挿入句テーブルＴB2に登録された複数の挿入句Ｙのうち発話文字列Ｌの対象部分ＬKに類似する挿入句Ｙを選択した。第３実施形態では、発話文字列Ｌの対象部分ＬKと挿入句Ｙとの類似性に加えて、案内対象である車輌Ｃの状況（例えば運行状況）を加味して挿入句Ｙを選択する。

図１３は、第３実施形態における音声案内システム１００および管理装置１０の構成図である。図１３に例示される通り、第３実施形態の音声案内システム１００の配信端末２０は、第１実施形態と同様の要素（制御部２１０，通信部２２０）に加えて情報取得部２３０を具備する。情報取得部２３０は、車輌Ｃの状況を表す状況情報Ｑを生成する。情報取得部２３０は、例えば車輌Ｃの位置を測位するＧＰＳ（Global Positioning System）等の測位機器を含んで構成され、車輌Ｃの位置を示す位置情報を状況情報Ｑとして生成する。情報取得部２３０が取得した状況情報Ｑは通信部２２０から管理装置１０に送信される。

第３実施形態の文字列特定部１１４は、第２実施形態と同様に、特定登録文字列Ｘについて挿入句Ｙを選択する。ただし、第３実施形態における挿入句Ｙの選択には、発話文字列Ｌとの類似性に加えて、通信部１３０が配信端末２０から受信した状況情報Ｑが加味される。具体的には、文字列特定部１１４は、第１に、挿入句テーブルＴB2に登録された複数の挿入句Ｙのうち発話文字列Ｌの対象部分ＬKに類似する２以上の挿入句（以下「候補挿入句」という）Ｙを特定する。例えば、対象部分ＬKとの類似指標の降順で上位に位置する２以上の挿入句Ｙや類似指標が閾値を上回る２以上の挿入句Ｙが候補挿入句Ｙとして選択される。第２に、文字列特定部１１４は、複数の候補挿入句Ｙのうち状況情報Ｑに応じた１個の挿入句Ｙを選択する。具体的には、文字列特定部１１４は、複数の候補挿入句Ｙのうち状況情報Ｑが示す車輌Ｃの位置に近い停車駅の駅名を示す候補挿入句Ｙを選択する。すなわち、車輌Ｃの現在の状況のもとで案内者ＯPが発話する可能性が高いと推定される挿入句Ｙが複数の候補挿入句Ｙから選択される。状況情報Ｑを利用した複数の候補挿入句Ｙの絞込みが実行されるとも換言され得る。なお、以上の説明では、発話文字列Ｌとの類似指標に応じた候補挿入句Ｙの選択後に状況情報Ｑを利用して挿入句Ｙを確定したが、状況情報Ｑを利用した候補挿入句Ｙの絞込みの実行後に、発話文字列Ｌとの類似指標に応じた挿入句Ｙの選択を実行することも可能である。

第３実施形態においても第１実施形態と同様の効果が実現される。また、第３実施形態では、案内音声Ｖによる案内対象（すなわち車輌Ｃ）の状況を示す状況情報Ｑに応じて挿入句Ｙが選択されるから、案内対象の実際の状況（すなわち運行状況）を加味した正確な案内情報Ｇを端末装置３０の利用者Ｕに提示できるという利点がある。

なお、状況情報Ｑの内容は車輌Ｃの位置に限定されない。例えば、車輌Ｃの直前の停車的の駅名と路線とを状況情報Ｑとして文字列特定部１１４が取得することも可能である。文字列特定部１１４は、複数の候補挿入句Ｙのうち、状況情報Ｑが示す路線のもとで、当該状況情報Ｑが示す直前の停車駅の前後の駅の名称を示す候補挿入句Ｙ（すなわち直前の停車駅から案内者ＯPによる発音の可能性が高いと推定される駅名）を選択する。また、時刻を表す挿入句Ｙが挿入区間ＴKに挿入される登録文字列Ｘ（例えば「現在、○○時××分です」「午後○○時に到着予定です」等の文字列）を想定すると、現在時刻や車輌Ｃの運行予定を表す状況情報Ｑが好適に利用される。

また、文字列特定部１１４による状況情報Ｑの取得先は音声案内システム１００に限定されない。例えば、複数の車輌Ｃの運行を統一的に管理する運行管理システムから文字列特定部１１４が状況情報Ｑを取得する構成や、管理装置１０が各車輌Ｃの運行を管理する構成も採用され得る。

＜変形例＞
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された２個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。

（１）前述の各形態では、登録文字列Ｘを案内情報Ｇとして端末装置３０の利用者Ｕに提示したが、案内情報Ｇの内容は以上の例示に限定されない。例えば、登録文字列Ｘを他言語に翻訳した翻訳文を案内情報Ｇとして端末装置３０の利用者Ｕに提示することも可能である。具体的には、図４の案内テーブルＴBの各案内情報Ｇ（Ｇ1，Ｇ2，……）として登録文字列Ｘの翻訳文が記憶される。以上の構成によれば、案内音声Ｖの再生後に当該案内音声Ｖの翻訳文が利用者Ｕに提示されるから、案内音声Ｖの言語を理解できない外国人にとって特に便利である。また、登録文字列Ｘによる案内に関連する情報（例えば停車が予定される地点の周辺の観光情報等）を案内情報Ｇとして利用者Ｕに提示することも可能である。

また、前述の各形態では、提示部３４０が案内情報Ｇを表示したが、案内情報Ｇを利用者Ｕに提示する方法は以上の例示（表示）に限定されない。例えば、案内情報Ｇの音声を放音するスピーカーやヘッドホンを提示部３４０として利用することも可能である。

（２）案内音声Ｖの発話文字列Ｌが案内テーブルＴAの何れの登録文字列Ｘにも類似しない可能性がある。発話文字列Ｌが何れの登録文字列Ｘにも類似しない場合には、音声解析部１１２が解析した発話文字列Ｌ（または当該発話文字列Ｌの翻訳文）を、通信網２００を介して管理装置１０から端末装置３０に送信することも可能である。なお、発話文字列Ｌが複数の登録文字列Ｘの何れにも類似しない場合には、端末装置３０に対する配信情報Ｄの送信を省略することも可能である。

（３）第１実施形態では、登録文字列Ｘの識別情報を配信情報Ｄとして端末装置３０に送信し、第２実施形態および第３実施形態では、登録文字列Ｘの識別情報ＤXと挿入句Ｙの識別情報ＤYとを配信情報Ｄとして端末装置３０に送信したが、配信情報Ｄの内容は以上の例示に限定されない。例えば、登録文字列Ｘ自体（または特定登録文字列Ｘに挿入句Ｙを挿入した文字列自体）を配信情報Ｄとして端末装置３０に送信することも可能である。

（４）前述の各形態では、発話文字列Ｌに類似する１個の登録文字列Ｘを文字列特定部１１４が特定したが、複数の登録文字列Ｘが発話文字列Ｌに同等に類似する（類似指標が相互に近似する）可能性も想定される。以上の事情を考慮すると、発話文字列Ｌに類似する複数の登録文字列Ｘの何れかを、音声案内システム１００（例えば配信端末２０）に対する案内者ＯPからの指示に応じて選択する構成が好適である。すなわち、案内者ＯPは、発話文字列Ｌに類似する複数の登録文字列Ｘのうち自身が発音した１個の登録文字列Ｘを選択する。以上の説明では登録文字列Ｘに着目したが、挿入句Ｙについても同様に、発話文字列Ｌの対象部分ＬKに類似する複数の挿入句Ｙの何れかを案内者ＯPが選択する構成も採用され得る。

（５）第３実施形態では、状況情報Ｑに応じて複数の候補挿入句Ｙのうち１個の挿入句Ｙを文字列特定部１１４が選択する構成を例示した。登録文字列Ｘについても同様に、複数の登録文字列Ｘのうち１個の登録文字列Ｘを状況情報Ｑに応じて選択する構成としてもよい。例えば、文字列特定部１１４は、第１に、案内テーブルＴB1に登録された複数の登録文字列Ｘのうち発話文字列Ｌに類似する２以上の登録文字列Ｘを候補として特定する。例えば、発話文字列Ｌとの類似指標の降順で上位に位置する２以上の登録文字列Ｘや類似指標が閾値を上回る２以上の登録文字列Ｘが候補として選択される。第２に、文字列特定部１１４は、複数の登録文字列Ｘのうち状況情報Ｑに応じた１個の登録文字列Ｘを選択する。以上の構成によれば、車輌Ｃの現在の状況のもとで案内者ＯPが発話する可能性が高いと推定される登録文字列Ｘが複数の登録文字列Ｘから選択される。例えば、状況情報Ｑからは想定し得ない登録文字列Ｘを適切に除外することが可能である。例えば、車輌Ｃが走行中であると状況情報Ｑから把握される場合に、「駆け込み乗車にご注意ください」という登録文字列Ｘを候補から除外することが可能である。

（６）前述の各形態では、相互に別体の管理装置１０と音声案内システム１００とで情報提供システム１を構成したが、音声案内システム１００の構成は以上の例示に限定されない。例えば、管理装置１０の一部または全部の機能を音声案内システム１００（例えば配信端末２０）に搭載することも可能である。

（７）前述の各形態では、端末装置３０の記憶部３３０に記憶された複数の案内情報Ｇを選択的に利用者Ｕに提示したが、配信情報Ｄに対応する案内情報Ｇを利用者Ｕに提示するための構成は以上の例示に限定されない。例えば、音声案内システム１００から取得した配信情報Ｄを含む配信要求を、複数の案内情報Ｇを保持する配信装置に対して端末装置３０から送信し、配信装置が、複数の案内情報Ｇのうち配信要求で指定された配信情報Ｄに対応する案内情報Ｇを要求元の端末装置３０に送信することも可能である。以上の構成によれば、複数の案内情報Ｇを端末装置３０の記憶部３３０に保持する必要がないという利点がある。他方、前述の各形態の例示のように、端末装置３０の記憶部３３０に記憶された案内情報Ｇを利用者Ｕに提示する構成によれば、端末装置３０と配信装置との間の通信網を介した通信が不要であるという利点がある。

（８）前述の各形態では、音響を伝送媒体とする音響通信で配信情報Ｄを端末装置３０に送信したが、音声案内システム１００から端末装置３０に配信情報Ｄを送信するための通信方式は音響通信に限定されない。例えば、電波や赤外線等の電磁波を伝送媒体とした無線通信で音声案内システム１００から端末装置３０に配信情報Ｄを送信することも可能である。以上の例示から理解される通り、配信情報Ｄの送信には、通信網２００が介在しない近距離無線通信が好適であり、音響を伝送媒体とする音響通信や電磁波を伝送媒体とする無線通信は近距離無線通信の例示である。

（９）前述の各形態では、音声案内システム１００の放音部２６が音響通信で配信情報Ｄを端末装置３０に送信したが、端末装置３０に配信情報Ｄを送信するための構成は以上の例示に限定されない。例えば、管理装置１０の通信部１３０が通信網２００を介して端末装置３０に配信情報Ｄを送信（例えばプッシュ配信）する構成としてもよい。以上の説明から理解される通り、「情報送信部」は、文字列特定部１１４が特定した登録文字列Ｘを示す配信情報Ｄを端末装置３０に送信する要素として包括的に表現され、前述の各形態における放音部２６のほか、通信網２００を介して端末装置３０に配信情報Ｄを送信する通信部１３０も、「情報送信部」の概念に包含される。

（１０）前述の各形態では、案内者ＯPが発音した案内音声Ｖの音声信号ＳGと配信情報Ｄを含む音響信号ＳDとを配信端末２０の外部の加算部２４により加算したが、音声信号ＳGと音響信号ＳDとを配信端末２０にて加算することも可能である。例えば図１４に例示される通り、収音部２２から放音部２６に至る経路が省略される。配信端末２０の信号処理部２１４は、音声取得部２１２が収音部２２から取得した案内音声Ｖの音声信号ＳGに配信情報Ｄの音響信号ＳDを加算し、加算後の音響信号Ｓ1を放音部２６に供給する。図１４の構成では、例えば音声信号ＳGを配信端末２０に保持し、配信情報Ｄの生成後に、当該配信情報Ｄの音響信号ＳDと保持された音声信号ＳGとを加算して放音部２６に供給する（したがって案内音声Ｖは案内者ＯPの発音から遅延して放音部２６から放音される）ことも可能である。

（１１）以上の各態様に係る情報提供システムは、専用の電子回路で実現されるほか、ＣＰＵ（Central Processing Unit）等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性（non-transitory）の記録媒体であり、ＣＤ-ＲＯＭ等の光学式記録媒体（光ディスク）が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。なお、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、以上の各態様に係る情報提供システムの動作方法（情報提供方法）としても本発明は特定される。

１……情報提供システム、１０……管理装置、３０……端末装置、１００……音声案内システム、１１０……制御部、１１２……音声解析部、１１４……文字列特定部、１２０……記憶部、１３０……通信部、２０……配信端末、２２……収音部、２４……加算部、２６……放音部、２１０……制御部、２１２……音声取得部、２１４……信号処理部、２２０……通信部、３１０……収音部、３２０……制御部、３２２……情報抽出部、３２４……情報管理部、３３０……記憶部、３４０……提示部。

Claims

案内音声を収音した音声信号に対する音声認識で発話文字列を解析する音声解析部と、
相異なる案内音声に対応する複数の登録文字列のうち前記音声解析部が解析した発話文字列に類似する登録文字列を特定する文字列特定部と、
配信情報に対応する案内情報を利用者に提示可能な端末装置に、前記文字列特定部が特定した登録文字列を示す配信情報を送信する通信部と
を具備する管理装置。
前記発話文字列が前記複数の登録文字列の何れにも類似しない場合、前記通信部は、前記音声解析部が解析した発話文字列を前記端末装置に送信する
請求項１の管理装置。
前記発話文字列が前記複数の登録文字列の何れにも類似しない場合、前記通信部は、前記配信情報の送信を実行しない
請求項１の管理装置。
案内音声を収音した音声信号に対する音声認識で発話文字列を解析する音声解析部、
相異なる案内音声に対応する複数の登録文字列のうち前記音声解析部が解析した発話文字列に類似する登録文字列を特定する文字列特定部、および、
配信情報に対応する案内情報を利用者に提示可能な端末装置に、前記文字列特定部が特定した登録文字列を示す配信情報を送信する通信部
としてコンピュータを機能させるプログラム。