JP6630139B2

JP6630139B2 - テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム

Info

Publication number: JP6630139B2
Application number: JP2015238205A
Authority: JP
Inventors: 正顯飯野; 真希野崎; 洋祐日高
Original assignee: East Japan Railway Co
Current assignee: East Japan Railway Co
Priority date: 2015-12-07
Filing date: 2015-12-07
Publication date: 2020-01-15
Anticipated expiration: 2035-12-07
Also published as: JP2017107261A

Description

本発明は、テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムに関し、特に、列車の運行状況に関するテキストデータのうち、必要なデータを抽出して表示させるためのテキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムに関する。

駅構内に配置されて列車利用者の対応にあたる駅社員等の鉄道会社の社員（以下において単に「社員」ともいう。）は、各種の事態に対応し、できる限り正確な情報を列車利用者に提供するために、各自の担当する路線等の列車に運行の乱れ等が生じていないか否かを把握して、生じている場合には現時点での状況や経過を正確かつ迅速に把握したいとの要望がある。

この点、従来、事故等の事象が発生すると、事象に関する進捗状況や復旧状況に関する情報が随時、社員である輸送指令員に報告され、輸送指令員の下に集約された情報が適宜無線等を通じた音声放送として社員に伝えられるのが一般的であった。
しかし、輸送指令員の下に集約された情報が音声によって伝えられるのみでは、提供された時点で聞き逃してしまうと社員が当該情報を得られない可能性がある。また、聞き手である社員が内容を聞き間違える等により情報の正確性を欠いてしまうおそれもある。
このため、輸送指令員の下に集約された情報を文字情報として社員向けに配信することが望ましい。

この点、音声データとして提供された情報を文字情報（テキストデータ）に変換して蓄積することも可能となっている。
また、特許文献１には、列車の遅延情報等の交通に関する情報を文字情報として辞書登録することが提案されている。

特許第５７７６１６９号公報

しかしながら、列車の運行状況について随時蓄積される情報は膨大であり、現場の社員としては、各自の担当する路線に関する情報等、必要な情報に絞って効率よく迅速に確認したいという要望がある。
この点、単に文字情報（テキストデータ）を蓄積していくのみでは、所望の情報のみを適切に抽出することができず、効率のよい情報確認ができないという問題がある。

本発明は以上のような事情に鑑みてなされたものであり、列車の運行状況について必要な情報を文字情報として正確かつ迅速に社員に提供することができるテキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムを提供することを目的とするものである。

前記課題を解決するために、本出願の発明であるテキストデータ加工装置は、
列車の運行に関わる音声放送のデータをテキストデータ化した放送テキストデータを取得してこの放送テキストデータを加工するテキストデータ加工装置であって、
前記放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するタグ付け処理部と、
前記文字列と前記タグとの対応関係を規定する辞書データを格納する辞書データベースと、
前記タグ付け処理部により付与された前記タグに基づいて、前記放送テキストデータをグループ分けするグループ化処理部と、
を備えており、
前記辞書データは、
同様の意味を有し言い回しの異なる複数の文字列である類似文字列について１つの確定ワードを対応付けており、
前記類似文字列及び前記確定ワードについて同じタグを対応付けている。
このように構成することで、放送テキストデータに含まれる文字列をその性質に応じて適切に分類し、タグ付けして、このタグにしたがってグループ分けすることができるため、ユーザである社員が各自必要な情報を得ようとしたときに、所望の情報をひとまとまりのものとして抽出することが可能となり、膨大な情報の中から知りたい情報を容易に確認することができる。
また、列車の運行に関する音声放送では、同じ意味の言葉でも様々な異なる言い回しで表現されることがあるが、上記のように構成することで、同じ意味の言葉について各種の表現がされた場合でも適切にタグを対応付けることができる。

また、好ましくは、前記辞書データは、前記確定ワードに優先順位を設けており、
前記タグ付け処理部は、１つの前記放送テキストデータ中に複数の前記確定ワードに対応する前記文字列がある場合には、前記確定ワードの前記優先順位にしたがって前記タグを付与する。
このように構成することで、タグを付ける際に、よりユーザである社員のニーズに合った適切な文字列を選択することができ、ユーザである社員にとって有用な情報を適切に抽出することが可能となる。

また、好ましくは、前記グループ化処理部は、前記タグの全部又は一部と対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けする。
このように構成することで、タグによって適切に放送テキストデータをグループ分けすることができる。

また、好ましくは、前記タグは、列車の路線名を示す文字列に対応付けられる路線名タグ、駅名を示す文字列に対応付けられる駅名タグ、列車の運行に関わる事象を示す文字列に対応付けられる事象タグを含んでおり、
前記グループ化処理部は、放送日、前記路線名タグ、前記駅名タグ、及び前記事象タグと対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けする。
放送日、路線名、駅名、及び事象が共通する場合には、同じ事象に関する経過情報である可能性が高く、上記のように構成することで、適切に必要な情報をひとまとまりのものとして抽出することが可能となる。

また、本出願の他の発明である文字化放送表示システムは、
上記のように構成された前記テキストデータ加工装置と、
前記テキストデータ加工装置によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置と、
を備えるようにする。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報を適切に表示させることができる。

また、好ましくは、前記表示用データ配信装置は、前記テキストデータ加工装置によるグループ分けに応じて前記放送テキストデータをソートした状態の表示用データを生成可能に構成されている。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報をひとまとまりのものとして適切に表示させることができる。

また、本出願の他の発明である文字化放送表示プログラムは、
前述したように前記テキストデータ加工装置により加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信機能をコンピュータに実現させる。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報を適切に表示させることが可能となる。

本発明によれば、列車の運行状況について必要な情報を文字情報として正確かつ迅速に社員に提供することができるという効果を奏する。

本実施形態に係る文字化放送表示システム全体を示す要部ブロック図である。事象辞書データの構成例を示す図である。詳細表示画面の表示画面例を示した図である。経過表示画面の表示画面例を示した図である。タグ付け処理の全体の流れを示すフローチャートである。タグ付け処理の全体の流れを示すフローチャートである。グループ化処理の全体の流れを示すフローチャートである。

図１から図７を参照しつつ、本発明に係るテキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムの一実施形態について説明する。なお、以下に述べる実施形態には、本発明を実施するために技術的に好ましい種々の限定が付されているが、本発明の範囲を以下の実施形態及び図示例に限定するものではない。

図１は、本実施形態に係る文字化放送表示システム１００の全体構成を示す図である。
図１に示すように、文字化放送表示システム１００は、放送テキスト化装置１によってテキストデータ化された放送情報（これを以下「放送テキストデータ」という。）を加工するテキストデータ加工装置２と、テキストデータ加工装置２によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、これを配信する表示用データ配信装置３とを備えている。
文字化放送表示システム１００には、ネットワークＮ等を介して端末装置Ｔが接続されており、表示用データ配信装置３は、生成した表示用データをネットワークＮ等を介して適宜端末装置Ｔに提供するようになっている。
端末装置Ｔは、例えば列車の運行に関わる社員（例えば駅構内に配置されて列車利用者の対応にあたる駅社員等）が使用している携帯可能な端末装置であって、液晶パネルや有機ＥＬディスプレイ等で構成される表示部Ｇを備えており、表示用データ配信装置３から提供される情報に基づいて表示を行う。端末装置Ｔは例えばタブレット型の端末装置でもよいし、携帯電話機等であってもよい。

放送テキスト化装置１は、列車の運行に関わる様々な事象に関する情報が音声で伝えられる音声放送の音声データを文字情報であるテキストデータ化するサーバ装置（コンピュータ）である。
列車の運行に関わる何らかの事象が発生すると、当該事象の発生場所や発生時刻、現時点での状態等の情報が輸送指令室に無線等により報告される。事象の発生が報告されると、輸送指令室では、輸送指令員が、この情報を無線等により社員（例えば駅構内に配置されて列車利用者の対応にあたる駅社員等）に音声放送として音声で伝える。
ここで「事象」とは、事故やトラブルの発生、車両の点検等、列車の見合わせや遅延等を引き起こす原因となる事柄の総称である。
また、「状態」とは、運転見合わせや運転再開、列車の運行遅延等、列車の運行状況である。

放送テキスト化装置１は、音声放送の音声データをテキストデータ（放送テキストデータ）に自動変換する放送テキスト化処理部１１、放送テキストデータを外部装置に配信するテキストデータ配信部１２、放送テキスト化処理部１１において音声データをテキストデータに自動変換する処理を行うための放送文字化プログラム等、コンピュータである放送テキスト化装置１において各機能部が各種処理を行うためのプログラムを格納するプログラム記憶部１３、放送テキスト化処理部１１においてテキストデータ化された放送情報（放送テキストデータ）が記憶されるテキスト化放送データベース（以下、本文中及び図１において「データベース」を「ＤＢ」とする。）１４、及び外部装置等と接続されるＩ／Ｆ１５等の機能部を備えており、これらはバス１６により接続されている。
なお、放送テキスト化処理部１１が音声データをテキストデータに自動変換する手法は特に限定されず、既存の手法を用いることができる。
放送テキスト化装置１によってテキストデータ化された放送情報（放送テキストデータ）は、テキストデータ加工装置２に送信される。

テキストデータ加工装置２は、放送テキスト化装置１によってテキストデータ化された放送テキストデータを取得してこの放送テキストデータを加工するサーバ装置（コンピュータ）である。
テキストデータ加工装置２は、タグ付け処理部２１、グループ化処理部２２、プログラム記憶部２３、辞書ＤＢ２４、加工後テキストＤＢ２５、及び外部装置等と接続されるＩ／Ｆ２７等の機能部を備えており、これらはバス２８により接続されている。
以下各機能部について説明する。

プログラム記憶部２３は、コンピュータであるテキストデータ加工装置２において各機能部が各種処理を行うためのプログラムを格納する。
本実施形態では、タグ付け処理部２１において放送テキストデータから抽出した文字列にタグを付与するタグ付け処理を行うためのタグ付け処理プログラム、グループ化処理部２２において放送テキストデータをグループ分けするグループ化処理を行うためのグループ化処理プログラム等がプログラム記憶部２３に格納されている。
また、加工後テキストＤＢ２５は、タグ付け処理部２１及びグループ化処理部２２によって加工処理が施された加工後のタグ付けされた文字列及び放送テキストデータの本文を記憶するものである。

辞書ＤＢ２４は、文字列とタグとの対応関係を規定する辞書データを格納する。
本実施形態では、図１に示すように、路線名辞書データ４１、駅名辞書データ４２、事象辞書データ４３、状態辞書データ４４、方向辞書データ４５が辞書ＤＢ２４に格納されている。
なお、辞書ＤＢ２４に格納される辞書データはここに例示したものに限定されない。これらのうちの一部のみであってもよいし、これら以外の辞書データを含んでいてもよい。例えば、辞書ＤＢ２４に格納される辞書データは、図１に図示した以外に、放送テキストデータから時刻情報を読み取るための時刻辞書データ、列車番号を読み取るための列車番号辞書データ、振り替え輸送手配に使用するパターン番号を読み取るためのパターン番号辞書データ等を含んでいてもよい。

例えば、路線名辞書データ４１は、音声放送において読み上げられることが想定されるすべての路線の路線名を示す文字列を、当該文字列の分類指標となるタグ（この場合には「路線名タグ」）と対応付けて記憶している。
また、例えば駅名辞書データ４２は、音声放送において読み上げられることが想定されるすべての駅の駅名を示す文字列を、当該文字列の分類指標となるタグ（この場合には「駅名タグ」）と対応付けて記憶している。
事象辞書データ４３は、事故やトラブルの発生等、列車の運転見合わせや遅延等を引き起こす原因として想定される事柄を示す文字列を、当該文字列の分類指標となるタグ（この場合には「事象タグ」）と対応付けて記憶するものである。
状態辞書データ４４は、運転見合わせや運転再開、列車の運行遅延等、上記事象によって引き起こされる列車の運行状況を示す文字列を、当該文字列の分類指標となるタグ（この場合には「状態タグ」）と対応付けて記憶するものである。
また、方向辞書データ４５にいう「方向」とは、例えば列車の上り・下り等の走行方向を意味しており、方向辞書データ４５は、こうした列車の走行方向を示す文字列を、当該文字列の分類指標となるタグ（この場合には「方向タグ」）と対応付けて記憶するものである。

タグ付け処理部２１がタグ付けする文字列は、基本的には放送テキストデータに含まれる文字列と確定ワードである。ただし、放送テキストデータに含まれる文字列は、放送を担当する読み手等によって、同じ意味の言葉でも複数の異なる言い回しで表現されることがある。特に、「事象」や「状態」については、各種の表現が想定される。
このため、辞書データは、同様の意味を有し言い回しの異なる複数の文字列である類似文字列（類似ワード）について１つの確定ワードを対応付けており、これらの類似文字列及び確定ワードについて同じタグを対応付けている。

図２は、事象辞書データ４３の構成例を示すものである。
例えば、車両に何らかの問題が発生した場合、放送テキストデータ上の文言としては「車両不具合」「車両故障」といった言い回しが想定される。
この点、本実施形態の事象辞書データ４３では、図２に示すように、これらの類似ワードに対して、「車両故障（車両点検）」が確定ワードとして対応付けられ、いずれの場合も事象タグが付与される。
また、「自動車」、「踏切」等、それぞれ単独では列車の運行に影響を及ぼす「事象」とは認められない文字列であっても、それらが組み合わされることで何らかの「事象」を意味することがある。
このため、辞書データでは、複数の文字列の組み合わせが所定の組み合わせである場合には、その組み合わせから導かれる「事象」を意味する確定ワードと対応付けており、複数の文字列の組み合わせによる検索にも対応できるようにしている。
なお、ここでは、図２に示す事象辞書データ４３を例として説明したが、複数の類似ワードを１つの確定ワードと対応付ける点や、複数の文字列の組み合わせを１つの確定ワードと組み合わせる点は、状態辞書データ４４等、他の辞書でも同様である。

さらに、辞書データでは、図２に示すように、確定ワードに予め優先順位（図２において「抽出優先順位」）を設けている。
後述するように、タグ付け処理部２１は、１つの放送テキストデータ中に複数の確定ワードに対応する文字列がある場合には、確定ワードの優先順位にしたがってタグを付与するようになっている。
このため、辞書データでは、情報としての重要度の高いものほど確定ワードの優先順位が高くなるように規定されている。

情報としての重要度の高さを決める指標は各種考えられるが、例えば、包括的・一般的な表現よりも具体的で詳細な表現の方が重要度が高いものとする。これは、現場社員への情報提供の観点からは、より細かい情報を主たる情報として扱った方が好ましいためである。
このため、事象辞書データ４３においては、例えば「車両故障（車両点検）」よりも「パンタグラフ支障（車両点検）」や「ブレーキ不具合（車両点検）」の方が優先順位が高いというように、より具体的で細かい情報ほど優先順位が高くなるようになっている。
なお、包括的・一般的な文言についてもタグを付与することができるように包括的・一般的な表現も辞書データに記憶させておくことにより、放送テキストデータに含まれる情報を漏れなく拾って分類することができる。また、音声放送では、何らかの事情がある場合や、ごく稀な事象であって具体的な表現が難しいケース等において、あえて具体的な表現を避けて放送を行うことがあるが、包括的・一般的な文言についてもタグを付与することで、このような放送がされた場合でも放送テキストデータに含まれる情報を適切に分類することができる。
また例えば、事象辞書データ４３においては、列車の運行に乱れを生じた原因として直接的な事象ほど情報としての重要度が高いため、上位とすることが好ましい。
このため、事象の確定ワードの優先順位は、事象としてより直接的で重要度の高いものほど順位が高く、間接的で重要度の低いものほど順位が低くなっている。
また例えば、何らかの事故が発生したり、異音を感知して列車の運転が見合わされた場合には、運行再開までのプロセスとして、「車両点検」が含まれることがある。
この場合には、運転見合わせの原因となった事象が優先され、プロセスの１つである「車両点検」の優先順位が最も低くなるように優先順位が設定されている。
また、例えば「動物との接触」や「支障物との接触」によって「異音感知」された場合のように、ある事象が生じた場合に、その具体的な原因が放送テキストデータ内において判明している場合もある。この場合には、具体的な原因を示す文字列（例えば「動物との接触」や「支障物との接触」）が優先されるように、一般的な事象を示す文字列（例えば「異音感知」）の優先順位は低く設定されている。
なお、ここでは、図２に示す事象辞書データ４３を例として説明したが、文字列や確定ワードに優先順位を付すことは事象辞書データ４３に限定されず、状態辞書データ４４等、他の辞書でも同様である。

タグ付け処理部２１は、放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するものである。
タグとは、文字列の性質や種類を示し分類の際の指標となるものである。
本実施形態では、タグ付け処理部２１は、タグとして「路線名タグ」、「関連路線名タグ」、「状態タグ」、「関連状態タグ」、「事象タグ」、「関連事象タグ」、「駅名タグ」、「関連駅名タグ」、「列車番号タグ」「方向タグ」「パターン番号タグ」、「時刻タグ」をそれぞれ対応する文字列に付与する。
ここで、「路線名タグ」、「事象タグ」、「駅名タグ」とは、一つの放送テキストデータ中、主たる路線名、事象、駅名（すなわち、後述する優先順位の高い路線名等や文中最初に登場する路線名等）に付与されるタグであり、「関連路線名タグ」、「関連事象タグ」、「関連駅名タグ」とは、一つの放送テキストデータ中に複数の路線名、事象、駅名が含まれている場合に、主たる路線名、事象、駅名以外のものに付与されるタグである。
なお、タグとしてどのような項目を用意するかはここに例示したものに限定されない。さらに多くの項目をタグとして拾ってもよいし、タグを付与する要素をこの例よりも少なくしてもよい。

ここで、辞書データを用いたタグ付けの仕方について具体的に説明する。
辞書データを用いてタグ付けを行う場合、タグ付け処理部２１は、まず１つ目の辞書データ（例えば、路線名辞書データ４１）を参照しつつ、放送テキストデータ中に路線名辞書データ４１に登録されている文字列があるか否かを文頭から順次検索する。
そして、路線名辞書データ４１に登録されている文字列があった場合には、これに路線名タグを付与する。
放送テキストデータの末尾まで検索が完了したら、同様に、次の辞書データ（例えば、駅名辞書データ４２）を参照しつつ、放送テキストデータ中に駅名辞書データ４２に登録されている文字列があるか否かを文頭から順次検索する。
そして、駅名辞書データ４２に登録されている文字列があった場合には、これに駅名タグを付与する。
タグ付け処理部２１は、同様に、順次すべての辞書データについて、検索を行い、適宜タグ付け処理を行う。

タグ付け処理を行うための検索を行った結果、１つの放送テキストデータ中に１つのタグに対応する文字列が複数存在する場合には、タグ付け処理部２１は、前述のように、辞書データ中に規定されている優先順位にしたがってタグ付け処理を行う。そして最も優先順位の高いものに主たる路線名、事象、駅名に付与される「路線名タグ」、「事象タグ」、「駅名タグ」を付与し、それ以外のものには従たる路線名、事象、駅名に付与される「関連路線名タグ」、「関連事象タグ」、「関連駅名タグ」を付与する。

すなわち、例えば事象辞書データ４３等においては、より具体的で細かい情報ほど優先順位が高くなるように設定されている。
また、例えば事象辞書データ４３においては、列車の運行に乱れを生じた原因として直接的で重要度の高いものほど優先順位が高く、間接的で重要度の低いものほど優先順位が低くなっている。
また、例えば事象辞書データ４３においては、列車の運行状態に乱れを生じた原因である事象と、この原因解消のためのプロセスを構成する事象とでは、「異音感知」等の原因となった事象が優先され、プロセスの１つである「車両点検」等の優先順位は低く設定されている。
また、ある事象が生じた場合に、その具体的な原因が放送テキストデータ内において判明している場合には、具体的な原因を示す文字列が優先され、一般的な事象を示す文字列の優先順位は低く設定されている。
また、例えば状態辞書データ４４においては、事象の発生から復旧に向かうプロセスにおいて、より現時点に近いもの、すなわち復旧プロセスの進んでいる（復旧に近い）方の優先順位が高く設定される。

なお、１つの放送テキストデータ中に１つのタグに対応する文字列が複数存在する場合であって、辞書データにおいて特に優先順位の規定がされていない場合には、タグ付け処理部２１は、放送テキストデータ中最初に登場した文字列に主たるタグを付与する。
例えば、１つの放送テキストデータ中に複数の路線名が含まれている場合に、路線名辞書データ４１中に特に優先順位の規定がされていない場合には、放送テキストデータ中最初に登場した路線名に主たる路線名に付される「路線名タグ」を付与し、その他の路線名には従たる路線名に付される「関連路線名タグ」を付与するというように、文中の登場順をもって優先順位とする。
また、本実施形態では「列車番号」、「パターン番号」、「時刻」については特に辞書を用意しておらず、優先順位の規定もない。このため、１つの放送テキストデータ中に「列車番号」、「パターン番号」、「時刻」に該当する文字列が複数ある場合には、タグ付け処理部２１は、「列車番号」に該当するすべての文字列に「列車番号タグ」を付与し、「パターン番号」に該当するすべての文字列に「パターン番号タグ」を付与し、「時刻」に該当するすべての文字列に「時刻タグ」を付与する。

具体的には、例えば、「Ｐ線運転再開見込み時刻についての情報です。Ｐ線は、▽▽駅で異音感知の為、※※から××間の上下線で運転を見合わせています。運転再開見込みは、１１時１０分頃を予定しています。」という放送テキストデータの場合、「Ｐ線」に「路線名タグ」が付与され、「異音感知」に「事象タグ」が付与され、文中最初に登場する「▽▽駅」に「駅名タグ」が付与され、それ以外の駅名である「※※」「××」には「関連駅名タグ」が付与される。また、「運転再開見込み」に「状態タグ」、「運転見合わせ」に「関連状態タグ」が付与される。その他「上下」には「方向タグ」、「１１時１０分」には「時刻タグ」が付与される。
なお、上記例の放送テキストデータの場合、「パターン番号」及び「列車番号」に該当すべき文字列がないため、パターン番号タグ及び列車番号タグについてはブランクとなる。

グループ化処理部２２は、タグ付け処理部２１により付与されたタグに基づいて、放送テキストデータをグループ分けするものである。
グループ化処理部２２は、放送テキストデータに付与された各種タグの全部又は一部と対応付けられた文字列が共通するものを同一グループとして当該放送テキストデータをグループ分けする。
文字化された音声放送のデータである放送テキストデータを現場の社員が確認する場合、社員が自らの業務に関わりのある事象に関する情報に絞って復旧に向けた経過を効率的にチェックできることが好ましい。
グループ化処理部２２によるグループ化処理は、このような要望に応えるために、路線や事象に関わりなく時系列的に蓄積されていく情報（放送テキストデータ）の中から、確認したい事象に関するものを抽出して表示させることができるようにするものである。
本実施形態では、前述のように、タグは、列車の路線名を示す文字列に対応付けられる「路線名タグ」、駅名を示す文字列に対応付けられる「駅名タグ」、列車の運行に関わる事象を示す文字列に対応付けられる「事象タグ」を含んでいる。また、各放送テキストデータには、当該音声放送がなされた放送日が情報として含まれている。グループ化処理部２２は、「放送日」が同じであって、かつ「路線名タグ」、「駅名タグ」、及び「事象タグ」と対応付けられた文字列が共通するものを同一グループとして放送テキストデータをグループ分けする。
以下、グループ化処理部２２によるグループ分けについて具体的に説明する。

グループ化処理部２２は、放送テキストデータについて、「路線名タグ」、「駅名タグ」、「事象タグ」と対応付けられた各文字列、及び「放送日」を、既にグループ分けされている過去の放送テキストデータにおける「路線名タグ」、「駅名タグ」、「事象タグ」と対応付けられた各文字列、及び「放送日」と比較して、各タグに対応する文字列、及び「放送日」が共通するか否かを判断する。
そして、３つのタグに対応する文字列、及び「放送日」が共通すると判断する場合には、比較対象となった過去の放送テキストデータと同一グループのものと判断して、当該過去の放送テキストデータと同じグループＩＤを付与する。
また、３つのタグに対応する文字列が共通しないと判断する場合には、当該放送テキストデータに新たなグループＩＤを付与する。
なお、「放送日」における日付は、午前０時を基準とするのではなく、例えば、列車がその日の運行を終了するとき（すなわちその日の最終列車の運行終了時）等、ある一定の時刻までは、同一の放送日として処理される。

例えば、放送テキストデータＡ〜Ｅがあり、放送テキストデータＡが最初の（すなわちグループＩＤのリセット後最も古い）音声放送のテキストデータであり、放送テキストデータＥが最新の音声放送のテキストデータである場合には、グループ化処理部２２は、まず、この放送テキストデータＡに「２０１５１００５−０００１」等、日付と固有の番号等からなるグループＩＤを付与する。
そして、次に放送テキストデータＢが送られると、グループ化処理部２２は、放送テキストデータＡにおいて、放送日の他に、路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象と放送テキストデータＢにおいて路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象とを比較し、これら４つの要素が一致するか否かを判断する。そして、放送テキストデータＢと放送テキストデータＡとで、４つの要素の全部又は一部が不一致である場合には、グループ化処理部２２は、放送テキストデータＢは過去のいずれのグループにも属さないと判断し、この放送テキストデータＢに放送テキストデータＡに付したものとは異なる「２０１５１００５−０００２」等のグループＩＤを付与する。

同様に、放送テキストデータＣが送られると、グループ化処理部２２は、放送テキストデータＡ及び放送テキストデータＢにおいて、放送日の他に、路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象と放送テキストデータＣにおいて路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象とを比較し、これら４つの要素が一致するか否かをそれぞれ判断する。
例えば、放送テキストデータＡと放送テキストデータＣとが、放送日が同一であり、かつ、いずれも路線名タグ：Ｐ線、駅名タグ：▽▽駅、事象タグ：異音感知である場合には、４つの要素全てが共通している。このため、グループ化処理部２２は、放送テキストデータＣは放送テキストデータＡと同一グループに属すると判断し、この放送テキストデータＣに放送テキストデータＡに付したものと同じ「２０１５１００５−０００１」のグループＩＤを付与する。
また、放送テキストデータＤ、放送テキストデータＥについても同様の判断を行い、放送テキストデータＡ〜Ｃと放送テキストデータＤとが４つの要素のうち全部又は一部が一致しない場合には、グループ化処理部２２は、放送テキストデータＤは過去のいずれのグループにも属さないと判断し、この放送テキストデータＤに放送テキストデータＡ〜Ｃに付した物とは異なる「２０１５１００５−０００３」等のグループＩＤを付与する。また、放送テキストデータＥの放送日、路線名、駅名、及び事象が放送テキストデータＢと一致する場合には、グループ化処理部２２は、放送テキストデータＥは放送テキストデータＢと同一グループに属すると判断し、この放送テキストデータＥに放送テキストデータＢに付したものと同じ「２０１５１００５−０００２」のグループＩＤを付与する。

なお、放送日以外の「路線名タグ」、「駅名タグ」、及び「事象タグ」のいずれかについて対応する文字列がない場合（すなわち、路線名、駅名、事象のいずれかが放送テキストデータに含まれていない場合）には、３つの要素のうち２つが一致し、残り１つの要素が積極的に不一致でない場合（すなわち、対応する文字列がなくブランクである場合）であれば、同一グループとして同じグループＩＤを付与してもよい。

グループＩＤは、日付が変わるごと、又は各路線の始発が運行を開始するのに合わせてリセットされることが好ましい。
タグ付け処理部２１によってタグを付与され、グループ化処理部２２によってグループ分けされた（すなわち何らかのグループＩＤが付与された）放送テキストデータは、タグ付けされた文字列のデータとともに、加工後テキストＤＢ２５に格納される。
なお、本実施形態では、放送テキスト化装置１からテキストデータ加工装置２に送られる放送テキストデータには、当該テキストデータの元となった音声放送の放送時刻が付帯情報として付与されている。そこで、テキストデータ加工装置２では、この放送テキストデータに付帯している音声放送の放送時刻データも加工後の放送テキストデータに付帯させたまま加工後テキストＤＢ２５に記憶させる。
加工後テキストＤＢ２５に格納された加工後の放送テキストデータは、表示用データ配信装置３に送られる。

表示用データ配信装置３は、テキストデータ加工装置２によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信するサーバ装置（コンピュータ）である。
表示用データ配信装置３は、表示用データ生成部３１、表示用データ配信部３２、プログラム記憶部３３、加工後テキストＤＢ３４、復旧見込みＤＢ３５、振替パターンＤＢ３６、及び外部装置等と接続されるＩ／Ｆ３７等の機能部を備えており、これらはバス３８により接続されている。
以下各機能部について説明する。

プログラム記憶部３３は、コンピュータである表示用データ配信装置３において各機能部が各種処理を行うためのプログラムを格納する。
本実施形態では、表示用データ配信装置３が、テキストデータ加工装置２により加工された加工後の放送テキストデータを使用して、各種端末装置の表示部に表示させる表示画面を構成する表示用データを生成・配信するための表示用データ生成処理プログラム等がプログラム記憶部３３に格納されている。
また、加工後テキストＤＢ３４は、テキストデータ加工装置２から送られた加工後のタグ付けされた文字列及び放送テキストデータ本文を記憶する記憶部である。

復旧見込みＤＢ３５は、事象ごとの過去の統計等に基づいて規定される、事象の発生から列車の運行状態が回復されるまでの平均的な時間のデータや、事象ごとのおよその復旧プロセスのデータ等、列車運行の復旧見込みに関する静的データが各事象と対応付けて記憶される記憶部である。
なお、事象の発生から列車の運行状態が回復されるまでの平均的な時間等については、事象例がある程度集まるごとに、データを集計し直して、新たなデータに書き換え、更新するようにしてもよい。本実施形態では、事象について事象タグを付与しているため、事象タグが付与されている文字列を分析して、同じ文字列（例えば異音感知等）のものを集めることにより、事象ごとの復旧までの所要時間のデータを容易に集めることができ、集計に用いることができる。
また、復旧プロセスについては、事象の発生から列車の運行状態が回復されるまでの一般的な処理過程をフローチャートのような形式で表したもののみでもよいし、処理過程における各プロセスに要する平均的な時間を過去の統計等から算出した参考所要時間の情報等を含むものであってもよい。

振替パターンＤＢ３６は、他路線への振替乗車のパターンを示す静的データを所定のパターン番号と対応付けて記憶する記憶部である。
振替乗車が行われる場合、事象や事象の発生場所に応じて、振替可能な路線や範囲（すなわち振替乗車の対象となる駅区間）が異なる。いかなる路線のどの範囲・区間において振替乗車が可能であるかは、それぞれパターン番号で管理されており、音声放送やこれをテキストデータ化した放送テキストデータ中では、振替パターンはパターン番号によって示されている。
振替パターンＤＢ３６には、こうした振替パターンのパターン番号と、各パターン番号に対応する具体的な振替可能路線の名称や振替乗車の対象となる駅区間等の振替可能範囲とを対応付けて記憶している。

表示用データ生成部３１は、加工後テキストＤＢ３４に記憶されている加工後の放送テキストデータに基づいて、各種端末装置Ｔの表示部Ｇに表示させる表示画面を構成する表示用データを生成する。
また、表示用データ配信部３２は、端末装置Ｔからの配信要求に応じて、表示用データ生成部３１により生成された表示用データをネットワークＮを介して対応する端末装置Ｔに配信するものである。

例えば、表示用データ生成部３１は、端末装置Ｔの表示部Ｇに、加工後テキストＤＢ３４に時系列的に蓄積されていく放送テキストデータを、時系列順に一覧表示させる表示用データを生成する。この表示用データを表示用データが配信部３２により端末装置Ｔに配信されることにより、放送テキストデータに対応する文章が時系列順に一覧表示された表示画面を表示部Ｇの表示画面上に表示させることができる。
また、表示部Ｇの表示画面上に一覧表示された中からユーザがいずれかの本文を選択操作すると、詳細表示画面ｇ４（図３参照）の表示用データの配信要求が表示用データ配信装置３に送られ、当該表示用データが配信されると、表示部Ｇの表示画面が、例えば図３に示すように、ユーザが選択した本文の全文が表示された詳細表示画面ｇ４に遷移するようになっている。

本実施形態の表示用データ生成部３１は、テキストデータ加工装置２によるグループ分けに応じて放送テキストデータをソートした状態の表示用データを生成可能となっている。
具体的には、例えば図３に示すように、詳細表示画面ｇ４には、「経過表示ボタン」６４が設けられている。この経過表示ボタン６４がタッチ操作されると、表示用データ生成部３１によって、詳細表示画面ｇ４に表示された放送テキストデータと同じグループに分類されている放送テキストデータ（すなわち、同じグループＩＤが付与されている放送テキストデータ）が抽出され、これらを１つの画面上に表示させる表示用データが生成される。
当該表示用データが端末装置Ｔに送られることにより、図４に示すように、詳細表示画面ｇ４に表示された放送テキストデータとともに、これと同じグループに分類されている放送テキストデータが時系列順に一覧表示された経過表示欄６６を有する経過表示画面ｇ５が端末装置Ｔの表示画面に表示される。

また、本実施形態の表示用データ生成部３１は、テキストデータ加工装置２によるタグ付けに応じて放送テキストデータをソートした状態の表示用データを生成可能に構成されていてもよい。
この場合、例えば、ユーザによって路線等が選択されると、表示用データ生成部３１は、選択された路線に対応する路線名に路線名タグが対応付けられている放送テキストデータのみを抽出して、これを時系列的に羅列した表示画面を表示させる表示用データを生成し、これを端末装置Ｔに送信する。これにより、ユーザによって選択された路線名や駅名等を含む放送テキストデータが時系列順に一覧表示された表示画面を表示させることができる。
なお、放送テキストデータに基づく表示を行う場合、表示用データ生成部３１は放送テキストデータの全文をそのまま表示させるのではなく、放送テキストデータのうち、タグが付与された重要な情報のみを表示させて、情報の要点を分かりやすく端的に示すようにしてもよい。
また、この場合、事象や状態については表現が統一されていた方が分かりやすい場合もあるため、放送テキストデータのままの類似文字列ではなく、当該類似文字列と対応付けられた確定ワードをもって表示させてもよい。

図５から図７を参照しつつ、本実施形態における文字化放送表示処理について説明する。
図５及び図６は、テキストデータ加工装置２のタグ付け処理部２１が行うタグ付け処理を示すフローチャートである。
図５に示すように、タグ付け処理部２１は、放送テキスト化装置１から放送テキストデータを取得すると（ステップＳ１）、当該放送テキストデータについて順次冒頭から各辞書データに登録されているものと合致する文字列があるか否かを検索する。
すなわち、例えばまず路線名辞書データ４１に登録されている文字列と合致するものがあるか否かを検索する（ステップＳ２）。このとき、タグ付け処理部２１は、データの冒頭から末尾までを検索して、合致する文字列がある場合（ステップＳ２；ＹＥＳ）には、さらにそれが複数あるか否かを判断し（ステップＳ３）、複数ある場合（ステップＳ３；ＹＥＳ）には、最初に登場した文字列に路線名タグを付与し、それ以降に登場した文字列には関連路線名タグを付与する（ステップＳ４）。他方合致する文字列が１つしかない場合（ステップＳ３；ＮＯ）には、当該文字列に路線名タグを付与する（ステップＳ５）。なお、合致する文字列がない場合（ステップＳ２；ＮＯ）には、路線名タグをブランクとする（ステップＳ６）。
同様に、駅名辞書データ４２に登録されている文字列と合致するものがあるか否かを検索する（ステップＳ７）。このとき、タグ付け処理部２１は、データの冒頭から末尾までを検索して、合致する文字列がある場合（ステップＳ７；ＹＥＳ）には、さらにそれが複数あるか否かを判断し（ステップＳ８）、複数ある場合（ステップＳ８；ＹＥＳ）には、最初に登場した文字列に駅名タグを付与し、それ以降に登場した文字列には関連駅名タグを付与する（ステップＳ９）。他方合致する文字列が１つしかない場合（ステップＳ８；ＮＯ）には、当該文字列に駅名タグを付与する（ステップＳ１０）。なお、合致する文字列がない場合（ステップＳ７；ＮＯ）には、駅名タグをブランクとする（ステップＳ１１）。

また、タグ付け処理部２１は、次に事象辞書データ４３に登録されている文字列と合致するものがあるか否かを検索する（ステップＳ１２）。このとき、タグ付け処理部２１は、データの冒頭から末尾までを検索して、合致する文字列がある場合（ステップＳ１２；ＹＥＳ）には、さらにそれが複数あるか否かを判断し（ステップＳ１３）、複数ある場合（ステップＳ１３；ＹＥＳ）には、事象辞書データ４３において優先順位の最も高い文字列に事象タグを付与し、それ以外の文字列には関連事象タグを付与する（ステップＳ１４）。他方合致する文字列が１つしかない場合（ステップＳ１３；ＮＯ）には、当該文字列に事象タグを付与する（ステップＳ１５）。
なお、放送テキストデータに含まれる文字列が事象辞書データ４３において類似文字列の１つとして登録されている場合には、タグ付け処理部２１は、当該文字列と、これに対応する確定ワードの両方に同じタグ（すなわち、事象タグ又は関連事象タグ）を付与する。
なお、合致する文字列がない場合（ステップＳ１２；ＮＯ）には、事象タグをブランクとする（ステップＳ１６）。

同様に、タグ付け処理部２１は、状態辞書データ４４に登録されている文字列と合致するものがあるか否かを検索する（ステップＳ１７）。このとき、タグ付け処理部２１は、データの冒頭から末尾までを検索して、合致する文字列がある場合（ステップＳ１７；ＹＥＳ）には、さらにそれが複数あるか否かを判断し（ステップＳ１８）、複数ある場合（ステップＳ１８；ＹＥＳ）には、状態辞書データ４４において優先順位の最も高い文字列に状態タグを付与し、それ以外の文字列には関連状態タグを付与する（ステップＳ１９）。他方合致する文字列が１つしかない場合（ステップＳ１８；ＮＯ）には、当該文字列に状態タグを付与する（ステップＳ２０）。
なお、放送テキストデータに含まれる文字列が状態辞書データ４４において類似文字列の１つとして登録されている場合には、タグ付け処理部２１は、当該文字列と、これに対応する確定ワードの両方に同じタグ（すなわち、状態タグ又は関連状態タグ）を付与する。
なお、合致する文字列がない場合（ステップＳ１７；ＮＯ）には、状態タグをブランクとする（ステップＳ２１）。

次に、図６に示すように、タグ付け処理部２１は、方向辞書データ４５に登録されている文字列と合致するものがあるか否かを検索する（ステップＳ２２）。このとき、タグ付け処理部２１は、データの冒頭から末尾までを検索して、合致する文字列がある場合（ステップＳ２２；ＹＥＳ）には、さらにそれが複数あるか否かを判断し（ステップＳ２３）、複数ある場合（ステップＳ２３；ＹＥＳ）には、最初に登場した文字列に方向タグを付与し、それ以降に登場した文字列には関連方向タグを付与する（ステップＳ２４）。他方合致する文字列が１つしかない場合（ステップＳ２３；ＮＯ）には、当該文字列に方向タグを付与する（ステップＳ２５）。
なお、合致する文字列がない場合（ステップＳ２２；ＮＯ）には、方向タグをブランクとする（ステップＳ２６）。

また、タグ付け処理部２１は、列車番号に該当する文字列があるか否かを判断する（ステップＳ２７）。すなわち、数字とアルファベット１文字との組み合わせからなる文字列があるか否かを判断し、ある場合（ステップＳ２７；ＹＥＳ）には、該当するすべての文字列に列車番号タグを付与する（ステップＳ２８）。
なお、合致する文字列がない場合（ステップＳ２７；ＮＯ）には、列車番号タグをブランクとする（ステップＳ２９）。
さらに、タグ付け処理部２１は、パターン番号に該当する文字列があるか否かを判断する（ステップＳ３０）。すなわち、「パターン」等の文字と数字との組み合わせからなる文字列があるか否かを判断し、ある場合（ステップＳ３０；ＹＥＳ）には、該当するすべての文字列にパターン番号タグを付与する（ステップＳ３１）。
なお、合致する文字列がない場合（ステップＳ３０；ＮＯ）には、パターン番号タグをブランクとする（ステップＳ３２）。
また、タグ付け処理部２１は、時刻に該当する文字列があるか否かを判断する（ステップＳ３３）。すなわち、時刻を示す数字や「時」「分」等の文字からなる文字列があるか否かを判断し、ある場合（ステップＳ３３；ＹＥＳ）には、該当するすべての文字列に時刻タグを付与する（ステップＳ３４）。
なお、合致する文字列がない場合（ステップＳ３３；ＮＯ）には、時刻タグをブランクとする（ステップＳ３５）。

次に、図７を参照しつつ、テキストデータ加工装置２のグループ化処理部２２が行うグループ化処理について説明する。
図７に示すように、グループ化処理部２２は、タグ付けされた放送テキストデータを取得すると（ステップＳ４１）、当該放送テキストデータについて、放送日の情報、及び路線名タグ、駅名タグ、事象タグがタグ付けされた文字列を抽出する（ステップＳ４２）。
そして、既にグループ化処理が完了している放送テキストデータのうち、放送日、及び路線名タグ、駅名タグ、事象タグがタグ付けされた文字列が当該抽出された文字列と合致するものがあるか否かを判断する（ステップＳ４３）。
過去のいずれの放送テキストデータも当該抽出された文字列やその放送日が合致しない場合や、未だ過去の放送テキストデータが存在しない場合（ステップＳ４３；ＮＯ）には、グループ化処理部２２は、当該放送テキストデータについて、新たなグループＩＤを付与する（ステップＳ４４）。他方、当該抽出された文字列やその放送日がが過去のいずれかの放送テキストデータの放送日、路線名タグ、駅名タグ、事象タグがタグ付けされた文字列と合致する場合（ステップＳ４３；ＹＥＳ）には、グループ化処理部２２は、当該放送テキストデータについて、当該合致する放送テキストデータに付与されているグループＩＤと同一のグループＩＤを付与する（ステップＳ４５）。

次に、表示用データ配信装置３が行う文字化放送表示処理について説明する。
表示用データ配信装置３は、端末装置Ｔからの表示用データ配信要求があると、これに応じて、表示用データ生成部３１が表示用データを生成し、表示用データ配信部３２からネットワークＮを介して配信要求元の端末装置Ｔに当該表示用データを配信する。
これにより、端末装置Ｔの表示部Ｇの表示画面に当該表示用データに基づく画面が表示される。

例えば、端末装置Ｔにおいて、路線名を選択する操作がなされると、表示用データ生成部３１は、加工後テキストＤＢ３４の中から、ユーザにより選択された路線名が路線名タグと対応付けされている放送テキストデータを抽出し、これを時系列順（又は設定によっては路線名の５０音順プラス時系列順）にソート表示した表示画面を表示させるための表示用データを生成する。この表示用データが表示用データ配信部３２からネットワークＮを介して配信要求元の端末装置Ｔに配信されることにより、端末装置Ｔの表示部Ｇの表示画面に当該表示用データに基づく表示画面が表示される。

また、例えば、端末装置Ｔにおいて、ユーザがある放送テキストデータをタッチして選択する操作を行うと、表示用データ生成部３１は、当該放送テキストデータの全文を表示させる詳細表示画面ｇ４を表示させるための表示用データを生成する。この表示用データが配信要求元の端末装置Ｔに配信されることにより、端末装置Ｔの表示部Ｇの表示画面に当該表示用データに基づく詳細表示画面ｇ４（図３参照）が表示される。
また、この詳細表示画面ｇ４において、経過表示ボタン６４がタッチ操作されると、表示用データ生成部３１は、当該放送テキストデータと同一グループに分類されている全ての放送テキストデータ（すなわち、同一のグループＩＤが対応付けられている全放送テキストデータ）を加工後テキストＤＢ３４の中から抽出し、抽出した放送テキストデータの全文が表示される経過表示画面ｇ５を表示させるための表示用データを生成する。この表示用データが配信要求元の端末装置Ｔに配信されることにより、端末装置Ｔの表示部Ｇの表示画面に当該表示用データに基づく経過表示画面ｇ５（図４参照）が表示される。

以上のように、本実施形態によれば、放送テキストデータから所定の文字列を抽出し、抽出した文字列に当該文字列の分類指標となるタグを適宜付与し、このタグに基づいて、放送テキストデータをグループ分けする。
このため、放送テキストデータに含まれる文字列を当該文字列の性質に応じて適切に分類し、タグ付けして、このタグにしたがってグループ分けすることができるため、ユーザである社員が各自必要な情報を得ようとしたときに、所望の情報をひとまとまりのものとして抽出することが可能となる。これにより、社員が必要な情報を容易に端末装置Ｔ等で確認することができ、各種事象への対応、列車利用者への適切かつ迅速な案内・説明等を行うのに情報を役立てることができる。

また、列車の運行に関する音声放送では、同じ意味の言葉でも様々な異なる言い回しで表現されることがあるところ、辞書データは、同様の意味を有し言い回しの異なる複数の文字列である類似文字列について１つの確定ワードを対応付けており、類似文字列及び確定ワードについて同じタグが対応付けられる。
このため、同じ意味の言葉について各種の表現がされた場合でも適切にタグを対応付けることができる。これにより、音声放送における言い回しに関わらず、適切にタグ付け処理及びグループ分け処理を行うことができる。

また、１つの放送テキストデータ中に複数の確定ワードに対応する文字列がある場合、適切な確定ワードのタグが付されなければ、適切な情報抽出が困難となるところ、辞書データは、確定ワードに優先順位を設けており、タグ付け処理は、この優先順位にしたがって行われる。
このため、タグを付ける際によりユーザである社員のニーズに合った適切な文字列を選択することができ、ユーザである社員にとって有用な情報を適切に抽出することが可能となる。

また、グループ化処理部２２は、タグの全部又は一部と対応付けられた類似文字列又は確定ワードが共通するものを同一グループとして放送テキストデータをグループ分けする。
このため、タグによって適切に放送テキストデータをグループ分けすることができる。

また、グループ化処理部２２は、放送日、路線名タグ、駅名タグ、及び事象タグと対応付けられた類似文字列又は確定ワードが共通するものを同一グループとして放送テキストデータをグループ分けする。
放送日、路線名、駅名、及び事象が共通する場合には、同じ事象に関する一連の経過情報である可能性が高く、上記のように構成することで、適切に必要な情報をひとまとまりのものとして抽出することが可能となる。

そして、文字化放送表示システム１００は、上記のようなタグ付け処理およびグループ化処理を行うテキストデータ加工装置２と、このテキストデータ加工装置２によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置３とを備えている。
このため、テキストデータ加工装置２において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員の有する端末装置Ｔ等に、社員にとって必要な情報を適切に表示させることができる。

また、表示用データ配信装置３は、テキストデータ加工装置２によるグループ分けに応じて放送テキストデータをソートした状態の表示用データを生成可能となっている。
このため、テキストデータ加工装置２において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報をひとまとまりのものとして適切に表示させることができる。

なお、以上本発明の実施形態について説明したが、本発明は、かかる実施形態に限定されず、その要旨を逸脱しない範囲で、種々変形が可能であることは言うまでもない。

例えば、本実施形態では、文字化放送表示プログラムが表示用データ配信装置３に備えられている例を示したが、文字化放送表示プログラムは表示用データ配信装置３に備えられている場合に限定されず、例えば、社員用の各端末装置Ｔにおいてダウンロードすることのできるアプリケーションプログラムとし、各端末装置Ｔ内のコンピュータと協働して文字化放送の表示処理を実現するものであってもよい。

また、本実施形態では、社員用の端末装置Ｔに文字化放送を表示させる場合を例としたが、例えば列車利用者の有する携帯電話機その他の各種端末装置や、駅構内や列車車両内等に設置されたモニタに、本実施形態で示したような表示画面を表示させるようにしてもよい。

２テキストデータ加工装置
３表示用データ配信装置
２１タグ付け処理部
２２グループ化処理部
２４辞書ＤＢ
２５加工後テキストＤＢ
３１表示用データ生成部
３２表示用データ配信部
３４加工後テキストＤＢ
３５復旧見込みＤＢ
３６振替パターンＤＢ
１００文字化放送表示システム
Ｎネットワーク
Ｔ端末装置

Claims

列車の運行に関わる音声放送のデータをテキストデータ化した放送テキストデータを取得してこの放送テキストデータを加工するテキストデータ加工装置であって、
前記放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するタグ付け処理部と、
前記文字列と前記タグとの対応関係を規定する辞書データを格納する辞書データベースと、
前記タグ付け処理部により付与された前記タグに基づいて、前記放送テキストデータをグループ分けするグループ化処理部と、
を備えており、
前記辞書データは、
同様の意味を有し言い回しの異なる複数の文字列である類似文字列について１つの確定ワードを対応付けており、
前記類似文字列及び前記確定ワードについて同じタグを対応付けていることを特徴とするテキストデータ加工装置。
前記辞書データは、前記確定ワードに優先順位を設けており、
前記タグ付け処理部は、１つの前記放送テキストデータ中に複数の前記確定ワードに対応する前記文字列がある場合には、前記確定ワードの前記優先順位にしたがって前記タグを付与することを特徴とする請求項１に記載のテキストデータ加工装置。
前記グループ化処理部は、前記タグの全部又は一部と対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けすることを特徴とする請求項１又は請求項２に記載のテキストデータ加工装置。
前記タグは、列車の路線名を示す文字列に対応付けられる路線名タグ、駅名を示す文字列に対応付けられる駅名タグ、列車の運行に関わる事象を示す文字列に対応付けられる事象タグを含んでおり、
前記グループ化処理部は、放送日、前記路線名タグ、前記駅名タグ、及び前記事象タグと対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けすることを特徴とする請求項１から請求項３のいずれか一項に記載のテキストデータ加工装置。
請求項１から請求項４のいずれか一項に記載のテキストデータ加工装置と、
前記テキストデータ加工装置によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置と、
を備えていることを特徴とする文字化放送表示システム。
前記表示用データ配信装置は、前記テキストデータ加工装置によるグループ分けに応じて前記放送テキストデータをソートした状態の表示用データを生成可能に構成されていることを特徴とする請求項５に記載の文字化放送表示システム。
請求項１から請求項４のいずれか一項に記載のテキストデータ加工装置により加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信機能をコンピュータに実現させることを特徴とする文字化放送表示プログラム。