JP6630139B2 - テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム - Google Patents

テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム Download PDF

Info

Publication number
JP6630139B2
JP6630139B2 JP2015238205A JP2015238205A JP6630139B2 JP 6630139 B2 JP6630139 B2 JP 6630139B2 JP 2015238205 A JP2015238205 A JP 2015238205A JP 2015238205 A JP2015238205 A JP 2015238205A JP 6630139 B2 JP6630139 B2 JP 6630139B2
Authority
JP
Japan
Prior art keywords
text data
broadcast
tag
character string
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015238205A
Other languages
English (en)
Other versions
JP2017107261A (ja
Inventor
正顯 飯野
正顯 飯野
真希 野崎
真希 野崎
洋祐 日高
洋祐 日高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East Japan Railway Co
Original Assignee
East Japan Railway Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East Japan Railway Co filed Critical East Japan Railway Co
Priority to JP2015238205A priority Critical patent/JP6630139B2/ja
Publication of JP2017107261A publication Critical patent/JP2017107261A/ja
Application granted granted Critical
Publication of JP6630139B2 publication Critical patent/JP6630139B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Train Traffic Observation, Control, And Security (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムに関し、特に、列車の運行状況に関するテキストデータのうち、必要なデータを抽出して表示させるためのテキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムに関する。
駅構内に配置されて列車利用者の対応にあたる駅社員等の鉄道会社の社員(以下において単に「社員」ともいう。)は、各種の事態に対応し、できる限り正確な情報を列車利用者に提供するために、各自の担当する路線等の列車に運行の乱れ等が生じていないか否かを把握して、生じている場合には現時点での状況や経過を正確かつ迅速に把握したいとの要望がある。
この点、従来、事故等の事象が発生すると、事象に関する進捗状況や復旧状況に関する情報が随時、社員である輸送指令員に報告され、輸送指令員の下に集約された情報が適宜無線等を通じた音声放送として社員に伝えられるのが一般的であった。
しかし、輸送指令員の下に集約された情報が音声によって伝えられるのみでは、提供された時点で聞き逃してしまうと社員が当該情報を得られない可能性がある。また、聞き手である社員が内容を聞き間違える等により情報の正確性を欠いてしまうおそれもある。
このため、輸送指令員の下に集約された情報を文字情報として社員向けに配信することが望ましい。
この点、音声データとして提供された情報を文字情報(テキストデータ)に変換して蓄積することも可能となっている。
また、特許文献1には、列車の遅延情報等の交通に関する情報を文字情報として辞書登録することが提案されている。
特許第5776169号公報
しかしながら、列車の運行状況について随時蓄積される情報は膨大であり、現場の社員としては、各自の担当する路線に関する情報等、必要な情報に絞って効率よく迅速に確認したいという要望がある。
この点、単に文字情報(テキストデータ)を蓄積していくのみでは、所望の情報のみを適切に抽出することができず、効率のよい情報確認ができないという問題がある。
本発明は以上のような事情に鑑みてなされたものであり、列車の運行状況について必要な情報を文字情報として正確かつ迅速に社員に提供することができるテキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムを提供することを目的とするものである。
前記課題を解決するために、本出願の発明であるテキストデータ加工装置は、
列車の運行に関わる音声放送のデータをテキストデータ化した放送テキストデータを取得してこの放送テキストデータを加工するテキストデータ加工装置であって、
前記放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するタグ付け処理部と、
前記文字列と前記タグとの対応関係を規定する辞書データを格納する辞書データベースと、
前記タグ付け処理部により付与された前記タグに基づいて、前記放送テキストデータをグループ分けするグループ化処理部と、
を備えており、
前記辞書データは、
同様の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードを対応付けており、
前記類似文字列及び前記確定ワードについて同じタグを対応付けている。
このように構成することで、放送テキストデータに含まれる文字列をその性質に応じて適切に分類し、タグ付けして、このタグにしたがってグループ分けすることができるため、ユーザである社員が各自必要な情報を得ようとしたときに、所望の情報をひとまとまりのものとして抽出することが可能となり、膨大な情報の中から知りたい情報を容易に確認することができる。
また、列車の運行に関する音声放送では、同じ意味の言葉でも様々な異なる言い回しで表現されることがあるが、上記のように構成することで、同じ意味の言葉について各種の表現がされた場合でも適切にタグを対応付けることができる。
また、好ましくは、前記辞書データは、前記確定ワードに優先順位を設けており、
前記タグ付け処理部は、1つの前記放送テキストデータ中に複数の前記確定ワードに対応する前記文字列がある場合には、前記確定ワードの前記優先順位にしたがって前記タグを付与する。
このように構成することで、タグを付ける際に、よりユーザである社員のニーズに合った適切な文字列を選択することができ、ユーザである社員にとって有用な情報を適切に抽出することが可能となる。
また、好ましくは、前記グループ化処理部は、前記タグの全部又は一部と対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けする。
このように構成することで、タグによって適切に放送テキストデータをグループ分けすることができる。
また、好ましくは、前記タグは、列車の路線名を示す文字列に対応付けられる路線名タグ、駅名を示す文字列に対応付けられる駅名タグ、列車の運行に関わる事象を示す文字列に対応付けられる事象タグを含んでおり、
前記グループ化処理部は、放送日、前記路線名タグ、前記駅名タグ、及び前記事象タグと対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けする。
放送日、路線名、駅名、及び事象が共通する場合には、同じ事象に関する経過情報である可能性が高く、上記のように構成することで、適切に必要な情報をひとまとまりのものとして抽出することが可能となる。
また、本出願の他の発明である文字化放送表示システムは、
上記のように構成された前記テキストデータ加工装置と、
前記テキストデータ加工装置によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置と、
を備えるようにする。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報を適切に表示させることができる。
また、好ましくは、前記表示用データ配信装置は、前記テキストデータ加工装置によるグループ分けに応じて前記放送テキストデータをソートした状態の表示用データを生成可能に構成されている。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報をひとまとまりのものとして適切に表示させることができる。
また、本出願の他の発明である文字化放送表示プログラムは、
前述したように前記テキストデータ加工装置により加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信機能をコンピュータに実現させる。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報を適切に表示させることが可能となる。
本発明によれば、列車の運行状況について必要な情報を文字情報として正確かつ迅速に社員に提供することができるという効果を奏する。
本実施形態に係る文字化放送表示システム全体を示す要部ブロック図である。 事象辞書データの構成例を示す図である。 詳細表示画面の表示画面例を示した図である。 経過表示画面の表示画面例を示した図である。 タグ付け処理の全体の流れを示すフローチャートである。 タグ付け処理の全体の流れを示すフローチャートである。 グループ化処理の全体の流れを示すフローチャートである。
図1から図7を参照しつつ、本発明に係るテキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラムの一実施形態について説明する。なお、以下に述べる実施形態には、本発明を実施するために技術的に好ましい種々の限定が付されているが、本発明の範囲を以下の実施形態及び図示例に限定するものではない。
図1は、本実施形態に係る文字化放送表示システム100の全体構成を示す図である。
図1に示すように、文字化放送表示システム100は、放送テキスト化装置1によってテキストデータ化された放送情報(これを以下「放送テキストデータ」という。)を加工するテキストデータ加工装置2と、テキストデータ加工装置2によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、これを配信する表示用データ配信装置3とを備えている。
文字化放送表示システム100には、ネットワークN等を介して端末装置Tが接続されており、表示用データ配信装置3は、生成した表示用データをネットワークN等を介して適宜端末装置Tに提供するようになっている。
端末装置Tは、例えば列車の運行に関わる社員(例えば駅構内に配置されて列車利用者の対応にあたる駅社員等)が使用している携帯可能な端末装置であって、液晶パネルや有機ELディスプレイ等で構成される表示部Gを備えており、表示用データ配信装置3から提供される情報に基づいて表示を行う。端末装置Tは例えばタブレット型の端末装置でもよいし、携帯電話機等であってもよい。
放送テキスト化装置1は、列車の運行に関わる様々な事象に関する情報が音声で伝えられる音声放送の音声データを文字情報であるテキストデータ化するサーバ装置(コンピュータ)である。
列車の運行に関わる何らかの事象が発生すると、当該事象の発生場所や発生時刻、現時点での状態等の情報が輸送指令室に無線等により報告される。事象の発生が報告されると、輸送指令室では、輸送指令員が、この情報を無線等により社員(例えば駅構内に配置されて列車利用者の対応にあたる駅社員等)に音声放送として音声で伝える。
ここで「事象」とは、事故やトラブルの発生、車両の点検等、列車の見合わせや遅延等を引き起こす原因となる事柄の総称である。
また、「状態」とは、運転見合わせや運転再開、列車の運行遅延等、列車の運行状況である。
放送テキスト化装置1は、音声放送の音声データをテキストデータ(放送テキストデータ)に自動変換する放送テキスト化処理部11、放送テキストデータを外部装置に配信するテキストデータ配信部12、放送テキスト化処理部11において音声データをテキストデータに自動変換する処理を行うための放送文字化プログラム等、コンピュータである放送テキスト化装置1において各機能部が各種処理を行うためのプログラムを格納するプログラム記憶部13、放送テキスト化処理部11においてテキストデータ化された放送情報(放送テキストデータ)が記憶されるテキスト化放送データベース(以下、本文中及び図1において「データベース」を「DB」とする。)14、及び外部装置等と接続されるI/F15等の機能部を備えており、これらはバス16により接続されている。
なお、放送テキスト化処理部11が音声データをテキストデータに自動変換する手法は特に限定されず、既存の手法を用いることができる。
放送テキスト化装置1によってテキストデータ化された放送情報(放送テキストデータ)は、テキストデータ加工装置2に送信される。
テキストデータ加工装置2は、放送テキスト化装置1によってテキストデータ化された放送テキストデータを取得してこの放送テキストデータを加工するサーバ装置(コンピュータ)である。
テキストデータ加工装置2は、タグ付け処理部21、グループ化処理部22、プログラム記憶部23、辞書DB24、加工後テキストDB25、及び外部装置等と接続されるI/F27等の機能部を備えており、これらはバス28により接続されている。
以下各機能部について説明する。
プログラム記憶部23は、コンピュータであるテキストデータ加工装置2において各機能部が各種処理を行うためのプログラムを格納する。
本実施形態では、タグ付け処理部21において放送テキストデータから抽出した文字列にタグを付与するタグ付け処理を行うためのタグ付け処理プログラム、グループ化処理部22において放送テキストデータをグループ分けするグループ化処理を行うためのグループ化処理プログラム等がプログラム記憶部23に格納されている。
また、加工後テキストDB25は、タグ付け処理部21及びグループ化処理部22によって加工処理が施された加工後のタグ付けされた文字列及び放送テキストデータの本文を記憶するものである。
辞書DB24は、文字列とタグとの対応関係を規定する辞書データを格納する。
本実施形態では、図1に示すように、路線名辞書データ41、駅名辞書データ42、事象辞書データ43、状態辞書データ44、方向辞書データ45が辞書DB24に格納されている。
なお、辞書DB24に格納される辞書データはここに例示したものに限定されない。これらのうちの一部のみであってもよいし、これら以外の辞書データを含んでいてもよい。例えば、辞書DB24に格納される辞書データは、図1に図示した以外に、放送テキストデータから時刻情報を読み取るための時刻辞書データ、列車番号を読み取るための列車番号辞書データ、振り替え輸送手配に使用するパターン番号を読み取るためのパターン番号辞書データ等を含んでいてもよい。
例えば、路線名辞書データ41は、音声放送において読み上げられることが想定されるすべての路線の路線名を示す文字列を、当該文字列の分類指標となるタグ(この場合には「路線名タグ」)と対応付けて記憶している。
また、例えば駅名辞書データ42は、音声放送において読み上げられることが想定されるすべての駅の駅名を示す文字列を、当該文字列の分類指標となるタグ(この場合には「駅名タグ」)と対応付けて記憶している。
事象辞書データ43は、事故やトラブルの発生等、列車の運転見合わせや遅延等を引き起こす原因として想定される事柄を示す文字列を、当該文字列の分類指標となるタグ(この場合には「事象タグ」)と対応付けて記憶するものである。
状態辞書データ44は、運転見合わせや運転再開、列車の運行遅延等、上記事象によって引き起こされる列車の運行状況を示す文字列を、当該文字列の分類指標となるタグ(この場合には「状態タグ」)と対応付けて記憶するものである。
また、方向辞書データ45にいう「方向」とは、例えば列車の上り・下り等の走行方向を意味しており、方向辞書データ45は、こうした列車の走行方向を示す文字列を、当該文字列の分類指標となるタグ(この場合には「方向タグ」)と対応付けて記憶するものである。
タグ付け処理部21がタグ付けする文字列は、基本的には放送テキストデータに含まれる文字列と確定ワードである。ただし、放送テキストデータに含まれる文字列は、放送を担当する読み手等によって、同じ意味の言葉でも複数の異なる言い回しで表現されることがある。特に、「事象」や「状態」については、各種の表現が想定される。
このため、辞書データは、同様の意味を有し言い回しの異なる複数の文字列である類似文字列(類似ワード)について1つの確定ワードを対応付けており、これらの類似文字列及び確定ワードについて同じタグを対応付けている。
図2は、事象辞書データ43の構成例を示すものである。
例えば、車両に何らかの問題が発生した場合、放送テキストデータ上の文言としては「車両不具合」「車両故障」といった言い回しが想定される。
この点、本実施形態の事象辞書データ43では、図2に示すように、これらの類似ワードに対して、「車両故障(車両点検)」が確定ワードとして対応付けられ、いずれの場合も事象タグが付与される。
また、「自動車」、「踏切」等、それぞれ単独では列車の運行に影響を及ぼす「事象」とは認められない文字列であっても、それらが組み合わされることで何らかの「事象」を意味することがある。
このため、辞書データでは、複数の文字列の組み合わせが所定の組み合わせである場合には、その組み合わせから導かれる「事象」を意味する確定ワードと対応付けており、複数の文字列の組み合わせによる検索にも対応できるようにしている。
なお、ここでは、図2に示す事象辞書データ43を例として説明したが、複数の類似ワードを1つの確定ワードと対応付ける点や、複数の文字列の組み合わせを1つの確定ワードと組み合わせる点は、状態辞書データ44等、他の辞書でも同様である。
さらに、辞書データでは、図2に示すように、確定ワードに予め優先順位(図2において「抽出優先順位」)を設けている。
後述するように、タグ付け処理部21は、1つの放送テキストデータ中に複数の確定ワードに対応する文字列がある場合には、確定ワードの優先順位にしたがってタグを付与するようになっている。
このため、辞書データでは、情報としての重要度の高いものほど確定ワードの優先順位が高くなるように規定されている。
情報としての重要度の高さを決める指標は各種考えられるが、例えば、包括的・一般的な表現よりも具体的で詳細な表現の方が重要度が高いものとする。これは、現場社員への情報提供の観点からは、より細かい情報を主たる情報として扱った方が好ましいためである。
このため、事象辞書データ43においては、例えば「車両故障(車両点検)」よりも「パンタグラフ支障(車両点検)」や「ブレーキ不具合(車両点検)」の方が優先順位が高いというように、より具体的で細かい情報ほど優先順位が高くなるようになっている。
なお、包括的・一般的な文言についてもタグを付与することができるように包括的・一般的な表現も辞書データに記憶させておくことにより、放送テキストデータに含まれる情報を漏れなく拾って分類することができる。また、音声放送では、何らかの事情がある場合や、ごく稀な事象であって具体的な表現が難しいケース等において、あえて具体的な表現を避けて放送を行うことがあるが、包括的・一般的な文言についてもタグを付与することで、このような放送がされた場合でも放送テキストデータに含まれる情報を適切に分類することができる。
また例えば、事象辞書データ43においては、列車の運行に乱れを生じた原因として直接的な事象ほど情報としての重要度が高いため、上位とすることが好ましい。
このため、事象の確定ワードの優先順位は、事象としてより直接的で重要度の高いものほど順位が高く、間接的で重要度の低いものほど順位が低くなっている。
また例えば、何らかの事故が発生したり、異音を感知して列車の運転が見合わされた場合には、運行再開までのプロセスとして、「車両点検」が含まれることがある。
この場合には、運転見合わせの原因となった事象が優先され、プロセスの1つである「車両点検」の優先順位が最も低くなるように優先順位が設定されている。
また、例えば「動物との接触」や「支障物との接触」によって「異音感知」された場合のように、ある事象が生じた場合に、その具体的な原因が放送テキストデータ内において判明している場合もある。この場合には、具体的な原因を示す文字列(例えば「動物との接触」や「支障物との接触」)が優先されるように、一般的な事象を示す文字列(例えば「異音感知」)の優先順位は低く設定されている。
なお、ここでは、図2に示す事象辞書データ43を例として説明したが、文字列や確定ワードに優先順位を付すことは事象辞書データ43に限定されず、状態辞書データ44等、他の辞書でも同様である。
タグ付け処理部21は、放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するものである。
タグとは、文字列の性質や種類を示し分類の際の指標となるものである。
本実施形態では、タグ付け処理部21は、タグとして「路線名タグ」、「関連路線名タグ」、「状態タグ」、「関連状態タグ」、「事象タグ」、「関連事象タグ」、「駅名タグ」、「関連駅名タグ」、「列車番号タグ」「方向タグ」「パターン番号タグ」、「時刻タグ」をそれぞれ対応する文字列に付与する。
ここで、「路線名タグ」、「事象タグ」、「駅名タグ」とは、一つの放送テキストデータ中、主たる路線名、事象、駅名(すなわち、後述する優先順位の高い路線名等や文中最初に登場する路線名等)に付与されるタグであり、「関連路線名タグ」、「関連事象タグ」、「関連駅名タグ」とは、一つの放送テキストデータ中に複数の路線名、事象、駅名が含まれている場合に、主たる路線名、事象、駅名以外のものに付与されるタグである。
なお、タグとしてどのような項目を用意するかはここに例示したものに限定されない。さらに多くの項目をタグとして拾ってもよいし、タグを付与する要素をこの例よりも少なくしてもよい。
ここで、辞書データを用いたタグ付けの仕方について具体的に説明する。
辞書データを用いてタグ付けを行う場合、タグ付け処理部21は、まず1つ目の辞書データ(例えば、路線名辞書データ41)を参照しつつ、放送テキストデータ中に路線名辞書データ41に登録されている文字列があるか否かを文頭から順次検索する。
そして、路線名辞書データ41に登録されている文字列があった場合には、これに路線名タグを付与する。
放送テキストデータの末尾まで検索が完了したら、同様に、次の辞書データ(例えば、駅名辞書データ42)を参照しつつ、放送テキストデータ中に駅名辞書データ42に登録されている文字列があるか否かを文頭から順次検索する。
そして、駅名辞書データ42に登録されている文字列があった場合には、これに駅名タグを付与する。
タグ付け処理部21は、同様に、順次すべての辞書データについて、検索を行い、適宜タグ付け処理を行う。
タグ付け処理を行うための検索を行った結果、1つの放送テキストデータ中に1つのタグに対応する文字列が複数存在する場合には、タグ付け処理部21は、前述のように、辞書データ中に規定されている優先順位にしたがってタグ付け処理を行う。そして最も優先順位の高いものに主たる路線名、事象、駅名に付与される「路線名タグ」、「事象タグ」、「駅名タグ」を付与し、それ以外のものには従たる路線名、事象、駅名に付与される「関連路線名タグ」、「関連事象タグ」、「関連駅名タグ」を付与する。
すなわち、例えば事象辞書データ43等においては、より具体的で細かい情報ほど優先順位が高くなるように設定されている。
また、例えば事象辞書データ43においては、列車の運行に乱れを生じた原因として直接的で重要度の高いものほど優先順位が高く、間接的で重要度の低いものほど優先順位が低くなっている。
また、例えば事象辞書データ43においては、列車の運行状態に乱れを生じた原因である事象と、この原因解消のためのプロセスを構成する事象とでは、「異音感知」等の原因となった事象が優先され、プロセスの1つである「車両点検」等の優先順位は低く設定されている。
また、ある事象が生じた場合に、その具体的な原因が放送テキストデータ内において判明している場合には、具体的な原因を示す文字列が優先され、一般的な事象を示す文字列の優先順位は低く設定されている。
また、例えば状態辞書データ44においては、事象の発生から復旧に向かうプロセスにおいて、より現時点に近いもの、すなわち復旧プロセスの進んでいる(復旧に近い)方の優先順位が高く設定される。
なお、1つの放送テキストデータ中に1つのタグに対応する文字列が複数存在する場合であって、辞書データにおいて特に優先順位の規定がされていない場合には、タグ付け処理部21は、放送テキストデータ中最初に登場した文字列に主たるタグを付与する。
例えば、1つの放送テキストデータ中に複数の路線名が含まれている場合に、路線名辞書データ41中に特に優先順位の規定がされていない場合には、放送テキストデータ中最初に登場した路線名に主たる路線名に付される「路線名タグ」を付与し、その他の路線名には従たる路線名に付される「関連路線名タグ」を付与するというように、文中の登場順をもって優先順位とする。
また、本実施形態では「列車番号」、「パターン番号」、「時刻」については特に辞書を用意しておらず、優先順位の規定もない。このため、1つの放送テキストデータ中に「列車番号」、「パターン番号」、「時刻」に該当する文字列が複数ある場合には、タグ付け処理部21は、「列車番号」に該当するすべての文字列に「列車番号タグ」を付与し、「パターン番号」に該当するすべての文字列に「パターン番号タグ」を付与し、「時刻」に該当するすべての文字列に「時刻タグ」を付与する。
具体的には、例えば、「P線運転再開見込み時刻についての情報です。P線は、▽▽駅で異音感知の為、※※から××間の上下線で運転を見合わせています。運転再開見込みは、11時10分頃を予定しています。」という放送テキストデータの場合、「P線」に「路線名タグ」が付与され、「異音感知」に「事象タグ」が付与され、文中最初に登場する「▽▽駅」に「駅名タグ」が付与され、それ以外の駅名である「※※」「××」には「関連駅名タグ」が付与される。また、「運転再開見込み」に「状態タグ」、「運転見合わせ」に「関連状態タグ」が付与される。その他「上下」には「方向タグ」、「11時10分」には「時刻タグ」が付与される。
なお、上記例の放送テキストデータの場合、「パターン番号」及び「列車番号」に該当すべき文字列がないため、パターン番号タグ及び列車番号タグについてはブランクとなる。
グループ化処理部22は、タグ付け処理部21により付与されたタグに基づいて、放送テキストデータをグループ分けするものである。
グループ化処理部22は、放送テキストデータに付与された各種タグの全部又は一部と対応付けられた文字列が共通するものを同一グループとして当該放送テキストデータをグループ分けする。
文字化された音声放送のデータである放送テキストデータを現場の社員が確認する場合、社員が自らの業務に関わりのある事象に関する情報に絞って復旧に向けた経過を効率的にチェックできることが好ましい。
グループ化処理部22によるグループ化処理は、このような要望に応えるために、路線や事象に関わりなく時系列的に蓄積されていく情報(放送テキストデータ)の中から、確認したい事象に関するものを抽出して表示させることができるようにするものである。
本実施形態では、前述のように、タグは、列車の路線名を示す文字列に対応付けられる「路線名タグ」、駅名を示す文字列に対応付けられる「駅名タグ」、列車の運行に関わる事象を示す文字列に対応付けられる「事象タグ」を含んでいる。また、各放送テキストデータには、当該音声放送がなされた放送日が情報として含まれている。グループ化処理部22は、「放送日」が同じであって、かつ「路線名タグ」、「駅名タグ」、及び「事象タグ」と対応付けられた文字列が共通するものを同一グループとして放送テキストデータをグループ分けする。
以下、グループ化処理部22によるグループ分けについて具体的に説明する。
グループ化処理部22は、放送テキストデータについて、「路線名タグ」、「駅名タグ」、「事象タグ」と対応付けられた各文字列、及び「放送日」を、既にグループ分けされている過去の放送テキストデータにおける「路線名タグ」、「駅名タグ」、「事象タグ」と対応付けられた各文字列、及び「放送日」と比較して、各タグに対応する文字列、及び「放送日」が共通するか否かを判断する。
そして、3つのタグに対応する文字列、及び「放送日」が共通すると判断する場合には、比較対象となった過去の放送テキストデータと同一グループのものと判断して、当該過去の放送テキストデータと同じグループIDを付与する。
また、3つのタグに対応する文字列が共通しないと判断する場合には、当該放送テキストデータに新たなグループIDを付与する。
なお、「放送日」における日付は、午前0時を基準とするのではなく、例えば、列車がその日の運行を終了するとき(すなわちその日の最終列車の運行終了時)等、ある一定の時刻までは、同一の放送日として処理される。
例えば、放送テキストデータA〜Eがあり、放送テキストデータAが最初の(すなわちグループIDのリセット後最も古い)音声放送のテキストデータであり、放送テキストデータEが最新の音声放送のテキストデータである場合には、グループ化処理部22は、まず、この放送テキストデータAに「20151005−0001」等、日付と固有の番号等からなるグループIDを付与する。
そして、次に放送テキストデータBが送られると、グループ化処理部22は、放送テキストデータAにおいて、放送日の他に、路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象と放送テキストデータBにおいて路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象とを比較し、これら4つの要素が一致するか否かを判断する。そして、放送テキストデータBと放送テキストデータAとで、4つの要素の全部又は一部が不一致である場合には、グループ化処理部22は、放送テキストデータBは過去のいずれのグループにも属さないと判断し、この放送テキストデータBに放送テキストデータAに付したものとは異なる「20151005−0002」等のグループIDを付与する。
同様に、放送テキストデータCが送られると、グループ化処理部22は、放送テキストデータA及び放送テキストデータBにおいて、放送日の他に、路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象と放送テキストデータCにおいて路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象とを比較し、これら4つの要素が一致するか否かをそれぞれ判断する。
例えば、放送テキストデータAと放送テキストデータCとが、放送日が同一であり、かつ、いずれも路線名タグ:P線、駅名タグ:▽▽駅、事象タグ:異音感知である場合には、4つの要素全てが共通している。このため、グループ化処理部22は、放送テキストデータCは放送テキストデータAと同一グループに属すると判断し、この放送テキストデータCに放送テキストデータAに付したものと同じ「20151005−0001」のグループIDを付与する。
また、放送テキストデータD、放送テキストデータEについても同様の判断を行い、放送テキストデータA〜Cと放送テキストデータDとが4つの要素のうち全部又は一部が一致しない場合には、グループ化処理部22は、放送テキストデータDは過去のいずれのグループにも属さないと判断し、この放送テキストデータDに放送テキストデータA〜Cに付した物とは異なる「20151005−0003」等のグループIDを付与する。また、放送テキストデータEの放送日、路線名、駅名、及び事象が放送テキストデータBと一致する場合には、グループ化処理部22は、放送テキストデータEは放送テキストデータBと同一グループに属すると判断し、この放送テキストデータEに放送テキストデータBに付したものと同じ「20151005−0002」のグループIDを付与する。
なお、放送日以外の「路線名タグ」、「駅名タグ」、及び「事象タグ」のいずれかについて対応する文字列がない場合(すなわち、路線名、駅名、事象のいずれかが放送テキストデータに含まれていない場合)には、3つの要素のうち2つが一致し、残り1つの要素が積極的に不一致でない場合(すなわち、対応する文字列がなくブランクである場合)であれば、同一グループとして同じグループIDを付与してもよい。
グループIDは、日付が変わるごと、又は各路線の始発が運行を開始するのに合わせてリセットされることが好ましい。
タグ付け処理部21によってタグを付与され、グループ化処理部22によってグループ分けされた(すなわち何らかのグループIDが付与された)放送テキストデータは、タグ付けされた文字列のデータとともに、加工後テキストDB25に格納される。
なお、本実施形態では、放送テキスト化装置1からテキストデータ加工装置2に送られる放送テキストデータには、当該テキストデータの元となった音声放送の放送時刻が付帯情報として付与されている。そこで、テキストデータ加工装置2では、この放送テキストデータに付帯している音声放送の放送時刻データも加工後の放送テキストデータに付帯させたまま加工後テキストDB25に記憶させる。
加工後テキストDB25に格納された加工後の放送テキストデータは、表示用データ配信装置3に送られる。
表示用データ配信装置3は、テキストデータ加工装置2によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信するサーバ装置(コンピュータ)である。
表示用データ配信装置3は、表示用データ生成部31、表示用データ配信部32、プログラム記憶部33、加工後テキストDB34、復旧見込みDB35、振替パターンDB36、及び外部装置等と接続されるI/F37等の機能部を備えており、これらはバス38により接続されている。
以下各機能部について説明する。
プログラム記憶部33は、コンピュータである表示用データ配信装置3において各機能部が各種処理を行うためのプログラムを格納する。
本実施形態では、表示用データ配信装置3が、テキストデータ加工装置2により加工された加工後の放送テキストデータを使用して、各種端末装置の表示部に表示させる表示画面を構成する表示用データを生成・配信するための表示用データ生成処理プログラム等がプログラム記憶部33に格納されている。
また、加工後テキストDB34は、テキストデータ加工装置2から送られた加工後のタグ付けされた文字列及び放送テキストデータ本文を記憶する記憶部である。
復旧見込みDB35は、事象ごとの過去の統計等に基づいて規定される、事象の発生から列車の運行状態が回復されるまでの平均的な時間のデータや、事象ごとのおよその復旧プロセスのデータ等、列車運行の復旧見込みに関する静的データが各事象と対応付けて記憶される記憶部である。
なお、事象の発生から列車の運行状態が回復されるまでの平均的な時間等については、事象例がある程度集まるごとに、データを集計し直して、新たなデータに書き換え、更新するようにしてもよい。本実施形態では、事象について事象タグを付与しているため、事象タグが付与されている文字列を分析して、同じ文字列(例えば異音感知等)のものを集めることにより、事象ごとの復旧までの所要時間のデータを容易に集めることができ、集計に用いることができる。
また、復旧プロセスについては、事象の発生から列車の運行状態が回復されるまでの一般的な処理過程をフローチャートのような形式で表したもののみでもよいし、処理過程における各プロセスに要する平均的な時間を過去の統計等から算出した参考所要時間の情報等を含むものであってもよい。
振替パターンDB36は、他路線への振替乗車のパターンを示す静的データを所定のパターン番号と対応付けて記憶する記憶部である。
振替乗車が行われる場合、事象や事象の発生場所に応じて、振替可能な路線や範囲(すなわち振替乗車の対象となる駅区間)が異なる。いかなる路線のどの範囲・区間において振替乗車が可能であるかは、それぞれパターン番号で管理されており、音声放送やこれをテキストデータ化した放送テキストデータ中では、振替パターンはパターン番号によって示されている。
振替パターンDB36には、こうした振替パターンのパターン番号と、各パターン番号に対応する具体的な振替可能路線の名称や振替乗車の対象となる駅区間等の振替可能範囲とを対応付けて記憶している。
表示用データ生成部31は、加工後テキストDB34に記憶されている加工後の放送テキストデータに基づいて、各種端末装置Tの表示部Gに表示させる表示画面を構成する表示用データを生成する。
また、表示用データ配信部32は、端末装置Tからの配信要求に応じて、表示用データ生成部31により生成された表示用データをネットワークNを介して対応する端末装置Tに配信するものである。
例えば、表示用データ生成部31は、端末装置Tの表示部Gに、加工後テキストDB34に時系列的に蓄積されていく放送テキストデータを、時系列順に一覧表示させる表示用データを生成する。この表示用データを表示用データが配信部32により端末装置Tに配信されることにより、放送テキストデータに対応する文章が時系列順に一覧表示された表示画面を表示部Gの表示画面上に表示させることができる。
また、表示部Gの表示画面上に一覧表示された中からユーザがいずれかの本文を選択操作すると、詳細表示画面g4(図3参照)の表示用データの配信要求が表示用データ配信装置3に送られ、当該表示用データが配信されると、表示部Gの表示画面が、例えば図3に示すように、ユーザが選択した本文の全文が表示された詳細表示画面g4に遷移するようになっている。
本実施形態の表示用データ生成部31は、テキストデータ加工装置2によるグループ分けに応じて放送テキストデータをソートした状態の表示用データを生成可能となっている。
具体的には、例えば図3に示すように、詳細表示画面g4には、「経過表示ボタン」64が設けられている。この経過表示ボタン64がタッチ操作されると、表示用データ生成部31によって、詳細表示画面g4に表示された放送テキストデータと同じグループに分類されている放送テキストデータ(すなわち、同じグループIDが付与されている放送テキストデータ)が抽出され、これらを1つの画面上に表示させる表示用データが生成される。
当該表示用データが端末装置Tに送られることにより、図4に示すように、詳細表示画面g4に表示された放送テキストデータとともに、これと同じグループに分類されている放送テキストデータが時系列順に一覧表示された経過表示欄66を有する経過表示画面g5が端末装置Tの表示画面に表示される。
また、本実施形態の表示用データ生成部31は、テキストデータ加工装置2によるタグ付けに応じて放送テキストデータをソートした状態の表示用データを生成可能に構成されていてもよい。
この場合、例えば、ユーザによって路線等が選択されると、表示用データ生成部31は、選択された路線に対応する路線名に路線名タグが対応付けられている放送テキストデータのみを抽出して、これを時系列的に羅列した表示画面を表示させる表示用データを生成し、これを端末装置Tに送信する。これにより、ユーザによって選択された路線名や駅名等を含む放送テキストデータが時系列順に一覧表示された表示画面を表示させることができる。
なお、放送テキストデータに基づく表示を行う場合、表示用データ生成部31は放送テキストデータの全文をそのまま表示させるのではなく、放送テキストデータのうち、タグが付与された重要な情報のみを表示させて、情報の要点を分かりやすく端的に示すようにしてもよい。
また、この場合、事象や状態については表現が統一されていた方が分かりやすい場合もあるため、放送テキストデータのままの類似文字列ではなく、当該類似文字列と対応付けられた確定ワードをもって表示させてもよい。
図5から図7を参照しつつ、本実施形態における文字化放送表示処理について説明する。
図5及び図6は、テキストデータ加工装置2のタグ付け処理部21が行うタグ付け処理を示すフローチャートである。
図5に示すように、タグ付け処理部21は、放送テキスト化装置1から放送テキストデータを取得すると(ステップS1)、当該放送テキストデータについて順次冒頭から各辞書データに登録されているものと合致する文字列があるか否かを検索する。
すなわち、例えばまず路線名辞書データ41に登録されている文字列と合致するものがあるか否かを検索する(ステップS2)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS2;YES)には、さらにそれが複数あるか否かを判断し(ステップS3)、複数ある場合(ステップS3;YES)には、最初に登場した文字列に路線名タグを付与し、それ以降に登場した文字列には関連路線名タグを付与する(ステップS4)。他方合致する文字列が1つしかない場合(ステップS3;NO)には、当該文字列に路線名タグを付与する(ステップS5)。なお、合致する文字列がない場合(ステップS2;NO)には、路線名タグをブランクとする(ステップS6)。
同様に、駅名辞書データ42に登録されている文字列と合致するものがあるか否かを検索する(ステップS7)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS7;YES)には、さらにそれが複数あるか否かを判断し(ステップS8)、複数ある場合(ステップS8;YES)には、最初に登場した文字列に駅名タグを付与し、それ以降に登場した文字列には関連駅名タグを付与する(ステップS9)。他方合致する文字列が1つしかない場合(ステップS8;NO)には、当該文字列に駅名タグを付与する(ステップS10)。なお、合致する文字列がない場合(ステップS7;NO)には、駅名タグをブランクとする(ステップS11)。
また、タグ付け処理部21は、次に事象辞書データ43に登録されている文字列と合致するものがあるか否かを検索する(ステップS12)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS12;YES)には、さらにそれが複数あるか否かを判断し(ステップS13)、複数ある場合(ステップS13;YES)には、事象辞書データ43において優先順位の最も高い文字列に事象タグを付与し、それ以外の文字列には関連事象タグを付与する(ステップS14)。他方合致する文字列が1つしかない場合(ステップS13;NO)には、当該文字列に事象タグを付与する(ステップS15)。
なお、放送テキストデータに含まれる文字列が事象辞書データ43において類似文字列の1つとして登録されている場合には、タグ付け処理部21は、当該文字列と、これに対応する確定ワードの両方に同じタグ(すなわち、事象タグ又は関連事象タグ)を付与する。
なお、合致する文字列がない場合(ステップS12;NO)には、事象タグをブランクとする(ステップS16)。
同様に、タグ付け処理部21は、状態辞書データ44に登録されている文字列と合致するものがあるか否かを検索する(ステップS17)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS17;YES)には、さらにそれが複数あるか否かを判断し(ステップS18)、複数ある場合(ステップS18;YES)には、状態辞書データ44において優先順位の最も高い文字列に状態タグを付与し、それ以外の文字列には関連状態タグを付与する(ステップS19)。他方合致する文字列が1つしかない場合(ステップS18;NO)には、当該文字列に状態タグを付与する(ステップS20)。
なお、放送テキストデータに含まれる文字列が状態辞書データ44において類似文字列の1つとして登録されている場合には、タグ付け処理部21は、当該文字列と、これに対応する確定ワードの両方に同じタグ(すなわち、状態タグ又は関連状態タグ)を付与する。
なお、合致する文字列がない場合(ステップS17;NO)には、状態タグをブランクとする(ステップS21)。
次に、図6に示すように、タグ付け処理部21は、方向辞書データ45に登録されている文字列と合致するものがあるか否かを検索する(ステップS22)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS22;YES)には、さらにそれが複数あるか否かを判断し(ステップS23)、複数ある場合(ステップS23;YES)には、最初に登場した文字列に方向タグを付与し、それ以降に登場した文字列には関連方向タグを付与する(ステップS24)。他方合致する文字列が1つしかない場合(ステップS23;NO)には、当該文字列に方向タグを付与する(ステップS25)。
なお、合致する文字列がない場合(ステップS22;NO)には、方向タグをブランクとする(ステップS26)。
また、タグ付け処理部21は、列車番号に該当する文字列があるか否かを判断する(ステップS27)。すなわち、数字とアルファベット1文字との組み合わせからなる文字列があるか否かを判断し、ある場合(ステップS27;YES)には、該当するすべての文字列に列車番号タグを付与する(ステップS28)。
なお、合致する文字列がない場合(ステップS27;NO)には、列車番号タグをブランクとする(ステップS29)。
さらに、タグ付け処理部21は、パターン番号に該当する文字列があるか否かを判断する(ステップS30)。すなわち、「パターン」等の文字と数字との組み合わせからなる文字列があるか否かを判断し、ある場合(ステップS30;YES)には、該当するすべての文字列にパターン番号タグを付与する(ステップS31)。
なお、合致する文字列がない場合(ステップS30;NO)には、パターン番号タグをブランクとする(ステップS32)。
また、タグ付け処理部21は、時刻に該当する文字列があるか否かを判断する(ステップS33)。すなわち、時刻を示す数字や「時」「分」等の文字からなる文字列があるか否かを判断し、ある場合(ステップS33;YES)には、該当するすべての文字列に時刻タグを付与する(ステップS34)。
なお、合致する文字列がない場合(ステップS33;NO)には、時刻タグをブランクとする(ステップS35)。
次に、図7を参照しつつ、テキストデータ加工装置2のグループ化処理部22が行うグループ化処理について説明する。
図7に示すように、グループ化処理部22は、タグ付けされた放送テキストデータを取得すると(ステップS41)、当該放送テキストデータについて、放送日の情報、及び路線名タグ、駅名タグ、事象タグがタグ付けされた文字列を抽出する(ステップS42)。
そして、既にグループ化処理が完了している放送テキストデータのうち、放送日、及び路線名タグ、駅名タグ、事象タグがタグ付けされた文字列が当該抽出された文字列と合致するものがあるか否かを判断する(ステップS43)。
過去のいずれの放送テキストデータも当該抽出された文字列やその放送日が合致しない場合や、未だ過去の放送テキストデータが存在しない場合(ステップS43;NO)には、グループ化処理部22は、当該放送テキストデータについて、新たなグループIDを付与する(ステップS44)。他方、当該抽出された文字列やその放送日がが過去のいずれかの放送テキストデータの放送日、路線名タグ、駅名タグ、事象タグがタグ付けされた文字列と合致する場合(ステップS43;YES)には、グループ化処理部22は、当該放送テキストデータについて、当該合致する放送テキストデータに付与されているグループIDと同一のグループIDを付与する(ステップS45)。
次に、表示用データ配信装置3が行う文字化放送表示処理について説明する。
表示用データ配信装置3は、端末装置Tからの表示用データ配信要求があると、これに応じて、表示用データ生成部31が表示用データを生成し、表示用データ配信部32からネットワークNを介して配信要求元の端末装置Tに当該表示用データを配信する。
これにより、端末装置Tの表示部Gの表示画面に当該表示用データに基づく画面が表示される。
例えば、端末装置Tにおいて、路線名を選択する操作がなされると、表示用データ生成部31は、加工後テキストDB34の中から、ユーザにより選択された路線名が路線名タグと対応付けされている放送テキストデータを抽出し、これを時系列順(又は設定によっては路線名の50音順プラス時系列順)にソート表示した表示画面を表示させるための表示用データを生成する。この表示用データが表示用データ配信部32からネットワークNを介して配信要求元の端末装置Tに配信されることにより、端末装置Tの表示部Gの表示画面に当該表示用データに基づく表示画面が表示される。
また、例えば、端末装置Tにおいて、ユーザがある放送テキストデータをタッチして選択する操作を行うと、表示用データ生成部31は、当該放送テキストデータの全文を表示させる詳細表示画面g4を表示させるための表示用データを生成する。この表示用データが配信要求元の端末装置Tに配信されることにより、端末装置Tの表示部Gの表示画面に当該表示用データに基づく詳細表示画面g4(図3参照)が表示される。
また、この詳細表示画面g4において、経過表示ボタン64がタッチ操作されると、表示用データ生成部31は、当該放送テキストデータと同一グループに分類されている全ての放送テキストデータ(すなわち、同一のグループIDが対応付けられている全放送テキストデータ)を加工後テキストDB34の中から抽出し、抽出した放送テキストデータの全文が表示される経過表示画面g5を表示させるための表示用データを生成する。この表示用データが配信要求元の端末装置Tに配信されることにより、端末装置Tの表示部Gの表示画面に当該表示用データに基づく経過表示画面g5(図4参照)が表示される。
以上のように、本実施形態によれば、放送テキストデータから所定の文字列を抽出し、抽出した文字列に当該文字列の分類指標となるタグを適宜付与し、このタグに基づいて、放送テキストデータをグループ分けする。
このため、放送テキストデータに含まれる文字列を当該文字列の性質に応じて適切に分類し、タグ付けして、このタグにしたがってグループ分けすることができるため、ユーザである社員が各自必要な情報を得ようとしたときに、所望の情報をひとまとまりのものとして抽出することが可能となる。これにより、社員が必要な情報を容易に端末装置T等で確認することができ、各種事象への対応、列車利用者への適切かつ迅速な案内・説明等を行うのに情報を役立てることができる。
また、列車の運行に関する音声放送では、同じ意味の言葉でも様々な異なる言い回しで表現されることがあるところ、辞書データは、同様の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードを対応付けており、類似文字列及び確定ワードについて同じタグが対応付けられる。
このため、同じ意味の言葉について各種の表現がされた場合でも適切にタグを対応付けることができる。これにより、音声放送における言い回しに関わらず、適切にタグ付け処理及びグループ分け処理を行うことができる。
また、1つの放送テキストデータ中に複数の確定ワードに対応する文字列がある場合、適切な確定ワードのタグが付されなければ、適切な情報抽出が困難となるところ、辞書データは、確定ワードに優先順位を設けており、タグ付け処理は、この優先順位にしたがって行われる。
このため、タグを付ける際によりユーザである社員のニーズに合った適切な文字列を選択することができ、ユーザである社員にとって有用な情報を適切に抽出することが可能となる。
また、グループ化処理部22は、タグの全部又は一部と対応付けられた類似文字列又は確定ワードが共通するものを同一グループとして放送テキストデータをグループ分けする。
このため、タグによって適切に放送テキストデータをグループ分けすることができる。
また、グループ化処理部22は、放送日、路線名タグ、駅名タグ、及び事象タグと対応付けられた類似文字列又は確定ワードが共通するものを同一グループとして放送テキストデータをグループ分けする。
放送日、路線名、駅名、及び事象が共通する場合には、同じ事象に関する一連の経過情報である可能性が高く、上記のように構成することで、適切に必要な情報をひとまとまりのものとして抽出することが可能となる。
そして、文字化放送表示システム100は、上記のようなタグ付け処理およびグループ化処理を行うテキストデータ加工装置2と、このテキストデータ加工装置2によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置3とを備えている。
このため、テキストデータ加工装置2において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員の有する端末装置T等に、社員にとって必要な情報を適切に表示させることができる。
また、表示用データ配信装置3は、テキストデータ加工装置2によるグループ分けに応じて放送テキストデータをソートした状態の表示用データを生成可能となっている。
このため、テキストデータ加工装置2において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報をひとまとまりのものとして適切に表示させることができる。
なお、以上本発明の実施形態について説明したが、本発明は、かかる実施形態に限定されず、その要旨を逸脱しない範囲で、種々変形が可能であることは言うまでもない。
例えば、本実施形態では、文字化放送表示プログラムが表示用データ配信装置3に備えられている例を示したが、文字化放送表示プログラムは表示用データ配信装置3に備えられている場合に限定されず、例えば、社員用の各端末装置Tにおいてダウンロードすることのできるアプリケーションプログラムとし、各端末装置T内のコンピュータと協働して文字化放送の表示処理を実現するものであってもよい。
また、本実施形態では、社員用の端末装置Tに文字化放送を表示させる場合を例としたが、例えば列車利用者の有する携帯電話機その他の各種端末装置や、駅構内や列車車両内等に設置されたモニタに、本実施形態で示したような表示画面を表示させるようにしてもよい。
2 テキストデータ加工装置
3 表示用データ配信装置
21 タグ付け処理部
22 グループ化処理部
24 辞書DB
25 加工後テキストDB
31 表示用データ生成部
32 表示用データ配信部
34 加工後テキストDB
35 復旧見込みDB
36 振替パターンDB
100 文字化放送表示システム
N ネットワーク
T 端末装置

Claims (7)

  1. 列車の運行に関わる音声放送のデータをテキストデータ化した放送テキストデータを取得してこの放送テキストデータを加工するテキストデータ加工装置であって、
    前記放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するタグ付け処理部と、
    前記文字列と前記タグとの対応関係を規定する辞書データを格納する辞書データベースと、
    前記タグ付け処理部により付与された前記タグに基づいて、前記放送テキストデータをグループ分けするグループ化処理部と、
    を備えており、
    前記辞書データは、
    同様の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードを対応付けており、
    前記類似文字列及び前記確定ワードについて同じタグを対応付けていることを特徴とするテキストデータ加工装置。
  2. 前記辞書データは、前記確定ワードに優先順位を設けており、
    前記タグ付け処理部は、1つの前記放送テキストデータ中に複数の前記確定ワードに対応する前記文字列がある場合には、前記確定ワードの前記優先順位にしたがって前記タグを付与することを特徴とする請求項に記載のテキストデータ加工装置。
  3. 前記グループ化処理部は、前記タグの全部又は一部と対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けすることを特徴とする請求項又は請求項に記載のテキストデータ加工装置。
  4. 前記タグは、列車の路線名を示す文字列に対応付けられる路線名タグ、駅名を示す文字列に対応付けられる駅名タグ、列車の運行に関わる事象を示す文字列に対応付けられる事象タグを含んでおり、
    前記グループ化処理部は、放送日、前記路線名タグ、前記駅名タグ、及び前記事象タグと対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けすることを特徴とする請求項から請求項のいずれか一項に記載のテキストデータ加工装置。
  5. 請求項1から請求項のいずれか一項に記載のテキストデータ加工装置と、
    前記テキストデータ加工装置によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置と、
    を備えていることを特徴とする文字化放送表示システム。
  6. 前記表示用データ配信装置は、前記テキストデータ加工装置によるグループ分けに応じて前記放送テキストデータをソートした状態の表示用データを生成可能に構成されていることを特徴とする請求項に記載の文字化放送表示システム。
  7. 請求項1から請求項のいずれか一項に記載のテキストデータ加工装置により加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信機能をコンピュータに実現させることを特徴とする文字化放送表示プログラム。
JP2015238205A 2015-12-07 2015-12-07 テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム Active JP6630139B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015238205A JP6630139B2 (ja) 2015-12-07 2015-12-07 テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015238205A JP6630139B2 (ja) 2015-12-07 2015-12-07 テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム

Publications (2)

Publication Number Publication Date
JP2017107261A JP2017107261A (ja) 2017-06-15
JP6630139B2 true JP6630139B2 (ja) 2020-01-15

Family

ID=59060738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015238205A Active JP6630139B2 (ja) 2015-12-07 2015-12-07 テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム

Country Status (1)

Country Link
JP (1) JP6630139B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7181043B2 (ja) * 2018-10-05 2022-11-30 株式会社日立ビルシステム 故障診断装置、故障診断方法、及び故障診断プログラム
JP7192874B2 (ja) * 2018-10-25 2022-12-20 日本電気株式会社 ナレッジ生成システム、方法およびプログラム
CN110442716B (zh) * 2019-08-05 2022-08-09 腾讯科技(深圳)有限公司 智能文本数据处理方法和装置、计算设备、存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4291191B2 (ja) * 2004-03-29 2009-07-08 財団法人鉄道総合技術研究所 列車復旧案内サーバ
JP4512549B2 (ja) * 2005-12-06 2010-07-28 財団法人鉄道総合技術研究所 放送内容送信システム
JP6971557B2 (ja) * 2015-06-24 2021-11-24 ヤマハ株式会社 管理装置およびプログラム
JP6160794B1 (ja) * 2015-10-15 2017-07-12 ヤマハ株式会社 情報管理システムおよび情報管理方法

Also Published As

Publication number Publication date
JP2017107261A (ja) 2017-06-15

Similar Documents

Publication Publication Date Title
JP5659122B2 (ja) 意思決定支援方法、およびシステム
JP6300961B2 (ja) リスク情報配信装置及びリスク情報配信方法
JP6094132B2 (ja) 災害情報管理装置、災害情報システム、災害情報の管理方法、および災害情報を管理するプログラム、ならびに、携帯端末、携帯端末の制御方法、および携帯端末の動作を制御する制御プログラム
US20180135992A1 (en) Information processing system, information processing method, information processing device, and information processing program
JP6630139B2 (ja) テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム
WO2020105478A1 (ja) 救急需要予測装置、救急需要予測方法およびプログラム
CN103605771A (zh) 一种智能化辅助决策和维护系统及其运行方法
Yazici et al. Incident detection through twitter: Organization versus personal accounts
CN105069665B (zh) 多渠道站外广告报表数据的排序展示方法及装置
JP2017201437A (ja) ニュース素材抽出装置及びプログラム
Power et al. Comparing web feeds and tweets for emergency management
JP2016081308A (ja) 集約情報提供システム
Yenkar et al. A novel ensemble approach based on MCC and MCDM methods for prioritizing tweets mentioning urban issues in smart city
US20210264315A1 (en) Selection assistance device, selection assistance method, data structure, learned model, and program
JP2017009361A (ja) 交通情報提供システム及び交通情報提供方法
JP6757654B2 (ja) 輸送サービス情報提供装置、及び輸送サービス情報提供方法
JP2015049813A (ja) 情報提供システム、プログラムおよび情報提供方法
JP5380358B2 (ja) 運行再開時刻予測方法及び装置
CN105303497A (zh) 基于云计算的护工查询系统及其使用方法
JP6496952B2 (ja) データ処理装置、データ処理システム、データ処理方法及びプログラム
JP2018106035A (ja) 地図整備装置、案内装置、制御方法、プログラム及び記憶媒体
JP5247343B2 (ja) 所要時間による施設情報検索方法
JP7175069B2 (ja) 異常時放送外国語化システム及び異常時放送外国語化プログラム
JP6306957B2 (ja) 列車情報取得プログラム、情報提供システム
JP7449192B2 (ja) ダイヤ情報管理システム、ダイヤ情報管理方法および運行案内システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191206

R150 Certificate of patent or registration of utility model

Ref document number: 6630139

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250