JP6630139B2 - テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム - Google Patents
テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム Download PDFInfo
- Publication number
- JP6630139B2 JP6630139B2 JP2015238205A JP2015238205A JP6630139B2 JP 6630139 B2 JP6630139 B2 JP 6630139B2 JP 2015238205 A JP2015238205 A JP 2015238205A JP 2015238205 A JP2015238205 A JP 2015238205A JP 6630139 B2 JP6630139 B2 JP 6630139B2
- Authority
- JP
- Japan
- Prior art keywords
- text data
- broadcast
- tag
- character string
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 122
- 238000000034 method Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 31
- 239000000284 extract Substances 0.000 claims description 7
- 238000005315 distribution function Methods 0.000 claims description 2
- 238000012546 transfer Methods 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 8
- 238000007689 inspection Methods 0.000 description 8
- 238000011084 recovery Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000012805 post-processing Methods 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
しかし、輸送指令員の下に集約された情報が音声によって伝えられるのみでは、提供された時点で聞き逃してしまうと社員が当該情報を得られない可能性がある。また、聞き手である社員が内容を聞き間違える等により情報の正確性を欠いてしまうおそれもある。
このため、輸送指令員の下に集約された情報を文字情報として社員向けに配信することが望ましい。
また、特許文献1には、列車の遅延情報等の交通に関する情報を文字情報として辞書登録することが提案されている。
この点、単に文字情報(テキストデータ)を蓄積していくのみでは、所望の情報のみを適切に抽出することができず、効率のよい情報確認ができないという問題がある。
列車の運行に関わる音声放送のデータをテキストデータ化した放送テキストデータを取得してこの放送テキストデータを加工するテキストデータ加工装置であって、
前記放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するタグ付け処理部と、
前記文字列と前記タグとの対応関係を規定する辞書データを格納する辞書データベースと、
前記タグ付け処理部により付与された前記タグに基づいて、前記放送テキストデータをグループ分けするグループ化処理部と、
を備えており、
前記辞書データは、
同様の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードを対応付けており、
前記類似文字列及び前記確定ワードについて同じタグを対応付けている。
このように構成することで、放送テキストデータに含まれる文字列をその性質に応じて適切に分類し、タグ付けして、このタグにしたがってグループ分けすることができるため、ユーザである社員が各自必要な情報を得ようとしたときに、所望の情報をひとまとまりのものとして抽出することが可能となり、膨大な情報の中から知りたい情報を容易に確認することができる。
また、列車の運行に関する音声放送では、同じ意味の言葉でも様々な異なる言い回しで表現されることがあるが、上記のように構成することで、同じ意味の言葉について各種の表現がされた場合でも適切にタグを対応付けることができる。
前記タグ付け処理部は、1つの前記放送テキストデータ中に複数の前記確定ワードに対応する前記文字列がある場合には、前記確定ワードの前記優先順位にしたがって前記タグを付与する。
このように構成することで、タグを付ける際に、よりユーザである社員のニーズに合った適切な文字列を選択することができ、ユーザである社員にとって有用な情報を適切に抽出することが可能となる。
このように構成することで、タグによって適切に放送テキストデータをグループ分けすることができる。
前記グループ化処理部は、放送日、前記路線名タグ、前記駅名タグ、及び前記事象タグと対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けする。
放送日、路線名、駅名、及び事象が共通する場合には、同じ事象に関する経過情報である可能性が高く、上記のように構成することで、適切に必要な情報をひとまとまりのものとして抽出することが可能となる。
上記のように構成された前記テキストデータ加工装置と、
前記テキストデータ加工装置によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置と、
を備えるようにする。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報を適切に表示させることができる。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報をひとまとまりのものとして適切に表示させることができる。
前述したように前記テキストデータ加工装置により加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信機能をコンピュータに実現させる。
このように構成することで、テキストデータ加工装置において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報を適切に表示させることが可能となる。
図1に示すように、文字化放送表示システム100は、放送テキスト化装置1によってテキストデータ化された放送情報(これを以下「放送テキストデータ」という。)を加工するテキストデータ加工装置2と、テキストデータ加工装置2によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、これを配信する表示用データ配信装置3とを備えている。
文字化放送表示システム100には、ネットワークN等を介して端末装置Tが接続されており、表示用データ配信装置3は、生成した表示用データをネットワークN等を介して適宜端末装置Tに提供するようになっている。
端末装置Tは、例えば列車の運行に関わる社員(例えば駅構内に配置されて列車利用者の対応にあたる駅社員等)が使用している携帯可能な端末装置であって、液晶パネルや有機ELディスプレイ等で構成される表示部Gを備えており、表示用データ配信装置3から提供される情報に基づいて表示を行う。端末装置Tは例えばタブレット型の端末装置でもよいし、携帯電話機等であってもよい。
列車の運行に関わる何らかの事象が発生すると、当該事象の発生場所や発生時刻、現時点での状態等の情報が輸送指令室に無線等により報告される。事象の発生が報告されると、輸送指令室では、輸送指令員が、この情報を無線等により社員(例えば駅構内に配置されて列車利用者の対応にあたる駅社員等)に音声放送として音声で伝える。
ここで「事象」とは、事故やトラブルの発生、車両の点検等、列車の見合わせや遅延等を引き起こす原因となる事柄の総称である。
また、「状態」とは、運転見合わせや運転再開、列車の運行遅延等、列車の運行状況である。
なお、放送テキスト化処理部11が音声データをテキストデータに自動変換する手法は特に限定されず、既存の手法を用いることができる。
放送テキスト化装置1によってテキストデータ化された放送情報(放送テキストデータ)は、テキストデータ加工装置2に送信される。
テキストデータ加工装置2は、タグ付け処理部21、グループ化処理部22、プログラム記憶部23、辞書DB24、加工後テキストDB25、及び外部装置等と接続されるI/F27等の機能部を備えており、これらはバス28により接続されている。
以下各機能部について説明する。
本実施形態では、タグ付け処理部21において放送テキストデータから抽出した文字列にタグを付与するタグ付け処理を行うためのタグ付け処理プログラム、グループ化処理部22において放送テキストデータをグループ分けするグループ化処理を行うためのグループ化処理プログラム等がプログラム記憶部23に格納されている。
また、加工後テキストDB25は、タグ付け処理部21及びグループ化処理部22によって加工処理が施された加工後のタグ付けされた文字列及び放送テキストデータの本文を記憶するものである。
本実施形態では、図1に示すように、路線名辞書データ41、駅名辞書データ42、事象辞書データ43、状態辞書データ44、方向辞書データ45が辞書DB24に格納されている。
なお、辞書DB24に格納される辞書データはここに例示したものに限定されない。これらのうちの一部のみであってもよいし、これら以外の辞書データを含んでいてもよい。例えば、辞書DB24に格納される辞書データは、図1に図示した以外に、放送テキストデータから時刻情報を読み取るための時刻辞書データ、列車番号を読み取るための列車番号辞書データ、振り替え輸送手配に使用するパターン番号を読み取るためのパターン番号辞書データ等を含んでいてもよい。
また、例えば駅名辞書データ42は、音声放送において読み上げられることが想定されるすべての駅の駅名を示す文字列を、当該文字列の分類指標となるタグ(この場合には「駅名タグ」)と対応付けて記憶している。
事象辞書データ43は、事故やトラブルの発生等、列車の運転見合わせや遅延等を引き起こす原因として想定される事柄を示す文字列を、当該文字列の分類指標となるタグ(この場合には「事象タグ」)と対応付けて記憶するものである。
状態辞書データ44は、運転見合わせや運転再開、列車の運行遅延等、上記事象によって引き起こされる列車の運行状況を示す文字列を、当該文字列の分類指標となるタグ(この場合には「状態タグ」)と対応付けて記憶するものである。
また、方向辞書データ45にいう「方向」とは、例えば列車の上り・下り等の走行方向を意味しており、方向辞書データ45は、こうした列車の走行方向を示す文字列を、当該文字列の分類指標となるタグ(この場合には「方向タグ」)と対応付けて記憶するものである。
このため、辞書データは、同様の意味を有し言い回しの異なる複数の文字列である類似文字列(類似ワード)について1つの確定ワードを対応付けており、これらの類似文字列及び確定ワードについて同じタグを対応付けている。
例えば、車両に何らかの問題が発生した場合、放送テキストデータ上の文言としては「車両不具合」「車両故障」といった言い回しが想定される。
この点、本実施形態の事象辞書データ43では、図2に示すように、これらの類似ワードに対して、「車両故障(車両点検)」が確定ワードとして対応付けられ、いずれの場合も事象タグが付与される。
また、「自動車」、「踏切」等、それぞれ単独では列車の運行に影響を及ぼす「事象」とは認められない文字列であっても、それらが組み合わされることで何らかの「事象」を意味することがある。
このため、辞書データでは、複数の文字列の組み合わせが所定の組み合わせである場合には、その組み合わせから導かれる「事象」を意味する確定ワードと対応付けており、複数の文字列の組み合わせによる検索にも対応できるようにしている。
なお、ここでは、図2に示す事象辞書データ43を例として説明したが、複数の類似ワードを1つの確定ワードと対応付ける点や、複数の文字列の組み合わせを1つの確定ワードと組み合わせる点は、状態辞書データ44等、他の辞書でも同様である。
後述するように、タグ付け処理部21は、1つの放送テキストデータ中に複数の確定ワードに対応する文字列がある場合には、確定ワードの優先順位にしたがってタグを付与するようになっている。
このため、辞書データでは、情報としての重要度の高いものほど確定ワードの優先順位が高くなるように規定されている。
このため、事象辞書データ43においては、例えば「車両故障(車両点検)」よりも「パンタグラフ支障(車両点検)」や「ブレーキ不具合(車両点検)」の方が優先順位が高いというように、より具体的で細かい情報ほど優先順位が高くなるようになっている。
なお、包括的・一般的な文言についてもタグを付与することができるように包括的・一般的な表現も辞書データに記憶させておくことにより、放送テキストデータに含まれる情報を漏れなく拾って分類することができる。また、音声放送では、何らかの事情がある場合や、ごく稀な事象であって具体的な表現が難しいケース等において、あえて具体的な表現を避けて放送を行うことがあるが、包括的・一般的な文言についてもタグを付与することで、このような放送がされた場合でも放送テキストデータに含まれる情報を適切に分類することができる。
また例えば、事象辞書データ43においては、列車の運行に乱れを生じた原因として直接的な事象ほど情報としての重要度が高いため、上位とすることが好ましい。
このため、事象の確定ワードの優先順位は、事象としてより直接的で重要度の高いものほど順位が高く、間接的で重要度の低いものほど順位が低くなっている。
また例えば、何らかの事故が発生したり、異音を感知して列車の運転が見合わされた場合には、運行再開までのプロセスとして、「車両点検」が含まれることがある。
この場合には、運転見合わせの原因となった事象が優先され、プロセスの1つである「車両点検」の優先順位が最も低くなるように優先順位が設定されている。
また、例えば「動物との接触」や「支障物との接触」によって「異音感知」された場合のように、ある事象が生じた場合に、その具体的な原因が放送テキストデータ内において判明している場合もある。この場合には、具体的な原因を示す文字列(例えば「動物との接触」や「支障物との接触」)が優先されるように、一般的な事象を示す文字列(例えば「異音感知」)の優先順位は低く設定されている。
なお、ここでは、図2に示す事象辞書データ43を例として説明したが、文字列や確定ワードに優先順位を付すことは事象辞書データ43に限定されず、状態辞書データ44等、他の辞書でも同様である。
タグとは、文字列の性質や種類を示し分類の際の指標となるものである。
本実施形態では、タグ付け処理部21は、タグとして「路線名タグ」、「関連路線名タグ」、「状態タグ」、「関連状態タグ」、「事象タグ」、「関連事象タグ」、「駅名タグ」、「関連駅名タグ」、「列車番号タグ」「方向タグ」「パターン番号タグ」、「時刻タグ」をそれぞれ対応する文字列に付与する。
ここで、「路線名タグ」、「事象タグ」、「駅名タグ」とは、一つの放送テキストデータ中、主たる路線名、事象、駅名(すなわち、後述する優先順位の高い路線名等や文中最初に登場する路線名等)に付与されるタグであり、「関連路線名タグ」、「関連事象タグ」、「関連駅名タグ」とは、一つの放送テキストデータ中に複数の路線名、事象、駅名が含まれている場合に、主たる路線名、事象、駅名以外のものに付与されるタグである。
なお、タグとしてどのような項目を用意するかはここに例示したものに限定されない。さらに多くの項目をタグとして拾ってもよいし、タグを付与する要素をこの例よりも少なくしてもよい。
辞書データを用いてタグ付けを行う場合、タグ付け処理部21は、まず1つ目の辞書データ(例えば、路線名辞書データ41)を参照しつつ、放送テキストデータ中に路線名辞書データ41に登録されている文字列があるか否かを文頭から順次検索する。
そして、路線名辞書データ41に登録されている文字列があった場合には、これに路線名タグを付与する。
放送テキストデータの末尾まで検索が完了したら、同様に、次の辞書データ(例えば、駅名辞書データ42)を参照しつつ、放送テキストデータ中に駅名辞書データ42に登録されている文字列があるか否かを文頭から順次検索する。
そして、駅名辞書データ42に登録されている文字列があった場合には、これに駅名タグを付与する。
タグ付け処理部21は、同様に、順次すべての辞書データについて、検索を行い、適宜タグ付け処理を行う。
また、例えば事象辞書データ43においては、列車の運行に乱れを生じた原因として直接的で重要度の高いものほど優先順位が高く、間接的で重要度の低いものほど優先順位が低くなっている。
また、例えば事象辞書データ43においては、列車の運行状態に乱れを生じた原因である事象と、この原因解消のためのプロセスを構成する事象とでは、「異音感知」等の原因となった事象が優先され、プロセスの1つである「車両点検」等の優先順位は低く設定されている。
また、ある事象が生じた場合に、その具体的な原因が放送テキストデータ内において判明している場合には、具体的な原因を示す文字列が優先され、一般的な事象を示す文字列の優先順位は低く設定されている。
また、例えば状態辞書データ44においては、事象の発生から復旧に向かうプロセスにおいて、より現時点に近いもの、すなわち復旧プロセスの進んでいる(復旧に近い)方の優先順位が高く設定される。
例えば、1つの放送テキストデータ中に複数の路線名が含まれている場合に、路線名辞書データ41中に特に優先順位の規定がされていない場合には、放送テキストデータ中最初に登場した路線名に主たる路線名に付される「路線名タグ」を付与し、その他の路線名には従たる路線名に付される「関連路線名タグ」を付与するというように、文中の登場順をもって優先順位とする。
また、本実施形態では「列車番号」、「パターン番号」、「時刻」については特に辞書を用意しておらず、優先順位の規定もない。このため、1つの放送テキストデータ中に「列車番号」、「パターン番号」、「時刻」に該当する文字列が複数ある場合には、タグ付け処理部21は、「列車番号」に該当するすべての文字列に「列車番号タグ」を付与し、「パターン番号」に該当するすべての文字列に「パターン番号タグ」を付与し、「時刻」に該当するすべての文字列に「時刻タグ」を付与する。
なお、上記例の放送テキストデータの場合、「パターン番号」及び「列車番号」に該当すべき文字列がないため、パターン番号タグ及び列車番号タグについてはブランクとなる。
グループ化処理部22は、放送テキストデータに付与された各種タグの全部又は一部と対応付けられた文字列が共通するものを同一グループとして当該放送テキストデータをグループ分けする。
文字化された音声放送のデータである放送テキストデータを現場の社員が確認する場合、社員が自らの業務に関わりのある事象に関する情報に絞って復旧に向けた経過を効率的にチェックできることが好ましい。
グループ化処理部22によるグループ化処理は、このような要望に応えるために、路線や事象に関わりなく時系列的に蓄積されていく情報(放送テキストデータ)の中から、確認したい事象に関するものを抽出して表示させることができるようにするものである。
本実施形態では、前述のように、タグは、列車の路線名を示す文字列に対応付けられる「路線名タグ」、駅名を示す文字列に対応付けられる「駅名タグ」、列車の運行に関わる事象を示す文字列に対応付けられる「事象タグ」を含んでいる。また、各放送テキストデータには、当該音声放送がなされた放送日が情報として含まれている。グループ化処理部22は、「放送日」が同じであって、かつ「路線名タグ」、「駅名タグ」、及び「事象タグ」と対応付けられた文字列が共通するものを同一グループとして放送テキストデータをグループ分けする。
以下、グループ化処理部22によるグループ分けについて具体的に説明する。
そして、3つのタグに対応する文字列、及び「放送日」が共通すると判断する場合には、比較対象となった過去の放送テキストデータと同一グループのものと判断して、当該過去の放送テキストデータと同じグループIDを付与する。
また、3つのタグに対応する文字列が共通しないと判断する場合には、当該放送テキストデータに新たなグループIDを付与する。
なお、「放送日」における日付は、午前0時を基準とするのではなく、例えば、列車がその日の運行を終了するとき(すなわちその日の最終列車の運行終了時)等、ある一定の時刻までは、同一の放送日として処理される。
そして、次に放送テキストデータBが送られると、グループ化処理部22は、放送テキストデータAにおいて、放送日の他に、路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象と放送テキストデータBにおいて路線名タグ、駅名タグ、及び事象タグが付与されている路線名、駅名、及び事象とを比較し、これら4つの要素が一致するか否かを判断する。そして、放送テキストデータBと放送テキストデータAとで、4つの要素の全部又は一部が不一致である場合には、グループ化処理部22は、放送テキストデータBは過去のいずれのグループにも属さないと判断し、この放送テキストデータBに放送テキストデータAに付したものとは異なる「20151005−0002」等のグループIDを付与する。
例えば、放送テキストデータAと放送テキストデータCとが、放送日が同一であり、かつ、いずれも路線名タグ:P線、駅名タグ:▽▽駅、事象タグ:異音感知である場合には、4つの要素全てが共通している。このため、グループ化処理部22は、放送テキストデータCは放送テキストデータAと同一グループに属すると判断し、この放送テキストデータCに放送テキストデータAに付したものと同じ「20151005−0001」のグループIDを付与する。
また、放送テキストデータD、放送テキストデータEについても同様の判断を行い、放送テキストデータA〜Cと放送テキストデータDとが4つの要素のうち全部又は一部が一致しない場合には、グループ化処理部22は、放送テキストデータDは過去のいずれのグループにも属さないと判断し、この放送テキストデータDに放送テキストデータA〜Cに付した物とは異なる「20151005−0003」等のグループIDを付与する。また、放送テキストデータEの放送日、路線名、駅名、及び事象が放送テキストデータBと一致する場合には、グループ化処理部22は、放送テキストデータEは放送テキストデータBと同一グループに属すると判断し、この放送テキストデータEに放送テキストデータBに付したものと同じ「20151005−0002」のグループIDを付与する。
タグ付け処理部21によってタグを付与され、グループ化処理部22によってグループ分けされた(すなわち何らかのグループIDが付与された)放送テキストデータは、タグ付けされた文字列のデータとともに、加工後テキストDB25に格納される。
なお、本実施形態では、放送テキスト化装置1からテキストデータ加工装置2に送られる放送テキストデータには、当該テキストデータの元となった音声放送の放送時刻が付帯情報として付与されている。そこで、テキストデータ加工装置2では、この放送テキストデータに付帯している音声放送の放送時刻データも加工後の放送テキストデータに付帯させたまま加工後テキストDB25に記憶させる。
加工後テキストDB25に格納された加工後の放送テキストデータは、表示用データ配信装置3に送られる。
表示用データ配信装置3は、表示用データ生成部31、表示用データ配信部32、プログラム記憶部33、加工後テキストDB34、復旧見込みDB35、振替パターンDB36、及び外部装置等と接続されるI/F37等の機能部を備えており、これらはバス38により接続されている。
以下各機能部について説明する。
本実施形態では、表示用データ配信装置3が、テキストデータ加工装置2により加工された加工後の放送テキストデータを使用して、各種端末装置の表示部に表示させる表示画面を構成する表示用データを生成・配信するための表示用データ生成処理プログラム等がプログラム記憶部33に格納されている。
また、加工後テキストDB34は、テキストデータ加工装置2から送られた加工後のタグ付けされた文字列及び放送テキストデータ本文を記憶する記憶部である。
なお、事象の発生から列車の運行状態が回復されるまでの平均的な時間等については、事象例がある程度集まるごとに、データを集計し直して、新たなデータに書き換え、更新するようにしてもよい。本実施形態では、事象について事象タグを付与しているため、事象タグが付与されている文字列を分析して、同じ文字列(例えば異音感知等)のものを集めることにより、事象ごとの復旧までの所要時間のデータを容易に集めることができ、集計に用いることができる。
また、復旧プロセスについては、事象の発生から列車の運行状態が回復されるまでの一般的な処理過程をフローチャートのような形式で表したもののみでもよいし、処理過程における各プロセスに要する平均的な時間を過去の統計等から算出した参考所要時間の情報等を含むものであってもよい。
振替乗車が行われる場合、事象や事象の発生場所に応じて、振替可能な路線や範囲(すなわち振替乗車の対象となる駅区間)が異なる。いかなる路線のどの範囲・区間において振替乗車が可能であるかは、それぞれパターン番号で管理されており、音声放送やこれをテキストデータ化した放送テキストデータ中では、振替パターンはパターン番号によって示されている。
振替パターンDB36には、こうした振替パターンのパターン番号と、各パターン番号に対応する具体的な振替可能路線の名称や振替乗車の対象となる駅区間等の振替可能範囲とを対応付けて記憶している。
また、表示用データ配信部32は、端末装置Tからの配信要求に応じて、表示用データ生成部31により生成された表示用データをネットワークNを介して対応する端末装置Tに配信するものである。
また、表示部Gの表示画面上に一覧表示された中からユーザがいずれかの本文を選択操作すると、詳細表示画面g4(図3参照)の表示用データの配信要求が表示用データ配信装置3に送られ、当該表示用データが配信されると、表示部Gの表示画面が、例えば図3に示すように、ユーザが選択した本文の全文が表示された詳細表示画面g4に遷移するようになっている。
具体的には、例えば図3に示すように、詳細表示画面g4には、「経過表示ボタン」64が設けられている。この経過表示ボタン64がタッチ操作されると、表示用データ生成部31によって、詳細表示画面g4に表示された放送テキストデータと同じグループに分類されている放送テキストデータ(すなわち、同じグループIDが付与されている放送テキストデータ)が抽出され、これらを1つの画面上に表示させる表示用データが生成される。
当該表示用データが端末装置Tに送られることにより、図4に示すように、詳細表示画面g4に表示された放送テキストデータとともに、これと同じグループに分類されている放送テキストデータが時系列順に一覧表示された経過表示欄66を有する経過表示画面g5が端末装置Tの表示画面に表示される。
この場合、例えば、ユーザによって路線等が選択されると、表示用データ生成部31は、選択された路線に対応する路線名に路線名タグが対応付けられている放送テキストデータのみを抽出して、これを時系列的に羅列した表示画面を表示させる表示用データを生成し、これを端末装置Tに送信する。これにより、ユーザによって選択された路線名や駅名等を含む放送テキストデータが時系列順に一覧表示された表示画面を表示させることができる。
なお、放送テキストデータに基づく表示を行う場合、表示用データ生成部31は放送テキストデータの全文をそのまま表示させるのではなく、放送テキストデータのうち、タグが付与された重要な情報のみを表示させて、情報の要点を分かりやすく端的に示すようにしてもよい。
また、この場合、事象や状態については表現が統一されていた方が分かりやすい場合もあるため、放送テキストデータのままの類似文字列ではなく、当該類似文字列と対応付けられた確定ワードをもって表示させてもよい。
図5及び図6は、テキストデータ加工装置2のタグ付け処理部21が行うタグ付け処理を示すフローチャートである。
図5に示すように、タグ付け処理部21は、放送テキスト化装置1から放送テキストデータを取得すると(ステップS1)、当該放送テキストデータについて順次冒頭から各辞書データに登録されているものと合致する文字列があるか否かを検索する。
すなわち、例えばまず路線名辞書データ41に登録されている文字列と合致するものがあるか否かを検索する(ステップS2)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS2;YES)には、さらにそれが複数あるか否かを判断し(ステップS3)、複数ある場合(ステップS3;YES)には、最初に登場した文字列に路線名タグを付与し、それ以降に登場した文字列には関連路線名タグを付与する(ステップS4)。他方合致する文字列が1つしかない場合(ステップS3;NO)には、当該文字列に路線名タグを付与する(ステップS5)。なお、合致する文字列がない場合(ステップS2;NO)には、路線名タグをブランクとする(ステップS6)。
同様に、駅名辞書データ42に登録されている文字列と合致するものがあるか否かを検索する(ステップS7)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(ステップS7;YES)には、さらにそれが複数あるか否かを判断し(ステップS8)、複数ある場合(ステップS8;YES)には、最初に登場した文字列に駅名タグを付与し、それ以降に登場した文字列には関連駅名タグを付与する(ステップS9)。他方合致する文字列が1つしかない場合(ステップS8;NO)には、当該文字列に駅名タグを付与する(ステップS10)。なお、合致する文字列がない場合(ステップS7;NO)には、駅名タグをブランクとする(ステップS11)。
なお、放送テキストデータに含まれる文字列が事象辞書データ43において類似文字列の1つとして登録されている場合には、タグ付け処理部21は、当該文字列と、これに対応する確定ワードの両方に同じタグ(すなわち、事象タグ又は関連事象タグ)を付与する。
なお、合致する文字列がない場合(ステップS12;NO)には、事象タグをブランクとする(ステップS16)。
なお、放送テキストデータに含まれる文字列が状態辞書データ44において類似文字列の1つとして登録されている場合には、タグ付け処理部21は、当該文字列と、これに対応する確定ワードの両方に同じタグ(すなわち、状態タグ又は関連状態タグ)を付与する。
なお、合致する文字列がない場合(ステップS17;NO)には、状態タグをブランクとする(ステップS21)。
なお、合致する文字列がない場合(ステップS22;NO)には、方向タグをブランクとする(ステップS26)。
なお、合致する文字列がない場合(ステップS27;NO)には、列車番号タグをブランクとする(ステップS29)。
さらに、タグ付け処理部21は、パターン番号に該当する文字列があるか否かを判断する(ステップS30)。すなわち、「パターン」等の文字と数字との組み合わせからなる文字列があるか否かを判断し、ある場合(ステップS30;YES)には、該当するすべての文字列にパターン番号タグを付与する(ステップS31)。
なお、合致する文字列がない場合(ステップS30;NO)には、パターン番号タグをブランクとする(ステップS32)。
また、タグ付け処理部21は、時刻に該当する文字列があるか否かを判断する(ステップS33)。すなわち、時刻を示す数字や「時」「分」等の文字からなる文字列があるか否かを判断し、ある場合(ステップS33;YES)には、該当するすべての文字列に時刻タグを付与する(ステップS34)。
なお、合致する文字列がない場合(ステップS33;NO)には、時刻タグをブランクとする(ステップS35)。
図7に示すように、グループ化処理部22は、タグ付けされた放送テキストデータを取得すると(ステップS41)、当該放送テキストデータについて、放送日の情報、及び路線名タグ、駅名タグ、事象タグがタグ付けされた文字列を抽出する(ステップS42)。
そして、既にグループ化処理が完了している放送テキストデータのうち、放送日、及び路線名タグ、駅名タグ、事象タグがタグ付けされた文字列が当該抽出された文字列と合致するものがあるか否かを判断する(ステップS43)。
過去のいずれの放送テキストデータも当該抽出された文字列やその放送日が合致しない場合や、未だ過去の放送テキストデータが存在しない場合(ステップS43;NO)には、グループ化処理部22は、当該放送テキストデータについて、新たなグループIDを付与する(ステップS44)。他方、当該抽出された文字列やその放送日がが過去のいずれかの放送テキストデータの放送日、路線名タグ、駅名タグ、事象タグがタグ付けされた文字列と合致する場合(ステップS43;YES)には、グループ化処理部22は、当該放送テキストデータについて、当該合致する放送テキストデータに付与されているグループIDと同一のグループIDを付与する(ステップS45)。
表示用データ配信装置3は、端末装置Tからの表示用データ配信要求があると、これに応じて、表示用データ生成部31が表示用データを生成し、表示用データ配信部32からネットワークNを介して配信要求元の端末装置Tに当該表示用データを配信する。
これにより、端末装置Tの表示部Gの表示画面に当該表示用データに基づく画面が表示される。
また、この詳細表示画面g4において、経過表示ボタン64がタッチ操作されると、表示用データ生成部31は、当該放送テキストデータと同一グループに分類されている全ての放送テキストデータ(すなわち、同一のグループIDが対応付けられている全放送テキストデータ)を加工後テキストDB34の中から抽出し、抽出した放送テキストデータの全文が表示される経過表示画面g5を表示させるための表示用データを生成する。この表示用データが配信要求元の端末装置Tに配信されることにより、端末装置Tの表示部Gの表示画面に当該表示用データに基づく経過表示画面g5(図4参照)が表示される。
このため、放送テキストデータに含まれる文字列を当該文字列の性質に応じて適切に分類し、タグ付けして、このタグにしたがってグループ分けすることができるため、ユーザである社員が各自必要な情報を得ようとしたときに、所望の情報をひとまとまりのものとして抽出することが可能となる。これにより、社員が必要な情報を容易に端末装置T等で確認することができ、各種事象への対応、列車利用者への適切かつ迅速な案内・説明等を行うのに情報を役立てることができる。
このため、同じ意味の言葉について各種の表現がされた場合でも適切にタグを対応付けることができる。これにより、音声放送における言い回しに関わらず、適切にタグ付け処理及びグループ分け処理を行うことができる。
このため、タグを付ける際によりユーザである社員のニーズに合った適切な文字列を選択することができ、ユーザである社員にとって有用な情報を適切に抽出することが可能となる。
このため、タグによって適切に放送テキストデータをグループ分けすることができる。
放送日、路線名、駅名、及び事象が共通する場合には、同じ事象に関する一連の経過情報である可能性が高く、上記のように構成することで、適切に必要な情報をひとまとまりのものとして抽出することが可能となる。
このため、テキストデータ加工装置2において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員の有する端末装置T等に、社員にとって必要な情報を適切に表示させることができる。
このため、テキストデータ加工装置2において適切にグループ分けされた放送テキストデータによって表示用データを生成することができ、社員に必要な情報をひとまとまりのものとして適切に表示させることができる。
3 表示用データ配信装置
21 タグ付け処理部
22 グループ化処理部
24 辞書DB
25 加工後テキストDB
31 表示用データ生成部
32 表示用データ配信部
34 加工後テキストDB
35 復旧見込みDB
36 振替パターンDB
100 文字化放送表示システム
N ネットワーク
T 端末装置
Claims (7)
- 列車の運行に関わる音声放送のデータをテキストデータ化した放送テキストデータを取得してこの放送テキストデータを加工するテキストデータ加工装置であって、
前記放送テキストデータから所定の文字列を抽出し、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与するタグ付け処理部と、
前記文字列と前記タグとの対応関係を規定する辞書データを格納する辞書データベースと、
前記タグ付け処理部により付与された前記タグに基づいて、前記放送テキストデータをグループ分けするグループ化処理部と、
を備えており、
前記辞書データは、
同様の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードを対応付けており、
前記類似文字列及び前記確定ワードについて同じタグを対応付けていることを特徴とするテキストデータ加工装置。 - 前記辞書データは、前記確定ワードに優先順位を設けており、
前記タグ付け処理部は、1つの前記放送テキストデータ中に複数の前記確定ワードに対応する前記文字列がある場合には、前記確定ワードの前記優先順位にしたがって前記タグを付与することを特徴とする請求項1に記載のテキストデータ加工装置。 - 前記グループ化処理部は、前記タグの全部又は一部と対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けすることを特徴とする請求項1又は請求項2に記載のテキストデータ加工装置。
- 前記タグは、列車の路線名を示す文字列に対応付けられる路線名タグ、駅名を示す文字列に対応付けられる駅名タグ、列車の運行に関わる事象を示す文字列に対応付けられる事象タグを含んでおり、
前記グループ化処理部は、放送日、前記路線名タグ、前記駅名タグ、及び前記事象タグと対応付けられた前記類似文字列又は前記確定ワードが共通するものを同一グループとして前記放送テキストデータをグループ分けすることを特徴とする請求項1から請求項3のいずれか一項に記載のテキストデータ加工装置。 - 請求項1から請求項4のいずれか一項に記載のテキストデータ加工装置と、
前記テキストデータ加工装置によって加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信装置と、
を備えていることを特徴とする文字化放送表示システム。 - 前記表示用データ配信装置は、前記テキストデータ加工装置によるグループ分けに応じて前記放送テキストデータをソートした状態の表示用データを生成可能に構成されていることを特徴とする請求項5に記載の文字化放送表示システム。
- 請求項1から請求項4のいずれか一項に記載のテキストデータ加工装置により加工された加工後の放送テキストデータに基づいて表示用データを生成し、配信する表示用データ配信機能をコンピュータに実現させることを特徴とする文字化放送表示プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015238205A JP6630139B2 (ja) | 2015-12-07 | 2015-12-07 | テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015238205A JP6630139B2 (ja) | 2015-12-07 | 2015-12-07 | テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017107261A JP2017107261A (ja) | 2017-06-15 |
JP6630139B2 true JP6630139B2 (ja) | 2020-01-15 |
Family
ID=59060738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015238205A Active JP6630139B2 (ja) | 2015-12-07 | 2015-12-07 | テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6630139B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7181043B2 (ja) * | 2018-10-05 | 2022-11-30 | 株式会社日立ビルシステム | 故障診断装置、故障診断方法、及び故障診断プログラム |
JP7192874B2 (ja) * | 2018-10-25 | 2022-12-20 | 日本電気株式会社 | ナレッジ生成システム、方法およびプログラム |
CN110442716B (zh) * | 2019-08-05 | 2022-08-09 | 腾讯科技(深圳)有限公司 | 智能文本数据处理方法和装置、计算设备、存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4291191B2 (ja) * | 2004-03-29 | 2009-07-08 | 財団法人鉄道総合技術研究所 | 列車復旧案内サーバ |
JP4512549B2 (ja) * | 2005-12-06 | 2010-07-28 | 財団法人鉄道総合技術研究所 | 放送内容送信システム |
JP6971557B2 (ja) * | 2015-06-24 | 2021-11-24 | ヤマハ株式会社 | 管理装置およびプログラム |
JP6160794B1 (ja) * | 2015-10-15 | 2017-07-12 | ヤマハ株式会社 | 情報管理システムおよび情報管理方法 |
-
2015
- 2015-12-07 JP JP2015238205A patent/JP6630139B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017107261A (ja) | 2017-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5659122B2 (ja) | 意思決定支援方法、およびシステム | |
JP6300961B2 (ja) | リスク情報配信装置及びリスク情報配信方法 | |
JP6094132B2 (ja) | 災害情報管理装置、災害情報システム、災害情報の管理方法、および災害情報を管理するプログラム、ならびに、携帯端末、携帯端末の制御方法、および携帯端末の動作を制御する制御プログラム | |
US20180135992A1 (en) | Information processing system, information processing method, information processing device, and information processing program | |
JP6630139B2 (ja) | テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム | |
WO2020105478A1 (ja) | 救急需要予測装置、救急需要予測方法およびプログラム | |
CN103605771A (zh) | 一种智能化辅助决策和维护系统及其运行方法 | |
Yazici et al. | Incident detection through twitter: Organization versus personal accounts | |
CN105069665B (zh) | 多渠道站外广告报表数据的排序展示方法及装置 | |
JP2017201437A (ja) | ニュース素材抽出装置及びプログラム | |
Power et al. | Comparing web feeds and tweets for emergency management | |
JP2016081308A (ja) | 集約情報提供システム | |
Yenkar et al. | A novel ensemble approach based on MCC and MCDM methods for prioritizing tweets mentioning urban issues in smart city | |
US20210264315A1 (en) | Selection assistance device, selection assistance method, data structure, learned model, and program | |
JP2017009361A (ja) | 交通情報提供システム及び交通情報提供方法 | |
JP6757654B2 (ja) | 輸送サービス情報提供装置、及び輸送サービス情報提供方法 | |
JP2015049813A (ja) | 情報提供システム、プログラムおよび情報提供方法 | |
JP5380358B2 (ja) | 運行再開時刻予測方法及び装置 | |
CN105303497A (zh) | 基于云计算的护工查询系统及其使用方法 | |
JP6496952B2 (ja) | データ処理装置、データ処理システム、データ処理方法及びプログラム | |
JP2018106035A (ja) | 地図整備装置、案内装置、制御方法、プログラム及び記憶媒体 | |
JP5247343B2 (ja) | 所要時間による施設情報検索方法 | |
JP7175069B2 (ja) | 異常時放送外国語化システム及び異常時放送外国語化プログラム | |
JP6306957B2 (ja) | 列車情報取得プログラム、情報提供システム | |
JP7449192B2 (ja) | ダイヤ情報管理システム、ダイヤ情報管理方法および運行案内システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6630139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |