JP5466575B2 - 重要語抽出装置とその方法とプログラム - Google Patents

重要語抽出装置とその方法とプログラム Download PDF

Info

Publication number
JP5466575B2
JP5466575B2 JP2010117671A JP2010117671A JP5466575B2 JP 5466575 B2 JP5466575 B2 JP 5466575B2 JP 2010117671 A JP2010117671 A JP 2010117671A JP 2010117671 A JP2010117671 A JP 2010117671A JP 5466575 B2 JP5466575 B2 JP 5466575B2
Authority
JP
Japan
Prior art keywords
word
utterance
unit
appearance
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010117671A
Other languages
English (en)
Other versions
JP2011248409A (ja
Inventor
済央 野本
敏 高橋
理 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010117671A priority Critical patent/JP5466575B2/ja
Publication of JP2011248409A publication Critical patent/JP2011248409A/ja
Application granted granted Critical
Publication of JP5466575B2 publication Critical patent/JP5466575B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、テキスト文書のキーワード検索を行うに当たり、テキスト文書から重要語を抽出する重要語抽出装置と、その方法とプログラムに関する。
従来から、テキスト文書中から重要語を抽出する方法としてTF-IDFアルゴリズム(非特許文献1)が知られている。TF-IDFアルゴリズムは、単語wの出現頻度TF(TF:Term Frequency)を、単語wを含む文書の数DF(IDF:Inverse Document Frequency)で除算したTF-IDFを指標として重要語を抽出するアルゴリズムである。このアルゴリズムは、ある文書内で数多く出現しており、且つ他の文書ではあまり出現しない単語ほど重要であるとして重要度を算出する。
図10に、TF-IDFアルゴリズムを用いた重要語抽出装置900の機能構成例を示す。その動作を、対話テキストから重要単語を抽出する場合について簡単に説明する。重要語抽出装置900は、単語出現頻度(TF)算出部91と、文書出現頻度(DF)算出部92と、単語重要度(TF-IDF)算出部93と、テキスト文書集合記憶部94と、を備える。
単語出現頻度(TF)算出部91は、例えば音声認識装置によって形態素解析した対話テキストを入力とする。そして、対話テキスト内の各単語の出現頻度TFを算出する。文書出現頻度(DF)算出部92は、テキスト文書集合記憶部94に記憶されている多数の文書を参照して各単語を含む文書数DFを算出する。単語重要度(TF-IDF)算出部93は、出現頻度TFを各単語を含む文書数DFで除算して、対話テキストを構成する各単語の重要度を出力する。
Gerard Salton, Christopher Buckley "TERM-WEIGHTING APPROACHES IN AUTOMATIC TEXT RETRIEVAL" Information Processing & Management Vol.24, No.5,pp.513-523,1988.
例えば、従来のTF-IDFアルゴリズムを用いて電話の料金や故障など電話に関する話題が話されている対話テキストを探す場合を、コンタクトセンタにおける対話を例に説明する。「電話」という単語は「お電話ありがとうございます。」や「お電話番号を教えていただけますでしょうか」など、抽出したい話題とは関係なく、対話テキストに数多く頻出する。その結果、「電話の料金」や「電話の故障」について話されていないのにも係わらず「電話」の出現頻度TFは大きくなる。そこで、他の対話テキストにも一般的に出てくる特徴的でない単語、例えば「電話」の重要度を下げる目的で、「電話」を含む文書の数DFの逆数を、出現頻度TFに乗算する必要があった。
よって、従来のTF-IDFアルゴリズムを用いた重要語抽出装置900では、各単語を含む文書の数DFを計算するために大量のテキストデータ(テキスト文書集合記憶部94)を持つ必要があった。その大量のテキストデータを収集するのに要するコストが大きい。
この発明は、このような課題に鑑みてなされたものであり、テキスト文書集合記憶部を必要としない重要語抽出装置とその方法とプログラムを提供することを目的とする。
この発明の重要語抽出装置は、発話分割部と、共通出現単語抽出部と、単語近傍度算出部と、単語重要度算出部と、を具備する。発話分割部は、複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割する。共通出現単語抽出部は、その発話単位に共通して出現する共通出現単語を抽出する。単語近傍度算出部は、共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、当該発話距離数の逆数を単語近傍度として算出する。単語重要度算出部は、共通出現単語の単語近傍度を入力として、単語近傍度が高く、その回数の多い共通出現単語ほど大きな値となる重要度を算出する。
この発明の重要語抽出装置は、形態素解析済みの対話テキストを入力として、その対話テキストの発話単位から共通出現語を抽出し、その共通出現語の近傍度と出現頻度とから共通出現語の重要度を算出する。したがって、従来技術のようにテキスト文書集合記憶部を必要としない。よって、重要抽出装置のコストを低減する効果を奏する。
この発明の重要語抽出装置100の機能構成例を示す図。 重要語抽出装置100の動作フローを示す図。 対話テキストの対話構造を示す図。 各発話が複数の単語から構成されることを示す図。 発話に含まれる共通出現単語の例を示す図。 この発明の重要語抽出装置200の機能構成例を示す図。 重要語抽出装置200の動作フローを示す図。 この発明の重要語抽出装置200′の機能構成例を示す図。 この発明の重要語抽出装置300の機能構成例を示す図。 従来のTF-IDFアルゴリズムを用いた重要語抽出装置900の機能構成例を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
図1にこの発明の重要語抽出装置100の機能構成例を示す。その動作フローを図2に示す。重要語抽出装置100は、発話分割部10と、共通出現単語抽出部20と、単語近傍度算出部30と、単語重要度算出部40と、を具備する。
重要語抽出装置100は、複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキスト内の重要語を抽出する装置であり、上記した各部の機能は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
ここで、形態素とは、言語学の用語で、意味を持つ最小の単位のことである。ある言語において、それ以上分解したら意味をなさなくなるまで分割されたものが形態素であり、品詞情報も付加されている。
この形態素解析済みの対話テキストは、図1に破線で示すように、対話音声データを音声認識装置1で音声認識することで得ることが出来る。また、対話テキスト情報を形態素解析装置2で解析して得ることも出来る。その何れも従来技術である。
発話分割部10は、複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割する(ステップS10)。発話分割部10は、例えば句読点「。」の単位で対話テキストを分割する。
図3に、発話単位に分割した対話テキストの対話構造を示す。ax,byは、それぞれ話者Aと話者Bの発話であり、経過時間順にax(x=1,2,…,X),by(y=1,2,…,Y)で表す。話者Aの最初の発話単位a1に対して、話者Bの発話単位b1があり、以後時間経過に伴って、通常は話者Aと話者Bの発話単位が交互に繰り返される。図4に、各発話単位が複数の単語から構成されることを示す。話者Aの発話a1は、単語W1 a1,W2 a1,W3 a1,…,Wi a1で構成される。話者Bの発話b1も同様に単語W1 b1,W2 b1,W3 b1,…,Wj b1で構成される。
共通出現単語抽出部20は、発話単位a1,b1〜aX,bYに共通して出現する共通出現単語を抽出する(ステップS20)。共通出現単語抽出部20は、各発話単位を構成する単語列から、名詞、動詞、形容詞の内容語を取り出して発話間で共通する共通出現単語を抽出する。
図5に共通出現単語の例を示す。発話a1は、W1 a1:「電話」/W2 a1:「の」/W3 a1:「料金」/W4 a1:「って」/W5 a1:「毎月」/W6 a1:「いくら」/W7 a1:「ぐらい」/W8 a1:「払ってる」/、の8個の単語から、名詞、動詞、形容詞の内容語である「電話」、「料金」、「毎月」、「払う」を取り出し、他の発話単位にも出現する内容語を共通出現単語として抽出する。このとき、動詞は原形に変換される。図5に示す例では、共通出現単語として「電話」、「料金」、「毎月」、「高い」、「プラチナライン」、が共通出現単語として抽出される。
単語近傍度算出部30は、それぞれの発話を基準として共通出現単語が含まれる発話間隔を発話距離数(式(1),(2))として検出する。
Figure 0005466575
例えば発話a1の共通出現単語W1 a1:「電話」を基準とした話者Bとの発話距離数は、発話b1がW1 b1:「電話」/W2 b1:「料金」/W3 b1:「だいたい」/W4 b1:「10000」/W5 b1:「円」/W6 b2:「いくら」/W7 a1:「ぐらい」1であるので、W1 b1:「電話」との発話距離数で1となる(式(3))。また、共通出現単語W5 a1:「毎月」を基準とした話者Bとの発話距離数は、発話b2がW1 b2:「高い」/W2 b2:「よ」/W3 b2:「本当」/W4 b2:「に」/W5 b2:「毎月」/W6 b2:「あっぷ」/W7 a2:「あっぷ」/W8 a2:「だよ」であるので、W5 b2:「毎月」との発話距離数で2となる(式(4))。
Figure 0005466575
発話a1に対する発話bの発話数はn個あるので、発話a1の共通出現単語W1 a1:「電話」に関する発話距離数は複数個存在する。共通出現単語W5 a1:「毎月」についても同様である。
次に、単語近傍度算出部30は、最近傍発話距離数を式(5)と式(6)で求める。
Figure 0005466575
そして、単語近傍度算出部30は、単語近傍度を式(7)と式(8)で算出する。
Figure 0005466575
つまり、単語近傍度算出部30は、共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、その発話距離の最小値の逆数を当該共通出現単語の単語近傍度として算出する。なお、発話距離数は単語間の距離で求めても良い。単語間距離の発話距離数も、各発話を構成する単語数が既知のため容易に求めることが可能である。
単語重要度算出部40は、単語近傍度算出部30が出力する単語近傍度を入力として、その単語近傍度の値が大きく、且つその数の多い共通出現単語ほど大きな値を示す重要度IWを式(9)で算出する(ステップS40)。
Figure 0005466575
図5の発話例を参照して重要度IWを説明する。発話a1の共通出現単語W1 a1:「電話」の単語近傍度DW1a1は1/1、発話b1の共通出現単語W1 b1:「電話」の単語近傍度DW1b1は1/1、発話a3の共通出現単語W1 a3:「電話」の単語近傍度DW1a3は1/2、これらを足し合わせた値2.5が共通出現単語「電話」の重要度IWとなる。
同様に、図5に示す範囲での共通出現単語「料金」の重要度は、発話a1の共通出現単語W3 a1:料金と、発話b1の共通出現単語W2 b1:料金の単語近傍度を足したIW=1/1+1/1=2である。共通出現単語「高い」の重要度は、発話a2と発話b2と発話a3の三箇所の単語近傍度を足したIW=1/1+1/1+1/1=3となる。
重要度IWはこのように求められるので、共通出現単語の発話距離が近く、その出現頻度が多いほど大きな値を示す。つまり、重要な単語ほど、短い間隔で繰り返し会話の中に登場する特性と合致している。以上説明したように、重要語抽出装置100は、テキスト文書集合記憶部94を用いること無く、共通出現単語の重要度を算出することが可能である。
図6に、この発明の重要語抽出装置200の機能構成例を示す。その動作フローを図7に示す。重要語抽出装置200は、上記した重要度抽出装置100に対して照応解析処理部25を具備する点で異なる。照応解析処理部25は、発話分割部10の前に設けられる。他の機能構成は、重要語抽出装置100と同じである。
照応解析処理部25は、単語の照応関係を明らかにし、「それ」、「これ」等や代名詞の「彼」、「あなた」等の指示語を、それらが指し示している実態の単語に置換する働きをする。この照応解析方法は、例えば参考文献1(特開2005−25659号公報)に開示された従来技術である。
照応解析処理部25が、指示語に置き換えられた共通出現単語を、本来の単語に変換する(ステップS25)。この処理は、共通出現単語を増加させるので、重要度の算出精度を向上させることが出来る。
なお、照応解析処理部25は、省略語を補完する機能に置き換えても良い。省略語を補完する機能とは、例えば「サーロインステーキは高い」という文書があった時に、「サーロインステーキの値段は高い」といったように本来あるべき語句を補完する技術である。また、「東京ラ」や「東京シ」のように省略して表記された文書を、「東京ディズニーランド」、「東京ディズニーシー」と本来の単語を推定するのも省略語補完技術である。この省略語補完技術については、例えば参考文献2(特開2008−305127号公報)に記載された従来技術である。
照応解析処理部25を、破線で示す省略語補完処理部26に置き換えても、省略語補完処理部26は省略された共通出現単語を補完するので、重要度の算出精度を向上させることが出来る。
〔変形例1〕
図8に、この発明の重要語抽出装置200′の機能構成例を示す。重要語抽出装置200′は、重要語抽出装置200に対して更に省略語補完処理部26を設けたものである。照応解析処理と省略語補完処理の両方を行う事で、重要度の算出精度を更に向上させることが可能になる。
なお、図8では、照応解析処理部25の後に省略語補完処理部26を設けた例を示したが、省略語補完処理部26を照応解析処理部25の前に移動しても同じ効果を得ることが出来る。
図9に、この発明の重要語抽出装置300の機能構成例を示す。重要語抽出装置300は、重要語抽出装置100と、従来のTF-IDFアルゴリズムを用いた重要語抽出装置900の機能構成を合体したものである。
単語重要度算出部45は、単語近傍度とTF-IDF値とに基づいて式(10)で重要度IWを算出する。
Figure 0005466575
ここでαは事前に適当な値に設定される重みである。Nは、テキスト文書集合記憶部94に記憶された全てのドキュメント数である。
重要語抽出装置300は、テキスト文書集合記憶部94を備えることになるが、単語近傍度とTF-IDF値の両方を用いることで、重要度の算出精度をより向上させる効果が期待できる。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (7)

  1. 複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割する発話分割部と、
    上記発話単位に共通して出現する共通出現単語を抽出する共通出現単語抽出部と、
    上記共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、当該発話距離数の逆数を単語近傍度として算出する単語近傍度算出部と、
    上記共通出現単語の単語近傍度を入力として、その単語近傍度が高く、且つその数の多い共通出現単語ほど大きな値を示す重要度を算出する単語重要度算出部と、
    を具備する重要語抽出装置。
  2. 請求項1に記載した重要語抽出装置において、
    更に、
    上記発話単語の指示語や代名詞を、それらが指し示す単語に置換する照応解析処理部又は、
    上記発話単位内において省略されている語を補完する省略語補完処理部を、
    具備することを特徴とする重要語抽出装置。
  3. 複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割する発話分割部と、
    上記発話単位に共通して出現する共通出現単語を抽出する共通出現単語抽出部と、
    上記共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、当該発話距離数の逆数を単語近傍度として算出する単語近傍度算出部と、
    上記発話分割部の出力する発話単位を入力として上記対話テキスト内の各単語の出現頻度TFを算出する単語出現頻度(TF)算出部と、
    上記各単語の出現頻度TFを入力としてテキスト文書集合記憶部に記憶されている文書を参照して各単語を含む文書数DFを算出する文書出現頻度(DF)算出部と、
    上記単語近傍度と、上記各単語の出現頻度TFと、各単語を含む文書数DFを入力として上記共通出現単語毎の重要度を算出する単語重要度算出部と、
    を具備する重要語抽出装置。
  4. 発話分割部が、複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割する発話分割過程と、
    共通出現単語抽出部が、上記発話単位に共通して出現する共通出現単語を抽出する共通出現単語抽出過程と、
    単語近傍度算出部が、上記共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、当該発話距離数の逆数を単語近傍度として算出する単語近傍度算出過程と、
    単語重要度算出部が、上記共通出現単語の単語近傍度を入力として、その単語近傍度が高く、且つその数の多い共通出現単語ほど大きな値を示す重要度を算出する単語重要度算出過程と、
    を含む重要語抽出方法。
  5. 請求項4に記載した重要語抽出方法において、
    更に、
    照応解析処理が、上記発話単語の指示語や代名詞を、それらが指し示す単語に置換する照応解析処理過程又は、
    省略語補完処理部が、上記発話単位内において省略されている語を補完する省略語補完処理過程を、
    含むことを特徴とする重要語抽出方法。
  6. 発話分割部が、複数人による会話の形態素解析済みの対話テキストを入力として、その対話テキストを話者毎の発話単位に分割する発話分割過程と、
    共通出現単語抽出部が、上記発話単位に共通して出現する共通出現単語を抽出する共通出現単語抽出過程と、
    単語近傍度算出部が、上記共通出現単語が他者の発話に出現する発話間隔を発話距離として検出し、当該発話距離数の逆数を単語近傍度として算出する単語近傍度算出過程と、
    単語出現頻度(TF)算出部が、上記発話分割部の出力する発話単位を入力として上記対話テキスト内の各単語の出現頻度TFを算出する単語出現頻度(TF)算出過程と、
    文書出現頻度(DF)算出部が、上記各単語の出現頻度TFを入力としてテキスト文書集合記憶部に記憶されている文書を参照して各単語を含む文書数DFを算出する文書出現頻度(DF)算出過程と、
    単語重要度算出部が、上記単語近傍度と、上記各単語の出現頻度TFと、各単語を含む文書数DFを入力として上記共通出現単語毎の重要度を算出する単語重要度算出過程と、
    を含む重要語抽出方法。
  7. 請求項1乃至3の何れかに記載した重要抽出装置の各部の機能を、コンピュータに実行させるためのプログラム。
JP2010117671A 2010-05-21 2010-05-21 重要語抽出装置とその方法とプログラム Expired - Fee Related JP5466575B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010117671A JP5466575B2 (ja) 2010-05-21 2010-05-21 重要語抽出装置とその方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010117671A JP5466575B2 (ja) 2010-05-21 2010-05-21 重要語抽出装置とその方法とプログラム

Publications (2)

Publication Number Publication Date
JP2011248409A JP2011248409A (ja) 2011-12-08
JP5466575B2 true JP5466575B2 (ja) 2014-04-09

Family

ID=45413639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010117671A Expired - Fee Related JP5466575B2 (ja) 2010-05-21 2010-05-21 重要語抽出装置とその方法とプログラム

Country Status (1)

Country Link
JP (1) JP5466575B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013109635A (ja) * 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 単語重要度算出装置とその方法とプログラム
JP6945130B2 (ja) * 2016-09-13 2021-10-06 パナソニックIpマネジメント株式会社 音声提示方法、音声提示プログラム、音声提示システム及び端末装置
JP6737398B2 (ja) 2017-03-24 2020-08-05 ヤマハ株式会社 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法
CN109254973A (zh) * 2018-08-29 2019-01-22 北京百度网讯科技有限公司 用于更新信息的方法及装置
JP2020190970A (ja) * 2019-05-23 2020-11-26 株式会社日立製作所 文書処理装置およびその方法、プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025659A (ja) * 2003-07-01 2005-01-27 Nippon Telegr & Teleph Corp <Ntt> ゼロ代名詞解消方法、解消装置、解消プログラムおよびプログラムを記録した記録媒体
JP2006113734A (ja) * 2004-10-13 2006-04-27 Hitachi Ltd 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2008305127A (ja) * 2007-06-07 2008-12-18 Nippon Telegr & Teleph Corp <Ntt> キーワード抽出装置、キーワード抽出方法、プログラム及び記録媒体
JP2009070180A (ja) * 2007-09-13 2009-04-02 Internatl Business Mach Corp <Ibm> 情報の検索を支援する装置及び方法
JP5171501B2 (ja) * 2008-03-07 2013-03-27 ヤフー株式会社 重要語を抽出するサーバ、システム、方法およびプログラム

Also Published As

Publication number Publication date
JP2011248409A (ja) 2011-12-08

Similar Documents

Publication Publication Date Title
Guzmán et al. Metrics for Modeling Code-Switching Across Corpora.
Ramisch et al. mwetoolkit: A framework for multiword expression identification.
US5930746A (en) Parsing and translating natural language sentences automatically
CN108140019B (zh) 语言模型生成装置、语言模型生成方法以及记录介质
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
US9600469B2 (en) Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon
JP5496863B2 (ja) 感情推定装置、その方法、プログラム及びその記録媒体
EP2418589A1 (en) Retrieval device
JP5466575B2 (ja) 重要語抽出装置とその方法とプログラム
US10403271B2 (en) System and method for automatic language model selection
EP3918507A1 (en) Unsupervised adaptation of sentiment lexicon
JP2012022599A (ja) 文構造解析装置、文構造解析方法および文構造解析プログラム
JP5713963B2 (ja) 音声認識単語追加装置とその方法とプログラム
US20210133394A1 (en) Experiential parser
JP2013109635A (ja) 単語重要度算出装置とその方法とプログラム
KR101646159B1 (ko) Srl 기반의 문장 분석 방법 및 장치
Pohl et al. Using part of speech n-grams for improving automatic speech recognition of Polish
JP6486789B2 (ja) 音声認識装置、音声認識方法、プログラム
JP2006004366A (ja) 機械翻訳システム及びそのためのコンピュータプログラム
Ma et al. A phonotactic-semantic paradigm for automatic spoken document classification
Zhang et al. Partial parse selection for robust deep processing
JP5860861B2 (ja) 焦点推定装置、モデル学習装置、方法、及びプログラム
Nongmeikapam et al. Identification of reduplicated multiword expressions using CRF
KR20190059826A (ko) 한국어 접사 기반 토크나이징 장치 및 그 방법
Nou et al. Khmer POS tagger: a transformation-based approach with hybrid unknown word handling

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140124

R150 Certificate of patent or registration of utility model

Ref document number: 5466575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees