JP2010257425A - 話題境界検出装置及びコンピュータプログラム - Google Patents
話題境界検出装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2010257425A JP2010257425A JP2009110003A JP2009110003A JP2010257425A JP 2010257425 A JP2010257425 A JP 2010257425A JP 2009110003 A JP2009110003 A JP 2009110003A JP 2009110003 A JP2009110003 A JP 2009110003A JP 2010257425 A JP2010257425 A JP 2010257425A
- Authority
- JP
- Japan
- Prior art keywords
- word
- boundary
- sentence
- topic
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 206
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000013500 data storage Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 20
- 238000000034 method Methods 0.000 description 33
- 238000012545 processing Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 241000718541 Tetragastris balsamifera Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 240000002234 Allium sativum Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】文境界検出モデル記憶部40は、単語列が文境界となる寄与率に応じた重みを記憶し、話題境界検出モデル記憶部50は、共起する単語と、話題境界となる寄与率に応じた重みを記憶する。文境界検出部61は、連続した2つの単語ネットワークから境界の単語列及び当該単語列の事後確率を取得すると、当該単語列の重みを読み出し、単語列の重みを事後確率に応じて変更した値を用いて文境界の確率を算出する。そして、確率が高ければ文境界と判断し、文境界毎に単語ネットワークを連結して連結ネットワークを生成する。話題境界検出部63は、連続した2つの連結ネットワークから共起する単語とその事後確率を取得すると、当該共起する単語の重みを事後確率に応じて変更した値を用いて話題境界の確率を算出し、算出した確率が高ければ話題境界があると判断する。
【選択図】図1
Description
この発明によれば、話題境界検出装置は、単語列と、直前または直後が文境界となる寄与率を示す重みとを対応づけた文境界検出モデル、及び、共起する単語と、話題境界となる寄与率を示す重みとを対応づけた話題境界検出モデルを記憶する。そして、音声認識結果として入力された単語ネットワークデータから、文境界の単語列及び当該単語列の事後確率を取得するとともに、文境界検出モデルから当該単語列の重みを読み出し、単語列の重みを事後確率に応じて変更した値を用いて文境界の確率を算出する。この確率が高ければ文境界と判断し、文境界毎に単語ネットワークを連結して連結ネットワークを生成する。続いて、連続した2つの連結ネットワークから共起する単語とその事後確率を取得するとともに、当該共起する単語の重みを話題境界検出モデルから読み出し、共起する単語の重みを事後確率に応じて変更した値を用いて話題境界の確率を算出する。算出した確率が高ければ話題境界があると判断し、連結ネットワーク間に話題境界がある旨の情報を出力する。
これにより、音声認識結果から、文章が終了する適切な位置において、正確に話題の境界を検出することが可能となる。また、話題境界検出の逐次処理が可能となるため、音声認識結果に併せて、リアルタイムに話題境界を出力することができる。
この発明によれば、話題境界検出装置は、音声認識結果に代えてテキストデータを用い、話題境界検出処理を行なう。
これにより、テキスト文書を対象にして、話題の境界を検出することができる。
この発明によれば、音声認識結果に文境界、話題境界の情報を付加した学習データに基づいて、文境界検出モデルと話題境界検出モデルを生成する。
これにより、文境界の検出に用いる文境界検出モデルと、話題境界の検出に用いる話題境界検出モデルとを、実際の音声認識結果に基づいて生成することができるため、信頼性の高いモデルを作成することができる。
この発明によれば、話題境界検出装置は、単語列と、直前または直後が文境界となる寄与率を示す重みとを対応づけた文境界検出モデル、及び、共起する単語と、話題境界となる寄与率を示す重みとを対応づけた話題境界検出モデルを記憶する。そして、音声認識結果として入力された単語ネットワークデータから、文境界の単語列及び当該単語列の事後確率を取得するとともに、文境界検出モデルから当該単語列の重みを読み出し、単語列の重みを事後確率に応じて変更した値を用いて文境界の確率を算出する。この確率が高ければ文境界と判断し、文境界毎に単語ネットワークを連結して連結ネットワークを生成する。続いて、連続した2つの連結ネットワークから共起する単語とその事後確率を取得するとともに、当該共起する単語の重みを話題境界検出モデルから読み出し、共起する単語の重みを事後確率に応じて変更した値を用いて話題境界の確率を算出する。算出した確率が高ければ話題境界があると判断し、連結ネットワーク間に話題境界がある旨の情報を出力する。
これにより、音声認識結果から、文章が終了する適切な位置において、正確に話題の境界を検出することが可能となる。また、話題境界検出の逐次処理が可能となるため、音声認識結果に併せて、リアルタイムに話題境界を出力することができる。
加えて、話題境界を逐次定められるため、音声認識システムから出力される音声認識結果に文境界及び話題境界をリアルタイムに付加することができる。よって、動画像に併せて出力される音声認識結果に、文境界や話題境界を表示させることができる。
[1.構成]
図1は、本発明の一実施形態による話題境界検出装置1の構成を示す機能ブロック図であり、発明と関係する機能ブロックのみ抽出して示してある。話題境界検出装置1は、音声認識結果の単語列から話題の境界を検出する。
同図において、話題境界検出装置1は、音声認識部10、学習データ記憶部20、学習部30、文境界検出モデル記憶部40、話題境界検出モデル記憶部50、及び、検出部60を備える。学習データ記憶部20、文境界検出モデル記憶部40、及び、話題境界検出モデル記憶部50は、ハードディスク装置や半導体メモリなどで実現される。また、学習部30、及び、検出部60は、サーバ等のコンピュータ装置により実現される。
本実施形態による話題境界検出装置1は、話題境界の検出を以下の2段階の処理により行なう。
(第1段階)単語ネットワークから文境界を検出する文境界検出処理。
(第2段階)検出された文境界から話題境界を検出する話題境界検出処理。
本実施の形態による話題境界検出装置1の音声認識部10は、音声認識結果として単語ネットワークを出力する。単語ネットワークは、音声認識における一連の単語仮説をグラフとして表現したものであり、ネットワークのノード(頂点)には、単語を発話した時刻、または、発話の終了時刻が与えられ、ノード間をつなぐエッジ(辺)には、単語の表記とその事後確率が与えられる。単語ネットワークは、主として小休止等によって区切られた入力音声に対し、音声認識結果をグラフ上に表現したものである。従って、単語ネットワークの始端及び終端は必ずしも意味的な文としての始端や終端とはならない。
(仮定1)単語ネットワークの終端ノードは、句点「。」もしくは読点「、」に該当する。
(仮定2)単語ネットワークの終端ノードを除く各ノードは句点に該当しない。
文境界が正しく検出されない場合、話題の境界が1つの文をまたがってしまう可能性があり、話題境界を正しく検出できずに誤検出となる可能性がある。従来技術においては、音声認識結果を単独の文と仮定して処理するため、文境界ではない箇所を話題とみなしてしまうことがあった。また、従来技術では、正解としてのもっともらしさ、つまり、音声認識の信頼度を使用せずに話題境界を検出していたため、信頼性が低かった。
一つの単語ネットワークにおいて、始端/終端ノードにつながるパスは一般に複数存在する(例えば、単語ネットワーク1では、「し/まし/た」、「し/ます/が」、…等)。従って、文境界かどうかの得点は、上述したように、単語ネットワーク上の各々のパスとその事後確率に基づく得点として表現される。つまり、文頭/文末に出現しやすい単語列の場合は文境界の確率を示す得点の数値を高く、他の単語列が前/後ろに続くことが多い場合は得点を低くするとともに、事後確率が低いほど得点の数値が低くなるようにする。文境界検出部61は、2つの単語ネットワーク内の文境界候補についてこれらの得点を得、この得られた得点が事前に定めた閾値より大きければ、その2つの文境界候補を文境界として判断する。なお、得点の具体的な計算方法については後述する。
第1段階の文境界検出処理において文境界検出部61が文境界を検出した後、第2段階として、話題境界検出部63は、この文境界の中から話題境界を検出する。このとき、第1段階で文境界が検出されなかった単語ネットワーク同士は、1つの文として全て連結されるものとする。この連結された単語ネットワークを連結ネットワークとよぶ。
(特徴1)連結ネットワーク間で共起する単語
(特徴2)連結ネットワーク間で共起する単語の意味的な類義牲
(特徴3)連結ネットワークに含まれる名詞(人名、地名、組織名など)などの共起関係
図3(a)では、連結ネットワーク5には「雨」という語が、連結ネットワーク6には「曇り」という語が含まれており、それぞれ事後確率0.9、0.8と比較的高い値となっている。「雨」と「曇り」は、どちらも気象に関する類義語であり、これらが連続して生起するような話題は気象情報である。従って、これらの語が共起する、連結ネットワーク5と連結ネットワーク6との間で仮定した話題境界候補は、話題境界ではないと考えられる。これの例では、「雨」と「曇り」の共起を用いたが、これらの語を「気象に関する語」という意味的な類犠牲に置き換え、その共起をとらえてもよい。
次に、話題境界検出装置1の詳細な処理手順を説明する。ここでは、音声認識システム等に備えられた音声認識部10の出力として単語ネットワークを得た後、話題境界を検出する場合について説明する。
本実施形態の話題境界検出装置1は、以下の処理手順によって動作する。
(手順2)学習部30は、学習データ記憶部20から、手順1により収集された単語ネットワークに文境界及び話題境界を付与した学習データを読み出して、文境界検出モデル、話題境界検出モデルを学習し、それぞれを文境界検出モデル40、話題境界検出モデル記憶部50に書き込む。
(手順3)検出部60は、文境界検出モデル40に記憶されている文境界検出モデルを使用して文境界を検出し、話題境界検出モデル記憶部50に記憶されている話題境界検出モデルを使用して、検出された文境界の中から話題境界を検出する。
まず、音声認識部10において、入力音声に基づいて音声認識を行い、その音声認識結果を示す単語ネットワークを生成し、出力する。学習に用いる場合、この単語ネットワークデータは、学習データ記憶部20に書き込まれる。
次に、学習部30による文境界検出モデル及び話題境界検出モデルの学習処理について説明する。学習部30は、文境界、話題境界の検出のための学習をそれぞれ独立して並行に行なう。
図8は、学習部30の文境界学習部31における文境界学習の処理フローである。
例えば、図2(a)に示す単語ネットワーク1及び単語ネットワーク2が読み出された場合、文境界学習部31は、文境界を検出するような以下のルールを得る。
(ルール2)単語ネットワーク1(gi−1)の終端ノードを含んだ所定ノード数のパスが、単語列「し/まし/た」であり、単語ネットワーク1(gi−1)の直後が文境界である。これを、ルールに対応した関数をf1 lとする。
図10は、学習部30の話題境界学習部33における文境界学習の処理フローである。
例えば、図4(a)に示すように、連結ネットワーク5及び連結ネットワーク6が話題境界の前後の連結ネットワークとして読み出された場合、話題境界学習部33は、話題境界を検出するような以下のルールを得る。
以下、ルール番号を特定しない場合、関数hjのルールの番号jは省略して記載する。
次に、検出部60における文境界及び話題境界検出処理について説明する。
図12は、検出部60の文境界検出部61における文境界検出の処理フローである。
なお、単語ネットワークバッファ62に読み出していない連結ネットワークがなければ(NO)、処理を終了する。
一方、(式9)を満たす場合は、文境界と判断してステップS330の処理を行なう。
図13は、検出部60の単語ネットワークバッファ62における文境界検出の処理フローである。
なお、連結ネットワークバッファ64に読み出していない連結ネットワークがなければ(NO)、処理を終了する。
一方、(式10)を満たす場合は、話題境界と判断してステップS430の処理を行なう。
つまり、テキスト文書の場合、形態素解析などによって単語に分割し、句点によって区切られた文章を連結ネットワークとする。また、事後確率を1.0として上記処理を行なう。
本実施形態の話題境界検出装置によれば、音声認識の確からしさを示す事後確率を用いて、音声認識結果から文境界を検出し、この検出した文境界の中から話題境界を検出する。このため、音声認識結果における適切な位置で、話題境界を正確に検出することができる。これにより、文書検索、音声文書検索、動画像検索等で用いられる話題境界を検出することができる。一般に、テキスト文書や、音声認識した単語列を含む音声文書、動画像は、複数の話題から構成されていることが多い。テキスト文書や音声認識結果等の文書に含まれている単語列を入力とし、この文書を話題に分割することが可能となれば、特定の話題を検索する、文書に自動的に見出しをつける、などの用途に利用が可能である。
加えて、話題境界を逐次定められるため、リアルタイム音声認識システムから出力される音声認識結果に文境界及び話題境界をリアルタイムに付加することができる。よって、動画像に併せて出力される音声認識結果に、文境界や話題境界を付加して表示させることができる。
また、入力として、既存の統計的言語モデルを用いた音声認識結果を利用することが可能である。
なお、上述の話題境界検出装置1の音声認識部10、学習データ記憶部20、学習部30、文境界検出モデル記憶部40、話題境界検出モデル記憶部50、及び、検出部60は、内部にコンピュータシステムを有している。そして、話題境界検出装置1の音声認識部10、学習部30、検出部60の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
10…音声認識部
20…学習データ記憶部
30…学習部
31…文境界学習部
32…文境界学習情報記憶部
33…話題境界学習部
34…話題境界学習情報記憶部
40…文境界検出モデル記憶部
50…話題境界検出モデル記憶部
60…検出部
61…文境界検出部
62…単語ネットワークバッファ
63…話題境界検出部
64…連結ネットワークバッファ
Claims (4)
- 単語列と、当該単語列の直前または直後が文境界となる寄与率を示す重みとを対応づけて記憶する文境界検出モデル記憶部と、
共起する単語と、当該共起する単語がそれぞれ含まれる2つの連結ネットワークの間が話題境界となる寄与率を示す重みとを対応づけて記憶する話題境界検出モデル記憶部と、
音声認識の出力結果のデータから得られた、ノード間の単語と当該単語の事後確率とを示す、連続した2つの単語ネットワークのうち、先に発生した単語ネットワークから終端ノードに至るパスの単語列及び当該単語列の事後確率を取得するとともに、当該単語列の直後を文境界とする重みを前記文境界検出モデル記憶部から読み出し、後に発生した単語ネットワークから先頭ノードより始まるパスの単語列及び当該単語列の事後確率を取得するとともに、当該単語列の直前を文境界とする重みを前記文境界検出モデル記憶部から読み出し、前記単語列の前記重みを当該単語列の前記事後確率に応じて変更した値に基づいて、前記連続した2つの単語ネットワーク間が文境界である確率を算出し、算出した確率が所定の値を越えた場合に、この検出した文境界と直前に検出した文境界との間に含まれる単語ネットワークを連結して連結ネットワークを生成する文境界検出部と、
前記話題境界検出モデル記憶部から、前記文境界検出部により生成された連続した2つの連結ネットワークに共起する単語の重みを読み出すとともに、当該共起する単語の事後確率を前記連続する2つの連結ネットワークから読み出し、前記共起する単語の前記重みを、当該共起する単語の前記事後確率に応じて変更した値に基づいて、前記連続した2つの連結ネットワークの間が話題境界である確率を算出し、算出した確率が所定の値を超えた場合に、前記連結ネットワーク間に話題境界がある旨の情報を出力する話題境界検出部と、
を備えることを特徴とする話題境界検出装置。 - 前記話題境界検出部は、前記音声認識の出力結果のデータに基づいて前記文境界検出部が生成した前記連結ネットワークの代わりに、テキストデータに含まれる文章を用いることを特徴とする請求項1に記載の話題境界検出装置。
- 音声認識結果の単語ネットワークと、文境界の前記単語ネットワークと、連結ネットワークを構成する前記単語ネットワークと、話題境界の直前及び直後の前記連結ネットワークとからなる学習データを記憶する学習データ記憶部と、
前記学習データ記憶部に記憶されている単語ネットワークデータから、先頭のノードより始まるパス、及び、終端のノードに至るパスの単語列及び当該単語列の事後確率を読み出し、読み出した当該単語列及び当該単語列の前記事後確率に基づいて、前記学習データにより示される文境界が存在する、連続した2つの前記単語ネットワークについて算出した前記文境界の確率が最大となるように、読み出した前記単語列に対応した前記重みを決定する文境界学習部と、
前記学習データ記憶部に記憶されている連続した2つの連結ネットワークデータから共起する単語及び当該単語の事後確率を読み出し、読み出した当該共起する単語及び当該単語の前記事後確率に基づいて、前記学習データにより示される話題境界が存在する、連続した2つの前記連結ネットワークについて算出した前記話題境界の確率が最大となるように、読み出した前記共起する単語に対応した前記重みを決定する話題境界学習部と、
をさらに備えることを特徴とする請求項1または請求項2に記載の話題境界検出装置。 - コンピュータを、
単語列と、当該単語列の直前または直後が文境界となる寄与率を示す重みとを対応づけて記憶する文境界検出モデル記憶部、
共起する単語と、当該共起する単語がそれぞれ含まれる2つの連結ネットワークの間が話題境界となる寄与率を示す重みとを対応づけて記憶する話題境界検出モデル記憶部、
音声認識の出力結果のデータから得られた、ノード間の単語と当該単語の事後確率とを示す、連続した2つの単語ネットワークのうち、先に発生した単語ネットワークから終端ノードに至るパスの単語列及び当該単語列の事後確率を取得するとともに、当該単語列の直後を文境界とする重みを前記文境界検出モデル記憶部から読み出し、後に発生した単語ネットワークから先頭ノードより始まるパスの単語列及び当該単語列の事後確率を取得するとともに、当該単語列の直前を文境界とする重みを前記文境界検出モデル記憶部から読み出し、前記単語列の前記重みを当該単語列の前記事後確率に応じて変更した値に基づいて、前記連続した2つの単語ネットワーク間が文境界である確率を算出し、算出した確率が所定の値を越えた場合に、この検出した文境界と直前に検出した文境界との間に含まれる単語ネットワークを連結して連結ネットワークを生成する文境界検出部、
前記話題境界検出モデル記憶部から、前記文境界検出部により生成された連続した2つの連結ネットワークに共起する単語の重みを読み出すとともに、当該共起する単語の事後確率を前記連続する2つの連結ネットワークから読み出し、前記共起する単語の前記重みを、当該共起する単語の前記事後確率に応じて変更した値に基づいて、前記連続した2つの連結ネットワークの間が話題境界である確率を算出し、算出した確率が所定の値を超えた場合に、前記連結ネットワーク間に話題境界がある旨の情報を出力する話題境界検出部、
として機能させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009110003A JP5265445B2 (ja) | 2009-04-28 | 2009-04-28 | 話題境界検出装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009110003A JP5265445B2 (ja) | 2009-04-28 | 2009-04-28 | 話題境界検出装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010257425A true JP2010257425A (ja) | 2010-11-11 |
JP5265445B2 JP5265445B2 (ja) | 2013-08-14 |
Family
ID=43318221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009110003A Active JP5265445B2 (ja) | 2009-04-28 | 2009-04-28 | 話題境界検出装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5265445B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069387A (ja) * | 2013-09-27 | 2015-04-13 | 大日本印刷株式会社 | サーバ装置、プログラム及び通信方法 |
JP2015225133A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 対話分割装置、方法、及びプログラム |
JP2015225134A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 話題変換検出装置、方法、及びプログラム |
JP2016177311A (ja) * | 2016-05-25 | 2016-10-06 | 株式会社東芝 | テキスト処理装置、テキスト処理方法およびテキスト処理プログラム |
JP2017058507A (ja) * | 2015-09-16 | 2017-03-23 | 日本電信電話株式会社 | 音声認識装置、音声認識方法、プログラム |
US10304457B2 (en) | 2011-07-26 | 2019-05-28 | Kabushiki Kaisha Toshiba | Transcription support system and transcription support method |
KR102516391B1 (ko) * | 2022-09-02 | 2023-04-03 | 주식회사 액션파워 | 음성 구간 길이를 고려하여 오디오에서 음성 구간을 검출하는 방법 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05342263A (ja) * | 1992-06-08 | 1993-12-24 | Nippon Telegr & Teleph Corp <Ntt> | ビデオデータ検索支援方法 |
JP2001005821A (ja) * | 1999-06-18 | 2001-01-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題型要約生成装置及び話題型要約生成方法並びに当該方法を記録したコンピュータ読み取り可能な記録媒体 |
JP2002197083A (ja) * | 2000-12-12 | 2002-07-12 | Hewlett Packard Co <Hp> | 文書分割方法 |
JP2005167452A (ja) * | 2003-12-01 | 2005-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 映像シーン区間情報抽出方法,映像シーン区間情報抽出装置,映像シーン区間情報抽出プログラムおよびそのプログラムを記録した記録媒体 |
WO2005069158A2 (ja) * | 2004-01-16 | 2005-07-28 | Nec Corp | テキスト処理方法/プログラム/プログラム記録媒体/装置 |
JP2008065435A (ja) * | 2006-09-05 | 2008-03-21 | Nippon Telegr & Teleph Corp <Ntt> | トークン列中の境界検出方法、装置、プログラム、記録媒体 |
JP2008197952A (ja) * | 2007-02-14 | 2008-08-28 | Nippon Telegr & Teleph Corp <Ntt> | テキストセグメンテーション方法,その装置,そのプログラムおよびコンピュータ読み取り可能な記録媒体 |
JP2008225563A (ja) * | 2007-03-08 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 相互に関係する固有表現の組抽出装置及びその方法 |
-
2009
- 2009-04-28 JP JP2009110003A patent/JP5265445B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05342263A (ja) * | 1992-06-08 | 1993-12-24 | Nippon Telegr & Teleph Corp <Ntt> | ビデオデータ検索支援方法 |
JP2001005821A (ja) * | 1999-06-18 | 2001-01-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題型要約生成装置及び話題型要約生成方法並びに当該方法を記録したコンピュータ読み取り可能な記録媒体 |
JP2002197083A (ja) * | 2000-12-12 | 2002-07-12 | Hewlett Packard Co <Hp> | 文書分割方法 |
JP2005167452A (ja) * | 2003-12-01 | 2005-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 映像シーン区間情報抽出方法,映像シーン区間情報抽出装置,映像シーン区間情報抽出プログラムおよびそのプログラムを記録した記録媒体 |
WO2005069158A2 (ja) * | 2004-01-16 | 2005-07-28 | Nec Corp | テキスト処理方法/プログラム/プログラム記録媒体/装置 |
JP2008065435A (ja) * | 2006-09-05 | 2008-03-21 | Nippon Telegr & Teleph Corp <Ntt> | トークン列中の境界検出方法、装置、プログラム、記録媒体 |
JP2008197952A (ja) * | 2007-02-14 | 2008-08-28 | Nippon Telegr & Teleph Corp <Ntt> | テキストセグメンテーション方法,その装置,そのプログラムおよびコンピュータ読み取り可能な記録媒体 |
JP2008225563A (ja) * | 2007-03-08 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 相互に関係する固有表現の組抽出装置及びその方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10304457B2 (en) | 2011-07-26 | 2019-05-28 | Kabushiki Kaisha Toshiba | Transcription support system and transcription support method |
JP2015069387A (ja) * | 2013-09-27 | 2015-04-13 | 大日本印刷株式会社 | サーバ装置、プログラム及び通信方法 |
JP2015225133A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 対話分割装置、方法、及びプログラム |
JP2015225134A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 話題変換検出装置、方法、及びプログラム |
JP2017058507A (ja) * | 2015-09-16 | 2017-03-23 | 日本電信電話株式会社 | 音声認識装置、音声認識方法、プログラム |
JP2016177311A (ja) * | 2016-05-25 | 2016-10-06 | 株式会社東芝 | テキスト処理装置、テキスト処理方法およびテキスト処理プログラム |
KR102516391B1 (ko) * | 2022-09-02 | 2023-04-03 | 주식회사 액션파워 | 음성 구간 길이를 고려하여 오디오에서 음성 구간을 검출하는 방법 |
US11972752B2 (en) | 2022-09-02 | 2024-04-30 | Actionpower Corp. | Method for detecting speech segment from audio considering length of speech segment |
Also Published As
Publication number | Publication date |
---|---|
JP5265445B2 (ja) | 2013-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gui et al. | Part-of-speech tagging for twitter with adversarial neural networks | |
CN109840287B (zh) | 一种基于神经网络的跨模态信息检索方法和装置 | |
Jin et al. | A novel lexicalized HMM-based learning framework for web opinion mining | |
JP5265445B2 (ja) | 話題境界検出装置及びコンピュータプログラム | |
JP6222821B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
Liu et al. | A study in machine learning from imbalanced data for sentence boundary detection in speech | |
CN108062954B (zh) | 语音识别方法和装置 | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
CN108538286A (zh) | 一种语音识别的方法以及计算机 | |
WO2009084554A1 (ja) | テキスト分割装置とテキスト分割方法およびプログラム | |
US8494847B2 (en) | Weighting factor learning system and audio recognition system | |
CN105551485B (zh) | 语音文件检索方法及系统 | |
CN109977220B (zh) | 一种基于关键句和关键字的反向生成摘要的方法 | |
CN111353306A (zh) | 基于实体关系和依存Tree-LSTM的联合事件抽取的方法 | |
CN109783806A (zh) | 一种利用语义解析结构的文本匹配方法 | |
CN114428850B (zh) | 一种文本检索匹配方法和系统 | |
CN111462751A (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
Fusayasu et al. | Word-error correction of continuous speech recognition based on normalized relevance distance | |
JP5437204B2 (ja) | 言語モデル処理装置および音声認識装置、ならびにプログラム | |
JP6300394B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
JP4005477B2 (ja) | 固有表現抽出装置及び方法並びに固有表現抽出プログラム | |
JP5523929B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
JPH117447A (ja) | 話題抽出方法及びこれに用いる話題抽出モデルとその作成方法、話題抽出プログラム記録媒体 | |
JP4175093B2 (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130501 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5265445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |