JP2007233823A - 自動要約装置及びコンピュータプログラム - Google Patents
自動要約装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2007233823A JP2007233823A JP2006056145A JP2006056145A JP2007233823A JP 2007233823 A JP2007233823 A JP 2007233823A JP 2006056145 A JP2006056145 A JP 2006056145A JP 2006056145 A JP2006056145 A JP 2006056145A JP 2007233823 A JP2007233823 A JP 2007233823A
- Authority
- JP
- Japan
- Prior art keywords
- clause
- dependency structure
- dependency
- phrase
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 テキストの要約を内容が正確に理解できる程度に行なえる自動要約装置を提供する。
【解決手段】 テキスト自動要約装置44は、テキストの各文を節に分割する節分割処理部52と、分割された各節内の文節間の係り受け構造を解析する節内部の係り受け解析部54と、節間の係り受け構造を解析し、解析結果に従って要約対象の単位となる文節列と当該文節列内の文節間の係り受け構造とを出力する節末文節の係り先解析部56と、出力される係り受け構造と係り受け構造内で削除すべき部分を定めるために予め定義された削除規則とに従って、係り先解析部56から出力される各文節列に対し、当該文節列内で削除すべき文節を定めて削除する不要部分削除部58とを含む。
【選択図】 図2
【解決手段】 テキスト自動要約装置44は、テキストの各文を節に分割する節分割処理部52と、分割された各節内の文節間の係り受け構造を解析する節内部の係り受け解析部54と、節間の係り受け構造を解析し、解析結果に従って要約対象の単位となる文節列と当該文節列内の文節間の係り受け構造とを出力する節末文節の係り先解析部56と、出力される係り受け構造と係り受け構造内で削除すべき部分を定めるために予め定義された削除規則とに従って、係り先解析部56から出力される各文節列に対し、当該文節列内で削除すべき文節を定めて削除する不要部分削除部58とを含む。
【選択図】 図2
Description
この発明は、テキストを要約する装置に関し、特に、発話等から得られたテキストを自動的に要約するための技術に関する。
公演及び生放送のテレビジョンプログラムにおける解説等においては、内容について観客のよりよい理解を助けるために様々なシステムが必要とされている。その一つとして、字幕自動生成システムが考えられる。この様な字幕自動生成において考慮すべき主な事項は二つある。第1は、正確さ、第2は追従性(リアルタイム性)である。
観客等に発話の中身が最も正確に伝わる様に字幕を生成しようとすると、発話の内容から一字一句違わずに字幕を生成する事が好ましい。しかし、この様に字幕生成の際に発話内容をそのまま表示すると、観客等が表示時間内に字幕を読みきる事ができないおそれがある。
かといって、表示時間内で読みきる事のできる様に字幕の表示時間を延ばすと、発話内容と字幕表示内容がずれてしまう。つまり、字幕表示内容が発話内容から遅れ、追いかける様な現象が起こる。この遅れによって、字幕生成のリアルタイム性は損なわれてしまう。
これらの問題点を解決するために、人手によって発話内容をリアルタイムで要約し、その要約内容から字幕を生成するという方法が考えられる。一般に、人間が1秒間に読みきる事のできる文字数の上限は4文字程度であると考えられている。この方法によると、人手によって1秒間に4文字以内に収まる様に要約を行ない、字幕を生成する事が可能である。
特開2004−318300号公報
しかし、人手を使って要約を行なうと処理が煩雑になりがちである。また、要約にかかる人件費等を考えると経済的でもない。さらに、人手を介すると、人間が内容を理解して要約するという過程を経なければならない。そのため、リアルタイム性が損なわれる恐れもある。
そこで、人手を介さずに、1秒間に4文字以内に収まる様に要約された字幕を生成する必要がある。また、その際には、発話の内容がなるべく損なわれない様にする必要がある。
従って、本発明の一つの目的は、発話等から得られるテキストの要約を、その内容が正確に理解できる程度に行なえる様な自動要約装置を提供する事である。
また、本発明の他の目的は、テキストの入力に追従してリアルタイムで要約が行なえる様な自動要約装置を提供する事である。
本発明の第1の局面に係るテキスト自動要約装置は、入力されるテキストを自動的に要約するためのテキスト自動要約装置であって、入力されるテキストの各文を節に分割するための節分割手段と、節分割手段により分割された各節内の文節間の係り受け構造と、節間の係り受け構造とを解析し、解析結果に従って要約対象の単位となる文節列と、当該文節列内の文節間の係り受け構造とを出力するための係り受け構造解析手段と、係り受け構造解析手段により出力される係り受け構造と、係り受け構造内で削除すべき部分を定めるための予め定義された削除規則とに従って、係り受け構造解析手段から出力される各文節列に対し、当該文節列内で削除すべき文節を定めて削除するための削除手段とを含む。
節分割手段により、入力されるテキストの各文が節に分割され、その分割された節に基づいて文の節内及び節間の係り受け構造が解析される。これら係り受け構造の解析結果に従って要約の単位となる文節列が出力される。削除手段は、この係り受け構造と、係り受け構造内で削除すべき部分を定めるための予め定義された削除規則とに従って、文節列に含まれる文節のうちで削除すべき文節を決定する。ゆえに、文の係り受け構造と、削除規則とに従って、適切な文節の削除を行なう事ができる。その結果、発話等から得られるテキストの要約を、係り受け構造に基づいてその内容が正確に理解できる程度に行なう事ができる。
好ましくは、係り受け構造解析手段の出力する文節列内の各文節には時間期間の情報が付されており、削除手段は、係り受け構造解析手段の出力する各文節列に対し、当該文節列内の文節の時間期間の合計と当該文節列内の文字数とが所定の条件を充足しているか否かを判定するための判定手段と、判定手段により所定の条件が充足されていないと判定された事に応答して、係り受け構造解析手段により出力される係り受け構造と、削除規則とに従って、文節列内で削除すべき文節を定めて削除するための手段と、判定手段により所定の条件が充足されたと判定されるまで、削除するための手段による削除処理と、判定手段による判定処理とを繰返し実行する様に、削除するための手段と判定手段とを制御するための制御手段とを含む。
この自動要約装置によると、各文節に時間期間の情報が付されており、文節列内の文節の時間期間の合計と当該文節列内の文字数とが所定の条件を充足しているか否かを判定する事ができる。そして、この所定の条件を充足しているか否かで、文節を削除すべきか否かが判定される。また、所定の条件が充足されたと判定されるまで、削除処理と判定処理とが繰返し実行される。ゆえに、所定の条件を充足する範囲でできるだけ多くの情報を残しながら文節の削除を行なう事ができる。その結果、発話等から得られるテキストの要約を、その内容が正確に理解できる程度に行なう事ができる。
好ましくは、節分割手段は、入力されるテキスト内の局部的な形態素列に基づいて、入力されるテキストを漸進的に節に分割して、分割された節を出力するための漸進的節分割手段を含み、係り受け構造解析手段は、節分割手段から出力される節を受けた事に応答して、当該節内の文節の係り受け構造を解析するための節内係り受け構造解析手段と、節内係り受け構造解析手段により節内の文節の係り受け構造が解析された節を受けた事に応答して、節内係り受け構造解析手段によりそれ以前に出力された節との間の節間係り受け構造を解析し、節間の係り受け関係の係り先が決定すると、新たに係り先が決定した節と、最も後の係り先との間の節内の文節列を出力するための節間係り受け構造解析手段とを含み、条件確認手段は、節間係り受け構造解析手段から与えられた文節列に付された時間情報を合計して、合計時間を計算するための時間合計手段と、時間合計手段により計算された合計時間と文節列に含まれる文字数とを比較して、節間係り受け構造解析手段から与えられた文節列に含まれる文字が時間あたり所定の文字数以内に収まっているか否かを判定するための時間比較手段とを含む。
この自動要約装置によると、入力されるテキストを漸進的に節に分割する。また、漸進的に節分割された節を受けて節の係り受け構造を解析する。さらに、係り受け構造の解析された文節列に付された時間情報の合計と当該文節列に含まれる文字が時間あたり所定の文字数以内に収まっているか否かを判定する。ゆえに、この判定に基づいて行なわれる文節の削除も、漸進的に行なう事ができる。その結果、要約がテキストの入力に追従してリアルタイムで行なわれる。
好ましくは、時間比較手段は、時間合計手段で計算された合計時間と文節列に含まれる文字数とを比較して、解析結果テキストに含まれる文字数が1秒間あたり4文字以内に収まっているか否かを判定するための手段を含む。
この自動要約装置によると、合計時間と文節列に含まれる文字数とを比較した結果が、文字数が1秒間あたり4文字以内に収まっているか否かを判定する事ができる。人間が1秒間に読む事のできる限度であると考えられている文字数は4文字程度とされており、この比率に達するまで文節の削除が行なわれる。その結果、発話等から得られるテキストの要約をリアルタイムで作成する場合にも、その内容が正確に理解できる程度に要約を行なう事ができる。
好ましくは、削除規則は、係り受け構造解析手段による解析により得られる係り受け構造に基づいて、進み得る枝が決定される決定木であって、係り受け構造と文節列とが与えられると、テキストのどの部分を削除すべきかが判定可能となる様に予め準備されている。
この自動要約装置によると、決定木により係り受け構造と文節列とが与えられると進み得る枝が決定される。その結果、決定木によって削除すべき文節が決定される。決定木は、係り受け構造からどの文節を削除すべきかを適切に決定できる様、予め準備されている。そのため要約の際の文節の削除が適切に行なわれる。その結果、発話等から得られるテキストの要約を、その内容が正確に理解できる程度に行なう事ができる。
さらに好ましくは、自動要約装置はさらに、削除規則を格納するための削除規則格納手段を含む。
この自動要約装置によると、文節の削除を行なう際に削除規則格納手段に格納された削除規則を使用する事ができる。ゆえに、効率的な文節の削除を行なう事ができる。その結果、テキストの要約も効率的に行なう事ができる。
本発明の第2の局面に係るコンピュータプログラムは、コンピュータにより実行されると、当該コンピュータを上記のいずれかに記載の自動要約装置として動作させるので、上記したいずれかの効果と同様の効果を得る事ができる。
[構成]
図1に、本発明の一実施の形態に係るリアルタイム字幕生成装置30のブロック図を示す。図1を参照して、リアルタイム字幕生成装置30は、入力された発話音声を音声信号に変換するためのマイクロフォン40と、マイクロフォン40の出力する音声信号をテキストに変換するための音声認識装置42と、音声認識装置42によってテキスト変換された発話テキストの内容をリアルタイムで要約するためのリアルタイム要約装置44と、リアルタイム要約装置44で要約された要約済み発話内容を字幕表示するための字幕表示装置46とを含む。
図1に、本発明の一実施の形態に係るリアルタイム字幕生成装置30のブロック図を示す。図1を参照して、リアルタイム字幕生成装置30は、入力された発話音声を音声信号に変換するためのマイクロフォン40と、マイクロフォン40の出力する音声信号をテキストに変換するための音声認識装置42と、音声認識装置42によってテキスト変換された発話テキストの内容をリアルタイムで要約するためのリアルタイム要約装置44と、リアルタイム要約装置44で要約された要約済み発話内容を字幕表示するための字幕表示装置46とを含む。
ここで、音声認識装置42では発話音声信号のテキスト化と同時に形態素解析も行なわれている。さらに、文節単位での発話時間情報を付す処理も行なわれる。また、ここでの音声認識精度は100%であると仮定する。
図2に、リアルタイム要約装置44の内部構成を示すブロック図を示す。図2を参照して、リアルタイム要約装置44は、特許文献1に開示の技術を用いて、発話テキストを節に分割する際に使用される規則を格納する節分割規則格納部50と、節分割規則格納部50に格納された規則を用いて発話テキストを節境界で分割する処理を行なうための、特許文献1に開示の技術を採用した節分割処理部52とを含む。ここでの節分割処理は、発話の進行と同時並行的に行なわれている。この様な節分割処理を漸進的節分割処理と呼ぶ。
リアルタイム要約装置44はさらに、予め準備された、統計処理による節内係り受け確率モデルを参照して、節分割処理部52から出力される各節に対する節内係り受け解析処理を行ない、その結果を当該節の形態素列とともに出力するための節内部の係り受け解析部54と、節内部の係り受け解析部54によって解析された節内部の係り受け構造を前提として、予め準備された、統計処理による節間係り受け確率モデルを参照して、確率計算と繰返し処理とによって各節の節末文節の係り先を決定し、係り先が決定されたところまでの節を次の処理部に与えるための節末文節の係り先解析部56とを含む。ここでの係り受け処理も、節分割処理と同様、発話の進行と同時並行的に行なわれている。この様な係り受け処理を漸進的係り受け処理と呼ぶ。
この様に、節分割処理及び係り受け処理が漸進的に行なわれる事により、発話に追従した処理が可能となる。その結果として、リアルタイムな字幕生成処理が可能となる。
節内部の係り受け解析部54が使用する節内係り受け確率モデルは、特願2005−016341号で本願出願人により提案されている。ここでは、節内部の係り受け構造が予め付与された多数の学習用データに基づいた統計処理により、この確率モデルが予め作成される。原理的には、節内部の係り受け解析部54は、入力される節の間の係り受け構造として考えられる構造を全て列挙する。そして、それらの確率を確率モデルを用いて算出する事で、最も確からしいと推定される係り受け構造を採用する。ただし、節末の文節の係り先は決定しない。
節末文節の係り先解析部56が使用する節間係り受け確率モデルも、同様に、特願2005−016341号において提案されている。ここでは、節間の係り受け構造が予め付与された多数の学習用データに基づいた統計処理により、この確率モデルが予め作成される。節末文節の係り先解析部56は、節分割処理部52によって新たな節境界が検出されるたびに、それまでに得られた節のうち、節末文節の係り先が未確定な節の各々について、節間係り受け確率モデルを使用して、係り先の文節として可能なものの確率を全て計算する。係り先の文節は、当該文節に含まれた節に後続するいずれかの節内の文節である。
節末文節の係り先解析部56は、その中で最も確率の高いものをその節の節末文節の係り先の一応の候補として決定する。節末文節の係り先解析部56は、新たな節境界が検出されるたびにこの処理を繰返し、そのたびに一応の候補を決定する。ある文節について、こうして繰返し定められる一応の候補が一定の回数の処理の間変わらなかった場合、その受け文節を当該節末文節の係り先として確定させる。
節分割処理部52、節内部の係り受け解析処理部54、及び節末文節の係り先解析処理部56での具体的な処理例については後述する。
リアルタイム要約装置44はさらに、節末文節の係り先解析部56から与えられた解析結果テキストを要約するためにその不要部分を削除する際に使用する削除規則を格納するための削除規則格納部60と、削除規則格納部60に格納された規則を参照して解析結果テキストの不要部分を削除して要約を作成するための不要部分削除部58とを含む。
削除規則格納部60に格納された規則の詳細については後述する。
図3に、節分割処理部52、節内部の係り受け解析部54、及び節末文節の係り先解析部56での具体的な処理例を示す。図3を参照して、テキスト70は、音声認識装置42から出力された発話テキストの一例であり、形態素列に基づいて文節で分割されている。テキスト70に節分割処理72を行なうと節毎に分割されたテキスト74が生成される。図中で楕円で囲まれた範囲が一つの節を表す。一つの節に複数の文節が含まれている場合もあるし、一つの節に一つだけ文節が含まれている場合もある。
節毎に分割されたテキスト74に節内部の係り受け解析処理76を行なうと、節内部での係り受け構造が解析されたテキスト78が生成される。テキスト78の文節と文節とをつなぐ実線の矢印が節内部での文節同士の係り受け構造を示している。この節内部の係り受け構造を決定するために、上述した統計的手法が使われている。
テキスト78に節末文節の係り先解析処理80を行なうと、節間の係り受け構造が解析されたテキスト82が生成される。テキスト82の文節と文節とをつなぐ点線の矢印が節間にまたがる節末文節の係り受け構造を示している。この節間にまたがる係り受け構造を決定するために、上述した統計的手法が使われている。
図4に、削除規則格納部60に格納された規則の詳細について示す。この規則は、最終文節の述語は重要な文節であるという仮定と、その最終文節の述語から離れるほど文節の重要性が下がるという仮定とに基づいて作成された決定木である。
また、規則中に登場する「係り受けの深さ」とは、ある文節からある文節までの距離を意味する。ここで、文節間の距離とは、ある文節とある文節とが係り受け構造上でどのくらい離れているかを示すために使用している語である。
さらに、人間が字幕を読みきる事のできる文字数は上記した様に1秒間に4文字程度であるので、以下で説明する文節又は節の削除は、この文字数制限に達するまで行なわれる。
図4を参照して、節末文節の係り先解析処理まで終わった解析結果テキストが入力されると、そこに含まれる全ての文節に対し、第1の条件160、すなわち当該文節に係る文節がなく、当該文節が節末でなく、当該文節の係り先が形容詞又は副詞等であるという条件を満たすか否かが判定される。この第1の条件160を満たす文節は削除候補172となる。削除候補172であると判定されても、直ちに削除されるわけではない。後述する様に複数の削除候補があるときは、さらに第2の条件162、すなわち節末からの係り受けの深さが最も深いという条件、第3の条件164、すなわち最右文節からの係り受けが最も深いという条件、及び第4の条件166、すなわち文節の文字数が最も多いという条件を満たすか否かが同様に順次判定され、削除すべき文節が決定される。
第1の条件〜第4の条件160〜166を満たす文節は全て削除候補とみなされるが、仮に、第3の条件164までを満たす文節が複数個存在する場合、第4の条件166を満たす文節が削除される。これは、先に述べた重要文節か否かという仮定に加えて、文字数の多い文節から削除した方が1秒間に4文字という文字数制限を満たしながらより多くの情報を残す事ができるという理由による。
第1の条件160を満たす文節がなければ、各文節が第5の条件168、すなわち当該文節に係る文節がなく、当該文節が節末でなく、当該文節の係り先が形式名詞以外の名詞であり、形容詞等であるという条件を満たすか否かが判定される。第5の条件168を満たす文節は、削除候補174となる。第5の条件168を満たす文節がなければ、各文節について第6の条件170、すなわち当該文節に係る文節がなく、当該文節が節末でなく、当該文節の係り先が状態動詞以外で述語であり、副詞等であるという条件が満たされるか否かが判定される。第6の条件170が満たされると、その文節は削除候補176となる。いずれの文節も第6の条件を満たさなければ、削除候補と判定される文節が存在しない事になる。そこで、この場合は、節単位の削除処理へと移行する。
この様に、削除規則は、文節列と係り受け構造とを受けると、それらに従ってルートノードから始まり、進み得る枝が決定される様になっている。この規則により、係り受け構造に基づき、どの文節を削除するかを決定できる。
図5に、削除規則格納部60に格納された、解析結果テキストの不要部分を節単位で削除して要約を作成するための規則の詳細について示す。この規則は、最終節は重要な節であるという仮定と、その最終節から離れるほど節の重要性が下がるという仮定とにより作成されている。また、規則中に登場する「係り受けの深さ」とは、文節の削除規則同様、ある節からある節までの係り受け構造における距離を意味する。
図5を参照して、図4の第6の条件170までの条件を満たさなかった解析結果テキストが入力されると、そこに含まれる全ての節に対し、第1の条件180、すなわち最終節ではなく、当該節に係る節はなく、形式名詞以外の名詞に係る節末を持つ節であるという条件を満たす節であるか否かが判定される。第1の条件180が満たされれば、その節は削除候補188となる。ある節が削除候補188であると判定されても、直ちに削除されるわけではない。後述する様に複数の削除候補があるときは、さらに、第2の条件182、すなわち最右節からの係り受けが最も深いという条件及び第3の条件184、すなわち節の文字数が最も多いという条件を満たすかが順次判定され、削除すべき節が決定される。
第1の条件〜第3の条件180〜184を満たす節は全て削除候補とみなされるが、仮に、第2の条件182までを満たす節が複数個存在する場合、第3の条件184を満たす節が削除される。文節の削除の場合同様、重要節か否かの仮定に加えて、文字数の多い節から削除した方が1秒間に4文字という文字数制限を満たしながらより多くの情報を残す事ができるという理由による。
第1の条件を満たす節がなければ、各節について第4の条件186、すなわち当該節が最終節ではなく、当該節に係る節がなく、当該節が形式名詞に係らず、節境界が最も弱いという条件が満たされるか否かが判定される。第4の条件186が満たされると、その節は削除候補190となる。
図6に、不要部分削除部58の内部構成を示すブロック図を示す。図6を参照して、不要部分削除部58は、節末文節の係り先解析部56から与えられた節間の係り受け構造が決定されたところまでの解析結果テキストについて、その一部を削除する必要があるか否かを確認するための条件確認部90と、条件確認部90によって削除をする必要があると判定された場合に、削除規則格納部60に格納された削除規則を参照して、解析結果テキストの一部を削除するための削除部92とを含む。
図7に、条件確認部90及び削除部92の内部構成を示すブロック図を示す。図7を参照して、条件確認部90は、節末文節の係り先解析部56から与えられた解析結果テキスト中の文節に付された発話時間を合計して、合計発話時間を計算するための時間合計部100と、時間合計部100で合計された時間と解析結果テキストの文字数との比較から、解析結果テキストが4文字1秒以内に収まっているか否かを計算するための時間比較部102とを含む。
削除部92は、二つの入力及び一つの出力を有し、時間比較部102からの制御入力によって二つの入力のいずれかを出力に接続するための第1のスイッチ110と、第1のスイッチ110からの出力テキストを一旦格納するためのバッファ112と、バッファ112の出力が接続された入力と二つの出力とを有し、時間比較部102からの制御入力によって、バッファ112からの入力を二つの出力のいずれかに接続するための第2のスイッチ114とを含む。
削除部92はさらに、時間比較部102での比較結果により文字数が4文字1秒に収まっていなければ、第2のスイッチ114が出力する形態素列から削除規則格納部60に格納された規則を参照して削除対象となる文節又は節を決定するための削除対象決定部116と、削除対象決定部116で決定された文節又は節を削除するための文節/節削除部118とを含む。なお、文節/節削除部118の出力は、第1のスイッチ110の二つある入力のうち、節末文節の係り先解析部56が接続されているものと別の方に接続されている。
ここで、第1のスイッチ110は、時間比較部102で文字数が1秒4文字以内に収まっていると判定されれば、時間比較部102からの制御信号を受けて、節末文節の係り先解析部56とバッファ112とを接続する。また、第1のスイッチ110は、文字数が1秒4文字よりも多ければ、文節/節削除部118とバッファ112とを接続する。
第2のスイッチ114は、時間比較部102で文字数が1秒4文字以内に収まっていると判定されれば、時間比較部102からの制御信号を受けて、バッファ112と字幕表示部46とを接続する。また、第2のスイッチ114は、文字数が1秒4文字よりも多ければ、バッファ112と削除対象決定部116とを接続する。
図8に、本実施の形態の要約装置44、特にそのうちの不要部分削除部58をコンピュータで実現するためのコンピュータプログラムのフローチャートを示す。図8を参照して、処理が開始されると、ステップ130では節末文節の係り先解析部56から節の入力があったか否かが判定される。節の入力がなければ、ステップ130に戻り、あればステップ134に進む。
ステップ134では、節末文節の係り先解析部56から入力された節をバッファ112に追加する処理が行なわれる。ステップ136では、バッファ112に格納された節の発話時間の合計が計算される。この処理の際には、バッファ112内に格納された節の文字数も計算される。
ステップ138では、計算された発話時間と文字数とが1秒間に4文字以内という条件を充足しているか否かが判定される。1秒間に4文字以内であれば、ステップ140に進み、4文字よりも多ければ、ステップ142へ進む。
ステップ140では、バッファ112内の文字を字幕として出力する処理が行なわれる。処理はステップ130に戻る。
ステップ142では、削除規則に基づいて、バッファ112内のどの文節を削除するかを決定する処理が前述した文節単位の削除規則に従って行なわれる。どの文節を削除するかが決定されなければステップ144へ進み、決定されればステップ146へ進む。
ステップ144ではどの節を削除するのかを前述した節単位の削除規則に従って決定する処理が行なわれる。ステップ146では、ステップ142で削除すべきと判定された文節又はステップ144で削除すべきと判定された節を削除する処理が行なわれる。削除結果によってバッファ112内が更新される。その後、処理はステップ136へ戻り、上記した処理を繰返す。
[動作]
本実施の一形態に係るリアルタイム字幕生成装置は以下の様に動作する。動作の説明は、図1、図2、図6、及び図7を適宜参照して行なう。
本実施の一形態に係るリアルタイム字幕生成装置は以下の様に動作する。動作の説明は、図1、図2、図6、及び図7を適宜参照して行なう。
まず、マイクロフォン40(図1参照)は入力された発話音声を音声信号に変換して、音声認識装置42に与える。音声認識装置42は、音声信号を音声認識し、文節ごとに時間情報の付された形態素列の形式で、リアルタイム要約装置44に与える。
与えられた形態素列を用いて、節分割処理部52(図2参照)で節分割規則格納部50に格納された規則を参照して、形態素の並びに基づき、入力される文中の節の境界が検出される。指定された節の境界位置には何らかのマーカが付される。節分割処理部52によって節分割処理されたテキストは、節内部の係り受け解析部54に与えられる。
節内部の係り受け解析部54は、節分割処理部52により節境界が検出されるたびに、当該節境界の直前の節に対し、節内係り受け構造確率モデルを参照して節内係り受け解析処理を行なう。解析処理結果は当該節の形態素列とともに、節末文節の係り先解析部56に与えられる。
節末文節の係り先解析部56は、節内部の係り受け解析部54により得られた節内部の係り受け構造を前提とし、節間係り受け確率モデルを参照して、確率計算により係り先が未確定の節末文節の受け文節の候補を決定する。そして、ある節について上記した受け文節候補の決定処理を所定回数繰返しても候補とされた受け文節が変化しなかった場合、その受け文節が当該節の節末の文節の係り先として決定される。
節分割処理部52が文を節に分割し、節内部の係り受け解析部54と節末文節の係り先解析部56とによって各節内の係り受け構造と節間の係り受け構造とが順次決定されて行く。節分割処理部52の処理、節内部の係り受け解析部54、及び節末文節の係り先解析部56の処理が節全体について終了する事により、当該節に対する係り受け解析結果が得られる。
得られた係り受け解析結果テキストは、削除部92(図6参照)に与えられる。削除部92に含まれるスイッチ110(図7参照)は、節末文節の係り先解析部56から最初の解析結果がスイッチ110を経てバッファ112に与えられるまでは、節末文節の係り先解析部56とバッファ112とを接続している。バッファ112は節末文節の係り先解析部56から与えられた解析結果を一旦格納する。バッファ112は一旦格納した解析結果テキストを時間合計部100に与える。
時間合計部100は与えられた解析結果テキストから文節ごとに付された発話時間情報を取り出し、発話時間の合計を計算する。計算された発話時間の合計は、時間比較部102に与えられる。
時間比較部102は、バッファ112に一旦格納された範囲の解析結果テキストに含まれている文字数と時間合計部100で計算された発話時間との比較を行なう。この比較によって、文字数が1秒間に4文字という基準に収まっているか否かが判定される。時間比較部102は判定結果をスイッチ114に与える。
文字数が1秒間に4文字以内であれば、スイッチ114はバッファと字幕表示部46とを接続する様に切替えられる。その結果、字幕表示部46には、バッファ112に一旦格納されていた発話内容が与えられる。字幕表示部46は、この発話内容を字幕表示する。
文字数が1秒間に4文字よりも多ければ、スイッチ114はバッファ112と削除対象決定部116とを接続する様に切替えられる。スイッチ110は、文節/節削除部118とバッファ112を接続する様に切替えられる。削除対象決定部116は、削除規則格納部60に格納された規則を参照して、バッファ112から与えられた解析結果テキストから削除すべき部分を決定する。
文節/節削除部118は、削除対象決定部116によって削除すべきと決定された部分を削除する。不要部分が削除された解析結果テキストは、スイッチ110を経て、バッファ112に与えられる。バッファ112は格納されていた解析結果テキストに、文節/節削除部118から新たに与えられたテキストを上書きする。
バッファ112に上書きされたテキストは時間合計部100に与えられ、合計時間が計算される。以後、この動作が何度か繰返される事によって、1秒間に含まれる文字数が4文字以内であるという条件を満たす様にテキストの一部を削除していく。テキストが文字制限条件を満たす様になれば、最終的にバッファ112内に残っているテキストが、字幕表示部46が与えられ、字幕として表示される。
[コンピュータによる実現]
この実施の形態のリアルタイム字幕生成装置30は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。図9はこのコンピュータシステム330の外観を示し、図10はコンピュータシステム330の内部構成を示す。
この実施の形態のリアルタイム字幕生成装置30は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。図9はこのコンピュータシステム330の外観を示し、図10はコンピュータシステム330の内部構成を示す。
図9を参照して、このコンピュータシステム330は、FD(フレキシブルディスク)ドライブ352及びCD−ROM(コンパクトディスク読出専用メモリ)ドライブ350を有するコンピュータ340と、キーボード346と、マウス348と、モニタ342と、マイクロフォン370とを含む。
図10を参照して、コンピュータ340は、FDドライブ352と、CD−ROMドライブ350と、マイクロフォン370とに加えて、CPU(中央処理装置)356と、CPU356、FDドライブ352及びCD−ROMドライブ350に接続されたバス366と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)358と、バス366に接続され、プログラム命令、システムプログラム、及び作業データ等を記憶するランダムアクセスメモリ(RAM)360と、バス366及びマイクロフォン370に接続されるサウンドボード368とを含む。
ここでは示さないが、コンピュータ340はさらにローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを含んでもよい。
コンピュータシステム330にリアルタイム字幕生成装置30としての動作を行なわせるためのコンピュータプログラムは、CD−ROMドライブ350又はFDドライブ352に挿入されるCD−ROM362又はFD364に記憶され、さらにハードディスク354に転送される。又は、プログラムは図示しないネットワークを通じてコンピュータ340に送信されハードディスク354に記憶されてもよい。プログラムは実行の際にRAM360にロードされる。CD−ROM362から、FD364から、又はネットワークを介して、直接にRAM360にプログラムをロードしてもよい。
このプログラムは、コンピュータ340にこの実施の形態のリアルタイム字幕生成装置30として動作を行なわせる複数の命令を含む。この動作を行なわせるのに必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)もしくはサードパーティのプログラム、又はコンピュータ340にインストールされる各種ツールキットのモジュールにより提供される。従って、このプログラムはこの実施の形態のシステム及び方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られる様に制御されたやり方で適切な機能又は「ツール」を呼出す事により、上記したリアルタイム字幕生成装置としての動作を実行する命令のみを含んでいればよい。コンピュータシステム330の動作は周知であるので、ここでは繰返さない。
以上の様に、本発明の一実施の形態に係るリアルタイム字幕生成装置30によると、発話が音声認識装置42(図1参照)によって音声認識されると、順次、節分割処理部52(図2参照)、節内部の係り受け解析部54、及び節末文節の係り先解析部56によって係り受け構造が推定される。さらに、こうして得られたテキストが1秒4文字の条件を充足するまで、係り受け解析結果に基づいて不要部分が決定され、不要部分削除部58で削除される。
この削除処理に使用される規則は、「最終文節の述語は重要である」等の仮定に基づいて作成されている。原理的には、この削除規則は、節の係り受け構造に基づいて作成されている。節の係り受け構造を明らかにするためには、節分割処理部52、節内部の係り受け解析部54、及び節末文節の係り先解析部56での処理に使用される特許文献1及び本願出願者により特願2005−016341号で提案された既存の、又は既に利用可能な技術を有効に使用する事ができる。すなわち、この様にして得られる削除規則に基づいて不要部分削除部58で削除処理が行なわれるので、削除処理自体も既存の技術を有効に利用して行なう事ができる。
また、不要部分削除部58では、漸進的節分割処理及び漸進的係り受け処理によって得られた係り受け解析結果を用いて不要な文節又は節の削除が行なわれるので、発話に追従してリアルタイムに要約処理を行なう事ができる。さらに、要約処理が人手を使わずに自動的に行なわれるので、人手を介する事による処理の遅れを回避する事ができ、リアルタイム性を損なわない様な要約処理が可能になる。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内でのすべての変更を含む。
44 リアルタイム要約装置
52 節分割処理部
54 節内部の係り受け解析部
56 節末文節の係り先解析部
58 不要部分削除部
60 削除規則格納部
90 条件確認部
92 削除部
100 時間合計部
102 時間比較部
110 第1のスイッチ
112 バッファ
114 第2のスイッチ
116 削除対象決定部
118 文節/節削除部
52 節分割処理部
54 節内部の係り受け解析部
56 節末文節の係り先解析部
58 不要部分削除部
60 削除規則格納部
90 条件確認部
92 削除部
100 時間合計部
102 時間比較部
110 第1のスイッチ
112 バッファ
114 第2のスイッチ
116 削除対象決定部
118 文節/節削除部
Claims (4)
- 入力されるテキストを自動的に要約するためのテキスト自動要約装置であって、
入力されるテキストの各文を節に分割するための節分割手段と、
前記節分割手段により分割された各節内の文節間の係り受け構造と、節間の係り受け構造とを解析し、解析結果に従って要約対象の単位となる文節列と、当該文節列内の文節間の係り受け構造とを出力するための係り受け構造解析手段と、
前記係り受け構造解析手段により出力される係り受け構造と、係り受け構造内で削除すべき部分を定めるための予め定義された削除規則とに従って、前記係り受け構造解析手段から出力される各文節列に対し、当該文節列内で削除すべき文節を定めて削除するための削除手段とを含む、自動要約装置。 - 前記係り受け構造解析手段の出力する文節列内の各文節には時間期間の情報が付されており、
前記削除手段は、
前記前記係り受け構造解析手段の出力する各文節列に対し、当該文節列内の文節の時間期間の合計と当該文節列内の文字数とが所定の条件を充足しているか否かを判定するための判定手段と、
前記判定手段により前記所定の条件が充足されていないと判定された事に応答して、前記係り受け構造解析手段により出力される係り受け構造と、前記削除規則とに従って、前記文節列内で削除すべき文節を定めて削除するための手段と、
前記判定手段により前記所定の条件が充足されたと判定されるまで、前記削除するための手段による削除処理と、前記判定手段による判定処理とを繰返し実行する様に、前記削除するための手段と前記判定手段とを制御するための制御手段とを含む、請求項1に記載の自動要約装置。 - 前記節分割手段は、前記入力されるテキスト内の局部的な形態素列に基づいて、前記入力されるテキストを漸進的に節に分割して、分割された節を出力するための漸進的節分割手段を含み、
前記係り受け構造解析手段は、
前記節分割手段から出力される節を受けた事に応答して、当該節内の文節の係り受け構造を解析するための節内係り受け構造解析手段と、
前記節内係り受け構造解析手段により節内の文節の係り受け構造が解析された節を受けた事に応答して、前記節内係り受け構造解析手段によりそれ以前に出力された節との間の節間係り受け構造を解析し、節間の係り受け関係の係り先が決定すると、新たに係り先が決定した節と、最も後の係り先との間の節内の文節列を出力するための節間係り受け構造解析手段とを含み、
前記条件確認手段は、
前記節間係り受け構造解析手段から与えられた文節列に付された前記時間情報を合計して、合計時間を計算するための時間合計手段と、
前記時間合計手段により計算された合計時間と前記文節列に含まれる文字数とを比較して、前記節間係り受け構造解析手段から与えられた文節列に含まれる文字が時間あたり所定の文字数以内に収まっているか否かを判定するための時間比較手段とを含む、請求項2に記載の自動要約装置。 - コンピュータにより実行されると、当該コンピュータを請求項1〜請求項3のいずれかに記載の自動要約装置として動作させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006056145A JP2007233823A (ja) | 2006-03-02 | 2006-03-02 | 自動要約装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006056145A JP2007233823A (ja) | 2006-03-02 | 2006-03-02 | 自動要約装置及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007233823A true JP2007233823A (ja) | 2007-09-13 |
Family
ID=38554342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006056145A Withdrawn JP2007233823A (ja) | 2006-03-02 | 2006-03-02 | 自動要約装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007233823A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122937A (ja) * | 2007-11-14 | 2009-06-04 | Nippon Telegr & Teleph Corp <Ntt> | 自動翻訳装置、その方法、そのプログラム |
JP2012141772A (ja) * | 2010-12-28 | 2012-07-26 | Yahoo Japan Corp | トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム |
WO2012131822A1 (ja) * | 2011-03-30 | 2012-10-04 | 日本電気株式会社 | 音声認識結果整形装置、音声認識結果整形方法及びプログラム |
-
2006
- 2006-03-02 JP JP2006056145A patent/JP2007233823A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122937A (ja) * | 2007-11-14 | 2009-06-04 | Nippon Telegr & Teleph Corp <Ntt> | 自動翻訳装置、その方法、そのプログラム |
JP2012141772A (ja) * | 2010-12-28 | 2012-07-26 | Yahoo Japan Corp | トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム |
WO2012131822A1 (ja) * | 2011-03-30 | 2012-10-04 | 日本電気株式会社 | 音声認識結果整形装置、音声認識結果整形方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6820058B2 (ja) | 音声認識方法、装置、デバイス、及び記憶媒体 | |
US7860719B2 (en) | Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers | |
JP4968036B2 (ja) | 韻律語グルーピング方法及び装置 | |
JP6328260B2 (ja) | 意図推定装置及び意図推定方法 | |
JP4215418B2 (ja) | 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム | |
KR20060043825A (ko) | 문자 대 음성 변환을 위한 단어 분절 방법 | |
KR20030078388A (ko) | 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법 | |
US8892435B2 (en) | Text data processing apparatus, text data processing method, and recording medium storing text data processing program | |
JP2012181358A (ja) | テキスト表示時間決定装置、テキスト表示システム、方法およびプログラム | |
JP2015158582A (ja) | 音声認識装置、及びプログラム | |
JP2002215187A (ja) | 音声認識方法及びその装置 | |
JP5766152B2 (ja) | 言語モデル生成装置、その方法及びプログラム | |
JP2007233823A (ja) | 自動要約装置及びコンピュータプログラム | |
JP4521631B2 (ja) | 木構造辞書を記録した記憶媒体、及び木構造辞書の言語スコアテーブル作成プログラム | |
JP2008293098A (ja) | 応答スコア情報生成装置、対話処理装置 | |
JP4478088B2 (ja) | 記号列変換方法、音声認識方法、記号列変換装置とプログラム、記録媒体 | |
JP2006209173A (ja) | 係り受け構造解析装置及びコンピュータプログラム | |
JP6867939B2 (ja) | 計算機、言語解析方法、及びプログラム | |
JP4243777B2 (ja) | トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 | |
KR100277690B1 (ko) | 화행 정보를 이용한 음성 인식 방법 | |
JP2007018462A (ja) | 機械翻訳装置、およびプログラム | |
JP4173404B2 (ja) | 文セット自動生成装置、文セット自動生成プログラム、記憶媒体 | |
JP2008293302A (ja) | 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム | |
JP2006126886A (ja) | 文短縮用知識の学習装置、文短縮装置、機械翻訳装置および文短縮のためのコンピュータプログラム | |
JP2005157823A (ja) | 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090227 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20091210 |