JP2005236543A - 映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム - Google Patents
映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム Download PDFInfo
- Publication number
- JP2005236543A JP2005236543A JP2004041591A JP2004041591A JP2005236543A JP 2005236543 A JP2005236543 A JP 2005236543A JP 2004041591 A JP2004041591 A JP 2004041591A JP 2004041591 A JP2004041591 A JP 2004041591A JP 2005236543 A JP2005236543 A JP 2005236543A
- Authority
- JP
- Japan
- Prior art keywords
- matching
- pattern
- video
- audio
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Studio Circuits (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Abstract
【解決手段】 本発明は、入力された映像音声と、入力されたシナリオテキストとを整合させ、映像音声とシナリオとの時間的な対応情報が記載されたインデックス情報テーブルを生成し、整合された結果をユーザに提示することにより得られた修正指示について、インデックス情報テーブルを参照して再整合する。
【選択図】 図1
Description
柳沼、和泉、坂内『同期されたシナリオ文書を用いた映像編集方式の一提案』電子情報通信学会論文誌 D-II, Vol.J79-D-II, No.4, pp.547-558, 1996 柳沼、坂内『DPマッチングを用いたドラマ映像・音声・シナリオ文書の対応付け手法の一提案』電子情報通信学会論文誌 D-II, Vol70-D-II, No.5, pp.747-755, 1996 谷村、中川『音声認識を用いたドラマのシナリオへの時刻情報付与』言語処理学会第5回年次大会講演論文集、pp.513-516, 1999、電子情報通信学会総合大会講演論文集、pp.377-378, 1999 谷村、中川『テレビドラマのシナリオと、音声トラックの自動対応付け』情報処理学会自然言語処理音声言語情報処理合同研究会 pp.23-29 谷村、中川「テレビドラマにおけるシナリオのセリフと音声トラックの同期システム」1999年度第13回人工知能学会全国大会講演論文集、pp.205-208,1999 谷村、中川『ドラマのビデオ音声トラックとシナリオのセリフの時刻同期法』情報処理学会、知識と複雑系研究会、pp.25-31, 1999 Wenli Zhang, Yoshitomo Yaginuma, Masao Sakauchi "A Video Movie Annotation System---Annotation Movie with its Script---" Proc. ICSP2000, pp. 1362-1366, 2000 Lawrence Rabiner, Biing-Hwang Juang(共著)、古井卓煕(監訳)、『音声認識の基礎(上)pp.242-287,NTTアドバンステクノロジ、東京、1995
映像音声入力手段から入力された映像音声と、シナリオテキスト入力手段から入力されたシナリオテキストとを整合させるパターン整合ステップ(ステップ1)と、
映像音声とシナリオとの時間的な対応情報を得るため、パターン整合ステップによって得られるマッチングパス情報に基づいて、インデックス情報テーブルを参照するインデックス情報テーブル参照ステップ(ステップ2)と、
整合された結果をユーザに提示する(ステップ3)ことにより得られた修正指示について(ステップ4)、インデックス情報テーブルを参照して(ステップ2)、再整合するマッチングパス情報修正ステップ(ステップ5)と、からなる。
映像音声入力手段から映像音声を入力し、シナリオテキスト入力手段からシナリオテキストを入力する入力ステップと、
入力された映像音声とシナリオテキストから、話者毎に一意に付与される話者IDに基づくパターンを生成するパターン生成ステップと、
パターンの各要素と、映像音声及びシナリオテキストとの対応関係を記載したインデックス情報を生成するインデックス情報生成ステップと、
対応付けを行う2つのパターンを指定するパターン対指定ステップと、
パターンマッチングを行う整合区間の始端と終端を初期化する整合区間初期化ステップと、
パターンマッチングを行うためのマッチング評価関数を再帰的に呼び出すマッチング評価関数呼び出しステップと、
マッチング評価関数によって計算されるパターン間距離が最小となるようなマッチングパスを取得し、記憶手段に記録するマッチングパス情報記録ステップと、を行う。
パターンマッチングを行うパターンの整合区間の始端と終端の番号を取得する始端終端取得ステップと、
パターン間の距離を計算するパターン間距離計算ステップと、
パターン間の距離が最小となるマッチングパスを選択するマッチングパス選択ステップと、を行う。
パターン整合ステップによって得られたマッチングパスについて、マッチングの修正を行う余地があるか否かを判定する終了条件判定ステップと、
ある1つのパターン(以下、パターン甲)の各要素に対する、ユーザに修正を促すか否かの判定基準となるスコアを算出するスコア算出ステップと、
パターン甲の各要素のスコアを全て算出するために、スコア算出ステップを繰り返す繰り返しステップと、
スコア算出ステップにより得られたスコアに基づいて、整合の状態をユーザに修正させるために、視覚的に映像を提示する映像提示ステップと、
ユーザにより修正された映像音声とシナリオテキストとの対応関係からインデックス情報テーブルを参照して、修正パターン要素番号を取得する修正パターン要素番号取得ステップと、
修正パターン要素番号に基づいて、再帰的にマッチング評価関数を呼び出すために必要な整合区間を指定する整合区間指定ステップと、
整合区間指定ステップで指定された区間でパターンマッチングを行うマッチング評価関数を呼び出し、パターンマッチングを行うことにより得られたマッチングパス情報を統合するマッチングパス統合ステップと、を行う。
m個の要素からなる2つのパターンP(p0,p1,…,pn−1)とパターンQ(q0,q1,…,qm−1)であるとき、
パターンPに含まれる任意の要素pnに対応付けられるパターンQ側の要素がいくつあるのかを示す指標s1nと、
パターンPに含まれる任意の要素pnに対応付けられるパターンQ側の要素とがどの程度分布するかを示す指標s2nと、
パターンPに含まれる任意の要素pnが、パターンP全体の中点にどれだけ近いかを示す指標s3nと、を用いて計算し、スコアSnが最大となるパターン要素nが修正に最適な候補とする。
映像音声入力手段1から入力された映像音声し、話者インデクシングを行い、話者毎に一意に付与される話者IDの並んだパターンと、パターンの各要素が映像のどこに対応するのかを記したインデックス情報を生成する映像音声解析手段3と、
シナリオテキスト入力手段2から入力されたシナリオテキストを解析し、台詞から話者IDの並んだパターンと、パターンの各要素が該シナリオテキストのどこに対応するのかを記したインデックス情報を生成するシナリオテキスト解析手段3と、
映像音声解析手段3とシナリオテキスト解析手段4において生成されたインデックス情報を格納するインデックス情報テーブル8と、
映像音声解析手段3から取得したパターンと、シナリオテキスト解析手段4から取得したパターンとを整合させるパターン整合手段5と、
パターン整合手段5で整合された結果をユーザに提示することにより得られた修正指示について、インデックス情報テーブルを参照して再整合する修正手段20と、を有する。
映像音声解析手段3とシナリオ解析手段4から取得したパターンから、対応付けを行う2つのパターンを指定するパターン対指定手段と、
パターンマッチングを行う整合区間の始端と終端を初期化する整合区間初期化手段と、
パターンマッチングを行うためのマッチング評価関数を再帰的に呼び出すマッチング評価関数呼び出し手段と、
マッチング評価関数によって計算されるパターン間距離が最小となるようなマッチングパスを取得し、記憶手段に記録するマッチングパス情報記録手段と、を含む。
パターンマッチングを行うパターンの整合区間の始端と終端の番号を取得する始端終端取得手段と、
パターン間の距離を計算するパターン間距離計算手段と、
パターン間の距離が最小となるマッチングパスを選択するマッチングパス選択手段と、を含む。
パターン整合手段5で得られたマッチングパスについて、マッチングの修正を行う余地があるか否かを判定する終了条件判定手段と、
ある1つのパターン(以下、パターン甲)の各要素に対する、ユーザに修正を促すか否かの判定基準となるスコアを算出するスコア算出手段と、
パターン甲の各要素のスコアを全て算出するために、スコア算出手段を繰り返す制御を行う繰り返し手段と、
スコア算出手段により得られたスコアに基づいて、整合の状態をユーザに修正させるために、視覚的に映像を表示手段に出力する映像提示手段と、
ユーザにより修正された映像音声とシナリオテキストとの対応関係からインデックス情報テーブルを参照して、修正パターン要素番号を取得する修正パターン要素番号取得手段と、
修正パターン要素番号に基づいて、再帰的にマッチング評価関数を呼び出すために必要な整合区間を指定する整合区間指定手段と、
整合区間指定ステップで指定された区間でパターンマッチングを行うマッチング評価関数を呼び出し、パターンマッチングを行うことにより得られたマッチングパス情報を統合するマッチングパス統合手段と、を含む。
m個の要素からなる2つのパターンP(p0,p1,…,pn−1)とパターンQ(q0,q1,…,qm−1)であるとき、
パターンPに含まれる任意の要素pnに対応付けられるパターンQ側の要素がいくつあるのかを示す指標s1nと、
パターンPに含まれる任意の要素pnに対応付けられるパターンQ側の要素とがどの程度分布するかを示す指標s2nと、
パターンPに含まれる任意の要素pnが、パターンP全体の中点にどれだけ近いかを示す指標s3nと、を用いて計算し、スコアSnが最大となるパターン要素nが修正に最適な候補とする手段を含む。
映像音声入力手段から入力された映像音声と、シナリオテキスト入力手段から入力されたシナリオテキストとを整合させるパターン整合ステップと、
映像音声とシナリオとの時間的な対応情報を得るため、パターン整合ステップによって得られるマッチングパス情報に基づいて、インデックス情報テーブルを参照するインデックス情報テーブル参照ステップと、
整合された結果をユーザに提示することにより得られた修正指示について、インデックス情報テーブルを参照して再整合するマッチングパス情報修正ステップと、をコンピュータに実行させる。
映像音声入力手段から映像音声を入力させ、シナリオテキスト入力手段からシナリオテキストを入力させる入力ステップと、
入力された映像音声とシナリオテキストから、話者毎に一意に付与される話者IDに基づくパターンを生成するパターン生成ステップと、
パターンの各要素と、映像音声及び前記シナリオテキストとの対応関係を記載したインデックス情報を生成するインデックス情報生成ステップと、
対応付けを行う2つのパターンを指定するパターン対指定ステップと、
パターンマッチングを行う整合区間の始端と終端を初期化する整合区間初期化ステップと、
パターンマッチングを行うためのマッチング評価関数を再帰的に呼び出すマッチング評価関数呼び出しステップと、
マッチング評価関数によって計算されるパターン間距離が最小となるようなマッチングパスを取得し、記憶手段に記録するマッチングパス情報記録ステップと、をコンピュータに実行させる。
パターンマッチングを行うパターンの整合区間の始端と終端の番号を取得する始端終端取得ステップと、
パターン間の距離を計算するパターン間距離計算ステップと、
パターン間の距離が最小となるマッチングパスを選択するマッチングパス選択ステップと、をコンピュータに実行させる。
パターン整合ステップによって得られたマッチングパスについて、マッチングの修正を行う余地があるか否かを判定する終了条件判定ステップと、
ある1つのパターン(以下、パターン甲)の各要素に対する、ユーザに修正を促すか否かの判定基準となるスコアを算出するスコア算出ステップと、
パターン甲の各要素のスコアを全て算出するために、スコア算出ステップを繰り返す繰り返しステップと、
スコア算出ステップにより得られたスコアに基づいて、整合の状態をユーザに修正させるために、視覚的に映像を提示する映像提示ステップと、
ユーザにより修正された映像音声とシナリオテキストとの対応関係からインデックス情報テーブルを参照して、修正パターン要素番号を取得する修正パターン要素番号取得ステップと、
修正パターン要素番号に基づいて、再帰的にマッチング評価関数を呼び出すために必要な整合区間を指定する整合区間指定ステップと、
整合区間指定ステップで指定された区間でパターンマッチングを行うマッチング評価関数を呼び出し、パターンマッチングを行うことにより得られたマッチングパス情報を統合するマッチングパス統合ステップと、をコンピュータに実行させる。
m個の要素からなる2つのパターンP(p0,p1,…,pn−1)とパターンQ(q0,q1,…,qm−1)であるとき、
パターンPに含まれる任意の要素pnに対応付けられるパターンQ側の要素がいくつあるのかを示す指標s1nと、
パターンPに含まれる任意の要素pnに対応付けられるパターンQ側の要素とがどの程度分布するかを示す指標s2nと、
パターンPに含まれる任意の要素pnが、パターンP全体の中点にどれだけ近いかを示す指標s3nと、を用いて計算し、スコアSnが最大となるパターン要素nが修正に最適な候補とするステップをコンピュータに実行させる。
D{Wc(M−m)+mWi}−MWi=Wc(M−m)(1−t)
となる。Wc>0及びM−m≧0は自明であることから、t>1であれば必ずD≦0となり、本発明の手法による作業量が従来手法に比較して少なくなることがわかる。
S2n={Max(nqi)―Min(nqi)}、(i=0,1,…,k−1);
s3n=Δ(n)(但し、Δ(n)は、n=0.5×(m−1)で最大値をとるような線形関数);
あるnに与えられるスコアSnは、上記S1n〜S3nを用い、
Sn=S1n+S2n+S3n (2)
の計算を行う。
Sn=w1・S1n+w2・S2n+w3・S3n
としてもよい。
ステップ240) ステップ220において、n<Nである場合は、前述の式(2)によりスコアSnを算出し、n=n+1として、ステップ220に戻る。
2 シナリオテキスト入力手段、シナリオテキスト入力部
3 映像音声解析手段、映像音声解析部
4 シナリオテキスト解析手段、シナリオテキスト解析部
5 パターン整合手段、パターン整合処理部
6 パターン統合処理部
7 Snスコア計算部
8 インデックス情報テーブル
9 映像/シナリオテキスト表示部
10 入力部
11 パターン分割処理部
20 修正手段
Claims (15)
- 映像音声とシナリオを整合させた状態を修正する装置における、映像音声とシナリオの整合状態の修正支援方法において、
映像音声入力手段から入力された映像音声と、シナリオテキスト入力手段から入力されたシナリオテキストとを整合させるパターン整合ステップと、
映像音声とシナリオとの時間的な対応情報を得るため、前記パターン整合ステップによって得られるマッチングパス情報に基づいて、インデックス情報テーブルを参照するインデックス情報テーブル参照ステップと、
整合された結果をユーザに提示することにより得られた修正指示について、インデックス情報テーブルを参照して再整合するマッチングパス情報修正ステップと、からなることを特徴とする映像音声とシナリオの整合状態の修正支援方法。 - 前記パターン整合ステップにおいて、
前記映像音声入力手段から前記映像音声を入力し、前記シナリオテキスト入力手段から前記シナリオテキストを入力する入力ステップと、
入力された前記映像音声と前記シナリオテキストから、話者毎に一意に付与される話者IDに基づくパターンを生成するパターン生成ステップと、
前記パターンの各要素と、前記映像音声及び前記シナリオテキストとの対応関係を記載したインデックス情報を生成するインデックス情報生成ステップと、
対応付けを行う2つのパターンを指定するパターン対指定ステップと、
パターンマッチングを行う整合区間の始端と終端を初期化する整合区間初期化ステップと、
前記パターンマッチングを行うためのマッチング評価関数を再帰的に呼び出すマッチング評価関数呼び出しステップと、
前記マッチング評価関数によって計算されるパターン間距離が最小となるようなマッチングパスを取得し、記憶手段に記録するマッチングパス情報記録ステップと、を行う請求項1記載の映像音声とシナリオの整合状態の修正支援方法。 - 前記マッチング評価関数呼び出しステップにおいて、
パターンマッチングを行うパターンの前記整合区間の始端と終端の番号を取得する始端終端取得ステップと、
パターン間の距離を計算するパターン間距離計算ステップと、
前記パターン間の距離が最小となるマッチングパスを選択するマッチングパス選択ステップと、を行う請求項2記載の映像音声とシナリオの整合状態の修正支援方法。 - 前記マッチングパス情報修正ステップにおいて、
前記パターン整合ステップによって得られたマッチングパスについて、マッチングの修正を行う余地があるか否かを判定する終了条件判定ステップと、
ある1つのパターン(以下、パターン甲)の各要素に対する、ユーザに修正を促すか否かの判定基準となるスコアを算出するスコア算出ステップと、
前記パターン甲の各要素のスコアを全て算出するために、前記スコア算出ステップを繰り返す繰り返しステップと、
前記スコア算出ステップにより得られたスコアに基づいて、整合の状態をユーザに修正させるために、視覚的に映像を提示する映像提示ステップと、
前記ユーザにより修正された映像音声とシナリオテキストとの対応関係から前記インデックス情報テーブルを参照して、修正パターン要素番号を取得する修正パターン要素番号取得ステップと、
前記修正パターン要素番号に基づいて、再帰的にマッチング評価関数を呼び出すために必要な整合区間を指定する整合区間指定ステップと、
前記整合区間指定ステップで指定された区間でパターンマッチングを行うマッチング評価関数を呼び出し、パターンマッチングを行うことにより得られたマッチングパス情報を統合するマッチングパス統合ステップと、を行う請求項1記載の映像音声とシナリオの整合状態の修正支援方法。 - 前記スコア算出ステップにおいて、
m個の要素からなる2つのパターンP(p0,p1,…,pn−1)とパターンQ(q0,q1,…,qm−1)であるとき、
前記パターンPに含まれる任意の要素pnに対応付けられる前記パターンQ側の要素がいくつあるのかを示す指標s1nと、
前記パターンPに含まれる任意の要素pnに対応付けられる前記パターンQ側の要素とがどの程度分布するかを示す指標s2nと、
前記パターンPに含まれる任意の要素pnが、前記パターンP全体の中点にどれだけ近いかを示す指標s3nと、を用いて計算し、スコアSnが最大となるパターン要素nが修正に最適な候補とする請求項4記載の映像音声とシナリオの整合状態の修正支援方法。 - 映像音声とシナリオを整合させた状態を修正する整合状態修正支援装置であって、
映像音声入力手段から入力された映像音声し、話者インデクシングを行い、話者毎に一意に付与される話者IDの並んだパターンと、パターンの各要素が映像のどこに対応するのかを記したとインデックス情報を生成する映像音声解析手段と、
シナリオテキスト入力手段から入力されたシナリオテキストを解析し、台詞から話者IDの並んだパターンと、パターンの各要素が該シナリオテキストのどこに対応するのかを記したインデックス情報を生成するシナリオテキスト解析手段と、
前記映像音声解析手段と前記シナリオテキスト解析手段において生成された前記インデックス情報を格納するインデックス情報テーブルと、
前記映像音声解析手段から取得したパターンと、前記シナリオテキスト解析手段から取得したパターンとを整合させるパターン整合手段と、
前記パターン整合手段で整合された結果をユーザに提示することにより得られた修正指示について、インデックス情報テーブルを参照して再整合する修正手段と、を有することを特徴とする整合状態修正支援装置。 - 前記パターン整合手段は、
前記映像音声解析手段と前記シナリオ解析手段から取得したパターンから、対応付けを行う2つのパターンを指定するパターン対指定手段と、
パターンマッチングを行う整合区間の始端と終端を初期化する整合区間初期化手段と、
前記パターンマッチングを行うためのマッチング評価関数を再帰的に呼び出すマッチング評価関数呼び出し手段と、
前記マッチング評価関数によって計算されるパターン間距離が最小となるようなマッチングパスを取得し、記憶手段に記録するマッチングパス情報記録手段と、を含む請求項6記載の整合状態修正支援装置。 - 前記マッチング評価関数呼び出し手段は、
パターンマッチングを行うパターンの前記整合区間の始端と終端の番号を取得する始端終端取得手段と、
パターン間の距離を計算するパターン間距離計算手段と、
前記パターン間の距離が最小となるマッチングパスを選択するマッチングパス選択手段と、を含む請求項7記載の整合状態修正支援装置。 - 前記修正手段は、
前記パターン整合手段で得られたマッチングパスについて、マッチングの修正を行う余地があるか否かを判定する終了条件判定手段と、
ある1つのパターン(以下、パターン甲)の各要素に対する、ユーザに修正を促すか否かの判定基準となるスコアを算出するスコア算出手段と、
前記パターン甲の各要素のスコアを全て算出するために、前記スコア算出手段を繰り返す制御を行う繰り返し手段と、
前記スコア算出手段により得られたスコアに基づいて、整合の状態をユーザに修正させるために、視覚的に映像を表示手段に出力する映像提示手段と、
前記ユーザにより修正された映像音声とシナリオテキストとの対応関係から前記インデックス情報テーブルを参照して、修正パターン要素番号を取得する修正パターン要素番号取得手段と、
前記修正パターン要素番号に基づいて、再帰的にマッチング評価関数を呼び出すために必要な整合区間を指定する整合区間指定手段と、
前記整合区間指定ステップで指定された区間でパターンマッチングを行うマッチング評価関数を呼び出し、パターンマッチングを行うことにより得られたマッチングパス情報を統合するマッチングパス統合手段と、を含む請求項6記載の整合状態修正支援装置。 - 前記スコア算出手段は、
m個の要素からなる2つのパターンP(p0,p1,…,pn−1)とパターンQ(q0,q1,…,qm−1)であるとき、
前記パターンPに含まれる任意の要素pnに対応付けられる前記パターンQ側の要素がいくつあるのかを示す指標s1nと、
前記パターンPに含まれる任意の要素pnに対応付けられる前記パターンQ側の要素とがどの程度分布するかを示す指標s2nと、
前記パターンPに含まれる任意の要素pnが、前記パターンP全体の中点にどれだけ近いかを示す指標s3nと、を用いて計算し、スコアSnが最大となるパターン要素nが修正に最適な候補とする手段を含む請求項9記載の整合状態修正支援装置。 - 映像音声とシナリオを整合させた状態を修正するコンピュータに実行させる整合状態修正支援プログラムであって、
映像音声入力手段から入力された映像音声と、シナリオテキスト入力手段から入力されたシナリオテキストとを整合させるパターン整合ステップと、
前記映像音声と前記シナリオとの時間的な対応情報を得るため、前記パターン整合ステップによって得られるマッチングパス情報に基づいて、インデックス情報テーブルを参照するインデックス情報テーブル参照ステップと、
整合された結果をユーザに提示することにより得られた修正指示について、インデックス情報テーブルを参照して再整合するマッチングパス情報修正ステップと、をコンピュータに実行させることを特徴とする整合状態修正支援プログラム。 - 前記パターン整合ステップにおいて、
前記映像音声入力手段から前記映像音声を入力させ、前記シナリオテキスト入力手段から前記シナリオテキストを入力させる入力ステップと、
入力された前記映像音声と前記シナリオテキストから、話者毎に一意に付与される話者IDに基づくパターンを生成するパターン生成ステップと、
前記パターンの各要素と、前記映像音声及び前記シナリオテキストとの対応関係を記載したインデックス情報を生成するインデックス情報生成ステップと、
対応付けを行う2つのパターンを指定するパターン対指定ステップと、
パターンマッチングを行う整合区間の始端と終端を初期化する整合区間初期化ステップと、
前記パターンマッチングを行うためのマッチング評価関数を再帰的に呼び出すマッチング評価関数呼び出しステップと、
前記マッチング評価関数によって計算されるパターン間距離が最小となるようなマッチングパスを取得し、記憶手段に記録するマッチングパス情報記録ステップと、をコンピュータに実行させる請求項11記載の整合状態修正支援プログラム。 - 前記マッチング評価関数呼び出しステップにおいて、
パターンマッチングを行うパターンの前記整合区間の始端と終端の番号を取得する始端終端取得ステップと、
パターン間の距離を計算するパターン間距離計算ステップと、
前記パターン間の距離が最小となるマッチングパスを選択するマッチングパス選択ステップと、をコンピュータに実行させる請求項12記載の整合状態修正支援プログラム。 - 前記マッチングパス情報修正ステップにおいて、
前記パターン整合ステップによって得られたマッチングパスについて、マッチングの修正を行う余地があるか否かを判定する終了条件判定ステップと、
ある1つのパターン(以下、パターン甲)の各要素に対する、ユーザに修正を促すか否かの判定基準となるスコアを算出するスコア算出ステップと、
前記パターン甲の各要素のスコアを全て算出するために、前記スコア算出ステップを繰り返す繰り返しステップと、
前記スコア算出ステップにより得られたスコアに基づいて、整合の状態をユーザに修正させるために、視覚的に映像を提示する映像提示ステップと、
前記ユーザにより修正された映像音声とシナリオテキストとの対応関係から前記インデックス情報テーブルを参照して、修正パターン要素番号を取得する修正パターン要素番号取得ステップと、
前記修正パターン要素番号に基づいて、再帰的にマッチング評価関数を呼び出すために必要な整合区間を指定する整合区間指定ステップと、
前記整合区間指定ステップで指定された区間でパターンマッチングを行うマッチング評価関数を呼び出し、パターンマッチングを行うことにより得られたマッチングパス情報を統合するマッチングパス統合ステップと、をコンピュータに実行させる請求項11記載の整合状態修正支援プログラム。 - 前記スコア算出ステップにおいて、
m個の要素からなる2つのパターンP(p0,p1,…,pn−1)とパターンQ(q0,q1,…,qm−1)であるとき、
前記パターンPに含まれる任意の要素pnに対応付けられる前記パターンQ側の要素がいくつあるのかを示す指標s1nと、
前記パターンPに含まれる任意の要素pnに対応付けられる前記パターンQ側の要素とがどの程度分布するかを示す指標s2nと、
前記パターンPに含まれる任意の要素pnが、前記パターンP全体の中点にどれだけ近いかを示す指標s3nと、を用いて計算し、スコアSnが最大となるパターン要素nが修正に最適な候補とするステップをコンピュータに実行させる請求項14記載の整合状態修正支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004041591A JP4079096B2 (ja) | 2004-02-18 | 2004-02-18 | 映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004041591A JP4079096B2 (ja) | 2004-02-18 | 2004-02-18 | 映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005236543A true JP2005236543A (ja) | 2005-09-02 |
JP4079096B2 JP4079096B2 (ja) | 2008-04-23 |
Family
ID=35019065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004041591A Expired - Fee Related JP4079096B2 (ja) | 2004-02-18 | 2004-02-18 | 映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4079096B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007295218A (ja) * | 2006-04-25 | 2007-11-08 | Nippon Hoso Kyokai <Nhk> | ノンリニア編集装置およびそのプログラム |
JP2009182859A (ja) * | 2008-01-31 | 2009-08-13 | Ntt Communications Kk | 字幕出力装置、字幕出力方法、及びプログラム |
KR20150022601A (ko) * | 2013-08-23 | 2015-03-04 | 삼성전자주식회사 | 저장된 정보 표시 방법 및 그 전자 장치 |
CN115580390A (zh) * | 2022-08-24 | 2023-01-06 | 京信数据科技有限公司 | 一种安全多方计算下的多场景模式计算方法及系统 |
-
2004
- 2004-02-18 JP JP2004041591A patent/JP4079096B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007295218A (ja) * | 2006-04-25 | 2007-11-08 | Nippon Hoso Kyokai <Nhk> | ノンリニア編集装置およびそのプログラム |
JP2009182859A (ja) * | 2008-01-31 | 2009-08-13 | Ntt Communications Kk | 字幕出力装置、字幕出力方法、及びプログラム |
KR20150022601A (ko) * | 2013-08-23 | 2015-03-04 | 삼성전자주식회사 | 저장된 정보 표시 방법 및 그 전자 장치 |
KR102114729B1 (ko) * | 2013-08-23 | 2020-05-26 | 삼성전자주식회사 | 저장된 정보 표시 방법 및 그 전자 장치 |
CN115580390A (zh) * | 2022-08-24 | 2023-01-06 | 京信数据科技有限公司 | 一种安全多方计算下的多场景模式计算方法及系统 |
CN115580390B (zh) * | 2022-08-24 | 2023-08-25 | 京信数据科技有限公司 | 一种安全多方计算下的多场景模式计算方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP4079096B2 (ja) | 2008-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9117450B2 (en) | Combining re-speaking, partial agent transcription and ASR for improved accuracy / human guided ASR | |
US8311832B2 (en) | Hybrid-captioning system | |
KR102085908B1 (ko) | 컨텐츠 제공 서버, 컨텐츠 제공 단말 및 컨텐츠 제공 방법 | |
CN109754783B (zh) | 用于确定音频语句的边界的方法和装置 | |
JP5149107B2 (ja) | 音響処理装置およびプログラム | |
US20200126559A1 (en) | Creating multi-media from transcript-aligned media recordings | |
JP2008083459A (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
US7046300B2 (en) | Assessing consistency between facial motion and speech signals in video | |
WO2014141054A1 (en) | Method, apparatus and system for regenerating voice intonation in automatically dubbed videos | |
JP5296598B2 (ja) | 音声情報抽出装置 | |
JP6327745B2 (ja) | 音声認識装置、及びプログラム | |
US11967248B2 (en) | Conversation-based foreign language learning method using reciprocal speech transmission through speech recognition function and TTS function of terminal | |
EP3839953A1 (en) | Automatic caption synchronization and positioning | |
Lanchantin et al. | The development of the Cambridge University alignment systems for the Multi-Genre Broadcast challenge | |
JP2006243575A (ja) | 音声書き起こし支援装置およびその方法ならびにプログラム | |
JP2010109898A (ja) | 撮影制御装置、撮影制御方法及びプログラム | |
JP4079096B2 (ja) | 映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム | |
KR101618777B1 (ko) | 파일 업로드 후 텍스트를 추출하여 영상 또는 음성간 동기화시키는 서버 및 그 방법 | |
JP2016080863A (ja) | 音声認識誤り修正装置 | |
CN114842858A (zh) | 一种音频处理方法、装置、电子设备及存储介质 | |
Saz et al. | Lightly supervised alignment of subtitles on multi-genre broadcasts | |
JP2009116107A (ja) | 情報処理装置及び方法 | |
Katsalis et al. | NLP-Theatre: Employing Speech Recognition Technologies for Improving Accessibility and Augmenting the Theatrical Experience | |
KR101501705B1 (ko) | 음성 데이터를 이용한 문서 생성 장치, 방법 및 컴퓨터 판독 가능 기록 매체 | |
Mocanu et al. | Automatic subtitle synchronization and positioning system dedicated to deaf and hearing impaired people |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110215 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120215 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130215 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |