JP4958120B2

JP4958120B2 - 支援装置、支援プログラム、および支援方法

Info

Publication number: JP4958120B2
Application number: JP2009041464A
Authority: JP
Inventors: 浩昭小瀬木; 晃太郎宮本; 隆斉藤
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2009-02-24
Filing date: 2009-02-24
Publication date: 2012-06-20
Anticipated expiration: 2029-02-24
Also published as: US20100214476A1; JP2010198247A; US8401857B2

Description

本発明は、支援装置、支援プログラム、および支援方法に関する。

従来、ニュースまたは映画等の音声付動画像の中には、字幕が付されて放送または上映等されるものがある。そこで、字幕編集者は、放送等の前に音声付動画像を見て、字幕を付さなければならない。なお、現時点で先行技術文献の存在を認識していないので、先行技術文献に関する記載を省略する。

ニュース等の中には、放送までは内容を秘密にすべきものがある。しかしながら、従来の方法では、ニュース等の内容が放送前に字幕編集者に知られてしまう。例えば、ある企業の不祥事のニュースを証券取引所がクローズした後に放送する予定である場合に、字幕編集者は、証券取引所がクローズする前からニュース映像に字幕を付すことがありうる。この場合、字幕編集者は、証券取引所が開いている間にニュースの内容を知ってしまうので、ニュースの内容を悪用しうる立場となってしまう。また例えば、字幕編集者が、未公開映画に字幕を付ける場合がある。この場合、字幕編集者は、映画の公開前から映画のストーリーおよび結末を知ってしまうので、公開前に映画のストーリーまたは結末を漏洩しうる立場となってしまう。

上記課題を解決するために、本発明の第１の態様においては、元データから作業済データを作成する作業を支援する支援装置であって、前記元データの内容を作業者に対して秘匿するべく、複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、を備え、前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させることを特徴とする支援装置、並びに、当該支援装置に関する支援プログラムおよび支援方法を提供する。

本発明の第２の態様においては、元データから作業済データを作成する作業を支援する支援装置であって、音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、作業者が前記インターフェイス部を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶部に登録する語句登録部と、を備える支援装置、並びに、当該支援装置に関する支援プログラムおよび支援方法を提供する。

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

図１は、本実施形態に係る支援システム１０の構成を示す。支援システム１０は、１または複数の作業者１２０が例えばニュースの音声付動画像に字幕を付す等の作業をする場合に、１または複数の作業者１２０に対してニュースの内容を秘匿しつつ、字幕編集作業をさせる。

支援システム１０は、支援装置１００と、１または複数の作業者１２０ａ〜ｃにより使用される１または複数の端末１１０ａ〜ｃと、ネットワーク１３０とを備える。支援装置１００は、音声付動画像等の元データから、字幕が付された音声付動画像等の作業済データを作成する作業を支援する。本実施形態においては、音声付動画像に字幕を付す作業を例に説明するが、支援システム１０は、元データを作業者に参照させて作業済データを作成させる各種の作業を支援してもよい。このような作業の例として、支援システム１０は、音声、静止画像、動画像、または音声付動画像に解説または翻訳した音声等の音声を付加する作業、または手話の映像を付加する作業を支援しうる。また、支援システム１０は、テキストの元データを翻訳してテキストの作業済データを作成する作業、およびテキストの元データを読み上げて音声の作業済データを作成する作業等も支援しうる。

端末１１０ａ〜ｃ（以下端末１１０と総称する）のそれぞれは、作業者１２０ａ〜ｃ（以下作業者１２０と総称する）のそれぞれが支援装置１００による支援を受けながら元データから作業済データを作成する作業をするために用いられ、対応する作業者１２０との間で情報を授受する。ネットワーク１３０は、１または複数の端末１１０と、支援装置１００との間を接続する。ネットワーク１３０は、有線及び／又は無線のインターネット、イントラネット、およびローカルエリアネットワーク等であってよい。

図２は、本実施形態に係る支援装置１００の構成を示す。支援装置１００は、元データ記憶部２００と、音声認識部２１０と、変換部２２０と、語句記憶部２３０と、均一化部２４０と、インターフェイス部２５０と、作業者情報記憶部２６０と、語句登録部２７０と、逆変換部２８０と、作業済データ記憶部２９０とを備える。元データ記憶部２００は、作業前の元データの一例として、音声付動画データを記憶する。音声認識部２１０は、元データの音声を音声認識して、音声認識テキストを生成する。音声を音声認識して音声認識テキストを生成する方法は、従来技術であるので、本明細書においては説明を省略する。

変換部２２０は、元データの内容を作業者１２０ａ〜ｃに対して秘匿するべく、元データを変換データに変換する。本実施形態において、変換部２２０は、音声付動画の映像および音声を含む元データを変換データに変換する。また、変換部２２０は、元データの音声認識テキストを変換データの音声認識テキストに変換する。

具体的には、変換部２２０は、元データの音声付動画、音声、および音声認識テキストを、ニュース等のトピック単位、文単位、及び／又は語句単位等の予め定められた単位で区切り、区切り毎に語句記憶部２３０に格納された秘密にするべき語句が含まれているか否かを判断する。そして、変換部２２０は、秘密にするべき語句が含まれている区切りに対して、以下に概説する内容不推定化処理および内容不完全化処理の少なくとも１つを施して、作業者に対し内容を秘匿する。

（１）内容不推定化処理
変換部２２０は、元データの音声および元データの音声認識テキストの少なくとも１つの対応する箇所、より好ましくは元データの内容を隠蔽するのに十分な数の対応する箇所に、他の音声および他のテキストを挿入して変換データおよび変換データの音声認識テキストを生成する。これにより、変換部２２０は、変換データのどの部分が元データに対応するものかを作業者が把握できないようにして、元データの内容を隠蔽する。

（２）内容不完全化処理
変換部２２０は、元データおよび元データの音声認識テキストをそれぞれ同様に並び替えて変換データおよび変換データの音声認識テキストを生成する。これにより、変換部２２０は、複数のニュース、複数の文、または複数の語句等が並び替えられて入り混じった変換データ等を生成することができ、作業者が元の順番に並べ直して元データの内容を把握するのを困難にする。

語句記憶部２３０は、複数の語句のそれぞれについて、当該語句の秘密度（例えば、当該語句を作業者１２０ａ〜ｃに対して秘密にするべきか否か、及び／又は当該語句の秘密を守るべき度合）と、当該語句を作業者１２０ａ〜ｃに提示してよい提示タイミングとを記憶する。均一化部２４０は、変換部２２０が出力する変換データおよび変換データの音声認識テキストに対して、以下に概説する話者不特定か処理を施して、作業者に対して内容を秘匿する。

（３）話者不特定化処理
均一化部２４０は、変換部２２０が生成した変換データの音声における、音の高さ、音の強さ、および発話速度のうちの少なくとも１つを均一化する。これにより、均一化部２４０は、内容不推定化処理によってダミーの音声等が挿入された変換データ、及び／又は内容不完全化処理によって並び替えられた変換データののそれぞれの部分における話者を区別困難とする。この結果、変換部２２０は、作業者が特定話者の音声部分を抽出できなくして、作業者に対して内容を秘匿する。

インターフェイス部２５０は、１または複数のネットワーク１３０を介して変換データを１または複数の作業者１２０に提供して、作業者により変換データを元に作業させて作業済の変換データを作成させる。ニュース等に字幕を付す作業を支援する場合、インターフェイス部２５０は、変換データを作業者１２０に提供して、変換データを元に音声に応じた字幕のテキストを含む作業済の変換データを作成させる。ここで、作業者１２０による作業は、例えば変換データのテキストを編集して作業済の変換データとする場合のように、変換データの少なくとも一部が作業済の変換データにも含まれるものであってよい。これに代えて、作業者１２０による作業は、例えば変換データのテキストを見ながら、新たな翻訳テキストを作成する場合のように、変換データとは全く異なる作業済の変換データ、換言すれば変換データに対する作業済データを作成するものであってもよい。

作業者情報記憶部２６０は、複数の作業者１２０のそれぞれに対して提示してよい語句の秘密度の上限を記憶する。語句登録部２７０は、作業者による作業の結果、秘密にすべき語句を新たに見つけた場合に、当該語句を語句記憶部２３０に登録する。

逆変換部２８０は、作業済の変換データを逆変換して作業済データを生成する。ニュース等に字幕を付す作業を支援する場合、逆変換部２８０は、作業済の変換データを逆変換して音声付動画に付加する字幕のテキストを含む作業済データを生成する。ここで、内容不推定化処理が施されている場合には、逆変換部２８０は、作業済の変換データから他の音声および他のテキストに対応する部分を取り除いて作業済データを生成する。また、内容不完全化処理が施されている場合には、逆変換部２８０は、作業済の変換データを元の順序に並べ直して作業済データを生成する。

作業済データ記憶部２９０は、逆変換部２８０が出力する作業済データを格納する。格納された作業済データは、後に放送または上映等される。また、変換部２２０は、既に逆変換部２８０に格納された作業済データを、後の内容不推定化処理において元データに挿入する他の音声及び／又はテキストとして用いてもよい。

以上に示した支援装置１００によれば、元データに対して内容不推定化処理、内容不完全化処理、および話者不特定化処理の少なくとも１つを施して変換データに変換して作業者に作業させて、作業後に逆変換して作業済データを生成することができる。これにより、支援装置１００は、元データの内容を作業者に対して秘匿することができる。

なお、音声またはテキストの元データから、音声またはテキストの作業済データを作成する作業を支援する場合、変換部２２０は、音声またはテキストの元データを音声またはテキストの変換データに変換する。そして、逆変換部２８０は、音声またはテキストの作業済の変換データを逆変換して音声またはテキストの作業済データを生成する。また、音声の元データからテキストの作業済データを作成する作業を支援する場合、変換部２２０は、音声の元データを音声の変換データに変換する。次に、インターフェイス部２５０は、変換データを作業者１２０に提供して、変換データの音声を元に作業済の変換データのテキストを作成させる。そして、逆変換部２８０は、作業済の変換データを逆変換して、テキストの作業済データを生成する。

図３は、本実施形態に係る語句記憶部２３０の内容の一例を示す。語句記憶部２３０は、１または複数の語句のそれぞれに対応付けて、当該語句を作業者に対して秘密にするべきか否か、及び／又は当該語句の秘密度を示す「リスク係数」と、当該語句を作業者に提示してよい提示タイミングを示す「処理制限時間」と、当該語句を含む区切りに対して適用すべき処理を示す「リスク対応」とを記憶する。

例えば、図中元データにおける語句Ｗ１には、リスク係数「高」が付されている。また、当該語句Ｗ１には、処理制限時間は３時間であるから対応するニュースを放送する３時間前以前に作業者に提供してはならない旨の制限が付されている。また、当該語句Ｗ１には、「ニュース単位でセキュア字幕処理」を、セキュア度「高」で実行すべきことが付されている。

また例えば、図中元データにおける語句ＷＣ３、ＷＣ４、およびＷＣ５の組には、リスク係数「高」が付されている。また、処理制限時間は１時間である。そして、当該語句ＷＣ３、ＷＣ４、およびＷＣ５を含む区切りについては、「１文単位でセキュア情報処理」を、セキュア度「高」で実行すべきことが付されている。

語句記憶部２３０に登録されるべき語句は、その語句を含むトピック、文、及び／又は文節等が正式な放送または公開等の前に知られると、不正に利用されて第三者に被害が及ぶ等の悪影響が生じうるものである。このような語句の一例としては、「情報漏えい」、「工場火災」、および「不正取引」等の企業のインサイダー情報となりうるもの、並びに、「氏名」、「住所」、「電話番号」、および「メールアドレス」等の個人情報に関するもの等が挙げられる。

以上において、語句記憶部２３０は、提供タイミングの一例として、放送時刻を基準として、当該放送時刻よりどれだけ前から登録語句を作業者１２０に提供してよいかを示す処理制限時間を記憶している。これに代えて、語句記憶部２３０は、提供タイミングの一例として、例えば元データの作成日時または元データ記憶部２００への書き込み日時を基準として、語句記憶部２３０に登録された語句を作業者１２０に提供してはならない期間を示す処理制限時間を記憶してもよい。また、語句記憶部２３０は、提供タイミングの一例として、予め定められた各種の時点を基準として、語句記憶部２３０に登録された語句を作業者１２０に提供してよくなるタイミングを示す情報を保持してもよい。

図４は、本実施形態に係る作業者情報記憶部２６０の内容の一例を示す。作業者情報記憶部２６０は、複数の作業者のそれぞれについて、作業者を識別する識別情報である「作業者ＩＤ」と、当該作業者に対して提示してよい元データ中の語句の秘密度の上限を示す「リスク係数上限」とを記憶する。

例えば、作業者１２０ａは、作業者ＩＤが「Ａ」であり、リスク係数上限は「高」である。したがって、支援装置１００は、作業者１２０ａに対して元データにおける秘密度「高」以下の語句を含む部分を提示してもよい。

また、作業者１２０ｂは、作業者ＩＤが「Ｂ」であり、リスク係数上限は「中」である。したがって、支援装置１００は、作業者１２０ｂに対して元データにおける秘密度「中」以下の語句を含む部分を提示してもよいが、秘密度「高」の語句を含む部分を提示することができない。

なお、本実施形態において秘密度は、「高」、「中」、「低」に分類される。これに代えて秘密度は、数値によって秘密の度合を表したものでもよく、ブール値によって秘密か否かを示したものであってもよい。

図５は、本実施形態に係る支援装置１００の動作フローを示す。まず、音声認識部２１０は、元データ記憶部２００から音声付動画データ等の元データを読み出す。そして音声認識部２１０は、元データの音声を音声認識して、音声認識テキストを生成する（ステップＳ５００）。

次に、変換部２２０は、元データの動画、音声、および音声認識テキストのトピック単位、文単位、及び／又は語句単位等の予め定められた単位毎の区切りを検出する（Ｓ５１０）。変換部２２０は、音声データ中の発話されていない空白期間の長さが基準空白時間であることを条件として、文区切り及び／又はトピック区切りを検出してよい。また、変換部２２０は、例えば「次のニュースです。」および「さて、スポーツコーナーです。」等といった予め設定された区切り定型語句が発話されたことを条件として、トピック区切りを検出してもよい。これに代えて、またはこれに加えて、変換部２２０は、映像が予め設定された基準変化量以上変化している映像の切り替わりを検出したかどうかを評価して、トピック区切りの検出精度を高めてもよい。また、変換部２２０は、音声認識における形態素解析結果を利用して、文区切り及び／又は語句区切りを検出してもよい。

次に、変換部２２０は、区切り毎に、秘密にするべき語句が含まれているか否かを判断する（Ｓ５２０）。一例として変換部２２０は、音声認識テキスト中に語句記憶部２３０に記憶された登録語句と一致する語句が含まれているかどうか、及び／又は音声認識テキスト中に登録語句と予め設定された評価値以上の類似度を有する語句が含まれているかどうかを検索する。

そして、変換部２２０は、音声認識テキスト中に登録語句とマッチする語句が含まれている場合に、音声認識テキスト中の対応する区切り部分に、当該登録語句に対応付けられたリスク係数で示される秘密度を割り当てる。ある区切り部分に２以上の登録語句がマッチする場合には、変換部２２０は、当該区切り部分に当該２以上の登録語句に応じたリスク係数のうち、最大のリスク係数を割り当てる。なお、変換部２２０は、当該登録語句に対応付けて語句記憶部２３０に記憶されたリスク対応の設定に応じ、当該登録語句を含むトピック全体、文、文節、及び／又は語句等のうちどの範囲の区切りをセキュア処理の対象とするかを決定してよい。

次に、変換部２２０は、秘密が含まれている区切り部分の動画、音声、及び音声認識テキストに対して、内容不推定化処理、および内容不完全化処理等のセキュア処理を施す（Ｓ５３０）。また、均一化部２４０は、変換部２２０が出力する変換データの音声に対して、話者不特定化処理を施す。ここで、変換部２２０および均一化部２４０は、秘密が含まれていない区切り部分については、セキュア処理を施さず、作業者１２０への秘匿無しに字幕作成作業ができるよう元データのまま維持してよい。

次に、インターフェイス部２５０は、変換部２２０および均一化部２４０により変換された動画および音声を含む変換データ、および変換データの音声認識テキストを１または複数の作業者１２０に提供して、変換データの音声認識テキストを編集させて変換データの音声に応じた字幕を作成させる（Ｓ５４０）。複数の作業者１２０で作業を分担する場合には、インターフェイス部２５０は、変換データを分割した複数の分割データを複数の作業者１２０ａ〜ｃに分散して提供して、複数の作業者１２０のそれぞれにより分割データを元に作業させる。そしてインターフェイス部２５０は、複数の作業済の分割データを集約して作業済の変換データを生成する。

次に、語句登録部２７０は、作業済の音声認識テキストを検索して、音声認識テキスト中に、語句記憶部２３０に記憶された登録語句に書き換えられた語句があるかどうかを検出する（Ｓ５５０）。少なくとも一人の作業者１２０がインターフェイス部２５０を介して変換データの音声認識テキスト中のある語句を、秘密にするべき登録語句に書き換えていた場合、語句登録部２７０は、書き換え前のこの語句を秘密にするべき語句として語句記憶部２３０に登録する（Ｓ５６０）。これにより語句登録部２７０は、以降において音声認識で同様の誤認識が発生した場合においても、誤認識した語句を秘密にすべきリスク語句として特定可能とする。

逆変換部２８０は、作業済の音声認識テキストを逆変換して、字幕用のテキストデータを生成する。そして、逆変換部２８０は、作成した字幕用のテキストデータを、音声付動画の元データの対応する箇所に付加する（Ｓ５７０）。

以上に示した支援装置１００によれば、音声付動画データを元データとして変換データおよび変換データの音声認識テキストを生成することにより、元データの内容を作業者に対して秘匿した状態で作業者に字幕の編集作業をさせることができる。そして、支援装置１００は、編集された字幕用のテキストデータを、音声付動画の元データに付加することにより、作業者に対して内容を秘匿しつつ、字幕が付された音声付動画を作成することができる。

以上において、支援装置１００は、区切り毎に秘密にするべき語句が含まれているかどうかを判断せずに、元データ全体に対してセキュア処理を施してもよい。この場合、例えば「桜の開花」等の作業者に対して秘密にしなくてもよいトピック等に対してもセキュア処理をするので、作業の負担が大きくなる可能性がある。その一方で、支援装置１００は、秘密にすべきトピック等が語句記憶部２３０の登録語句を含まない場合であっても、一律にセキュア処理を施すから、安全性を高めうる。

また、変換部２２０及び／又はインターフェイス部２５０は、元データ中における秘密にすべき区切り部分の動画については、作業者に提供しないようにしてもよい。これにより、支援装置１００は、元データの内容をより高い秘密度で保護することができる。

図６は、本実施形態に係る支援装置１００による字幕編集作業の一例を示す。音声認識部２１０は、元データの音声を音声認識して、音声認識テキストを生成する。変換部２２０は、音声認識テキスト上で、ニュース単位等のトピック区切り、文単位の文区切り、および語句単位の語句区切り等を検出する。ここで、変換部２２０は、前述のように区切り定型語句からトピック区切りを検出してもよく、音声認識における形態素解析の結果から文区切り等を検出してもよい。更に変換部２２０は、音声の空白期間を調査して結果をフィードバックして、検出した区切り位置を調整してもよい。

次に、インターフェイス部２５０は、変換部２２０および均一化部２４０によりセキュア処理された変換データの音声認識テキストを１または複数の作業者１２０に提供して、編集作業をさせる。作業者１２０は、変換済データの動画および音声と、変換済データの音声認識テキストとを参照して、音声認識テキストを編集して修正する。この結果、インターフェイス部２５０は、修正された作業済テキストを得ることができる。本図においては、説明を簡単にするために、音声認識テキストに対してセキュア処理が施されていない例を挙げている。本図の例では、作業者１２０は、誤認識された「ＸＺ」を「ＸＸ」に修正しており、また、「漏ネい事件」を「漏洩事件」に修正している。

ここで「ＸＸ」がリスク語句として語句記憶部２３０に登録されている場合、語句登録部２７０は、作業者によって「ＸＸ」に書き換えられた「ＸＺ」を語句記憶部２３０に登録する。語句登録部２７０は、「ＸＺ」に対しても、「ＸＸ」と同様のリスク係数、処理制限時間、およびリスク対応を付与してよい。これにより、以後の音声認識において「ＸＸ」が「ＸＺ」に誤認識された場合に、支援装置１００は、「ＸＺ」をもリスク語句として認識することができ、適切なセキュア処理を施すことができる。

図７は、本実施形態に係る支援装置１００による変換処理の第１例として、内容不完全化処理を示す。本図において、元データは、文、文節、及び／又は語句等の区切りＳ１−Ｓ３を順に含むニュースＮ１と、区切りＳ４−Ｓ７を順に含むニュースＮ２と、区切りＳ８−Ｓ１０を順に含むニュースＮ３とを、この順に有する。

変換部２２０は、内容不完全化処理において、元データの動画および音声と、元データの音声認識テキストとをそれぞれ並べ替えて、変換データを生成する。本図の例において、変換部２２０は、ニュースＮ３の区切りＳ８をニュースＮ２の区切りＳ４の前に移動させ、ニュースＮ２の区切りＳ７をニュースＮ３の区切りＳ９の後に移動させて変換データおよび音声認識テキストを生成している。

ここで、変換部２２０は、元データおよび元データの音声認識テキストの中において秘密にするべき語句を分散させるようにしてもよい。すなわち、変換部２２０は、区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化するように、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させる。

更に、インターフェイス部２５０は、生成された変換データおよび音声認識テキストを分割して、複数の分割データを複数の作業者１２０に分散して提供する。本図の例において、インターフェイス部２５０は、ニュースＮ１の区切りＳ１を作業者１２０ａに、区切りＳ２を作業者１２０ｂに、区切りＳ３を作業者１２０ｃに、並べ替えにより移動されたニュースＮ３の区切りＳ８とニュースＮ２の区切りＳ４とを作業者１２０ａに、…という様に、内容不完全化処理済の変換データを区切り毎にほぼインタリーブして複数の作業者１２０に分散している。このように、インターフェイス部２５０は、変換データを複数の作業者１２０に分散させることによって、変換データの一部を受け取った作業者１２０が元データの内容を把握するのを更に困難にすることができる。

ここで、インターフェイス部２５０は、それぞれの分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者１２０ａ〜ｃを選択してもよい。ニュースＮ２の区切りＳ４の秘密度が「高」であった場合、インターフェイス部２５０は、区切りＳ４をリスク係数上限が「中」の作業者１２０ｂに分配せず、本図に例示したように秘密度の条件を満たすことができる作業者１２０ａ等に分配してよい。

また、インターフェイス部２５０は、変換データおよび変換データの音声認識テキストにおける、提示タイミングに対応付けられた登録語句を含む部分を検索して、当該部分を当該提示タイミングを満たすタイミングで作業者１２０に提示する。これを実現するために、インターフェイス部２５０は、並べ替えられた各区切りを作業者１２０に提供するタイミングを、当該区切りについての提示タイミングに応じて遅延させてよい。これに代えて、インターフェイス部２５０は、各区切りが対応する提示タイミングを満たすように、複数の区切りを並べ替えてもよい。例えば、インターフェイス部２５０は、提示タイミングの制約がない区切り、およびより早くに提示可能な提示タイミングを有する区切りをより前に移動させ、より遅くまで提示できない提示タイミングを有する区切りをより後ろに移動させてもよい。この場合においてインターフェイス部２５０は、全ての区切りについて提示タイミングを満たすようにする。

以上に例示した処理により、支援装置１００は、複数のトピックの内容が入り混じった変換データの一部ずつを各作業者に分散させることができる。これにより支援装置１００は、元データの内容が漏洩するのを防ぐことができる。なお、以上の処理において、変換部２２０は、元データおよび音声認識テキストの順序を並べ替えるだけでなく、並べ替えた区切り同士の間の時間的間隔を各区切り部分の秘密度に応じて更に変更してもよい。

なお、変換部２２０は、上記の並べ替えをした場合に、一例として変換前の元データにおける各区切りが、変換データにおけるどの位置に移動されたかを示す対応表を生成して、均一化部２４０およびインターフェイス部２５０を介して逆変換部２８０へと渡してよい。これにより、逆変換部２８０は、当該対応表を参照して、変換データにおける各区切りを元データにおける順序に並べ直すことができる。

図８は、本実施形態に係る支援装置１００による変換処理の第２例として、内容不推定化処理を示す。本図において、元データは、文、文節、及び／又は語句等の区切りＳ１−Ｓ３を順に含むニュースＮ１と、区切りＳ４−Ｓ７を順に含むニュースＮ２と、区切りＳ８−Ｓ１０を順に含むニュースＮ３とを、この順に有する。説明を簡潔にするため、本図においては作業者１２０ａに提供する変換済データに関する内容不推定化処理を例示する。

変換部２２０は、内容不推定化処理において、元データの動画および音声と、元データの音声認識テキストのそれぞれの対応する少なくとも１つの箇所に他の動画および音声、並びに他のテキストを挿入する。本図のパターン１は、元データのニュース間に、他のニュースのデータを挿入した例である。また、本図のパターン２は、元データのニュース間に、既に字幕が付された他のニュースのデータを挿入した例である。変換部２２０は、以前に字幕を付した他のニュースのデータを作業済データ記憶部２９０から読み出して、字幕のテキストを除いて現在処理中の元データのニュース間に追加してよい。

以上のように、変換部２２０は、元データのトピック、文、文節、及び／又は語句の間に、他のトピック、文、文節、及び／又は語句を挿入する。これにより、変換部２２０は、いずれのトピック、文、文節、及び／又は語句が元データに対応するものかを判別できなくして、元データの内容を隠蔽することができる。更に、変換部２２０は、内容不推定化処理によって元データの音声等および音声認識テキストに他の音声および音声認識テキストを挿入して、更に内容不完全化処理によって音声等および音声認識テキストを並び替えることによって、元データの内容を更に特定しにくくしてもよい。

以上において、変換部２２０は、元データの音声等および元データの音声認識テキスト中に作業者１２０に対して秘匿すべき固有名詞が含まれると判断した場合に、元データの音声等および元データの音声認識テキストの少なくとも１箇所に、他の固有名詞の音声等およびテキストを挿入して変換データおよび変換データの音声認識テキストを生成してもよい。例えば、変換部２２０は、元データの音声等および音声認識テキスト中に会社名が含まれる場合には元データに他の会社名を挿入して、人名が含まれる場合には元データに他の人名を挿入して、地名が含まれる場合には元データに他の地名を挿入してもよい。これにより、変換部２２０は、ニュース等の中で現れる会社名、人名、および地名等の固有名詞を特定できなくして、元データの内容を隠蔽することができる。

なお、変換部２２０は、元データの音声等および音声認識テキスト中に他の音声等およびテキストを挿入した場合に、挿入した音声等またはテキストを元データの音声等および音声認識テキストと区別できる情報を付与してもよい。これにより、逆変換部２８０は、当該情報が付された部分を検査して、変換済データの音声等および音声認識テキストから削除することができる。

図９は、本実施形態に係るコンピュータ１９００のハードウェア構成の一例を示す。本実施形態に係るコンピュータ１９００は、ホスト・コントローラ２０８２により相互に接続されるＣＰＵ２０００、ＲＡＭ２０２０、グラフィック・コントローラ２０７５、及び表示装置２０８０を有するＣＰＵ周辺部と、入出力コントローラ２０８４によりホスト・コントローラ２０８２に接続される通信インターフェイス２０３０、ハードディスクドライブ２０４０、及びＤＶＤドライブ２０６０を有する入出力部と、入出力コントローラ２０８４に接続されるＲＯＭ２０１０、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０を有するレガシー入出力部とを備える。

ホスト・コントローラ２０８２は、ＲＡＭ２０２０と、高い転送レートでＲＡＭ２０２０をアクセスするＣＰＵ２０００及びグラフィック・コントローラ２０７５とを接続する。ＣＰＵ２０００は、ＲＯＭ２０１０及びＲＡＭ２０２０に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ２０７５は、ＣＰＵ２０００等がＲＡＭ２０２０内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置２０８０上に表示させる。これに代えて、グラフィック・コントローラ２０７５は、ＣＰＵ２０００等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。

入出力コントローラ２０８４は、ホスト・コントローラ２０８２と、比較的高速な入出力装置である通信インターフェイス２０３０、ハードディスクドライブ２０４０、ＤＶＤドライブ２０６０を接続する。通信インターフェイス２０３０は、ネットワークを介して他の装置と通信する。ハードディスクドライブ２０４０は、コンピュータ１９００内のＣＰＵ２０００が使用するプログラム及びデータを格納する。ＤＶＤドライブ２０６０は、ＤＶＤ２０９５からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。

また、入出力コントローラ２０８４には、ＲＯＭ２０１０と、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０の比較的低速な入出力装置とが接続される。ＲＯＭ２０１０は、コンピュータ１９００が起動時に実行するブート・プログラム、及び／又は、コンピュータ１９００のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ２０５０は、フレキシブルディスク２０９０からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。入出力チップ２０７０は、フレキシブルディスク・ドライブ２０５０を入出力コントローラ２０８４へと接続すると共に、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ２０８４へと接続する。

ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供されるプログラムは、フレキシブルディスク２０９０、ＤＶＤ２０９５、又はＩＣカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、ＲＡＭ２０２０を介してコンピュータ１９００内のハードディスクドライブ２０４０にインストールされ、ＣＰＵ２０００において実行される。

コンピュータ１９００にインストールされ、コンピュータ１９００を支援装置１００として機能させるプログラムは、元データ記憶部２００を管理する元データ記憶管理モジュールと、音声認識モジュールと、変換モジュールと、語句記憶部２３０を管理する語句記憶管理モジュールと、均一化モジュールと、インターフェイスモジュールと、作業者情報記憶部２６０を管理する作業者情報記憶管理モジュールと、語句登録モジュールと、逆変換モジュールと、作業済データ記憶部２９０を管理する作業済データ記憶管理モジュールとを備える。これらのプログラム又はモジュールは、ＣＰＵ２０００等に働きかけて、コンピュータ１９００を、元データ記憶部２００と、音声認識部２１０と、変換部２２０と、語句記憶部２３０と、均一化部２４０と、インターフェイス部２５０と、作業者情報記憶部２６０と、語句登録部２７０と、逆変換部２８０と、作業済データ記憶部２９０としてそれぞれ機能させる。

これらのプログラムに記述された情報処理は、コンピュータ１９００に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である音声認識部２１０と、変換部２２０と、均一化部２４０と、インターフェイス部２５０と、語句登録部２７０と、逆変換部２８０として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ１９００の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の支援装置１００が構築される。

一例として、コンピュータ１９００と外部の装置等との間で通信を行う場合には、ＣＰＵ２０００は、ＲＡＭ２０２０上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス２０３０に対して通信処理を指示する。通信インターフェイス２０３０は、ＣＰＵ２０００の制御を受けて、ＲＡＭ２０２０、ハードディスクドライブ２０４０、フレキシブルディスク２０９０、又はＤＶＤ２０９５等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス２０３０は、ＤＭＡ（ダイレクト・メモリ・アクセス）方式により記憶装置との間で送受信データを転送してもよく、これに代えて、ＣＰＵ２０００が転送元の記憶装置又は通信インターフェイス２０３０からデータを読み出し、転送先の通信インターフェイス２０３０又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。

また、ＣＰＵ２０００は、ハードディスクドライブ２０４０、ＤＶＤドライブ２０６０（ＤＶＤ２０９５）、フレキシブルディスク・ドライブ２０５０（フレキシブルディスク２０９０）等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をＤＭＡ転送等によりＲＡＭ２０２０へと読み込ませ、ＲＡＭ２０２０上のデータに対して各種の処理を行う。そして、ＣＰＵ２０００は、処理を終えたデータを、ＤＭＡ転送等により外部記憶装置へと書き戻す。このような処理において、ＲＡＭ２０２０は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはＲＡＭ２０２０および外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、ＣＰＵ２０００は、ＲＡＭ２０２０の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはＲＡＭ２０２０の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもＲＡＭ２０２０、メモリ、及び／又は記憶装置に含まれるものとする。

また、ＣＰＵ２０００は、ＲＡＭ２０２０から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、ＲＡＭ２０２０へと書き戻す。例えば、ＣＰＵ２０００は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすかどうかを判断し、条件が成立した場合（又は不成立であった場合）に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。

また、ＣＰＵ２０００は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第１属性の属性値に対し第２属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、ＣＰＵ２０００は、記憶装置に格納されている複数のエントリの中から第１属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第２属性の属性値を読み出すことにより、所定の条件を満たす第１属性に対応付けられた第２属性の属性値を得ることができる。

以上に示したプログラム又はモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク２０９０、ＤＶＤ２０９５の他に、ＤＶＤ又はＣＤ等の光学記録媒体、ＭＯ等の光磁気記録媒体、テープ媒体、ＩＣカード等の半導体メモリ等を用いることができる。また、専用通信ネットワーク又はインターネットに接続されたサーバシステムに設けたハードディスク又はＲＡＭ等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ１９００に提供してもよい。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

本発明の実施形態に係る支援システム１０の構成を示す。本発明の実施形態に係る支援装置１００の構成を示す。本発明の実施形態に係る語句記憶部２３０の内容の一例を示す。本発明の実施形態に係る作業者情報記憶部２６０の内容の一例を示す。本発明の実施形態に係る支援装置１００の動作フローを示す。本発明の実施形態に係る支援装置１００による字幕編集作業の一例を示す。本発明の実施形態に係る支援装置１００による変換処理の第１例を示す。本発明の実施形態に係る支援装置１００による変換処理の第２例を示す。本発明の実施形態に係るコンピュータ１９００のハードウェア構成の一例を示す。

１０支援システム、１００支援装置、１１０ａ〜ｃ端末、１２０ａ〜ｃ作業者、１３０ネットワーク、２００元データ記憶部、２１０音声認識部、２２０変換部、２３０語句記憶部、２４０均一化部、２５０インターフェイス部、２６０作業者情報記憶部、２７０語句登録部、２８０逆変換部、２９０作業済データ記憶部、１９００コンピュータ、２０００ＣＰＵ、２０１０ＲＯＭ、２０２０ＲＡＭ、２０３０通信インターフェイス、２０４０ハードディスクドライブ、２０５０フレキシブルディスク・ドライブ、２０６０ＤＶＤドライブ、２０７０入出力チップ、２０７５グラフィック・コントローラ、２０８０表示装置、２０８２ホスト・コントローラ、２０８４入出力コントローラ、２０９０フレキシブルディスク、２０９５ＤＶＤ

Claims

元データから作業済データを作成する作業を支援する支援装置であって、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援装置。
元データから作業済データを作成する作業を支援する支援装置であって、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援装置。
前記変換部は、音声付動画の映像および音声を含む前記元データを予め定められた区切りを単位として並び替えて音声付動画の映像および音声を含む前記変換データに変換し、
前記インターフェイス部は、前記変換データを作業者に提供して、前記変換データを元に音声に応じた字幕のテキストを含む作業済の前記変換データを作成させ、
前記逆変換部は、作業済の前記変換データを元の順序に並べ直して前記音声付動画に付加する字幕のテキストを含む前記作業済データを生成する
請求項１または２に記載の支援装置。
元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援装置。
元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
作業者が前記インターフェイス部を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶部に登録する語句登録部と、
を備える支援装置。
元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援装置。
元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
を備え、
前記変換部は、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させ、前記元データおよび前記元データの音声認識テキストの文、文節、及び／又は語句の区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化させる支援装置。
前記語句記憶部は、複数の語句のそれぞれについて、当該語句を作業者に提示してよい提示タイミングを更に記憶し、
前記インターフェイス部は、前記変換データおよび前記変換データの音声認識テキストにおける、前記提示タイミングに対応付けられた語句を含む部分を、当該提示タイミングを満たすタイミングで作業者に提示する
請求項５から７のいずれか１項に記載の支援装置。
前記変換部は、前記元データの音声および前記元データの音声認識テキストのトピック、文、文節、及び／又は語句の間の少なくとも１箇所に、他の音声および他のテキストの他のトピック、文、文節、及び／又は語句を挿入して前記変換データおよび前記変換データの音声認識テキストを生成し、
前記逆変換部は、作業済の前記変換データから前記他の音声および前記他のテキストに対応する部分を取り除いて前記作業済データを生成する
請求項４から８のいずれか１項に記載の支援装置。
前記変換部は、前記元データの音声および前記元データの音声認識テキスト中に作業者に対して秘匿すべき固有名詞が含まれると判断した場合に、前記元データの音声および前記元データの音声認識テキストの少なくとも１箇所に、他の固有名詞の音声およびテキストを挿入して前記変換データおよび前記変換データの音声認識テキストを生成する
請求項９に記載の支援装置。
前記変換部が生成した前記変換データの音声における、音の高さ、音の強さ、および発話速度のうちの少なくとも１つを均一化する均一化部を更に備える請求項１から１０のいずれか１項に記載の支援装置。
コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援プログラム。
コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援プログラム。
コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援プログラム。
コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
作業者が前記インターフェイス部を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶部に登録する語句登録部と
して機能させる支援プログラム。
コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援プログラム。
コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
して機能させ、
前記変換部は、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させ、前記元データおよび前記元データの音声認識テキストの文、文節、及び／又は語句の区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化させる支援プログラム。
元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換段階と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記元データにおける、前記語句記憶段階で記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援方法。
元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶段階と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換段階と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援方法。
元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記元データにおける、前記語句記憶段階で記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援方法。
元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
作業者が前記インターフェイス段階を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶段階で登録する語句登録段階と、
を備える支援方法。
元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶段階と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援方法。
元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
を備え、
前記変換段階は、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させ、前記元データおよび前記元データの音声認識テキストの文、文節、及び／又は語句の区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化させる支援方法。