JP4958120B2 - 支援装置、支援プログラム、および支援方法 - Google Patents
支援装置、支援プログラム、および支援方法 Download PDFInfo
- Publication number
- JP4958120B2 JP4958120B2 JP2009041464A JP2009041464A JP4958120B2 JP 4958120 B2 JP4958120 B2 JP 4958120B2 JP 2009041464 A JP2009041464 A JP 2009041464A JP 2009041464 A JP2009041464 A JP 2009041464A JP 4958120 B2 JP4958120 B2 JP 4958120B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- conversion
- phrase
- original data
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000006243 chemical reaction Methods 0.000 claims description 224
- 230000006870 function Effects 0.000 claims description 15
- 230000035945 sensitivity Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 36
- 230000008569 process Effects 0.000 description 18
- 238000013500 data storage Methods 0.000 description 15
- 230000006854 communication Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 238000005192 partition Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Document Processing Apparatus (AREA)
Description
変換部220は、元データの音声および元データの音声認識テキストの少なくとも1つの対応する箇所、より好ましくは元データの内容を隠蔽するのに十分な数の対応する箇所に、他の音声および他のテキストを挿入して変換データおよび変換データの音声認識テキストを生成する。これにより、変換部220は、変換データのどの部分が元データに対応するものかを作業者が把握できないようにして、元データの内容を隠蔽する。
変換部220は、元データおよび元データの音声認識テキストをそれぞれ同様に並び替えて変換データおよび変換データの音声認識テキストを生成する。これにより、変換部220は、複数のニュース、複数の文、または複数の語句等が並び替えられて入り混じった変換データ等を生成することができ、作業者が元の順番に並べ直して元データの内容を把握するのを困難にする。
均一化部240は、変換部220が生成した変換データの音声における、音の高さ、音の強さ、および発話速度のうちの少なくとも1つを均一化する。これにより、均一化部240は、内容不推定化処理によってダミーの音声等が挿入された変換データ、及び/又は内容不完全化処理によって並び替えられた変換データののそれぞれの部分における話者を区別困難とする。この結果、変換部220は、作業者が特定話者の音声部分を抽出できなくして、作業者に対して内容を秘匿する。
Claims (23)
- 元データから作業済データを作成する作業を支援する支援装置であって、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援装置。 - 元データから作業済データを作成する作業を支援する支援装置であって、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援装置。 - 前記変換部は、音声付動画の映像および音声を含む前記元データを予め定められた区切りを単位として並び替えて音声付動画の映像および音声を含む前記変換データに変換し、
前記インターフェイス部は、前記変換データを作業者に提供して、前記変換データを元に音声に応じた字幕のテキストを含む作業済の前記変換データを作成させ、
前記逆変換部は、作業済の前記変換データを元の順序に並べ直して前記音声付動画に付加する字幕のテキストを含む前記作業済データを生成する
請求項1または2に記載の支援装置。 - 元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援装置。 - 元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
作業者が前記インターフェイス部を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶部に登録する語句登録部と、
を備える支援装置。 - 元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
を備え、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援装置。 - 元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
を備え、
前記変換部は、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させ、前記元データおよび前記元データの音声認識テキストの文、文節、及び/又は語句の区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化させる支援装置。 - 前記語句記憶部は、複数の語句のそれぞれについて、当該語句を作業者に提示してよい提示タイミングを更に記憶し、
前記インターフェイス部は、前記変換データおよび前記変換データの音声認識テキストにおける、前記提示タイミングに対応付けられた語句を含む部分を、当該提示タイミングを満たすタイミングで作業者に提示する
請求項5から7のいずれか1項に記載の支援装置。 - 前記変換部は、前記元データの音声および前記元データの音声認識テキストのトピック、文、文節、及び/又は語句の間の少なくとも1箇所に、他の音声および他のテキストの他のトピック、文、文節、及び/又は語句を挿入して前記変換データおよび前記変換データの音声認識テキストを生成し、
前記逆変換部は、作業済の前記変換データから前記他の音声および前記他のテキストに対応する部分を取り除いて前記作業済データを生成する
請求項4から8のいずれか1項に記載の支援装置。 - 前記変換部は、前記元データの音声および前記元データの音声認識テキスト中に作業者に対して秘匿すべき固有名詞が含まれると判断した場合に、前記元データの音声および前記元データの音声認識テキストの少なくとも1箇所に、他の固有名詞の音声およびテキストを挿入して前記変換データおよび前記変換データの音声認識テキストを生成する
請求項9に記載の支援装置。 - 前記変換部が生成した前記変換データの音声における、音の高さ、音の強さ、および発話速度のうちの少なくとも1つを均一化する均一化部を更に備える請求項1から10のいずれか1項に記載の支援装置。
- コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援プログラム。 - コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換部と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援プログラム。 - コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記元データにおける、前記語句記憶部に記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援プログラム。 - コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
作業者が前記インターフェイス部を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶部に登録する語句登録部と
して機能させる支援プログラム。 - コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶部と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
して機能させ、
前記インターフェイス部は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援プログラム。 - コンピュータを、元データから作業済データを作成する作業を支援する支援装置として機能させるための支援プログラムであって、
当該支援プログラムは、前記コンピュータを、
元データから作業済データを作成する作業を支援する支援装置であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識部と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶部と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換部と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス部と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換部と、
して機能させ、
前記変換部は、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させ、前記元データおよび前記元データの音声認識テキストの文、文節、及び/又は語句の区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化させる支援プログラム。 - 元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換段階と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記元データにおける、前記語句記憶段階で記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援方法。 - 元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶段階と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、音声の前記元データを予め定められた区切りを単位として並び替えて音声の変換データを生成する変換段階と、
前記変換データを作業者に提供して、前記変換データの音声を元に作業済の前記変換データのテキストを作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直してテキストの前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援方法。 - 元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれに対応付けて、当該語句を作業者に提示してよい提示タイミングを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記元データにおける、前記語句記憶段階で記憶された語句を含む部分を、当該語句に対応する前記提示タイミングを満たすタイミングで作業者に提示して、前記元データにおける当該部分について作業させる支援方法。 - 元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
作業者が前記インターフェイス段階を介して前記変換データの音声認識テキスト中の一の語句を、秘密にするべき語句に書き換えた場合に、前記一の語句を秘密にするべき語句として前記語句記憶段階で登録する語句登録段階と、
を備える支援方法。 - 元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれについて、当該語句の秘密度を記憶する語句記憶段階と、
複数の作業者のそれぞれに対して提示してよい語句の秘密度の上限を記憶する作業者情報記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
を備え、
前記インターフェイス段階は、前記変換データを分割した複数の分割データを複数の作業者に分散して提供して、前記複数の作業者のそれぞれにより前記分割データを元に作業させ、複数の作業済の前記分割データを集約して作業済の前記変換データを生成し、それぞれの前記分割データに含まれる語句の秘密度に応じて、当該分割データを提供する作業者を選択する支援方法。 - 元データから作業済データを作成する作業を支援装置により支援する支援方法であって、
音声付動画の映像および音声を含む前記元データの音声を音声認識して、音声認識テキストを生成する音声認識段階と、
複数の語句のそれぞれについて、当該語句を作業者に対して秘密にするべきか否かを記憶する語句記憶段階と、
前記元データの内容を作業者に対して秘匿するべく、前記元データおよび前記元データの音声認識テキストを予め定められた区切りを単位としてそれぞれ並び替えて変換データおよび前記変換データの音声認識テキストを生成する変換段階と、
前記変換データおよび前記変換データの音声認識テキストを作業者に提供して、前記変換データの音声認識テキストを編集させて前記変換データの音声に応じた字幕を作成させるインターフェイス段階と、
作業済の前記変換データを元の順序に並べ直して音声付動画の映像および音声を含む前記作業済データを生成する逆変換段階と、
を備え、
前記変換段階は、リスク語句を元データおよび元データの音声認識テキスト中に分散配置させ、前記元データおよび前記元データの音声認識テキストの文、文節、及び/又は語句の区切り毎に含まれるリスク語句から算出した区切り毎の秘密度の分布を平準化させる支援方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009041464A JP4958120B2 (ja) | 2009-02-24 | 2009-02-24 | 支援装置、支援プログラム、および支援方法 |
US12/709,642 US8401857B2 (en) | 2009-02-24 | 2010-02-22 | Assisting apparatus generating task-completed data while keeping some original data secret from the operator in charge of the task |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009041464A JP4958120B2 (ja) | 2009-02-24 | 2009-02-24 | 支援装置、支援プログラム、および支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010198247A JP2010198247A (ja) | 2010-09-09 |
JP4958120B2 true JP4958120B2 (ja) | 2012-06-20 |
Family
ID=42630661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009041464A Expired - Fee Related JP4958120B2 (ja) | 2009-02-24 | 2009-02-24 | 支援装置、支援プログラム、および支援方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8401857B2 (ja) |
JP (1) | JP4958120B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011085387A2 (en) * | 2010-01-11 | 2011-07-14 | Everspeech, Inc. | Integrated data processing and transcription service |
JP5688279B2 (ja) | 2010-12-08 | 2015-03-25 | ニュアンス コミュニケーションズ,インコーポレイテッド | 秘匿情報をフィルタリングする情報処理装置、方法およびプログラム |
US9727748B1 (en) * | 2011-05-03 | 2017-08-08 | Open Invention Network Llc | Apparatus, method, and computer program for providing document security |
KR101579467B1 (ko) * | 2014-02-27 | 2016-01-04 | 엘지전자 주식회사 | 디지털 디바이스 및 그의 서비스 처리 방법 |
US10861463B2 (en) * | 2018-01-09 | 2020-12-08 | Sennheiser Electronic Gmbh & Co. Kg | Method for speech processing and speech processing device |
JP6511189B1 (ja) * | 2018-10-31 | 2019-05-15 | 株式会社ジェイ・エックス・ウィンド | 情報処理システムおよび文字起こし方法 |
US10891939B2 (en) * | 2018-11-26 | 2021-01-12 | International Business Machines Corporation | Sharing confidential information with privacy using a mobile phone |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5960447A (en) * | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
US6678822B1 (en) * | 1997-09-25 | 2004-01-13 | International Business Machines Corporation | Method and apparatus for securely transporting an information container from a trusted environment to an unrestricted environment |
US5960080A (en) * | 1997-11-07 | 1999-09-28 | Justsystem Pittsburgh Research Center | Method for transforming message containing sensitive information |
JP4434465B2 (ja) * | 1999-11-16 | 2010-03-17 | キヤノン株式会社 | 通信装置及び方法並びに記憶媒体 |
US7293175B2 (en) * | 2000-06-29 | 2007-11-06 | Lockheed Martin Corporation | Automatic information sanitizer |
US7103915B2 (en) * | 2000-11-13 | 2006-09-05 | Digital Doors, Inc. | Data security system and method |
US7305444B2 (en) * | 2002-01-23 | 2007-12-04 | International Business Machines Corporation | Method and system for controlling delivery of information in a forum |
US9167087B2 (en) * | 2004-07-13 | 2015-10-20 | International Business Machines Corporation | Dynamic media content for collaborators including disparate location representations |
US7487209B2 (en) * | 2004-07-13 | 2009-02-03 | International Business Machines Corporation | Delivering dynamic media content for collaborators to purposeful devices |
JP4419871B2 (ja) * | 2005-03-02 | 2010-02-24 | 富士ゼロックス株式会社 | 翻訳依頼装置およびプログラム |
JP4274375B2 (ja) * | 2005-03-04 | 2009-06-03 | 株式会社アイデック | データエントリーシステム |
US20070244700A1 (en) * | 2006-04-12 | 2007-10-18 | Jonathan Kahn | Session File Modification with Selective Replacement of Session File Components |
US7934160B2 (en) * | 2006-07-31 | 2011-04-26 | Litrell Bros. Limited Liability Company | Slide kit creation and collaboration system with multimedia interface |
JP2008040587A (ja) * | 2006-08-02 | 2008-02-21 | Fuji Xerox Co Ltd | 文書管理装置およびプログラム |
JP4117328B2 (ja) * | 2006-10-13 | 2008-07-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声、動画および静止画を含むコンテンツを無害化するための装置および方法。 |
US8078595B2 (en) * | 2007-10-09 | 2011-12-13 | Oracle International Corporation | Secure normal forms |
-
2009
- 2009-02-24 JP JP2009041464A patent/JP4958120B2/ja not_active Expired - Fee Related
-
2010
- 2010-02-22 US US12/709,642 patent/US8401857B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20100214476A1 (en) | 2010-08-26 |
JP2010198247A (ja) | 2010-09-09 |
US8401857B2 (en) | 2013-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4958120B2 (ja) | 支援装置、支援プログラム、および支援方法 | |
US20050143994A1 (en) | Recognizing speech, and processing data | |
US20080270437A1 (en) | Session File Divide, Scramble, or Both for Manual or Automated Processing by One or More Processing Nodes | |
CN112632326B (zh) | 一种基于视频脚本语义识别的视频生产方法及装置 | |
JP2011100355A (ja) | 発言記録装置、発言記録方法、プログラム及び記録媒体 | |
US11138970B1 (en) | System, method, and computer program for creating a complete transcription of an audio recording from separately transcribed redacted and unredacted words | |
US20210151038A1 (en) | Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media | |
US20080262841A1 (en) | Apparatus and method for rendering contents, containing sound data, moving image data and static image data, harmless | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
US11822589B2 (en) | Method and system for performing summarization of text | |
KR102036721B1 (ko) | 녹음 음성에 대한 빠른 검색을 지원하는 단말 장치 및 그 동작 방법 | |
JP4848397B2 (ja) | 関連クエリ導出装置、関連クエリ導出方法及びプログラム | |
WO2010146869A1 (ja) | 編集支援システム、編集支援方法および編集支援プログラム | |
EP3640940A1 (en) | Method, program, and information processing apparatus for presenting correction candidates in voice input system | |
WO2021153403A1 (ja) | テキスト情報編集装置及びテキスト情報編集方法 | |
JP6626029B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
KR102107447B1 (ko) | 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법 | |
JP2022061934A (ja) | サーバおよびデータ割り当て方法 | |
KR20210145536A (ko) | 회의록 관리 방법 및 장치 | |
JP4769124B2 (ja) | 話者選択機能付き音声合成方法、装置、話者選択機能付き音声合成プログラム | |
JP4444141B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体 | |
JP2015022406A (ja) | テキストによる視覚表現を含む文書を分析する装置、方法およびプログラム | |
US20240048821A1 (en) | System and method for generating a synopsis video of a requested duration | |
CN110717091B (zh) | 基于人脸识别的词条数据扩充方法及装置 | |
CN117573870B (zh) | 一种多模态数据的文本标签提取方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20120222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120313 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150330 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |