JP2020053832A - 情報処理方法および情報処理装置 - Google Patents

情報処理方法および情報処理装置 Download PDF

Info

Publication number
JP2020053832A
JP2020053832A JP2018181200A JP2018181200A JP2020053832A JP 2020053832 A JP2020053832 A JP 2020053832A JP 2018181200 A JP2018181200 A JP 2018181200A JP 2018181200 A JP2018181200 A JP 2018181200A JP 2020053832 A JP2020053832 A JP 2020053832A
Authority
JP
Japan
Prior art keywords
characters
input
moving image
upper limit
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018181200A
Other languages
English (en)
Inventor
直之 安立
Naoyuki Adachi
直之 安立
克己 石川
Katsumi Ishikawa
克己 石川
康之介 加藤
Konosuke Kato
康之介 加藤
祐二 小池
Yuji Koike
祐二 小池
謙一良 齋藤
Kenichiro Saito
謙一良 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2018181200A priority Critical patent/JP2020053832A/ja
Priority to PCT/JP2019/035902 priority patent/WO2020066660A1/ja
Publication of JP2020053832A publication Critical patent/JP2020053832A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects

Abstract

【課題】実動画の時間長に対して適切な時間長の音声を合成するための文字数を利用者が把握できるようにする情報処理方法及び情報処理装置を提供する。【解決手段】情報処理装置は、動画の時間長に応じて上限文字数を設定し、動画に付加される音声を表す文字の入力を受付け、文字の個数である入力文字数が上限文字数を超えた場合、入力文字数の超過を利用者に警告メッセージ等により報知する。【選択図】図3

Description

本発明は、動画を処理する技術に関する。
端末装置を利用して動画像を収録する技術が従来から提案されている。例えば特許文献1には、複数のシーンで構成されるコンテンツを生成するために、各シーンをビデオカメラで撮影する技術が開示されている。
特開2004−32277号公報
撮影済の動画に音声(ナレーション)を付加する場面が想定される。音声を収録する作業は煩雑であるから、利用者が指定した文字に応じた音声を公知の音声合成技術により生成することが要求される。しかし、利用者が入力した文字に対応した音声が、動画の時間長に対して適切であるか否かを利用者は把握できない。したがって、音声合成技術により生成された音声が実際には動画よりも長時間におよび、動画に対して音声を適切に付加できないといった事態が想定される。以上の事情を考慮して、本発明の好適な態様は、動画の時間長に対して適切な時間長の音声を合成するための文字数を利用者が把握できるようにすることを目的とする。
以上の課題を解決するために、本発明の好適な態様に係る情報処理方法は、動画の時間長に応じて上限文字数を設定し、前記動画に付加される音声を表す文字の入力を受付け、前記文字の個数である入力文字数と前記上限文字数とに応じた報知動作を実行する。
本発明の好適な態様に係る情報処理装置は、動画の時間長に応じて上限文字数を設定する上限設定部と、前記動画に付加される音声を表す文字の入力を受付け入力受付部と、前記文字の個数である入力文字数と前記上限文字数とに応じた報知動作を実行する報知処理部とを具備する。
第1実施形態における情報処理装置の構成を例示するブロック図である。 動画と付加音声との関係を例示する模式図である。 制御装置が実行する処理の具体的な手順を例示するフローチャートである。 制御装置が実行する処理の具体的な手順を例示するフローチャートである。 収録画面を例示する模式図である。 収録画面を例示する模式図である。 第2実施形態における制御装置が実行する処理の具体的な手順を例示するフローチャートである。 第2実施形態における収録画面を例示する模式図である。 第2実施形態の変形例における上限文字数および入力文字数の表示例である。
<第1実施形態>
図1は、本発明の第1実施形態に係る情報処理装置100の構成を例示するブロック図である。情報処理装置100は、コンテンツを構成する動画を収録するためのコンピュータシステムである。例えば、携帯電話機、スマートフォン、タブレット端末、またはパーソナルコンピュータ等の情報端末が、情報処理装置100として好適に利用される。第1実施形態では、例えば企業を紹介するコンテンツまたは人材募集のためのコンテンツなど、企業に関する各種のコンテンツを想定する。企業を紹介するコンテンツとしては、例えば企業自体を紹介するコンテンツのほか、企業が取扱う製品を紹介するコンテンツ、または、企業が開発した技術を紹介するコンテンツなどが想定される。もっとも、コンテンツの内容は以上の例示に限定されない。
図1に例示される通り、第1実施形態の情報処理装置100は、制御装置11と記憶装置12と通信装置13と表示装置14と入力装置15と収録装置16と放音装置17とを具備する。制御装置11は、例えばCPU(Central Processing Unit)またはFPGA(Field Programmable Gate Array)等の処理回路で構成され、情報処理装置100の各要素を統括的に制御する。なお、制御装置11の一部の機能を専用の電子回路で実現してもよい。また、制御装置11の機能を複数の装置に搭載してもよい。
通信装置13は、移動体通信網またはインターネット等を含む通信網200を介して編集装置300および音声合成装置400と通信する。具体的には、通信装置13は、動画を含むデータ(以下「素材データ」という)を編集装置300に送信する。編集装置300は、情報処理装置100から受信した素材データを編集することで1個のコンテンツを生成するサーバ装置である。例えば自動または手動による編集でコンテンツが生成される。編集装置300が生成したコンテンツは情報処理装置100に提供される。なお、情報処理装置100が素材データからコンテンツを生成してもよい。
表示装置14は、制御装置11による制御のもとで各種の画像を表示する。例えば液晶表示パネルが表示装置14として好適に利用される。表示装置14は、例えば複数の動画を収録するための画面、および、編集装置300が生成したコンテンツの各動画を表示する。入力装置15は、利用者による操作を受付ける。例えば、利用者が操作する操作子、または表示装置14と一体に構成されたタッチパネルが、入力装置15として好適に利用される。また、音声入力が可能な収音装置を入力装置15として利用してもよい。放音装置17(例えばスピーカまたはヘッドホン)は、制御装置11による制御のもとで音響を放射する。
収録装置16は、動画Mを収録する画像入力機器である。具体的には、収録装置16は、撮影レンズ等の光学系からの入射光を電気信号に変換する撮像装置を具備する。第1実施形態では、収録装置16により収録された動画Mが音響を含まない場合を例示する。ただし、周囲の音響を収音する収音装置を収録装置16に搭載し、音響と映像の双方を含む動画Mを収録してもよい。収録装置16が収録した動画Mは、任意の形式の動画データで表現される。なお、情報処理装置100とは別体の収録装置16を有線または無線により情報処理装置100に接続してもよい。
記憶装置12は、制御装置11が実行するプログラムと制御装置11が使用する各種のデータとを記憶する。例えば収録装置16が収録した動画Mが記憶装置12に記憶される。半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置12として任意に採用される。なお、情報処理装置100に対して着脱可能な可搬型の記録媒体、または情報処理装置100が通信可能な外部記録媒体(例えばオンラインストレージ)を、記憶装置12として利用してもよい。すなわち、記憶装置12は情報処理装置100から省略され得る。
第1実施形態の制御装置11は、記憶装置12に記憶されたプログラムを実行することで収録処理を実行する。収録処理は、動画Mを収録するとともに、当該動画Mに付加される音声(以下「付加音声」という)Vを生成する処理である。付加音声Vは、図2に例示される通り、動画Mに並行して再生される音声(例えばナレーション)である。具体的には、動画M内の特定の期間(以下「付加期間」という)Q内に付加音声Vが再生される。付加期間Qは、動画Mが再生される期間のうち先頭の所定長の期間q1と末尾の所定長の期間q2とを除外した期間である。期間q1は、例えば動画Mの開始を印象付ける音楽等の所定の音響が再生される期間、または、直前の動画Mとの連結に使用される期間である。また、期間q2は、例えば動画Mの終了を印象付ける音楽等の所定の音響が再生される期間、または、直後の動画Mとの連結に使用される期間である。
図3および図4は、制御装置11が実行する収録処理の具体的な手順を例示するフローチャートである。例えば、入力装置15に対する利用者からの指示を契機として収録処理が開始される。
収録処理を開始すると、制御装置11は、図5の収録画面Gを表示装置14に表示させる(Sa1)。図5に例示される通り、収録画面Gは、撮影領域R1と入力領域R2とを含んで構成される。撮影領域R1は、収録装置16が収録した動画M(具体的には撮像装置が撮像する映像)が表示される領域である。入力領域R2は、付加音声Vを表す文字Cを利用者が入力するための領域である。
制御装置11は、利用者からの指示に応じて収録装置16により動画Mを収録する(Sa2)。具体的には、制御装置11は、利用者からの開始の指示に応じて収録装置16に動画Mの収録を開始させ、利用者からの終了の指示に応じて動画Mの収録を終了させる。したがって、動画Mの時間長Tは、利用者からの指示に応じた可変値である。
制御装置11は、動画Mの時間長Tに応じて上限文字数Xを設定する(Sa3)。上限文字数Xは、付加音声Vを表す文字Cの個数(以下「入力文字数」という)Yの上限値である。第1実施形態の上限文字数Xは、動画Mのうち付加期間Qの時間長Tqに応じて可変に設定される。具体的には、付加期間Qの時間長Tqが長い(すなわち動画Mの時間長Tが長い)ほど上限文字数Xは大きい数値となる。以上の説明から理解される通り、制御装置11は、動画Mの時間長Tに応じて上限文字数Xを設定する要素(上限設定部)として機能する。
第1実施形態では、付加期間Q内に所定の話速(以下「基準話速」という)Pで発話される文字数が上限文字数Xとして設定される。基準話速Pは、単位時間(例えば1分間)内に発話される標準的な文字数である。例えば、基準話速Pは300文字/分に設定される。具体的には、制御装置11は、付加期間Qの時間長Tq(単位:分)と基準話速Pとの乗算値を上限文字数Xとして設定する(X=P・Tq)。以上の構成によれば、動画の時間長に対して妥当性が高い適切な上限文字数Xを設定することが可能である。
動画Mの収録が完了すると、利用者は、入力装置15を操作することで所望の文字Cを入力領域R2に順次に入力する。制御装置11は、利用者による文字Cの入力を受付ける(Sa4)。すなわち、制御装置11は、付加音声Vを表す文字Cの入力を受付ける要素(入力受付部)として機能する。
制御装置11は、利用者による入力済の文字Cの個数である入力文字数Yと動画Mについて設定した上限文字数Xとを比較し、入力文字数Yが上限文字数Xを超過したか否かを判定する(Sa5)。入力文字数Yが上限文字数Xを超過した場合(Sa5:YES)、制御装置11は、入力文字数Yの超過を利用者に報知する(Sa6)。具体的には、図6に例示される通り、入力文字数Yの超過を警告する「入力文字数が上限値を超えました」等のメッセージWを表示装置14に表示させる。以上の報知を認識すると、利用者は、入力済の文字Cの削除など入力文字数Yを削減するための作業を実行する。他方、入力文字数Yが上限文字数Xを下回る場合(Sa5:NO)、利用者に対する報知(Sa6)は実行されない。
入力文字数Yが上限文字数Xを超過したか否かを判定する処理(Sa5)と、入力文字数Yの超過を利用者に報知する処理(Sa6)とは、入力文字数Yと上限文字数Xとに応じた報知動作Nの例示である。以上の説明から理解される通り、制御装置11は、入力文字数Yと上限文字数Xとに応じた報知動作Nを実行する要素(報知処理部)として機能する。
利用者は、収録画面Gの操作子B1を操作することで、入力済の文字Cの時系列(以下「入力文字列」という)に対応する付加音声Vの再生を指示することが可能である。図4に例示される通り、付加音声Vの再生が指示されると(Sa7:YES)、制御装置11は、付加音声Vを再生するための処理(Sa8,Sa9)を実行する。第1実施形態の制御装置11は、入力文字列に対応する付加音声Vを音声合成装置400から取得する(Sa8)。具体的には、制御装置11は、入力文字列を通信装置13から音声合成装置400に送信し、音声合成装置400が生成した付加音声Vを通信装置13により受信する。そして、制御装置11は、音声合成装置400から取得した付加音声Vを放音装置17に再生させる(Sa9)。他方、付加音声Vの再生が指示されない場合(Sa7:NO)、付加音声Vは再生されない。
音声合成装置400は、情報処理装置100から受信した入力文字列に対応した付加音声Vを生成するサーバ装置である。付加音声Vの生成には公知の音声合成技術(TTS:Text To Speech)が任意に採用される。例えば、複数の音声素片の接続により付加音声Vを生成する素片接続型の音声合成、または、隠れマルコフモデル等の統計モデルを利用して付加音声Vを生成する統計モデル型の音声合成が、付加音声Vの生成に好適に利用される。付加音声Vは、MP3(MPEG-1 Audio Layer-3)等の任意の形式のデータで表現される。音声合成装置400は、合成済の付加音声Vを情報処理装置100に送信する。以上の手順で付加音声Vが生成されると、制御装置11は、当該付加音声Vの再生時間Tvを表示装置14に表示させる(Sa10)。なお、情報処理装置100の制御装置11が、音声合成技術により入力文字列から付加音声Vを生成してもよい。
利用者は、収録画面Gの操作子B2を操作することで、入力文字列の確定を指示することが可能である。入力文字列の確定が指示されていない場合(Sa11:NO)、制御装置11は、処理をステップSa4に移行して、文字Cの受付(Sa4)と報知動作N(Sa5,Sa6)と付加音声Vの再生(Sa7−Sa9)とを反復する。他方、入力文字列の確定が指示されると(Sa11:YES)、制御装置11は、現時点の入力文字列について付加音声Vの再生(Sa8,Sa9)が実行済であるか否かを判定する(Sa12)。付加音声Vが未再生である場合(Sa12:NO)、制御装置11は、「音声を再生してからOKを操作して下さい」等のメッセージを表示装置14に表示したうえで、処理をステップSa4に移行する。他方、付加音声Vが再生済である場合(Sa12:YES)、制御装置11は、現時点の内容で入力文字列を確定したうえでステップSa13に処理を進行させる。以上の説明から理解される通り、付加音声Vの再生を条件として入力文字列の確定が許可される。すなわち、入力文字列の確定前に、利用者は必ず付加音声Vを実際に聴取する。したがって、付加音声Vの聴感的な印象または再生時間Tvが利用者の認識から乖離する可能性を未然に防止できる。
利用者は、収録画面Gの操作子B3を操作することで、動画Mの再生を指示することが可能である。動画Mの再生が指示されると(Sa13:YES)、制御装置11は、収録装置16が収録した動画Mと音声合成装置400が生成した付加音声Vとを再生する(Sa14)。具体的には、表示装置14による動画Mの表示と放音装置17による付加音声Vの放音とが並行に実行される。付加音声Vは動画Mの付加期間Q内で再生される。他方、動画Mの再生が指示されていない場合(Sa13:N0)、動画Mおよび付加音声Vは再生されない。
制御装置11は、収録処理の終了が利用者から指示されたか否かを判定する(Sa15)。収録処理の終了が指示されていない場合(Sa15:NO)、制御装置11は、処理をステップSa4に移行する。すなわち、文字Cの受付(Sa4)と報知動作N(Sa5,Sa6)と付加音声Vの再生(Sa7−Sa9)と動画Mの再生(Sa13,Sa14)とが反復される。他方、収録処理の終了が指示された場合(Sa15:YES)、制御装置11は、動画Mと付加音声Vとを含む素材データを通信装置13から編集装置300に送信する(Sa16)。編集装置300は、動画Mおよび付加音声Vを適宜に調整したうえで、動画Mの付加期間Qに付加音声Vが付加されたコンテンツを生成する。
以上に説明した通り、第1実施形態では、上限文字数Xと入力文字数Yとに応じた報知動作Nが実行されるから、動画Mの時間長Tに対して適切な時間長の付加音声Vを合成するための入力文字数Yを利用者が把握できるという利点がある。第1実施形態では特に、入力文字数Yが上限文字数Xを超過した場合に、入力文字数Yの超過が利用者に報知されるから、入力文字数Yの超過を利用者が容易に把握できるという利点がある。
<第2実施形態>
本発明の第2実施形態を説明する。なお、以下の各例示において機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
図7は、第2実施形態における収録処理の部分的なフローチャートである。第2実施形態の制御装置11は、第1実施形態における図3の処理に代えて図7の処理を実行する。第1実施形態では、入力文字数Yの超過の有無を判定する処理(Sa5)と当該超過を利用者に報知する処理(Sa6)とを報知動作Nとして例示した。図7に例示される通り、第2実施形態の制御装置11は、上限文字数Xと入力文字数Yとを表示装置14に表示させる処理を、報知動作Nとして実行する(Sb)。具体的には、制御装置11は、図8に例示される通り、上限文字数Xに対する入力文字数Yの比λ(λ=Y/X)を入力領域R2に表示させる。報知動作N以外の動作は第1実施形態と同様である。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、上限文字数Xと入力文字数Yとが表示装置14に表示されるから、上限文字数Xに対して入力文字数Yがどの程度の割合にあるのか(すなわち、あとどれ位の文字Cを入力できるのか)を利用者が容易に把握できるという利点がある。
なお、図8においては、上限文字数Xおよび入力文字数Yの数値を表示装置14に表示したが、上限文字数Xと入力文字数Yとを図式的に表示してもよい。例えば、図9に例示される通り、上限文字数Xと入力文字数Yとを棒グラフで表示してもよい。
<変形例>
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された複数の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
(1)前述の各形態では、動画Mの再生期間のうち先頭の期間q1と末尾の期間q2とを除外した付加期間Qの時間長Tqに応じて上限文字数Xを設定したが、付加期間Qの確定の仕方は以上の例示に限定されない。例えば、動画Mの再生期間から期間q1と期間q2とを除外する必要はなく、当該再生期間の全体を付加期間Qとして上限文字数Xを設定してもよい。動画Mの再生期間から期間q1および期間q2の一方を除外した期間を付加期間Qとしてもよい。
(2)前述の各形態では、時間軸上で連続する1個の付加音声Vを動画Mに付加する場合を例示したが、動画Mの再生期間内に複数の付加期間Qを画定し、各付加期間Qに別個の付加音声Vを付加してもよい。すなわち、複数の付加音声Vを1個の動画Mに付加してもよい。上限文字数Xは、動画Mの再生期間内における複数の付加期間Qの時間長の合計に応じて設定される。付加期間Q毎に上限文字数Xを個別に設定してもよい。
(3)前述の各形態では、表示装置14が表示する画像により入力文字数Yの超過を利用者に報知したが、入力文字数Yの超過を利用者に報知する方法は以上の例示に限定されない。例えば入力文字数Yの超過を音声により報知する構成が想定される。具体的には、例えば「入力文字数が上限値を超えました」等のメッセージを表す音声を放音装置17から放音してもよい。
(4)前述の各形態では、動画Mと付加音声Vとを含む素材データを編集装置300に送信したが、付加音声Vに代えて(または付加音声Vとともに)、入力文字列を、動画Mとともに編集装置300に送信してもよい。編集装置300においては、入力文字列から付加音声Vが合成される。また、特定の発声者が入力文字列を発音した音声を編集装置300が付加音声Vとして収録してもよい。以上の説明から理解される通り、入力文字列に応じた付加音声Vの合成は省略され得る。
(5)前述の各形態では、動画Mに付加音声Vを付加する場合を例示したが、所定の時間にわたる静止画の表示に並行して付加音声Vを再生する場合にも、本発明を適用できる。具体的には、静止画を表示する時間長Tに応じて上限文字数Xが設定される。以上の説明から理解される通り、本発明の好適な態様における「動画」は、付加音声Vに並行して再生される画像を意味し、被写体が動的に変化する狭義の動画のほか、所定長にわたり継続して表示される静止画も含む概念である。
(6)前述の各形態に係る情報処理装置100の機能は、各形態での例示の通り、制御装置11等の処理回路とプログラムとの協働により実現される。前述の各形態に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、通信網を介した配信の形態でプログラムをコンピュータに提供してもよい。
<付記>
以上に例示した形態から、例えば以下の構成が把握される。
本発明の好適な態様(第1態様)に係る情報処理方法は、動画の時間長に応じて上限文字数を設定し、前記動画に付加される音声を表す文字の入力を受付け、前記文字の個数である入力文字数と前記上限文字数とに応じた報知動作を実行する。以上の態様によれば、上限文字数と入力文字数とに応じた報知動作が実行されるから、動画の時間長に対して適切な時間長の音声を合成するための文字数を利用者が把握できるという利点がある。
第1態様の好適例(第2態様)において、前記上限文字数の設定では、前記動画のうち当該動画の時間長に応じた付加期間内に所定の話速で発話される文字数を、前記上限文字数として算定する。以上の態様によれば、動画の時間長に対して妥当性が高い適切な上限文字数を設定できる。
第1態様または第2態様の好適例(第3態様)において、前記報知動作は、前記入力文字数が前記上限文字数を超過した場合に、当該入力文字数の超過を利用者に報知する動作である。以上の態様によれば、入力文字数の過多を利用者が容易に把握できるという利点がある。
第1態様から第3態様の何れかの好適例(第4態様)において、前記報知動作は、前記上限文字数と前記入力文字数とを表示装置に表示させる動作である。以上の態様によれば、上限文字数に対して入力文字数がどの程度にあるのかを利用者が把握できるという利点がある。
本発明の好適な態様(第5態様)に係る情報処理装置は、動画の時間長に応じて上限文字数を設定する上限設定部と、前記動画に付加される音声を表す文字の入力を受付け入力受付部と、前記文字の個数である入力文字数と前記上限文字数とに応じた報知動作を実行する報知処理部とを具備する。
100…情報提供装置、11…制御装置、12…記憶装置、13…通信装置、14…表示装置、15…入力装置、16…収録装置、17…放音装置、200…通信網、300…編集装置、400…音声合成装置。

Claims (5)

  1. 動画の時間長に応じて上限文字数を設定し、
    前記動画に付加される音声を表す文字の入力を受付け、
    前記文字の個数である入力文字数と前記上限文字数とに応じた報知動作を実行する
    コンピュータにより実現される情報処理方法。
  2. 前記上限文字数の設定においては、前記動画のうち当該動画の時間長に応じた付加期間内に所定の話速で発話される文字数を、前記上限文字数として算定する
    請求項1の情報処理方法。
  3. 前記報知動作は、前記入力文字数が前記上限文字数を超過した場合に、当該入力文字数の超過を利用者に報知する動作である
    請求項1または請求項2の情報処理方法。
  4. 前記報知動作は、前記上限文字数と前記入力文字数とを表示装置に表示させる動作である
    請求項1から請求項3の何れかの情報処理方法。
  5. 動画の時間長に応じて上限文字数を設定する上限設定部と、
    前記動画に付加される音声を表す文字の入力を受付け入力受付部と、
    前記文字の個数である入力文字数と前記上限文字数とに応じた報知動作を実行する報知処理部と
    を具備する情報処理装置。
JP2018181200A 2018-09-27 2018-09-27 情報処理方法および情報処理装置 Pending JP2020053832A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018181200A JP2020053832A (ja) 2018-09-27 2018-09-27 情報処理方法および情報処理装置
PCT/JP2019/035902 WO2020066660A1 (ja) 2018-09-27 2019-09-12 情報処理方法、情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018181200A JP2020053832A (ja) 2018-09-27 2018-09-27 情報処理方法および情報処理装置

Publications (1)

Publication Number Publication Date
JP2020053832A true JP2020053832A (ja) 2020-04-02

Family

ID=69952627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018181200A Pending JP2020053832A (ja) 2018-09-27 2018-09-27 情報処理方法および情報処理装置

Country Status (2)

Country Link
JP (1) JP2020053832A (ja)
WO (1) WO2020066660A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059412A (ja) * 2009-09-10 2011-03-24 Fujitsu Ltd 合成音声テキスト入力装置及びプログラム
JP2011133882A (ja) * 2009-11-27 2011-07-07 Media Flats Co Ltd 音声付映像合成システム及び音声付映像合成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3741524B2 (ja) * 1997-09-11 2006-02-01 日本放送協会 ナレーション作成収録支援装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059412A (ja) * 2009-09-10 2011-03-24 Fujitsu Ltd 合成音声テキスト入力装置及びプログラム
JP2011133882A (ja) * 2009-11-27 2011-07-07 Media Flats Co Ltd 音声付映像合成システム及び音声付映像合成方法

Also Published As

Publication number Publication date
WO2020066660A1 (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
US10681408B2 (en) Systems and methods for creating composite videos
JP4596060B2 (ja) 電子機器、動画像データ区間変更方法及びプログラム
JP2007026133A (ja) 情報提供装置および情報提供方法
KR20060047204A (ko) 정보 처리 장치, 이미지 처리 장치, 정보 처리 방법 및프로그램
JPWO2011158435A1 (ja) 音声制御装置、音声制御プログラム、及び音声制御方法
WO2020066660A1 (ja) 情報処理方法、情報処理装置およびプログラム
JP2009260718A (ja) 画像再生装置及び画像再生処理プログラム
JP2014035436A (ja) 音声処理装置
JP2013131871A (ja) 編集装置、遠隔制御装置、テレビジョン受像機、特定音声信号、編集システム、編集方法、プログラム、および、記録媒体
JP2007165959A (ja) 画像表示装置
JP5454802B2 (ja) カラオケ装置
JP2009087449A (ja) 音声再生装置及び音声再生方法
JP2010008893A (ja) 電子音楽装置
JP6222611B1 (ja) デジタル音声情報記録媒体、プログラムおよび音響再生装置
JP2009118117A (ja) スライドショー作成システム及びスライドショー作成方法並びにスライドショー作成プログラム
KR20160010843A (ko) 진동 기능을 제공하는 오디오북 재생 방법, 장치 및 컴퓨터 판독 가능 매체
JP6544147B2 (ja) 歌唱動画作成装置及び歌唱動画作成システム
WO2017026387A1 (ja) 映像処理装置、映像処理方法および記録媒体
JP6646172B1 (ja) 多言語コンテンツの教育用再生方法、そのためのデータ構造及びプログラム
WO2022079853A1 (ja) 音楽データ処理方法
JP2014056137A (ja) コンテンツ再生装置、コンテンツ再生方法、コンテンツ再生プログラム
JP2022117152A (ja) 情報処理方法、情報処理システムおよびプログラム
JPH04335283A (ja) 情報編集装置
CN113948054A (zh) 音轨处理方法、装置、电子设备和存储介质
JP2003141859A (ja) 画像音声再生システム、プログラム、及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220823