JP2014035541A - コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム - Google Patents
コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム Download PDFInfo
- Publication number
- JP2014035541A JP2014035541A JP2012178620A JP2012178620A JP2014035541A JP 2014035541 A JP2014035541 A JP 2014035541A JP 2012178620 A JP2012178620 A JP 2012178620A JP 2012178620 A JP2012178620 A JP 2012178620A JP 2014035541 A JP2014035541 A JP 2014035541A
- Authority
- JP
- Japan
- Prior art keywords
- image
- text
- content
- attribute
- reproduction control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
- G10L13/0335—Pitch control
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/036—Insert-editing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/93—Regeneration of the television signal or of selected parts thereof
- H04N5/9305—Regeneration of the television signal or of selected parts thereof involving the mixing of the reproduced video signal with a non-recorded signal, e.g. a text signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
- G10L2021/105—Synthesis of the lips movements from speech, e.g. for talking heads
Abstract
【解決手段】コンテンツ再生制御装置100は、音声再生すべきテキスト内容を入力するテキスト入力手段107と、テキスト内容を発声させる主体の画像を入力する画像入力手段102と、テキスト内容を音声データに変換する変換手段109と、画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成手段109と、音声データと、生成された動画データとを同期して再生させる再生制御手段109とを備える。
【選択図】図2
Description
通信部101は例えば無線通信を利用して、CPU109からの命令に基づいて、所望する画像データを記憶装置200内から取得するために、取得信号を記憶装置200に送信する。記憶装置200は、その取得信号に基づいて自身が持つ画像データをコンテンツ再生制御装置100に供給する。尚、有線通信を利用して、画像データの取得信号等を記憶装置200に送信してもよいことは勿論である。
画像入力部102は記憶装置200から供給される画像データを無線通信又は有線通信により受け取り、CPU109にその画像データを渡す。
なお以下に示す動作は、上述した如くCPU109がプログラムメモリ110Aから読出した動作プログラムや定型データ等をワーク用領域110Fに展開した上で実行するものである。全体制御プログラムとして記憶される動作プログラム等は、このコンテンツ再生制御装置100の工場出荷時に記憶されていたもののみならず、ユーザがこのコンテンツ再生制御装置100を購入後に通信部101を介して図示しないパーソナルコンピュータ等からインターネット経由でダウンロードしたバージョンアップ用のプログラム等によりインストールした内容を含む。
その主体となるもの画像は、例えば、人の画像である。また、動物や物の画像であってもよく、その場合は、擬人化して音声が発声されることとなる。(詳しくは後述する。)
ここでは、属性1として、主体が人間(人)か動物か物かが判別され抽出されるものとしている。
人間の場合、顔の特徴から性別、大体の年齢(大人か子供か)が更に抽出される。
また、画像の特徴から、主体が動物であると判断された場合、猫か犬かといった詳細な属性を抽出し、更に猫の種別や、犬の種別が判別される例を示している。
なお、ここでは、属性決定、顔画像の切り出しの順番で、処理が行われる例で説明したが、顔画像の切り出しを行ってから、顔画像の輪郭の大きさや縦横比、目鼻口など特徴パーツの大きさや位置、形状などより、属性を決定する処理を行うようにしてもよい。
これは、記憶部110に記憶された属性に結びつけられたテキスト変化用データ110Bを参照して、変化させる。
この処理は、語尾に限らず、テキストの他の部分を属性に応じて変化させる処理を含む。
ユーザは、画像入力(選択)、切り出すべき画像を中央の画像入力(選択)、切り出し画面で指定する。
テキスト自体を主体の属性に基づいて変化させるというボタン(変化ボタン)が押されれば(変化アイコンがクリックされれば)、属性に応じてテキストが変化され、音声に変換されるテキスト欄に表示される。
オリジナルテキストをそのまま音声データに変換させたい場合は、無変化ボタンが押されれば、テキストが変化されずに、オリジナルテキストが音声に変換されるテキスト欄に表示される。
また、再生ボタンを押すことで、音声に変換されるテキストが実際にどのように発声されるのかを音として確認することができる。
しかし、当該コンテンツ再生制御装置100は、コンテンツ供給装置200及び又はコンテンツ映像再生装置300と一体になっているものであってもよい。
そのようにすれば、システムをよりコンパクトなものにすることができる。
〔付記〕
<請求項1>
コンテンツの再生を制御するコンテンツ再生制御装置であって、
音声再生すべきテキスト内容を入力するテキスト入力手段と、
当該テキスト入力手段により入力された前記テキスト内容を発声させる主体の画像を入力する画像入力手段と、
前記テキスト内容を音声データに変換する変換手段と、
当該変換手段で変換された音声データに応じて、前記画像入力手段で入力された画像を元に、当該画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成手段と、
前記音声データと、前記生成手段で生成された前記動画データとを同期して再生させる再生制御手段と
を備えることを特徴とするコンテンツ再生制御装置。
<請求項2>
前記画像の属性を決定する決定手段を更に備え、
前記変換手段は、前記決定手段により決定された属性に基づいて、前記テキスト内容を音声データに変換することを特徴とする請求項1記載のコンテンツ再生制御装置。
<請求項3>
前記変換手段は、前記決定手段により決定された属性に基づいて、前記テキストを別のテキストに変化させた上で、変化させたテキストを音声データに変換することを特徴とする請求項2記載のコンテンツ再生制御装置。
<請求項4>
前記決定手段は、前記画像から画像解析により属性を抽出する属性抽出手段を含み、
前記決定手段は、前記属性抽出手段により抽出された属性を、前記主体の画像に関する属性であると決定することを特徴とする請求項2又は3記載のコンテンツ再生制御装置。
<請求項5>
前記決定手段は、ユーザに属性を指定させる属性指定手段を更に含み、
前記決定手段は、前記属性指定手段により指定された属性を、前記主体の画像に関する属性であると決定することを特徴とする請求項2〜4何れか記載のコンテンツ再生制御装置。
<請求項6>
前記決定手段は、前記画像の属性として、発声させる主体の性別を決定し、
前記変換手段は、決定された性別に基づいて、前記テキストを音声データに変換することを特徴とする請求項2〜5何れか記載のコンテンツ再生制御装置。
<請求項7>
前記決定手段は、前記画像の属性として、発声させる主体の年齢を決定し、
前記変換手段は、決定された年齢に基づいて、前記テキストを音声データに変換することを特徴とする請求項2〜6何れか記載のコンテンツ再生制御装置。
<請求項8>
前記決定手段は、画像の属性として、発声させる主体が人か動物か物かを決定し、
前記変換手段は、決定された結果に基づいて、前記テキストを音声データに変換することを特徴とする請求項2〜7何れか記載のコンテンツ再生制御装置。
<請求項9>
前記変換手段は、前記決定手段により決定された属性に基づいて、再生速度を設定し、前記テキスト内容を音声データに変換することを特徴とする請求項2〜8何れか記載のコンテンツ再生制御装置。
<請求項10>
前記生成手段は、前記画像入力手段により入力された画像の発声に関する画像部分を抽出する画像抽出手段を含み、
前記生成手段は、前記画像抽出手段により抽出された発声に関する画像部分を、前記変換手段で変換された音声データに応じて変化させ、変化させた画像を前記画像入力手段により入力された画像に合成することにより前記動画データを生成することを特徴とする請求項1〜9何れか記載のコンテンツ再生制御装置。
<請求項11>
コンテンツの再生を制御するコンテンツ再生制御方法であって、
音声再生すべきテキスト内容を入力するテキスト入力工程と、
当該テキスト入力工程により入力された前記テキスト内容を発声させる主体の画像を入力する画像入力工程と、
前記テキスト内容を音声データに変換する変換工程と、
当該変換工程で変換された音声データに応じて、前記画像入力工程で入力された画像を元に、当該画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成工程と、
前記音声データと、前記生成工程で生成された前記動画データとを同期して再生させる再生制御工程と
を備えることを特徴とするコンテンツ再生制御方法。
<請求項12>
コンテンツの再生を制御する装置が内蔵するコンピュータが実行するプログラムであって、
前記コンピュータを、
音声再生すべきテキスト内容を入力するテキスト入力手段、
当該テキスト入力手段により入力された前記テキスト内容を発声させる主体の画像を入力する画像入力手段、
前記テキスト内容を音声データに変換する変換手段、
当該変換手段で変換された音声データに応じて、前記画像入力手段で入力された画像を元に、当該画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成手段、
前記音声データと、前記生成手段で生成された前記動画データとを同期して再生させる再生制御手段
として機能させることを特徴とするプログラム。
Claims (12)
- コンテンツの再生を制御するコンテンツ再生制御装置であって、
音声再生すべきテキスト内容を入力するテキスト入力手段と、
当該テキスト入力手段により入力された前記テキスト内容を発声させる主体の画像を入力する画像入力手段と、
前記テキスト内容を音声データに変換する変換手段と、
当該変換手段で変換された音声データに応じて、前記画像入力手段で入力された画像を元に、当該画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成手段と、
前記音声データと、前記生成手段で生成された前記動画データとを同期して再生させる再生制御手段と
を備えることを特徴とするコンテンツ再生制御装置。 - 前記画像の属性を決定する決定手段を更に備え、
前記変換手段は、前記決定手段により決定された属性に基づいて、前記テキスト内容を音声データに変換することを特徴とする請求項1記載のコンテンツ再生制御装置。 - 前記変換手段は、前記決定手段により決定された属性に基づいて、前記テキストを別のテキストに変化させた上で、変化させたテキストを音声データに変換することを特徴とする請求項2記載のコンテンツ再生制御装置。
- 前記決定手段は、前記画像から画像解析により属性を抽出する属性抽出手段を含み、
前記決定手段は、前記属性抽出手段により抽出された属性を、前記主体の画像に関する属性であると決定することを特徴とする請求項2又は3記載のコンテンツ再生制御装置。 - 前記決定手段は、ユーザに属性を指定させる属性指定手段を更に含み、
前記決定手段は、前記属性指定手段により指定された属性を、前記主体の画像に関する属性であると決定することを特徴とする請求項2〜4何れか記載のコンテンツ再生制御装置。 - 前記決定手段は、前記画像の属性として、発声させる主体の性別を決定し、
前記変換手段は、決定された性別に基づいて、前記テキストを音声データに変換することを特徴とする請求項2〜5何れか記載のコンテンツ再生制御装置。 - 前記決定手段は、前記画像の属性として、発声させる主体の年齢を決定し、
前記変換手段は、決定された年齢に基づいて、前記テキストを音声データに変換することを特徴とする請求項2〜6何れか記載のコンテンツ再生制御装置。 - 前記決定手段は、画像の属性として、発声させる主体が人か動物か物かを決定し、
前記変換手段は、決定された結果に基づいて、前記テキストを音声データに変換することを特徴とする請求項2〜7何れか記載のコンテンツ再生制御装置。 - 前記変換手段は、前記決定手段により決定された属性に基づいて、再生速度を設定し、前記テキスト内容を音声データに変換することを特徴とする請求項2〜8何れか記載のコンテンツ再生制御装置。
- 前記生成手段は、前記画像入力手段により入力された画像の発声に関する画像部分を抽出する画像抽出手段を含み、
前記生成手段は、前記画像抽出手段により抽出された発声に関する画像部分を、前記変換手段で変換された音声データに応じて変化させ、変化させた画像を前記画像入力手段により入力された画像に合成することにより前記動画データを生成することを特徴とする請求項1〜9何れか記載のコンテンツ再生制御装置。 - コンテンツの再生を制御するコンテンツ再生制御方法であって、
音声再生すべきテキスト内容を入力するテキスト入力工程と、
当該テキスト入力工程により入力された前記テキスト内容を発声させる主体の画像を入力する画像入力工程と、
前記テキスト内容を音声データに変換する変換工程と、
当該変換工程で変換された音声データに応じて、前記画像入力工程で入力された画像を元に、当該画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成工程と、
前記音声データと、前記生成工程で生成された前記動画データとを同期して再生させる再生制御工程と
を備えることを特徴とするコンテンツ再生制御方法。 - コンテンツの再生を制御する装置が内蔵するコンピュータが実行するプログラムであって、
前記コンピュータを、
音声再生すべきテキスト内容を入力するテキスト入力手段、
当該テキスト入力手段により入力された前記テキスト内容を発声させる主体の画像を入力する画像入力手段、
前記テキスト内容を音声データに変換する変換手段、
当該変換手段で変換された音声データに応じて、前記画像入力手段で入力された画像を元に、当該画像の口元を含む発声に関する対応部分を変化させた動画データを生成する生成手段、
前記音声データと、前記生成手段で生成された前記動画データとを同期して再生させる再生制御手段
として機能させることを特徴とするプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012178620A JP2014035541A (ja) | 2012-08-10 | 2012-08-10 | コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム |
PCT/JP2013/004466 WO2014024399A1 (en) | 2012-08-10 | 2013-07-23 | Content reproduction control device, content reproduction control method and program |
US14/420,027 US20150187368A1 (en) | 2012-08-10 | 2013-07-23 | Content reproduction control device, content reproduction control method and computer-readable non-transitory recording medium |
CN201380041604.4A CN104520923A (zh) | 2012-08-10 | 2013-07-23 | 内容再现控制设备、内容再现控制方法和程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012178620A JP2014035541A (ja) | 2012-08-10 | 2012-08-10 | コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014035541A true JP2014035541A (ja) | 2014-02-24 |
Family
ID=49447764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012178620A Pending JP2014035541A (ja) | 2012-08-10 | 2012-08-10 | コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150187368A1 (ja) |
JP (1) | JP2014035541A (ja) |
CN (1) | CN104520923A (ja) |
WO (1) | WO2014024399A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017007033A (ja) * | 2015-06-22 | 2017-01-12 | シャープ株式会社 | ロボット |
CN110867177A (zh) * | 2018-08-16 | 2020-03-06 | 林其禹 | 音色可选的人声播放系统、其播放方法及可读记录介质 |
CN114467140A (zh) * | 2020-08-05 | 2022-05-10 | 互动解决方案公司 | 基于语音来改变图像的系统 |
JP2022538702A (ja) * | 2020-05-27 | 2022-09-06 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 音声パケット推薦方法、装置、電子機器およびプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794104A (zh) * | 2015-04-30 | 2015-07-22 | 努比亚技术有限公司 | 多媒体文档的生成方法及装置 |
WO2017176527A1 (en) * | 2016-04-05 | 2017-10-12 | Carrier Corporation | Apparatus, system, and method of establishing a communication link |
JP7107017B2 (ja) * | 2018-06-21 | 2022-07-27 | カシオ計算機株式会社 | ロボット、ロボットの制御方法及びプログラム |
CN109218629B (zh) * | 2018-09-14 | 2021-02-05 | 三星电子(中国)研发中心 | 视频生成方法、存储介质和装置 |
CN112562721B (zh) * | 2020-11-30 | 2024-04-16 | 清华珠三角研究院 | 一种视频翻译方法、系统、装置及存储介质 |
CN112580577B (zh) * | 2020-12-28 | 2023-06-30 | 出门问问(苏州)信息科技有限公司 | 一种基于面部关键点生成说话人图像的训练方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05153581A (ja) * | 1991-12-02 | 1993-06-18 | Seiko Epson Corp | 顔画像符号化方式 |
JP2002190009A (ja) * | 2000-12-22 | 2002-07-05 | Minolta Co Ltd | 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体 |
JP2005202552A (ja) * | 2004-01-14 | 2005-07-28 | Pioneer Electronic Corp | 文章生成装置及び方法 |
JP2005257747A (ja) * | 2004-03-09 | 2005-09-22 | Nec Corp | 音声合成装置、声質生成装置及びプログラム |
JP2008241772A (ja) * | 2007-03-26 | 2008-10-09 | Konami Digital Entertainment:Kk | 音声画像処理装置、音声画像処理方法、ならびに、プログラム |
JP2010141412A (ja) * | 2008-12-09 | 2010-06-24 | Canon Inc | 画像選択装置及びその制御方法 |
JP2010238133A (ja) * | 2009-03-31 | 2010-10-21 | Namco Bandai Games Inc | プログラム、情報記憶媒体、口形状制御方法及び口形状制御装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05313686A (ja) * | 1992-04-02 | 1993-11-26 | Sony Corp | 表示制御装置 |
US6963839B1 (en) * | 2000-11-03 | 2005-11-08 | At&T Corp. | System and method of controlling sound in a multi-media communication application |
EP1271469A1 (en) * | 2001-06-22 | 2003-01-02 | Sony International (Europe) GmbH | Method for generating personality patterns and for synthesizing speech |
US20030163315A1 (en) * | 2002-02-25 | 2003-08-28 | Koninklijke Philips Electronics N.V. | Method and system for generating caricaturized talking heads |
US20040203613A1 (en) * | 2002-06-07 | 2004-10-14 | Nokia Corporation | Mobile terminal |
AU2002950502A0 (en) * | 2002-07-31 | 2002-09-12 | E-Clips Intelligent Agent Technologies Pty Ltd | Animated messaging |
GB0702150D0 (en) * | 2007-02-05 | 2007-03-14 | Amegoworld Ltd | A Communication Network and Devices |
US7853659B2 (en) * | 2008-11-25 | 2010-12-14 | International Business Machines Corporation | Method for presenting personalized, voice printed messages from online digital devices to hosted services |
US20100299134A1 (en) * | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Contextual commentary of textual images |
WO2011119117A1 (en) * | 2010-03-26 | 2011-09-29 | Agency For Science, Technology And Research | Facial gender recognition |
-
2012
- 2012-08-10 JP JP2012178620A patent/JP2014035541A/ja active Pending
-
2013
- 2013-07-23 US US14/420,027 patent/US20150187368A1/en not_active Abandoned
- 2013-07-23 CN CN201380041604.4A patent/CN104520923A/zh active Pending
- 2013-07-23 WO PCT/JP2013/004466 patent/WO2014024399A1/en active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05153581A (ja) * | 1991-12-02 | 1993-06-18 | Seiko Epson Corp | 顔画像符号化方式 |
JP2002190009A (ja) * | 2000-12-22 | 2002-07-05 | Minolta Co Ltd | 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体 |
JP2005202552A (ja) * | 2004-01-14 | 2005-07-28 | Pioneer Electronic Corp | 文章生成装置及び方法 |
JP2005257747A (ja) * | 2004-03-09 | 2005-09-22 | Nec Corp | 音声合成装置、声質生成装置及びプログラム |
JP2008241772A (ja) * | 2007-03-26 | 2008-10-09 | Konami Digital Entertainment:Kk | 音声画像処理装置、音声画像処理方法、ならびに、プログラム |
JP2010141412A (ja) * | 2008-12-09 | 2010-06-24 | Canon Inc | 画像選択装置及びその制御方法 |
JP2010238133A (ja) * | 2009-03-31 | 2010-10-21 | Namco Bandai Games Inc | プログラム、情報記憶媒体、口形状制御方法及び口形状制御装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017007033A (ja) * | 2015-06-22 | 2017-01-12 | シャープ株式会社 | ロボット |
CN110867177A (zh) * | 2018-08-16 | 2020-03-06 | 林其禹 | 音色可选的人声播放系统、其播放方法及可读记录介质 |
JP2020056996A (ja) * | 2018-08-16 | 2020-04-09 | 國立臺灣科技大學 | 音色選択可能なボイス再生システム、その再生方法、およびコンピュータ読み取り可能な記録媒体 |
JP2022538702A (ja) * | 2020-05-27 | 2022-09-06 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 音声パケット推薦方法、装置、電子機器およびプログラム |
JP7240505B2 (ja) | 2020-05-27 | 2023-03-15 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 音声パケット推薦方法、装置、電子機器およびプログラム |
CN114467140A (zh) * | 2020-08-05 | 2022-05-10 | 互动解决方案公司 | 基于语音来改变图像的系统 |
US11568877B2 (en) | 2020-08-05 | 2023-01-31 | Interactive Solutions Corp. | System to change image based on voice |
Also Published As
Publication number | Publication date |
---|---|
US20150187368A1 (en) | 2015-07-02 |
CN104520923A (zh) | 2015-04-15 |
WO2014024399A1 (en) | 2014-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014035541A (ja) | コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム | |
US9332100B2 (en) | Portable communications device | |
JP2014011676A (ja) | コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム | |
US20080275700A1 (en) | Method of and System for Modifying Messages | |
JP6665446B2 (ja) | 情報処理装置、プログラム及び音声合成方法 | |
JP2020056996A (ja) | 音色選択可能なボイス再生システム、その再生方法、およびコンピュータ読み取り可能な記録媒体 | |
JP2020160341A (ja) | 動画出力システム | |
JP2003530654A (ja) | キャラクタのアニメ化 | |
JP5045519B2 (ja) | 動作生成装置、ロボット及び動作生成方法 | |
EP3548156B1 (en) | Animated character head systems and methods | |
KR19980082608A (ko) | 다중매체와의 연동을 위한 텍스트/음성변환기 및 그 입력 데이터 구조화 방법 | |
TW201233413A (en) | Input support device, input support method, and recording medium | |
KR20150076128A (ko) | 3차원 멀티미디어 활용 발음 학습 지원 시스템 및 그 시스템의 발음 학습 지원 방법 | |
US7315820B1 (en) | Text-derived speech animation tool | |
JPH11109991A (ja) | マンマシンインターフェースシステム | |
US20240022772A1 (en) | Video processing method and apparatus, medium, and program product | |
CN112348932A (zh) | 口型动画录制方法及装置、电子设备、存储介质 | |
JP3569278B1 (ja) | 発音学習支援方法、学習者端末及び処理プログラム並びに該プログラムを記録した記録媒体 | |
Fletcher et al. | Speech modification by a deaf child through dynamic orometric modeling and feedback | |
JP4276393B2 (ja) | 番組制作支援装置及び番組制作支援プログラム | |
JP6902127B2 (ja) | 動画出力システム | |
US20080228497A1 (en) | Method For Communication and Communication Device | |
JP4720974B2 (ja) | 音声発生装置およびそのためのコンピュータプログラム | |
JP2001005476A (ja) | プレゼンテーション装置 | |
JP4052561B2 (ja) | 映像付帯音声データ記録方法、映像付帯音声データ記録装置および映像付帯音声データ記録プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170314 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20171003 |