JP2012042503A - インターアクティブ・ビデオシステム - Google Patents

インターアクティブ・ビデオシステム Download PDF

Info

Publication number
JP2012042503A
JP2012042503A JP2010180916A JP2010180916A JP2012042503A JP 2012042503 A JP2012042503 A JP 2012042503A JP 2010180916 A JP2010180916 A JP 2010180916A JP 2010180916 A JP2010180916 A JP 2010180916A JP 2012042503 A JP2012042503 A JP 2012042503A
Authority
JP
Japan
Prior art keywords
voice
function
user
interactive video
video system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010180916A
Other languages
English (en)
Inventor
Chie Yamamoto
智恵 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2010180916A priority Critical patent/JP2012042503A/ja
Publication of JP2012042503A publication Critical patent/JP2012042503A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】 ユーザー(視聴者)が映像(動画)とインターアクト(対話)することで、映像(動画)のストーリーが進行・変化する新しい映像(動画)技術を提供することにある。
【解決手段】 ユーザーが動画と対話するインターアクティブ・ビデオシステムにあって、ユーザーに対して、所定又は選択肢のある音声入力を促す音声受音機能と、受音されたユーザーの音声を音声認識手段によって認識・評価する音声認識評価機能と、評価された評価結果に基づいて、これと関連付けられた動画を出力する動画出力機能とを備えたことを特徴とする。
【選択図】 図4

Description

本願発明は、音声認識技術などを使用して、ユーザーが映像(動画)とインターアクト(対話・交流)することで、映像(動画)のストーリーが進行・変化する新しい映像(動画)技術の提供に関するものである。
テレビの地上デジタル放送が始まり、視聴者が参加できる(リモコンのボタンを押して答えが選べる)双方向可能なクイズ番組をよく見かけるようになったが、答えを声で言えたら楽しいのではないか?さらにクイズ番組に限らず、映画やドラマなど映像(動画)に話しかけられたら楽しいのではないか?その声に映像(動画)が反応すると、もっと楽しいのではないか?このように考えるうちに、ユーザー(視聴者)が映像(動画)とインターアクト(対話)することで、映像(動画)のストーリーが進行・変化する新しい映像(動画)のアイディアを思いつく。
特開平7−295466号公報
そこで、本願発明者は、ユーザー(視聴者)が映像(動画)とインターアクト(対話)することで、映像(動画)のストーリーが進行・変化する新しい映像(動画)技術を提供すべく、鋭意研究・開発の結果、本願発明を完成するに至った。
本願発明の第1の発明(再生モード)は、ユーザーが動画と対話するインターアクティブ・ビデオシステムにあって、ユーザーに対して、動画の出力中に選択肢を提示する選択肢提示機能と、ユーザーによって選択された選択肢に基づいて、これと関連付けられた動画を出力する動画出力機能とを備えたことを特徴とするものである。
第2の発明(挑戦モード:その1)は、ユーザーに対して、所定又は選択肢のある音声入力を促す音声受音機能と、受音されたユーザーの音声を音声認識手段によって認識・評価する音声認識評価機能と、評価された評価結果に基づいて、これと関連付けられた動画を出力する動画出力機能とを備えたことを特徴とする同インターアクティブ・ビデオシステムである。
第3の発明(挑戦モード:その2)は、音声認識評価機能による評価結果を換算する評価結果換算機能と、評価結果換算機能によって換算された成績を出力する成績出力機能とを備えたことを特徴とする同インターアクティブ・ビデオシステムである。
第4の発明(練習モード:その1)は、ユーザーに対して、所定又は選択肢のある音声入力を促す音声受音機能と、受音されたユーザーの音声を音声認識手段によって認識・評価する音声認識評価機能と、評価された評価結果が所定の合格基準に達していない場合には、再度その音声入力を促す音声練習機能とを備えたことを特徴とする同インターアクティブ・ビデオシステムである
第5の発明(練習モード:その2)は、音声受音機能は、ユーザーに対して所定又は選択肢のある音声入力を促す前に、模範となる音声を出力することを特徴とする同インターアクティブ・ビデオシステムである。
本願発明によれば、以下のような効果を有する。
(1)ユーザーによって選択された選択肢或いはユーザーの発した音声(発音)によって、動画(映像)の流れ(例えば、ストーリー)が変化する。すなわち、ユーザーの行為に動画(映像)が反応し、ユーザー(視聴者)と動画(映像)のインターアクト(対話)を実現できる。
(2)ユーザーの音声(発音)の評価結果を換算し、成績結果を出力することで、ユーザー自身が客観的に自分の成績を把握できる。それとともに、その成績(点数)は記録として残り、他ユーザーと比較できるランキングに登録可能となる。また、そのランキングはコミュニティー(例、SNSサービス)で共有され、ユーザー同士、コメントをし合うことができる。
(3)評価された評価結果が所定の合格基準に達していない場合には、再度その音声入力を促す音声練習機能を備えることで、不合格の場所を練習することができる。また、音声練習する際に模範となる音声を出力することで、効果的な音声練習を行える。
本願発明に係るインターアクティブ・ビデオの再生モードを示す説明図。 本願発明に係るインターアクティブ・ビデオの挑戦モードを示す説明図。 本願発明に係るインターアクティブ・ビデオの練習モードを示す説明図。 本願発明に係るインターアクティブ・ビデオの特徴を示す説明図(1)。 本願発明に係るインターアクティブ・ビデオの特徴を示す説明図(2)。 本願発明に係るインターアクティブ・ビデオの特徴を示す説明図(3)。 本願発明に係るインターアクティブ・ビデオの特徴を示す説明図(4)。 本願発明に係るインターアクティブ・ビデオの特徴を示す説明図(5)。 本願発明に係るインターアクティブ・ビデオの特徴を示す説明図(6)。
本願発明の実施形態を図面に基づいて説明する。
図1〜図3は、本願発明に係るインターアクティブ・ビデオシステムの機能を示す説明図である。インターアクティブ・ビデオシステムは、図1に示す再生モードと、図2に示す挑戦モードと、図3に示す練習モードからなる。
まず、図1の再生モードについて説明する。
ユーザー(ユーザー端末)は、まずサーバーにアクセスして「プレイヤー」をダウンロードする。この時、プレイヤーのプログラムに音声認識SDKが組み込まれている。また、インターアクトしたい映像(ストーリー)をダウンロードする。例えば、映像は3分前後の短編エピソードとして、定期的に新エピソードをサーバーへアップするとよい。次に、ダウンロードしたプレイヤーを起動して、ダウンロードした映像を再生すると、まず単純に映像が再生される。映像で話されているセリフ(外国語)とその翻訳(日本語)が字幕として表示される。ここで、いずれか又は両方を隠すこともできる。再生されるスピードの調整が出来る。再生されている位置を調整(巻き戻し、早送り)できる。そして、所々に「選択分岐」と呼ばれる分岐があり、表示されるセリフの選択肢から好きなものを選ぶ(クリック)ことができる。選んだセリフによって、ストーリーが変化・分岐することが特徴である。ここで、映像(ストーリー)は実写に限らず、アニメーションやCG(コンピュータグラフィックス)、スライドショーも含まれる。
次に、図2の挑戦モードについて説明する。
図1(再生モード)のプレイヤープログラム及びストーリーのダウンロードまでは一緒である。そして、図1の再生モードと同じストーリーが流れるが、映像は選んだ俳優の目線からのものになる。よって、相手の俳優がユーザーに(ユーザーの目を見て)話しかけているように見える。選んだ俳優のセリフの順番になると、入力待ちになる。マイクを使って、字幕にあるセリフ(外国語)を音声入力する(字幕を隠している場合は、記憶していないといけない)。音声入力した発音に対して、どれだけネイティブの発音に近いか音声認識され、内部的に数字が返ってくる。その数字の高い・低いで、合格・不合格を決める。合格の場合は合格マークと音が鳴り、そのままストーリーが「再生」と同じように進む。不合格の場合は不合格マークと音が鳴り、聞き返すセリフ(例、「なんて言ったの?」)が流れ、再度入力待ちになる。或いは、ストーリーの展開が変わる。なお、数秒(例えば、5秒)待っても声入力がないと入力を促す映像が流れ(例えば、手を耳に当て聞き返すジェスチャー)、再度入力待ちになるか、ストーリーの展開が変わる。ストーリーの展開は、不合格の場合徐々にネガティブとなり、最終的にはゲームオーバーになる(例、相手が怒って帰ってしまう)。「選択分岐」では、選択肢から好きなセリフを音声入力し、ストーリーを変化・分岐して、進めることができる。ストーリーの最後まで行くと、それまでの合格・不合格(数字)を換算して、総合得点(100点満点中)が冠(金、銀、銅)付きで表示される(成績の出力)。その点数は記録として残り、他ユーザーと比較できるランキングに登録される。また、そのランキングはコミュニティー(例、SNSサービス)で共有され、ユーザー同士、コメントをし合うことができるようにしてもよい。再度挑戦して、よりよい得点を出した場合は、記録されている最高得点やランキングが更新される。なお、コミュニティーで共有されるものに、録音されたユーザーの音声もある。映像と一緒にユーザーの音声を再生でき、上位ランキングの音声を参考に視聴できる。
また、図3の練習モードについて説明する。
練習モードは、不合格の箇所を「練習」することができるものである。図2(挑戦モード)と同じく、映像は選んだ俳優の目線からのものになる。選んだ俳優のセリフの順番になると、セリフ(正解の発音)が再生され、入力待ちになる。練習したい位置を調整(巻き戻し、早送り)できる。また、セリフ(正解の発音)は何度でも再生できる。音声入力(発音)が合格の場合は合格マークと音が鳴り、そのままストーリーが進む。不合格の場合は不合格マークと音が鳴り、再度セリフが再生され、入力待ちになる。この時、セリフの字幕(外国語)上、発音の悪い箇所に色が付く。合格になるまで「セリフの再生を聞き、音声入力(発音)する」を繰り返す。直前の声入力は録音されていて、何度でも聞き返すことが出来る。また、不合格マークをクリックすると、セリフの字幕(外国語)にカタカナで発音方法が表示される。なお、発音がカタカナ英語にならないように工夫されている。例えば、玉ねぎ→アニアン(オニオンではない)。強く発音する箇所に色が付いている。カタカナにない音は2つのカタカナを同時に発声させる表示を使う。例えば、「あ」と「え」の中間音は「(あえ)」と表示する。抑揚とリズムを強調した発音の再生が繰り返し聞ける。抑揚とリズムはCGの波で表示され、発音の強弱が視覚的にも分かる。字幕のカタカナを参考に、表示される波と聞こえる発音(抑揚とリズム)に合わせて(重ねて)声入力をする。音声入力の波は自動的に描かれ、正しい発音の波と重なって表示される自分の声入力の波を視覚的に比較できる。特に発音が難しい単語やフレーズはクリックすると俳優がゆっくり発音する口元のアップが動画で流れる。合格になると合格マークと音が鳴り、ストーリーが進む。
図4〜図6は、インターアクティブ・ビデオシステムの最大の特徴である「ストーリー展開の変化」について説明したものである(挑戦モード・練習モード)。
図4は、喫茶店での初デートをストーリーにしている(ユーザーの選択は男性)。
(a)「I want some coffee with my cake.」(ケーキと一緒にコーヒーが飲みたいわ)と女性に言われ、
(b)店員に対して「Can we get some coffee?」(コーヒーもらえますか?)のセリフを言う。
(c−1)正しく発音できると、コーヒーを持ってこられ、「Thank you. I'm having a great time!」(ありがとう。とても楽しいわ!)とストーリーが良い方向に展開される。
(c−2)正しく発音できないと、コーラを2本持って来られ、「Cake with cola? You have bad taste.」(ケーキとコーラ?悪趣味ね)と初デートなのに印象が悪くなる。
図5は、図4の続きである。
(d)再度、店員に「I meant two coffee.」(コーヒー2つのつもりでした)と正しく発音できると、
(e)店員に「I'm sorry. Here you go.」(すみません、どうぞ)と、正しくコーヒーを持って来てもらえ、ストーリーが良い方向に展開する。また、店員に対して「Can you take the cola away?」(コーラをさげてもらえますか?)のセリフを言う。
(f−1)正しく発音できると、コーラをさげてもらえ、「Yes, coffee goes well withcakes.」(やっぱりケーキにはコーヒーね。)とストーリーが良い方向に展開される。
(c−2)正しく発音できないと、全部を下げられ、「I was still eating!」(まだ食べていたのに!)とストーリーが悪い方向に展開される。
図5は、ビジネス会議での新製品のデザイン提案をストーリーにしている(ユーザーの選択は依頼者)。
(a)取引先(先方)から「What do you think?」(どう思われますか?)と問いかけられ、「This is not what we are looking for.」(弊社が求めているものではありません)と正しく発音できないと、
(b)「You like it, right?」(お好きですよね?)と強引に賛同を求められ、「This is not what we are looking for.」(弊社が求めているものではありません)ともう一度発音しても、
(c)再度、発音が悪いと、「Okay, let's go with this design!」(では、このデザインで行きましょう!)と会議が悪い方向へ進む。
図7〜図9は、図4〜図6に図示した「ストーリー展開の変化」を再生モードの場合で説明したものである。図4〜図6の挑戦・練習モード(音声入力がある)は、選んだ俳優目線になるので、モニターには自分の選択した俳優は表示されない。これに対して、図7〜図9の再生モード(音声入力がない)は、会話している当事者同士が表示される。その他は、図4〜図6の説明と同様であるので、その説明を省略する。
また、図4〜図9では、ユーザー(視聴者)と動画(映像)とのやり取りが「音声」であるが、その他に入力方法のバリエーションとして以下のようなものが考えられる。
(1)画面上をクリック。例えば、
・パーソナルコンピュータ(PC):画面上のアイテムにカーソルを当て、クリックする。
・家庭用コンピュータゲーム機:コントローラの方向キーで、画面上のアイテムを選び、○ボタンで決定。
・タブレット型PC:画面上のアイテムをタッチ。
等が考えられる。
(2)カメラから画像を入力。例えば、パーソナルコンピュータの上部に(ユーザーに向けて)装着したカメラでユーザーの動作(例、手を振る)を撮り、画像認識する。
(3)その他
本願発明は、以下の用途に使用できるものである。なお、(3)〜(5)については、日本人が海外に行く場合や外国人が日本に来る場合などの事前準備として便利である。
(1)語学学習
(2)企業研修、新人研修
(3)旅行、日常会話シミュレーション
(4)バーチャル旅行
(5)ハウツー・マニュアル
(6)お見合いゲーム
(7)育成ゲーム
(8)その他

Claims (5)

  1. ユーザーが動画と対話するインターアクティブ・ビデオシステムであって、
    ユーザーに対して、動画の出力中に選択肢を提示する選択肢提示機能と、
    ユーザーによって選択された選択肢に基づいて、これと関連付けられた動画を出力する動画出力機能とを備えたことを特徴とするインターアクティブ・ビデオシステム。
  2. ユーザーに対して、所定又は選択肢のある音声入力を促す音声受音機能と、
    受音されたユーザーの音声を音声認識手段によって認識・評価する音声認識評価機能と、
    評価された評価結果に基づいて、これと関連付けられた動画を出力する動画出力機能とを備えたことを特徴とする請求項1記載のインターアクティブ・ビデオシステム。
  3. 音声認識評価機能による評価結果を換算する評価結果換算機能と、
    評価結果換算機能によって換算された成績を出力する成績出力機能とを備えたことを特徴とする請求項2記載のインターアクティブ・ビデオシステム。
  4. ユーザーに対して、所定又は選択肢のある音声入力を促す音声受音機能と、
    受音されたユーザーの音声を音声認識手段によって認識・評価する音声認識評価機能と、
    評価された評価結果が所定の合格基準に達していない場合には、再度その音声入力を促す音声練習機能とを備えたことを特徴とする請求項1記載のインターアクティブ・ビデオシステム。
  5. 音声受音機能は、ユーザーに対して所定又は選択肢のある音声入力を促す前に、模範となる音声を出力することを特徴とする請求項4記載のインターアクティブ・ビデオシステム。
JP2010180916A 2010-08-12 2010-08-12 インターアクティブ・ビデオシステム Pending JP2012042503A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010180916A JP2012042503A (ja) 2010-08-12 2010-08-12 インターアクティブ・ビデオシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010180916A JP2012042503A (ja) 2010-08-12 2010-08-12 インターアクティブ・ビデオシステム

Publications (1)

Publication Number Publication Date
JP2012042503A true JP2012042503A (ja) 2012-03-01

Family

ID=45898951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010180916A Pending JP2012042503A (ja) 2010-08-12 2010-08-12 インターアクティブ・ビデオシステム

Country Status (1)

Country Link
JP (1) JP2012042503A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015503117A (ja) * 2012-10-15 2015-01-29 ジュ ファン リ 学習情報提供方法、学習方法提供システム及び学習用装置
JP2015049515A (ja) * 2013-09-02 2015-03-16 イートーク カンパニー リミテッドEtalk Co., Ltd. 言語学習プログラムおよびそれを記録したコンピュータで読み取り可能な記録媒体
TWI494904B (zh) * 2014-05-30 2015-08-01 Hiachieve Digital Technology 數位教學系統
WO2016114261A3 (ja) * 2015-01-13 2016-09-09 株式会社ジェネックスソリューションズ 映像音声クリップを利用した自律的学習システム
JP6032660B1 (ja) * 2015-07-23 2016-11-30 デレック・ヤキュウチャク 言語練習用装置、言語教材、および言語練習用プログラム
CN107135418A (zh) * 2017-06-14 2017-09-05 北京易世纪教育科技有限公司 一种视频播放的控制方法及装置
JP2022040624A (ja) * 2020-08-31 2022-03-11 Kddi株式会社 画像表示装置及びプログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015503117A (ja) * 2012-10-15 2015-01-29 ジュ ファン リ 学習情報提供方法、学習方法提供システム及び学習用装置
JP2015049515A (ja) * 2013-09-02 2015-03-16 イートーク カンパニー リミテッドEtalk Co., Ltd. 言語学習プログラムおよびそれを記録したコンピュータで読み取り可能な記録媒体
TWI494904B (zh) * 2014-05-30 2015-08-01 Hiachieve Digital Technology 數位教學系統
JPWO2016114261A1 (ja) * 2015-01-13 2017-04-27 株式会社ジェネックスソリューションズ 映像音声クリップを利用した自律的学習システム
WO2016114261A3 (ja) * 2015-01-13 2016-09-09 株式会社ジェネックスソリューションズ 映像音声クリップを利用した自律的学習システム
CN107210001B (zh) * 2015-01-13 2020-03-24 科力普莱恩株式会社 使用视频片段的自主学习系统
CN107210001A (zh) * 2015-01-13 2017-09-26 株式会社金尼克斯解决方案 使用视频片段的自主学习系统
JP6032660B1 (ja) * 2015-07-23 2016-11-30 デレック・ヤキュウチャク 言語練習用装置、言語教材、および言語練習用プログラム
JP2017026831A (ja) * 2015-07-23 2017-02-02 デレック・ヤキュウチャク 言語練習用装置、言語教材、および言語練習用プログラム
CN107851400A (zh) * 2015-07-23 2018-03-27 德里克·亚库奇克 语言练习用装置、语言教材以及语言练习用程序
KR20180033257A (ko) * 2015-07-23 2018-04-02 야큐착 데렉 언어 연습용 장치, 언어 교재, 및 언어 연습용 프로그램
WO2017014251A1 (ja) * 2015-07-23 2017-01-26 デレック ヤキュウチャク 言語練習用装置、言語教材、および言語練習用プログラム
CN107851400B (zh) * 2015-07-23 2020-11-13 德里克·亚库奇克 语言练习用装置以及存储媒体
KR102597551B1 (ko) * 2015-07-23 2023-11-02 야큐착 데렉 언어 연습용 장치, 언어 교재, 및 언어 연습용 프로그램
CN107135418A (zh) * 2017-06-14 2017-09-05 北京易世纪教育科技有限公司 一种视频播放的控制方法及装置
JP2022040624A (ja) * 2020-08-31 2022-03-11 Kddi株式会社 画像表示装置及びプログラム

Similar Documents

Publication Publication Date Title
US20220254343A1 (en) System and method for intelligent initiation of a man-machine dialogue based on multi-modal sensory inputs
US11468894B2 (en) System and method for personalizing dialogue based on user's appearances
Pearl Designing voice user interfaces: Principles of conversational experiences
US10235620B2 (en) Guided personal companion
US7284202B1 (en) Interactive multi media user interface using affinity based categorization
JP2012042503A (ja) インターアクティブ・ビデオシステム
US20020010584A1 (en) Interactive voice communication method and system for information and entertainment
US10741089B2 (en) Interactive immersion system for movies, television, animation, music videos, language training, entertainment, video games and social networking
US20150287403A1 (en) Device, system, and method of automatically generating an animated content-item
Brodie Stand-up Comedy as a Genre of Intimacy
WO2001060072A2 (en) Interactive multi media user interface using affinity based categorization
Rosenbaun et al. Blurring the boundaries between domestic and digital spheres: Competing engagements in public Google Hangouts
JP4077656B2 (ja) 発言者特定映像装置
KR101949997B1 (ko) 더빙/증강현실을 이용한 참여형 대화훈련 학습 방법
Addo Worshipping on Zoom: a digital ethnographic study of African Pentecostals churches and their Liturgical practices during Covid-19
Zhang How culture influences emotion display in transnational television formats: The case of the voice of China
Jiang et al. Beyond audio description: Exploring 360 video accessibility with blind and low vision users through collaborative creation
Hutchby Performed retelling: Self-enactment and the dramatisation of narrative on a television talk show
Camauër Denigrating and being denigrated for a higher end: Constructing ordinary expertise through supportive and belligerent talk
El Naggar American Muslim televangelists as religious celebrities: The changing “face” of religious discourse
Tosa et al. Interactive comedy: laughter as the next intelligence system
Dang et al. Opportunities for Accessible Virtual Reality Design for Immersive Musical Performances for Blind and Low-Vision People
Lau Compliment Responses in Vietnamese: The Influence of Genre and Context on Gender and Region
Junell English code-switches in Finnish Youtube vlos: Playful attitudes and casual evaluation
JP2015049365A (ja) インターアクティブ・ビデオシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130809

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20131213