JP2021180473A - オンライン絵本コンテンツの取得方法、装置及びスマートスクリーンデバイス - Google Patents

オンライン絵本コンテンツの取得方法、装置及びスマートスクリーンデバイス Download PDF

Info

Publication number
JP2021180473A
JP2021180473A JP2020213348A JP2020213348A JP2021180473A JP 2021180473 A JP2021180473 A JP 2021180473A JP 2020213348 A JP2020213348 A JP 2020213348A JP 2020213348 A JP2020213348 A JP 2020213348A JP 2021180473 A JP2021180473 A JP 2021180473A
Authority
JP
Japan
Prior art keywords
picture book
content
image
video
online
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020213348A
Other languages
English (en)
Other versions
JP7153052B2 (ja
Inventor
▲暁▼澄 戴
Xiaocheng Dai
柳 郎
Liu Lang
▲楽▼ 王
Le Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2021180473A publication Critical patent/JP2021180473A/ja
Application granted granted Critical
Publication of JP7153052B2 publication Critical patent/JP7153052B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】スマートスクリーンデバイスでオンライン絵本コンテンツをビデオの方式で表示し、より生き生きとした方式でオフライン絵本コンテンツを取得する方法、装置及びスマートスクリーンデバイスを提供する。【解決手段】方法は、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得し、スマートスクリーンデバイスと通信リンクを確立するプリズムコンポーネントがオフライン絵本に対応する画像コンテンツを認識して取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得する。【選択図】図1

Description

本出願は、インターネット技術分野に関し、具体的にオンライン教育技術分野に関し、特にオンライン絵本コンテンツの取得方法、装置及びスマートスクリーンデバイスに関する。
マルチモーダルインテリジェントインタラクションは、将来のインテリジェントインタラクションの主要な形式であり、人工知能技術の進歩に伴い、人とスマートデバイスの間、および人とマシンの間のインタラクションは、よりスマートで、より自然になる傾向がある。ユーザは例えば、スマートスピーカ、スマートロボットなどのスマートデバイスとのインタラクションにより、クラス内の教育リソース、課外リソース、娯楽リソースなど、様々なリソースを取得することができる。
しかしながら、既存のスマートデバイスがユーザにオンライン絵本コンテンツを提供する場合、オーディオ形式のコンテンツのみを提供することができ、より多くのシーンに適合するオンライン絵本コンテンツを豊富なマルチメディア形式で表示することができない。
本出願は、オンライン絵本コンテンツの取得方法、装置、スマートスクリーンデバイス及び記憶媒体を提供する。
本出願の第1の側面の実施例は、スマートスクリーンデバイスに適用されるオンライン絵本コンテンツの取得方法を提供し、
前記スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立するステップと、
前記プリズムコンポーネントを使用してオフライン絵本を認識して、前記オフライン絵本に対応する画像コンテンツを取得するステップと、
前記画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得するステップと、を含む。
本出願の第2の側面の実施例は、スマートスクリーンデバイスに適用されるオンライン絵本コンテンツの取得装置を提供し、
前記スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立するための確立モジュールと、
前記プリズムコンポーネントを使用してオフライン絵本を認識して、前記オフライン絵本に対応する画像コンテンツを取得するための認識モジュールと、
前記画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得するための取得モジュールと、を含む。
本出願の第3の側面の実施例は、スマートスクリーンデバイスを提供し、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも一つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサによって実行される場合、前記少なくとも一つのプロセッサが第1の側面の実施例のオンライン絵本コンテンツの取得方法を実行する。
本出願の第4の側面の実施例は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに第1の側面の実施例のオンライン絵本コンテンツの取得方法を実行させる。
本出願の第5の態様では、コンピュータプログラムを提供し、前記コンピュータプログラムにおける命令が実行された場合に、第1の側面の実施例のオンライン絵本コンテンツの取得方法が実行される。
上記出願における一つの実施例は、以下のような利点または有益な効果を有する。スマートスクリーンデバイスに適用され、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得する。当該方法は、スマートスクリーンデバイスと通信リンクを確立するプリズムコンポーネントがオフライン絵本に対応する画像コンテンツを認識して取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得し、従来技術におけるオーディオ形式のオンライン絵本コンテンツのみを取得することと比較して、本出願は、スマートスクリーンデバイスでオンライン絵本コンテンツをビデオの方式で表示し、より生き生きとした方式でオフライン絵本コンテンツをユーザに提供することができることを実現する。
なお、この部分に記載された内容は、本開示の実施例の肝心または重要な特徴を限定することを意図するものではなく、本開示の範囲を限定することを意図するものでもない。本開示の他の特徴は、以下の説明によって容易に理解されやすくなる。
図面は、本技術案をよりよく理解するために使用されており、本出願の限定を構造するものではない。
本出願の実施例一により提供されるオンライン絵本コンテンツの取得方法のフローチャートである。 本出願の実施例により提供されるオンライン絵本コンテンツの取得の例示図である。 本出願の実施例二により提供されるオンライン絵本コンテンツの取得方法のフローチャートである。 本出願の実施例三により提供されるオンライン絵本コンテンツの取得方法のフローチャートである。 本出願の実施例四により提供されるオンライン絵本コンテンツの取得装置の概略構造図である。 本出願の実施例のオンライン絵本コンテンツの取得方法を実現するためのスマートスクリーンデバイスのブロック図である。
以下、図面を組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔するために、以下の説明では、周知の機能及び構造の説明を省略する。
以下、図面を参照して本出願の実施例のオンライン絵本コンテンツの取得方法、装置、スマートスクリーンデバイス及び記憶媒体を説明する。
図1は本出願の実施例一により提供されるオンライン絵本コンテンツの取得方法のフローチャートである。
本出願の実施例は、当該オンライン絵本コンテンツの取得方法がオンライン絵本コンテンツの取得装置に配置されることを例として説明し、当該オンライン絵本コンテンツの取得装置はいずれかのスマートスクリーンデバイスに適用されることができ、当該スマートスクリーンデバイスがオンライン絵本コンテンツの取得機能を実行することができる。
一つの可能的な情況として、本出願の実施例により提供されるオンライン絵本コンテンツの取得方法は、教育係アプリケーション(Application、APPと略称する)に適用されることができ、教育係APPはスマートスクリーンデバイスで実行することができる。ここで、スマートスクリーンデバイスは、タッチスクリーンを備えたスマートデバイスであってもよい。
なお、子供が絵本を読みやすくするために、スマートデバイスのタッチスクリーンを大きなスクリーンに設定し、一定の角度に傾けることであってもよい。例えば、スマートスクリーンのスクリーンは8インチであってもよく、スクリーンの傾斜角度は105°であってもよい。
図1に示すように、当該オンライン絵本コンテンツの取得方法は、以下のステップを含むことができる。
ステップ101:スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立する。
ここで、スマートスクリーンデバイスは、ユーザとの遠方界の音声インタラクションやジェスチャーコントロール、目覚め、顔認識などのマルチモーダルインタラクションを実現して、ユーザにより自然で多様な人間とコンピュータのインタラクション体験を提供する。例えば、スマートスクリーンデバイスは、タッチスクリーンを備えたスマートスピーカであってもよい。
なお、スマートスクリーンデバイスがスリープ状態にあるとき、ユーザは音声、顔認識、タッチ、クリックなどの方式によってスマートスクリーンデバイスをウェイクアップして、アウェイクアップ状態にあるスマートスクリーンデバイスがプリズムコンポーネントと通信リンクを確立することができる。
本出願におけるプリズムコンポーネントは、プリズム枠、及び反射鏡などを含むことができる。
本出願の実施例において、スマートスクリーンデバイスは、ユニバーサル・シリアル・バス(Universal Serial Bus、USBと略称する)インタフェースによってプリズムコンポーネントと通信リンクを確立することができ、ブルートゥース(登録商標)によってプリズムコンポーネントと通信リンクを確立することもでき、無線通信ネットワーク接続方式によってプリズムコンポーネントと通信リンクを確立することもできる。
なお、スマートスクリーンデバイスとプリズムコンポーネントの間の通信接続方式は、上述接続通信接続方式に限定されず、他の通信接続方式によって通信リンクを確立するもよく、ここでは限定しない。
ステップ102:プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得する。
ここで、オフライン絵本は、子供用の絵本でも大人用の絵本でもよいが、ここでは限定しない。
本出願の実施例において、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立した後、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することができる。ここで、オフライン絵本に対応する画像コンテンツは、オフライン絵本の表紙画像コンテンツであってもよいし、オフライン絵本の本文部分の画像コンテンツであってもよい、ここでは限定しない。オフライン絵本の画像コンテンツは、画像部分および/または文字部分を含むこともできる。
例えば、オフライン絵本の表紙画像コンテンツはそれぞれ異なるので、オフライン絵本に対応する画像コンテンツはオフライン絵本の表紙画像コンテンツである場合、スマートスクリーンデバイスがオフライン絵本の表紙画像コンテンツを効果的に認識して取得できるようにして、表紙画像コンテンツとマッチングされたビデオ形式のオンライン絵本コンテンツを取得する。本出願において、スマートスクリーンデバイスは、オフラインでもオンラインでも、オフライン絵本に対応する画像コンテンツの検出を実現することができ、ここでは限定しない。
一つの可能的な実現方式として、プリズムコンポーネントをスマートスクリーンデバイスの上方に設置し、オフライン絵本とスマートスクリーンデバイスを同じレベルに配置し、プリズムコンポーネントによってオフライン絵本を認識した後、スマートスクリーンデバイスにオフライン絵本に対応する画像コンテンツを取得させることができる。
例示として、プリズムコンポーネントにカメラヘッドが設置されたと仮定すると、プリズムコンポーネントにおけるカメラヘッドによってオフライン絵本に対応する画像を収集することができ、さらに、収集された画像を認識して、オフライン絵本に対応する画像コンテンツを取得する。
本出願の実施例において、プリズムコンポーネントに設置されたカメラヘッドがオフライン絵本に対応する画像を収集して取得した後、さらに収集されたオフライン絵本の画像を画像認識して、オフライン絵本に対応する画像コンテンツを取得する。
例えば、カメラヘッドがオフライン絵本の画像を収集して取得した後、画像に強調処理を行って、画像中のノイズを低減し、画像の鮮明度、品質などを向上させることができる。さらに、画像をエンコード、圧縮などする方式で画像処理を行う。そして、画像処理して取得された画像に対して特徴抽出を行って、抽出して取得された特徴図をトレーニングされた画像認識モデルに入力し、モデルの出力に基づいてオフライン絵本に対応する画像コンテンツを決定することができる。
なお、他の画像認識方法によってカメラヘッドで収集されたオフライン絵本の画像を画像処理してもよく、例えば、ニューラルネットワークに基づく画像認識方法、またはウェーブレット距離に基づく画像認識方法などを使用して、画像コンテンツを含む初期絵本コンテンツを取得する。
なお、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得する場合、オフライン絵本の表紙を認識してもよいし、オフライン絵本の本文部分を認識してもよい、ここでは限定しない。
例えば、図2を参照すると、図2におけるスマートスクリーンデバイスはスマートスピーカであってもよく、スマートスピーカとオフライン絵本を同じレベルに配置して、スマートスピーカの上方に設置されたプリズムコンポーネントがオフライン絵本を認識させて、オフライン絵本に対応する画像コンテンツを取得することができる。一つの可能的な情況において、スマートスピーカが有効なオフライン絵本を認識しておらず、ユーザにオフライン絵本の交換を促すことができる。
例えば、スマートスピーカのスクリーンに文字を表示する方式で、例えば「絵本が無効なので、交換してください」を表示する方式でユーザに注意を促すことができ、音声再生の方式で、例えば音声「絵本が無効なので、交換してください」を再生する方式でユーザに注意を促すこともでき、ビープ音や予め設定された音楽などの特定の音を出す方式でユーザに注意を促すこともでき、ここでは限定しない。
もう一つの可能的な実現方式として、プリズムコンポーネントにおけるプリズムによってオフライン絵本をキャプチャした後、スマートスクリーンデバイスに設置されたカメラヘッドによってプリズムに表示されたオフライン絵本を収集し、さらにスマートスクリーンデバイスがオフライン絵本を取得した後、収集されたオフライン絵本コンテンツを認識して、オフライン絵本に対応する画像コンテンツを取得することができる。
本出願の実施例の一つの可能的な情況として、スマートスクリーンデバイスに、オフライン絵本に構造光を発射するための構造光発射装置を取り付けることができる。構造光がオフライン絵本を照射した後、オフライン絵本に基づいて構造光を反射して、構造光の歪みを引き起こし、オフライン絵本に対応する画像コンテンツを取得することができる。
例示として、構造光のタイプは、グレーティング型、スポット型、スペックル型(円形スペックルと十字スペックルを含む)を含み、上記構造光は均一に配置されている。対応的に、構造光を生成するデバイスは、光のスポット、ライン、グレーティング、グリッド、またはスペックルをオフライン絵本コンテンツ上に投影するある投影デバイスまたは機器、例えば光学プロジェクタであってもよいし、レーザービームを生成するレーザであってもよい。
ステップ103:画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得する。
ここで、オンライン絵本コンテンツは、スマートスクリーンデバイスで予め取得された、絵本コンテンツライブラリに記憶されたコンテンツであってもよいし、サードパーティのAPPで提供されるオンライン絵本コンテンツであってもよいし、外部検索エンジンがクエリして教育係APPにフィードバックしたオンライン絵本コンテンツであってもよい、ここでは限定しない。
本出願において、オフライン絵本に対応する画像コンテンツを取得した後、画像コンテンツに基づいて、対応するビデオ形式のオンライン絵本コンテンツを取得することができる。
一つの可能的な実現方式として、画像コンテンツで含まれた画像部分及び文字部分に基づいて、スマートスクリーンデバイスで予め取得された、絵本コンテンツライブラリに記憶されたコンテンツから画像コンテンツとマッチングされたビデオ形式のオンライン絵本コンテンツを取得することができる。
もう一つの可能的な実現方式として、画像コンテンツで含まれた画像部分及び文字部分に基づいて、サードパーティのAPPから画像コンテンツとマッチングされたビデオ形式のオンライン絵本コンテンツを取得することができる。
もう一つの可能的な実現方式として、画像コンテンツで含まれた画像部分及び文字部分に基づいて、外部検索エンジンから画像コンテンツとマッチングされたビデオ形式のオンライン絵本コンテンツをクエリすることができる。
なお、画像コンテンツに基づいて取得されたオンライン絵本コンテンツは、オフライン絵本コンテンツと同期したビデオコンテンツであってもよく、スマートスクリーンデバイスの表示ページにオンライン絵本コンテンツをビデオの形式で表示し、より生き生きとした方式でオフライン絵本コンテンツをユーザに提供することができる。
選択可能に、スマートスクリーンデバイスがビデオ形式のオンライン絵本コンテンツを取得した後、スマートスクリーンデバイスに取り付けられた教育係APPのメインインタフェースでは、オンライン絵本コンテンツをビデオの方式で表示することで、ユーザがビデオ形式のオンライン絵本コンテンツを取得することができる。
本出願の実施例のオンライン絵本コンテンツの取得方法は、スマートスクリーンデバイスに適用され、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得する。当該方法は、スマートスクリーンデバイスと通信リンクを確立するプリズムコンポーネントがオフライン絵本に対応する画像コンテンツを認識して取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得し、従来技術におけるオーディオ形式のオンライン絵本コンテンツのみを取得することと比較して、本出願は、スマートスクリーンデバイスでオンライン絵本コンテンツをビデオの方式で表示し、より生き生きとした方式でオフライン絵本コンテンツをユーザに提供することができることを実現する。
上記実施例に基づいて、本出願は、もう一つのオンライン絵本コンテンツの取得方法を提供する。
図3は本出願の実施例二により提供されるオンライン絵本コンテンツの取得方法のフローチャートである。
図3に示すように、当該オンライン絵本コンテンツの取得方法は、以下のステップを含むことができる。
ステップ201:スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立する。
ステップ202:プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得する。
本出願の実施例において、ステップ201及びステップ202の実現プロセスは、上記実施例におけるステップ101及びステップ102の実現プロセスを参照することができ、ここでは説明を省略する。
ステップ203:画像コンテンツを解析してコンテンツタグを取得する。
ここで、コンテンツタグは、オフライン絵本に対応する画像コンテンツをマークして、対応するビデオ形式を取得するためのオンライン絵本コンテンツであってもよい。
選択可能に、大量のオフライン絵本に対応する画像コンテンツを予めマークして、各オフライン絵本に対応する画像コンテンツのコンテンツタグを作成することができる。例えば、オフライン絵本の表紙をマークすることができ、オフライン絵本のページごとをマークすることもできる。オフライン絵本に対応する画像コンテンツをマークする場合、カメラヘッドによってオフライン絵本に対応する画像コンテンツを異なる角度と位置で収集して、オフライン絵本に対応する画像コンテンツをマークして対応するコンテンツタグを取得することができる。
一つの可能的な実現方式として、オフライン絵本に対応する画像コンテンツを予めトレーニングされたコンテンツ認識モデルに入力して、モデルの出力に基づいて対応するコンテンツタグを取得することができる。
ここで、コンテンツ認識モデルはディープニューラルネットワークに基づくモデルであってもよく、大量のマークされたオフライン絵本に対応する画像コンテンツに基づいて予めトレーニングされた、画像コンテンツとコンテンツタグの対応関係を学習したものであってもよい。
ステップ204:ビデオライブラリからコンテンツタグに対応する絵本ビデオをビデオ形式のオンライン絵本コンテンツとして取得する。
ここで、絵本ビデオは、ビデオ形式で再生される絵本コンテンツであってもよい。ビデオライブラリは、大量のオフライン絵本に対応する画像コンテンツに対応するコンテンツタグに基づいて、予め記憶された、コンテンツタグを持った絵本ビデオであってもよい。
本出願の実施例において、オフライン絵本に対応する画像コンテンツを解析して、画像コンテンツに対応するコンテンツタグを取得した後、ビデオライブラリからコンテンツタグに対応する絵本ビデオをビデオ形式のオンライン絵本コンテンツとして取得することができる。
一つの可能的な実現方式として、スマートスクリーンデバイスは複数の絵本ビデオを予めローカルビデオライブラリに格納して、画像コンテンツに基づいて取得されたコンテンツタグを解析し、スマートスクリーンデバイスのローカルビデオライブラリからコンテンツタグに対応する絵本ビデオを取得して、取得された絵本ビデオをビデオ形式のオンライン絵本コンテンツとすることができる。これにより、スマートスクリーンデバイスのローカルビデオライブラリが絵本ビデオを提供することにより、ビデオ形式のオンライン絵本コンテンツの取得速度を向上させ、ユーザがオンライン絵本コンテンツを取得するための使用体験を向上させることに役立つ。
もう一つの可能的な実現方式として、画像コンテンツを解析して取得されたコンテンツタグに基づいて、スマートスクリーンデバイスのローカルビデオライブラリからコンテンツタグに対応する絵本ビデオを取得していない。この場合に、サードパーティのビデオライブラリからコンテンツタグに対応する絵本ビデオを取得して、取得された絵本ビデオをビデオ形式のオンライン絵本コンテンツとすることができる。これにより、ローカルビデオライブラリにコンテンツタグに対応する絵本ビデオが格納されない場合、対応する絵本ビデオを取得することもできる。
もう一つの可能的な実現方式として、オフライン絵本に対応する画像コンテンツを解析してコンテンツタグを取得した後、ローカルビデオライブラリ及びサードパーティのビデオライブラリから同時にコンテンツタグに対応する絵本ビデオを取得することができる。取得された絵本ビデオが同じでない場合、最新バージョンの絵本ビデオをビデオ形式のオンライン絵本コンテンツとして、スマートスクリーンデバイスの画面に表示することができ、異なる絵本ビデオをスマートスクリーンデバイスの画面に表示して、ユーザの選択に基づいて表示する必要がある絵本ビデオを決定することもできる。
選択可能に、ビデオライブラリは、候補コンテンツタグ、及び候補コンテンツタグに対応する候補絵本ビデオを含むことができる。つまり、ビデオライブラリは、複数のコンテンツタグ及びコンテンツタグに対応する絵本ビデオを格納することができる。
本出願の実施例において、オフライン絵本に対応する画像コンテンツを解析してコンテンツタグを取得した後、ビデオライブラリにおけるコンテンツタグとマッチングされた候補コンテンツタグに対応する候補絵本ビデオをビデオ形式のオンライン絵本コンテンツとして直接取得することができる。これにより、ビデオ形式のオンライン絵本コンテンツの取得効率を向上させる。
オフライン絵本に対応する画像コンテンツを解析してコンテンツタグを取得した後、コンテンツタグとビデオライブラリに格納された候補コンテンツタグを比較して、コンテンツタグとある候補コンテンツタグがマッチングされた場合、ビデオライブラリから取得された、コンテンツタグとマッチングされた候補コンテンツタグに対応する候補絵本ビデオをビデオ形式のオンライン絵本コンテンツとすることができると理解できる。
例えば、ローカルビデオライブラリに格納された候補コンテンツタグにはオフライン絵本に対応するコンテンツタグとマッチングされた候補コンテンツタグがあるか否かを判断することができ、ローカルビデオライブラリに格納された候補コンテンツタグにはオフライン絵本に対応するコンテンツタグとマッチングされた候補コンテンツタグがある場合、ローカルビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグに対応する候補絵本ビデオをビデオ形式のオンライン絵本コンテンツとして直接取得することができる。ローカルビデオライブラリに格納された候補コンテンツタグにはオフライン絵本に対応するコンテンツタグとマッチングされた候補コンテンツタグがない場合、さらに、サードパーティのビデオライブラリからコンテンツタグに対応する絵本ビデオを取得する。
選択可能に、スマートスクリーンデバイスがビデオ形式のオンライン絵本コンテンツを取得した後、スマートスクリーンデバイスに取り付けられた教育係APPのメインインタフェースでは、オンライン絵本コンテンツをビデオの方式で表示することで、ユーザがビデオ形式のオンライン絵本コンテンツを取得することができる。
本出願の実施例のオンライン絵本コンテンツの取得方法は、スマートスクリーンデバイスに適用され、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得し、画像コンテンツを解析してコンテンツタグを取得し、ビデオライブラリからコンテンツタグに対応する絵本ビデオをビデオ形式のオンライン絵本コンテンツとして取得する。これにより、オフライン絵本に対応する画像コンテンツに基づいて取得された対応するコンテンツタグを解析することにより、ビデオライブラリからビデオ形式のオンライン絵本コンテンツを取得し、オンライン絵本コンテンツをビデオ方式で表示する目的を実現し、ユーザがより生き生きとしたオフライン絵本コンテンツを取得することができる。
上記実施例に基づいて、一つの可能的な情況で、ビデオライブラリは、候補コンテンツタグ、及び候補コンテンツタグに対応するマルチフレーム候補絵本画像をさらに含むことができる。この場合に、ビデオライブラリからオフライン絵本コンテンツに対応するコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を取得して、マルチフレーム候補絵本画像に基づいて、対応する絵本ビデオを合成することができる。以下は図4を組み合わせて上記のプロセスについて詳細に説明し、図4は本出願の実施例三により提供されるオンライン絵本コンテンツの取得方法のフローチャートである。
図4に示すように、当該オンライン絵本コンテンツの取得方法は、以下のステップを含むことができる。
ステップ301:スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立する。
ステップ302:プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得する。
ステップ303:画像コンテンツを解析してコンテンツタグを取得する。
本出願の実施例において、ステップ301及びステップ303の実現プロセスは、上記実施例におけるステップ201及びステップ203の実現プロセスを参照することができ、ここでは説明を省略する。
ステップ304:ビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を読み取る。
選択可能に、ビデオライブラリは、候補コンテンツタグ、及び候補コンテンツタグに対応するマルチフレーム候補絵本画像をさらに含むことができる。つまり、ビデオライブラリには、複数のコンテンツタグ及びコンテンツタグごとに対応するマルチフレーム絵本画像が格納される。例えば、1つのオフライン絵本は5ページあり、ビデオライブラリにはそのオフライン絵本に対応する絵本画像が5フレーム格納されることができる。
1つの完全なオフライン絵本は複数のコンテンツを含むことができるので、オフライン絵本に対応する画像コンテンツのコンテンツタグは、マルチフレーム候補絵本画像に対応することができると理解できる。
本出願において、オフライン絵本に対応する画像コンテンツを解析して画像コンテンツに対応するコンテンツタグを取得した後、画像コンテンツに対応するコンテンツタグとビデオライブラリに格納された候補コンテンツタグを比較して、ビデオライブラリから画像コンテンツに対応するコンテンツタグとマッチングされた候補コンテンツタグを取得することができる。さらに、ビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を読み取る。
なお、本出願のビデオライブラリはスマートスクリーンデバイスに対応するローカルビデオライブラリであってもよいし、サードパーティのビデオライブラリであってもよい、ここでは限定しない。
なお、オフライン絵本に対応するビデオ形式のオンライン絵本コンテンツを取得する速度を向上させるために、まずローカルビデオライブラリにはオフライン絵本の画像コンテンツに対応するコンテンツタグとマッチングされた候補コンテンツタグが格納されるか否かを決定することができる。一つの可能的な情況で、ローカルビデオライブラリにはコンテンツタグとマッチングされた候補コンテンツタグが格納されると決定された場合、ビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を直接読み取ることができる。
もう一つの可能的な情況で、ローカルビデオライブラリにはコンテンツタグとマッチングされた候補コンテンツタグが格納されない、サードパーティのビデオライブラリにはコンテンツタグとマッチングされた候補コンテンツタグが格納されると決定された場合、サードパーティのビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を直接読み取ることができる。
ステップ305:マルチフレーム候補絵本画像に基づいて、対応する絵本ビデオをビデオ形式のオンライン絵本コンテンツとして合成する。
本出願の実施例において、ビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を取得した後、マルチフレーム候補絵本画像を合成して、対応する絵本ビデオを取得し、さらにビデオ形式のオンライン絵本コンテンツを取得する。
一つの可能的な情況で、各フレーム候補絵本画像は、それぞれ1つのタイムスタンプに対応することができ、つまり、各フレーム候補絵本画像にはタイムスタンプを持つことができる。本出願において、マルチフレーム候補絵本画像に基づいて、各フレーム候補絵本画像に対応するタイムスタンプを結合して、対応する絵本ビデオをビデオ形式のオンライン絵本コンテンツとして合成する。
例示として、マルチフレーム候補絵本画像を、各フレーム候補絵本画像に対応するタイムスタンプの優先順位に従って並べ替えることで、並べ替えたマルチフレーム候補絵本画像を対応する絵本ビデオに合成することができる。
選択可能に、各フレーム候補絵本画像は、1段のテキストコンテンツに対応することができ、マルチフレーム候補絵本画像に基づいて対応する絵本ビデオを合成した後、各フレーム候補絵本画像に対応するテキストコンテンツに基づいて、絵本ビデオに対応するオーディオを形成し、形成された絵本ビデオを対応するオーディオに関連付けることができる。
本出願の実施例のオンライン絵本コンテンツの取得方法は、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得し、画像コンテンツを解析してコンテンツタグを取得し、ビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を読み取り、マルチフレーム候補絵本画像に基づいて、対応する絵本ビデオをビデオ形式のオンライン絵本コンテンツとして合成する。これにより、ビデオライブラリからコンテンツタグに対応するマルチフレーム候補絵本画像を取得して、取得された絵本ビデオを合成することができ、ビデオ形式のオンライン絵本コンテンツの取得を実現する。
上記のいずれかの実施例において、一つの可能的な情況として、プリズムコンポーネントは、撮影コンポーネントと画像認識コンポーネントとを含むことができる。ここで、撮影コンポーネントは、マルチモーダルのインタラクション方式に基づいてオフライン絵本の絵本画像をキャプチャすることに用いられ、画像認識コンポーネントは、絵本画像の画像特徴を認識して取得することに用いられる。
ここで、それぞれの情報のソースまたは形式は、モーダルと呼ぶことができる。例えば、人の触覚、聴覚、視覚、嗅覚、情報の媒体の音声、ビデオ、文字など、レーダー、赤外線、加速度計などの様々なセンサ、これらのいずれも一種のモーダルと呼ぶことができる。
2つの異なる言語を2つのモーダルと考えることができ、2つの異なる状況で収集されたデータセットでも、2つのモーダルと考えることができる。したがって、本出願において、マルチモーダルのインタラクション方式に基づいてオフライン絵本の画像コンテンツをキャプチャすることができる。
一つの可能的な実現方式として、オンライン絵本コンテンツを取得するときに、プリズムコンポーネントをスマートスクリーンデバイスの上方に取り付け、スマートスクリーンデバイスとオフライン絵本が同じレベルに位置して、プリズムコンポーネントの撮影コンポーネントによってオフライン絵本の絵本画像をキャプチャすることができる。撮影コンポーネントで収集されたオフライン絵本の絵本画像を取得した後、画像認識コンポーネントを使用して、絵本画像を画像認識して、絵本画像の画像特徴を認識して取得することができる。さらに、スマートスクリーンデバイスのプロセッサを使用して、絵本画像の画像特徴を解析して、オフライン絵本に対応する画像コンテンツを取得する。
なお、撮影コンポーネントは、通常のカメラヘッドを設置することができ、通常のカメラヘッドを使用してオフライン教材コンテンツを撮影して、オフライン教材コンテンツに対応する2次元絵本画像を取得することができ、撮影コンポーネントは、深度カメラヘッドを設置することもでき、深度カメラヘッドを使用してオフライン絵本コンテンツを撮影して、深度情報を含む3次元絵本画像を取得することもでき、もちろん、撮影コンポーネントは他の形式のカメラヘッドを設置することもでき、ここでは限定しない。
選択可能に、スマートスクリーンデバイスのプロセッサが絵本画像の画像特徴を取得した後、画像特徴をトレーニングされた画像認識モデルに入力して、モデルの出力に基づいて、オフライン絵本に対応する画像コンテンツを決定することができる。
これにより、プリズムコンポーネントによってオフライン絵本の画像特徴を取得し、さらに解析してオフライン絵本に対応する画像コンテンツを取得して、画像コンテンツに基づいてビデオ形式のオンライン絵本コンテンツを取得し、スマートスクリーンデバイスにオンライン絵本コンテンツをビデオの方式で表示することを実現し、子供の良い読書習慣を育成することができ、めくりながら見ながら聞きながら考えることで絵本を読み、絵本の内容のすばらしさを実感し、言語能力、感情体験、思考能力の共同発展を促進することができる。
上記実施例を実現するために、本出願は、オンライン絵本コンテンツの取得装置を提供する。
図5は本出願の実施例四により提供されるオンライン絵本コンテンツの取得装置の概略構造図である。
図5に示すように、当該オンライン絵本コンテンツの取得装置400は、スマートスクリーンデバイスに適用されることができ、当該オンライン絵本コンテンツの取得装置400は、確立モジュール410と、認識モジュール420と、取得モジュール430と、を含むことができる。
ここで、確立モジュール410は、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立することに用いられる。
認識モジュール420は、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することに用いられる。
取得モジュール430は、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得することに用いられる。
一つの可能的な情況として、取得モジュール430は、
画像コンテンツを解析してコンテンツタグを取得するための解析ユニットと、
ビデオライブラリから前記コンテンツタグに対応する絵本ビデオを前記ビデオ形式のオンライン絵本コンテンツとして取得するための取得ユニットと、を含む。
もう一つの可能的な情況として、取得ユニットは、
ローカルビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得する、及び/又は
サードパーティのビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得することにさらに用いられる。
もう一つの可能的な情況として、ビデオライブラリは、候補コンテンツタグ、及び候補コンテンツタグに対応する候補絵本ビデオを含むことができ、取得ユニットは、
ビデオライブラリにおけるコンテンツタグとマッチングされた候補コンテンツタグに対応する候補絵本ビデオを直接取得することにさらに用いられる。
もう一つの可能的な情況として、ビデオライブラリは、候補コンテンツタグ、及び候補コンテンツタグに対応するマルチフレーム候補絵本画像をさらに含むことができ、取得ユニットは、
ビデオライブラリからコンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を読み取り、
マルチフレーム候補絵本画像に基づいて、対応する絵本ビデオを合成することにさらに用いられる。
もう一つの可能的な情況として、各フレーム候補絵本画像は、それぞれ1つのタイムスタンプに対応し、取得ユニットは、
マルチフレーム候補絵本画像に基づいて、各フレーム候補絵本画像に対応するタイムスタンプを結合して、対応する絵本ビデオ合成することにさらに用いられる。
もう一つの可能的な情況として、各フレーム候補絵本画像は、1段のテキストコンテンツに対応し、取得ユニットは、
各フレーム候補絵本画像に対応するテキストコンテンツに基づいて、絵本ビデオに対応するオーディオを形成し、形成された絵本ビデオを対応するオーディオに関連付けることにさらに用いられる。
もう一つの可能的な情況として、プリズムコンポーネントは、撮影コンポーネントと画像認識コンポーネントとを含むことができ、撮影コンポーネントを使用して、マルチモーダルのインタラクション方式に基づいてオフライン絵本の絵本画像をキャプチャし、画像認識コンポーネントを使用して、絵本画像の画像特徴を認識し、及びスマートスクリーンデバイスのプロセッサを使用して、絵本画像の画像特徴を解析して画像コンテンツを取得することができる。
もう一つの可能的な情況として、画像コンテンツはオフライン絵本の表紙画像コンテンツである。
もう一つの可能的な情況として、当該オンライン絵本コンテンツの取得装置400は、
教育係アプリケーションのメインインタフェースでビデオ形式のオンライン絵本コンテンツを表示するための表示モジュールをさらに含む。
本出願の実施例のオンライン絵本コンテンツの取得装置は、スマートスクリーンデバイスに適用され、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得する。当該方法は、スマートスクリーンデバイスと通信リンクを確立するプリズムコンポーネントがオフライン絵本に対応する画像コンテンツを認識して取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得し、従来技術におけるオーディオ形式のオンライン絵本コンテンツのみを取得することと比較して、本出願は、スマートスクリーンデバイスでオンライン絵本コンテンツをビデオの方式で表示し、より生き生きとした方式でオフライン絵本コンテンツをユーザに提供することができることを実現する。
本出願の実施例によれば、本出願は、スマートスクリーンデバイス及び読み取り可能な記憶媒体をさらに提供する。本出願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムにおける命令が実行された場合に、上記オンライン絵本コンテンツの取得方法が実行される。
図6に示すように、それは本出願の実施例に係るオンライン絵本コンテンツの取得方法のスマートスクリーンデバイスのブロック図である。スマートスクリーンデバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。スマートスクリーンデバイスは、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるユニット、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
図6に示すように、当該スマートスクリーンデバイスは、一つ又は複数のプロセッサ501と、メモリ502と、高速インターフェースと低速インターフェースを含む各ユニットを接続するためのインターフェースと、を含む。各ユニットは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に基づいて他の方式で取り付けることができる。プロセッサは、外部入力/出力装置(インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリに記憶されている命令を含む、スマートスクリーンデバイス内に実行される命令を処理することができる。他の実施方式では、必要であれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリと複数のメモリとともに使用することができる。同様に、複数のスマートスクリーンデバイスを接続することができ、各スマートスクリーンデバイスは、部分的な必要な操作(例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする)を提供することができる。図6では、一つのプロセッサ501を例とする。
メモリ502は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。その中、前記メモリには、少なくとも一つのプロセッサによって実行される命令を記憶して、前記少なくとも一つのプロセッサが本出願により提供されるオンライン絵本コンテンツの取得方法を実行することができるようにする。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータが本出願により提供されるオンライン絵本コンテンツの取得方法を実行するためのコンピュータ命令を記憶する。
メモリ502は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例におけるオンライン絵本コンテンツの取得方法に対応するプログラム命令/モジュール(例えば、図5に示す確立モジュール410、認識モジュール420及び取得モジュール430)ように、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するために用いられる。プロセッサ501は、メモリ502に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アクティベーション及びデータ処理を実行し、すなわち上記の方法の実施例におけるオンライン絵本コンテンツの取得方法を実現する。
メモリ502は、ストレージプログラム領域とストレージデータ領域とを含むことができ、その中、ストレージプログラム領域は、オペレーティングシステム、少なくとも一つの機能に必要なアクティベーションプログラムを記憶することができ、ストレージデータ領域は、スマートスクリーンデバイスの使用によって作成されたデータなどを記憶することができる。また、メモリ502は、高速ランダム存取メモリを含むことができ、非一時的なメモリをさらに含むことができ、例えば、少なくとも一つのディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ502は、プロセッサ501に対して遠隔に設置されたメモリを含むことができ、これらの遠隔メモリは、ネットワークを介してスマートスクリーンデバイスに接続されることができる。上記のネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定しない。
スマートスクリーンデバイスは、入力装置503と出力装置504とをさらに含むことができる。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方式を介して接続することができ、図6では、バスを介して接続することを例とする。
入力装置503は、入力された数字又は文字情報を受信することができ、及びスマートスクリーンデバイスのユーザ設置及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、指示杆、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置504は、ディスプレイデバイス、補助照明デバイス(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定しない。いくつかの実施方式では、ディスプレイデバイスは、タッチスクリーンであってもよい。
本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアクティベーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令、高レベルのプロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することを含む。本明細書に使用されるように、用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械命令及び/又はデータをプログラマブルプロセッサに提供するために使用される任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。用語「機械読み取り可能な信号」は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドユニットを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアユニットを含むコンピューティングシステム(例えば、アクティベーションサーバー)、又はフロントエンドユニットを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする)、又はこのようなバックエンドユニットと、ミドルウェアユニットと、フロントエンドユニットの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのユニットを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。
本出願の実施例の技術案によれば、スマートスクリーンデバイスに適用され、スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立し、プリズムコンポーネントを使用してオフライン絵本を認識して、オフライン絵本に対応する画像コンテンツを取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得する。当該方法は、スマートスクリーンデバイスと通信リンクを確立するプリズムコンポーネントがオフライン絵本に対応する画像コンテンツを認識して取得することにより、画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得し、従来技術におけるオーディオ形式のオンライン絵本コンテンツのみを取得することと比較して、本出願は、スマートスクリーンデバイスでオンライン絵本コンテンツをビデオの方式で表示し、より生き生きとした方式でオフライン絵本コンテンツをユーザに提供することができることを実現する。
上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
上記の具体的な実施方式は、本出願に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本出願の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれなければならない。

Claims (23)

  1. スマートスクリーンデバイスに適用されるオンライン絵本コンテンツの取得方法であって、
    前記方法は、
    前記スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立するステップと、
    前記プリズムコンポーネントを使用してオフライン絵本を認識して、前記オフライン絵本に対応する画像コンテンツを取得するステップと、
    前記画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得するステップと、
    を含む、
    ことを特徴とするオンライン絵本コンテンツの取得方法。
  2. 前記画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得するステップは、
    前記画像コンテンツを解析してコンテンツタグを取得するステップと、
    ビデオライブラリから前記コンテンツタグに対応する絵本ビデオを前記ビデオ形式のオンライン絵本コンテンツとして取得するステップと、
    を含む、
    ことを特徴とする請求項1に記載のオンライン絵本コンテンツの取得方法。
  3. 前記ビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得するステップは、
    ローカルビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得するステップ、及び/又は
    サードパーティのビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得するステップ、
    を含む、
    ことを特徴とする請求項2に記載のオンライン絵本コンテンツの取得方法。
  4. 前記ビデオライブラリは、候補コンテンツタグ、及び前記候補コンテンツタグに対応する候補絵本ビデオを含み、前記ビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得するステップは、
    前記ビデオライブラリにおける前記コンテンツタグとマッチングされた候補コンテンツタグに対応する候補絵本ビデオを直接取得するステップを含む、
    ことを特徴とする請求項2に記載のオンライン絵本コンテンツの取得方法。
  5. 前記ビデオライブラリは、候補コンテンツタグ、及び前記候補コンテンツタグに対応するマルチフレーム候補絵本画像をさらに含み、前記ビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得するステップは、
    ビデオライブラリから前記コンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を読み取るステップと、
    前記マルチフレーム候補絵本画像に基づいて、前記対応する絵本ビデオを合成するステップと、
    を含む、
    ことを特徴とする請求項2に記載のオンライン絵本コンテンツの取得方法。
  6. 各フレーム前記候補絵本画像は、それぞれ1つのタイムスタンプに対応し、前記マルチフレーム候補絵本画像に基づいて、前記対応する絵本ビデオを合成するステップは、
    前記マルチフレーム候補絵本画像に基づいて、各フレーム候補絵本画像に対応するタイムスタンプを結合して、前記対応する絵本ビデオ合成するステップを含む、
    ことを特徴とする請求項5に記載のオンライン絵本コンテンツの取得方法。
  7. 各フレーム前記候補絵本画像は、1段のテキストコンテンツに対応し、前記マルチフレーム候補絵本画像に基づいて、前記対応する絵本ビデオを合成した後、
    各フレーム候補絵本画像に対応するテキストコンテンツに基づいて、前記絵本ビデオに対応するオーディオを形成し、形成された絵本ビデオを前記対応するオーディオに関連付けるステップをさらに含む、
    ことを特徴とする請求項5に記載のオンライン絵本コンテンツの取得方法。
  8. 前記プリズムコンポーネントは、撮影コンポーネントと画像認識コンポーネントとを含み、
    前記撮影コンポーネントを使用して、マルチモーダルのインタラクション方式に基づいて前記オフライン絵本の絵本画像をキャプチャし、
    前記画像認識コンポーネントを使用して、前記絵本画像の画像特徴を認識し、及び
    前記スマートスクリーンデバイスのプロセッサを使用して、前記絵本画像の画像特徴を解析して前記画像コンテンツを取得する、
    ことを特徴とする請求項1〜7のいずれかに記載のオンライン絵本コンテンツの取得方法。
  9. 前記画像コンテンツは前記オフライン絵本の表紙画像コンテンツである、
    ことを特徴とする請求項1〜7のいずれかに記載のオンライン絵本コンテンツの取得方法。
  10. 教育係アプリケーションのメインインタフェースで前記ビデオ形式のオンライン絵本コンテンツを表示するステップをさらに含む、
    ことを特徴とする請求項1〜7のいずれかに記載のオンライン絵本コンテンツの取得方法。
  11. オンライン絵本コンテンツの取得装置であって、
    スマートスクリーンデバイスに適用され、前記装置は、
    前記スマートスクリーンデバイスとプリズムコンポーネントとの通信リンクを確立するための確立モジュールと、
    前記プリズムコンポーネントを使用してオフライン絵本を認識して、前記オフライン絵本に対応する画像コンテンツを取得するための認識モジュールと、
    前記画像コンテンツに基づいて、ビデオ形式のオンライン絵本コンテンツを取得するための取得モジュールと、
    を含む、
    ことを特徴とするオンライン絵本コンテンツの取得装置。
  12. 前記取得モジュールは、
    前記画像コンテンツを解析してコンテンツタグを取得するための解析ユニットと、
    ビデオライブラリから前記コンテンツタグに対応する絵本ビデオを前記ビデオ形式のオンライン絵本コンテンツとして取得するための取得ユニットと、
    を含む、
    ことを特徴とする請求項11に記載のオンライン絵本コンテンツの取得装置。
  13. 前記取得ユニットは、
    ローカルビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得する、及び/又は
    サードパーティのビデオライブラリから前記コンテンツタグに対応する絵本ビデオを取得することにさらに用いられる、
    ことを特徴とする請求項12に記載のオンライン絵本コンテンツの取得装置。
  14. 前記ビデオライブラリは、候補コンテンツタグ、及び前記候補コンテンツタグに対応する候補絵本ビデオを含み、前記取得ユニットは、
    前記ビデオライブラリにおける前記コンテンツタグとマッチングされた候補コンテンツタグに対応する候補絵本ビデオを直接取得することにさらに用いられる、
    ことを特徴とする請求項12に記載のオンライン絵本コンテンツの取得装置。
  15. 前記ビデオライブラリは、候補コンテンツタグ、及び前記候補コンテンツタグに対応するマルチフレーム候補絵本画像をさらに含み、前記取得ユニットは、
    ビデオライブラリから前記コンテンツタグとマッチングされた候補コンテンツタグのマルチフレーム候補絵本画像を読み取り、
    前記マルチフレーム候補絵本画像に基づいて、前記対応する絵本ビデオを合成することにさらに用いられる、
    ことを特徴とする請求項12に記載のオンライン絵本コンテンツの取得装置。
  16. 各フレーム前記候補絵本画像は、それぞれ1つのタイムスタンプに対応し、前記取得ユニットは、
    前記マルチフレーム候補絵本画像に基づいて、各フレーム候補絵本画像に対応するタイムスタンプを結合して、前記対応する絵本ビデオ合成することにさらに用いられる、
    ことを特徴とする請求項15に記載のオンライン絵本コンテンツの取得装置。
  17. 各フレーム前記候補絵本画像は、1段のテキストコンテンツに対応し、前記取得ユニットは、
    各フレーム候補絵本画像に対応するテキストコンテンツに基づいて、前記絵本ビデオに対応するオーディオを形成し、形成された絵本ビデオを前記対応するオーディオに関連付けることにさらに用いられる、
    ことを特徴とする請求項15に記載のオンライン絵本コンテンツの取得装置。
  18. 前記プリズムコンポーネントは、撮影コンポーネントと画像認識コンポーネントとを含み、
    前記撮影コンポーネントを使用して、マルチモーダルのインタラクション方式に基づいて前記オフライン絵本の絵本画像をキャプチャし、
    前記画像認識コンポーネントを使用して、前記絵本画像の画像特徴を認識し、及び
    前記スマートスクリーンデバイスのプロセッサを使用して、前記絵本画像の画像特徴を解析して前記画像コンテンツを取得する、
    ことを特徴とする請求項11〜17のいずれかに記載のオンライン絵本コンテンツの取得装置。
  19. 前記画像コンテンツは前記オフライン絵本の表紙画像コンテンツである、
    ことを特徴とする請求項11〜17のいずれかに記載のオンライン絵本コンテンツの取得装置。
  20. 教育係アプリケーションのメインインタフェースで前記ビデオ形式のオンライン絵本コンテンツを表示するための表示モジュールをさらに含む、
    ことを特徴とする請求項11〜17のいずれかに記載のオンライン絵本コンテンツの取得装置。
  21. スマートスクリーンデバイスであって、
    少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサと通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも一つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサによって実行される場合、前記少なくとも一つのプロセッサが請求項1〜10のいずれかに記載のオンライン絵本コンテンツの取得方法を実行する、
    ことを特徴とするスマートスクリーンデバイス。
  22. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、前記コンピュータに請求項1〜10のいずれかに記載のオンライン絵本コンテンツの取得方法を実行させる、
    ことを特徴とするコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体。
  23. コンピュータプログラムであって、
    前記コンピュータプログラムにおける命令が実行された場合に、請求項1〜10のいずれかに記載のオンライン絵本コンテンツの取得方法が実行される、
    ことを特徴とするコンピュータプログラム。
JP2020213348A 2020-05-13 2020-12-23 オンライン絵本コンテンツの取得方法、装置及びスマートスクリーンデバイス Active JP7153052B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010403581.9 2020-05-13
CN202010403581.9A CN113673277A (zh) 2020-05-13 2020-05-13 线上绘本内容的获取方法、装置以及智能屏设备

Publications (2)

Publication Number Publication Date
JP2021180473A true JP2021180473A (ja) 2021-11-18
JP7153052B2 JP7153052B2 (ja) 2022-10-13

Family

ID=78510587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020213348A Active JP7153052B2 (ja) 2020-05-13 2020-12-23 オンライン絵本コンテンツの取得方法、装置及びスマートスクリーンデバイス

Country Status (3)

Country Link
US (1) US20210357452A1 (ja)
JP (1) JP7153052B2 (ja)
CN (1) CN113673277A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009119769A (ja) * 2007-11-16 2009-06-04 Konami Digital Entertainment Co Ltd 電子絵本システム及び電子絵本システム制御装置
JP2013092964A (ja) * 2011-10-27 2013-05-16 Sony Corp 画像処理装置、画像処理方法及びプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010105244A2 (en) * 2009-03-12 2010-09-16 Exbiblio B.V. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9832392B2 (en) * 2011-04-29 2017-11-28 Ufaceme, Inc. Mobile device for recording, reviewing, and analyzing video
EP3042340A4 (en) * 2013-09-02 2017-04-26 Suresh T. Thankavel Ar-book
CN103929653B (zh) * 2014-04-30 2018-01-09 成都理想境界科技有限公司 增强现实视频生成器、播放器及其生成方法、播放方法
CN104166851B (zh) * 2014-08-25 2018-01-23 盛静浩 一种纸质教材的多媒体互动式学习系统及方法
CN104899293A (zh) * 2015-06-05 2015-09-09 深圳市创易联合科技有限公司 资源调取方法及系统
US9961275B2 (en) * 2015-09-12 2018-05-01 The Aleph Group Pte, Ltd Method, system, and apparatus for operating a kinetic typography service
CN205899836U (zh) * 2016-03-28 2017-01-18 海南椰百利文化传播有限公司 一种图书应用系统
CN108255822A (zh) * 2016-12-28 2018-07-06 深圳市氧橙互动娱乐有限公司 一种交互式图书阅读方法、装置及系统
CN109241305B (zh) * 2018-08-23 2021-04-30 深圳市同维通信技术有限公司 一种基于图像识别的绘本阅读方法及装置
CN109344291B (zh) * 2018-09-03 2020-08-25 腾讯科技(武汉)有限公司 一种视频生成方法及装置
CN109255990A (zh) * 2018-09-30 2019-01-22 杭州乔智科技有限公司 一种基于ar增强现实的教学系统
US20210390306A1 (en) * 2018-10-23 2021-12-16 Finderscope, Inc. Ar system for enhanced book covers and related methods
CN109756786A (zh) * 2018-12-25 2019-05-14 北京百度网讯科技有限公司 视频生成方法、装置、设备及存储介质
CN209313957U (zh) * 2019-01-30 2019-08-27 深圳市博悦生活用品有限公司 一种反射镜系统
CN110263187A (zh) * 2019-06-19 2019-09-20 深圳市沃特沃德股份有限公司 绘本识别方法、装置、存储介质及计算机设备
US20210037071A1 (en) * 2019-07-29 2021-02-04 Steven Thomas Schoenwald Efficient distribution and display of media
CN111079423A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种听写报读音频的生成方法、电子设备及存储介质
CN111145604A (zh) * 2019-12-30 2020-05-12 西安Tcl软件开发有限公司 绘本识别方法、装置及计算机可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009119769A (ja) * 2007-11-16 2009-06-04 Konami Digital Entertainment Co Ltd 電子絵本システム及び電子絵本システム制御装置
JP2013092964A (ja) * 2011-10-27 2013-05-16 Sony Corp 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
JP7153052B2 (ja) 2022-10-13
CN113673277A (zh) 2021-11-19
US20210357452A1 (en) 2021-11-18

Similar Documents

Publication Publication Date Title
US20210201550A1 (en) Method, apparatus, device and storage medium for animation interaction
US8661053B2 (en) Method and apparatus for enabling virtual tags
US10339715B2 (en) Virtual reality system
CN110446063B (zh) 视频封面的生成方法、装置及电子设备
CN114375435A (zh) 增强物理活动表面上的有形内容
WO2017124116A1 (en) Searching, supplementing and navigating media
CN110322760B (zh) 语音数据生成方法、装置、终端及存储介质
WO2022252932A1 (zh) 电子文档的编辑方法、装置、设备及存储介质
CN112752121B (zh) 一种视频封面生成方法及装置
US9519355B2 (en) Mobile device event control with digital images
US20230368461A1 (en) Method and apparatus for processing action of virtual object, and storage medium
US10965743B2 (en) Synchronized annotations in fixed digital documents
US20150177944A1 (en) Capturing objects in editable format using gestures
CN109863746B (zh) 用于数据探索的沉浸式环境系统和视频投影模块
CN114302221A (zh) 一种虚拟现实设备及投屏媒资播放方法
CN110837557B (zh) 摘要生成方法、装置、设备及介质
JP7153052B2 (ja) オンライン絵本コンテンツの取得方法、装置及びスマートスクリーンデバイス
US20210392394A1 (en) Method and apparatus for processing video, electronic device and storage medium
CN111638918B (zh) 用于呈现信息的方法和装置
CN114328815A (zh) 文本映射模型的处理方法、装置、计算机设备及存储介质
CN114327033A (zh) 一种虚拟现实设备及媒资播放方法
CN111292773A (zh) 音视频合成的方法、装置、电子设备及介质
US11107285B2 (en) Augmented reality-based image editing
JP2020037155A (ja) 仕草制御装置及び仕草制御プログラム
CN113657173B (zh) 一种数据处理方法、装置和用于数据处理的装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220930

R150 Certificate of patent or registration of utility model

Ref document number: 7153052

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150