JP6515624B2 - 講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体 - Google Patents

講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体 Download PDF

Info

Publication number
JP6515624B2
JP6515624B2 JP2015064698A JP2015064698A JP6515624B2 JP 6515624 B2 JP6515624 B2 JP 6515624B2 JP 2015064698 A JP2015064698 A JP 2015064698A JP 2015064698 A JP2015064698 A JP 2015064698A JP 6515624 B2 JP6515624 B2 JP 6515624B2
Authority
JP
Japan
Prior art keywords
video
lecture video
learning
script
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015064698A
Other languages
English (en)
Other versions
JP2015201185A (ja
Inventor
俊 王
俊 王
内野 寛治
寛治 内野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2015201185A publication Critical patent/JP2015201185A/ja
Application granted granted Critical
Publication of JP6515624B2 publication Critical patent/JP6515624B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)

Description

ここで議論される実施形態は、講義ビデオ内のトピックスの特定に関する。
開かれた教育は、一般に、インターネット又は他の公的なアクセスネットワーク上で利用可能なオンラインの学習プログラム又は学習講座に言及される。開かれた教育の例として、eラーニングプログラム、オープン講座ウェア(OCW)、マッシブオープンオンライン講座(MOOC)等が含まれる。様々な大学及び他の教育機関は、一般の人々に対して、アカデミックな参加条件を強いることなく、無料の開かれた教育プログラムを提供している。開かれた教育プログラムへの参加は、通常、学習者が様々なトピックスに関係する学習教材にアクセスすることを許容する。学習教材は、教育機関の指導員による講義の講義ノート及び/又は講義ビデオ録画を含み得る。
様々な開かれた教育プログラムが、現在、マサチューセッツ工科大学、イェール、ミシガン大学、カルファルニア大学バークレー校及びスタンフォード大学を含む他の機関という、多数の教育機関によって提供されている。10年少し前の開かれた教育の発端から、開かれた教育プログラムを提供する教育機関の数が、実質的に増加している。開かれた教育の急増と共に、利用可能な学習教材の数及びオンラインで利用可能な講義ビデオの数が、付随して増加している。しかし、ある場合には、講義ビデオの構造化されていなくて線形な特徴のために、学習者は、講義ビデオ内に求められる知識点又は概念の特定の部分を見つけることが困難である。例えば、学習者が、講義ビデオの特定の部分を勉強するか又は見直したい時、彼らは、しばしば、ほとんど全てのビデオを通して見なければならないか、適切な点を見つけるために数回前後に再生しなければならない時もある。
ここに請求される主題は、不利を解決するか、又は、上述したこれらのような環境のみで動作する実施形態には限定されない。むしろ、この背景は、ここに述べられるある実施形態が具体化されるかもしれない1つの例示の技術領域を説明するために、提供されるだけである。
米国特許出願公開第13/731996号明細書
実施形態の一面によれば、講義ビデオのトピックス(topic:話題)を特定する方法は、講義ビデオのメタデータと、学習講座のメタデータと、講義ビデオの台本とを受信することを含み得る。講義ビデオの台本は、講義ビデオが文字に書き写された文章(transcribed text)を含み得る。方法は、上記講義ビデオのメタデータと上記学習講座(course:講座、課程、コース)のメタデータとの間の測定された類似度に基づいて、上記講義ビデオに関係する1つ又は複数の候補学習講座を見出すことを含み得る。方法は、1つ又は複数の上記候補学習講座の学習教材から重要語句(key phrase)を抽出することを含み得る。方法は、見出された上記学習教材内の抽出された上記重要語句の位置と、抽出された上記重要語句が上記学習教材内にあらわれる頻度と、上記重要語句があらわれる上記候補学習講座とに基づいて、抽出された上記重要語句に重みを割り当てることを含み得る。また、方法は、上記講義ビデオの台本内に生成された2以上のトピックスセグメント(topic segment)と、抽出された上記重要語句と、抽出された上記重要語句に割り当てられた上記重みとに基づいて、上記講義ビデオを2以上の特定トピックス部分(topic−specific portion)に分割することを含み得る。
本実施形態の目的及び効果は、特に請求項において指摘される構成要素、特徴及び組み合わせを用いることによって認識され且つ得られるだろう。
前述の一般的な説明及び後述の詳細な説明の両方は、例示的及び説明的なものであり、特許請求の範囲に記載されている本発明を制限するものではない。
例示の実施形態が、添付の図面を用いて、追加の特定及び詳細と共に、述べられて説明される。
ここで説明されるある実施形態が組み込まれ得る例示の動作環境のブロック図である。 図1の動作環境に組み込まれ得る計算装置のブロック図である。 図1の動作環境に含まれ得る例示のビデオメタデータを示す。 図1の動作環境に含まれ得る例示の学習講座メタデータを示す。 図1の動作環境で学習教材から抽出され得る重要語句の例を示す。 図1の動作環境に含まれ得る例示の講義ビデオの台本を示す。 図1の動作環境で提供され得る分割された形における例示の講義ビデオのスクリーンショットを示す。 図1の動作環境で提供され得る分割された形における例示の講義ビデオのスクリーンショットを示す。 講義ビデオのトピックスを特定する例示の方法のフロー図を示す。 候補学習講座を見出す例示の方法のフロー図を示す。 重要語句を抽出する例示の方法のフロー図を示す。 講義ビデオを分割する例示の方法のフロー図を示す。 ラベルを誘導する例示の方法のフロー図を示す。全ての図面は、ここで説明される少なくとも1つの実施形態に従って準備されている。
ここで議論されるある実施形態は、一般に、講義ビデオ(ビデオ)の中で、トピックスの特定に関係する。トピックスが特定された後、ビデオは特定トピックス部分に分割され得る。それから、学習者は、トピックスによって、ビデオを効率的に捜して閲覧し得る。例示の方法は、講義ビデオメタデータと学習講座メタデータとの間の類似度に基づいて、ビデオに関係する1つ又は複数の候補学習講座を見出すことを含む。重要語句は、1つ又は複数の候補学習講座の学習教材から抽出され得る。学習教材内の抽出された前記重要語句の位置と、抽出された重要語句が学習教材内にあらわれる頻度と、重要語句があらわれる見出された候補学習講座とに基づいて、抽出された重要語句に重みが割り当てられ得る。講義ビデオの台本内に生成された複数のトピックスセグメントと、複数のトピックスセグメント内の抽出された重要語句の存在と、抽出された重要語句に割り当てられた重みとに基づいて、講義ビデオを2以上の特定トピックス部分に分割され得る。そして、複数の特定トピックス部分に対してラベルが誘導されて、ビデオに対するキーワード検索が作成され得る。分割された形のビデオが、学習者に提示される。そして、学習者は、複数の特定トピックス部分の内の1つを選択し得る。特定トピックス部分は、トピックスが議論(discuss)される間に、選択された特定トピックス部分へビデオを進め得る。本実施形態及び他の実施形態は、添付の図面を参照して説明される。
図1は、ここで説明されるある実施形態が組み込まれ得る例示の動作環境100のブロック図を示す。動作環境100は、講義ビデオ(ビデオ)126のようなビデオを複数の特定トピックス部分へ分割することを可能とする、ビデオ解析システム150を含み得る。講義ビデオ126の分割は、ビデオ126の講義ビデオの台本(台本)134及び/又はビデオ126に関係し得る学習講座136の学習教材130に少なくとも部分的に基づき得る。ビデオ126が分割された後、学習者102は、ビデオ126の全体を見ることなく、トピックスに関係するビデオ126の部分を見ることができ得る。追加に又は代わりに、ビデオ126が分割された後、学習者102は、キーワードを求めてビデオ126を探し得る。キーワードに関係するビデオ126の部分は、学習者102に対して通信されるか、又は、ユーザインターフェースにおいて示され得る。学習者102は、ビデオ126の全体を見ることなく、キーワードに関係するビデオ126の部分を見ることができ得る。
説明している実施形態では、学習者102は、ビデオ解析システム150と入出力している個人又は実体(entity:エンティティ)を含み得る。学習者102は、ビデオ解析システム150及び/又は動作環境100との相互作用を可能にする装置104と関係し得る。装置104に加えて、動作環境100は、学習講座サーバ114と、教育サーバ116と、ビデオ解析サーバ108を含み得る。装置104と、学習講座サーバ114と、教育サーバ116と、ビデオ解析サーバ108は、ネットワーク140を介して、通信し得る。例えば、装置104と、サードパーティサーバ106と、ビデオ解析サーバ108は、ネットワーク140を介して、学習教材130と通信し得る。ある実施形態では、学習講座サーバ114及び教育サーバ116は、開かれた教育リソース(OER)サーバを含み得る1つのサーバに含まれ得る。また、ある実施形態では、学習講座サーバ114に含まれる1つ又は複数のアイテム(item)(例えば、136、130、132)は、教育サーバ116に含まれ得るか、又は、教育サーバ116に含まれるいくつかのアイテム(item)(例えば、128、134、126)は、学習講座サーバ114に含まれ得る。例えば、ビデオ126は、学習教材130の一例であり得る。
また、装置104は、ビデオ解析モジュール110Aを含み得る、及び/又は、ビデオ解析サーバ108は、ビデオ解析モジュール110Bを含み得る。ビデオ解析モジュール110A及び/又は110Bを参照する場合、ここでは、ビデオ解析モジュール110が用いられる。ビデオ解析モジュール110は、ビデオ126を分割(apportion)するように構成され得る。ビデオ解析モジュール110は、更に、学習教材130、学習講座メタデータ132、学習講座136、講義ビデオメタデータ128、台本134、ビデオ126のような情報、及び、これらに関係する情報を、装置104、ビデオ解析サーバ108、教育サーバ116及び学習講座サーバ114の間で、ネットワーク140を介して、通信を可能にし得る。
ネットワーク140は、有線又は無線であり得えて、制限されないが、スター構成、トークンリング構成又は他の構成を含む多くの異なる構成を有し得る。更に、ネットワーク140は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)(例えばインターネット)、及び/又は、複数の装置が通信可能な他の相互接続する横断するデータ経路を含み得る。ある実施形態では、ネットワーク140は、ピアツーピアネットワークを含み得る。ネットワーク140は、また、様々な異なる通信プロトコルのデータの通信を可能とする電話通信ネットワークの一部と接続するか又は含んでいても良い。
ある実施形態では、ネットワーク140は、ショートメッセージサービス(SMS)、マルチメディアメッセージサービス(MMS)、ハイパーテキストトランスファプロトコル(HTTP)、ダイレクトデータコネクション、無線アプリケーションプロトコル(WAP)、Eメール等を介することを含む、データを送信及び受信するための、ブルートゥース(登録商標)通信ネットワーク及び/又は携帯通信ネットワークを含む。
装置104は、プロセッサ、メモリ及びネットワーク通信能力を含む計算装置を有し得る。例えば、装置104は、ラップトップコンピュータ、デスクトップコンピュータ、タブレットコンピュータ、携帯電話、パーソナルデジタルアシスタント(PDA)、携帯Eメール装置、携帯ゲーム機、携帯音楽プレーヤ、1つ又は複数のプロセッサが内蔵又は結合されたテレビ、又は、ネットワーク140へアクセス可能な他の電子装置を含み得る。
装置104は、ビデオ解析モジュール110Aを含み得る。
ビデオ解析モジュール110A又は装置104に組み込まれている一部は、学習者102との相互作用を可能にするように構成され得る。
例えば、ビデオ解析モジュール110Aは、学習者102が分割後のビデオ126へアクセスすることを許容するユーザインターフェースを提供するように構成され得る。
学習者102は、ビデオ解析モジュール110Aを介して、ビデオ126又は分割された形のその一部を視聴し、及び/又は、ビデオ126内のキーワードを探し得る。
ある実施形態では、装置104は、ビデオ解析モジュール110Aを含まなくてもよい。
本実施形態又は他の実施形態では、装置104は、学習者102によって、ブラウザを介して、ビデオ解析モジュール110Bを用いて入出力するように使用され得る。
学習講座サーバ114は、プロセッサ、メモリ及び通信能力を含む計算装置を有し得るハードウェアサーバを含み得る。図示の実施形態では、学習講座サーバ114は、ネットワーク140に接続され、ネットワーク140を介して、装置104、ビデオ解析サーバ108、教育サーバ116との間でデータを送信及び受信し得る。学習講座サーバ114は、ホストとなり、及び/又は、学習講座136を保存するように構成され得る。学習講座136は、例えば、教育課程又はセミナーを含み得る。
学習講座136は、例えば、学習教材130を含み得る。例えば、学習教材130は、制限されないが、シラバス(syllabus:概要)、ノート、アウトライン、例題及び/又は解答、講義ノートのリスト、講義ビデオ、他のビデオ、ビデオの台本、又は学習講座136に対する他の類似した学習教材を含み得る。学習講座136は、また、学習講座メタデータ132を含み得る。学習講座メタデータ132は、学習講座136からのメタデータ及び/又はそこに含まれる学習教材130を含み得る。学習講座メタデータ132のいくつかの例は、制限されないが、講座のタイトル、講座の番号、講座の日程、教授、機関、シラバス、ノートのような学習教材130の内の1つのタイトル、及び学習教材130の文書(text:テキスト)を含み得る。
ある実施形態では、学習講座サーバ114内の学習講座136は、OERから選択され得る。追加して又は代わりに、学習講座136は、学習者102の興味に少なくとも部分的に基づいて選択され得る。従って、本実施形態又は他の実施形態では、1つ又は複数の学習講座136及び/又は学習教材130は、オープン講座ウェア(OCW)講座のような開かれた教育の教材を含み得る。ある実施形態では、開かれた教育の教材の推薦及び/又は選択は、2012年12月31日に出願された米国特許出願第13/731996号に記載されているように実行される。この公報の内容は、参照されて、本明細書に組み込まれる。
教育サーバ116は、プロセッサ、メモリ及び通信能力を含む計算装置を有し得るハードウェアサーバを含み得る。図示の実施形態では、教育サーバ116は、ネットワーク140に接続されて、ネットワーク140を介して、装置104、ビデオ解析サーバ108、学習講座サーバ114との間でデータを送信及び受信し得る。教育サーバ116は、ホストとなり、及び/又は、ビデオ126を保存するように構成され得る。ビデオ126は、ネットワーク140を介して、装置104、学習講座サーバ114及びビデオ解析サーバ108に対して、アクセス可能である。
教育サーバ116は、また、ホストとなり、及び/又は、ビデオ126、講義ビデオメタデータ128及び台本134を保存し得る。台本134は、ビデオ126の時間と関連して、ビデオ126が文字に書き写された文章を含み得る。講義ビデオメタデータ128は、ビデオ126と関連したデータを含み得る。ビデオ126と関連したデータは、ビデオ126のタイトル、ビデオ126が属するか又はビデオ126が関連する講座のタイトル、講座の数、ビデオ126が録画されたか及び/又は対応する講義が示された日付け、教授又は対応する講義を示す指導員、対応する講義が示されたか又は教授が関係する機関、ビデオ126及び/又は対応する講座の説明、及び台本134の内の1つ又は複数を含み得る。
ある実施形態では、教育サーバ116は、大学又は同様の教育機関と結びつき得る。追加して又は代わりに、教育サーバ116は、OERサーバを有し得る。OERサーバは、学習者102が公式に授業に登録されることなく、ビデオ126を学習者102に提供し得る。
ビデオ解析サーバ108、プロセッサ、メモリ及びネットワーク通信能力を含む計算装置を有し得るハードウェアサーバを含み得る。図示の実施形態では、ビデオ解析サーバ108は、ネットワーク140に接続されて、ネットワーク140を介して、装置104、学習講座サーバ114及び/又は教育サーバ116との間でデータを送信及び受信し得る。ビデオ解析サーバ108は、ビデオ解析モジュール110Bを含み得る。ビデオ解析モジュール110Bは、ビデオ126を解析するように構成され得る。追加して又は代わりに、ビデオ解析モジュール110Bは、ビデオ解析モジュール110Aと相互作用して、ビデオ126を解析するか及び/又は学習者102に対して分割された形のビデオ126を提供するように構成され得る。
後述の段落では、ビデオ126の分割の例が説明される。両方のビデオ解析モジュール110が同じ動作を実行するとしてここでは説明されているが、追加して又は代わりに、ビデオ解析モジュール110Aが動作の一部を実行し、他方のビデオ解析モジュール110Bが動作の他の部分を実行してもよい。例えば、ある実施形態では、ビデオ解析モジュール110Bが、後述する動作の大部分を実行し、装置104のビデオ解析モジュール110Aは、学習者102が分割された形のビデオ126へのアクセスを可能にする。ある実施形態では、装置104が大部分の動作を実行するように構成され得るビデオ解析モジュール110Aを有し得る。
ある実施形態では、ビデオ解析モジュール110は、台本134、講義ビデオメタデータ128、学習教材130及び学習講座メタデータ132を受信するように構成され得る。例えば、ビデオ解析モジュール110は、台本134、講義ビデオメタデータ128、学習講座メタデータ132、又はこれらの組み合わせを、教育サーバ116及び学習講座サーバ114から、ネットワーク140を介して、受信し得る。追加して又は代わりに、ビデオ解析モジュール110は、台本134、講義ビデオメタデータ128、学習講座136の学習教材130、学習講座メタデータ132又はこれらの組み合わせに対して、教育サーバ116及び学習講座サーバ114から、ネットワーク140を介して、アクセスし得る。
ビデオ解析モジュール110は、ビデオ126に関係する学習講座136の中から1つ又は複数の候補学習講座を見出し得る。見出すことは、講義ビデオメタデータ128と学習講座メタデータ132との間の測定された類似度(measured similarity)に基づき得る。測定された類似度は、制限されないが、特定のメタデータ間の完全な一致、特定のメタデータが有効か否かの決定、特定のメタデータ間の文書(テキスト)の類似度を含み得る。ある実施形態では、測定された類似度はマッチスコア(match score:一致度)で定量化される。
例えば、ビデオ解析モジュール110は、学習講座136に対してマッチスコアを計算し得る。マッチスコアは、講義ビデオメタデータ128と各学習講座136の学習講座メタデータ132に基づき得る。ある実施形態では、マッチスコアは、文書の類似度を算出することによって、並びに、1つ又は複数のメタデータのカテゴリに対する有効性及び一致度を決定することによって、部分的に計算され得る。メタデータのカテゴリは、制限されないが、ビデオタイトル/講義ノートのタイトル、講座のタイトル、講座の番号、日付け、教授又は指導員、機関、ビデオの説明/シラバス、及びビデオの台本/講座ノートの文書を含み得る。ビデオ解析モジュール110は、それぞれのメタデータのカテゴリに対して重みを割り当て得る。そして、ビデオ解析モジュール110は、割り当てられた重みと算出された文書の類似度との積の和を求め得る。
本実施形態又は他の実施形態では、マッチスコアは、マッチスコア式に従って計算される。
Figure 0006515624
マッチスコア式では、マッチスコアの量は、ビデオ126に関する複数の学習講座136の内の1つのマッチスコアを示す。変数VTは、ビデオタイトル/講義ノートのタイトルのメタデータのカテゴリに対する文書の類似度のスコアを示す。変数VTは、ビデオタイトル/講義ノートのタイトルのメタデータ間で選択された最大の文書(テキスト)の類似度を示す。変数CTは、講座のタイトルのメタデータのカテゴリに対する文書の類似度のスコアを示す。変数CNは、講座の番号が有効か否か及び講座の番号が有効な時には、メタデータ内の複数の講座の番号が一致するか否かを示す講座の番号のカテゴリのメタデータに対するスコアを示す。例えば、講座の番号が有効であり且つ一致する時には、CNは1と等しく、そうでない時には、CNはゼロと等しいかもしれない。
変数Dは、メタデータ間の一致度を示す。例えば、日付けがメタデータ内で有効(available)である時には、Dは日付け類似度式に従って、計算され得る。
Figure 0006515624
日付け類似度式では、expは指数関数を示す。パラメータλは、定数を示す。パラメータvideo_dateは、ビデオの日付けを示す。パラメータcourse_dateは、講座の日付を示す。日付けが有効でない時には、Dはゼロと等しいかもしれない。日付けは、年を単位として計算され得る。
変数Lは、教授又は講座のメタデータのカテゴリに対する文書の類似度のスコアを示す。教授又は講座が有効でない時には、変数Lはゼロと等しいかもしれない。変数Iは、複数の機関のメタデータのカテゴリに対するマッチスコアを示す。機関のメタデータが有効であり且つ一致する時には、Iは1と等しく、そうでない時には、Iはゼロと等しいかもしれない。変数DSは、ビデオの説明/シラバスのメタデータのカテゴリに対する文書の類似度のスコアを示す。ビデオの説明/シラバスのメタデータのカテゴリ内のメタデータが有効でない時には、DSはゼロと等しいかもしれない。変数TLは、ビデオの台本/講座ノートの文書のメタデータのカテゴリに対する文書の類似度のスコアを示す。ある実施形態では、TLを決定するために、文書の類似度のスコアは、ビデオの台本と各講座ノートの全文書との間で計算され得る。TLは、文書の類似度の複数のスコアの内の最大値を示す。
変数a,b,c,d,e,f,g,及びhは、割り当てられた重みを示す。割り当てられた重みは、それぞれのメタデータのカテゴリの相対的な重要度に基づいて、調整され得る。ある実施形態では、割り当てられた重みの値は、その場で設定され得る。追加して又は代わりに、割り当てられた重みは、機械学習を用いて、変更又は最適化され得る。追加して又は代わりに、割り当てられた重みの和は、1と等しいかもしれない。例えば、例示の実施形態では、変数a,b,c,d,e,f,g,及びhの値は、a=0.2,b=0.4,c=0.1,d=0.05,e=0.05,f=0.05,g=0.1,及びh=0.1を含み得る。ある実施形態では、ベクトル空間モデル(VSM)が、文書の類似度を計算するために使用され得る。本明細書では、VSMの追加の詳細は、他で提供される。
ビデオ解析モジュール110は、それぞれのマッチスコアが所定のマッチスコア閾値を超えるか否かを決定し得る。学習講座136の1つのマッチスコアが所定のマッチスコア閾値を超えている結果に応えて、ビデオ解析モジュール110は、その学習講座136を、候補学習講座として選択し得る。マッチスコアが所定のマッチスコア閾値よりも下である結果に応えて、ビデオ解析モジュール110は、その学習講座136を、候補学習講座として選択しないだろう。マッチスコア閾値は、割り当てられた重みの値及び/又は測定された類似度に対して用いられたアルゴリズムに依存し得る。例えば、割り当てられた重みの和が1と等しい時には、マッチスコア閾値は、0.5と1との間の値を含み得る。
そして、ビデオ解析モジュール110は、重要語句を抽出する。重要語句は、候補学習講座からの重要トピックス及び/又は重要概念を含み得る。重要語句は、特定の学習教材130に及び/又は特定の学習教材130の特定の位置にあらわれる語句を含み得る。追加して又は代わりに、重要語句は、学習教材130に頻繁にあらわれる語句を含み得る。例えば、語句は、複数回繰り返される時に、重要語句でありそうである。
ビデオ解析モジュール110は、1つ又は複数の語句の特徴を決定し、且つ、語句を、重要語句であるか又は重要語句でないとして指定するように構成され得る。例えば、ビデオ解析モジュール110は、語出現頻度−文書出現頻度の逆数法(TF−IDF法)を用いて、重要語句を抽出し得る。追加して又は代わりに、ビデオ解析モジュール110は、1つ又は複数の候補学習講座の学習教材130にアクセスし得る。ビデオ解析モジュール110は、テキスト形式の解析に基づいて、学習教材130内の語句の位置を検出し得る。ビデオ解析モジュール110は、また、一般化接尾辞木(generalized suffix tree)を用いて、繰り返される語句を抽出し得る。
ビデオ解析モジュール110は、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれるか否かを決定し得る。繰り返される語句がシラバス又は講義ノートのタイトルにあらわれる結果に応えて、ビデオ解析モジュール110は、繰り返される語句を重要語句として指定し得る。繰り返される語句がシラバス又は講義ノートのタイトルにあらわれない結果に応えて、ビデオ解析モジュール110は、繰り返される語句がセクションタイトル(section title)又はページタイトル(page title)にあらわれるか否かを決定し得る。繰り返される語句がセクションタイトル又はページタイトルにあらわれる結果に応えて、ビデオ解析モジュール110は、繰り返される語句を重要語句として指定し得る。繰り返される語句がセクションタイトル又はページタイトルにあらわれない結果に応えて、ビデオ解析モジュール110は、繰り返される語句が学習教材130内で所定の頻度閾値(例えば、学習教材130内に2回)を超えてあらわれるか否かを決定し得る。繰り返される語句が学習教材130内で所定の頻度閾値を超えてあらわれない結果に応えて、ビデオ解析モジュール110は、繰り返される語句を重要語句として指定しないだろう。繰り返される語句が学習教材130内で所定の頻度閾値を超えてあらわれる結果に応えて、ビデオ解析モジュール110は、繰り返される語句を重要語句として指定し得る。
追加して又は代わりに、ビデオ解析モジュール110は、重要語句内のストップワードを処理し得る。ストップワードは、一般に、分析の前に除去される語を含み得る。ストップワードのいくつかの例は、「the」及び「or」又は「a」のような一般のストップワードと共に、「講義(lecture)」又は「ノート(notes)」のような領域に特有の語を含み得る。また、ビデオ解析モジュール110は、発見的規則(heuristic rules)を用いて、略語を抽出し及び/又は統一し得る。発見的規則の例は、括弧に挟まれた表現に続く語句を抽出して、括弧に挟まれた表現が語句に対する略語又は頭字語を含むか否かを決定する規則を含み得る。
追加して又は代わりに、ビデオ解析モジュール110は、抽出された重要語句及び抽出された重要語句に割り当てられた重みに基づいて、重要語句の出現する位置を解析し、候補学習講座内の重要トピックス及び重要概念の階層を生成し得る。
ビデオ解析モジュール110は、抽出された重要語句に重みを割り当て得る。重みは、学習教材130内の抽出された重要語句の位置に基づいて、割り当てられ得る。例えば、抽出された重要語句がタイトル(title)又は見出し(heading)内にあらわれる時には、重みは、より高くなり得る。追加して又は代わりに、重みは、抽出された重要語句が学習教材130内にあらわれる頻度に基づいて、割り当てられ得る。例えば、抽出された重要語句が所定の閾値より高く生じる時には、重みは、より高くなり得る。追加して又は代わりに、重みは、重要語句があらわれる候補学習講座又はこれらの内のいくつかの組み合わせに基づいて、割り当てられ得る。例えば、重要語句がビデオ126の見出された候補学習講座内にあらわれる時には、他の候補学習講座内にあらわれる重要語句よりも、その重要語句にはより高い重みが割り当てられ得る。
また、ある実施形態では、ビデオ解析モジュール110は、台本134が音声認識によって生成されたか否かを判断し得る。台本134が音声認識によって生成されている結果に応えて、ビデオ解析モジュール110は、抽出された重要語句及び/又は割り当てられた重みに基づいて、台本134を修正し得る。例えば、抽出された重要語句は、領域(domain)に特有の辞書で用いられ得る。領域に特有の辞書は音声認識システムと共に用いられて、辞書を向上して台本134の正確さを向上し得る。追加して又は代わりに、ビデオ解析モジュール110は、発見的規則を用いて、台本134を統一し得る。
ビデオ解析モジュール110は、台本内に生成された複数のトピックスセグメント(topic segment:トピックスの部分)と、複数のトピックスセグメント内の抽出された重要語句の存在と、抽出された重要語句に割り当てられた重みと又はこれらの内のいくつかの組み合わせに基づいて、ビデオ126を複数の特定トピックス部分に分割し得る。複数のトピックスセグメントは、通常、台本134内の文字に書き写された文章のブロックに言及する。
本実施形態又は他の実施形態では、ビデオ解析モジュール110は、抽出された重要語句及び割り当てられた重みを用いて、台本134のトークン化を更新し得る。トークン化は、一般に、台本134の文字に書き写された文章が単語及び語句に分割される方法に言及する。トークン化の更新は、抽出された重要語句が結合されるか又は一緒に解析されることを確実にすることを含み得る。
トピックスセグメントは、スライドするウィンドウ(sliding−window)の分割中に作られ得る。一般に、スライドするウィンドウの分割は、台本内に作られるスライドするウィンドウの修正されたベクトル表示を構成することを含み得る。そして、ビデオ解析モジュール110は、複数のスライドするウィンドウ間の類似度を計算し、台本134に含まれる複数のトピックスに対応するトピックスセグメントの境界を検出し得る。ビデオ解析モジュール110は、2つのトピックスセグメントの境界の間に、それぞれが台本134の一部を含む複数のトピックスセグメントを生成し得る。文章の類似度が変化する境界文(例えば、ローカルミニマム又はグローバルミニマム(local又はglobal minimum))は、トピックスセグメントの境界として設定され得る。スライドするウィンドウの分割では、トピックスセグメントの境界は、抽出された重要語句の存在及び/又は抽出された重要語句の割り当てられた重みに基づいて、移動し又は調整され得る。例えば、文章の類似度のスコアは、抽出された重要語句の存在及び/又は抽出された重要語句に割り当てられた重みに関係する類似度を反映し得る。
例えば、台本134は、1から45の番号がつけられた45個の文を含み得る。ウィンドウの寸法は5つの文に設定されて、1つのステップは1つの文に設定され得る。スライドするウィンドウの分割の開始において、1番目のウィンドウは、1から5の文を含み、2番目のウィンドウは、6から10の文を含む。そして、文章の類似度の解析は、1番目のウィンドウに含まれる文章と2番目のウィンドウに含まれる文章との間で実行され得る。ステップは1に設定されて、1番目のウィンドウは、2から6の文を含むように再構成され、2番目のウィンドウは、7から11の文をふくむように再構成され得る。そして、もう1つの文章の類似度の解析が、再構成された1番目のウィンドウと2番目のウィンドウとの間で実行され得る。そして、1番目のウィンドウ及び2番目のウィンドウは、全ての45の文が2つのウインドウに含まれるまで、ステップに従って再構成され得る。14及び26の文において、文章の類似度が変化する時(例えば、ローカルミニマム又はグローバルミニマム)、トピックスセグメントの境界は、14及び26の文に設定され得る。
上述したように、トピックスセグメントは、類似度の決定を用いて、生成され得る。文章の類似度の測定は、VSMに基づき得る。例えば、ある実施形態では、文章の類似度は、例示のVSM式に従って計算され得る。
Figure 0006515624
VSM式では、変数tは、最初の語(term)を示す1から最後の語を示す変数nまで、変動する添え字を表す。従って、変数tは、抽出された重要語句を含む全ての語にわたって変動する。変数b1は、1番目のスライドするウィンドウを示し、b2は、2番目のスライドするウィンドウを示す。sim(b1,b2)の量は、1番目のトピックスウインドウと2番目のトピックスウインドウとの間の類似度を示す。パラメータωt、bは、1つのトピックスウインドウの内のある語に割り当てられた重みを示す。例えば、ωt、b1は、1番目のスライドするウィンドウ内のある語に割り当てられた重みを示す。
台本134の1つ又は複数のトピックスセグメントは、ビデオ126の特定トピックス部分に関連付けられ得る。具体的には、ある実施形態では、台本134は、文字に書き写された文章の言葉の朗読がビデオ126内に生じる時間と関連づけられた文字に書き写された文章を含み得る。複数のトピックスセグメントは、時間に基づいて、台本134からビデオ126に変換(translate)され得る。
ビデオ解析モジュール110は、また、トピックスに対するラベルを誘導し得る。ラベルは、トピックスセグメント内に存在する抽出された重要語句に基づき得る。例えば、ビデオ解析モジュール110は、トピックスセグメントの境界と、抽出された重要語句と、割り当てられた重みとを受信し得る。ビデオ解析モジュール110は、トピックスインドウの境界に基づいて、台本134を、通常トピックスセグメントと関連する複数の下位文書(sub−document)に分割し得る。そして、ビデオ解析モジュール110は、複数の下位文書のそれぞれに対して、修正されたベクトル表示を再構成し得る。ビデオ解析モジュール110は、複数の下位文書のそれぞれにおいて、TF−IDF法に基づいて、割り当てられた重みを更新し得る。ビデオ解析モジュール110は、複数の下位文書のそれぞれに対する更新された割り当てられた重みに基づいて、候補ラベルを選択し得る。ビデオ解析モジュール110は、それぞれの候補ラベルが、抽出された重要語句の内の1つであるか否かを決定し得る。ビデオ解析モジュール110は、候補ラベルが抽出された重要語句の内の1つである結果に応えて、候補ラベルを、下位文書に対するラベルとして選択し得る。ビデオ解析モジュール110は、候補ラベルが抽出された重要語句の内の1つでない結果に応えて、下位文書をトピックスではないと特定し得る。
追加して又は代わりに、ビデオ解析モジュール110は、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係を確認し得る。ビデオ解析モジュール110は、階層的関係に基づいて、複数のラベルを結合するか又は分割し得る。複数のラベルを結合すること及び分割することは、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係に基づき得る。
また、ある実施形態では、ビデオ解析モジュール110は、キーワード検索と、分割されたビデオ126とを関連づけ得る。例えば、抽出された重要語句は、複数の下位文書のそれぞれ及び/又はそれぞれのトピックスセグメントに特定され得る。ビデオ解析モジュール110は、学習者102がキーワード検索を入力することを許容するユーザインターフェースを提供し得る。そして、ビデオ解析モジュール110は、学習者102に対して、ビデオ126のどの部分においてキーワードが論じられているかを示し得る。
ある実施形態では、分割された形のビデオ126が、装置104を介して、学習者102に対して、示され得る。分割された形のビデオ126は、ビデオ126のどの部分の間にどのトピックスが生じるかを示すトピックス時間バー(bar)又は他のグラフィク要素を含み得る。トピックス時間バーは、台本134と関連づけられ得る。ラベルは、それぞれの部分に対して提供され得る。追加して又は代わりに、キーワードが存在するビデオ126の部分は、キーワード検索に応えて、時間バー及び/又は台本134内の表示された強調によって、学習者102に示される。従って、学習者102は、トピックスの部分及び/又は部分におけるキーワードの議論に基づいて、ビデオ126の部分だけを見ることを選択し得る。
本開示の範囲から離れることなく、動作環境100及び/又はビデオ解析システム150に対して、変更、追加又は省略をしてもよい。具体的には、図1に示される動作環境100の実施形態は、一人の学習者102と、1つの学習講座サーバ114と、1つの教育サーバ116と、1つの装置104及び1つのビデオ解析サーバ108を含むビデオ解析システム150とを含む。しかし、本開示は、一人以上の学習者102と、1つ以上の学習講座サーバ114と、1つ以上の装置104及び1つ以上のビデオ解析サーバ108又はこれらの任意の組み合わせを含み得るビデオ解析システム150とを含む動作環境100に対して適用される。
更に、本明細書に説明される実施形態内の様々な構成要素の分離は、分離が全ての実施形態において生じることを示すことを意味するものではない。また、本開示の利益と共に、説明された複数の構成要素が1つの構成要素内に集積されるか又は複数の構成要素に分離され得ることを理解されたい。
ビデオ解析モジュール110は、講座ビデオ内のトピックスの特定のためのコード(code)及びルーチン(routine:決められた動作)を含み得る。
ある実施形態では、ビデオ解析モジュール110は、装置104のような計算装置上に格納され得るシンクライアントアプリケーションとして、部分的に働き、また、例えば、ビデオ解析サーバ108上に格納され得る構成要素として部分的に働く。ある実施形態では、ビデオ解析モジュール110は、フィールドプログラマブルアレイ(FPGA)又は特定用途向け集積回路(ASIC)を含むハードウェアを用いて実装され得る。いくつかの他の実施形態では、ビデオ解析モジュール110は、ハードウェア及びソフトウェアの組み合わせを用いて実装され得る。
さて図2を参照して、例示のビデオ解析モジュール110は、より詳細に示される。図2に示されるビデオ解析モジュール110は、図1における装置104のビデオ解析モジュール110A及び/又はビデオ解析サーバ108のビデオ解析モジュール110Bを含み得る。図2は、ビデオ解析モジュール110、プロセッサ224、メモリ222及び通信ユニット226を含む計算装置200のブロック図である。計算装置200の構成要素は、バス220によって、通信可能に接続され得る。ある実施形態では、計算装置200は、図1におけるビデオ解析サーバ108又はビデオ解析システム150の装置104を含み得る。ビデオ解析モジュール110、単一の計算装置200内に多数のモジュール240を含むように示される。ある実施形態では、1つ又は複数のモジュール240は、計算装置200と実質的に同等であり得る多数の計算装置上にロード(load:読み込む)され、そうでない場合には格納されて、使用され得る。例えば、モジュール240の一のサブセット(subset:小集団)が、装置104上にロードされ、モジュール240の他のサブセットがビデオ解析サーバ108上にロードされ得る。
図1及び図2を組み合わせて参照して、プロセッサ224は、算術演算論理ユニット(ALU)、マイクロプロセッサ、多目的コントローラ、又はいくつかの他のプロセッサアレイを含み、計算及びソフトウェアプログラムの解析を実行し得る。プロセッサ224は、他の構成要素(例えば、110、226、222)との通信のためにバス220と接続し得る。プロセッサ224は、一般に、データ信号を処理し、復号命令セットコンピュータ(CISC)アーキテクチャ、縮小命令セットコンピュータ(RISC)アーキテクチャ又は命令セットの組み合わせを実装するアーキテクチャを含む様々な計算アーキテクチャを含み得る。図2は、単一のプロセッサ224を示しているけれども、複数のプロセッサが計算装置200に含まれ得る。他のプロセッサ、オペレーティングシステム、及び物理的構成が可能であり得る。
メモリ222は、プロセッサ224によって実行され得る命令及び/又はデータを記憶するように構成され得る。メモリ222は、他の構成要素と通信するためのバス220に接続され得る。命令及び/又はデータは、本明細書に説明される技術又は方法を実行するためのコード(code)を含み得る。メモリ222は、DRAM装置、SRAM装置、フラッシュメモリ又はいくつかの他の記憶装置を含み得る。ある実施形態では、メモリ222は、また、不揮発性メモリ又は同等の永久記憶装置、及び、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブ、CD−ROM装置、DVD−ROM装置、DVD−RAM装置、DVD−RW装置、フラッシュメモリ装置を含む媒体、又はより永久ベースで情報を格納するいくつかの他の大容量記憶装置を含む。
通信ユニット226は、ビデオ解析モジュール110が格納されている場所に依存して、学習講座サーバ114、教育サーバ116、装置104及びビデオ解析サーバ108の内の少なくとも1つとの間でデータを送信及び受信するように構成され得る。通信ユニット226は、バス220に接続され得る。ある実施形態では、通信ユニット226は、ネットワーク140又は他の通信チャネルへの直接の物理的な接続のためのポートを含み得る。例えば、通信ユニット226は、動作環境100の構成要素との有線通信のために、USB、SD、CAT−5又は同様のポートを含み得る。ある実施形態では、通信ユニット226は、通信チャネルを介して、IEEE802.11,IEEE802.16,ブルートゥース(登録商標)又は他の適切な無線通信方法を含む1つ又は複数の無線通信方法を用いて、データを交換するための無線トランシーバを含む。
ある実施形態では、通信ユニット226は、有線ポート及び無線トランシーバを含む。通信ユニット226は、また、トランスミッションコントロールプロトコル/インターネットプロトコル(TCP/IP)、HTTP、HTTPセキュア(HTTPS)及び単純なメール転送プロトコル(SMTP)等を含む標準のネットワークプロトコルを用いて、ファイル及び/又はメディア物の分配のために、他の従来の接続をネットワーク140へ提供し得る。ある実施形態では、通信ユニット226は、また、SMS、MMS、HTTP、ダイレクトデータ接続、WAP、Eメール又は他の適切なタイプの電気通信を介することを含む無線通信ネットワーク上で、データの送受信のために無線通信トランシーバを含む。
図2の実施形態では、ビデオ解析モジュール110は、通信モジュール202、計算モジュール214、発見(見出し)モジュール206、抽出モジュール212、判断モジュール216、割り当てモジュール208、分割(apportionment)モジュール210、選択モジュール218、検出モジュール228、指定モジュール230、解析モジュール232、更新モジュール234、修正モジュール236、誘導モジュール242、生成モジュール246、分割(segmentation)モジュール248、構成モジュール244(まとめて、モジュール240)を含み得る。モジュール240のそれぞれは、1つ又は複数の動作を実行するように構成された1つ又は複数のルーチン(routine:決められた動作)を含むソフトウェアとして実装され得る。モジュール240は、本明細書に説明される機能を提供するべく、プロセッサ224によって実行可能な命令のセットを含み得る。いくつかの例では、モジュール240は、計算装置200のメモリ222に記憶され又は少なくとも一時的にロードされて、プロセッサ224によってアクセスされて実行可能であり得る。モジュール240の内の1つ又は複数が、バス220を介して、プロセッサ224及び計算装置200の構成要素と協働及び通信するために適合し得る。
通信モジュール202は、ビデオ解析モジュール110と計算装置200の他の構成要素(例えば、224、222及び226)との間の通信を処理するように構成され得る。通信モジュール202は、通信ユニット226を介して、学習講座サーバ114、装置104、教育サーバ116及びビデオ解析サーバ108との間でデータを送受信するように構成され得る。ある実施形態では、通信モジュール202は、他のモジュール(例えば、204,206,208,210,212,214,216,218,228,230,232,234,236,238,242,248)と協働して、通信ユニット226を介して、学習講座サーバ114、装置104、教育サーバ116及びビデオ解析サーバ108の内の1つ又は複数との間で、データの受け取り及び/又は送信し得る。
例えば、通信モジュール202は、学習講座サーバ114及び/又は教育サーバ116から、台本134、講義ビデオメタデータ128、学習講座メタデータ132、又はこれらの内の組み合わせを受信し及び/又はアクセスするように構成され得る。通信モジュール202は、講義ビデオメタデータ128及び学習講座メタデータ132を、発見モジュール206と通信し得る。通信モジュール202は、台本134を、分割モジュール210と通信し得る。
発見モジュール206は、1つ又は複数の候補学習講座を見出すように構成され得る。
候補学習講座は、ビデオ126と関連する1つ又は複数の学習講座136を含み得る。発見モジュール206は、講義ビデオメタデータ128と学習講座メタデータ132との間の類似度に関連性の基礎をおき得る。ある実施形態では、発見モジュール206は、計算モジュール214、判断モジュール216、割り当てモジュール208及び選択モジュール218と連携し、1つ又は複数の候補学習講座を見出し得る。
例えば、計算モジュール214は、1つ又は複数の学習講座136に対するマッチスコア(match score:一致点数)を計算するように構成され得る。計算モジュール214は、講義ビデオメタデータ128と学習講座メタデータ132とに基づいて、マッチスコアを計算し得る。ある実施形態では、計算モジュール214は、文書の類似度、所定のメタデータの有効性、所定の複数のメタデータ間の一致に基づいて測定された類似度を計算し得る。測定された類似度及び/又はマッチスコアに含まれる文書の類似度は、ある実施形態では、VSMに基づき得る。
割り当てモジュール208は、メタデータのカテゴリ及び/又は重要語句に重みを割り当てるように構成され得る。例えば、割り当てモジュール208は、それぞれのメタデータのカテゴリに重みを割り当て得る。重みは、それぞれのメタデータのカテゴリの相対的な重要度を反映し得る。割り当てモジュール208は、それぞれのメタデータのカテゴリの重みを、計算モジュール214に通信する。1つ又は複数の学習講座136のマッチスコアを計算するために、計算モジュール214は、割り当てられた重みと計算されたスコアとの積の和(例えば、線形結合)を求め得る。計算モジュール214は、マッチスコアを判断モジュール216に通信し得る。
判断モジュール216は、それぞれのマッチスコアが所定のマッチスコア閾値を超えるか否かを決定するように構成される。マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、判断モジュール216は、1つの学習講座136のマッチスコアが所定のマッチスコア閾値を超えていることを示す信号を選択モジュール218に通信し得る。マッチスコアが所定のマッチスコア閾値よりも下である結果に応えて、判断モジュール216は、1つの学習講座136のマッチスコアが所定のマッチスコア閾値よりも下であることを示す信号を選択モジュール218に通信し得る。
判断モジュール216は、マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、その学習講座136を候補学習講座として選択し、マッチスコアが所定のマッチスコア閾値よりも下である結果に応えて、その学習講座136を候補学習講座として選択しないように構成され得る。
候補学習講座は、抽出モジュール212に通信され得る。抽出モジュール212は、1つ又は複数の候補学習講座の学習教材130から重要トピックス及び重要概念の重要語句を抽出するように構成され得る。ある実施形態では、抽出モジュール212は、通信モジュール202、検出モジュール228、判断モジュール216及び指定モジュール230と協力して重要語句を抽出し得る。
通信モジュール202は、1つ又は複数の候補学習講座の学習教材130にアクセスし、学習教材130を、検出モジュール228及び抽出モジュール212に通信し得る。検出モジュール228は、テキスト形式の解析に基づいて、学習教材130内の語句の位置を検出するように構成され得る。また、抽出モジュール212は、一般化接尾辞木を用いて、繰り返される語句を抽出し得る。語句は、抽出モジュール212及び検出モジュール228から判断モジュール216に通信され得る。
判断モジュール216は、語句の1つ又は複数の特徴を決定し、特徴を示している信号を、指定モジュール230に通信するように構成され得る。判断モジュール216からの信号に基づいて、指定モジュール230は、語句を重要語句として指定するか、又は、重要語句として指定しないだろう。
例えば、判断モジュール216は、語句がシラバス又は講義ノートのタイトルにあらわれるか否かを判断する。語句がシラバス又は講義ノートのタイトルにあらわれる結果に応えて、指定モジュール230は、語句を重要語句として指定し得る。語句がシラバス又は講義ノートのタイトルにあらわれない結果に応えて、判断モジュール216は、語句がセクションタイトル又はページタイトルにあらわれるか否かを決定し得る。語句がセクションタイトル又はページタイトルにあらわれる結果に応えて、指定モジュール230は、語句を重要語句として指定し得る。語句がセクションタイトル又はページタイトルにあらわれない結果に応えて、判断モジュール216は、語句が学習教材130内で所定の頻度閾値を超えてあらわれるか否かを決定し得る。
語句が学習教材130内で所定の頻度閾値を超えてあらわれない結果に応えて、指定モジュール230は、語句を重要語句として指定しないだろう。語句が学習教材130内で所定の頻度閾値を超えてあらわれる結果に応えて、指定モジュール230は、語句を重要語句として指定し得る。また、ある実施形態では、抽出モジュール212は、重要語句内のストップワードを処理し、発見的規則を用いて、重要語句内の略語を抽出し及び/又は統一し得る。重要語句は、割り当てモジュール208に通信され得る。
割り当てモジュール208は、抽出された重要語句に重みを割り当てるように構成され得る。ある実施形態では、割り当てモジュール208は、学習教材130内の抽出された重要語句の位置、抽出された重要語句が学習教材130内にあらわれる頻度、重要語句があらわれる見出された候補学習講座136、又はこれらの内のいくつかの組み合わせに基づいて、抽出された重要語句に重みを割り当て得る。割り当てられた重み及び抽出された重要語句は、解析モジュール232及び分割モジュール210に通信され得る。
ある実施形態では、解析モジュール232は、重要語句の出現する位置を解析するように構成され得る。また、抽出された重要語句及び抽出された重要語句に割り当てられた重みに基づいて、解析モジュール232は、候補学習講座内の重要トピックス及び重要概念の階層を生成し得る。
また、ある実施形態では、修正モジュール236は、台本134を修正するように構成され得る。例えば、判断モジュール216は、台本134が自動音声認識によって生成されたか否かを判断し得る。台本134が自動音声認識によって生成されている結果に応えて、修正モジュール236は、台本134を修正し得る。修正は、抽出された重要語句及び割り当てられた重みに基づき得る。
分割モジュール210は、ビデオ126を2以上の特定トピックス部分に分割するように構成され得る。分割モジュール210は、台本134内に生成された複数のトピックスセグメントと、2以上のトピックスセグメント内の抽出された重要語句の存在とに基づいて、及び/又は抽出された重要語句に割り当てられた重みに基づいて、ビデオ126を分割し得る。2以上の特定トピックス部分は、通常、台本134のトピックスセグメントに対応し得る。
ある実施形態では、分割モジュール210は、更新モジュール234、構成モジュール244、計算モジュール214、及び生成モジュール246と協力して、ビデオ126を分割し得る。例えば、更新モジュール234は、抽出された重要語句及び割り当てられた重みを用いて、台本134のトークン化を更新するように構成され得る。構成モジュール244は、スライドするウィンドウの修正されたベクトル表示を構成し得る。スライドするウィンドウは、修正されたベクトル表示に基づいて、台本134内を段階的に他のウィンドウに動いて、トピックスセグメントの境界を見つける。
計算モジュール214は、スライドするウィンドウ間の類似度を計算し得る。検出モジュール228は、台本134内に含まれる計算された文書(text:文字列)の類似度における変化により反映されるトピックスの変化に対応し得るトピックスセグメントの境界を検出し得る。そして、生成モジュール246は、2つのトピックスセグメントの境界の間の台本134の部分を含むトピックスセグメントを生成し得る。
ある実施形態では、誘導モジュール242は、トピックスセグメント内に存在する抽出された重要語句に基づいて、1つ又は複数の特定トピックス部分に対するラベルを誘導するように構成され得る。例えば、誘導モジュール242は、通信モジュール202、分割モジュール248、構成モジュール244、更新モジュール234、選択モジュール218、及び判断モジュール216と協力して、ビデオ126の特定トピックス部分に対するラベルを誘導し得る。例えば、通信モジュール202は、トピックスセグメントの境界、抽出された重要語句及び割り当てられた重みを受け取るように構成され得る。検出されたトピックスセグメントの境界に基づいて、分割モジュール248は、台本134を複数の下位文書に分割するように構成され得る。そして、構成モジュール244は、複数の下位文書のそれぞれに対して、修正されたベクトル表示を再構成し得る。そして、更新モジュール234は、TF−IDF法に基づいて、複数の下位文書のそれぞれにおける重要語句の割り当てられた重みを更新し得る。選択モジュール218は、複数の下位文書のそれぞれに対する更新された割り当てられた重みに基づいて候補ラベルを選択し、その候補ラベルを判断モジュール216に通信し得る。
判断モジュール216は、それぞれの候補ラベルが、抽出された重要語句の内の1つであるか否かを決定するように構成され得る。そして、判断モジュール216は、それぞれの候補ラベルが、抽出された重要語句の内の1つであるか否かを示す信号を、選択モジュール218に通信し得る。候補ラベルが抽出された重要語句の内の1つである結果に応えて、選択モジュール218は、候補ラベルを、下位文書に対するラベルとして選択し得る。候補ラベルが抽出された重要語句の内の1つでない結果に応えて、選択モジュール218は、下位文書をトピックスではないと特定し得る。
ある実施形態では、誘導モジュール242は、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係を確認するように構成され得る。ラベル間の階層的関係に基づいて、誘導モジュール242は、1つ又は複数の下位文書のラベルを結合するか、又は1つ又は複数の下位文書のラベルを分割し得る。
また、ある実施形態では、分割モジュール210は、キーワード検索と、ビデオ126の1つ又は複数の部分とを関連づけ得る。キーワード検索は、本明細書において説明するように検出される、台本134内の語句の存在に基づき得る。
図3は、図1の動作環境100に含まれ得る例示の講義ビデオメタデータ128を示す。
具体的には、図3は、例示のビデオの第1のスクリーンショット300と、ビデオのリストの第2のスクリーンショット302とを含む。第1のスクリーンショット300では、講義ビデオメタデータ128の例は、例えば、ビデオタイトル304、機関306、日付け308、教授312、講義番号310及び説明314が見える。また、第1のスクリーンショット300は、第2のスクリーンショット302に示されるビデオのリストと関連付けられ得る講座タイトル316を含み得る。ビデオタイトル304は、また、ビデオのリスト内の他のビデオと共に、第2のスクリーンショット302にもあらわれる。
図4は、図1の動作環境100に含まれ得る例示の学習講座メタデータ132を示す。学習講座メタデータ132は、例えば、シラバス406及び講座のウェブページ402内に見つけられる。学習講座メタデータ132は、講座タイトル404、日付け408、説明410、講座番号412、機関414、1つ又は複数の主なトピックス416及び1つ又は複数の下位トピックス418を含み得る。図4では、全ての下位トピックス418はラベル付けされていない。
図1、3及び4を組み合わせて参照して、ビデオ解析モジュール110は、講義ビデオメタデータ128及び学習講座メタデータ132に基づいて、1つ又は複数の学習講座136に対するマッチスコアを計算するように構成され得る。マッチスコアを計算することは、1つ又は複数のメタデータのカテゴリにおいて、所定のメタデータの文書の類似度を含み得る測定された類似度、所定のメタデータの有効性、及び所定の複数のメタデータ間の一致を計算することを含み得る。例えば、メタデータのカテゴリは、他にもあるが加えて、講座番号のカテゴリ、タイトルのカテゴリ、機関のカテゴリ及び日付けのカテゴリを含み得る。従って、ビデオ解析モジュール110は、図3の講座番号310と、図4の講座番号412とを一致させ、図3のタイトル304と図4のタイトル404とを一致させ、図3の日付け308と図4の日付けとを一致させ得る。そして、ビデオ解析モジュール110は、線形結合を実行して、マッチスコアを計算し得る。
図5は、図1の動作環境100の学習教材130から抽出され得る重要語句500A〜500Eの例を示す。重要語句500A〜500Eは、例えば講義ノート504内のスライド、講義ノートのリスト502及びシラバス506を含み得る学習教材130から抽出され得る。重要語句500A〜500Eは、学習教材130内にあらわれる語句を含み得る。例えば、重要語句500Aは、講義ノート504のタイトルを含み得る。また、重要語句500Bは、講義ノート504内の語又は語句を含み得る。また、重要語句500Cは、講義ノートのリスト502内の講義のタイトルを含み得る。また、重要語句500Dは、シラバス506内の語又は語句を含み得る。また、重要語句500Eは、シラバス506のタイトルを含み得る。
図6は、図1の動作環境10に実装され得る例示の台本134を示す。台本134は、複数の抽出された重要語句602を含み得る。重要語句602は、図5の重要語句500A〜500Eと同様の重要語句の追加の例である。複数の抽出された重要語句602は、トピックスセグメントの境界606によって分離され得る1つ又は複数のトピックスセグメント604を特定するために使用され得る。複数の抽出された重要語句602は、また、それぞれのトピックスセグメント604のトピックスに対するラベルを誘導するために使用され得る。図6には示されていないけれども、台本134は、例えば、台本134の1つ又は複数の行のそれぞれに対して、又は別の方法では、対応するビデオの経過時間と関連づけられて、対応するビデオにおけるそれぞれのトピックスウインドウ604の開始時間及び/又は終了時間を特定することを許容するタイムスタンプを含み得る。
図7A及び7Bは、図1の動作環境100で提供され得る分割された形における例示のビデオ126のスクリーンショット700A及び700B(一般に、スクリーンショット700又は複数のスクリーンショット700)を示す。第1のスクリーンショット700Aは、キーワード検索の問い合わせを受ける前の分割された形におけるビデオ126を示す。第2のスクリーンショット700Bは、キーワード検索の結果に応えて、分割された形におけるビデオ126を示す。
図7A及び7Bを組み合わせて参照して、スクリーンショット700は、ビデオ126が表示又は再生され得るビデオ部分702を含み得る。スクリーンショット700は、また、台本の部分714A〜714Dが表示され得る台本部分704を含み得る。ビデオ部分702と台本部分704との間に、スクリーンショット700は、経過時間バー716及びトピックス時間バー710を含み得る。経過時間バー716は、学習者102のような学習者が、ビデオ126を先送り又は巻き戻しすることを可能にする。ビデオ126を再生する時、アイコン718が、通常、経過時間バー716の長さと関連づけられたビデオの総時間である経過時間バー716に沿って進む。そして、ビデオ126の半分が再生された時、アイコン718は、経過時間バー716の長さのおよそ半分を横切る所に位置し得る。経過時間バー716は、ユーチューブ(登録商標)のようなビデオ再生アプリケーションに含まれ得る。
トピックス時間バー710は、2つ以上の断片712A〜712Dに分けられ得る。断片712A〜712Dは、ビデオ126が分割される特定トピックス部分に対応し得る。また、それぞれの断片712A〜712Dの長さは、ビデオ126がそれぞれのトピックスを議論する間の経過時間バー716の部分に対応し得る。例えば、トピックス時間バー710における第1の断片712Aは、第1の長さを有し且つ第1のトピックスに対応し得る。また、第1のトピックスは、トピックス時間バー710の第1の長さの間に対応する経過時間バー716の第1の長さの間、ビデオ126内で議論される。
本実施形態及び他の実施形態では、断片712A〜712Dは、また、台本部分704に表示される台本の1つ又は複数の文書セグメント714〜714Dに対応し得る。例えば、第1断片712Aは、台本の第1セグメント714Aに対応し得る。台本の第1セグメント714Aは、トピックスに対するラベル及び/又は台本126内で議論されるトピックスが変化する時間を含み得る。また、ある実施形態では、学習者は、断片712A〜712Dを選択し得る。応えて、ラベルが、ドロップダウンウィンドウに示され得る。
また、スクリーンショット700は、検索時間バー706及び検索フィールド708を含み得る。第1のスクリーンショット700Aでは、検索フィールド708は空であり、検索時間バー706は空であり得る。図7Bを参照して、第2のスクリーンショット700Bは、キーワード問い合わせ後の例示の検索時間バー706を示す。本実施形態及び他の実施形態では、キーワード「tutor」が検索フィールド708内に入力され得る。応えて、検索時間バー706は、1つ又は複数のキーワード表示ブロック720を含み得る。キーワード表示ブロック720は、キーワード(例えば「tutor」)が議論されている間のビデオ126の部分を含み得る。ある実施形態では、トピックス時間バー710の部分及び/又は断片712A〜712Dのセグメントを選択することによって、ビデオ126は、トピックスを議論しているビデオ126の部分に先送り又は巻き戻され得る。
スクリーンショット700A及び700Bは、例示の実施形態を示す。ある実施形態では、台本部分704は、ビデオ部分702の横に位置づけられるか又は省略され得る。追加して又は代わりに、1つ又は複数の検索時間バー706、経過時間バー716、トピックス時間バー710、これらの内の組み合わせ、又は、検索時間バー706、経過時間バー716又はトピックス時間バー710に関して説明された機能は、結合されるか及び/又は省略され得る。
図8は、本明細書に説明する少なくとも1つの実施形態に従って用意された、講義ビデオのトピックスを特定する例示の方法800のフロー図を示す。方法800は、図2を参照して説明される計算装置200によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法800は、図1の装置104又はビデオ解析サーバ108によって、プログラム可能に実行され得る。装置104、ビデオ解析サーバ108及び計算装置200は、プロセッサによって実行可能又は方法800の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体(例えば、図2のメモリ222)を含むか又は通信可能に接続され得る。装置104、ビデオ解析サーバ108及び計算装置200は、コンピュータ命令を実行して、方法800の処理を生じさせるか又は制御するように構成されるプロセッサ(例えば、図2のプロセッサ224)を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。
方法800は、ブロック802で開始して、講義ビデオメタデータ、学習講座メタデータ及び講義ビデオの台本が受け取られ得る。ある実施形態では、講義ビデオの台本は、講義ビデオの時間と関連付けられた講義ビデオの文字に書き写された文章を含み得る。
ブロック804では、講義ビデオと関連付けられた1つ又は複数の候補学習講座が見出され得る。ある実施形態では、1つ又は複数の候補学習講座が、講義ビデオメタデータと学習講座メタデータとの間の測定された類似度に基づいて、見出され得る。
ブロック806では、重要トピックス及び重要概念の重要語句が、1つ又は複数の候補学習講座の学習教材から抽出され得る。ブロック808では、抽出された重要語句に対して重みが割り当てられ得る。重みは、学習教材内の重要語句の位置と、抽出された重要語句が学習教材内にあらわれる頻度と、重要語句があらわれる見出された候補学習講座と、又はこれらの内のいくつかの組み合わせとに基づいて、割り当てられ得る。
ブロック810では、講義ビデオは、2つ以上の特定トピックス部分に分割され得る。ある実施形態では、講義ビデオは、講義ビデオの台本内に生成された2以上のトピックスセグメントと、2以上のトピックスセグメント内に含まれる重要語句と、抽出された重要語句に割り当てられた重みとに基づいて、2以上の特定トピックス部分に分割され得る。ブロック812では、2以上の特定トピックス部分に対して、ラベルが誘導され得る。ある実施形態では、ラベルは、2以上のトピックスセグメント内に存在する抽出された語句に基づいて、誘導され得る。ブロック814では、キーワード検索が、分割されたビデオに関連付けられ得る。
当業者は、本明細書に説明されるこの手順及び方法並びに他の手順及び方法に対して、処理及び方法で実行される機能は、他の順番で実装され得ることを認識するだろう。更に、概説されたステップ及び動作は、例として提供されるだけであり、開示された実施形態を損なうことなく、いくつかのステップ及び動作は、任意であり、より少ないステップ及び動作に結合されるか、又は、追加のステップ及び動作に拡張され得る。
図9は、本明細書に説明する少なくとも1つの実施形態に従って用意された、候補学習講座を見出す例示の方法900のフロー図を示す。方法900は、図2を参照して説明される計算装置200によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法900は、図1の装置104又はビデオ解析サーバ108によって、プログラム可能に実行され得る。装置104、ビデオ解析サーバ108及び計算装置200は、プロセッサによって実行可能又は方法900の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体(例えば、図2のメモリ222)を含むか又は通信可能に接続され得る。装置104、ビデオ解析サーバ108及び計算装置200は、コンピュータ命令を実行して、方法900の処理を生じさせるか又は制御するように構成されるプロセッサ(例えば、図2のプロセッサ224)を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。
方法900は、1つ又は複数の学習講座に対するマッチスコアが計算され得るブロック902で開始し得る。ある実施形態では、マッチスコアは、講義ビデオメタデータ及び学習講座メタデータに基づき得る。例えば、マッチスコアを計算することは、1つ又は複数のメタデータのカテゴリに対する文書の類似度を計算すること、及び/又は、1つ又は複数のメタデータのカテゴリの一致度、それぞれのメタデータのカテゴリに重みを割り当てること、及び、割り当てられた重み及びマッチスコアの線形結合を実行することを含み得る。
ブロック904では、1つ又は複数の学習講座のそれぞれに対して、マッチスコアがマッチスコア閾値を超えるか否かを決定し得る。ブロック906では、マッチスコアが所定のマッチスコア閾値を超えている結果に応えて(904において「はい」)、学習講座は、候補学習講座として選択され得る。ブロック908では、マッチスコアが所定のマッチスコア閾値を超えていない結果に応えて(904において「いいえ」)、学習講座は、候補学習講座として選択されないだろう。
図10は、本明細書に説明する少なくとも1つの実施形態に従って用意された、重要語句を抽出する例示の方法1000のフロー図を示す。方法1000は、図2を参照して説明される計算装置200によって、ある実施形態では、プログラム可能に実行され得る。
追加して又は代わりに、方法1000は、図1の装置104又はビデオ解析サーバ108によって、プログラム可能に実行され得る。装置104、ビデオ解析サーバ108及び計算装置200は、プロセッサによって実行可能又は方法1000の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体(例えば、図2のメモリ222)を含むか又は通信可能に接続され得る。装置104、ビデオ解析サーバ108及び計算装置200は、コンピュータ命令を実行して、方法1000の処理を生じさせるか又は制御するように構成されるプロセッサ(例えば、図2のプロセッサ224)を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。
方法1000は、1つ又は複数の候補学習講座の学習教材がアクセスされ得るブロック1002で開始し得る。ブロック1004では、学習教材内の語句の位置が、テキスト形式の解析に基づいて、検出され得る。ブロック1006では、一般化接尾辞木を用いて、繰り返される語句が抽出され得る。
ブロック1008では、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれるか否かが決定され得る。ブロック1016では、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれている結果に応えて(ブロック1008における「はい」)、繰り返される語句が重要語句として指定される。ブロック1010では、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれない結果に応えて(ブロック1008における「いいえ」)、繰り返される語句がセクションタイトル又はページタイトルにあらわれるか否かが決定され得る。ブロック1016では、繰り返される語句がセクションタイトル又はページタイトルにあらわれている結果に応えて(ブロック1010における「はい」)、繰り返される語句が重要語句として指定される。ブロック1012では、繰り返される語句がセクションタイトル又はページタイトルにあらわれない結果に応えて(ブロック1010における「いいえ」)、繰り返される語句が学習教材内で所定の頻度閾値を超えてあらわれるか否かが決定され得る。ブロック1016では、繰り返される語句が学習教材内で所定の頻度閾値を超えてあらわれている結果に応えて(ブロック1012における「はい」)、繰り返される語句が重要語句として指定される。ブロック1014では、繰り返される語句が学習教材内で所定の頻度閾値を超えてあらわれない結果に応えて(ブロック1012における「いいえ」)、繰り返される語句が重要語句として指定されないだろう。ブロック1018では、重要語句内のストップワードが処理され得る。ブロック1020では、発見的規則を用いて、略語が、抽出され及び/又は統一され得る。ブロック1022では、抽出された重要語句及び抽出された重要語句に割り当てられた重みに基づいて、重要語句の出現する位置が解析され、候補学習講座内の重要トピックス及び重要概念の階層が生成され得る。
図11は、本明細書に説明する少なくとも1つの実施形態に従って用意された、講義ビデオを分割する例示の方法1100のフロー図を示す。方法1100は、図2を参照して説明される計算装置200によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法1100は、図1の装置104又はビデオ解析サーバ108によって、プログラム可能に実行され得る。装置104、ビデオ解析サーバ108及び計算装置200は、プロセッサによって実行可能又は方法1100の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体(例えば、図2のメモリ222)を含むか又は通信可能に接続され得る。装置104、ビデオ解析サーバ108及び計算装置200は、コンピュータ命令を実行して、方法1100の処理を生じさせるか又は制御するように構成されるプロセッサ(例えば、図2のプロセッサ224)を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。
方法1100は、台本が受け取られるブロック1102で開始する。ブロック1104では、台本が自動音声認識によって生成されたか否かが判断され得る。ブロック1106では、台本が自動音声認識によって生成されている結果に応えて(ブロック1104における「はい」)、抽出された重要語句及び割り当てられた重みに基づいて台本が修正されて、方法1100はブロック1102及び1104へ戻り得る。実質的に修正された、自動音声認識によって生成された台本は、自動音声認識によって生成されているとは考えられないので、方法1100はブロック1108に進み得る。台本が最初から自動音声認識によって生成されていないか、又は、台本が最初は自動音声認識によって生成されており且つ実質的に修正されていれば、ブロック1108では、講義ビデオの台本が自動音声認識によって生成されていないという判断結果に応えて(ブロック1104における「いいえ」)、抽出された重要語句及び割り当てられた重みを用いて、台本のトークン化が更新され得る。
ブロック1110では、スライドするウィンドウの修正されたベクトル表示が構成され得る。ブロック1112では、複数のスライドするウィンドウ間の類似度が計算され得る。ブロック1114では、台本に含まれる1つ又は複数のトピックスに対応するトピックスセグメントの境界が検出され得る。ブロック1116では、2以上のトピックスセグメントが生成され得る。2以上のトピックスセグメントは、2つのトピックスセグメントの境界の間の講義ビデオの台本の一部を含み得る。
図12は、本明細書に説明する少なくとも1つの実施形態に従って用意された、ラベルを誘導する例示の方法1200のフロー図を示す。方法1200は、図2を参照して説明される計算装置200によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法1200は、図1の装置104又はビデオ解析サーバ108によって、プログラム可能に実行され得る。装置104、ビデオ解析サーバ108及び計算装置200は、プロセッサによって実行可能又は方法1200の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体(例えば、図2のメモリ222)を含むか又は通信可能に接続され得る。装置104、ビデオ解析サーバ108及び計算装置200は、コンピュータ命令を実行して、方法1200の処理を生じさせるか又は制御するように構成されるプロセッサ(例えば、図2のプロセッサ224)を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。
方法1200は、トピックスセグメントの境界、抽出された重要語句及び割り当てられた重みを受け取り得る、ブロック1202で開始し得る。ブロック1204では、講義ビデオの台本は、複数の下位文書に分割され得る。例えば、講義ビデオの台本は、トピックスセグメントの境界に基づいて、分割され得る。ブロック1206では、複数の下位文書のそれぞれに対して、修正されたベクトル表示が再構成され得る。ブロック1208では、割り当てられた重みが更新され得る。例えば、ある実施形態では、TF−IDF法に基づいて、複数の下位文書のそれぞれにおける割り当てられた重みが更新され得る。
ブロック1210では、候補ラベルが選択され得る。例えば、ある実施形態では、複数の下位文書のそれぞれに対する更新された割り当てられた重みに基づいて、候補ラベルが選択され得る。ブロック1212では、それぞれの候補ラベルが、抽出された重要語句の内の1つであるか否かが決定され得る。ブロック1214では、候補ラベルが抽出された重要語句の内の1つである結果に応えて(ブロック1212における「はい」)、候補ラベルが、下位文書に対するラベルとして選択され得る。ブロック1216では、候補ラベルが抽出された重要語句の内の1つでない結果に応えて、下位文書はトピックスではないと特定され得る。ブロック1218では、1つ又は複数の下位文書のラベルが結合され得る。例えば、ある実施形態では、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係に基づいて、ラベルが結合され得る。ブロック1220では、1つ又は複数の下位文書のラベルが分割され得る。例えば、ある実施形態では、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係に基づいて、ラベルが分割され得る。
後で更に詳しく論じられるように、ここに説明される実施形態は、様々なコンピュータ・ハードウェア又はソフトウェア・モジュールを含む特別な目的又は多目的なコンピュータの使用を含み得る。
ここに説明される実施形態は、内部に記憶されたコンピュータ実行可能な命令又はデータ構造を運ぶ又は有するコンピュータ可読媒体を用いて、実装され得る。そのようなコンピュータ可読媒体は、多目的又は特別な目的のコンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。例えば、制限されることなく、そのようなコンピュータ可読媒体は、コンピュータ実行可能な命令又はデータ構造の形で所望のプログラムコードを運ぶ又は記憶するために使用され、且つ多目的又は特別な目的のコンピュータによってアクセスされ得る、RAM、ROM、EEPROM、CD−ROM又は他の光ディスクメモリ、磁気ディスクメモリ又は他の磁気記憶装置、又は他の任意の記憶媒体を含む非一時的なコンピュータ可読媒体を有し得る。上記の組み合わせは、また、コンピュータ可読媒体の範囲内に含まれ得る。
コンピュータ実行可能な命令は、例えば、多目的コンピュータ、特別な目的のコンピュータ、又は特別な目的の処理装置が、所定の機能又は機能の群を実行させる命令及びデータを有する。主題は、特有の言語において構造的な特徴及び/又は方法論的な行為に対して説明されているが、添付の請求項において定義される主題は、上述された特別な特徴又は行為に制限される必要のないことを理解されたい。むしろ、上述された特別な特徴及び行為は、請求項を実装する例示の形として開示される。
本明細書では、「モジュール」又は「構成要素(コンポーネント)」という用語は、コンピュータシステム上で実行するソフトウェアオブジェクト又はルーチンに言及し得る。本明細書で説明される異なる構成要素、モジュール、エンジン及びサービスは、コンピュータシステム上で実行するオブジェクト又は処理(例えば、分離したスレッドとして)として実装され得る。本明細書で説明されるシステム及び方法は、ソフトウェアで実装されることが好ましいが、ハードウェア、又はソフトウェア及びハードウェアの組み合わせにおける実装も可能であり且つ考慮される。本明細書の記載では、「コンピューティングエンティティ(計算実体)」は、上述したように本明細書で定義されるように任意の計算システム、又は任意のモジュール、又はコンピュータシステム上で動作するモジュールの組み合わせであり得る。
ここで述べられた全ての例及び条件付きの言葉は、読者が、発明者によって寄与された発明及び概念を技術を深めて理解することを助けるための教育的な目的を意図しており、そのような具体的に述べられた例及び条件に限定されることなく解釈されるべきである。本発明の実施形態は詳細に説明されているが、その様々な変更、置き換え又は修正が本発明の精神及び範囲を逸脱しない限り行われ得ることが理解されるべきである。

Claims (18)

  1. 講義ビデオのメタデータと、学習講座のメタデータと、講義ビデオが文字に書き写された文章を有する講義ビデオの台本とを受信することと、
    前記講義ビデオのメタデータと前記学習講座のメタデータとの間の測定された類似度に基づいて、前記講義ビデオに関係する1つ又は複数の候補学習講座を見出すことであって、1つ又は複数の前記学習講座のそれぞれに対して、前記講義ビデオのメタデータ及び前記学習講座のメタデータの1つ又は複数のメタデータのカテゴリに基づいて、マッチスコアを計算することと、前記マッチスコアが所定のマッチスコア閾値を超えるか否かを決定することと、前記マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、前記学習講座を、候補学習講座として選択することと、
    1つ又は複数の前記候補学習講座の学習教材から重要語句を抽出することと、
    前記学習教材内の抽出された前記重要語句の位置と、抽出された前記重要語句が前記学習教材内にあらわれる頻度と、前記重要語句があらわれる見出された前記候補学習講座とに基づいて、抽出された前記重要語句に重みを割り当てることと、
    前記講義ビデオの台本内に生成された2以上のトピックスセグメントと、2以上の前記トピックスセグメント内の抽出された前記重要語句の存在と、抽出された前記重要語句に割り当てられた前記重みとに基づいて、前記講義ビデオを2以上の特定トピックス部分に分割することと、
    を備える講義ビデオのトピックスを特定する方法。
  2. 前記抽出することは、
    1つ又は複数の前記候補学習講座の前記学習教材にアクセスすることと、
    テキスト形式の解析に基づいて、前記学習教材内の語句の位置を検出することと、
    一般化接尾辞木を用いて、繰り返される語句を抽出することと、
    前記繰り返される語句がシラバス又は講義ノートのタイトルにあらわれること、又は、前記繰り返される語句がセクションタイトル又はページタイトルにあらわれること、又は、前記繰り返される語句が前記学習教材内で所定の頻度閾値を超えてあらわれることの内の少なくとも1つの結果に応えて、前記繰り返される語句を前記重要語句として指定することと、
    前記重要語句内のストップワードを処理することと、
    発見的規則を用いて、前記重要語句から略語を抽出して統一することと、
    を備える請求項1に記載の方法。
  3. 前記抽出することは、抽出された前記重要語句及び抽出された前記重要語句に割り当てられた重みに基づいて、前記重要語句内の出現する位置を解析し、前記候補学習講座内の重要トピックス及び重要概念の階層を生成すること、を備える請求項1に記載の方法。
  4. 更に、
    前記講義ビデオの台本を受信することと、
    前記講義ビデオの台本が自動音声認識により生成されたか否かを判断することと、
    前記講義ビデオの台本が自動音声認識により生成されている結果に応えて、抽出された前記重要語句及び割り当てられた前記重みに基づいて、前記講義ビデオの台本を修正することと、
    前記講義ビデオの台本が自動音声認識により生成されていない結果に応えて、抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
    を備える請求項1に記載の方法。
  5. 前記分割することは、
    抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
    複数のスライドするウィンドウの修正されたベクトル表示を構成することと、
    前記複数のスライドするウィンドウ間の類似度を計算することと、
    前記講義ビデオの台本に含まれる1つ又は複数のトピックスに対応する前記トピックスセグメントの境界を検出することと、
    2つのトピックスウインドウの境界の間に、前記講義ビデオの台本の一部を含む2以上の前記トピックスセグメントを生成することと、
    を備える請求項1に記載の方法。
  6. 更に、2以上の前記トピックスセグメント内に存在する抽出された前記重要語句に基づいて、2以上の前記特定トピックス部分に対してラベルを誘導すること、
    を備える請求項1に記載の方法。
  7. 前記誘導することは、更に、
    前記トピックスセグメントの境界と、抽出された前記重要語句と、割り当てられた前記重みとを受信することと、
    トピックスインドウの境界に基づいて、前記講義ビデオの台本を複数の下位文書に分割することと、
    複数の前記下位文書のそれぞれに対して、修正されたベクトル表示を再構成することと、
    複数の前記下位文書のそれぞれにおいて、語出現頻度−文書出現頻度の逆数法(TF−IDF法)に基づいて、割り当てられた前記重みを更新することと、
    複数の前記下位文書のそれぞれに対する更新された割り当てられた前記重みに基づいて、候補ラベルを選択することと、
    それぞれの前記候補ラベルが、抽出された前記重要語句の内の1つであるか否かを決定することと、
    前記候補ラベルが抽出された前記重要語句の内の1つである結果に応えて、前記候補ラベルを、前記下位文書に対するラベルとして選択することと、
    前記候補ラベルが抽出された前記重要語句の内の1つでない結果に応えて、前記下位文書をトピックスではないと特定することと、
    を備える請求項に記載の方法。
  8. 更に、
    複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、1つ又は複数の前記下位文書の前記ラベルを結合することか、
    又は、
    複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、1つ又は複数の前記下位文書の前記ラベルを分割すること、
    を備える請求項に記載の方法。
  9. 更に、
    キーワード検索と、分割された前記講義ビデオとを関連づけること、
    を備える請求項1に記載の方法。
  10. 講義ビデオのメタデータと、学習講座のメタデータと、講義ビデオが文字に書き写された文章を有する講義ビデオの台本とを受信することと、
    前記講義ビデオのメタデータと前記学習講座のメタデータとの間の測定された類似度に基づいて、前記講義ビデオに関係する1つ又は複数の候補学習講座を見出すことであって、1つ又は複数の前記学習講座のそれぞれに対して、前記講義ビデオのメタデータ及び前記学習講座のメタデータの1つ又は複数のメタデータのカテゴリに基づいて、マッチスコアを計算することと、前記マッチスコアが所定のマッチスコア閾値を超えるか否かを決定することと、前記マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、前記学習講座を、候補学習講座として選択する見出すことと
    1つ又は複数の前記候補学習講座の学習教材から重要語句を抽出することと、
    前記学習教材内の抽出された前記重要語句の位置と、抽出された前記重要語句が前記学習教材内にあらわれる頻度と、前記重要語句があらわれる見出された前記候補学習講座とに基づいて、抽出された前記重要語句に重みを割り当てることと、
    前記講義ビデオの台本内に生成された2以上のトピックスセグメントと、2以上の前記トピックスセグメント内の抽出された前記重要語句の存在と、抽出された前記重要語句に割り当てられた前記重みとに基づいて、前記講義ビデオを2以上の特定トピックス部分に分割することと、
    を備える動作を実行するべく、プロセッサによって実行可能なプログラムコードが内部にコード化された非一時的なコンピュータ可読媒体。
  11. 前記抽出することは、
    1つ又は複数の前記候補学習講座の前記学習教材にアクセスすることと、
    テキスト形式の解析に基づいて、前記学習教材内の語句の位置を検出することと、
    一般化接尾辞木を用いて、繰り返される語句を抽出することと、
    前記繰り返される語句がシラバス又は講義ノートのタイトルにあらわれること、又は、前記繰り返される語句がセクションタイトル又はページタイトルにあらわれること、又は、前記繰り返される語句が前記学習教材内で所定の頻度閾値を超えてあらわれることの内の少なくとも1つの結果に応えて、前記繰り返される語句を前記重要語句として指定することと、
    前記重要語句内のストップワードを処理することと、
    発見的規則を用いて、前記重要語句から略語を抽出して統一することと、
    を備える請求項10に記載の非一時的なコンピュータ可読媒体。
  12. 前記抽出することは、
    抽出された前記重要語句及び抽出された前記重要語句に割り当てられた重みに基づいて、前記重要語句の出現する位置を解析し、前記候補学習講座内の重要トピックス及び重要概念の階層を生成すること、を備える請求項10に記載の非一時的なコンピュータ可読媒体。
  13. 前記動作は、更に、
    前記講義ビデオの台本を受信することと、
    前記講義ビデオの台本が自動音声認識により生成されたか否かを判断することと、
    前記講義ビデオの台本が自動音声認識により生成されている結果に応えて、抽出された前記重要語句及び割り当てられた前記重みに基づいて、前記講義ビデオの台本を修正することと、
    前記講義ビデオの台本が自動音声認識により生成されていない結果に応えて、抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
    を備える請求項10に記載の非一時的なコンピュータ可読媒体。
  14. 前記分割することは、
    抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
    複数のスライドするウィンドウの修正されたベクトル表示を構成することと、
    前記複数のスライドするウィンドウ間の類似度を計算することと、
    前記講義ビデオの台本に含まれる1つ又は複数のトピックスに対応する前記トピックスセグメントの境界を検出することと、
    2つのトピックスウインドウの境界の間に、前記講義ビデオの台本の一部を含む2以上の前記トピックスセグメントを生成することと、
    を備える請求項10に記載の非一時的なコンピュータ可読媒体。
  15. 前記動作は、更に、
    2以上の前記トピックスセグメント内に存在する抽出された前記重要語句に基づいて、2以上の前記特定トピックス部分に対してラベルを誘導すること、を備える請求項10に記載の非一時的なコンピュータ可読媒体。
  16. 前記誘導することは、更に、
    前記トピックスセグメントの境界と、抽出された前記重要語句と、割り当てられた前記重みとを受信することと、
    トピックスインドウの境界に基づいて、前記講義ビデオの台本を複数の下位文書に分割することと、
    複数の前記下位文書のそれぞれに対して、修正されたベクトル表示を再構成することと、
    複数の前記下位文書のそれぞれにおいて、語出現頻度−文書出現頻度の逆数法(TF−IDF法)に基づいて、割り当てられた前記重みを更新することと、
    複数の前記下位文書のそれぞれに対する更新された割り当てられた前記重みに基づいて、候補ラベルを選択することと、
    それぞれの前記候補ラベルが、抽出された前記重要語句の内の1つであるか否かを決定することと、
    前記候補ラベルが抽出された前記重要語句の内の1つである結果に応えて、前記候補ラベルを、前記下位文書に対するラベルとして選択することと、
    前記候補ラベルが抽出された前記重要語句の内の1つでない結果に応えて、前記下位文書をトピックスではないと特定することと、
    を備える請求項15に記載の非一時的なコンピュータ可読媒体。
  17. 前記動作は、更に、
    複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、1つ又は複数の前記下位文書の前記ラベルを結合することか、
    又は、
    複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、1つ又は複数の前記下位文書の前記ラベルを分割すること、
    を備える請求項16に記載の非一時的なコンピュータ可読媒体。
  18. 前記動作は、更に、
    キーワード検索と、分割された前記講義ビデオとを関連づけること、
    を備える請求項10に記載の非一時的なコンピュータ可読媒体。
JP2015064698A 2014-04-04 2015-03-26 講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体 Active JP6515624B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/245,725 2014-04-04
US14/245,725 US9892194B2 (en) 2014-04-04 2014-04-04 Topic identification in lecture videos

Publications (2)

Publication Number Publication Date
JP2015201185A JP2015201185A (ja) 2015-11-12
JP6515624B2 true JP6515624B2 (ja) 2019-05-22

Family

ID=54209944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015064698A Active JP6515624B2 (ja) 2014-04-04 2015-03-26 講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体

Country Status (2)

Country Link
US (1) US9892194B2 (ja)
JP (1) JP6515624B2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015195955A1 (en) * 2014-06-18 2015-12-23 Social Compass, LLC Systems and methods for categorizing messages
US20160189712A1 (en) * 2014-10-16 2016-06-30 Veritone, Inc. Engine, system and method of providing audio transcriptions for use in content resources
CN106652580A (zh) * 2016-11-08 2017-05-10 广东小天才科技有限公司 一种教育视频课程的录制集成系统
US10276155B2 (en) 2016-12-22 2019-04-30 Fujitsu Limited Media capture and process system
WO2018155807A1 (ko) * 2017-02-22 2018-08-30 삼성전자 주식회사 전자 장치, 그의 문서 표시 방법 및 비일시적 컴퓨터 판독가능 기록매체
KR102484257B1 (ko) * 2017-02-22 2023-01-04 삼성전자주식회사 전자 장치, 그의 문서 표시 방법 및 비일시적 컴퓨터 판독가능 기록매체
JP6816621B2 (ja) * 2017-04-11 2021-01-20 富士通株式会社 判別方法、判別プログラム及び判別装置
US10509825B2 (en) * 2017-07-21 2019-12-17 Fuji Xerox Co., Ltd. Systems and methods for topic guidance in video content using sequence mining
US10795932B2 (en) * 2017-09-28 2020-10-06 Electronics And Telecommunications Research Institute Method and apparatus for generating title and keyframe of video
CN108304379B (zh) * 2018-01-15 2020-12-01 腾讯科技(深圳)有限公司 一种文章识别方法、装置及存储介质
KR102170844B1 (ko) * 2018-03-14 2020-10-27 주식회사 산타 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템
EP3621022A1 (en) * 2018-09-07 2020-03-11 Delta Electronics, Inc. Data analysis method and data analysis system thereof
TWI699663B (zh) * 2018-09-07 2020-07-21 台達電子工業股份有限公司 分段方法、分段系統及非暫態電腦可讀取媒體
EP3621021A1 (en) * 2018-09-07 2020-03-11 Delta Electronics, Inc. Data search method and data search system thereof
EP3620936A1 (en) 2018-09-07 2020-03-11 Delta Electronics, Inc. System and method for recommending multimedia data
US11775775B2 (en) * 2019-05-21 2023-10-03 Salesforce.Com, Inc. Systems and methods for reading comprehension for a question answering task
JP7271327B2 (ja) * 2019-06-12 2023-05-11 株式会社デンソーテン 生成装置、生成システム、生成方法および教材データを生成する方法
US20200403818A1 (en) * 2019-06-24 2020-12-24 Dropbox, Inc. Generating improved digital transcripts utilizing digital transcription models that analyze dynamic meeting contexts
US11689379B2 (en) 2019-06-24 2023-06-27 Dropbox, Inc. Generating customized meeting insights based on user interactions and meeting media
US11531703B2 (en) 2019-06-28 2022-12-20 Capital One Services, Llc Determining data categorizations based on an ontology and a machine-learning model
US10489454B1 (en) * 2019-06-28 2019-11-26 Capital One Services, Llc Indexing a dataset based on dataset tags and an ontology
CN110322738B (zh) * 2019-07-03 2021-06-11 北京易真学思教育科技有限公司 一种课程优化方法、装置和系统
KR102188553B1 (ko) * 2019-10-24 2020-12-09 김형민 애니메이션 기반의 스토리텔링을 통한 한글 교육 시스템
CN111314792B (zh) * 2020-02-27 2022-04-08 北京奇艺世纪科技有限公司 一种笔记生成方法、电子设备及存储介质
US20210304628A1 (en) * 2020-03-26 2021-09-30 Ponddy Education Inc. Systems and Methods for Automatic Video to Curriculum Generation
CN111597471A (zh) * 2020-05-22 2020-08-28 北京字节跳动网络技术有限公司 一种展示位置的确定方法、装置、电子设备及存储介质
US11308258B1 (en) * 2020-12-03 2022-04-19 International Business Machines Corporation Textbook content reorganization based on classroom analytics
US11588911B2 (en) 2021-01-14 2023-02-21 International Business Machines Corporation Automatic context aware composing and synchronizing of video and audio transcript
WO2023059000A1 (ko) * 2021-10-08 2023-04-13 삼성전자주식회사 학습을 보조하기 위한 방법 및 장치
US11853356B1 (en) 2022-06-27 2023-12-26 Lumos Information Services, LLC System and method for generating hierarchical mind map and index table
CN116320622B (zh) * 2023-05-17 2023-08-18 成都索贝数码科技股份有限公司 一种广播电视新闻视频转图文稿制作系统和制作方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714909B1 (en) 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
US6816858B1 (en) * 2000-03-31 2004-11-09 International Business Machines Corporation System, method and apparatus providing collateral information for a video/audio stream
JP2002262268A (ja) * 2001-03-02 2002-09-13 Sony Corp 付加情報提供方法、付加情報提供装置、付加情報提供プログラムを記録した情報記録媒体、付加情報提供プログラム
US7526425B2 (en) * 2001-08-14 2009-04-28 Evri Inc. Method and system for extending keyword searching to syntactically and semantically annotated data
US6928407B2 (en) * 2002-03-29 2005-08-09 International Business Machines Corporation System and method for the automatic discovery of salient segments in speech transcripts
US7431650B2 (en) 2002-05-30 2008-10-07 Ameranth, Inc. Casino poker and dealer management system
US8316301B2 (en) 2005-08-04 2012-11-20 Samsung Electronics Co., Ltd. Apparatus, medium, and method segmenting video sequences based on topic
JP4904184B2 (ja) * 2007-03-20 2012-03-28 富士通株式会社 学習支援装置、学習支援方法およびそのプログラム
JP5343861B2 (ja) 2007-12-27 2013-11-13 日本電気株式会社 テキスト分割装置とテキスト分割方法およびプログラム
US8140544B2 (en) * 2008-09-03 2012-03-20 International Business Machines Corporation Interactive digital video library
US8438131B2 (en) * 2009-11-06 2013-05-07 Altus365, Inc. Synchronization of media resources in a media archive
US8423555B2 (en) 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video
JP2012027723A (ja) * 2010-07-23 2012-02-09 Sony Corp 情報処理装置、情報処理方法及び情報処理プログラム
JP5834815B2 (ja) * 2011-11-22 2015-12-24 株式会社リコー 情報処理装置、プログラムおよび文書を検索するための方法

Also Published As

Publication number Publication date
US9892194B2 (en) 2018-02-13
JP2015201185A (ja) 2015-11-12
US20150286718A1 (en) 2015-10-08

Similar Documents

Publication Publication Date Title
JP6515624B2 (ja) 講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体
US9852648B2 (en) Extraction of knowledge points and relations from learning materials
AU2014201827B2 (en) Scoring concept terms using a deep network
US9020805B2 (en) Context-based disambiguation of acronyms and abbreviations
US8972265B1 (en) Multiple voices in audio content
US9996533B2 (en) Question answering system using multilingual information sources
JP6769140B2 (ja) 学習素材のセグメントのランク付け
US9720904B2 (en) Generating training data for disambiguation
JP6361351B2 (ja) 発話ワードをランク付けする方法、プログラム及び計算処理システム
CN106462640B (zh) 对多媒体内容进行的场境搜索
US11762926B2 (en) Recommending web API's and associated endpoints
US20230076387A1 (en) Systems and methods for providing a comment-centered news reader
US10229187B2 (en) System for determination of automated response follow-up
US20190005122A1 (en) System for determination of automated response follow-up
KR102010343B1 (ko) 분절 인터넷 강의 제공 방법 및 장치
US11635883B2 (en) Indication of content linked to text
CN112805715A (zh) 识别实体属性关系
CN107679186A (zh) 基于实体库进行实体搜索的方法及装置
JP2017016642A (ja) キュレーションラーニングにおける論理的思考を向上するシステム及び方法
Dubuisson Duplessis et al. Utterance retrieval based on recurrent surface text patterns
KR20200124836A (ko) 콘텐츠 분석 기반의 인공지능 책쓰기 가이딩 시스템
US10296533B2 (en) Method and system for generation of a table of content by processing multimedia content
EP3762841A1 (en) Methods, systems, devices, and software for managing and conveying knowledge
Foucher et al. Word2Course: Creating interactive courses from as little as a keyword
JP7131518B2 (ja) 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190401

R150 Certificate of patent or registration of utility model

Ref document number: 6515624

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150