JP6515624B2

JP6515624B2 - 講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体

Info

Publication number: JP6515624B2
Application number: JP2015064698A
Authority: JP
Inventors: 俊王; 内野　寛治; 寛治内野
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2014-04-04
Filing date: 2015-03-26
Publication date: 2019-05-22
Anticipated expiration: 2035-03-26
Also published as: US9892194B2; JP2015201185A; US20150286718A1

Description

ここで議論される実施形態は、講義ビデオ内のトピックスの特定に関する。

開かれた教育は、一般に、インターネット又は他の公的なアクセスネットワーク上で利用可能なオンラインの学習プログラム又は学習講座に言及される。開かれた教育の例として、ｅラーニングプログラム、オープン講座ウェア（ＯＣＷ）、マッシブオープンオンライン講座（ＭＯＯＣ）等が含まれる。様々な大学及び他の教育機関は、一般の人々に対して、アカデミックな参加条件を強いることなく、無料の開かれた教育プログラムを提供している。開かれた教育プログラムへの参加は、通常、学習者が様々なトピックスに関係する学習教材にアクセスすることを許容する。学習教材は、教育機関の指導員による講義の講義ノート及び／又は講義ビデオ録画を含み得る。

様々な開かれた教育プログラムが、現在、マサチューセッツ工科大学、イェール、ミシガン大学、カルファルニア大学バークレー校及びスタンフォード大学を含む他の機関という、多数の教育機関によって提供されている。１０年少し前の開かれた教育の発端から、開かれた教育プログラムを提供する教育機関の数が、実質的に増加している。開かれた教育の急増と共に、利用可能な学習教材の数及びオンラインで利用可能な講義ビデオの数が、付随して増加している。しかし、ある場合には、講義ビデオの構造化されていなくて線形な特徴のために、学習者は、講義ビデオ内に求められる知識点又は概念の特定の部分を見つけることが困難である。例えば、学習者が、講義ビデオの特定の部分を勉強するか又は見直したい時、彼らは、しばしば、ほとんど全てのビデオを通して見なければならないか、適切な点を見つけるために数回前後に再生しなければならない時もある。

ここに請求される主題は、不利を解決するか、又は、上述したこれらのような環境のみで動作する実施形態には限定されない。むしろ、この背景は、ここに述べられるある実施形態が具体化されるかもしれない１つの例示の技術領域を説明するために、提供されるだけである。

米国特許出願公開第１３／７３１９９６号明細書

実施形態の一面によれば、講義ビデオのトピックス(ｔｏｐｉｃ:話題）を特定する方法は、講義ビデオのメタデータと、学習講座のメタデータと、講義ビデオの台本とを受信することを含み得る。講義ビデオの台本は、講義ビデオが文字に書き写された文章（ｔｒａｎｓｃｒｉｂｅｄｔｅｘｔ）を含み得る。方法は、上記講義ビデオのメタデータと上記学習講座（ｃｏｕｒｓｅ：講座、課程、コース）のメタデータとの間の測定された類似度に基づいて、上記講義ビデオに関係する１つ又は複数の候補学習講座を見出すことを含み得る。方法は、１つ又は複数の上記候補学習講座の学習教材から重要語句（ｋｅｙｐｈｒａｓｅ）を抽出することを含み得る。方法は、見出された上記学習教材内の抽出された上記重要語句の位置と、抽出された上記重要語句が上記学習教材内にあらわれる頻度と、上記重要語句があらわれる上記候補学習講座とに基づいて、抽出された上記重要語句に重みを割り当てることを含み得る。また、方法は、上記講義ビデオの台本内に生成された２以上のトピックスセグメント（ｔｏｐｉｃｓｅｇｍｅｎｔ）と、抽出された上記重要語句と、抽出された上記重要語句に割り当てられた上記重みとに基づいて、上記講義ビデオを２以上の特定トピックス部分（ｔｏｐｉｃ−ｓｐｅｃｉｆｉｃｐｏｒｔｉｏｎ）に分割することを含み得る。

本実施形態の目的及び効果は、特に請求項において指摘される構成要素、特徴及び組み合わせを用いることによって認識され且つ得られるだろう。

前述の一般的な説明及び後述の詳細な説明の両方は、例示的及び説明的なものであり、特許請求の範囲に記載されている本発明を制限するものではない。

例示の実施形態が、添付の図面を用いて、追加の特定及び詳細と共に、述べられて説明される。

ここで説明されるある実施形態が組み込まれ得る例示の動作環境のブロック図である。図１の動作環境に組み込まれ得る計算装置のブロック図である。図１の動作環境に含まれ得る例示のビデオメタデータを示す。図１の動作環境に含まれ得る例示の学習講座メタデータを示す。図１の動作環境で学習教材から抽出され得る重要語句の例を示す。図１の動作環境に含まれ得る例示の講義ビデオの台本を示す。図１の動作環境で提供され得る分割された形における例示の講義ビデオのスクリーンショットを示す。図１の動作環境で提供され得る分割された形における例示の講義ビデオのスクリーンショットを示す。講義ビデオのトピックスを特定する例示の方法のフロー図を示す。候補学習講座を見出す例示の方法のフロー図を示す。重要語句を抽出する例示の方法のフロー図を示す。講義ビデオを分割する例示の方法のフロー図を示す。ラベルを誘導する例示の方法のフロー図を示す。全ての図面は、ここで説明される少なくとも１つの実施形態に従って準備されている。

ここで議論されるある実施形態は、一般に、講義ビデオ（ビデオ）の中で、トピックスの特定に関係する。トピックスが特定された後、ビデオは特定トピックス部分に分割され得る。それから、学習者は、トピックスによって、ビデオを効率的に捜して閲覧し得る。例示の方法は、講義ビデオメタデータと学習講座メタデータとの間の類似度に基づいて、ビデオに関係する１つ又は複数の候補学習講座を見出すことを含む。重要語句は、１つ又は複数の候補学習講座の学習教材から抽出され得る。学習教材内の抽出された前記重要語句の位置と、抽出された重要語句が学習教材内にあらわれる頻度と、重要語句があらわれる見出された候補学習講座とに基づいて、抽出された重要語句に重みが割り当てられ得る。講義ビデオの台本内に生成された複数のトピックスセグメントと、複数のトピックスセグメント内の抽出された重要語句の存在と、抽出された重要語句に割り当てられた重みとに基づいて、講義ビデオを２以上の特定トピックス部分に分割され得る。そして、複数の特定トピックス部分に対してラベルが誘導されて、ビデオに対するキーワード検索が作成され得る。分割された形のビデオが、学習者に提示される。そして、学習者は、複数の特定トピックス部分の内の１つを選択し得る。特定トピックス部分は、トピックスが議論（ｄｉｓｃｕｓｓ）される間に、選択された特定トピックス部分へビデオを進め得る。本実施形態及び他の実施形態は、添付の図面を参照して説明される。

図１は、ここで説明されるある実施形態が組み込まれ得る例示の動作環境１００のブロック図を示す。動作環境１００は、講義ビデオ（ビデオ）１２６のようなビデオを複数の特定トピックス部分へ分割することを可能とする、ビデオ解析システム１５０を含み得る。講義ビデオ１２６の分割は、ビデオ１２６の講義ビデオの台本（台本）１３４及び／又はビデオ１２６に関係し得る学習講座１３６の学習教材１３０に少なくとも部分的に基づき得る。ビデオ１２６が分割された後、学習者１０２は、ビデオ１２６の全体を見ることなく、トピックスに関係するビデオ１２６の部分を見ることができ得る。追加に又は代わりに、ビデオ１２６が分割された後、学習者１０２は、キーワードを求めてビデオ１２６を探し得る。キーワードに関係するビデオ１２６の部分は、学習者１０２に対して通信されるか、又は、ユーザインターフェースにおいて示され得る。学習者１０２は、ビデオ１２６の全体を見ることなく、キーワードに関係するビデオ１２６の部分を見ることができ得る。

説明している実施形態では、学習者１０２は、ビデオ解析システム１５０と入出力している個人又は実体（ｅｎｔｉｔｙ：エンティティ）を含み得る。学習者１０２は、ビデオ解析システム１５０及び／又は動作環境１００との相互作用を可能にする装置１０４と関係し得る。装置１０４に加えて、動作環境１００は、学習講座サーバ１１４と、教育サーバ１１６と、ビデオ解析サーバ１０８を含み得る。装置１０４と、学習講座サーバ１１４と、教育サーバ１１６と、ビデオ解析サーバ１０８は、ネットワーク１４０を介して、通信し得る。例えば、装置１０４と、サードパーティサーバ１０６と、ビデオ解析サーバ１０８は、ネットワーク１４０を介して、学習教材１３０と通信し得る。ある実施形態では、学習講座サーバ１１４及び教育サーバ１１６は、開かれた教育リソース（ＯＥＲ）サーバを含み得る１つのサーバに含まれ得る。また、ある実施形態では、学習講座サーバ１１４に含まれる１つ又は複数のアイテム（ｉｔｅｍ）（例えば、１３６、１３０、１３２）は、教育サーバ１１６に含まれ得るか、又は、教育サーバ１１６に含まれるいくつかのアイテム（ｉｔｅｍ）（例えば、１２８、１３４、１２６）は、学習講座サーバ１１４に含まれ得る。例えば、ビデオ１２６は、学習教材１３０の一例であり得る。

また、装置１０４は、ビデオ解析モジュール１１０Ａを含み得る、及び／又は、ビデオ解析サーバ１０８は、ビデオ解析モジュール１１０Ｂを含み得る。ビデオ解析モジュール１１０Ａ及び／又は１１０Ｂを参照する場合、ここでは、ビデオ解析モジュール１１０が用いられる。ビデオ解析モジュール１１０は、ビデオ１２６を分割（ａｐｐｏｒｔｉｏｎ）するように構成され得る。ビデオ解析モジュール１１０は、更に、学習教材１３０、学習講座メタデータ１３２、学習講座１３６、講義ビデオメタデータ１２８、台本１３４、ビデオ１２６のような情報、及び、これらに関係する情報を、装置１０４、ビデオ解析サーバ１０８、教育サーバ１１６及び学習講座サーバ１１４の間で、ネットワーク１４０を介して、通信を可能にし得る。

ネットワーク１４０は、有線又は無線であり得えて、制限されないが、スター構成、トークンリング構成又は他の構成を含む多くの異なる構成を有し得る。更に、ネットワーク１４０は、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）（例えばインターネット）、及び／又は、複数の装置が通信可能な他の相互接続する横断するデータ経路を含み得る。ある実施形態では、ネットワーク１４０は、ピアツーピアネットワークを含み得る。ネットワーク１４０は、また、様々な異なる通信プロトコルのデータの通信を可能とする電話通信ネットワークの一部と接続するか又は含んでいても良い。

ある実施形態では、ネットワーク１４０は、ショートメッセージサービス（ＳＭＳ）、マルチメディアメッセージサービス（ＭＭＳ）、ハイパーテキストトランスファプロトコル（ＨＴＴＰ）、ダイレクトデータコネクション、無線アプリケーションプロトコル（ＷＡＰ）、Ｅメール等を介することを含む、データを送信及び受信するための、ブルートゥース（登録商標）通信ネットワーク及び／又は携帯通信ネットワークを含む。

装置１０４は、プロセッサ、メモリ及びネットワーク通信能力を含む計算装置を有し得る。例えば、装置１０４は、ラップトップコンピュータ、デスクトップコンピュータ、タブレットコンピュータ、携帯電話、パーソナルデジタルアシスタント（ＰＤＡ）、携帯Ｅメール装置、携帯ゲーム機、携帯音楽プレーヤ、１つ又は複数のプロセッサが内蔵又は結合されたテレビ、又は、ネットワーク１４０へアクセス可能な他の電子装置を含み得る。

装置１０４は、ビデオ解析モジュール１１０Ａを含み得る。
ビデオ解析モジュール１１０Ａ又は装置１０４に組み込まれている一部は、学習者１０２との相互作用を可能にするように構成され得る。
例えば、ビデオ解析モジュール１１０Ａは、学習者１０２が分割後のビデオ１２６へアクセスすることを許容するユーザインターフェースを提供するように構成され得る。
学習者１０２は、ビデオ解析モジュール１１０Ａを介して、ビデオ１２６又は分割された形のその一部を視聴し、及び／又は、ビデオ１２６内のキーワードを探し得る。
ある実施形態では、装置１０４は、ビデオ解析モジュール１１０Ａを含まなくてもよい。
本実施形態又は他の実施形態では、装置１０４は、学習者１０２によって、ブラウザを介して、ビデオ解析モジュール１１０Ｂを用いて入出力するように使用され得る。

学習講座サーバ１１４は、プロセッサ、メモリ及び通信能力を含む計算装置を有し得るハードウェアサーバを含み得る。図示の実施形態では、学習講座サーバ１１４は、ネットワーク１４０に接続され、ネットワーク１４０を介して、装置１０４、ビデオ解析サーバ１０８、教育サーバ１１６との間でデータを送信及び受信し得る。学習講座サーバ１１４は、ホストとなり、及び／又は、学習講座１３６を保存するように構成され得る。学習講座１３６は、例えば、教育課程又はセミナーを含み得る。

学習講座１３６は、例えば、学習教材１３０を含み得る。例えば、学習教材１３０は、制限されないが、シラバス（ｓｙｌｌａｂｕｓ：概要)、ノート、アウトライン、例題及び／又は解答、講義ノートのリスト、講義ビデオ、他のビデオ、ビデオの台本、又は学習講座１３６に対する他の類似した学習教材を含み得る。学習講座１３６は、また、学習講座メタデータ１３２を含み得る。学習講座メタデータ１３２は、学習講座１３６からのメタデータ及び／又はそこに含まれる学習教材１３０を含み得る。学習講座メタデータ１３２のいくつかの例は、制限されないが、講座のタイトル、講座の番号、講座の日程、教授、機関、シラバス、ノートのような学習教材１３０の内の１つのタイトル、及び学習教材１３０の文書（ｔｅｘｔ：テキスト）を含み得る。

ある実施形態では、学習講座サーバ１１４内の学習講座１３６は、ＯＥＲから選択され得る。追加して又は代わりに、学習講座１３６は、学習者１０２の興味に少なくとも部分的に基づいて選択され得る。従って、本実施形態又は他の実施形態では、１つ又は複数の学習講座１３６及び／又は学習教材１３０は、オープン講座ウェア（ＯＣＷ）講座のような開かれた教育の教材を含み得る。ある実施形態では、開かれた教育の教材の推薦及び／又は選択は、２０１２年１２月３１日に出願された米国特許出願第１３／７３１９９６号に記載されているように実行される。この公報の内容は、参照されて、本明細書に組み込まれる。

教育サーバ１１６は、プロセッサ、メモリ及び通信能力を含む計算装置を有し得るハードウェアサーバを含み得る。図示の実施形態では、教育サーバ１１６は、ネットワーク１４０に接続されて、ネットワーク１４０を介して、装置１０４、ビデオ解析サーバ１０８、学習講座サーバ１１４との間でデータを送信及び受信し得る。教育サーバ１１６は、ホストとなり、及び／又は、ビデオ１２６を保存するように構成され得る。ビデオ１２６は、ネットワーク１４０を介して、装置１０４、学習講座サーバ１１４及びビデオ解析サーバ１０８に対して、アクセス可能である。

教育サーバ１１６は、また、ホストとなり、及び／又は、ビデオ１２６、講義ビデオメタデータ１２８及び台本１３４を保存し得る。台本１３４は、ビデオ１２６の時間と関連して、ビデオ１２６が文字に書き写された文章を含み得る。講義ビデオメタデータ１２８は、ビデオ１２６と関連したデータを含み得る。ビデオ１２６と関連したデータは、ビデオ１２６のタイトル、ビデオ１２６が属するか又はビデオ１２６が関連する講座のタイトル、講座の数、ビデオ１２６が録画されたか及び／又は対応する講義が示された日付け、教授又は対応する講義を示す指導員、対応する講義が示されたか又は教授が関係する機関、ビデオ１２６及び／又は対応する講座の説明、及び台本１３４の内の１つ又は複数を含み得る。

ある実施形態では、教育サーバ１１６は、大学又は同様の教育機関と結びつき得る。追加して又は代わりに、教育サーバ１１６は、ＯＥＲサーバを有し得る。ＯＥＲサーバは、学習者１０２が公式に授業に登録されることなく、ビデオ１２６を学習者１０２に提供し得る。

ビデオ解析サーバ１０８、プロセッサ、メモリ及びネットワーク通信能力を含む計算装置を有し得るハードウェアサーバを含み得る。図示の実施形態では、ビデオ解析サーバ１０８は、ネットワーク１４０に接続されて、ネットワーク１４０を介して、装置１０４、学習講座サーバ１１４及び／又は教育サーバ１１６との間でデータを送信及び受信し得る。ビデオ解析サーバ１０８は、ビデオ解析モジュール１１０Ｂを含み得る。ビデオ解析モジュール１１０Ｂは、ビデオ１２６を解析するように構成され得る。追加して又は代わりに、ビデオ解析モジュール１１０Ｂは、ビデオ解析モジュール１１０Ａと相互作用して、ビデオ１２６を解析するか及び／又は学習者１０２に対して分割された形のビデオ１２６を提供するように構成され得る。

後述の段落では、ビデオ１２６の分割の例が説明される。両方のビデオ解析モジュール１１０が同じ動作を実行するとしてここでは説明されているが、追加して又は代わりに、ビデオ解析モジュール１１０Ａが動作の一部を実行し、他方のビデオ解析モジュール１１０Ｂが動作の他の部分を実行してもよい。例えば、ある実施形態では、ビデオ解析モジュール１１０Ｂが、後述する動作の大部分を実行し、装置１０４のビデオ解析モジュール１１０Ａは、学習者１０２が分割された形のビデオ１２６へのアクセスを可能にする。ある実施形態では、装置１０４が大部分の動作を実行するように構成され得るビデオ解析モジュール１１０Ａを有し得る。

ある実施形態では、ビデオ解析モジュール１１０は、台本１３４、講義ビデオメタデータ１２８、学習教材１３０及び学習講座メタデータ１３２を受信するように構成され得る。例えば、ビデオ解析モジュール１１０は、台本１３４、講義ビデオメタデータ１２８、学習講座メタデータ１３２、又はこれらの組み合わせを、教育サーバ１１６及び学習講座サーバ１１４から、ネットワーク１４０を介して、受信し得る。追加して又は代わりに、ビデオ解析モジュール１１０は、台本１３４、講義ビデオメタデータ１２８、学習講座１３６の学習教材１３０、学習講座メタデータ１３２又はこれらの組み合わせに対して、教育サーバ１１６及び学習講座サーバ１１４から、ネットワーク１４０を介して、アクセスし得る。

ビデオ解析モジュール１１０は、ビデオ１２６に関係する学習講座１３６の中から１つ又は複数の候補学習講座を見出し得る。見出すことは、講義ビデオメタデータ１２８と学習講座メタデータ１３２との間の測定された類似度（ｍｅａｓｕｒｅｄｓｉｍｉｌａｒｉｔｙ）に基づき得る。測定された類似度は、制限されないが、特定のメタデータ間の完全な一致、特定のメタデータが有効か否かの決定、特定のメタデータ間の文書（テキスト）の類似度を含み得る。ある実施形態では、測定された類似度はマッチスコア（ｍａｔｃｈｓｃｏｒｅ：一致度）で定量化される。

例えば、ビデオ解析モジュール１１０は、学習講座１３６に対してマッチスコアを計算し得る。マッチスコアは、講義ビデオメタデータ１２８と各学習講座１３６の学習講座メタデータ１３２に基づき得る。ある実施形態では、マッチスコアは、文書の類似度を算出することによって、並びに、１つ又は複数のメタデータのカテゴリに対する有効性及び一致度を決定することによって、部分的に計算され得る。メタデータのカテゴリは、制限されないが、ビデオタイトル／講義ノートのタイトル、講座のタイトル、講座の番号、日付け、教授又は指導員、機関、ビデオの説明／シラバス、及びビデオの台本／講座ノートの文書を含み得る。ビデオ解析モジュール１１０は、それぞれのメタデータのカテゴリに対して重みを割り当て得る。そして、ビデオ解析モジュール１１０は、割り当てられた重みと算出された文書の類似度との積の和を求め得る。

本実施形態又は他の実施形態では、マッチスコアは、マッチスコア式に従って計算される。

マッチスコア式では、マッチスコアの量は、ビデオ１２６に関する複数の学習講座１３６の内の１つのマッチスコアを示す。変数ＶＴは、ビデオタイトル／講義ノートのタイトルのメタデータのカテゴリに対する文書の類似度のスコアを示す。変数ＶＴは、ビデオタイトル／講義ノートのタイトルのメタデータ間で選択された最大の文書（テキスト）の類似度を示す。変数ＣＴは、講座のタイトルのメタデータのカテゴリに対する文書の類似度のスコアを示す。変数ＣＮは、講座の番号が有効か否か及び講座の番号が有効な時には、メタデータ内の複数の講座の番号が一致するか否かを示す講座の番号のカテゴリのメタデータに対するスコアを示す。例えば、講座の番号が有効であり且つ一致する時には、ＣＮは１と等しく、そうでない時には、ＣＮはゼロと等しいかもしれない。

変数Ｄは、メタデータ間の一致度を示す。例えば、日付けがメタデータ内で有効（aｖａｉｌａｂｌｅ）である時には、Ｄは日付け類似度式に従って、計算され得る。

日付け類似度式では、ｅｘｐは指数関数を示す。パラメータλは、定数を示す。パラメータｖｉｄｅｏ＿ｄａｔｅは、ビデオの日付けを示す。パラメータｃｏｕｒｓｅ＿ｄａｔｅは、講座の日付を示す。日付けが有効でない時には、Ｄはゼロと等しいかもしれない。日付けは、年を単位として計算され得る。

変数Ｌは、教授又は講座のメタデータのカテゴリに対する文書の類似度のスコアを示す。教授又は講座が有効でない時には、変数Ｌはゼロと等しいかもしれない。変数Ｉは、複数の機関のメタデータのカテゴリに対するマッチスコアを示す。機関のメタデータが有効であり且つ一致する時には、Ｉは１と等しく、そうでない時には、Ｉはゼロと等しいかもしれない。変数ＤＳは、ビデオの説明／シラバスのメタデータのカテゴリに対する文書の類似度のスコアを示す。ビデオの説明／シラバスのメタデータのカテゴリ内のメタデータが有効でない時には、ＤＳはゼロと等しいかもしれない。変数ＴＬは、ビデオの台本／講座ノートの文書のメタデータのカテゴリに対する文書の類似度のスコアを示す。ある実施形態では、ＴＬを決定するために、文書の類似度のスコアは、ビデオの台本と各講座ノートの全文書との間で計算され得る。ＴＬは、文書の類似度の複数のスコアの内の最大値を示す。

変数ａ，ｂ，ｃ，ｄ，ｅ，ｆ，ｇ，及びｈは、割り当てられた重みを示す。割り当てられた重みは、それぞれのメタデータのカテゴリの相対的な重要度に基づいて、調整され得る。ある実施形態では、割り当てられた重みの値は、その場で設定され得る。追加して又は代わりに、割り当てられた重みは、機械学習を用いて、変更又は最適化され得る。追加して又は代わりに、割り当てられた重みの和は、１と等しいかもしれない。例えば、例示の実施形態では、変数ａ，ｂ，ｃ，ｄ，ｅ，ｆ，ｇ，及びｈの値は、ａ＝０．２，ｂ＝０．４，ｃ＝０．１，ｄ＝０．０５，ｅ＝０．０５，ｆ＝０．０５，ｇ＝０．１，及びｈ＝０．１を含み得る。ある実施形態では、ベクトル空間モデル（ＶＳＭ）が、文書の類似度を計算するために使用され得る。本明細書では、ＶＳＭの追加の詳細は、他で提供される。

ビデオ解析モジュール１１０は、それぞれのマッチスコアが所定のマッチスコア閾値を超えるか否かを決定し得る。学習講座１３６の１つのマッチスコアが所定のマッチスコア閾値を超えている結果に応えて、ビデオ解析モジュール１１０は、その学習講座１３６を、候補学習講座として選択し得る。マッチスコアが所定のマッチスコア閾値よりも下である結果に応えて、ビデオ解析モジュール１１０は、その学習講座１３６を、候補学習講座として選択しないだろう。マッチスコア閾値は、割り当てられた重みの値及び／又は測定された類似度に対して用いられたアルゴリズムに依存し得る。例えば、割り当てられた重みの和が１と等しい時には、マッチスコア閾値は、０．５と１との間の値を含み得る。

そして、ビデオ解析モジュール１１０は、重要語句を抽出する。重要語句は、候補学習講座からの重要トピックス及び／又は重要概念を含み得る。重要語句は、特定の学習教材１３０に及び／又は特定の学習教材１３０の特定の位置にあらわれる語句を含み得る。追加して又は代わりに、重要語句は、学習教材１３０に頻繁にあらわれる語句を含み得る。例えば、語句は、複数回繰り返される時に、重要語句でありそうである。

ビデオ解析モジュール１１０は、１つ又は複数の語句の特徴を決定し、且つ、語句を、重要語句であるか又は重要語句でないとして指定するように構成され得る。例えば、ビデオ解析モジュール１１０は、語出現頻度−文書出現頻度の逆数法（ＴＦ−ＩＤＦ法）を用いて、重要語句を抽出し得る。追加して又は代わりに、ビデオ解析モジュール１１０は、１つ又は複数の候補学習講座の学習教材１３０にアクセスし得る。ビデオ解析モジュール１１０は、テキスト形式の解析に基づいて、学習教材１３０内の語句の位置を検出し得る。ビデオ解析モジュール１１０は、また、一般化接尾辞木（ｇｅｎｅｒａｌｉｚｅｄｓｕｆｆｉｘｔｒｅｅ）を用いて、繰り返される語句を抽出し得る。

ビデオ解析モジュール１１０は、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれるか否かを決定し得る。繰り返される語句がシラバス又は講義ノートのタイトルにあらわれる結果に応えて、ビデオ解析モジュール１１０は、繰り返される語句を重要語句として指定し得る。繰り返される語句がシラバス又は講義ノートのタイトルにあらわれない結果に応えて、ビデオ解析モジュール１１０は、繰り返される語句がセクションタイトル（ｓｅｃｔｉｏｎｔｉｔｌｅ）又はページタイトル（ｐａｇｅｔｉｔｌｅ）にあらわれるか否かを決定し得る。繰り返される語句がセクションタイトル又はページタイトルにあらわれる結果に応えて、ビデオ解析モジュール１１０は、繰り返される語句を重要語句として指定し得る。繰り返される語句がセクションタイトル又はページタイトルにあらわれない結果に応えて、ビデオ解析モジュール１１０は、繰り返される語句が学習教材１３０内で所定の頻度閾値（例えば、学習教材１３０内に２回）を超えてあらわれるか否かを決定し得る。繰り返される語句が学習教材１３０内で所定の頻度閾値を超えてあらわれない結果に応えて、ビデオ解析モジュール１１０は、繰り返される語句を重要語句として指定しないだろう。繰り返される語句が学習教材１３０内で所定の頻度閾値を超えてあらわれる結果に応えて、ビデオ解析モジュール１１０は、繰り返される語句を重要語句として指定し得る。

追加して又は代わりに、ビデオ解析モジュール１１０は、重要語句内のストップワードを処理し得る。ストップワードは、一般に、分析の前に除去される語を含み得る。ストップワードのいくつかの例は、「ｔｈｅ」及び「ｏｒ」又は「ａ」のような一般のストップワードと共に、「講義（ｌｅｃｔｕｒｅ）」又は「ノート（ｎｏｔｅｓ）」のような領域に特有の語を含み得る。また、ビデオ解析モジュール１１０は、発見的規則（ｈｅｕｒｉｓｔｉｃｒｕｌｅｓ）を用いて、略語を抽出し及び／又は統一し得る。発見的規則の例は、括弧に挟まれた表現に続く語句を抽出して、括弧に挟まれた表現が語句に対する略語又は頭字語を含むか否かを決定する規則を含み得る。

追加して又は代わりに、ビデオ解析モジュール１１０は、抽出された重要語句及び抽出された重要語句に割り当てられた重みに基づいて、重要語句の出現する位置を解析し、候補学習講座内の重要トピックス及び重要概念の階層を生成し得る。

ビデオ解析モジュール１１０は、抽出された重要語句に重みを割り当て得る。重みは、学習教材１３０内の抽出された重要語句の位置に基づいて、割り当てられ得る。例えば、抽出された重要語句がタイトル（ｔｉｔｌｅ）又は見出し（ｈｅａｄｉｎｇ）内にあらわれる時には、重みは、より高くなり得る。追加して又は代わりに、重みは、抽出された重要語句が学習教材１３０内にあらわれる頻度に基づいて、割り当てられ得る。例えば、抽出された重要語句が所定の閾値より高く生じる時には、重みは、より高くなり得る。追加して又は代わりに、重みは、重要語句があらわれる候補学習講座又はこれらの内のいくつかの組み合わせに基づいて、割り当てられ得る。例えば、重要語句がビデオ１２６の見出された候補学習講座内にあらわれる時には、他の候補学習講座内にあらわれる重要語句よりも、その重要語句にはより高い重みが割り当てられ得る。

また、ある実施形態では、ビデオ解析モジュール１１０は、台本１３４が音声認識によって生成されたか否かを判断し得る。台本１３４が音声認識によって生成されている結果に応えて、ビデオ解析モジュール１１０は、抽出された重要語句及び／又は割り当てられた重みに基づいて、台本１３４を修正し得る。例えば、抽出された重要語句は、領域（ｄｏｍａｉｎ）に特有の辞書で用いられ得る。領域に特有の辞書は音声認識システムと共に用いられて、辞書を向上して台本１３４の正確さを向上し得る。追加して又は代わりに、ビデオ解析モジュール１１０は、発見的規則を用いて、台本１３４を統一し得る。

ビデオ解析モジュール１１０は、台本内に生成された複数のトピックスセグメント（ｔｏｐｉｃｓｅｇｍｅｎｔ：トピックスの部分）と、複数のトピックスセグメント内の抽出された重要語句の存在と、抽出された重要語句に割り当てられた重みと又はこれらの内のいくつかの組み合わせに基づいて、ビデオ１２６を複数の特定トピックス部分に分割し得る。複数のトピックスセグメントは、通常、台本１３４内の文字に書き写された文章のブロックに言及する。

本実施形態又は他の実施形態では、ビデオ解析モジュール１１０は、抽出された重要語句及び割り当てられた重みを用いて、台本１３４のトークン化を更新し得る。トークン化は、一般に、台本１３４の文字に書き写された文章が単語及び語句に分割される方法に言及する。トークン化の更新は、抽出された重要語句が結合されるか又は一緒に解析されることを確実にすることを含み得る。

トピックスセグメントは、スライドするウィンドウ（ｓｌｉｄｉｎｇ−ｗｉｎｄｏｗ）の分割中に作られ得る。一般に、スライドするウィンドウの分割は、台本内に作られるスライドするウィンドウの修正されたベクトル表示を構成することを含み得る。そして、ビデオ解析モジュール１１０は、複数のスライドするウィンドウ間の類似度を計算し、台本１３４に含まれる複数のトピックスに対応するトピックスセグメントの境界を検出し得る。ビデオ解析モジュール１１０は、２つのトピックスセグメントの境界の間に、それぞれが台本１３４の一部を含む複数のトピックスセグメントを生成し得る。文章の類似度が変化する境界文（例えば、ローカルミニマム又はグローバルミニマム（ｌｏｃａｌ又はｇｌｏｂａｌｍｉｎｉｍｕｍ））は、トピックスセグメントの境界として設定され得る。スライドするウィンドウの分割では、トピックスセグメントの境界は、抽出された重要語句の存在及び／又は抽出された重要語句の割り当てられた重みに基づいて、移動し又は調整され得る。例えば、文章の類似度のスコアは、抽出された重要語句の存在及び／又は抽出された重要語句に割り当てられた重みに関係する類似度を反映し得る。

例えば、台本１３４は、１から４５の番号がつけられた４５個の文を含み得る。ウィンドウの寸法は５つの文に設定されて、１つのステップは１つの文に設定され得る。スライドするウィンドウの分割の開始において、１番目のウィンドウは、１から５の文を含み、２番目のウィンドウは、６から１０の文を含む。そして、文章の類似度の解析は、１番目のウィンドウに含まれる文章と２番目のウィンドウに含まれる文章との間で実行され得る。ステップは１に設定されて、１番目のウィンドウは、２から６の文を含むように再構成され、２番目のウィンドウは、７から１１の文をふくむように再構成され得る。そして、もう１つの文章の類似度の解析が、再構成された１番目のウィンドウと２番目のウィンドウとの間で実行され得る。そして、１番目のウィンドウ及び２番目のウィンドウは、全ての４５の文が２つのウインドウに含まれるまで、ステップに従って再構成され得る。１４及び２６の文において、文章の類似度が変化する時（例えば、ローカルミニマム又はグローバルミニマム）、トピックスセグメントの境界は、１４及び２６の文に設定され得る。

上述したように、トピックスセグメントは、類似度の決定を用いて、生成され得る。文章の類似度の測定は、ＶＳＭに基づき得る。例えば、ある実施形態では、文章の類似度は、例示のＶＳＭ式に従って計算され得る。

ＶＳＭ式では、変数ｔは、最初の語（ｔｅｒｍ）を示す１から最後の語を示す変数ｎまで、変動する添え字を表す。従って、変数ｔは、抽出された重要語句を含む全ての語にわたって変動する。変数ｂ１は、１番目のスライドするウィンドウを示し、ｂ２は、２番目のスライドするウィンドウを示す。ｓｉｍ（ｂ１，ｂ２）の量は、１番目のトピックスウインドウと２番目のトピックスウインドウとの間の類似度を示す。パラメータωｔ、ｂは、１つのトピックスウインドウの内のある語に割り当てられた重みを示す。例えば、ωｔ、ｂ１は、１番目のスライドするウィンドウ内のある語に割り当てられた重みを示す。

台本１３４の１つ又は複数のトピックスセグメントは、ビデオ１２６の特定トピックス部分に関連付けられ得る。具体的には、ある実施形態では、台本１３４は、文字に書き写された文章の言葉の朗読がビデオ１２６内に生じる時間と関連づけられた文字に書き写された文章を含み得る。複数のトピックスセグメントは、時間に基づいて、台本１３４からビデオ１２６に変換（ｔｒａｎｓｌａｔｅ）され得る。

ビデオ解析モジュール１１０は、また、トピックスに対するラベルを誘導し得る。ラベルは、トピックスセグメント内に存在する抽出された重要語句に基づき得る。例えば、ビデオ解析モジュール１１０は、トピックスセグメントの境界と、抽出された重要語句と、割り当てられた重みとを受信し得る。ビデオ解析モジュール１１０は、トピックスインドウの境界に基づいて、台本１３４を、通常トピックスセグメントと関連する複数の下位文書（ｓｕｂ−ｄｏｃｕｍｅｎｔ）に分割し得る。そして、ビデオ解析モジュール１１０は、複数の下位文書のそれぞれに対して、修正されたベクトル表示を再構成し得る。ビデオ解析モジュール１１０は、複数の下位文書のそれぞれにおいて、ＴＦ−ＩＤＦ法に基づいて、割り当てられた重みを更新し得る。ビデオ解析モジュール１１０は、複数の下位文書のそれぞれに対する更新された割り当てられた重みに基づいて、候補ラベルを選択し得る。ビデオ解析モジュール１１０は、それぞれの候補ラベルが、抽出された重要語句の内の１つであるか否かを決定し得る。ビデオ解析モジュール１１０は、候補ラベルが抽出された重要語句の内の１つである結果に応えて、候補ラベルを、下位文書に対するラベルとして選択し得る。ビデオ解析モジュール１１０は、候補ラベルが抽出された重要語句の内の１つでない結果に応えて、下位文書をトピックスではないと特定し得る。

追加して又は代わりに、ビデオ解析モジュール１１０は、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係を確認し得る。ビデオ解析モジュール１１０は、階層的関係に基づいて、複数のラベルを結合するか又は分割し得る。複数のラベルを結合すること及び分割することは、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係に基づき得る。

また、ある実施形態では、ビデオ解析モジュール１１０は、キーワード検索と、分割されたビデオ１２６とを関連づけ得る。例えば、抽出された重要語句は、複数の下位文書のそれぞれ及び／又はそれぞれのトピックスセグメントに特定され得る。ビデオ解析モジュール１１０は、学習者１０２がキーワード検索を入力することを許容するユーザインターフェースを提供し得る。そして、ビデオ解析モジュール１１０は、学習者１０２に対して、ビデオ１２６のどの部分においてキーワードが論じられているかを示し得る。

ある実施形態では、分割された形のビデオ１２６が、装置１０４を介して、学習者１０２に対して、示され得る。分割された形のビデオ１２６は、ビデオ１２６のどの部分の間にどのトピックスが生じるかを示すトピックス時間バー（ｂａｒ）又は他のグラフィク要素を含み得る。トピックス時間バーは、台本１３４と関連づけられ得る。ラベルは、それぞれの部分に対して提供され得る。追加して又は代わりに、キーワードが存在するビデオ１２６の部分は、キーワード検索に応えて、時間バー及び／又は台本１３４内の表示された強調によって、学習者１０２に示される。従って、学習者１０２は、トピックスの部分及び／又は部分におけるキーワードの議論に基づいて、ビデオ１２６の部分だけを見ることを選択し得る。

本開示の範囲から離れることなく、動作環境１００及び／又はビデオ解析システム１５０に対して、変更、追加又は省略をしてもよい。具体的には、図１に示される動作環境１００の実施形態は、一人の学習者１０２と、１つの学習講座サーバ１１４と、１つの教育サーバ１１６と、１つの装置１０４及び１つのビデオ解析サーバ１０８を含むビデオ解析システム１５０とを含む。しかし、本開示は、一人以上の学習者１０２と、１つ以上の学習講座サーバ１１４と、１つ以上の装置１０４及び１つ以上のビデオ解析サーバ１０８又はこれらの任意の組み合わせを含み得るビデオ解析システム１５０とを含む動作環境１００に対して適用される。

更に、本明細書に説明される実施形態内の様々な構成要素の分離は、分離が全ての実施形態において生じることを示すことを意味するものではない。また、本開示の利益と共に、説明された複数の構成要素が１つの構成要素内に集積されるか又は複数の構成要素に分離され得ることを理解されたい。

ビデオ解析モジュール１１０は、講座ビデオ内のトピックスの特定のためのコード（ｃｏｄｅ）及びルーチン（ｒｏｕｔｉｎｅ：決められた動作）を含み得る。
ある実施形態では、ビデオ解析モジュール１１０は、装置１０４のような計算装置上に格納され得るシンクライアントアプリケーションとして、部分的に働き、また、例えば、ビデオ解析サーバ１０８上に格納され得る構成要素として部分的に働く。ある実施形態では、ビデオ解析モジュール１１０は、フィールドプログラマブルアレイ（ＦＰＧＡ）又は特定用途向け集積回路（ＡＳＩＣ）を含むハードウェアを用いて実装され得る。いくつかの他の実施形態では、ビデオ解析モジュール１１０は、ハードウェア及びソフトウェアの組み合わせを用いて実装され得る。

さて図２を参照して、例示のビデオ解析モジュール１１０は、より詳細に示される。図２に示されるビデオ解析モジュール１１０は、図１における装置１０４のビデオ解析モジュール１１０Ａ及び／又はビデオ解析サーバ１０８のビデオ解析モジュール１１０Ｂを含み得る。図２は、ビデオ解析モジュール１１０、プロセッサ２２４、メモリ２２２及び通信ユニット２２６を含む計算装置２００のブロック図である。計算装置２００の構成要素は、バス２２０によって、通信可能に接続され得る。ある実施形態では、計算装置２００は、図１におけるビデオ解析サーバ１０８又はビデオ解析システム１５０の装置１０４を含み得る。ビデオ解析モジュール１１０、単一の計算装置２００内に多数のモジュール２４０を含むように示される。ある実施形態では、１つ又は複数のモジュール２４０は、計算装置２００と実質的に同等であり得る多数の計算装置上にロード（ｌｏａｄ：読み込む）され、そうでない場合には格納されて、使用され得る。例えば、モジュール２４０の一のサブセット（ｓｕｂｓｅｔ：小集団）が、装置１０４上にロードされ、モジュール２４０の他のサブセットがビデオ解析サーバ１０８上にロードされ得る。

図１及び図２を組み合わせて参照して、プロセッサ２２４は、算術演算論理ユニット（ＡＬＵ）、マイクロプロセッサ、多目的コントローラ、又はいくつかの他のプロセッサアレイを含み、計算及びソフトウェアプログラムの解析を実行し得る。プロセッサ２２４は、他の構成要素（例えば、１１０、２２６、２２２）との通信のためにバス２２０と接続し得る。プロセッサ２２４は、一般に、データ信号を処理し、復号命令セットコンピュータ（ＣＩＳＣ）アーキテクチャ、縮小命令セットコンピュータ（ＲＩＳＣ）アーキテクチャ又は命令セットの組み合わせを実装するアーキテクチャを含む様々な計算アーキテクチャを含み得る。図２は、単一のプロセッサ２２４を示しているけれども、複数のプロセッサが計算装置２００に含まれ得る。他のプロセッサ、オペレーティングシステム、及び物理的構成が可能であり得る。

メモリ２２２は、プロセッサ２２４によって実行され得る命令及び／又はデータを記憶するように構成され得る。メモリ２２２は、他の構成要素と通信するためのバス２２０に接続され得る。命令及び／又はデータは、本明細書に説明される技術又は方法を実行するためのコード（ｃｏｄｅ）を含み得る。メモリ２２２は、ＤＲＡＭ装置、ＳＲＡＭ装置、フラッシュメモリ又はいくつかの他の記憶装置を含み得る。ある実施形態では、メモリ２２２は、また、不揮発性メモリ又は同等の永久記憶装置、及び、ハードディスクドライブ、フロッピー（登録商標）ディスクドライブ、ＣＤ−ＲＯＭ装置、ＤＶＤ−ＲＯＭ装置、ＤＶＤ−ＲＡＭ装置、ＤＶＤ−ＲＷ装置、フラッシュメモリ装置を含む媒体、又はより永久ベースで情報を格納するいくつかの他の大容量記憶装置を含む。

通信ユニット２２６は、ビデオ解析モジュール１１０が格納されている場所に依存して、学習講座サーバ１１４、教育サーバ１１６、装置１０４及びビデオ解析サーバ１０８の内の少なくとも１つとの間でデータを送信及び受信するように構成され得る。通信ユニット２２６は、バス２２０に接続され得る。ある実施形態では、通信ユニット２２６は、ネットワーク１４０又は他の通信チャネルへの直接の物理的な接続のためのポートを含み得る。例えば、通信ユニット２２６は、動作環境１００の構成要素との有線通信のために、ＵＳＢ、ＳＤ、ＣＡＴ−５又は同様のポートを含み得る。ある実施形態では、通信ユニット２２６は、通信チャネルを介して、ＩＥＥＥ８０２．１１，ＩＥＥＥ８０２．１６，ブルートゥース（登録商標）又は他の適切な無線通信方法を含む１つ又は複数の無線通信方法を用いて、データを交換するための無線トランシーバを含む。

ある実施形態では、通信ユニット２２６は、有線ポート及び無線トランシーバを含む。通信ユニット２２６は、また、トランスミッションコントロールプロトコル／インターネットプロトコル（ＴＣＰ／ＩＰ）、ＨＴＴＰ、ＨＴＴＰセキュア（ＨＴＴＰＳ）及び単純なメール転送プロトコル（ＳＭＴＰ）等を含む標準のネットワークプロトコルを用いて、ファイル及び／又はメディア物の分配のために、他の従来の接続をネットワーク１４０へ提供し得る。ある実施形態では、通信ユニット２２６は、また、ＳＭＳ、ＭＭＳ、ＨＴＴＰ、ダイレクトデータ接続、ＷＡＰ、Ｅメール又は他の適切なタイプの電気通信を介することを含む無線通信ネットワーク上で、データの送受信のために無線通信トランシーバを含む。

図２の実施形態では、ビデオ解析モジュール１１０は、通信モジュール２０２、計算モジュール２１４、発見（見出し）モジュール２０６、抽出モジュール２１２、判断モジュール２１６、割り当てモジュール２０８、分割（ａｐｐｏｒｔｉｏｎｍｅｎｔ）モジュール２１０、選択モジュール２１８、検出モジュール２２８、指定モジュール２３０、解析モジュール２３２、更新モジュール２３４、修正モジュール２３６、誘導モジュール２４２、生成モジュール２４６、分割（ｓｅｇｍｅｎｔａｔｉｏｎ）モジュール２４８、構成モジュール２４４（まとめて、モジュール２４０）を含み得る。モジュール２４０のそれぞれは、１つ又は複数の動作を実行するように構成された１つ又は複数のルーチン（ｒｏｕｔｉｎｅ：決められた動作）を含むソフトウェアとして実装され得る。モジュール２４０は、本明細書に説明される機能を提供するべく、プロセッサ２２４によって実行可能な命令のセットを含み得る。いくつかの例では、モジュール２４０は、計算装置２００のメモリ２２２に記憶され又は少なくとも一時的にロードされて、プロセッサ２２４によってアクセスされて実行可能であり得る。モジュール２４０の内の１つ又は複数が、バス２２０を介して、プロセッサ２２４及び計算装置２００の構成要素と協働及び通信するために適合し得る。

通信モジュール２０２は、ビデオ解析モジュール１１０と計算装置２００の他の構成要素（例えば、２２４、２２２及び２２６）との間の通信を処理するように構成され得る。通信モジュール２０２は、通信ユニット２２６を介して、学習講座サーバ１１４、装置１０４、教育サーバ１１６及びビデオ解析サーバ１０８との間でデータを送受信するように構成され得る。ある実施形態では、通信モジュール２０２は、他のモジュール（例えば、２０４，２０６，２０８，２１０，２１２，２１４，２１６，２１８，２２８，２３０，２３２，２３４，２３６，２３８，２４２，２４８）と協働して、通信ユニット２２６を介して、学習講座サーバ１１４、装置１０４、教育サーバ１１６及びビデオ解析サーバ１０８の内の１つ又は複数との間で、データの受け取り及び／又は送信し得る。

例えば、通信モジュール２０２は、学習講座サーバ１１４及び／又は教育サーバ１１６から、台本１３４、講義ビデオメタデータ１２８、学習講座メタデータ１３２、又はこれらの内の組み合わせを受信し及び／又はアクセスするように構成され得る。通信モジュール２０２は、講義ビデオメタデータ１２８及び学習講座メタデータ１３２を、発見モジュール２０６と通信し得る。通信モジュール２０２は、台本１３４を、分割モジュール２１０と通信し得る。

発見モジュール２０６は、１つ又は複数の候補学習講座を見出すように構成され得る。
候補学習講座は、ビデオ１２６と関連する１つ又は複数の学習講座１３６を含み得る。発見モジュール２０６は、講義ビデオメタデータ１２８と学習講座メタデータ１３２との間の類似度に関連性の基礎をおき得る。ある実施形態では、発見モジュール２０６は、計算モジュール２１４、判断モジュール２１６、割り当てモジュール２０８及び選択モジュール２１８と連携し、１つ又は複数の候補学習講座を見出し得る。

例えば、計算モジュール２１４は、１つ又は複数の学習講座１３６に対するマッチスコア（ｍａｔｃｈｓｃｏｒｅ：一致点数）を計算するように構成され得る。計算モジュール２１４は、講義ビデオメタデータ１２８と学習講座メタデータ１３２とに基づいて、マッチスコアを計算し得る。ある実施形態では、計算モジュール２１４は、文書の類似度、所定のメタデータの有効性、所定の複数のメタデータ間の一致に基づいて測定された類似度を計算し得る。測定された類似度及び／又はマッチスコアに含まれる文書の類似度は、ある実施形態では、ＶＳＭに基づき得る。

割り当てモジュール２０８は、メタデータのカテゴリ及び／又は重要語句に重みを割り当てるように構成され得る。例えば、割り当てモジュール２０８は、それぞれのメタデータのカテゴリに重みを割り当て得る。重みは、それぞれのメタデータのカテゴリの相対的な重要度を反映し得る。割り当てモジュール２０８は、それぞれのメタデータのカテゴリの重みを、計算モジュール２１４に通信する。１つ又は複数の学習講座１３６のマッチスコアを計算するために、計算モジュール２１４は、割り当てられた重みと計算されたスコアとの積の和（例えば、線形結合）を求め得る。計算モジュール２１４は、マッチスコアを判断モジュール２１６に通信し得る。

判断モジュール２１６は、それぞれのマッチスコアが所定のマッチスコア閾値を超えるか否かを決定するように構成される。マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、判断モジュール２１６は、１つの学習講座１３６のマッチスコアが所定のマッチスコア閾値を超えていることを示す信号を選択モジュール２１８に通信し得る。マッチスコアが所定のマッチスコア閾値よりも下である結果に応えて、判断モジュール２１６は、１つの学習講座１３６のマッチスコアが所定のマッチスコア閾値よりも下であることを示す信号を選択モジュール２１８に通信し得る。

判断モジュール２１６は、マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、その学習講座１３６を候補学習講座として選択し、マッチスコアが所定のマッチスコア閾値よりも下である結果に応えて、その学習講座１３６を候補学習講座として選択しないように構成され得る。

候補学習講座は、抽出モジュール２１２に通信され得る。抽出モジュール２１２は、１つ又は複数の候補学習講座の学習教材１３０から重要トピックス及び重要概念の重要語句を抽出するように構成され得る。ある実施形態では、抽出モジュール２１２は、通信モジュール２０２、検出モジュール２２８、判断モジュール２１６及び指定モジュール２３０と協力して重要語句を抽出し得る。

通信モジュール２０２は、１つ又は複数の候補学習講座の学習教材１３０にアクセスし、学習教材１３０を、検出モジュール２２８及び抽出モジュール２１２に通信し得る。検出モジュール２２８は、テキスト形式の解析に基づいて、学習教材１３０内の語句の位置を検出するように構成され得る。また、抽出モジュール２１２は、一般化接尾辞木を用いて、繰り返される語句を抽出し得る。語句は、抽出モジュール２１２及び検出モジュール２２８から判断モジュール２１６に通信され得る。

判断モジュール２１６は、語句の１つ又は複数の特徴を決定し、特徴を示している信号を、指定モジュール２３０に通信するように構成され得る。判断モジュール２１６からの信号に基づいて、指定モジュール２３０は、語句を重要語句として指定するか、又は、重要語句として指定しないだろう。

例えば、判断モジュール２１６は、語句がシラバス又は講義ノートのタイトルにあらわれるか否かを判断する。語句がシラバス又は講義ノートのタイトルにあらわれる結果に応えて、指定モジュール２３０は、語句を重要語句として指定し得る。語句がシラバス又は講義ノートのタイトルにあらわれない結果に応えて、判断モジュール２１６は、語句がセクションタイトル又はページタイトルにあらわれるか否かを決定し得る。語句がセクションタイトル又はページタイトルにあらわれる結果に応えて、指定モジュール２３０は、語句を重要語句として指定し得る。語句がセクションタイトル又はページタイトルにあらわれない結果に応えて、判断モジュール２１６は、語句が学習教材１３０内で所定の頻度閾値を超えてあらわれるか否かを決定し得る。
語句が学習教材１３０内で所定の頻度閾値を超えてあらわれない結果に応えて、指定モジュール２３０は、語句を重要語句として指定しないだろう。語句が学習教材１３０内で所定の頻度閾値を超えてあらわれる結果に応えて、指定モジュール２３０は、語句を重要語句として指定し得る。また、ある実施形態では、抽出モジュール２１２は、重要語句内のストップワードを処理し、発見的規則を用いて、重要語句内の略語を抽出し及び／又は統一し得る。重要語句は、割り当てモジュール２０８に通信され得る。

割り当てモジュール２０８は、抽出された重要語句に重みを割り当てるように構成され得る。ある実施形態では、割り当てモジュール２０８は、学習教材１３０内の抽出された重要語句の位置、抽出された重要語句が学習教材１３０内にあらわれる頻度、重要語句があらわれる見出された候補学習講座１３６、又はこれらの内のいくつかの組み合わせに基づいて、抽出された重要語句に重みを割り当て得る。割り当てられた重み及び抽出された重要語句は、解析モジュール２３２及び分割モジュール２１０に通信され得る。

ある実施形態では、解析モジュール２３２は、重要語句の出現する位置を解析するように構成され得る。また、抽出された重要語句及び抽出された重要語句に割り当てられた重みに基づいて、解析モジュール２３２は、候補学習講座内の重要トピックス及び重要概念の階層を生成し得る。

また、ある実施形態では、修正モジュール２３６は、台本１３４を修正するように構成され得る。例えば、判断モジュール２１６は、台本１３４が自動音声認識によって生成されたか否かを判断し得る。台本１３４が自動音声認識によって生成されている結果に応えて、修正モジュール２３６は、台本１３４を修正し得る。修正は、抽出された重要語句及び割り当てられた重みに基づき得る。

分割モジュール２１０は、ビデオ１２６を２以上の特定トピックス部分に分割するように構成され得る。分割モジュール２１０は、台本１３４内に生成された複数のトピックスセグメントと、２以上のトピックスセグメント内の抽出された重要語句の存在とに基づいて、及び／又は抽出された重要語句に割り当てられた重みに基づいて、ビデオ１２６を分割し得る。２以上の特定トピックス部分は、通常、台本１３４のトピックスセグメントに対応し得る。

ある実施形態では、分割モジュール２１０は、更新モジュール２３４、構成モジュール２４４、計算モジュール２１４、及び生成モジュール２４６と協力して、ビデオ１２６を分割し得る。例えば、更新モジュール２３４は、抽出された重要語句及び割り当てられた重みを用いて、台本１３４のトークン化を更新するように構成され得る。構成モジュール２４４は、スライドするウィンドウの修正されたベクトル表示を構成し得る。スライドするウィンドウは、修正されたベクトル表示に基づいて、台本１３４内を段階的に他のウィンドウに動いて、トピックスセグメントの境界を見つける。

計算モジュール２１４は、スライドするウィンドウ間の類似度を計算し得る。検出モジュール２２８は、台本１３４内に含まれる計算された文書（ｔｅｘｔ：文字列）の類似度における変化により反映されるトピックスの変化に対応し得るトピックスセグメントの境界を検出し得る。そして、生成モジュール２４６は、２つのトピックスセグメントの境界の間の台本１３４の部分を含むトピックスセグメントを生成し得る。

ある実施形態では、誘導モジュール２４２は、トピックスセグメント内に存在する抽出された重要語句に基づいて、１つ又は複数の特定トピックス部分に対するラベルを誘導するように構成され得る。例えば、誘導モジュール２４２は、通信モジュール２０２、分割モジュール２４８、構成モジュール２４４、更新モジュール２３４、選択モジュール２１８、及び判断モジュール２１６と協力して、ビデオ１２６の特定トピックス部分に対するラベルを誘導し得る。例えば、通信モジュール２０２は、トピックスセグメントの境界、抽出された重要語句及び割り当てられた重みを受け取るように構成され得る。検出されたトピックスセグメントの境界に基づいて、分割モジュール２４８は、台本１３４を複数の下位文書に分割するように構成され得る。そして、構成モジュール２４４は、複数の下位文書のそれぞれに対して、修正されたベクトル表示を再構成し得る。そして、更新モジュール２３４は、ＴＦ−ＩＤＦ法に基づいて、複数の下位文書のそれぞれにおける重要語句の割り当てられた重みを更新し得る。選択モジュール２１８は、複数の下位文書のそれぞれに対する更新された割り当てられた重みに基づいて候補ラベルを選択し、その候補ラベルを判断モジュール２１６に通信し得る。

判断モジュール２１６は、それぞれの候補ラベルが、抽出された重要語句の内の１つであるか否かを決定するように構成され得る。そして、判断モジュール２１６は、それぞれの候補ラベルが、抽出された重要語句の内の１つであるか否かを示す信号を、選択モジュール２１８に通信し得る。候補ラベルが抽出された重要語句の内の１つである結果に応えて、選択モジュール２１８は、候補ラベルを、下位文書に対するラベルとして選択し得る。候補ラベルが抽出された重要語句の内の１つでない結果に応えて、選択モジュール２１８は、下位文書をトピックスではないと特定し得る。

ある実施形態では、誘導モジュール２４２は、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係を確認するように構成され得る。ラベル間の階層的関係に基づいて、誘導モジュール２４２は、１つ又は複数の下位文書のラベルを結合するか、又は１つ又は複数の下位文書のラベルを分割し得る。

また、ある実施形態では、分割モジュール２１０は、キーワード検索と、ビデオ１２６の１つ又は複数の部分とを関連づけ得る。キーワード検索は、本明細書において説明するように検出される、台本１３４内の語句の存在に基づき得る。

図３は、図１の動作環境１００に含まれ得る例示の講義ビデオメタデータ１２８を示す。
具体的には、図３は、例示のビデオの第１のスクリーンショット３００と、ビデオのリストの第２のスクリーンショット３０２とを含む。第１のスクリーンショット３００では、講義ビデオメタデータ１２８の例は、例えば、ビデオタイトル３０４、機関３０６、日付け３０８、教授３１２、講義番号３１０及び説明３１４が見える。また、第１のスクリーンショット３００は、第２のスクリーンショット３０２に示されるビデオのリストと関連付けられ得る講座タイトル３１６を含み得る。ビデオタイトル３０４は、また、ビデオのリスト内の他のビデオと共に、第２のスクリーンショット３０２にもあらわれる。

図４は、図１の動作環境１００に含まれ得る例示の学習講座メタデータ１３２を示す。学習講座メタデータ１３２は、例えば、シラバス４０６及び講座のウェブページ４０２内に見つけられる。学習講座メタデータ１３２は、講座タイトル４０４、日付け４０８、説明４１０、講座番号４１２、機関４１４、１つ又は複数の主なトピックス４１６及び１つ又は複数の下位トピックス４１８を含み得る。図４では、全ての下位トピックス４１８はラベル付けされていない。

図１、３及び４を組み合わせて参照して、ビデオ解析モジュール１１０は、講義ビデオメタデータ１２８及び学習講座メタデータ１３２に基づいて、１つ又は複数の学習講座１３６に対するマッチスコアを計算するように構成され得る。マッチスコアを計算することは、１つ又は複数のメタデータのカテゴリにおいて、所定のメタデータの文書の類似度を含み得る測定された類似度、所定のメタデータの有効性、及び所定の複数のメタデータ間の一致を計算することを含み得る。例えば、メタデータのカテゴリは、他にもあるが加えて、講座番号のカテゴリ、タイトルのカテゴリ、機関のカテゴリ及び日付けのカテゴリを含み得る。従って、ビデオ解析モジュール１１０は、図３の講座番号３１０と、図４の講座番号４１２とを一致させ、図３のタイトル３０４と図４のタイトル４０４とを一致させ、図３の日付け３０８と図４の日付けとを一致させ得る。そして、ビデオ解析モジュール１１０は、線形結合を実行して、マッチスコアを計算し得る。

図５は、図１の動作環境１００の学習教材１３０から抽出され得る重要語句５００Ａ〜５００Ｅの例を示す。重要語句５００Ａ〜５００Ｅは、例えば講義ノート５０４内のスライド、講義ノートのリスト５０２及びシラバス５０６を含み得る学習教材１３０から抽出され得る。重要語句５００Ａ〜５００Ｅは、学習教材１３０内にあらわれる語句を含み得る。例えば、重要語句５００Ａは、講義ノート５０４のタイトルを含み得る。また、重要語句５００Ｂは、講義ノート５０４内の語又は語句を含み得る。また、重要語句５００Ｃは、講義ノートのリスト５０２内の講義のタイトルを含み得る。また、重要語句５００Ｄは、シラバス５０６内の語又は語句を含み得る。また、重要語句５００Ｅは、シラバス５０６のタイトルを含み得る。

図６は、図１の動作環境１０に実装され得る例示の台本１３４を示す。台本１３４は、複数の抽出された重要語句６０２を含み得る。重要語句６０２は、図５の重要語句５００Ａ〜５００Ｅと同様の重要語句の追加の例である。複数の抽出された重要語句６０２は、トピックスセグメントの境界６０６によって分離され得る１つ又は複数のトピックスセグメント６０４を特定するために使用され得る。複数の抽出された重要語句６０２は、また、それぞれのトピックスセグメント６０４のトピックスに対するラベルを誘導するために使用され得る。図６には示されていないけれども、台本１３４は、例えば、台本１３４の１つ又は複数の行のそれぞれに対して、又は別の方法では、対応するビデオの経過時間と関連づけられて、対応するビデオにおけるそれぞれのトピックスウインドウ６０４の開始時間及び／又は終了時間を特定することを許容するタイムスタンプを含み得る。

図７Ａ及び７Ｂは、図１の動作環境１００で提供され得る分割された形における例示のビデオ１２６のスクリーンショット７００Ａ及び７００Ｂ（一般に、スクリーンショット７００又は複数のスクリーンショット７００）を示す。第１のスクリーンショット７００Ａは、キーワード検索の問い合わせを受ける前の分割された形におけるビデオ１２６を示す。第２のスクリーンショット７００Ｂは、キーワード検索の結果に応えて、分割された形におけるビデオ１２６を示す。

図７Ａ及び７Ｂを組み合わせて参照して、スクリーンショット７００は、ビデオ１２６が表示又は再生され得るビデオ部分７０２を含み得る。スクリーンショット７００は、また、台本の部分７１４Ａ〜７１４Ｄが表示され得る台本部分７０４を含み得る。ビデオ部分７０２と台本部分７０４との間に、スクリーンショット７００は、経過時間バー７１６及びトピックス時間バー７１０を含み得る。経過時間バー７１６は、学習者１０２のような学習者が、ビデオ１２６を先送り又は巻き戻しすることを可能にする。ビデオ１２６を再生する時、アイコン７１８が、通常、経過時間バー７１６の長さと関連づけられたビデオの総時間である経過時間バー７１６に沿って進む。そして、ビデオ１２６の半分が再生された時、アイコン７１８は、経過時間バー７１６の長さのおよそ半分を横切る所に位置し得る。経過時間バー７１６は、ユーチューブ（登録商標）のようなビデオ再生アプリケーションに含まれ得る。

トピックス時間バー７１０は、２つ以上の断片７１２Ａ〜７１２Ｄに分けられ得る。断片７１２Ａ〜７１２Ｄは、ビデオ１２６が分割される特定トピックス部分に対応し得る。また、それぞれの断片７１２Ａ〜７１２Ｄの長さは、ビデオ１２６がそれぞれのトピックスを議論する間の経過時間バー７１６の部分に対応し得る。例えば、トピックス時間バー７１０における第１の断片７１２Ａは、第１の長さを有し且つ第１のトピックスに対応し得る。また、第１のトピックスは、トピックス時間バー７１０の第１の長さの間に対応する経過時間バー７１６の第１の長さの間、ビデオ１２６内で議論される。

本実施形態及び他の実施形態では、断片７１２Ａ〜７１２Ｄは、また、台本部分７０４に表示される台本の１つ又は複数の文書セグメント７１４〜７１４Ｄに対応し得る。例えば、第１断片７１２Ａは、台本の第１セグメント７１４Ａに対応し得る。台本の第１セグメント７１４Ａは、トピックスに対するラベル及び／又は台本１２６内で議論されるトピックスが変化する時間を含み得る。また、ある実施形態では、学習者は、断片７１２Ａ〜７１２Ｄを選択し得る。応えて、ラベルが、ドロップダウンウィンドウに示され得る。

また、スクリーンショット７００は、検索時間バー７０６及び検索フィールド７０８を含み得る。第１のスクリーンショット７００Ａでは、検索フィールド７０８は空であり、検索時間バー７０６は空であり得る。図７Ｂを参照して、第２のスクリーンショット７００Ｂは、キーワード問い合わせ後の例示の検索時間バー７０６を示す。本実施形態及び他の実施形態では、キーワード「ｔｕｔｏｒ」が検索フィールド７０８内に入力され得る。応えて、検索時間バー７０６は、１つ又は複数のキーワード表示ブロック７２０を含み得る。キーワード表示ブロック７２０は、キーワード（例えば「ｔｕｔｏｒ」）が議論されている間のビデオ１２６の部分を含み得る。ある実施形態では、トピックス時間バー７１０の部分及び／又は断片７１２Ａ〜７１２Ｄのセグメントを選択することによって、ビデオ１２６は、トピックスを議論しているビデオ１２６の部分に先送り又は巻き戻され得る。

スクリーンショット７００Ａ及び７００Ｂは、例示の実施形態を示す。ある実施形態では、台本部分７０４は、ビデオ部分７０２の横に位置づけられるか又は省略され得る。追加して又は代わりに、１つ又は複数の検索時間バー７０６、経過時間バー７１６、トピックス時間バー７１０、これらの内の組み合わせ、又は、検索時間バー７０６、経過時間バー７１６又はトピックス時間バー７１０に関して説明された機能は、結合されるか及び／又は省略され得る。

図８は、本明細書に説明する少なくとも１つの実施形態に従って用意された、講義ビデオのトピックスを特定する例示の方法８００のフロー図を示す。方法８００は、図２を参照して説明される計算装置２００によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法８００は、図１の装置１０４又はビデオ解析サーバ１０８によって、プログラム可能に実行され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、プロセッサによって実行可能又は方法８００の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体（例えば、図２のメモリ２２２）を含むか又は通信可能に接続され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、コンピュータ命令を実行して、方法８００の処理を生じさせるか又は制御するように構成されるプロセッサ（例えば、図２のプロセッサ２２４）を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。

方法８００は、ブロック８０２で開始して、講義ビデオメタデータ、学習講座メタデータ及び講義ビデオの台本が受け取られ得る。ある実施形態では、講義ビデオの台本は、講義ビデオの時間と関連付けられた講義ビデオの文字に書き写された文章を含み得る。
ブロック８０４では、講義ビデオと関連付けられた１つ又は複数の候補学習講座が見出され得る。ある実施形態では、１つ又は複数の候補学習講座が、講義ビデオメタデータと学習講座メタデータとの間の測定された類似度に基づいて、見出され得る。

ブロック８０６では、重要トピックス及び重要概念の重要語句が、１つ又は複数の候補学習講座の学習教材から抽出され得る。ブロック８０８では、抽出された重要語句に対して重みが割り当てられ得る。重みは、学習教材内の重要語句の位置と、抽出された重要語句が学習教材内にあらわれる頻度と、重要語句があらわれる見出された候補学習講座と、又はこれらの内のいくつかの組み合わせとに基づいて、割り当てられ得る。

ブロック８１０では、講義ビデオは、２つ以上の特定トピックス部分に分割され得る。ある実施形態では、講義ビデオは、講義ビデオの台本内に生成された２以上のトピックスセグメントと、２以上のトピックスセグメント内に含まれる重要語句と、抽出された重要語句に割り当てられた重みとに基づいて、２以上の特定トピックス部分に分割され得る。ブロック８１２では、２以上の特定トピックス部分に対して、ラベルが誘導され得る。ある実施形態では、ラベルは、２以上のトピックスセグメント内に存在する抽出された語句に基づいて、誘導され得る。ブロック８１４では、キーワード検索が、分割されたビデオに関連付けられ得る。

当業者は、本明細書に説明されるこの手順及び方法並びに他の手順及び方法に対して、処理及び方法で実行される機能は、他の順番で実装され得ることを認識するだろう。更に、概説されたステップ及び動作は、例として提供されるだけであり、開示された実施形態を損なうことなく、いくつかのステップ及び動作は、任意であり、より少ないステップ及び動作に結合されるか、又は、追加のステップ及び動作に拡張され得る。

図９は、本明細書に説明する少なくとも１つの実施形態に従って用意された、候補学習講座を見出す例示の方法９００のフロー図を示す。方法９００は、図２を参照して説明される計算装置２００によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法９００は、図１の装置１０４又はビデオ解析サーバ１０８によって、プログラム可能に実行され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、プロセッサによって実行可能又は方法９００の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体（例えば、図２のメモリ２２２）を含むか又は通信可能に接続され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、コンピュータ命令を実行して、方法９００の処理を生じさせるか又は制御するように構成されるプロセッサ（例えば、図２のプロセッサ２２４）を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。

方法９００は、１つ又は複数の学習講座に対するマッチスコアが計算され得るブロック９０２で開始し得る。ある実施形態では、マッチスコアは、講義ビデオメタデータ及び学習講座メタデータに基づき得る。例えば、マッチスコアを計算することは、１つ又は複数のメタデータのカテゴリに対する文書の類似度を計算すること、及び／又は、１つ又は複数のメタデータのカテゴリの一致度、それぞれのメタデータのカテゴリに重みを割り当てること、及び、割り当てられた重み及びマッチスコアの線形結合を実行することを含み得る。

ブロック９０４では、１つ又は複数の学習講座のそれぞれに対して、マッチスコアがマッチスコア閾値を超えるか否かを決定し得る。ブロック９０６では、マッチスコアが所定のマッチスコア閾値を超えている結果に応えて（９０４において「はい」）、学習講座は、候補学習講座として選択され得る。ブロック９０８では、マッチスコアが所定のマッチスコア閾値を超えていない結果に応えて（９０４において「いいえ」）、学習講座は、候補学習講座として選択されないだろう。

図１０は、本明細書に説明する少なくとも１つの実施形態に従って用意された、重要語句を抽出する例示の方法１０００のフロー図を示す。方法１０００は、図２を参照して説明される計算装置２００によって、ある実施形態では、プログラム可能に実行され得る。
追加して又は代わりに、方法１０００は、図１の装置１０４又はビデオ解析サーバ１０８によって、プログラム可能に実行され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、プロセッサによって実行可能又は方法１０００の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体（例えば、図２のメモリ２２２）を含むか又は通信可能に接続され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、コンピュータ命令を実行して、方法１０００の処理を生じさせるか又は制御するように構成されるプロセッサ（例えば、図２のプロセッサ２２４）を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。

方法１０００は、１つ又は複数の候補学習講座の学習教材がアクセスされ得るブロック１００２で開始し得る。ブロック１００４では、学習教材内の語句の位置が、テキスト形式の解析に基づいて、検出され得る。ブロック１００６では、一般化接尾辞木を用いて、繰り返される語句が抽出され得る。

ブロック１００８では、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれるか否かが決定され得る。ブロック１０１６では、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれている結果に応えて（ブロック１００８における「はい」）、繰り返される語句が重要語句として指定される。ブロック１０１０では、繰り返される語句がシラバス又は講義ノートのタイトルにあらわれない結果に応えて（ブロック１００８における「いいえ」）、繰り返される語句がセクションタイトル又はページタイトルにあらわれるか否かが決定され得る。ブロック１０１６では、繰り返される語句がセクションタイトル又はページタイトルにあらわれている結果に応えて（ブロック１０１０における「はい」）、繰り返される語句が重要語句として指定される。ブロック１０１２では、繰り返される語句がセクションタイトル又はページタイトルにあらわれない結果に応えて（ブロック１０１０における「いいえ」）、繰り返される語句が学習教材内で所定の頻度閾値を超えてあらわれるか否かが決定され得る。ブロック１０１６では、繰り返される語句が学習教材内で所定の頻度閾値を超えてあらわれている結果に応えて（ブロック１０１２における「はい」）、繰り返される語句が重要語句として指定される。ブロック１０１４では、繰り返される語句が学習教材内で所定の頻度閾値を超えてあらわれない結果に応えて（ブロック１０１２における「いいえ」）、繰り返される語句が重要語句として指定されないだろう。ブロック１０１８では、重要語句内のストップワードが処理され得る。ブロック１０２０では、発見的規則を用いて、略語が、抽出され及び／又は統一され得る。ブロック１０２２では、抽出された重要語句及び抽出された重要語句に割り当てられた重みに基づいて、重要語句の出現する位置が解析され、候補学習講座内の重要トピックス及び重要概念の階層が生成され得る。

図１１は、本明細書に説明する少なくとも１つの実施形態に従って用意された、講義ビデオを分割する例示の方法１１００のフロー図を示す。方法１１００は、図２を参照して説明される計算装置２００によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法１１００は、図１の装置１０４又はビデオ解析サーバ１０８によって、プログラム可能に実行され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、プロセッサによって実行可能又は方法１１００の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体（例えば、図２のメモリ２２２）を含むか又は通信可能に接続され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、コンピュータ命令を実行して、方法１１００の処理を生じさせるか又は制御するように構成されるプロセッサ（例えば、図２のプロセッサ２２４）を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。

方法１１００は、台本が受け取られるブロック１１０２で開始する。ブロック１１０４では、台本が自動音声認識によって生成されたか否かが判断され得る。ブロック１１０６では、台本が自動音声認識によって生成されている結果に応えて（ブロック１１０４における「はい」）、抽出された重要語句及び割り当てられた重みに基づいて台本が修正されて、方法１１００はブロック１１０２及び１１０４へ戻り得る。実質的に修正された、自動音声認識によって生成された台本は、自動音声認識によって生成されているとは考えられないので、方法１１００はブロック１１０８に進み得る。台本が最初から自動音声認識によって生成されていないか、又は、台本が最初は自動音声認識によって生成されており且つ実質的に修正されていれば、ブロック１１０８では、講義ビデオの台本が自動音声認識によって生成されていないという判断結果に応えて（ブロック１１０４における「いいえ」）、抽出された重要語句及び割り当てられた重みを用いて、台本のトークン化が更新され得る。

ブロック１１１０では、スライドするウィンドウの修正されたベクトル表示が構成され得る。ブロック１１１２では、複数のスライドするウィンドウ間の類似度が計算され得る。ブロック１１１４では、台本に含まれる１つ又は複数のトピックスに対応するトピックスセグメントの境界が検出され得る。ブロック１１１６では、２以上のトピックスセグメントが生成され得る。２以上のトピックスセグメントは、２つのトピックスセグメントの境界の間の講義ビデオの台本の一部を含み得る。

図１２は、本明細書に説明する少なくとも１つの実施形態に従って用意された、ラベルを誘導する例示の方法１２００のフロー図を示す。方法１２００は、図２を参照して説明される計算装置２００によって、ある実施形態では、プログラム可能に実行され得る。追加して又は代わりに、方法１２００は、図１の装置１０４又はビデオ解析サーバ１０８によって、プログラム可能に実行され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、プロセッサによって実行可能又は方法１２００の処理を生じさせるプログラムコード又は命令が内部に記憶されるか又はコード化されている非一時的なコンピュータ可読媒体（例えば、図２のメモリ２２２）を含むか又は通信可能に接続され得る。装置１０４、ビデオ解析サーバ１０８及び計算装置２００は、コンピュータ命令を実行して、方法１２００の処理を生じさせるか又は制御するように構成されるプロセッサ（例えば、図２のプロセッサ２２４）を含み得る。離散的なブロックとして示さているけれども、各ブロックは、所望の実装に依存して、追加の複数のブロックに分割されたり、より少数のブロックに結合されたり、又は省略され得る。

方法１２００は、トピックスセグメントの境界、抽出された重要語句及び割り当てられた重みを受け取り得る、ブロック１２０２で開始し得る。ブロック１２０４では、講義ビデオの台本は、複数の下位文書に分割され得る。例えば、講義ビデオの台本は、トピックスセグメントの境界に基づいて、分割され得る。ブロック１２０６では、複数の下位文書のそれぞれに対して、修正されたベクトル表示が再構成され得る。ブロック１２０８では、割り当てられた重みが更新され得る。例えば、ある実施形態では、ＴＦ−ＩＤＦ法に基づいて、複数の下位文書のそれぞれにおける割り当てられた重みが更新され得る。

ブロック１２１０では、候補ラベルが選択され得る。例えば、ある実施形態では、複数の下位文書のそれぞれに対する更新された割り当てられた重みに基づいて、候補ラベルが選択され得る。ブロック１２１２では、それぞれの候補ラベルが、抽出された重要語句の内の１つであるか否かが決定され得る。ブロック１２１４では、候補ラベルが抽出された重要語句の内の１つである結果に応えて（ブロック１２１２における「はい」）、候補ラベルが、下位文書に対するラベルとして選択され得る。ブロック１２１６では、候補ラベルが抽出された重要語句の内の１つでない結果に応えて、下位文書はトピックスではないと特定され得る。ブロック１２１８では、１つ又は複数の下位文書のラベルが結合され得る。例えば、ある実施形態では、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係に基づいて、ラベルが結合され得る。ブロック１２２０では、１つ又は複数の下位文書のラベルが分割され得る。例えば、ある実施形態では、複数の下位文書に対するラベルと複数の下位文書のそれぞれにあらわれる候補ラベルとの間の階層的関係に基づいて、ラベルが分割され得る。

後で更に詳しく論じられるように、ここに説明される実施形態は、様々なコンピュータ・ハードウェア又はソフトウェア・モジュールを含む特別な目的又は多目的なコンピュータの使用を含み得る。

ここに説明される実施形態は、内部に記憶されたコンピュータ実行可能な命令又はデータ構造を運ぶ又は有するコンピュータ可読媒体を用いて、実装され得る。そのようなコンピュータ可読媒体は、多目的又は特別な目的のコンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。例えば、制限されることなく、そのようなコンピュータ可読媒体は、コンピュータ実行可能な命令又はデータ構造の形で所望のプログラムコードを運ぶ又は記憶するために使用され、且つ多目的又は特別な目的のコンピュータによってアクセスされ得る、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ又は他の光ディスクメモリ、磁気ディスクメモリ又は他の磁気記憶装置、又は他の任意の記憶媒体を含む非一時的なコンピュータ可読媒体を有し得る。上記の組み合わせは、また、コンピュータ可読媒体の範囲内に含まれ得る。

コンピュータ実行可能な命令は、例えば、多目的コンピュータ、特別な目的のコンピュータ、又は特別な目的の処理装置が、所定の機能又は機能の群を実行させる命令及びデータを有する。主題は、特有の言語において構造的な特徴及び／又は方法論的な行為に対して説明されているが、添付の請求項において定義される主題は、上述された特別な特徴又は行為に制限される必要のないことを理解されたい。むしろ、上述された特別な特徴及び行為は、請求項を実装する例示の形として開示される。

本明細書では、「モジュール」又は「構成要素（コンポーネント）」という用語は、コンピュータシステム上で実行するソフトウェアオブジェクト又はルーチンに言及し得る。本明細書で説明される異なる構成要素、モジュール、エンジン及びサービスは、コンピュータシステム上で実行するオブジェクト又は処理（例えば、分離したスレッドとして）として実装され得る。本明細書で説明されるシステム及び方法は、ソフトウェアで実装されることが好ましいが、ハードウェア、又はソフトウェア及びハードウェアの組み合わせにおける実装も可能であり且つ考慮される。本明細書の記載では、「コンピューティングエンティティ（計算実体）」は、上述したように本明細書で定義されるように任意の計算システム、又は任意のモジュール、又はコンピュータシステム上で動作するモジュールの組み合わせであり得る。

ここで述べられた全ての例及び条件付きの言葉は、読者が、発明者によって寄与された発明及び概念を技術を深めて理解することを助けるための教育的な目的を意図しており、そのような具体的に述べられた例及び条件に限定されることなく解釈されるべきである。本発明の実施形態は詳細に説明されているが、その様々な変更、置き換え又は修正が本発明の精神及び範囲を逸脱しない限り行われ得ることが理解されるべきである。

Claims

講義ビデオのメタデータと、学習講座のメタデータと、講義ビデオが文字に書き写された文章を有する講義ビデオの台本とを受信することと、
前記講義ビデオのメタデータと前記学習講座のメタデータとの間の測定された類似度に基づいて、前記講義ビデオに関係する１つ又は複数の候補学習講座を見出すことであって、１つ又は複数の前記学習講座のそれぞれに対して、前記講義ビデオのメタデータ及び前記学習講座のメタデータの１つ又は複数のメタデータのカテゴリに基づいて、マッチスコアを計算することと、前記マッチスコアが所定のマッチスコア閾値を超えるか否かを決定することと、前記マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、前記学習講座を、候補学習講座として選択することと、
１つ又は複数の前記候補学習講座の学習教材から重要語句を抽出することと、
前記学習教材内の抽出された前記重要語句の位置と、抽出された前記重要語句が前記学習教材内にあらわれる頻度と、前記重要語句があらわれる見出された前記候補学習講座とに基づいて、抽出された前記重要語句に重みを割り当てることと、
前記講義ビデオの台本内に生成された２以上のトピックスセグメントと、２以上の前記トピックスセグメント内の抽出された前記重要語句の存在と、抽出された前記重要語句に割り当てられた前記重みとに基づいて、前記講義ビデオを２以上の特定トピックス部分に分割することと、
を備える講義ビデオのトピックスを特定する方法。
前記抽出することは、
１つ又は複数の前記候補学習講座の前記学習教材にアクセスすることと、
テキスト形式の解析に基づいて、前記学習教材内の語句の位置を検出することと、
一般化接尾辞木を用いて、繰り返される語句を抽出することと、
前記繰り返される語句がシラバス又は講義ノートのタイトルにあらわれること、又は、前記繰り返される語句がセクションタイトル又はページタイトルにあらわれること、又は、前記繰り返される語句が前記学習教材内で所定の頻度閾値を超えてあらわれることの内の少なくとも１つの結果に応えて、前記繰り返される語句を前記重要語句として指定することと、
前記重要語句内のストップワードを処理することと、
発見的規則を用いて、前記重要語句から略語を抽出して統一することと、
を備える請求項１に記載の方法。
前記抽出することは、抽出された前記重要語句及び抽出された前記重要語句に割り当てられた重みに基づいて、前記重要語句内の出現する位置を解析し、前記候補学習講座内の重要トピックス及び重要概念の階層を生成すること、を備える請求項１に記載の方法。
更に、
前記講義ビデオの台本を受信することと、
前記講義ビデオの台本が自動音声認識により生成されたか否かを判断することと、
前記講義ビデオの台本が自動音声認識により生成されている結果に応えて、抽出された前記重要語句及び割り当てられた前記重みに基づいて、前記講義ビデオの台本を修正することと、
前記講義ビデオの台本が自動音声認識により生成されていない結果に応えて、抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
を備える請求項１に記載の方法。
前記分割することは、
抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
複数のスライドするウィンドウの修正されたベクトル表示を構成することと、
前記複数のスライドするウィンドウ間の類似度を計算することと、
前記講義ビデオの台本に含まれる１つ又は複数のトピックスに対応する前記トピックスセグメントの境界を検出することと、
２つのトピックスウインドウの境界の間に、前記講義ビデオの台本の一部を含む２以上の前記トピックスセグメントを生成することと、
を備える請求項１に記載の方法。
更に、２以上の前記トピックスセグメント内に存在する抽出された前記重要語句に基づいて、２以上の前記特定トピックス部分に対してラベルを誘導すること、
を備える請求項１に記載の方法。
前記誘導することは、更に、
前記トピックスセグメントの境界と、抽出された前記重要語句と、割り当てられた前記重みとを受信することと、
トピックスインドウの境界に基づいて、前記講義ビデオの台本を複数の下位文書に分割することと、
複数の前記下位文書のそれぞれに対して、修正されたベクトル表示を再構成することと、
複数の前記下位文書のそれぞれにおいて、語出現頻度−文書出現頻度の逆数法（ＴＦ−ＩＤＦ法）に基づいて、割り当てられた前記重みを更新することと、
複数の前記下位文書のそれぞれに対する更新された割り当てられた前記重みに基づいて、候補ラベルを選択することと、
それぞれの前記候補ラベルが、抽出された前記重要語句の内の１つであるか否かを決定することと、
前記候補ラベルが抽出された前記重要語句の内の１つである結果に応えて、前記候補ラベルを、前記下位文書に対するラベルとして選択することと、
前記候補ラベルが抽出された前記重要語句の内の１つでない結果に応えて、前記下位文書をトピックスではないと特定することと、
を備える請求項６に記載の方法。
更に、
複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、１つ又は複数の前記下位文書の前記ラベルを結合することか、
又は、
複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、１つ又は複数の前記下位文書の前記ラベルを分割すること、
を備える請求項７に記載の方法。
更に、
キーワード検索と、分割された前記講義ビデオとを関連づけること、
を備える請求項１に記載の方法。
講義ビデオのメタデータと、学習講座のメタデータと、講義ビデオが文字に書き写された文章を有する講義ビデオの台本とを受信することと、
前記講義ビデオのメタデータと前記学習講座のメタデータとの間の測定された類似度に基づいて、前記講義ビデオに関係する１つ又は複数の候補学習講座を見出すことであって、１つ又は複数の前記学習講座のそれぞれに対して、前記講義ビデオのメタデータ及び前記学習講座のメタデータの１つ又は複数のメタデータのカテゴリに基づいて、マッチスコアを計算することと、前記マッチスコアが所定のマッチスコア閾値を超えるか否かを決定することと、前記マッチスコアが所定のマッチスコア閾値を超えている結果に応えて、前記学習講座を、候補学習講座として選択する見出すことと、
１つ又は複数の前記候補学習講座の学習教材から重要語句を抽出することと、
前記学習教材内の抽出された前記重要語句の位置と、抽出された前記重要語句が前記学習教材内にあらわれる頻度と、前記重要語句があらわれる見出された前記候補学習講座とに基づいて、抽出された前記重要語句に重みを割り当てることと、
前記講義ビデオの台本内に生成された２以上のトピックスセグメントと、２以上の前記トピックスセグメント内の抽出された前記重要語句の存在と、抽出された前記重要語句に割り当てられた前記重みとに基づいて、前記講義ビデオを２以上の特定トピックス部分に分割することと、
を備える動作を実行するべく、プロセッサによって実行可能なプログラムコードが内部にコード化された非一時的なコンピュータ可読媒体。
前記抽出することは、
１つ又は複数の前記候補学習講座の前記学習教材にアクセスすることと、
テキスト形式の解析に基づいて、前記学習教材内の語句の位置を検出することと、
一般化接尾辞木を用いて、繰り返される語句を抽出することと、
前記繰り返される語句がシラバス又は講義ノートのタイトルにあらわれること、又は、前記繰り返される語句がセクションタイトル又はページタイトルにあらわれること、又は、前記繰り返される語句が前記学習教材内で所定の頻度閾値を超えてあらわれることの内の少なくとも１つの結果に応えて、前記繰り返される語句を前記重要語句として指定することと、
前記重要語句内のストップワードを処理することと、
発見的規則を用いて、前記重要語句から略語を抽出して統一することと、
を備える請求項１０に記載の非一時的なコンピュータ可読媒体。
前記抽出することは、
抽出された前記重要語句及び抽出された前記重要語句に割り当てられた重みに基づいて、前記重要語句の出現する位置を解析し、前記候補学習講座内の重要トピックス及び重要概念の階層を生成すること、を備える請求項１０に記載の非一時的なコンピュータ可読媒体。
前記動作は、更に、
前記講義ビデオの台本を受信することと、
前記講義ビデオの台本が自動音声認識により生成されたか否かを判断することと、
前記講義ビデオの台本が自動音声認識により生成されている結果に応えて、抽出された前記重要語句及び割り当てられた前記重みに基づいて、前記講義ビデオの台本を修正することと、
前記講義ビデオの台本が自動音声認識により生成されていない結果に応えて、抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
を備える請求項１０に記載の非一時的なコンピュータ可読媒体。
前記分割することは、
抽出された前記重要語句及び割り当てられた前記重みを用いて、前記講義ビデオの台本のトークン化を更新することと、
複数のスライドするウィンドウの修正されたベクトル表示を構成することと、
前記複数のスライドするウィンドウ間の類似度を計算することと、
前記講義ビデオの台本に含まれる１つ又は複数のトピックスに対応する前記トピックスセグメントの境界を検出することと、
２つのトピックスウインドウの境界の間に、前記講義ビデオの台本の一部を含む２以上の前記トピックスセグメントを生成することと、
を備える請求項１０に記載の非一時的なコンピュータ可読媒体。
前記動作は、更に、
２以上の前記トピックスセグメント内に存在する抽出された前記重要語句に基づいて、２以上の前記特定トピックス部分に対してラベルを誘導すること、を備える請求項１０に記載の非一時的なコンピュータ可読媒体。
前記誘導することは、更に、
前記トピックスセグメントの境界と、抽出された前記重要語句と、割り当てられた前記重みとを受信することと、
トピックスインドウの境界に基づいて、前記講義ビデオの台本を複数の下位文書に分割することと、
複数の前記下位文書のそれぞれに対して、修正されたベクトル表示を再構成することと、
複数の前記下位文書のそれぞれにおいて、語出現頻度−文書出現頻度の逆数法（ＴＦ−ＩＤＦ法）に基づいて、割り当てられた前記重みを更新することと、
複数の前記下位文書のそれぞれに対する更新された割り当てられた前記重みに基づいて、候補ラベルを選択することと、
それぞれの前記候補ラベルが、抽出された前記重要語句の内の１つであるか否かを決定することと、
前記候補ラベルが抽出された前記重要語句の内の１つである結果に応えて、前記候補ラベルを、前記下位文書に対するラベルとして選択することと、
前記候補ラベルが抽出された前記重要語句の内の１つでない結果に応えて、前記下位文書をトピックスではないと特定することと、
を備える請求項１５に記載の非一時的なコンピュータ可読媒体。
前記動作は、更に、
複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、１つ又は複数の前記下位文書の前記ラベルを結合することか、
又は、
複数の前記下位文書に対する前記ラベルと複数の前記下位文書のそれぞれにあらわれる前記候補ラベルとの間の階層的関係に基づいて、１つ又は複数の前記下位文書の前記ラベルを分割すること、
を備える請求項１６に記載の非一時的なコンピュータ可読媒体。
前記動作は、更に、
キーワード検索と、分割された前記講義ビデオとを関連づけること、
を備える請求項１０に記載の非一時的なコンピュータ可読媒体。