JP2021132281A - メタデータ生成システムおよびメタデータ生成方法 - Google Patents
メタデータ生成システムおよびメタデータ生成方法 Download PDFInfo
- Publication number
- JP2021132281A JP2021132281A JP2020026201A JP2020026201A JP2021132281A JP 2021132281 A JP2021132281 A JP 2021132281A JP 2020026201 A JP2020026201 A JP 2020026201A JP 2020026201 A JP2020026201 A JP 2020026201A JP 2021132281 A JP2021132281 A JP 2021132281A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- content
- metadata
- image element
- change determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
ここで「ベル音」とは、当該番組の中の各コーナ、テーマ等の改変の際に発せられる報知音をいう。
図1に示すように一実施形態のメタデータ生成システム100は、画像認識部110と、画像要素変化判別部120と、音声認識部130と、音声変化判別部140と、パート間区切り判別部150と、メタデータ生成部160と、を有する。このメタデータ生成システム100は、コンピュータに、本発明に係るシステム及び方法を実現するためのプログラムをインストールし実行することにより実現される。メタデータ生成システム100には、大容量記憶装置10及びコンテンツ提供装置20が接続されている。
例えば、フレームレートが60fpsであれば、フレーム画面が60回以下の所定回数切り替わる周期に設定される。
図2に示すようにメタデータ生成システム100は、画像認識ステップS1と、画像要素変化判別ステップS2と、音声認識ステップS3と、音声変化判別ステップS4と、パート間区切り判別ステップS5と、メタデータ生成ステップS6と、を実行する。
上記のように、一実施形態のメタデータ生成システム100によれば、放送コンテンツに含まれるコンテンツ映像から、当該コンテンツ映像を構成するコンテンツ画面内の画像要素を画像認識部110により認識し、画像要素の時間的変化を画像要素変化判別部120により判別するとともに、放送コンテンツに含まれるコンテンツ音声を音声認識部130により認識し、コンテンツ音声の変化を音声変化判別部140により判別する。そして、画像要素変化判別部120による画像要素変化判別結果と音声変化判別部140による音声変化判別結果とに基づいて、パート間区切り判別部150により、パート間の区切りを判別し、メタデータ生成部160によりパート毎のメタデータを自動生成する。
110 画像認識部
120 画像要素変化判別部
130 音声認識部
140 音声変化判別部
150 パート間区切り判別部
160 メタデータ生成部
151 第一判別機能部
152 第二判別機能部
153 第三判別機能部
154 総合評価部
S1 画像認識ステップ
S2 画像要素変化判別ステップ
S3 音声認識ステップ
S4 音声変化判別ステップ
S5 パート間区切り判別ステップ
S6 メタデータ生成ステップ
S51 第一判別機能ステップ
S52 第二判別機能ステップ
S53 第三判別機能ステップ
S54 総合評価ステップ
Claims (12)
- 映像と音声とからなる放送コンテンツのメタデータを自動生成するシステムであって、
放送コンテンツに含まれるコンテンツ映像から、当該コンテンツ映像を構成するコンテンツ画面内の画像要素を認識する画像認識部と、
前記画像認識部により認識された画像要素の時間的変化を判別する画像要素変化判別部と、
放送コンテンツに含まれるコンテンツ音声を認識する音声認識部と、
前記音声認識部により認識されたコンテンツ音声の変化を判別する音声変化判別部と、
前記画像要素変化判別部による画像要素変化判別結果と前記音声変化判別部による音声変化判別結果とに基づいて、一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別するパート間区切り判別部と、
前記パート毎のメタデータを自動生成するメタデータ生成部と、を有することを特徴とするメタデータ自動生成システム。 - 前記コンテンツ画面は、フレーム画面であり、
前記画像要素変化判別部は、フレーム画面が所定回数切り替わる毎に、切り替わりの前後のフレーム画面における画像要素が別の画像要素に変化したか否かを判別する、請求項1に記載のメタデータ自動生成システム。 - 前記画像要素は、文字、登場分物の顔、番組セット、背景の少なくともいずれかである、請求項1又は2に記載のメタデータ自動生成システム。
- 前記音声認識部は、前記コンテンツ音声に含まれる人物の声、楽音、効果音、環境音又はベル音のうちのいずれか一の音声を認識する、請求項1から3のいずれか一項に記載のメタデータ自動生成システム。
- 前記音声変化判別部は、前記コンテンツ音声が所定時間以上完全に無音になった否かを判別する、請求項1から4のいずれか一項に記載のメタデータ自動生成システム。
- 前記パート間区切り判別部は、
機械学習の結果得られた学習済みモデルを用いて前記一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別する第一判別機能と、
予め設定された知識情報に基づいて前記一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別する第二判別機能と、
前記知識情報によらず所定のアルゴリズムにより前記一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別する第三判別機能と、を有し、
前記第一判別機能、前記第二判別機能及び前記第三判別機能による判別結果の総合評価に基づいて、前記区切りを判別する、請求項1から5のいずれか一項に記載のメタデータ自動生成システム。 - 映像と音声とからなる放送コンテンツのメタデータを自動生成する方法であって、
放送コンテンツに含まれるコンテンツ映像から、当該コンテンツ映像を構成するコンテンツ画面内の画像要素を認識する画像認識ステップと、
前記画像認識ステップにより認識された画像要素の時間的変化を判別する画像要素変化判別ステップと、
放送コンテンツに含まれるコンテンツ音声を認識する音声認識ステップと、
前記音声認識ステップにより認識されたコンテンツ音声の変化を判別する音声変化判別ステップと、
前記画像要素変化判別ステップによる画像要素変化判別結果と前記音声変化判別ステップによる音声変化判別結果とに基づいて、一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別するパート間区切り判別ステップと、
前記パート毎のメタデータを自動生成するメタデータ生成ステップと、を有することを特徴とするメタデータ自動生成方法。 - 前記コンテンツ画面は、フレーム画面であり、
前記画像要素変化判別ステップは、フレーム画面が所定回数切り替わる毎に、切り替わりの前後のフレーム画面における画像要素が別の画像要素に変化したか否かを判別するステップである、請求項7に記載のメタデータ自動生成方法。 - 前記画像要素は、文字、登場分物の顔、番組セット、背景の少なくともいずれかである、請求項7又は8に記載のメタデータ自動生成方法。
- 前記音声認識ステップは、前記コンテンツ音声に含まれる人物の声、楽音、効果音、環境音又はベル音のうちのいずれか一の音声を認識する、請求項7から9のいずれか一項に記載のメタデータ自動生成方法。
- 前記音声変化判別ステップは、前記コンテンツ音声が所定時間以上完全に無音になったか否かを判別する、請求項7から10のいずれか一項に記載のメタデータ自動生成方法。
- 前記パート間区切り判別ステップは、
機械学習の結果得られた学習済みモデルを用いて前記一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別する第一判別機能ステップと、
予め設定された知識情報に基づいて前記一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別する第二判別機能ステップと、
前記知識情報によらず所定のアルゴリズムにより前記一つの放送コンテンツを構成している時系列的に互いに隣接するパートとパートとの間の区切りを判別する第三判別機能ステップと、を有し、
前記第一判別機能ステップ、前記第二判別機能ステップ及び前記第三判別機能ステップによる判別結果を総合評価して、前記区切りを判別する、請求項7から11のいずれか一項に記載のメタデータ自動生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020026201A JP2021132281A (ja) | 2020-02-19 | 2020-02-19 | メタデータ生成システムおよびメタデータ生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020026201A JP2021132281A (ja) | 2020-02-19 | 2020-02-19 | メタデータ生成システムおよびメタデータ生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021132281A true JP2021132281A (ja) | 2021-09-09 |
Family
ID=77551317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020026201A Pending JP2021132281A (ja) | 2020-02-19 | 2020-02-19 | メタデータ生成システムおよびメタデータ生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021132281A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023176997A1 (ko) * | 2022-03-17 | 2023-09-21 | 엘지전자 주식회사 | 디스플레이 장치 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009171624A (ja) * | 2002-04-12 | 2009-07-30 | Mitsubishi Electric Corp | メタデータ配信装置、メタデータ検索装置、メタデータ再生成条件設定装置、メタデータ再生成装置、メタデータ配信方法及びメタデータ再生成方法 |
JP2011024077A (ja) * | 2009-07-17 | 2011-02-03 | Mitsubishi Electric Corp | 映像音声記録再生装置および映像音声記録再生方法 |
JP2012142645A (ja) * | 2009-04-28 | 2012-07-26 | Mitsubishi Electric Corp | 映像音声再生装置、映像音声記録再生装置、映像音声編集装置、映像音声再生方法、映像音声記録再生方法、および映像音声編集方法 |
JP2014006912A (ja) * | 2009-01-20 | 2014-01-16 | Sony Corp | 情報処理装置、情報処理方法およびプログラム |
JP2017112448A (ja) * | 2015-12-15 | 2017-06-22 | 日本放送協会 | 映像シーン分割装置及び映像シーン分割プログラム |
JP2020009300A (ja) * | 2018-07-11 | 2020-01-16 | 株式会社東芝 | ラベル付与装置、ラベル付与方法およびプログラム |
-
2020
- 2020-02-19 JP JP2020026201A patent/JP2021132281A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009171624A (ja) * | 2002-04-12 | 2009-07-30 | Mitsubishi Electric Corp | メタデータ配信装置、メタデータ検索装置、メタデータ再生成条件設定装置、メタデータ再生成装置、メタデータ配信方法及びメタデータ再生成方法 |
JP2014006912A (ja) * | 2009-01-20 | 2014-01-16 | Sony Corp | 情報処理装置、情報処理方法およびプログラム |
JP2012142645A (ja) * | 2009-04-28 | 2012-07-26 | Mitsubishi Electric Corp | 映像音声再生装置、映像音声記録再生装置、映像音声編集装置、映像音声再生方法、映像音声記録再生方法、および映像音声編集方法 |
JP2011024077A (ja) * | 2009-07-17 | 2011-02-03 | Mitsubishi Electric Corp | 映像音声記録再生装置および映像音声記録再生方法 |
JP2017112448A (ja) * | 2015-12-15 | 2017-06-22 | 日本放送協会 | 映像シーン分割装置及び映像シーン分割プログラム |
JP2020009300A (ja) * | 2018-07-11 | 2020-01-16 | 株式会社東芝 | ラベル付与装置、ラベル付与方法およびプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023176997A1 (ko) * | 2022-03-17 | 2023-09-21 | 엘지전자 주식회사 | 디스플레이 장치 |
US11949942B2 (en) | 2022-03-17 | 2024-04-02 | Lg Electronics Inc. | Display device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107146612B (zh) | 语音引导方法、装置、智能设备及服务器 | |
KR102436734B1 (ko) | 비디오 재생 노드 위치 확정 방법, 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 | |
CA2924065C (en) | Content based video content segmentation | |
KR100707189B1 (ko) | 동영상의 광고 검출 장치 및 방법과 그 장치를 제어하는컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체 | |
EP1345360B1 (en) | Method and apparatus for controlling devices connected to home network | |
EP3796110A1 (en) | Method and apparatus for determining controlled object, and storage medium and electronic device | |
CN102342124A (zh) | 用于提供与广播节目相关的信息的装置和方法 | |
CN111258995B (zh) | 数据处理方法、装置、存储介质及设备 | |
CN111711855A (zh) | 视频生成方法及装置 | |
CN101444092A (zh) | 视频播放装置,视频播放方法,以及视频播放程序 | |
CN1581951A (zh) | 信息处理设备及其方法 | |
CN112632326B (zh) | 一种基于视频脚本语义识别的视频生产方法及装置 | |
CN112153397B (zh) | 视频处理方法、装置、服务器及存储介质 | |
CN105072465A (zh) | 一种视频播放控制方法及电子设备 | |
CN112423081B (zh) | 一种视频数据处理方法、装置、设备及可读存储介质 | |
CN113411674A (zh) | 视频的播放控制方法、装置、电子设备及存储介质 | |
CN114598933B (zh) | 一种视频内容处理方法、系统、终端及存储介质 | |
CN114466210B (zh) | 直播质量检测处理方法及其装置、设备、介质 | |
CN111930974A (zh) | 一种音视频类型的推荐方法、装置、设备及存储介质 | |
JP2021132281A (ja) | メタデータ生成システムおよびメタデータ生成方法 | |
GB2533913A (en) | A video signal caption system and method for advertising | |
KR102243275B1 (ko) | 오프라인 오브젝트에 관한 콘텐츠 자동 생성 방법, 장치 및 컴퓨터 판독가능 저장 매체 | |
CN112328152B (zh) | 媒体文件的播放控制方法、装置、电子设备及存储介质 | |
CN108922534A (zh) | 控制方法、装置、设备及存储介质 | |
CN112333554A (zh) | 多媒体数据的处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211203 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220328 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220525 |