JP2000067085A - 非コ―ド化情報のデ―タベ―ス化方式 - Google Patents

非コ―ド化情報のデ―タベ―ス化方式

Info

Publication number
JP2000067085A
JP2000067085A JP11208465A JP20846599A JP2000067085A JP 2000067085 A JP2000067085 A JP 2000067085A JP 11208465 A JP11208465 A JP 11208465A JP 20846599 A JP20846599 A JP 20846599A JP 2000067085 A JP2000067085 A JP 2000067085A
Authority
JP
Japan
Prior art keywords
keyword
information
moving image
database
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11208465A
Other languages
English (en)
Inventor
Yoshihide Nakao
好秀 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11208465A priority Critical patent/JP2000067085A/ja
Publication of JP2000067085A publication Critical patent/JP2000067085A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 動画像など文字コード化されていないために
特徴の抽出が困難な非コード化情報を自動的にデータベ
ース化して省力化を図る。 【解決手段】 動画像21を任意の一定時間またはシー
ンごとに分割することで分割動画像23を生成し、その
分割動画像23が伴っている音声に対して音声認識処理
24を施し、その分割動画像23の中に含まれている会
話や音声の内容を認識することで音声情報25を得、こ
の音声情報25に対して言語処理26を施すことにより
キーワード27を抽出し、出現頻度の高いキーワードほ
ど大きな点数を与える点数付けを行い、点数が基準点以
上の場合にはその該当するキーワードをその分割動画像
に付加してデータベース化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、図面や絵や動画像
などの文字コード化されない非コード化情報を対象とし
て、その情報のデータベース化を図ったり、高精度な検
索を可能にしたりする技術に関する。本発明の利用分野
としては、任意の言葉で検索できる図面,絵,動画像
などのデータベースシステム、マルチメディアシステ
ム、言葉で検索できる電子ファイルシステム、テレ
ビ画像の自動選択録画および検索システム、ビデオ録
画画像の分類および検索システム、インタラクティブ
ムービーなどがある。
【0002】
【従来の技術】従来、図面や画像などの非コード化情報
をデータベース化する場合、それぞれに対して単純に異
なった番号を付け、別途に対照表を用意して、データベ
ースを蓄積したり、そのデータベースを検索したりして
いた。あるいは、図面や画像などの非コード化情報を人
間が見て、その非コード化情報が表現している意味(内
容)に最も適切なキーワードや検索情報を付加して分類
し、データベースを蓄積したり、そのデータベースを検
索したりしていた。例えば画像ファイルシステムなどで
は入力したイメージ画像に対して、人間が表題や検索情
報を後から入力していた。いずれにしろ、人為的な判断
が必須となっていた。
【0003】
【発明が解決しようとする課題】図面や絵や動画像など
の非コード化情報は、その情報の特徴を単純に抽出する
ことがきわめてむずかしい。したがって、従来からそれ
らの非コード化情報を分類したり整理したりする場合、
機械的に番号を付け、別途に対照表を用意するか、ある
いは、人間がその非コード化情報を見て適当な表題や検
索情報を付加するなどしていた。これらは、その大部分
の作業が人為的なものであった。機械的に番号を付けた
場合は対照表を用意して検索しなければならず、検索作
業がきわめて大変であった。また、表題や検索情報を付
加する場合も、それらを付加する作業自体が大変なもの
であった。このようにデータベースの作成に多大な手間
がかかる上に、検索情報を人間が付けているために主観
が入り込んでしまい、客観的で的確なデータベース化が
むずかしいという問題を有していた。
【0004】本発明は、このような事情に鑑みて創案さ
れたものであって、動画像など文字コード化されていな
いために本来的にはそのものから特徴を抽出することが
きわめてむずかしい非コード化情報の中において、ある
いはそのような非コード化情報の周辺において、その非
コード化情報を説明するために付加されている音声の言
語情報に着目し、そのような言語情報を用いて動画像な
どの非コード化情報を自動的にデータベース化したり高
精度な検索が可能になるようにすることを目的とする。
換言すれば、従来においてそのデータベース化に莫大な
人手作業を必要とした非コード化情報のデータベース化
を自動化し、省力化を図ることを目的とする。また、従
来にあっては、分類やキーワード付けのなされていない
非コード化情報のデータベースの検索はむずかしいもの
であったが、その検索を容易化することも目的とする。
【0005】
【課題を解決するための手段】本発明に係る非コード化
情報のデータベース化方式は、その最大の特徴が、音声
を伴う動画像に対して任意の一定時間またはシーンごと
に分割動画像を得る分割処理と、その分割動画像が伴っ
ている音声に対してその中に含まれている音声の内容を
認識し、その音声内容から音声情報を取得する音声認識
処理と、その音声情報から複数のキーワードを抽出する
言語処理と、その抽出された各キーワードに対してその
出現頻度が高いものほど大きな点数を付与する点数付け
処理と、各キーワードに付与された点数が基準点に達し
ているか否かを判断する点数判別処理と、基準点以上の
点数を持つと判断されたキーワードに対してはそれに該
当する分割画像またはその分割画像に付随して音声が記
録されている部分に付加する付加処理と、を順次施すこ
とで、動画像のデータベースを作成することを特徴とし
ている。
【0006】これによって、本発明によれば、分割動画
像が伴っている音声情報から抽出したキーワードに対し
て点数を付与し、基準点以上のキーワードを分割動画像
に付加してデータベース化してあるから、分割動画像と
それを分類・検索するためのキーワードとの関連付けが
密接なものとなる。
【0007】
【発明の実施の形態】以下に、本発明に係る非コード化
情報のデータベース化方式の実施の形態に関して図面を
用いて説明する。
【0008】(第1実施例)この第1実施例は、文書中
にある図についてのデータベースの作成に関するもので
ある。図1は第1実施例に係る非コード化情報のデータ
ベース化方式の構成を示すブロック線図である。
【0009】非コード化情報である図を含む文書1を画
像データとしてスキャナ2で読み込み、文章情報と図の
情報とを電子化する。次に、これらに対して所要の画像
処理3を施すことにより、文章データ部分4と図データ
部分5とに分離する。図データ部分5が非コード化情報
に相当している。さらに、文章データ部分4と図データ
部分5に対して文字認識処理6を行い、文章データ部分
4中の文字および図データ部分5中の文字をそれぞれコ
ード化する。このコード化によって作成されたのが文字
情報7であるが、その文字情報7に対して言語処理8を
施すことによって複数のキーワード9を抽出する。これ
らのキーワード9は、元の文書1に対応している。
【0010】次いで、抽出した複数のキーワード9に対
して点数付け処理10を行う。この点数付け処理10に
ついては次のように行う。すなわち、図の辺の付近にお
いて他の文章とは離れており、しかも、図の辺と平行に
記載されている文章から抽出したキーワードに対しては
最も大きな点数を与える。図中にある文字から抽出した
キーワードには次に大きな点数を与える。図の周辺に存
在する文章から抽出したキーワードに対して次に大きな
点数を与えるが、この場合、図から位置的に近い順に大
きな点数を与える。さらに、出現頻度の高いキーワード
ほど大きな点数を与える。以上のようにして、さまざま
のキーワード9に対してそれぞれ独自の点数が付与され
ることになる。
【0011】次に、点数判別処理11により各キーワー
ド9に付与されている点数が基準点に達しているか否か
を判断し、基準点以上の点数をもつキーワード9をそれ
に該当する図データ部分5に対して付加する付加処理1
2を施すことによって図のデータベース13を作成す
る。
【0012】以上のようにして作成された図のデータベ
ース13を分類する場合には上記のキーワード9に従っ
て分類する。また、そのデータベース13を検索する場
合には、検索者が検索したい図に関連した言葉を入力
し、入力した言葉に合致するキーワード9またはそれに
近いキーワード9を付加されている図データ部分5を読
み出す。この検索の場合において、付与されている点数
が高いキーワード9から順に検索するのである。
【0013】(第2実施例)この第2実施例は、動画像
についてのデータベースの作成に関するものである。図
2は第2実施例に係る非コード化情報の検索方式の構成
を示すブロック線図である。
【0014】非コード化情報の顕著な例である音声を伴
う動画像21に対して分割処理22を施すことにより、
動画像21を任意の一定時間またはシーンごとに分割
し、分割動画像23を得る。次に、分割動画像23が伴
っている音声に対して音声認識処理24を施し、その分
割動画像23の中で話されている会話や音声の内容を認
識する。この音声認識処理24によって音声情報25が
得られるが、この音声情報25に対して言語処理26を
施すことによって複数のキーワード27を抽出する。こ
れらのキーワード27は、分割動画像23に対応してい
る。
【0015】次いで、抽出した複数のキーワード27に
対して点数付け処理28を施す。この点数付け処理28
は、出現頻度の高いキーワードほど大きな点数を与える
ものとする。これにより、各キーワード27に対してそ
れぞれ独自の点数が付与されることになる。
【0016】次に、点数判別処理29により各キーワー
ド27に付与されている点数が基準点に達しているか否
かを判断し、基準点以上の点数をもつキーワード27を
それに該当する分割動画像23またはその分割動画像2
3に付随して音声が記録されている部分に対して付加す
る付加処理30を施すことによって動画像のデータベー
ス31を作成する。
【0017】以上のようにして作成された動画像のデー
タベース31を分類する場合には上記のキーワード27
に従って分類する。また、そのデータベース31を検索
する場合には、検索者が検索したい動画像に関連した言
葉を入力し、入力した言葉に合致するキーワード27ま
たはそれに近いキーワード27を付加されている分割動
画像23を読み出す。この検索の場合において、付与さ
れている点数が高いキーワード27から順に検索するの
である。
【0018】以上説明した第1実施例および第2実施例
によれば、次の利点がある。
【0019】 データベースの作成を完全自動化する
ことにより大幅な省力化を図ることができる。
【0020】 キーワードの付加を自動的に行うた
め、人間の主観が入り込む余地がなく、キーワードのバ
ラツキのない均質で精度の高いデータベース化が可能と
なっている。
【0021】 キーワードの付加を自動的に負うた
め、人手作業の場合に比べて大幅な高速化を図ることが
できる。
【0022】 人間では分からないか判断しにくいよ
うな情報に対しても、客観的なキーワードを付加するこ
とができる。
【0023】 前後に存在する多くの言語情報を用い
ることにより、幅広いキーワードが付加でき、漏れのな
い分類や検索が可能になる。
【0024】(第3実施例)この第3実施例はマルチメ
ディアデータベースの検索に関するものである。具体的
には、CD−ROMのようにすでに作られており、読み
出しはできるが書き込みができないデータベースに示し
た有効な検索方式である。CD−ROM等に記録された
マルチメディアデータベースの中から特定の図面や画像
や動画像の一部を検索するシステムである。図3は第3
実施例に係る非コード化情報の検索方式の構成を示すブ
ロック線図である。
【0025】検索者41は自分が欲する情報に関連した
言葉や文章を自然言語42としてシステムに入力する。
システムは、入力された自然言語42に対して言語処理
43を施すことにより、その自然言語42の中から適切
な複数のキーワード44を自動的に抽出する。そして、
そのキーワード44を用いてまずCD−ROM等のマル
チメディアデータベース45の中のコード化された文字
情報45aを検索し、キーワード44と同一または同様
の意味もしくは近い意味の文字データを抽出する。
【0026】次に、システムは、抽出した文字データに
対して位置的に近い部位にある画像情報45bを近い順
に検索する。あるいは、抽出した文字データに対して時
間的に近い部位にある動画像を一定シーン切り出して抽
出する。切り出すシーンの長さは検索者41の指示によ
り任意に設定でき、また、抽出後も任意に変更できる。
この図面や画像や動画像の抽出においては、抽出されて
きたものとキーワード44とのマッチング処理46を行
い、一定の度合い以上にマッチングしておれば、画像サ
ーチ処理47を行って抽出すべき対象を絞り込んでい
き、最終的に画像抽出処理48により抽出対象を検索者
41に提供する。
【0027】検索者41は、以上の処理によって得られ
た情報が満足できないものであったり、あるいはさらに
詳細な情報を得たい場合には、システムに対して次のス
テップの指示をする。システムは、画像認識処理49に
よってデータベース45中の画像情報45bを分析し文
字認識によりイメージ状の文字を文字コードに変換す
る。また、音声認識処理50によってデータベース45
中の音声情報45cを分析し音声認識により音声を文字
コードに変換する。そして、この新たに生成された文字
コードの少なくともいずれか一方に基づいてデータベー
ス45を前記と同様に検索し、関連する文字データに対
して位置的もしくは時間的に近い部位にある画像情報4
5bや動画像の一部のシーンを抽出し、前述と同様の手
順を経て検索者41に提供する。
【0028】この第3実施例の検索方式によれば、CD
−ROMだけでなく、分類やキーワード付けのなされて
いないどのようなデータベースからでも検索者が必要と
する任意の非コード化情報を高速かつ的確に検索するこ
とができる。
【0029】(第4実施例)この第4実施例はインタラ
クティブムービーの作成および検索に係るものである。
図4はインタラクティブムービーのデータベースの概念
図、図5はキーワード画像対照表を示す図である。デー
タベース51は、画像データ記録部52とキーワード画
像対照表53とを有している。画像データ記録部52に
は、画像データ番号が割り当てられた複数の画像データ
52a,52b,……,52i,…が記録されている。
キーワード画像対照表53においては、キーワードと画
像データ番号との対応だけでなく、次に接続して行うべ
き抽出対象となるキーワードとの対応を付けたキーワー
ドリンクが確保されている。
【0030】この方式は第2実施例とよく似ている。ま
ず最初に、動画像情報とともに同時記録されている音声
情報の分析を行って、ナレーションや会話などの音声部
分を抽出し、音声認識処理によって文字コードに変換す
る。次いで、変換した文字コード列に言語処理を施して
キーワードを抽出する。次に、動画像情報に画像処理を
行い、画面内に文字情報の記録されている動画像を切り
出す。そして、1つの文字情報に関して、文字情報それ
ぞれについて最も鮮明に文字情報が記録されている画像
を1枚ずつ自動的に抽出する。今度は、その画像に対し
て文字認識処理を行い、画面内の文字を認識し文字コー
ドに変換する。次いで、上記と同様に変換した文字コー
ド列に言語処理を施してキーワードを抽出する。以上に
より、音声情報に基づいたキーワードと画像情報に基づ
いたキーワードとが抽出されたことになる。
【0031】動画像情報の中の音声および文字からキー
ワードを抽出した部位に対して検索用の識別信号を記録
し、データベース51において動画像情報の前部(また
は後部)に、キーワードと識別信号(画像データ番号)
との組み合わせよりなるキーワード画像対照表53を付
加する。
【0032】インタラクティブムービーを作成する場合
には、このようにして作成した1つまたは複数の動画像
情報を組み合わせて作成する。ユーザーは、そのときに
見たいストーリーや場面を自然言語で入力する。する
と、システムが言語処理を行ってキーワードを抽出し、
そのキーワードと同じまたは同様の意味もしくは近い意
味をもつキーワードをキーワード画像対照表53より選
択する。その結果、ユーザーが求める内容に最も近い動
画像情報が抽出され、その動画像情報の先頭または必要
部位からの再生が開始される。
【0033】このようにユーザーがインタラクティブに
自分の見たい内容の動画像情報を抽出することができ
る。さらに、ユーザーが複数のキーワードを順次に入力
することにより、複数の動画像を接続して任意のストー
リーのムービーを作ることができる。
【0034】また、動画像情報から抽出した複数のキー
ワード相互間に、キーワードリンクという多様な関連付
けを行うことにより複雑なインタラクティブムービーの
作成も可能となる。
【0035】
【発明の効果】本発明によれば、動画像のデータベース
化が自動的に行われるから、ほぼ全般的に人為的作業に
頼っていた従来方式に比べて大幅な省力化を図ることが
でき、また、高精度な検索も可能になった。
【図面の簡単な説明】
【図1】本発明の第1実施例に係る非コード化情報のデ
ータベース化方式の構成を示すブロック線図である。
【図2】本発明の第2実施例に係る非コード化情報のデ
ータベース化方式の構成を示すブロック線図である。
【図3】本発明の第3実施例に係る非コード化情報の検
索方式の構成を示すブロック線図である。
【図4】本発明の第4実施例に係るインタラクティブム
ービーのデータベースの概念図である。
【図5】本発明の第4実施例におけるキーワード画像対
照表を示す図である。
【符号の説明】
1 図を含む文書 2 スキャナ 3 画像処理 4 文章データ部分 5 図データ部分 6 文字認識処理 7 文字情報 8 言語処理 9 キーワード 10 点数付け処理 11 点数判別処理 12 付加処理 13 図のデータベース 21 動画像 22 分割処理 23 分割動画像 24 音声認識処理 25 音声情報 26 言語処理 27 キーワード 28 点数付け処理 29 点数判別処理 30 付加処理 31 動画像のデータベース 41 検索者 42 自然言語 43 言語処理 44 キーワード 45 マルチメディアデータベース 45a 文字情報 45b 画像情報 45c 音声情報 46 マッチング処理 47 画像サーチ処理 48 画像抽出処理 49 画像認識処理 50 音声認識処理 51 インタラクティブムービーデータベース 52 画像データ記録部 53 キーワード画像対照表

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声を伴う動画像に対して任意の一定時
    間またはシーンごとに分割動画像を得る分割処理と、そ
    の分割動画像が伴っている音声に対してその中に含まれ
    ている音声の内容を認識し、その音声内容から音声情報
    を取得する音声認識処理と、その音声情報から複数のキ
    ーワードを抽出する言語処理と、その抽出された各キー
    ワードに対してその出現頻度が高いものほど大きな点数
    を付与する点数付け処理と、各キーワードに付与された
    点数が基準点に達しているか否かを判断する点数判別処
    理と、基準点以上の点数を持つと判断されたキーワード
    に対してはそれに該当する分割画像またはその分割画像
    に付随して音声が記録されている部分に付加する付加処
    理と、を順次施すことで、動画像のデータベースを作成
    することを特徴とする非コード化情報のデータベース化
    方式。
JP11208465A 1999-07-23 1999-07-23 非コ―ド化情報のデ―タベ―ス化方式 Pending JP2000067085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11208465A JP2000067085A (ja) 1999-07-23 1999-07-23 非コ―ド化情報のデ―タベ―ス化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11208465A JP2000067085A (ja) 1999-07-23 1999-07-23 非コ―ド化情報のデ―タベ―ス化方式

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP9329841A Division JP2980085B2 (ja) 1988-04-28 1988-04-28 暗号化方法及び復号化方法

Publications (1)

Publication Number Publication Date
JP2000067085A true JP2000067085A (ja) 2000-03-03

Family

ID=16556642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11208465A Pending JP2000067085A (ja) 1999-07-23 1999-07-23 非コ―ド化情報のデ―タベ―ス化方式

Country Status (1)

Country Link
JP (1) JP2000067085A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007281618A (ja) * 2006-04-03 2007-10-25 Sony Corp 情報処理装置、情報処理方法、およびプログラム
WO2008015907A1 (fr) * 2006-08-03 2008-02-07 Nec Corporation Dispositif, procédé et programme d'exploration de texte
JP2008176748A (ja) * 2007-01-22 2008-07-31 Fujitsu Ltd 情報付与プログラム、情報付与装置、および情報付与方法
JP2008268985A (ja) * 2007-04-16 2008-11-06 Yahoo Japan Corp タグを付与する方法
JP2013239988A (ja) * 2012-05-17 2013-11-28 Software Factory:Kk 携帯端末、記録装置及びこれらを備えたライフレコーダ
CN111401218A (zh) * 2020-03-12 2020-07-10 高宽友 一种智慧城市监控方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007281618A (ja) * 2006-04-03 2007-10-25 Sony Corp 情報処理装置、情報処理方法、およびプログラム
WO2008015907A1 (fr) * 2006-08-03 2008-02-07 Nec Corporation Dispositif, procédé et programme d'exploration de texte
US8140337B2 (en) 2006-08-03 2012-03-20 Nec Corporation Apparatus, method and program for text mining
JP2008176748A (ja) * 2007-01-22 2008-07-31 Fujitsu Ltd 情報付与プログラム、情報付与装置、および情報付与方法
JP2008268985A (ja) * 2007-04-16 2008-11-06 Yahoo Japan Corp タグを付与する方法
JP2013239988A (ja) * 2012-05-17 2013-11-28 Software Factory:Kk 携帯端末、記録装置及びこれらを備えたライフレコーダ
CN111401218A (zh) * 2020-03-12 2020-07-10 高宽友 一种智慧城市监控方法及系统
CN111401218B (zh) * 2020-03-12 2023-05-26 上海虹点智能科技有限公司 一种智慧城市监控方法及系统

Similar Documents

Publication Publication Date Title
US5664227A (en) System and method for skimming digital audio/video data
US6580437B1 (en) System for organizing videos based on closed-caption information
US6363380B1 (en) Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser
JP4600828B2 (ja) 文書対応付け装置、および文書対応付け方法
KR101516995B1 (ko) 컨텍스트 기반 브이오디 검색 시스템 및 이를 이용한 브이오디 검색 방법
US7908141B2 (en) Extracting and utilizing metadata to improve accuracy in speech to text conversions
JP2004533756A (ja) 自動コンテンツ分析及びマルチメデイア・プレゼンテーションの表示
MXPA97002675A (en) System and method for examining digital audio / video data
CN101650958A (zh) 对电影类视频进行场景片段抽取方法及其建立索引的方法
JPH10507554A (ja) 探索できるディジタルビデオライブラリを作成する方法および装置ならびにそのようなライブラリを利用するシステムおよび方法
JP3023461B2 (ja) 非コード化情報のデータベース化装置
JP2010161722A (ja) データ処理装置、データ処理方法、及び、プログラム
US7349477B2 (en) Audio-assisted video segmentation and summarization
CN112784078A (zh) 一种基于语义识别的视频自动剪辑方法
CN116361510A (zh) 一种利用影视类作品和剧本建立剧本场景片段视频自动提取和检索的方法和装置
JP3938096B2 (ja) インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム
CN115272533A (zh) 一种基于视频结构化数据的智能图文转视频的方法及系统
JP2000067085A (ja) 非コ―ド化情報のデ―タベ―ス化方式
CN109376145A (zh) 影视对白数据库的建立方法、建立装置及存储介质
KR20030014804A (ko) 폐쇄자막 기반의 뉴스 비디오 데이터베이스 생성 장치 및방법과 그에 따른 내용기반 검색/탐색 방법
KR100348901B1 (ko) 오디오/영상물의 음향적 장면분할방법
JP2006195900A (ja) マルチメディアコンテンツ生成装置及び方法
JP3021252B2 (ja) データ検索方法及びデータ検索装置
KR100493635B1 (ko) 멀티미디어 데이터 검색 및 브라우징 시스템
US20060092327A1 (en) Story segmentation method for video