JP7345897B2 - データ保管装置、データ保管方法、及びデータ保管プログラム - Google Patents
データ保管装置、データ保管方法、及びデータ保管プログラム Download PDFInfo
- Publication number
- JP7345897B2 JP7345897B2 JP2021194193A JP2021194193A JP7345897B2 JP 7345897 B2 JP7345897 B2 JP 7345897B2 JP 2021194193 A JP2021194193 A JP 2021194193A JP 2021194193 A JP2021194193 A JP 2021194193A JP 7345897 B2 JP7345897 B2 JP 7345897B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- input data
- conversion
- unit
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013500 data storage Methods 0.000 title claims description 56
- 238000000034 method Methods 0.000 title claims description 40
- 238000006243 chemical reaction Methods 0.000 claims description 96
- 239000000284 extract Substances 0.000 claims description 6
- 238000012015 optical character recognition Methods 0.000 description 61
- 238000010586 diagram Methods 0.000 description 26
- 238000010801 machine learning Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
Description
図1は、本実施形態に係るデータ保管システムのシステム構成図である。データ保管システム1は、画像データ、音声データ、及び動画データ等の入力データ2をキーワード等のテキストで検索できるようにするためのシステムであって、端末装置3とデータ保管装置4とを備える。
次に、本実施形態に係るデータ保管方法について説明する。
入力データ2は画像データに限定されず、音声データや動画データであってもよい。
次に、本実施形態に係るデータ保管装置4のハードウェア構成について説明する。
Claims (11)
- 画像データ、音声データ、及び動画データのいずれかである複数の入力データを取得する取得部と、
前記入力データの特徴に基づいて、複数の前記入力データの各々を前記特徴ごとに複数のグループに分類する分類部と、
前記入力データの内容をテキストに変換する複数の変換プログラムであって、前記画像データに対しては文字認識処理を含み、前記音声データに対しては音声認識処理を含み、前記動画データに対しては画像認識処理を含む変換プログラムが前記グループごとに割り当てられており、複数の前記変換プログラムの各々を用いて前記入力データごとに前記内容を複数の前記テキストに変換する変換部と、
複数の前記テキストに基づいて、前記入力データの前記内容を示すタグ情報を生成する生成部と、
前記入力データを識別するデータ識別子と、当該入力データに係るタグ情報とを対応付けて記憶部に保管する保管処理部と、
を有することを特徴とするデータ保管装置。 - 請求項1に記載のデータ保管装置であって、
前記複数の変換プログラムの少なくとも一つは、前記入力データの前記内容に関する属性情報を抽出し、前記属性情報を前記テキストに変換することを特徴とするデータ保管装置。 - 請求項1又は請求項2に記載のデータ保管装置であって、
前記分類部は、前記音声データに含まれる発話の内容ごとに前記音声データを分類することを特徴とするデータ保管装置。 - 請求項1又は請求項2に記載のデータ保管装置であって、
前記分類部は、前記動画データが録画された時間帯ごとに当該動画データを分類することを特徴とするデータ保管装置。 - 請求項1又は請求項2に記載のデータ保管装置であって、
前記保管処理部は、前記入力データが前記画像データ、前記音声データ、及び前記動画データのうちのどれであるかを示すデータ種別と、前記データ識別子と、前記タグ情報とを対応付けて前記記憶部に保管することを特徴とするデータ保管装置。 - 請求項1~5のいずれか一項に記載のデータ保管装置であって、
前記生成部は、複数の前記テキストの各々に出現する文字列のうち、出現する頻度が最も高い文字列を前記タグ情報として出力することを特徴とするデータ保管装置。 - 請求項1~6のいずれか一項に記載のデータ保管装置であって、
複数の前記変換プログラムごとに、前記変換の精度の高さを示す重みが割り当てられており、
前記生成部は、一つの前記入力データから変換された複数の前記テキストの各々に相異なる文字列が出現した場合に、前記重みが最も大きい前記変換プログラムが変換した前記テキストに出現した前記文字列を、当該入力データに対応した前記タグ情報として生成することを特徴とするデータ保管装置。 - 請求項1~7のいずれか一項に記載のデータ保管装置であって、
前記分類部は、同一の前記特徴を有する複数の前記入力データを同一の前記グループに分類し、
前記変換部は、前記分類部が同一の前記特徴を有する複数の前記入力データを同一の前記グループに分類した後に、同一の前記グループに属する複数の前記入力データの各々の前記内容を前記テキストに変換することを特徴とするデータ保管装置。 - 請求項1~8のいずれか一項に記載のデータ保管装置であって、
前記グループは前記入力データの様式に対応しており、
前記分類部は、前記入力データの前記様式と前記特徴とを対応付けた特徴情報を参照することにより、前記様式に対応した前記グループに前記入力データを分類し、
前記変換部は、前記変換プログラムを識別するプログラム識別子と前記様式とを対応付けた変換情報を参照することにより、前記様式に対応した前記グループに複数の前記変換プログラムを割り当て、
複数の前記グループのいずれにも属さない新たな前記様式を前記入力データが有する場合に、前記新たな様式と当該入力データの前記特徴とを対応付けて前記特徴情報に格納する特徴情報格納部と、
新たな前記様式に対応した新たな複数の前記変換プログラムの各々の前記プログラム識別子を、新たな前記様式と対応付けて前記変換情報に格納する変換情報格納部とを更に有することを特徴とするデータ保管装置。 - コンピュータが、
画像データ、音声データ、及び動画データのいずれかである複数の入力データを取得するステップと、
前記入力データの特徴に基づいて、複数の前記入力データの各々を前記特徴ごとに複数のグループに分類するステップと、
前記入力データの内容をテキストに変換する複数の変換プログラムであって、前記画像データに対しては文字認識処理を含み、前記音声データに対しては音声認識処理を含み、前記動画データに対しては画像認識処理を含む変換プログラムが前記グループごとに割り当てられており、複数の前記変換プログラムの各々を用いて前記入力データごとに前記内容を複数の前記テキストに変換するステップと、
複数の前記テキストに基づいて、前記入力データの前記内容を示すタグ情報を生成するステップと、
前記入力データを識別する識別子と、当該入力データに係る前記タグ情報とを対応付けて記憶部に保管するステップと、
を実行することを特徴とするデータ保管方法。 - 画像データ、音声データ、及び動画データのいずれかである複数の入力データを取得するステップと、
前記入力データの特徴に基づいて、複数の前記入力データの各々を前記特徴ごとに複数のグループに分類するステップと、
前記入力データの内容をテキストに変換する複数の変換プログラムであって、前記画像データに対しては文字認識処理を含み、前記音声データに対しては音声認識処理を含み、前記動画データに対しては画像認識処理を含む変換プログラムが前記グループごとに割り当てられており、複数の前記変換プログラムの各々を用いて前記入力データごとに前記内容を複数の前記テキストに変換するステップと、
複数の前記テキストに基づいて、前記入力データの前記内容を示すタグ情報を生成するステップと、
前記入力データを識別する識別子と、当該入力データに係る前記タグ情報とを対応付けて記憶部に保管するステップと、
をコンピュータに実行させるためのデータ保管プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021194193A JP7345897B2 (ja) | 2021-11-30 | 2021-11-30 | データ保管装置、データ保管方法、及びデータ保管プログラム |
JP2023138504A JP2023155335A (ja) | 2021-11-30 | 2023-08-29 | データ保管装置、データ保管方法、及びデータ保管プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021194193A JP7345897B2 (ja) | 2021-11-30 | 2021-11-30 | データ保管装置、データ保管方法、及びデータ保管プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023138504A Division JP2023155335A (ja) | 2021-11-30 | 2023-08-29 | データ保管装置、データ保管方法、及びデータ保管プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023080708A JP2023080708A (ja) | 2023-06-09 |
JP7345897B2 true JP7345897B2 (ja) | 2023-09-19 |
Family
ID=86656571
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021194193A Active JP7345897B2 (ja) | 2021-11-30 | 2021-11-30 | データ保管装置、データ保管方法、及びデータ保管プログラム |
JP2023138504A Pending JP2023155335A (ja) | 2021-11-30 | 2023-08-29 | データ保管装置、データ保管方法、及びデータ保管プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023138504A Pending JP2023155335A (ja) | 2021-11-30 | 2023-08-29 | データ保管装置、データ保管方法、及びデータ保管プログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7345897B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344562A (ja) | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
WO2008150003A1 (ja) | 2007-06-06 | 2008-12-11 | Nec Corporation | キーワード抽出モデル学習システム、方法およびプログラム |
JP2018169697A (ja) | 2017-03-29 | 2018-11-01 | 西日本電信電話株式会社 | 映像データ処理装置、映像データ処理方法、及びコンピュータプログラム |
JP2020181369A (ja) | 2019-04-25 | 2020-11-05 | 株式会社東芝 | 書類読取システム |
-
2021
- 2021-11-30 JP JP2021194193A patent/JP7345897B2/ja active Active
-
2023
- 2023-08-29 JP JP2023138504A patent/JP2023155335A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344562A (ja) | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
WO2008150003A1 (ja) | 2007-06-06 | 2008-12-11 | Nec Corporation | キーワード抽出モデル学習システム、方法およびプログラム |
JP2018169697A (ja) | 2017-03-29 | 2018-11-01 | 西日本電信電話株式会社 | 映像データ処理装置、映像データ処理方法、及びコンピュータプログラム |
JP2020181369A (ja) | 2019-04-25 | 2020-11-05 | 株式会社東芝 | 書類読取システム |
Also Published As
Publication number | Publication date |
---|---|
JP2023155335A (ja) | 2023-10-20 |
JP2023080708A (ja) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Oramas et al. | Multi-label music genre classification from audio, text, and images using deep features | |
JP4337064B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US9384196B2 (en) | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof | |
CN1723455B (zh) | 基于语义关联的内容检索 | |
US20040163034A1 (en) | Systems and methods for labeling clusters of documents | |
JPWO2019102533A1 (ja) | 文献分類装置 | |
CN109344298A (zh) | 一种将非结构化数据转化为结构化数据的方法及装置 | |
JP4991407B2 (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
US20180151178A1 (en) | Interactive question-answering apparatus and method thereof | |
CN113094534A (zh) | 一种基于深度学习的多模态图文推荐方法及设备 | |
JP6373292B2 (ja) | 特徴量生成装置、方法、及びプログラム | |
Shi et al. | Research on music emotion classification based on lyrics and audio | |
CN114661951A (zh) | 一种视频处理方法、装置、计算机设备以及存储介质 | |
JP2013109479A (ja) | コンテンツ変換方法、コンテンツ変換装置及びコンテンツ変換プログラム | |
CN114817622A (zh) | 歌曲片段搜索方法及其装置、设备、介质、产品 | |
CN113591853A (zh) | 关键词提取方法、装置及电子设备 | |
JP7345897B2 (ja) | データ保管装置、データ保管方法、及びデータ保管プログラム | |
JP4054046B2 (ja) | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
CN110347696B (zh) | 数据转换方法、装置、计算机设备以及存储介质 | |
JP7367139B2 (ja) | データ検索方法及びシステム | |
CN114780757A (zh) | 短媒体标签抽取方法、装置、计算机设备和存储介质 | |
Areeb et al. | AI art critic: Artistic classification of poster images using neural networks | |
WO2021191392A1 (fr) | Méthode mise en oeuvre par ordinateur pour la recherche analogique de documents | |
US20210158082A1 (en) | Duplicate image detection based on image content | |
Parian-Scherb et al. | Gesture retrieval and its application to the study of multimodal communication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230210 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230830 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7345897 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |