JP2024046323A - Information processing program, information processing device, and information processing method - Google Patents

Information processing program, information processing device, and information processing method Download PDF

Info

Publication number
JP2024046323A
JP2024046323A JP2022151640A JP2022151640A JP2024046323A JP 2024046323 A JP2024046323 A JP 2024046323A JP 2022151640 A JP2022151640 A JP 2022151640A JP 2022151640 A JP2022151640 A JP 2022151640A JP 2024046323 A JP2024046323 A JP 2024046323A
Authority
JP
Japan
Prior art keywords
information processing
image
recognition
files
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022151640A
Other languages
Japanese (ja)
Inventor
恭大 福世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2022151640A priority Critical patent/JP2024046323A/en
Publication of JP2024046323A publication Critical patent/JP2024046323A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ファイルの検索効率を高めること。【解決手段】実施形態によれば、情報処理プログラムは、記憶部とプロセッサとを具備するコンピュータにインストール可能な情報処理プログラムである。この情報処理プログラムは、プロセッサに、認識処理と、受付処理と、抽出処理と、提示処理とを実行させる命令を含む。認識処理は、テキストと画像とを含む複数のファイルを蓄積するデータベースにアクセスして、ファイルに含まれる画像の認識スコアを予め計算する処理である。受付処理は、検索キー画像の指定を受け付ける処理である。抽出処理は、検索キー画像との類似度が既定の基準を満たす画像を含むファイルを、認識スコアに基づいてデータベースから抽出する処理である。提示処理は、抽出されたファイルの一覧を提示する処理である。【選択図】 図2[Problem] To improve the efficiency of file searches. [Solution] According to an embodiment, an information processing program is an information processing program that can be installed in a computer having a storage unit and a processor. This information processing program includes instructions for causing the processor to execute a recognition process, a reception process, an extraction process, and a presentation process. The recognition process is a process of accessing a database that accumulates a plurality of files including text and images, and calculating in advance a recognition score of an image included in the file. The reception process is a process of receiving a specification of a search key image. The extraction process is a process of extracting files including an image whose similarity to the search key image meets a predetermined standard based on the recognition score from the database. The presentation process is a process of presenting a list of the extracted files. [Selected Figure] Figure 2

Description

本発明の実施形態は、情報処理プログラム、情報処理装置、および情報処理方法に関する。 Embodiments of the present invention relate to an information processing program, an information processing device, and an information processing method.

ありとあらゆる情報資産がデータベース化された今日、検索システムは、必要な情報を入手するために欠かせない技術である。例えば、報告書を作成するためにひな型となる文書ファイル(ドキュメント)を探すために、文書ファイルの管理システムにおいてキーワード検索することがある。キーワードにマッチする画像を検索するためのWebページも知られている。 Today, when all kinds of information assets have been organized into databases, search systems are an essential technology for obtaining the information required. For example, to find a template document file (document) for creating a report, a keyword search may be performed in a document file management system. Web pages for searching for images that match keywords are also known.

特許第4302799号公報Patent No. 4302799 特許第6314071号公報Patent No. 6314071 特許第6712796号公報Patent No. 6712796

テキストベースのキーワードを用いた既存の検索技術では、アウトプットが膨大な量になりがちで、検索の結果を絞り込むことも難しい。殊に、検索されたファイルを1件ずつ開いて内容を確認するという作業は効率的でなく、長い作業時間がかかってしまう。
そこで、目的は、ファイルの検索効率を高めた情報処理プログラム、情報処理装置、および情報処理方法を提供することにある。
Existing search techniques using text-based keywords tend to produce a huge amount of output, and it is difficult to narrow down the search results. In particular, opening the searched files one by one and checking the contents is not efficient and takes a long time.
Therefore, an object of the present invention is to provide an information processing program, an information processing device, and an information processing method that improve file search efficiency.

実施形態によれば、情報処理プログラムは、記憶部とプロセッサとを具備するコンピュータにインストール可能な情報処理プログラムである。この情報処理プログラムは、プロセッサに、認識処理と、受付処理と、抽出処理と、提示処理とを実行させる命令を含む。認識処理は、テキストと画像とを含む複数のファイルを蓄積するデータベースにアクセスして、ファイルに含まれる画像の認識スコアを予め計算する処理である。受付処理は、検索キー画像の指定を受け付ける処理である。抽出処理は、検索キー画像との類似度が既定の基準を満たす画像を含むファイルを、認識スコアに基づいてデータベースから抽出する処理である。提示処理は、抽出されたファイルの一覧を提示する処理である。 According to an embodiment, the information processing program is an information processing program that can be installed in a computer having a storage unit and a processor. This information processing program includes instructions that cause the processor to execute a recognition process, a reception process, an extraction process, and a presentation process. The recognition process is a process of accessing a database that accumulates multiple files including text and images, and calculating in advance a recognition score of the image included in the file. The reception process is a process of receiving a specification of a search key image. The extraction process is a process of extracting files including an image whose similarity to the search key image meets a predetermined standard from the database based on the recognition score. The presentation process is a process of presenting a list of the extracted files.

図1は、実施形態に係るコンピュータ10の一例を示す機能ブロック図である。FIG. 1 is a functional block diagram showing an example of a computer 10 according to an embodiment. 図2は、プロセッサ11およびストレージ14の一例を示す機能ブロック図である。FIG. 2 is a functional block diagram showing an example of the processor 11 and the storage 14. As shown in FIG. 図3は、文書データベース14bに登録される文書ファイルの一例を示す図である。FIG. 3 is a diagram showing an example of a document file registered in the document database 14b. 図4は、コンピュータ10の処理手順の一例を示すフローチャートである。FIG. 4 is a flowchart showing an example of a processing procedure of the computer 10. 図5は、検索キー画像を指定するためのGUI画面の一例を示す図である。FIG. 5 is a diagram showing an example of a GUI screen for designating a search key image. 図6は、文書検索に係るコンピュータ10の処理手運の一例を示すフローチャートである。FIG. 6 is a flow chart showing an example of a processing operation of the computer 10 relating to document search. 図7は、ユーザに提示される検索結果の一例を示す図である。FIG. 7 is a diagram showing an example of a search result presented to the user.

図面を参照して実施の形態について説明する。実施形態において、ユーザは、コンピュータ10を操作して、文書ファイルを検索するための情報(検索キー)を指定する。実施形態では、検索キーとして画像ファイルを与える。検索キーとしての画像(検索キー画像)は、コンピュータ10に予め記憶されているものでも良いし、USBメモリ等の記憶媒体に記憶された画像から選択したり、ネットワーク経由で取得された画像でもよい。 Embodiments will be described with reference to the drawings. In the embodiment, a user operates the computer 10 to specify information (search key) for searching a document file. In the embodiment, an image file is given as a search key. The image as a search key (search key image) may be one stored in advance in the computer 10, or may be selected from images stored in a storage medium such as a USB memory, or may be an image acquired via a network. .

検索キー画像が指定されると、コンピュータ10は、検索キー画像に類似する画像を含む文書ファイルをデータベースから抽出し、リストアップしてユーザに提示する。以下、その詳細について開示する。 When a search key image is specified, computer 10 extracts document files that contain images similar to the search key image from the database, lists them, and presents them to the user. Details are disclosed below.

<構成>
図1は、実施形態に係るコンピュータ10の一例を示す機能ブロック図である。コンピュータ10は、プロセッサ11、ROM12、RAM13、ストレージ14、通信部15、操作部16、および、表示部17を備える。これらは、コンピュータ10内部において、バスライン経由で相互に接続され、データを授受可能である。
<Configuration>
FIG. 1 is a functional block diagram showing an example of a computer 10 according to an embodiment. The computer 10 includes a processor 11 , a ROM 12 , a RAM 13 , a storage 14 , a communication section 15 , an operation section 16 , and a display section 17 . These are interconnected via bus lines within the computer 10 and are capable of exchanging data.

プロセッサ11は、コンピュータ10全体の動作を制御する。また、プロセッサ11は、ROM12又はストレージ14にインストールされたプログラムをRAM13にロードし、実行して、実施形態に係わる種々の処理を実現する。 The processor 11 controls the overall operation of the computer 10. The processor 11 also loads programs installed in the ROM 12 or storage 14 into the RAM 13 and executes them to realize various processes related to the embodiment.

ROM12は、制御プログラムや制御データなどを予め記憶する、不揮発性メモリである。ROM12に記憶される制御プログラム、制御データ等は、例えばコンピュータ10の起動時に、最初に読み込まれてRAM13に展開される。 ROM 12 is a non-volatile memory that prestores control programs, control data, etc. The control programs, control data, etc. stored in ROM 12 are first read and expanded in RAM 13, for example, when computer 10 is started.

RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを記憶する。アプリケーションプログラムの実行に必要なデータや、アプリケーションプログラムの実行結果なども、RAM13に記憶される。 RAM 13 is a volatile memory. RAM 13 temporarily stores data being processed by processor 11. RAM 13 stores various application programs based on instructions from processor 11. Data required to execute application programs and execution results of application programs are also stored in RAM 13.

ストレージ14は、データの書き込み及び書き換えが可能な不揮発性メモリである。ストレージ14は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、あるいはフラッシュメモリなどから構成される。コンピュータ10の基本プログラム、アプリケーション、あるいは種々のデータなどがストレージ14にインストールされる。 The storage 14 is a non-volatile memory to which data can be written and rewritten. The storage 14 is composed of, for example, a hard disk drive (HDD), a solid state drive (SSD), or a flash memory. Basic programs, applications, and various data of the computer 10 are installed in the storage 14.

通信部15は、例えば、有線または無線LAN(Local Area Network)接続をサポートし、ネットワーク経由で他のホストと通信するためのインターフェースである。コンピュータ10は、通信部15を介して、例えばインターネット上のホストコンピュータと通信可能である。 The communication unit 15 is an interface that supports, for example, wired or wireless LAN (Local Area Network) connection and communicates with other hosts via the network. The computer 10 can communicate with, for example, a host computer on the Internet via the communication unit 15.

操作部16は、マウスやキーボードなどを備えるユーザインタフェースであり、ユーザから種々の操作の入力を受け付ける。操作部16は、入力された操作を示す信号をプロセッサ11へ送信する。
表示部17は、例えば液晶モニタであり、各種の情報を視覚的に表示する。操作部16がタッチパネルから構成される場合、表示部17は、操作部16としてのタッチパネルと一体的に形成される。
The operation unit 16 is a user interface that includes a mouse, a keyboard, and the like, and accepts various operation inputs from the user. The operation unit 16 transmits a signal indicating the input operation to the processor 11.
The display unit 17 is, for example, a liquid crystal monitor, and visually displays various information. When the operation section 16 is composed of a touch panel, the display section 17 is formed integrally with the touch panel as the operation section 16.

図2は、プロセッサ11およびストレージ14の一例を示す機能ブロック図である。図2において、プロセッサ11は、実施形態に係わる処理機能として認識機能11a、受付機能11b、抽出機能11c、および、提示機能11dを有する。また、ストレージ14は、プログラム14a、文書データベース14b、画像認識モデル14c、および、認識スコア14dを記憶する。 FIG. 2 is a functional block diagram showing an example of the processor 11 and the storage 14. In FIG. 2, the processor 11 has a recognition function 11a, a reception function 11b, an extraction function 11c, and a presentation function 11d as processing functions according to the embodiment. The storage 14 also stores a program 14a, a document database 14b, an image recognition model 14c, and a recognition score 14d.

プログラム14aは、情報処理のためのプログラムであって、プロセッサ11に、認識機能11a、受付機能11b、抽出機能11c、および、提示機能11dを実行させる命令を含む。
認識機能11aは、文書データベース14bにアクセスして、文書データベース14bに蓄積されたファイルに含まれる画像の認識スコアを、予め計算する。
受付機能11bは、ユーザによる検索キー画像の指定を受け付ける。
抽出機能11cは、検索キー画像との類似度が既定の基準を満たす画像を含むファイルを、認識スコアに基づいて、文書データベース14bから抽出する。
提示機能11dは、抽出されたファイルの一覧を、コンピュータ10の表示部17に提示する。
The program 14a is a program for information processing, and includes instructions for causing the processor 11 to execute a recognition function 11a, a reception function 11b, an extraction function 11c, and a presentation function 11d.
The recognition function 11a accesses the document database 14b and pre-calculates recognition scores for images contained in files stored in the document database 14b.
The reception function 11b receives a search key image designated by the user.
The extraction function 11c extracts files including images whose similarity to the search key image satisfies a predetermined criterion from the document database 14b, based on the recognition score.
The presentation function 11d presents a list of the extracted files on the display unit 17 of the computer 10.

ストレージ14の文書データベース14bは、検索の対象となる複数の文書ファイルを蓄積する。実施形態では、例えば報告書などのように、テキストおよび画像を含む文書ファイルを検索の対象とする。 The document database 14b of the storage 14 accumulates multiple document files to be searched. In the embodiment, the document files to be searched include document files that contain text and images, such as reports.

図3は、文書データベース14bに登録される文書ファイルの一例を示す図である。検索対象になるファイルは、文書作成ソフトによって生成されたファイル(ワードファイルなど)、プレゼンテーション作成ソフトによって生成されたファイル(パワーポイントファイルなど)、印刷ソフトによって生成されたファイル(PDF(Portable Document Format)ファイル)などである。この種の形式のファイルには、テキストデータだけでなく、画像を埋め込むことができる。例えば、word_001のファイルには建物の画像が、word_002のファイルには収集車の画像が含まれる。同様に、飛行機や、乗用車などの画像を含むファイルもある。実施形態では、データベースに蓄積されている各種文書ファイルに含まれる画像に関して、例えばAI(Artificial Intelligence)技術を用いた画像認識処理により予め認識スコアを計算する。 Figure 3 is a diagram showing an example of a document file registered in the document database 14b. Files to be searched include files generated by word processing software (such as Word files), files generated by presentation creation software (such as PowerPoint files), and files generated by printing software (Portable Document Format (PDF) files). Files of this type of format can embed not only text data but also images. For example, a word_001 file contains an image of a building, and a word_002 file contains an image of a collection truck. Similarly, there are files that contain images of airplanes, passenger cars, and the like. In the embodiment, a recognition score is calculated in advance for images contained in various document files stored in the database by image recognition processing using, for example, AI (Artificial Intelligence) technology.

図2に戻って再び説明を続ける。図2のストレージ14の画像認識モデル14cは、埋め込み画像の認識スコアを計算するために、ニューラルネットワークを学習させることにより予め生成されたモデルである。例えば、画像データを構成するピクセルのRGBの画素値を要素とするベクトル(画素値ベクトル)を、ニューラルネットワークの入力層に入力し、隠れ層での重み付け係数に基づく演算により、出力層から認識スコアが出力される。画像認識モデル14cの重み付け係数は、画素値ベクトルと認識スコアとをセットとする学習データを繰り返し与えることにより、一定の値に収束する。 Returning to Figure 2, we will continue the explanation. The image recognition model 14c of the storage 14 in Figure 2 is a model that has been generated in advance by training a neural network in order to calculate the recognition score of an embedded image. For example, a vector whose elements are the RGB pixel values of the pixels that make up the image data (pixel value vector) is input to the input layer of the neural network, and a recognition score is output from the output layer through a calculation based on the weighting coefficients in the hidden layer. The weighting coefficients of the image recognition model 14c converge to a certain value by repeatedly providing training data consisting of sets of pixel value vectors and recognition scores.

プロセッサ11は、算出された認識スコアをストレージに記憶する(認識スコア14d)。また、プロセッサ11は、認識された画像を含むファイルの識別情報(ファイル名、識別子など)と、当該画像の認識スコアとを対応付けた属性情報を生成し、ストレージ14に格納する。 The processor 11 stores the calculated recognition score in the storage (recognition score 14d). The processor 11 also generates attribute information that associates the identification information (file name, identifier, etc.) of the file containing the recognized image with the recognition score of the image, and stores the attribute information in the storage 14.

<作用>
次に、上記構成における作用を説明する。
図4は、コンピュータ10の処理手順の一例を示すフローチャートである。図4は、コンピュータ10が認識スコアを計算する際の処理手順の一例を示す。
<Action>
Next, the operation of the above configuration will be described.
Fig. 4 is a flowchart showing an example of a processing procedure of the computer 10. Fig. 4 shows an example of a processing procedure when the computer 10 calculates a recognition score.

図4において、コンピュータ10のプロセッサ11は、1つの検索対象ファイルを文書データベース14bから取得する(ステップS11)。次に、プロセッサ11は、取得された検索対象ファイルに含まれる画像を取得する(ステップS12)。 In FIG. 4, the processor 11 of the computer 10 acquires one search target file from the document database 14b (step S11). Next, the processor 11 acquires an image included in the acquired search target file (step S12).

画像を取り出すと、プロセッサ11は、その画像の認識スコアを計算する(ステップS13)。次に、プロセッサ11は、画像のサイズを縮小してサムネイル化する(ステップS14)。 After retrieving the image, the processor 11 calculates a recognition score for the image (step S13). Next, the processor 11 reduces the size of the image and converts it into a thumbnail (step S14).

サムネイルを生成すると、プロセッサ11は、当該検索対象ファイルの識別情報に、認識スコアおよびサムネイルを対応付けて属性情報に追記する(ステップS15)。ここで、ストレージ14が属性情報を格納していない場合には、プロセッサ11は、属性情報を生成する。 When the thumbnail is generated, the processor 11 associates the recognition score and the thumbnail with the identification information of the search target file and adds them to the attribute information (step S15). Here, if the storage 14 does not store the attribute information, the processor 11 generates the attribute information.

次に、プロセッサ11は、画像の認識スコアが計算されていない検索対象ファイルの有無を判定する(ステップS16)。認識スコアが計算されていない検索対象ファイルが存在するならば、(ステップS16でYES)、処理手順はステップS11に戻る。全ての検索対象ファイルに含まれる画像の認識スコアが計算されたならば(ステップS16でNO)、処理手順は終了する。 Next, the processor 11 determines whether there is a search target file for which an image recognition score has not been calculated (step S16). If there is a search target file for which a recognition score has not been calculated (YES in step S16), the processing procedure returns to step S11. If the recognition scores of the images included in all the search target files have been calculated (NO in step S16), the processing procedure ends.

図5は、コンピュータ10の表示部17に表示されるGUI(Graphical User Interface)の一例を示す図である。このようなGUIを用いて、ユーザは、検索キー画像を指定することができる。図5に示されるように、例えば、ブラウザ上の指定された領域に検索キー画像をドラッグ/ドロップすることで、システムに検索キー画像を与えることができる。 Figure 5 is a diagram showing an example of a GUI (Graphical User Interface) displayed on the display unit 17 of the computer 10. Using such a GUI, the user can specify a search key image. As shown in Figure 5, for example, the search key image can be provided to the system by dragging and dropping the search key image into a specified area on the browser.

図6は、文書検索に係るコンピュータ10の処理手運の一例を示すフローチャートである。実施形態では、いわゆるリクエスト-レスポンス方式のWebアプリケーションによる検索サービスとしての形態について説明する。スタンドアロンのコンピュータ10において、この種のサービスは、ローカルホスト(localhost)の例えばポート80番を指定してアクセスすることにより提供される。 FIG. 6 is a flowchart showing an example of the processing procedure of the computer 10 related to document search. In the embodiment, a search service using a so-called request-response Web application will be described. In the stand-alone computer 10, this type of service is provided by specifying and accessing, for example, port 80 of the local host.

図6において、コンピュータ10のプロセッサ11は、ユーザから指定された検索キー画像を含むリクエストを取得する(ステップS21)。リクエストを受信すると、プロセッサ11は、リクエストに含まれる検索キー画像に類似する画像を含む文書ファイルを、文書データベース14bから抽出する(ステップS22)。 In FIG. 6, the processor 11 of the computer 10 obtains a request including a search key image specified by the user (step S21). Upon receiving the request, the processor 11 extracts a document file containing an image similar to the search key image included in the request from the document database 14b (step S22).

ここでは、プロセッサ11は、検索キー画像の認識スコアを別途算出し、その値(スカラ、またはベクトル)と類似する認識スコアの画像を含む文書ファイルを抽出する。埋め込み画像と検索キー画像との類似度は、予め定められたしきい値に基づいて判定され、しきい値以上の一致度を示す文書ファイルがピックアップされる。 Here, the processor 11 separately calculates the recognition score of the search key image, and extracts document files that include images with a recognition score similar to that value (scalar or vector). The similarity between the embedded image and the search key image is determined based on a predetermined threshold, and document files that show a match equal to or greater than the threshold are picked up.

文書ファイルが抽出されると、プロセッサ11は、検索されたファイルのファイル名およびサムネイル画像を属性情報から取得し、例えばHTMLまたはXML形式の一覧表データを作成する(ステップS23)。一覧表データを生成すると、プロセッサ11は、この一覧表データを含むレスポンスをアクセス元に送信し(ステップS24)、処理手順は終了する。 When the document file is extracted, the processor 11 acquires the file name and thumbnail image of the searched file from the attribute information, and creates list data in, for example, HTML or XML format (step S23). After generating the list data, the processor 11 transmits a response including this list data to the access source (step S24), and the processing procedure ends.

図7は、ユーザに提示される検索結果の一例を示す図である。図5のGUIにおいて車両の検索キー画像が指定されたことに応じて、文書データベース14bから、車両の画像を含むファイルが抽出される。抽出された複数のファイルは、例えば埋め込み画像と検索キー画像とのマッチ度(一致の度合い)が高い順にソートされ、ファイル名およびサムネイル画像とともに、コンピュータ10の表示部17に一覧表示される。 Figure 7 shows an example of a search result presented to the user. In response to the specification of a search key image of a vehicle in the GUI of Figure 5, files containing images of the vehicle are extracted from the document database 14b. The extracted files are sorted, for example, in descending order of the degree of match (degree of agreement) between the embedded image and the search key image, and are displayed in a list on the display unit 17 of the computer 10 together with the file name and thumbnail image.

<効果>
以上説明したように、実施形態では、データベースに蓄積された文書ファイル(WordやPowerPoint、PDFなど)に埋め込まれている(掲載されている)画像を分析/評価し、予め認識スコアを計算する。そして、ユーザの指定した検索キー画像との類似度を評価し、類似度の高い画像を含む文書ファイルを抽出する。さらに、抽出されたファイルのファイル名を、埋め込み画像のサムネイルとともにリストアップし、一覧表示するようにした。
<Effects>
As described above, in the embodiment, images embedded (published) in document files (such as Word, PowerPoint, PDF, etc.) stored in a database are analyzed/evaluated, and a recognition score is calculated in advance. Then, the similarity to a search key image designated by a user is evaluated, and document files containing images with high similarity are extracted. Furthermore, the file names of the extracted files are listed together with thumbnails of the embedded images, and are displayed as a list.

つまり実施形態によれば、文字列をキーとして画像を検索するWebサービスとは異なり、画像を検索キーとして、検索キーに類似する画像を含む文書ファイルを抽出することができる。 That is, according to the embodiment, unlike a web service that searches for images using a character string as a key, it is possible to use an image as a search key to extract document files that include images similar to the search key.

従って実施形態によれば、例えば、文書作成時に参考となる可能性のある文書を探し出すことが容易となる。つまり、文字列を用いたキーワード検索ではなく、手元の画像をキーとして、データベース内の文書を検索することが可能になる。従って検索効率を飛躍的に高めることが可能になる。 Therefore, according to the embodiment, for example, it becomes easy to find documents that may be useful when creating a document. In other words, instead of searching for keywords using character strings, it becomes possible to search for documents in a database using an image at hand as a key. This makes it possible to dramatically improve search efficiency.

例えば、現時点での天気図を検索キーとし、災害状況を記録した報告書のデータベースを検索すれば、類似する天気図を含む過去の報告書が抽出される。ユーザは、検索結果としてサムネイル表示された画像を参考に自分の思考に合うと思われる文書を閲覧する。そして、ユーザは当時の報告書をもとに、将来に起こりうる災害を予測したり、警告する文書を手早く作成することが可能になる。また、文書ファイルに掲載されている画像がサムネイル表示されるので、ユーザは、文書ファイルを1つ1つ開いて確認する必要が無くなり、煩雑な手間から解放される。 For example, by using a current weather chart as a search key and searching a database of reports recording disaster situations, past reports containing similar weather charts can be extracted. The user can refer to the images displayed as thumbnails in the search results and view documents that seem to match their own thinking. Based on the reports from that time, the user can then quickly create documents that predict or warn of future disasters. In addition, because images in document files are displayed as thumbnails, the user does not need to open and check each document file one by one, freeing them from the tedious work.

また、埋め込み画像の認識スコアを、ニューラルネットワークを用いたAIにより算出している。これにより、学習の量に伴って精度を向上させてゆくことができる。つまり、データベースに蓄積される文書ファイルが多くなればなるほど、検索の精度も向上することが期待される。 In addition, the recognition score of the embedded image is calculated by AI using a neural network. This allows the accuracy to improve as the amount of learning increases. In other words, the more document files are stored in the database, the more the search accuracy is expected to improve.

これらのことから、実施形態によれば、ファイルの検索効率を高めた情報処理プログラム、情報処理装置、および情報処理方法を提供することが可能となる。 For these reasons, according to the embodiment, it is possible to provide an information processing program, an information processing device, and an information processing method with improved file search efficiency.

なお、この発明は上記実施の形態に限定されるものではない。例えば、文書データベース14bに登録される文書ファイルは、Webスクレイピング技術などによってWebページから得られた情報から構成されるファイルであってもよい。また、文書ファイルは、音声や動画を含むものであってもよい。 Note that the present invention is not limited to the above-described embodiment. For example, the document files registered in the document database 14b may be files composed of information obtained from web pages by web scraping technology or the like. Furthermore, the document files may contain audio and video.

また、実施形態ではスタンドアロンのコンピュータ10にデータベースを構築した。これにより情報の機密性を担保することが可能になる。これに対し、一般に公開された文書ファイルを取り扱うのであれば、コンピュータ10とは異なるサーバ上に構築されたデータベースにネットワーク経由でアクセスして、クライアント-サーバ形式によるシステムを構築することも可能である。 In addition, in this embodiment, the database is built on a standalone computer 10. This makes it possible to ensure the confidentiality of the information. On the other hand, if publicly available document files are to be handled, it is also possible to build a system in a client-server format by accessing a database built on a server other than the computer 10 via a network.

実施形態を説明したが、この実施形態は例として提示するものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although an embodiment has been described, this embodiment is presented as an example and is not intended to limit the scope of the invention. This new embodiment can be implemented in various other forms, and various omissions, substitutions, and modifications can be made without departing from the gist of the invention. This embodiment and its modifications are included within the scope and gist of the invention, and are included in the scope of the invention and its equivalents described in the claims.

10…コンピュータ11…プロセッサ11a…認識機能11b…受付機能11c…抽出機能11d…提示機能12…ROM13…RAM14…ストレージ14a…プログラム14b…文書データベース14c…画像認識モデル14d…認識スコア15…通信部16…操作部17…表示部。 10...Computer 11...Processor 11a...Recognition function 11b...Reception function 11c...Extraction function 11d...Presentation function 12...ROM 13...RAM 14...Storage 14a...Program 14b...Document database 14c...Image recognition model 14d...Recognition score 15...Communication unit 16...Operation unit 17...Display unit.

Claims (5)

記憶部とプロセッサとを具備するコンピュータにインストール可能な情報処理プログラムであって、
前記プロセッサに、
テキストと画像とを含む複数のファイルを蓄積するデータベースにアクセスして、前記ファイルに含まれる画像の認識スコアを予め計算する認識処理と、
検索キー画像の指定を受け付ける受付処理と、
前記検索キー画像との類似度が既定の基準を満たす画像を含むファイルを、前記認識スコアに基づいて前記データベースから抽出する抽出処理と、
前記抽出されたファイルの一覧を提示する提示処理と、を実行させる命令を含む、情報処理プログラム。
An information processing program installable on a computer comprising a storage unit and a processor,
the processor;
recognition processing that accesses a database that stores a plurality of files including text and images and pre-calculates a recognition score for an image included in the file;
A reception process that accepts the specification of a search key image,
an extraction process of extracting a file containing an image whose similarity with the search key image satisfies a predetermined criterion from the database based on the recognition score;
An information processing program including an instruction for executing a presentation process of presenting a list of the extracted files.
前記提示処理は、前記抽出されたファイルに含まれる画像のサムネイルを前記一覧に提示する、請求項1に記載の情報処理プログラム。 The information processing program according to claim 1, wherein the presentation process presents thumbnails of images contained in the extracted files in the list. 前記認識処理は、ニューラルネットワークを学習させて生成される画像認識モデルに前記画像を与えて前記認識スコアを出力させる、請求項1に記載の情報処理プログラム。 The information processing program according to claim 1, wherein the recognition process includes providing the image to an image recognition model generated by training a neural network, and outputting the recognition score. テキストと画像とを含む複数のファイルを蓄積するデータベースを記憶する記憶部と、
プロセッサとを軍備し、
前記プロセッサは、
前記ファイルに含まれる画像の認識スコアを予め計算する認識機能と、
検索キー画像の指定を受け付ける受付機能と、
前記検索キー画像との類似度が既定の基準を満たす画像を含むファイルを、前記認識スコアに基づいて前記データベースから抽出する抽出機能と、
前記抽出されたファイルの一覧を提示する提示機能と、を備える、情報処理装置。
a storage unit that stores a database that stores a plurality of files including text and images;
Armed with a processor,
The processor includes:
a recognition function that calculates in advance a recognition score of an image included in the file;
A reception function that accepts the specification of a search key image,
an extraction function that extracts files containing images whose similarity to the search key image satisfies a predetermined criterion from the database based on the recognition score;
An information processing device comprising: a presentation function that presents a list of the extracted files.
記憶部とプロセッサとを具備するコンピュータによる情報処理方法であって、
前記プロセッサが、
テキストと画像とを含む複数のファイルを蓄積するデータベースを前記記憶部に記憶することと、
前記ファイルに含まれる画像の認識スコアを予め計算することと、
検索キー画像の指定を受け付けることと、
前記検索キー画像との類似度が既定の基準を満たす画像を含むファイルを、前記認識スコアに基づいて前記データベースから抽出することと、
前記抽出されたファイルの一覧を提示することとを含む、情報処理方法。
An information processing method by a computer having a storage unit and a processor,
The processor,
storing a database in the storage unit, the database storing a plurality of files including text and images;
pre-calculating recognition scores for images contained in said file;
Accepting a designation of a search key image;
extracting from the database, based on the recognition score, a file including an image whose similarity to the search key image satisfies a predetermined criterion;
and presenting a list of the extracted files.
JP2022151640A 2022-09-22 2022-09-22 Information processing program, information processing device, and information processing method Pending JP2024046323A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022151640A JP2024046323A (en) 2022-09-22 2022-09-22 Information processing program, information processing device, and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022151640A JP2024046323A (en) 2022-09-22 2022-09-22 Information processing program, information processing device, and information processing method

Publications (1)

Publication Number Publication Date
JP2024046323A true JP2024046323A (en) 2024-04-03

Family

ID=90481670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022151640A Pending JP2024046323A (en) 2022-09-22 2022-09-22 Information processing program, information processing device, and information processing method

Country Status (1)

Country Link
JP (1) JP2024046323A (en)

Similar Documents

Publication Publication Date Title
JP4776894B2 (en) Information retrieval method
JP4711385B2 (en) Information processing
US11907669B2 (en) Creation of component templates based on semantically similar content
JP4682284B2 (en) Document difference detection device
US8271410B2 (en) Displaying resources based on shared contexts
JP2010073114A (en) Image information search device, image information search method, computer program for the same
CN101611406A (en) Document archiving system
EP3839785A1 (en) Characterizing malware files for similarity searching
US10694071B2 (en) Techniques for viewing and searching documents from collections of documents
KR20210129465A (en) Apparatus for managing laboratory note and method for searching laboratory note using thereof
CN107357765A (en) Word document flaking method and device
WO2019151502A1 (en) Presentation device, presentation method and presentation program
US20150339786A1 (en) Forensic system, forensic method, and forensic program
JP2010211688A (en) Document editing apparatus, data processing method and program
JP4703487B2 (en) Image classification method, apparatus and program
JP2004110834A (en) Information storage retrieval system and method
JP2024046323A (en) Information processing program, information processing device, and information processing method
JP4135659B2 (en) Format conversion device and file search device
JP4544047B2 (en) Web image search result classification presentation method and apparatus, program, and storage medium storing program
JP2016018279A (en) Document file search program, document file search device, document file search method, document information output program, document information output device, and document information output method
CN114021541A (en) Presentation generation method, device, equipment and storage medium
US20120117449A1 (en) Creating and Modifying an Image Wiki Page
JP2009146013A (en) Content retrieval method, its device, and program
JP2011248827A (en) Cross-lingual information searching method, cross-lingual information searching system and cross-lingual information searching program
JP2011054006A (en) Image keyword determination system

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105