JP2022026752A - Knowledge database generation device, program, and automated answering system - Google Patents

Knowledge database generation device, program, and automated answering system Download PDF

Info

Publication number
JP2022026752A
JP2022026752A JP2020130361A JP2020130361A JP2022026752A JP 2022026752 A JP2022026752 A JP 2022026752A JP 2020130361 A JP2020130361 A JP 2020130361A JP 2020130361 A JP2020130361 A JP 2020130361A JP 2022026752 A JP2022026752 A JP 2022026752A
Authority
JP
Japan
Prior art keywords
word
knowledge database
knowledge
target data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020130361A
Other languages
Japanese (ja)
Other versions
JP7512748B2 (en
Inventor
幸 白石
Miyuki Shiraishi
義久 石原
Yoshihisa Ishihara
潤平 小林
Junpei Kobayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2020130361A priority Critical patent/JP7512748B2/en
Priority claimed from JP2020130361A external-priority patent/JP7512748B2/en
Publication of JP2022026752A publication Critical patent/JP2022026752A/en
Application granted granted Critical
Publication of JP7512748B2 publication Critical patent/JP7512748B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a knowledge database generation device, a program, and an automated answering system, which can easily construct a knowledge database having highly accurate data.SOLUTION: A knowledge DB generation server 1 includes: a character processing section 12 that recognizes or acquires a character string included in data to be registered and extracts a word included in the character string; an image processing section 14 that performs image recognition processing on the data to be registered and acquires the recognized word; a word classification section 16 that acquires classification of the word obtained as a result of performing processing of the character processing section 12 and the image processing section 14 using dictionary data; and a data registration section 18 that associates the data to be registered with the word and the classification and stores in a knowledge DB 3.SELECTED DRAWING: Figure 1

Description

本発明は、知識データベース生成装置、プログラム及び自動応答システムに関する。 The present invention relates to a knowledge database generator, a program and an automated response system.

従来、業務効率化の観点から、企業の受付等にディスプレイやマイクを設置し、表示されたバーチャルなキャラクタ等が窓口業務等の接客業務を行う取り組みがなされている。このようなシステムでは、利用者の質問を、マイクを介した音声認識によって認識し、知識データベースから回答を検索し、ディスプレイへ表示及び/又はスピーカから発話することで、利用者の質問に回答する。このような対話システムの一例として、例えば、特許文献1に記載の技術が開示されている。 Conventionally, from the viewpoint of improving work efficiency, an effort has been made to install a display and a microphone at a reception desk of a company, etc., and to perform customer service work such as window work by the displayed virtual character or the like. In such a system, the user's question is recognized by voice recognition via a microphone, the answer is searched from the knowledge database, and the user's question is answered by displaying it on the display and / or speaking from the speaker. .. As an example of such a dialogue system, for example, the technique described in Patent Document 1 is disclosed.

特開2007-148118号公報Japanese Unexamined Patent Publication No. 2007-148118

特許文献1に記載のような対話システムを実現する場合には、知識データベースに事前にデータを登録する必要があるが、その際、知識データベースに登録するデータ量やデータの精度が重要になる。そのため、高精度のデータを含む知識データベースを、より容易に構築することが望まれる。 In order to realize the dialogue system as described in Patent Document 1, it is necessary to register the data in the knowledge database in advance, but in that case, the amount of data to be registered in the knowledge database and the accuracy of the data are important. Therefore, it is desired to more easily construct a knowledge database containing highly accurate data.

そこで、本発明は、高精度のデータを有する知識データベースを容易に構築することが可能な知識データベース生成装置、プログラム及び自動応答システムを提供することを目的とする。 Therefore, an object of the present invention is to provide a knowledge database generator, a program, and an automatic response system capable of easily constructing a knowledge database having highly accurate data.

本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、登録対象データに含まれる文字列を認識又は取得し、前記文字列に含まれる単語を抽出する文字処理手段と、前記登録対象データに画像認識処理を行い、認識された単語を取得する画像処理手段と、前記文字処理手段及び前記画像処理手段の処理を行った結果として得られた前記単語の分類を、辞書データを用いて取得する単語分類手段と、前記登録対象データに、前記単語と前記分類とを対応付けて、知識データベースに記憶させるデータ登録手段と、を備える、知識データベース生成装置である。
第2の発明は、第1の発明の知識データベース生成装置において、前記画像認識処理は、画像のシーンを認識する、知識データベース生成装置である。
第3の発明は、第1の発明又は第2の発明の知識データベース生成装置において、前記登録対象データを分析して画像と文字列との重なりの有無を確認し、重なりがある場合には、前記文字列を含む文字列領域を削除し、削除した前記文字列領域を、前記文字列領域の周囲の画像を用いて補完する画像加工手段を備え、前記画像処理手段は、前記画像加工手段による処理後の前記登録対象データを用いて処理を行う、知識データベース生成装置である。
第4の発明は、第1の発明から第3の発明までのいずれかの知識データベース生成装置において、前記文字処理手段及び前記画像処理手段の処理を行った結果として得られた前記単語の上位語を取得する上位語取得手段を備え、前記単語分類手段は、前記上位語取得手段により取得した前記上位語を前記単語として、前記分類をさらに取得する、知識データベース生成装置である。
第5の発明は、第1の発明から第4の発明までのいずれかの知識データベース生成装置において、前記文字処理手段及び前記画像処理手段の処理を行った結果として得られた前記単語の重みを決定する重み決定手段を備え、前記データ登録手段は、前記単語に、前記重み決定手段により決定した前記重みをさらに対応付けて前記知識データベースに記憶する、知識データベース生成装置である。
第6の発明は、第5の発明の知識データベース生成装置において、前記重み決定手段は、前記登録対象データにおける前記単語の出現頻度及び前記単語の強調表示の態様、並びに、前記登録対象データの領域における前記単語に対応する画像の占める割合のうち少なくともいずれかに基づいて、前記単語の重みを決定する、知識データベース生成装置である。
第7の発明は、第1の発明から第6の発明までのいずれかの知識データベース生成装置において、前記登録対象データを分析して色情報を取得する色情報取得手段を備え、前記データ登録手段は、前記色情報取得手段により取得した前記色情報を、前記登録対象データにさらに対応付けて、前記知識データベースに記憶させる、知識データベース生成装置である。
第8の発明は、第1の発明から第7の発明までのいずれかの知識データベース生成装置において、前記文字処理手段は、見出しになる前記文字列を抽出し、同一又は類似する前記見出しを有する前記登録対象データを関連付ける関連付け手段を備える、知識データベース生成装置である。
第9の発明は、第1の発明から第8の発明までのいずれかの知識データベース生成装置としてコンピュータを機能させるためのプログラムである。
第10の発明は、第5の発明又は第6の発明の知識データベース生成装置において生成した前記知識データベースを用いる、自動応答システムであって、質問を受け付ける質問受付手段と、前記質問受付手段により受け付けた前記質問であって、文字列化された前記質問に対して形態素解析を行う質問解析手段と、前記質問解析手段による解析結果に基づいて前記知識データベースを検索し、検索結果として取得した、前記単語に対応した前記重みの合計が大きいものを優先に、前記登録対象データを出力する回答出力手段と、を備える、自動応答システムである。
The present invention solves the above-mentioned problems by the following solution means.
The first invention is a character processing means for recognizing or acquiring a character string included in the registration target data and extracting a word included in the character string, and an image recognition process for the registration target data to recognize the word. The word classification means for acquiring the word classification obtained as a result of processing the character processing means and the image processing means, and the word classification means for acquiring the word classification using dictionary data, and the registration target data. , A knowledge database generation device comprising a data registration means for associating the word with the classification and storing it in the knowledge database.
The second invention is the knowledge database generation device of the first invention, wherein the image recognition process is a knowledge database generation device that recognizes an image scene.
According to the third invention, in the knowledge database generator of the first invention or the second invention, the registration target data is analyzed to confirm whether or not the image and the character string overlap, and if there is an overlap, the third invention is performed. An image processing means for deleting a character string area including the character string and complementing the deleted character string area with an image around the character string area is provided, and the image processing means is based on the image processing means. It is a knowledge database generation device that performs processing using the registered data after processing.
The fourth invention is a hypernym of the word obtained as a result of processing the character processing means and the image processing means in any of the knowledge database generators from the first invention to the third invention. The word classification means is a knowledge database generation device that further acquires the classification by using the hypernym acquired by the hypernym acquisition means as the word.
In the fifth invention, the weight of the word obtained as a result of processing the character processing means and the image processing means in any of the knowledge database generation devices from the first invention to the fourth invention is used. The data registration means is a knowledge database generation device including a weight determining means for determining, which further associates the weight determined by the weight determining means with the word and stores the weight in the knowledge database.
A sixth aspect of the invention is the knowledge database generation device of the fifth aspect, wherein the weight determination means includes the frequency of appearance of the word in the registration target data, the mode of highlighting the word, and the area of the registration target data. A knowledge database generator that determines the weight of the word based on at least one of the proportions of the image corresponding to the word in.
The seventh invention comprises a color information acquisition means for analyzing the registration target data and acquiring color information in any of the knowledge database generation devices from the first invention to the sixth invention, and the data registration means. Is a knowledge database generation device that further associates the color information acquired by the color information acquisition means with the registration target data and stores it in the knowledge database.
According to the eighth aspect of the invention, in any one of the knowledge database generators from the first invention to the seventh invention, the character processing means extracts the character string to be a heading and has the same or similar heading. It is a knowledge database generation device provided with an association means for associating the registration target data.
The ninth invention is a program for making a computer function as a knowledge database generator according to any one of the first invention to the eighth invention.
The tenth invention is an automatic response system using the knowledge database generated by the knowledge database generator of the fifth invention or the sixth invention, and is received by a question receiving means for receiving a question and a question receiving means. The question was obtained by searching the knowledge database based on the question analysis means for performing morphological analysis on the question in character string and the analysis result by the question analysis means, and acquiring the question as a search result. It is an automatic response system including a response output means for outputting the registration target data, giving priority to a word having a large total weight.

本発明によれば、高精度のデータを有する知識データベースを容易に構築することが可能な知識データベース生成装置、プログラム及び自動応答システムを提供することができる。 According to the present invention, it is possible to provide a knowledge database generator, a program, and an automatic response system capable of easily constructing a knowledge database having highly accurate data.

本実施形態に係る自動応答システムの機能ブロック図である。It is a functional block diagram of the automatic response system which concerns on this embodiment. 本実施形態に係る知識DB生成サーバでの知識データ登録処理を示すフローチャートである。It is a flowchart which shows the knowledge data registration process in the knowledge DB generation server which concerns on this embodiment. 本実施形態に係る知識DBに登録する登録対象データの例を示す図である。It is a figure which shows the example of the registration target data to be registered in the knowledge DB which concerns on this embodiment. 本実施形態に係る知識DB生成サーバでの文字処理を示すフローチャートである。It is a flowchart which shows the character processing in the knowledge DB generation server which concerns on this embodiment. 本実施形態に係る文字処理における画像加工処理の具体例を示す図である。It is a figure which shows the specific example of the image processing processing in the character processing which concerns on this embodiment. 本実施形態に係る知識DB生成サーバでの画像処理を示すフローチャートである。It is a flowchart which shows the image processing in the knowledge DB generation server which concerns on this embodiment. 本実施形態に係る知識DB生成サーバで生成した知識DBに登録する知識データの例を示す図である。It is a figure which shows the example of the knowledge data which is registered in the knowledge DB generated by the knowledge DB generation server which concerns on this embodiment. 本実施形態に係る自動応答装置での質問応答処理を示すフローチャートである。It is a flowchart which shows the question answering process in the automatic answering apparatus which concerns on this embodiment. 本実施形態に係る自動応答装置における具体例を示す図である。It is a figure which shows the specific example in the automatic response apparatus which concerns on this embodiment.

以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(実施形態)
<自動応答システム100>
図1は、本実施形態に係る自動応答システム100の機能ブロック図である。
自動応答システム100は、自動応答装置4が受け付けた質問に対して、知識DB(データベース)3を用いて応答するためのシステムである。また、自動応答システム100は、知識DB生成サーバ1が、例えば、チラシやパンフレットといった既存のメディアを使用して、知識DB3を生成する。
自動応答システム100は、知識DB生成サーバ1と、知識DB3と、自動応答装置4とを備える。
Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. It should be noted that this is only an example, and the technical scope of the present invention is not limited to this.
(Embodiment)
<Automatic response system 100>
FIG. 1 is a functional block diagram of the automatic response system 100 according to the present embodiment.
The automatic response system 100 is a system for responding to a question received by the automatic response device 4 by using the knowledge DB (database) 3. Further, in the automatic response system 100, the knowledge DB generation server 1 generates the knowledge DB 3 by using an existing medium such as a leaflet or a pamphlet.
The automatic response system 100 includes a knowledge DB generation server 1, a knowledge DB 3, and an automatic response device 4.

<知識DB生成サーバ1>
知識DB生成サーバ1は、登録対象データと、登録対象データから得られる各種の情報とを知識DB3にデータを登録することで、知識DB3を生成する装置である。
知識DB生成サーバ1は、例えば、サーバやパーソナルコンピュータ(PC)等である。
知識DB生成サーバ1は、制御部10と、記憶部20と、通信インタフェース部29とを備える。
<Knowledge DB generation server 1>
The knowledge DB generation server 1 is a device that generates the knowledge DB 3 by registering the registration target data and various information obtained from the registration target data in the knowledge DB 3.
The knowledge DB generation server 1 is, for example, a server, a personal computer (PC), or the like.
The knowledge DB generation server 1 includes a control unit 10, a storage unit 20, and a communication interface unit 29.

制御部10は、知識DB生成サーバ1の全体を制御するCPU(中央処理装置)である。制御部10は、記憶部20に記憶されているOS(オペレーティングシステム)やアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
制御部10は、対象データ受付部11と、文字処理部12(文字処理手段)と、対象データ確認処理部13(画像加工手段、色情報取得手段)と、画像処理部14(画像処理手段)と、上位語取得部15(上位語取得手段)と、単語分類部16(単語分類手段)と、重み決定部17(重み決定手段)と、データ登録部18(データ登録手段)とを備える。
The control unit 10 is a CPU (central processing unit) that controls the entire knowledge DB generation server 1. The control unit 10 appropriately reads out and executes an OS (operating system) and an application program stored in the storage unit 20 to cooperate with the above-mentioned hardware and execute various functions.
The control unit 10 includes a target data receiving unit 11, a character processing unit 12 (character processing means), a target data confirmation processing unit 13 (image processing means, color information acquisition means), and an image processing unit 14 (image processing means). The upper word acquisition unit 15 (upper word acquisition means), the word classification unit 16 (word classification means), the weight determination unit 17 (weight determination means), and the data registration unit 18 (data registration means) are provided.

対象データ受付部11は、登録対象データを受け付ける。ここで、登録対象データとは、知識DB3に登録する知識データになるものである。登録対象データは、例えば、既存の様々なメディアであってよく、チラシやパンフレットといった、紙媒体での配布を想定したものの他、WebページやSNS(Social Networking Service)等の電子化されたデータであってもよいし、手書きのメモ等であってもよい。本実施形態では、登録対象データは、チラシやパンフレットのように、文字と画像とを含むものとして説明する。実際には、登録対象データは、文字のみのものや、画像のみのものを含んでもよい。
対象データ受付部11は、紙媒体のものである場合には、例えば、スキャナや、カメラ等(図示せず)によって画像化し、登録対象データとして画像化した画像データを受け付ける。
また、対象データ受付部11は、例えば、パンフレット類のように複数ページあるものについて、まとめて1つの登録対象データとして受け付けてもよいし、ページごとに登録対象データとして受け付けてもよい。
The target data receiving unit 11 receives the registration target data. Here, the registration target data is the knowledge data to be registered in the knowledge DB 3. The data to be registered may be, for example, various existing media, and may be distributed in paper media such as leaflets and pamphlets, as well as digitized data such as Web pages and SNS (Social Networking Services). It may be present, or it may be a handwritten memo or the like. In the present embodiment, the data to be registered will be described as including characters and images, such as a leaflet or a pamphlet. Actually, the data to be registered may include only characters or only images.
When the target data receiving unit 11 is a paper medium, the target data receiving unit 11 is imaged by, for example, a scanner, a camera, or the like (not shown), and receives the imaged image data as the registration target data.
Further, the target data receiving unit 11 may collectively accept a plurality of pages such as pamphlets as one registration target data, or may accept each page as registration target data.

文字処理部12は、受け付けた登録対象データに含まれるテキスト(文字列)に対する処理を行う。
文字処理部12は、登録対象データに含まれるテキストを取得し、又は、文字認識処理によって認識し、認識したテキストに含まれる単語を取得する。文字処理部12は、テキストから単語を取得する処理を、自然言語処理として、例えば、形態素解析等により行うことができる。
The character processing unit 12 processes the text (character string) included in the received registration target data.
The character processing unit 12 acquires the text included in the registration target data, or recognizes it by the character recognition process and acquires the word included in the recognized text. The character processing unit 12 can perform a process of acquiring a word from a text as a natural language process, for example, by morphological analysis or the like.

対象データ確認処理部13は、登録対象データを分析して画像とテキストとの重なりの有無を確認する。そして、重なりがある場合、つまり、画像の上にテキストが重なっている場合に、対象データ確認処理部13は、テキストを含むテキスト領域を削除し、削除したテキスト領域を、テキスト領域の周囲の画像を用いて補完する画像加工処理を行う。
また、対象データ確認処理部13は、登録対象データの色情報を取得する。対象データ確認処理部13は、登録対象データの画像全体の色合いを分析することで、色情報を取得する。色情報は、例えば、RGB値を16進数で表したカラーコードとして取得する。
The target data confirmation processing unit 13 analyzes the registration target data and confirms whether or not the image and the text overlap. Then, when there is an overlap, that is, when the text overlaps the image, the target data confirmation processing unit 13 deletes the text area including the text, and the deleted text area is used as the image around the text area. Performs complementary image processing processing using.
Further, the target data confirmation processing unit 13 acquires the color information of the registration target data. The target data confirmation processing unit 13 acquires color information by analyzing the hue of the entire image of the registration target data. The color information is acquired, for example, as a color code in which the RGB value is represented by a hexadecimal number.

画像処理部14は、登録対象データに対して画像認識処理を行い、認識された単語を取得する。より具体的には、画像処理部14は、例えば、含まれる各画像を検出及び分析し、各画像に関連する単語を取得する。また、画像処理部14は、例えば、既存の画像分析技術を活用して、登録対象データに含まれる各画像を検出及び切出し処理を行い、各画像に対するラベル付けをすることで、ラベル付けを単語として取得する。画像処理部14は、各画像に対するラベル付けに、画像と単語とが関連付けられた画像DB(図示せず)を用い、各画像に類似する画像DBの画像に関連付けられた単語を取得するようにしてもよい。さらに、画像処理部14は、画像のシーンを認識する。ここで、画像処理部14は、対象データ確認処理部13による画像加工処理を行った場合には、画像加工処理後の登録対象データである加工後対象データから各画像を検出するようにしてもよい。
なお、登録対象データそのものに予めラベル付けがされている場合には、画像処理部14は、そのラベルを取得してもよい。
The image processing unit 14 performs image recognition processing on the registration target data and acquires the recognized word. More specifically, the image processing unit 14 detects and analyzes each image included, and acquires a word related to each image, for example. Further, for example, the image processing unit 14 utilizes an existing image analysis technique to detect and cut out each image included in the registration target data, and labels each image to label the image. Get as. The image processing unit 14 uses an image DB (not shown) in which an image and a word are associated with each image for labeling, and acquires a word associated with an image in an image DB similar to each image. You may. Further, the image processing unit 14 recognizes the scene of the image. Here, when the image processing unit 14 performs the image processing processing by the target data confirmation processing unit 13, the image processing unit 14 may detect each image from the processed target data which is the registration target data after the image processing processing. good.
If the registration target data itself is labeled in advance, the image processing unit 14 may acquire the label.

上位語取得部15は、文字処理部12及び画像処理部14で取得した単語の上位語を取得する。上位語取得部15は、単語と上位語とを関連付けた、例えば、用語辞書(図示せず)を用いて、単語の上位概念に相当する上位語を取得する。上位語は、例えば、単語が「まぐろ」である場合に、「鮮魚」、「食べ物」といったものである。
単語分類部16は、単語(上位語を含む)の分類を取得する。単語分類部16は、シーン関連用語辞書22(辞書データ)を参照して、単語を「物体」と「シーン」とに分類する。その結果、「物体」に分類される単語には、単語分類部16は、さらにカテゴリ分けをしてもよい。
The hypernym acquisition unit 15 acquires the hypernym of the word acquired by the character processing unit 12 and the image processing unit 14. The hypernym acquisition unit 15 acquires a hypernym corresponding to a hypernym of a word by using, for example, a term dictionary (not shown) in which the word is associated with the hypernym. The hypernyms are, for example, "fresh fish" and "food" when the word is "tuna".
The word classification unit 16 acquires the classification of words (including hypernyms). The word classification unit 16 refers to the scene-related term dictionary 22 (dictionary data) and classifies words into "objects" and "scenes". As a result, the word classification unit 16 may further categorize the words classified as "objects".

重み決定部17は、各単語の重みを決定する。ここで、重み決定部17は、例えば、文字と画像とのいずれからも取得した単語についての重みを大きくしてもよい。また、重み決定部17は、文字の大きさやフォント(態様)によって重みを決定してもよく、文字の大きさがより大きく、太字や下線が付されている単語の重みを、より大きくしてもよい。さらに、重み決定部17は、画像の大きさによって重みを決定してもよく、例えば、登録対象データの全体の領域に占める画像の大きさ(領域)の割合が大きいほど、重みを大きくしてもよい。 The weight determination unit 17 determines the weight of each word. Here, the weight determination unit 17 may increase the weight of the word acquired from both the character and the image, for example. Further, the weight determination unit 17 may determine the weight according to the size of the character and the font (mode), and the weight of the word having a larger character size and being bold or underlined is made larger. May be good. Further, the weight determination unit 17 may determine the weight according to the size of the image. For example, the larger the ratio of the size (area) of the image to the entire area of the registration target data, the larger the weight. May be good.

データ登録部18は、登録対象データに、単語と分類とを対応付けて、知識DB3に登録する。データ登録部18は、登録対象データに、対象データ確認処理部13により取得した色情報を、さらに対応付けてもよい。また、データ登録部18は、単語に、重み決定部17により決定した重みをさらに対応付けてもよい。 The data registration unit 18 associates a word with a classification with the data to be registered and registers it in the knowledge DB 3. The data registration unit 18 may further associate the color information acquired by the target data confirmation processing unit 13 with the registration target data. Further, the data registration unit 18 may further associate the weight determined by the weight determination unit 17 with the word.

記憶部20は、制御部10が各種の処理を実行するために必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶領域である。
記憶部20は、プログラム記憶部21と、シーン関連用語辞書22とを備える。
プログラム記憶部21は、プログラムを記憶するための記憶領域である。プログラム記憶部21は、プログラム21aを記憶している。
プログラム21aは、制御部10の各種機能を実行するためのプログラムである。
The storage unit 20 is a storage area for a hard disk, a semiconductor memory element, or the like for storing programs, data, and the like necessary for the control unit 10 to execute various processes.
The storage unit 20 includes a program storage unit 21 and a scene-related term dictionary 22.
The program storage unit 21 is a storage area for storing a program. The program storage unit 21 stores the program 21a.
The program 21a is a program for executing various functions of the control unit 10.

シーン関連用語辞書22は、少なくともシーンに関連する単語を記憶した辞書である。シーンとは、情景や場面といった意味のものであり、個々の物体とは異なる全体での状態を表す言葉である。シーン関連用語辞書22は、単語に対して、シーンか、物体か、のうちのいずれかを対応付けたものであってもよい。シーン関連用語辞書22は、予め用意されたものである。
通信インタフェース部29は、通信ネットワークを介して知識DB3や、その他のDBや、他の装置等との通信を行うためのインタフェースである。
The scene-related term dictionary 22 is a dictionary that stores at least words related to the scene. A scene means a scene or a scene, and is a word that expresses a state as a whole that is different from individual objects. The scene-related term dictionary 22 may associate a word with either a scene or an object. The scene-related term dictionary 22 is prepared in advance.
The communication interface unit 29 is an interface for communicating with the knowledge DB 3, other DBs, other devices, and the like via the communication network.

<知識DB3>
知識DB3は、知識DB生成サーバ1によって登録対象データからに取得した、単語及び分類を含む登録対象データの情報を記憶するデータベースである。知識DB3は、図1では、知識DB生成サーバ1の外部に有するものになっている。知識DB3は、大量の画像データを含む大量の情報を記憶するため、大容量の記憶領域を有する。
<Knowledge DB3>
The knowledge DB 3 is a database that stores information on registration target data including words and classifications acquired from the registration target data by the knowledge DB generation server 1. In FIG. 1, the knowledge DB 3 is provided outside the knowledge DB generation server 1. The knowledge DB 3 has a large storage area for storing a large amount of information including a large amount of image data.

<自動応答装置4>
自動応答装置4は、知識DB3を用いて、質問に対する回答を行う装置である。
自動応答装置4は、例えば、PCや、スマートフォン等であり、ロボット等であってもよい。自動応答装置4は、PCやロボット等である場合には、例えば、観光案内所や、各所の受付等に設けられて、自動応答装置4が設置された場所を訪ねた一般人の質問に対して回答をするものである。また、自動応答装置4は、PCやスマートフォン等である場合には、例えば、自動応答装置4の所持者の質問に対して回答をするものである。以降の説明において、自動応答装置4を用いて質問をする者を、利用者という。
<Automatic response device 4>
The automatic response device 4 is a device that answers a question by using the knowledge DB 3.
The automatic response device 4 is, for example, a PC, a smartphone, or the like, and may be a robot or the like. In the case of a PC, a robot, or the like, the automatic response device 4 is provided at a tourist information center, reception desks, etc. at various places, and responds to questions from ordinary people who visit the place where the automatic response device 4 is installed. It is the answer. Further, in the case of a PC, a smartphone, or the like, the automatic response device 4 answers, for example, a question of the owner of the automatic response device 4. In the following description, a person who asks a question using the automatic response device 4 is referred to as a user.

自動応答装置4は、制御部40と、記憶部50と、入力部56と、表示部57と、通信インタフェース部59とを備える。
制御部40は、自動応答装置4の全体を制御するCPUである。制御部40は、記憶部50に記憶されているOSやアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
制御部40は、受付処理部41(質問受付手段、質問解析手段)と、DB処理部42(回答出力手段)と、回答出力部43(回答出力手段)とを備える。
The automatic response device 4 includes a control unit 40, a storage unit 50, an input unit 56, a display unit 57, and a communication interface unit 59.
The control unit 40 is a CPU that controls the entire automatic response device 4. The control unit 40 appropriately reads and executes the OS and application programs stored in the storage unit 50, thereby collaborating with the above-mentioned hardware to execute various functions.
The control unit 40 includes a reception processing unit 41 (question receiving means, question analysis means), a DB processing unit 42 (answer output means), and an answer output unit 43 (answer output means).

受付処理部41は、利用者による質問を受け付ける。利用者が、例えば、キーボード等を用いて文字を入力したり、マイクに話しかけたりすることで、受付処理部41は、利用者による質問を受け付ける。
そして、受付処理部41は、受け付けた質問に対してテキスト化が必要な場合にはテキスト化した上で、形態素解析を行い、例えば、質問に含まれる単語を抽出する。
The reception processing unit 41 receives questions from users. When the user inputs characters using a keyboard or the like or speaks to a microphone, the reception processing unit 41 receives a question from the user.
Then, when the received question needs to be converted into text, the reception processing unit 41 performs morphological analysis after converting it into text, and extracts, for example, words included in the question.

DB処理部42は、抽出した単語に基づいて知識DB3を検索する。そして、DB処理部42は、知識DB3を検索した結果の一覧を生成する。ここで、DB処理部42は、重みの大きい単語を含む登録対象データが上位になるようにした結果一覧を生成してもよい。
回答出力部43は、DB処理部42で生成した結果一覧から上位の登録対象データを、表示部57に出力させる。
The DB processing unit 42 searches the knowledge DB 3 based on the extracted words. Then, the DB processing unit 42 generates a list of the results of searching the knowledge DB 3. Here, the DB processing unit 42 may generate a result list in which the registration target data including a word having a large weight is ranked higher.
The answer output unit 43 causes the display unit 57 to output higher-level registration target data from the result list generated by the DB processing unit 42.

記憶部50は、制御部40が各種の処理を実行するために必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶領域である。
入力部56は、例えば、キーボードやマウス等の入力装置である。入力部56は、例えば、マイク等の音声入力装置であってもよい。
表示部57は、例えば、LCD(Liquid Crystal Display)等の表示装置である。
通信インタフェース部59は、通信ネットワークを介して知識DB3等との通信を行うためのインタフェースである。
The storage unit 50 is a storage area for a hard disk, a semiconductor memory element, or the like for storing programs, data, and the like necessary for the control unit 40 to execute various processes.
The input unit 56 is, for example, an input device such as a keyboard or a mouse. The input unit 56 may be, for example, a voice input device such as a microphone.
The display unit 57 is, for example, a display device such as an LCD (Liquid Crystal Display).
The communication interface unit 59 is an interface for communicating with the knowledge DB 3 and the like via the communication network.

ここで、コンピュータとは、制御部、記憶装置等を備えた情報処理装置をいい、知識DB生成サーバ1及び自動応答装置4は、それぞれ制御部、記憶部等を備えた情報処理装置であり、コンピュータの概念に含まれる。 Here, the computer means an information processing device provided with a control unit, a storage device, and the like, and the knowledge DB generation server 1 and the automatic response device 4 are information processing devices provided with a control unit, a storage unit, and the like, respectively. Included in the concept of computers.

<処理の説明>
次に、知識DB3に知識データを登録する処理について説明する。
図2は、本実施形態に係る知識DB生成サーバ1での知識データ登録処理を示すフローチャートである。
図3は、本実施形態に係る知識DB3に登録する登録対象データの例を示す図である。
図4は、本実施形態に係る知識DB生成サーバ1での文字処理を示すフローチャートである。
図5は、本実施形態に係る文字処理における画像加工処理の具体例を示す図である。
図6は、本実施形態に係る知識DB生成サーバ1での画像処理を示すフローチャートである。
図7は、本実施形態に係る知識DB生成サーバ1で生成した知識DB3に登録する知識データ31の例を示す図である。
<Explanation of processing>
Next, the process of registering the knowledge data in the knowledge DB 3 will be described.
FIG. 2 is a flowchart showing a knowledge data registration process in the knowledge DB generation server 1 according to the present embodiment.
FIG. 3 is a diagram showing an example of registration target data to be registered in the knowledge DB 3 according to the present embodiment.
FIG. 4 is a flowchart showing character processing in the knowledge DB generation server 1 according to the present embodiment.
FIG. 5 is a diagram showing a specific example of image processing processing in the character processing according to the present embodiment.
FIG. 6 is a flowchart showing image processing in the knowledge DB generation server 1 according to the present embodiment.
FIG. 7 is a diagram showing an example of knowledge data 31 registered in the knowledge DB 3 generated by the knowledge DB generation server 1 according to the present embodiment.

図2に示す知識データ登録処理は、登録対象データごとに行う処理である。登録対象データが複数ある場合には、制御部10は、登録対象データごとに、知識データ登録処理を、複数回繰り返す。
図2のステップS(以下、単に「S」という。)11において、知識DB生成サーバ1の制御部10(対象データ受付部11)は、登録対象データを受け付ける。ここで、登録したいメディアが電子化されたものではない場合には、制御部10は、スキャナ等を用いて画像化してから、画像化データを登録対象データとして受け付ける。
登録対象データの例として、画像化されたパンフレット61を、図3に示す。
図3に示すパンフレット61は、グルメに関するものである。パンフレット61は、テキスト62aから62cまでと、画像63aから63cまでを含む。
The knowledge data registration process shown in FIG. 2 is a process performed for each registration target data. When there are a plurality of registration target data, the control unit 10 repeats the knowledge data registration process a plurality of times for each registration target data.
In step S (hereinafter, simply referred to as “S”) 11 of FIG. 2, the control unit 10 (target data reception unit 11) of the knowledge DB generation server 1 receives the registration target data. Here, if the media to be registered is not digitized, the control unit 10 uses a scanner or the like to image the media, and then accepts the imaged data as the data to be registered.
As an example of the data to be registered, the imaged pamphlet 61 is shown in FIG.
The pamphlet 61 shown in FIG. 3 relates to gourmet food. The pamphlet 61 includes texts 62a to 62c and images 63a to 63c.

図2のS12において、制御部10は、文字処理を行う。
ここで、文字処理について、図4に基づき説明する。
図4のS21において、制御部10(文字処理部12)は、登録対象データに含まれるテキストを文字認識処理によって認識する。図3のパンフレット61の例では、「美味しいグルメMAP」のテキスト62aと、「鯛」のテキスト62bと、「まぐろ」のテキスト62cとを認識する。なお、制御部10は、テキスト62aを、行ごとに別テキストとして、「美味しい」「グルメ」「MAP」と3つの文字として認識してもよい。
図4のS22において、制御部10(文字処理部12)は、テキストに含まれる単語を取得する。そして、制御部10は、取得した単語を、記憶部20に一時記憶する。
In S12 of FIG. 2, the control unit 10 performs character processing.
Here, the character processing will be described with reference to FIG.
In S21 of FIG. 4, the control unit 10 (character processing unit 12) recognizes the text included in the registration target data by the character recognition process. In the example of the pamphlet 61 of FIG. 3, the text 62a of "delicious gourmet MAP", the text 62b of "sea bream", and the text 62c of "tuna" are recognized. The control unit 10 may recognize the text 62a as three characters, "delicious", "gourmand", and "MAP", as separate texts for each line.
In S22 of FIG. 4, the control unit 10 (character processing unit 12) acquires a word included in the text. Then, the control unit 10 temporarily stores the acquired word in the storage unit 20.

S23において、制御部10(対象データ確認処理部13)は、画像とテキストとの重なりを確認する。例えば、図3のテキスト62b及び62cは、それぞれ画像63b及び63cと重なっている。
S24において、制御部10は、画像とテキストとの重なりがあるか否かを判断する。1つでも画像とテキストとの重なりがある場合(S24:YES)には、制御部10は、処理をS25に移す。他方、画像とテキストとの重なりがない場合(S24:NO)には、制御部10は、処理を図2のS13に移す。
S25において、制御部10(対象データ確認処理部13)は、登録対象データの画像とテキストとの重なり部分に対して画像加工処理を行い、加工後対象データを生成する。そして、制御部10は、画像加工処理後の加工後対象データを、記憶部20に一時記憶する。その後、制御部10は、処理を図2のS13に移す。
In S23, the control unit 10 (target data confirmation processing unit 13) confirms the overlap between the image and the text. For example, the texts 62b and 62c of FIG. 3 overlap with the images 63b and 63c, respectively.
In S24, the control unit 10 determines whether or not there is an overlap between the image and the text. If there is even one overlap between the image and the text (S24: YES), the control unit 10 shifts the processing to S25. On the other hand, when there is no overlap between the image and the text (S24: NO), the control unit 10 shifts the processing to S13 in FIG.
In S25, the control unit 10 (target data confirmation processing unit 13) performs image processing processing on the overlapping portion of the image and the text of the registration target data, and generates the processed target data. Then, the control unit 10 temporarily stores the processed target data after the image processing process in the storage unit 20. After that, the control unit 10 shifts the processing to S13 in FIG.

ここで、画像加工処理について、図5を用いて説明する。
図5(A)は、パンフレット61のうちの、画像とテキストとの重なり部分を有するテキスト62cを含む画像63cを示す。この画像63cに対する画像加工処理は、次に示すステップを経て行われる。
制御部10は、画像63cに対して、テキスト62c含むテキスト領域を白抜きする。図5(B)は、制御部10による白抜き処理後の画像70であり、白抜き部71を含む。
次に、制御部10は、画像70の白抜き部71に対して、白抜き部71の周囲の平均色で補完する処理を行い、図5(C)に示すように、補完画像73を含む加工後画像72を生成する。
制御部10は、パンフレット61のテキスト62bを含む画像63bについても、同様に画像加工処理を行う。そのようにすることで、画像加工処理後の加工後対象データは、画像とテキストとの重なりがないものになる。
Here, the image processing process will be described with reference to FIG.
FIG. 5A shows an image 63c of the pamphlet 61 including a text 62c having an overlapping portion between the image and the text. The image processing process for the image 63c is performed through the following steps.
The control unit 10 outlines the text area including the text 62c with respect to the image 63c. FIG. 5B is an image 70 after the whitening process by the control unit 10, and includes the whitening unit 71.
Next, the control unit 10 performs a process of complementing the white portion 71 of the image 70 with the average color around the white portion 71, and includes the complementary image 73 as shown in FIG. 5 (C). The processed image 72 is generated.
The control unit 10 also performs image processing processing on the image 63b including the text 62b of the pamphlet 61. By doing so, the processed target data after the image processing process has no overlap between the image and the text.

図2のS13において、制御部10は、画像処理を行う。
ここで、画像処理について、図6に基づき説明する。
図6のS31において、制御部10(対象データ確認処理部13)は、登録対象データ(画像加工処理をした場合には、加工後対象データ)の色情報を取得する。その際、制御部10は、登録対象データの全体における各色情報についての割合を取得する。色情報は、登録対象データの全体の色合いによる印象を表すため、漠然とした類似イメージ検索において活用できるものである。制御部10は、取得した色情報を、記憶部20に一時記憶する。
In S13 of FIG. 2, the control unit 10 performs image processing.
Here, image processing will be described with reference to FIG.
In S31 of FIG. 6, the control unit 10 (target data confirmation processing unit 13) acquires the color information of the registration target data (when image processing is performed, the processed target data). At that time, the control unit 10 acquires the ratio of each color information in the entire registration target data. Since the color information expresses the impression of the entire color of the data to be registered, it can be used in a vague similar image search. The control unit 10 temporarily stores the acquired color information in the storage unit 20.

S32において、制御部10(画像処理部14)は、登録対象データに含まれる各画像を検出して切り出す画像切出処理を行う。この処理により、図3に示す画像63aから63cまでの3つの画像を切り出すことができる。なお、制御部10は、画像加工処理後の加工後対象データから画像を切り出すため、画像の切り出し精度を高精度なものにできる。 In S32, the control unit 10 (image processing unit 14) performs image cutting processing for detecting and cutting out each image included in the registration target data. By this processing, three images from images 63a to 63c shown in FIG. 3 can be cut out. Since the control unit 10 cuts out an image from the processed target data after the image processing process, the cutting accuracy of the image can be made highly accurate.

S33において、制御部10(画像処理部14)は、画像認識処理を行い、認識された単語を取得する。制御部10は、画像DB(図示せず)を用いて、切り出した画像に関する単語を取得してもよい。画像から取得する単語は、画像に含まれる物体に関するものの他、画像全体のシーンに関するものを含む。なお、この処理で使用する画像にはテキストが含まれていない。そのため、画像から単語を取得する処理を高精度に行うことができる。制御部10は、取得した単語を、記憶部20に一時記憶する。その後、制御部10は、処理を図2のS14に移す。 In S33, the control unit 10 (image processing unit 14) performs image recognition processing and acquires the recognized word. The control unit 10 may acquire a word related to the cut out image by using the image DB (not shown). Words obtained from an image include not only those related to objects contained in the image but also those related to the scene of the entire image. The image used in this process does not contain text. Therefore, the process of acquiring a word from an image can be performed with high accuracy. The control unit 10 temporarily stores the acquired word in the storage unit 20. After that, the control unit 10 shifts the processing to S14 in FIG.

図2のS14において、制御部10(上位語取得部15)は、テキストや画像から取得した単語の上位語を取得する。ここで、制御部10は、全ての単語の上位語を取得し、取得した上位語を単語に対応付けてもよい。また、制御部10は、全ての単語の上位語を取得する必要はなく、例えば、複数の単語に共通の上位語がある場合にのみ、上位語を取得してもよい。制御部10は、取得した上位語を、記憶部20に一時記憶する。 In S14 of FIG. 2, the control unit 10 (hypernym acquisition unit 15) acquires the hypernym of the word acquired from the text or the image. Here, the control unit 10 may acquire the hypernyms of all the words and associate the acquired hypernyms with the words. Further, the control unit 10 does not need to acquire the hypernyms of all the words, and may acquire the hypernyms only when, for example, there is a common hypernym in a plurality of words. The control unit 10 temporarily stores the acquired hypernym in the storage unit 20.

S15において、制御部10(単語分類部16)は、シーン関連用語辞書22を参照して各単語(上位語を含む)の分類を取得する。そして、制御部10は、各単語と取得した分類とを対応付ける。
S16において、制御部10(重み決定部17)は、各単語の重みを決定する。制御部10は、各単語の重みとして、上記したように、テキスト及び画像による様々な指標を用いることができる。また、制御部10は、上位語の重みを、対応する単語の重みと同様にするようにしてもよいし、複数の単語の上位語であれば、大きい重みと同様にするようにしてもよい。
In S15, the control unit 10 (word classification unit 16) obtains the classification of each word (including the hypernym) by referring to the scene-related term dictionary 22. Then, the control unit 10 associates each word with the acquired classification.
In S16, the control unit 10 (weight determination unit 17) determines the weight of each word. As described above, the control unit 10 can use various indexes based on text and images as the weight of each word. Further, the control unit 10 may make the weight of the hypernym the same as the weight of the corresponding word, or may make the weight of the hypernym of a plurality of words the same as the weight of the large word. ..

S17において、制御部10(データ登録部18)は、登録対象データに、単語と分類と重みとを対応付け、さらに色情報を対応付けて、知識DB3に登録する。ここで、制御部10は、全ての単語の上位語を取得した場合には、重みが所定以上である単語に対応付けられた上位語のみを登録対象にしてもよい。
その後、制御部10は、本処理を終了する。
In S17, the control unit 10 (data registration unit 18) associates the word, the classification, and the weight with the data to be registered, further associates the color information, and registers the data in the knowledge DB 3. Here, when the control unit 10 acquires the hypernyms of all the words, only the hypernyms associated with the words having a weight of a predetermined weight or more may be registered.
After that, the control unit 10 ends this process.

図7は、知識DB3に登録した知識データ31の例を示す。
図7に示す知識データ31は、図3に示すパンフレット61を登録対象データとしたものである。
知識データ31は、データ部31aと、キーワード分類部31bと、色情報部31cとを含む。
データ部31aには、登録対象データと、生成した場合には加工後対象データとを記憶する。
キーワード分類部31bには、単語と分類と重みとを対応付けて記憶する。
例えば、単語が「まぐろ」の場合、テキストと画像とから抽出された単語であり、分類は「物体」の「食べ物」であり、重みは、「2」であることを示す。
色情報部31cには、パンフレット61の全体を構成する各色の色情報と、その割合とを対応付けて記憶する。
FIG. 7 shows an example of the knowledge data 31 registered in the knowledge DB 3.
The knowledge data 31 shown in FIG. 7 is the data to be registered in the pamphlet 61 shown in FIG.
The knowledge data 31 includes a data unit 31a, a keyword classification unit 31b, and a color information unit 31c.
The data unit 31a stores the registration target data and, if generated, the processed target data.
The keyword classification unit 31b stores words, classifications, and weights in association with each other.
For example, when the word is "tuna", it is a word extracted from text and an image, the classification is "food" of "object", and the weight is "2".
In the color information unit 31c, the color information of each color constituting the entire pamphlet 61 and the ratio thereof are stored in association with each other.

この知識データ登録処理によって、知識DB生成サーバ1は、登録対象データを、知識データとして知識DB3に登録する。知識DB3には、このような登録対象データに対応した知識データ31が、複数記憶される。そして、知識DB3には、登録対象データに含まれるテキストだけでなく、画像に関する単語も含まれる。そして、画像に関する単語は、画像に含まれる物体だけでなく、画像から得られるシーンに関するものを含む。よって、知識DB3に登録される知識データを、検索時に使用可能な高精度のデータにできる。 By this knowledge data registration process, the knowledge DB generation server 1 registers the registration target data in the knowledge DB 3 as knowledge data. A plurality of knowledge data 31 corresponding to such registration target data are stored in the knowledge DB 3. Then, the knowledge DB 3 includes not only the text included in the registration target data but also the words related to the image. And the word about the image includes not only the object contained in the image but also the scene obtained from the image. Therefore, the knowledge data registered in the knowledge DB 3 can be converted into highly accurate data that can be used at the time of search.

次に、知識DB3を用いた自動応答に関する処理について説明する。
図8は、本実施形態に係る自動応答装置4での質問応答処理を示すフローチャートである。
図9は、本実施形態に係る自動応答装置4における具体例を示す図である。
図8のS41において、自動応答装置4の制御部40(受付処理部41)は、利用者からの質問を、入力部56を介して受け付ける。
S42において、制御部40(受付処理部41)は、受け付けた質問をテキスト化する。なお、利用者からの質問を、キーボード等の入力装置を用いて受け付けた場合には、既にテキスト化されているため、当該処理は不要である。
S43において、制御部40(受付処理部41)は、形態素解析処理を行い、単語を抽出する。
Next, the process related to the automatic response using the knowledge DB 3 will be described.
FIG. 8 is a flowchart showing a question answering process in the automatic answering device 4 according to the present embodiment.
FIG. 9 is a diagram showing a specific example of the automatic response device 4 according to the present embodiment.
In S41 of FIG. 8, the control unit 40 (reception processing unit 41) of the automatic response device 4 receives a question from the user via the input unit 56.
In S42, the control unit 40 (reception processing unit 41) converts the received question into a text. When a question from a user is received using an input device such as a keyboard, the process is not necessary because it has already been converted into text.
In S43, the control unit 40 (reception processing unit 41) performs morphological analysis processing and extracts words.

S44において、制御部40(DB処理部42)は、抽出した単語に基づいて知識DB3を検索する。そして、制御部40(DB処理部42)は、重みの大きい単語を含む登録対象データを上位にした検索結果の一覧を生成する。
S45において、制御部40(回答出力部43)は、生成した検索結果の一覧から上位の登録対象データを、表示部57に出力する。その後、制御部40は、本処理を終了する。
In S44, the control unit 40 (DB processing unit 42) searches the knowledge DB 3 based on the extracted words. Then, the control unit 40 (DB processing unit 42) generates a list of search results in which the registration target data including a word having a large weight is ranked higher.
In S45, the control unit 40 (answer output unit 43) outputs the higher-level registration target data from the generated search result list to the display unit 57. After that, the control unit 40 ends this process.

図9は、利用者による利用場面の一例を示す。
利用者が、「夜、デートで使えそうな美味しいご飯が食べられる店を探したいんだけど。」と発言すると、自動応答装置4の制御部40は、マイク56a(入力部56)を介して質問を受け付ける。
そして、自動応答装置4による処理結果として、制御部40は、パンフレット61をディスプレイ57a(表示部57)に表示し、バーチャルなキャラクタが喋るように、「こんな情報がありますが、いかがですか?」という音声がスピーカ58から出力される。その際、制御部40は、パンフレット61のうちキーワードとなる発言との関連部分を、ハイライト等による強調表示をしてもよい。
FIG. 9 shows an example of a usage scene by a user.
When the user says, "I want to find a restaurant where I can eat delicious rice that can be used on a date at night.", The control unit 40 of the automatic response device 4 asks a question via the microphone 56a (input unit 56). Accept.
Then, as a result of processing by the automatic response device 4, the control unit 40 displays the pamphlet 61 on the display 57a (display unit 57), and so that the virtual character speaks, "I have this information, how about it?" Is output from the speaker 58. At that time, the control unit 40 may highlight the portion of the pamphlet 61 that is related to the keyword statement by highlighting or the like.

ここで、利用者が他の情報をさらに要求する場合には、「他には?」と発言したり、次を示す入力部(図示せず)による操作を行うことで、制御部40は、重みの大きい単語を含む登録対象データを上位にした検索結果の一覧から順番に、登録対象データを表示部57に出力してもよい。 Here, when the user further requests other information, the control unit 40 can perform an operation by saying "What else?" Or by performing an operation by an input unit (not shown) indicating the following. The registration target data may be output to the display unit 57 in order from the list of search results in which the registration target data including a word having a large weight is ranked higher.

このように、本実施形態の自動応答システム100によれば、以下のような効果がある。
(1)知識DB生成サーバ1は、登録対象データ全体並びに登録対象データに含まれるテキスト及び画像から得られた単語の分類を取得し、登録対象データに単語と分類とを対応付けて知識DB3に登録する。よって、知識DB3には、登録対象データから得られた様々な単語を分類に対応付けて、知識データとして登録できる。
(2)知識DB生成サーバ1は、シーンに関する用語を記憶したシーン関連用語辞書22を参照して、単語の分類として、少なくともシーンであるか否かに分類する。よって、登録対象データの全体や、画像の雰囲気を伝えるシーンとして、各単語を分類できる。
(3)知識DB生成サーバ1は、画像とテキストとの重なり有無を確認し、重なっている場合には、画像からテキストを削除する加工を行い、処理後の画像を含む加工後対象データに対して画像処理を行う。よって、テキストを含まない画像を処理対象にすることで、画像処理の精度を向上できる。
As described above, the automatic response system 100 of the present embodiment has the following effects.
(1) The knowledge DB generation server 1 acquires the classification of words obtained from the entire registration target data and the texts and images contained in the registration target data, and associates the words and classifications with the registration target data in the knowledge DB 3. to register. Therefore, various words obtained from the registration target data can be associated with the classification and registered as knowledge data in the knowledge DB 3.
(2) The knowledge DB generation server 1 refers to the scene-related term dictionary 22 that stores terms related to the scene, and classifies the words as at least whether or not they are scenes. Therefore, each word can be classified as the whole of the data to be registered or as a scene that conveys the atmosphere of the image.
(3) The knowledge DB generation server 1 confirms whether or not the image and the text overlap, and if they overlap, the text is deleted from the image, and the processed target data including the processed image is subjected to processing. Image processing is performed. Therefore, the accuracy of image processing can be improved by targeting an image that does not contain text as a processing target.

(4)知識DB生成サーバ1は、単語の上位語を取得して、取得した上位語の分類を取得するので、取得した上位語及び分類を、知識DB3に登録でき、知識DB3に登録する知識データを、より精度の高いものにできる。
(5)知識DB生成サーバ1は、単語の重みを決定し、知識DB3に単語にさらに対応付けて重みを登録する。重みは、単語の出現頻度や強調度合や、画像の占有度合によって決定する。よって、質問に対する回答に知識DB3を使用する際に、重みを用いて、より精度の高い、よい回答を出力できる可能性がある。
(4) Since the knowledge DB generation server 1 acquires the hypernym of a word and acquires the acquired hypernym classification, the acquired hypernym and classification can be registered in the knowledge DB 3 and the knowledge to be registered in the knowledge DB 3. The data can be made more accurate.
(5) The knowledge DB generation server 1 determines the weight of a word, and further associates the weight with the word and registers the weight in the knowledge DB 3. The weight is determined by the frequency of appearance of words, the degree of emphasis, and the degree of occupancy of the image. Therefore, when the knowledge DB 3 is used for answering a question, there is a possibility that a better answer with higher accuracy can be output by using the weight.

(6)自動応答装置4は、質問を受け付けると、質問をテキスト化して形態素解析を行い、解析結果に基づいて知識DB生成サーバ1が生成した知識DB3を検索し、重みが大きいものから順番に登録対象データを質問に対する回答として出力する。よって、質問に対して、知識DB3を用いて回答を行うことができる。その際、重みを用いることで、質問により適合した知識DB3の登録対象データを、回答として出力できる。 (6) When the automatic response device 4 receives a question, the automatic response device 4 converts the question into text and performs morphological analysis, searches for the knowledge DB 3 generated by the knowledge DB generation server 1 based on the analysis result, and sequentially in descending order of weight. Output the registration target data as an answer to the question. Therefore, it is possible to answer the question using the knowledge DB3. At that time, by using the weight, the registration target data of the knowledge DB 3 more suitable for the question can be output as an answer.

以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されるものではない。また、実施形態に記載した効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載したものに限定されない。なお、上述した実施形態及び後述する変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。 Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments. Moreover, the effects described in the embodiments are merely a list of the most suitable effects resulting from the present invention, and the effects according to the present invention are not limited to those described in the embodiments. The above-described embodiment and the modified form described later can be used in combination as appropriate, but detailed description thereof will be omitted.

(変形形態)
(1)本実施形態では、知識DB生成サーバと、自動応答装置とを異なる装置であるものとして説明したが、これに限定されない。知識DB生成サーバと、自動応答装置との機能が一体になった装置であってもよい。また、知識DBは、例えば、知識DB生成サーバの記憶部に有してもよい。
(Transformed form)
(1) In the present embodiment, the knowledge DB generation server and the automatic response device have been described as different devices, but the present invention is not limited to this. It may be a device in which the functions of the knowledge DB generation server and the automatic response device are integrated. Further, the knowledge DB may be stored in the storage unit of the knowledge DB generation server, for example.

(2)本実施形態では、重みの決定を、複数回登場する単語が重要単語であると考えて重みを大きくするものを例に説明したが、これに限定されない。例えば、登録対象データに占める当該単語を表す画像の占有割合が大きいものほど、重みを大きくしてもよい。また、文字のフォントが大きかったり、太文字だったり、といった強調するものである場合に、重みを大きくしてもよい。 (2) In the present embodiment, the determination of the weight is described by taking as an example a word in which a word appearing a plurality of times is considered to be an important word and the weight is increased, but the weight is not limited to this. For example, the larger the occupancy ratio of the image representing the word in the registration target data, the larger the weight may be. Further, when the font of the character is large or the character is bold, the weight may be increased.

(3)本実施形態では、知識DBの利用において、重みの大きい登録対象データから順番に出力するものを例に説明したが、これに限定されない。例えば、検索結果として複数の登録対象データを一覧として出力してもよく、利用者が一覧から登録対象データを指定すると、指定した登録対象データの詳細を出力するものであってもよい。
(4)本実施形態により知識DBに登録した色情報は、例えば、漠然とした類似イメージ検索で、活用することができる。また、一度検索した後に、再度同じ情報を得たい場合等に、キー情報として利用できる。
(5)本実施形態で生成した知識データ同士を、さらに関連付けてもよい。例えば、文字処理手段が、見出しになるテキストを抽出する。見出しになるテキストは、予め指定してもよい。そして、関連付け手段が、同一又は類似する見出しを有する前記登録対象データを関連付けるようにすればよい。
(3) In the present embodiment, in the use of the knowledge DB, the data to be output in order from the registration target data having the largest weight has been described as an example, but the present invention is not limited to this. For example, a plurality of registration target data may be output as a list as a search result, and when the user specifies the registration target data from the list, the details of the designated registration target data may be output.
(4) The color information registered in the knowledge DB according to the present embodiment can be utilized, for example, by a vague similar image search. Also, it can be used as key information when you want to obtain the same information again after searching once.
(5) The knowledge data generated in the present embodiment may be further associated with each other. For example, the character processing means extracts the text to be the heading. The text to be the heading may be specified in advance. Then, the association means may associate the registration target data having the same or similar headings.

1 知識DB生成サーバ
3 知識DB
4 自動応答装置
10,40 制御部
12 文字処理部
13 対象データ確認処理部
14 画像処理部
15 上位語取得部
16 単語分類部
17 重み決定部
18 データ登録部
20,50 記憶部
21a プログラム
22 シーン関連用語辞書
41 受付処理部
42 DB処理部
43 回答出力部
56 入力部
57 表示部
61 パンフレット
100 自動応答システム
1 Knowledge DB generation server 3 Knowledge DB
4 Automatic response device 10, 40 Control unit 12 Character processing unit 13 Target data confirmation processing unit 14 Image processing unit 15 Hypernym acquisition unit 16 Word classification unit 17 Weight determination unit 18 Data registration unit 20, 50 Storage unit 21a Program 22 Scene-related Term dictionary 41 Reception processing unit 42 DB processing unit 43 Answer output unit 56 Input unit 57 Display unit 61 Brochure 100 Automatic response system

Claims (10)

登録対象データに含まれる文字列を認識又は取得し、前記文字列に含まれる単語を抽出する文字処理手段と、
前記登録対象データに画像認識処理を行い、認識された単語を取得する画像処理手段と、
前記文字処理手段及び前記画像処理手段の処理を行った結果として得られた前記単語の分類を、辞書データを用いて取得する単語分類手段と、
前記登録対象データに、前記単語と前記分類とを対応付けて、知識データベースに記憶させるデータ登録手段と、
を備える、知識データベース生成装置。
A character processing means for recognizing or acquiring a character string included in the data to be registered and extracting a word contained in the character string, and a character processing means.
An image processing means that performs image recognition processing on the registration target data and acquires the recognized word,
A word classification means for acquiring the classification of the word obtained as a result of processing the character processing means and the image processing means using dictionary data, and a word classification means.
A data registration means for associating the word with the classification with the registration target data and storing the word in the knowledge database.
A knowledge database generator.
請求項1に記載の知識データベース生成装置において、
前記画像認識処理は、画像のシーンを認識する、知識データベース生成装置。
In the knowledge database generator according to claim 1,
The image recognition process is a knowledge database generation device that recognizes an image scene.
請求項1又は請求項2に記載の知識データベース生成装置において、
前記登録対象データを分析して画像と文字列との重なりの有無を確認し、重なりがある場合には、前記文字列を含む文字列領域を削除し、削除した前記文字列領域を、前記文字列領域の周囲の画像を用いて補完する画像加工手段を備え、
前記画像処理手段は、前記画像加工手段による処理後の前記登録対象データを用いて処理を行う、知識データベース生成装置。
In the knowledge database generator according to claim 1 or 2.
The registration target data is analyzed to confirm whether or not the image and the character string overlap, and if there is an overlap, the character string area including the character string is deleted, and the deleted character string area is used as the character. Equipped with image processing means to complement using the image around the column area,
The image processing means is a knowledge database generation device that performs processing using the registration target data after processing by the image processing means.
請求項1から請求項3までのいずれかに記載の知識データベース生成装置において、
前記文字処理手段及び前記画像処理手段の処理を行った結果として得られた前記単語の上位語を取得する上位語取得手段を備え、
前記単語分類手段は、前記上位語取得手段により取得した前記上位語を前記単語として、前記分類をさらに取得する、知識データベース生成装置。
In the knowledge database generator according to any one of claims 1 to 3.
It is provided with a hypernym acquisition means for acquiring a hypernym of the word obtained as a result of processing the character processing means and the image processing means.
The word classification means is a knowledge database generation device that further acquires the classification by using the hypernym acquired by the hypernym acquisition means as the word.
請求項1から請求項4までのいずれかに記載の知識データベース生成装置において、
前記文字処理手段及び前記画像処理手段の処理を行った結果として得られた前記単語の重みを決定する重み決定手段を備え、
前記データ登録手段は、前記単語に、前記重み決定手段により決定した前記重みをさらに対応付けて前記知識データベースに記憶する、知識データベース生成装置。
In the knowledge database generator according to any one of claims 1 to 4.
A weight determining means for determining the weight of the word obtained as a result of processing the character processing means and the image processing means is provided.
The data registration means is a knowledge database generation device that further associates the word with the weight determined by the weight determination means and stores it in the knowledge database.
請求項5に記載の知識データベース生成装置において、
前記重み決定手段は、前記登録対象データにおける前記単語の出現頻度及び前記単語の強調表示の態様、並びに、前記登録対象データの領域における前記単語に対応する画像の占める割合のうち少なくともいずれかに基づいて、前記単語の重みを決定する、知識データベース生成装置。
In the knowledge database generator according to claim 5,
The weight determining means is based on at least one of the frequency of appearance of the word in the registration target data, the mode of highlighting the word, and the proportion of the image corresponding to the word in the region of the registration target data. A knowledge database generator that determines the weight of the word.
請求項1から請求項6までのいずれかに記載の知識データベース生成装置において、
前記登録対象データを分析して色情報を取得する色情報取得手段を備え、
前記データ登録手段は、前記色情報取得手段により取得した前記色情報を、前記登録対象データにさらに対応付けて、前記知識データベースに記憶させる、知識データベース生成装置。
In the knowledge database generator according to any one of claims 1 to 6.
A color information acquisition means for analyzing the registration target data and acquiring color information is provided.
The data registration means is a knowledge database generation device that further associates the color information acquired by the color information acquisition means with the registration target data and stores it in the knowledge database.
請求項1から請求項7までのいずれかに記載の知識データベース生成装置において、
前記文字処理手段は、見出しになる前記文字列を抽出し、
同一又は類似する前記見出しを有する前記登録対象データを関連付ける関連付け手段を備える、知識データベース生成装置。
In the knowledge database generator according to any one of claims 1 to 7.
The character processing means extracts the character string to be a heading and obtains the character string.
A knowledge database generator comprising associating means for associating the registration target data having the same or similar headings.
請求項1から請求項8までのいずれかに記載の知識データベース生成装置としてコンピュータを機能させるためのプログラム。 The program for operating a computer as the knowledge database generator according to any one of claims 1 to 8. 請求項5又は請求項6に記載の知識データベース生成装置において生成した前記知識データベースを用いる、自動応答システムであって、
質問を受け付ける質問受付手段と、
前記質問受付手段により受け付けた前記質問であって、文字列化された前記質問に対して形態素解析を行う質問解析手段と、
前記質問解析手段による解析結果に基づいて前記知識データベースを検索し、検索結果として取得した、前記単語に対応した前記重みの合計が大きいものを優先に、前記登録対象データを出力する回答出力手段と、
を備える、自動応答システム。
An automated response system using the knowledge database generated by the knowledge database generator according to claim 5 or 6.
Question reception means for accepting questions and
A question analysis means for performing morphological analysis on the question received by the question receiving means and converted into a character string, and a question analysis means.
An answer output means that searches the knowledge database based on the analysis result by the question analysis means and outputs the registration target data with priority given to the one having a large total of the weights corresponding to the words acquired as the search result. ,
Equipped with an automatic response system.
JP2020130361A 2020-07-31 Knowledge database generation device and program Active JP7512748B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020130361A JP7512748B2 (en) 2020-07-31 Knowledge database generation device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020130361A JP7512748B2 (en) 2020-07-31 Knowledge database generation device and program

Publications (2)

Publication Number Publication Date
JP2022026752A true JP2022026752A (en) 2022-02-10
JP7512748B2 JP7512748B2 (en) 2024-07-09

Family

ID=

Similar Documents

Publication Publication Date Title
CN109685056B (en) Method and device for acquiring document information
US9230543B2 (en) Method and apparatus for providing contents about conversation
US20160344860A1 (en) Document and image processing
US7712020B2 (en) Transmitting secondary portions of a webpage as a voice response signal in response to a lack of response by a user
US10832049B2 (en) Electronic document classification system optimized for combining a plurality of contemporaneously scanned documents
US8874590B2 (en) Apparatus and method for supporting keyword input
CN110597952A (en) Information processing method, server, and computer storage medium
US20220254507A1 (en) Knowledge graph-based question answering method, computer device, and medium
JP4904496B2 (en) Document similarity derivation device and answer support system using the same
US20230195780A1 (en) Image Query Analysis
EP1803076A2 (en) An electronic device and method for visual text interpretation
US20060190240A1 (en) Method and system for locating language expressions using context information
CN110362744B (en) Reading recommendation method and system, terminal equipment, computer equipment and medium
JP2002537604A (en) Document similarity search
CN100368960C (en) Information processing method and apparatus
CA2488961C (en) Systems and methods for semantic stenography
KR102287431B1 (en) Apparatus for recording meeting and meeting recording system
Sripriya et al. Speech-based virtual travel assistant for visually impaired
CN109660621A (en) A kind of content delivery method and service equipment
JP2009003814A (en) Method and system for answering question
JP2022026752A (en) Knowledge database generation device, program, and automated answering system
Selvaraj et al. Enhanced portable text to speech converter for visually impaired
JP7512748B2 (en) Knowledge database generation device and program
JPH0962684A (en) Information retrieval method and information retrieval device, and information guiding method and information guiding device
KR101401503B1 (en) System, Method and Apparatus for Providing Service Based on User Voice

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240528