JP6287529B2 - Keyword determining apparatus, keyword determining program, and keyword determining method - Google Patents

Keyword determining apparatus, keyword determining program, and keyword determining method Download PDF

Info

Publication number
JP6287529B2
JP6287529B2 JP2014086039A JP2014086039A JP6287529B2 JP 6287529 B2 JP6287529 B2 JP 6287529B2 JP 2014086039 A JP2014086039 A JP 2014086039A JP 2014086039 A JP2014086039 A JP 2014086039A JP 6287529 B2 JP6287529 B2 JP 6287529B2
Authority
JP
Japan
Prior art keywords
word
keyword
image
character
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014086039A
Other languages
Japanese (ja)
Other versions
JP2015207069A (en
Inventor
美佐子 宗
美佐子 宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014086039A priority Critical patent/JP6287529B2/en
Publication of JP2015207069A publication Critical patent/JP2015207069A/en
Application granted granted Critical
Publication of JP6287529B2 publication Critical patent/JP6287529B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、キーワード決定装置、キーワード決定プログラム及びキーワード決定方法に関する。   The present invention relates to a keyword determination device, a keyword determination program, and a keyword determination method.

画像を管理する場合、画像にキーワードを紐付けることで管理しやすくなり、画像へのアクセス性も向上する。このキーワードの紐付け作業をユーザが手作業で行うこととすると、手間と時間を要する。したがって、画像から自動的にキーワードを抽出して紐付けができるようになれば、ユーザの利便性も向上する。   When managing images, it is easier to manage by associating keywords with images, and the accessibility to the images is also improved. If the keyword is linked manually by the user, it takes time and effort. Therefore, if the keyword can be automatically extracted from the image and linked, the convenience for the user is improved.

従来、駅名板を撮影した画像情報から文字列を抽出し、文字列のサイズや位置に基づいて、駅名を抽出する方法が知られている(例えば、特許文献1等参照)。   Conventionally, a method of extracting a character string from image information obtained by photographing a station name plate and extracting a station name based on the size and position of the character string is known (see, for example, Patent Document 1).

特開2009−130697号公報JP 2009-130697 A

しかしながら、上記特許文献1のように、文字列の位置やサイズに基づいて画像のキーワードを特定しようとしても、キーワードとなりうる文字列の位置やサイズは撮影した画像に含まれる看板の種類によって異なる。このため、上記特許文献1を用いたとしても画像のキーワードを正しく特定できない場合がある。   However, as in Patent Document 1, even if an image keyword is specified based on the position and size of the character string, the position and size of the character string that can be a keyword vary depending on the type of signboard included in the photographed image. For this reason, even if the said patent document 1 is used, the keyword of an image may not be correctly specified.

1つの側面では、本発明は、画像のキーワードとして適切なキーワードを決定することが可能なキーワード決定装置、キーワード決定プログラム及びキーワード決定方法を提供することを目的とする。   In one aspect, an object of the present invention is to provide a keyword determination device, a keyword determination program, and a keyword determination method capable of determining an appropriate keyword as an image keyword.

一つの態様では、キーワード決定装置は、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部と、画像に複数の文字列が含まれる場合、前記記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定する特定部と、前記特定部が特定した単語を示す前記画像に含まれる文字列の種類数又は個数が多い単語を前記文字列の種類数又は個数が少ない単語よりも優先して、特定した単語の中から前記画像を示すキーワードを決定する決定部と、を備えている。
In one aspect, the keyword determination device includes a storage unit that associates and stores a word that can be a keyword and a character string of one or more character systems that indicate the word, and when the image includes a plurality of character strings, Referring to the storage unit, a specifying unit for specifying a word indicated by each character string included in the image, and a word having a large number of types or number of character strings included in the image indicating the word specified by the specifying unit. A determination unit that determines a keyword indicating the image from among the specified words in preference to a word having a small number of types or number of character strings .

一つの態様では、キーワード決定プログラムは、画像に複数の文字列が含まれる場合、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定し、特定した前記単語を示す前記画像に含まれる文字列の種類数又は個数が多い単語を前記文字列の種類数又は個数が少ない単語よりも優先して、特定した前記単語の中から前記画像を示すキーワードを決定する、処理をコンピュータに実行させるプログラムである。
In one aspect, when a plurality of character strings are included in an image, the keyword determination program refers to a storage unit that stores a word that can be a keyword and a character string of one or more character systems that indicate the word in association with each other. Then, a word indicated by each character string included in the image is specified, and a word having a large number or number of character strings included in the image indicating the specified word is a word having a small number or number of character strings. This is a program that causes a computer to execute a process of determining a keyword indicating the image from among the identified words with priority over the word.

一つの態様では、キーワード決定方法は、画像に複数の文字列が含まれる場合、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定し、特定した前記単語を示す前記画像に含まれる文字列の種類数又は個数が多い単語を前記文字列の種類数又は個数が少ない単語よりも優先して、特定した前記単語の中から前記画像を示すキーワードを決定する、処理をコンピュータが実行するキーワード決定方法である。
In one aspect, when a plurality of character strings are included in an image, the keyword determination method refers to a storage unit that associates and stores a word that can be a keyword and a character string of one or more character systems that indicate the word. Then, a word indicated by each character string included in the image is specified, and a word having a large number or number of character strings included in the image indicating the specified word is a word having a small number or number of character strings. This is a keyword determination method in which a computer executes a process of determining a keyword indicating the image from among the specified words with priority over the word.

画像のキーワードとして適切なキーワードを決定することができる。   An appropriate keyword can be determined as an image keyword.

一実施形態に係る電子機器のハードウェア構成を概略的に示すブロック図である。It is a block diagram which shows roughly the hardware constitutions of the electronic device which concerns on one Embodiment. CPUの機能ブロック図である。It is a functional block diagram of CPU. 単語DBのデータ構造を示す図である。It is a figure which shows the data structure of word DB. CPUによるキーワード決定処理を示すフローチャートである。It is a flowchart which shows the keyword determination process by CPU. 図5(a)〜図5(c)は、図4の処理を説明するための図である。FIG. 5A to FIG. 5C are diagrams for explaining the processing of FIG. 看板領域の別例を示す図である。It is a figure which shows another example of a signboard area | region.

以下、一実施形態について、図1〜図6に基づいて詳細に説明する。図1には、本実施形態に係る電子機器100のハードウェア構成が概略的に示されている。電子機器100は、例えば、スマートフォンや携帯電話などの端末や、コンパクトカメラや一眼レフカメラなどの撮影装置等であるものとする。   Hereinafter, an embodiment will be described in detail with reference to FIGS. FIG. 1 schematically shows a hardware configuration of an electronic device 100 according to the present embodiment. The electronic device 100 is assumed to be, for example, a terminal such as a smartphone or a mobile phone, or a photographing device such as a compact camera or a single-lens reflex camera.

電子機器100は、図1に示すように、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、ネットワークインタフェース97、表示部93、入力部95、撮影部80、及び可搬型記憶媒体用ドライブ99等を備えている。これら電子機器100の構成各部は、バス98に接続されている。表示部93は、液晶ディスプレイ等を含み、入力部95は、タッチパネルや入力ボタン等を含む。撮影部80は、入力部95を介したユーザからの指示に基づいて、撮影を行う。なお、電子機器100では、CPU90は、撮影部80が撮影した画像をHDD96で管理する際、画像のキーワードを決定して、該キーワードを紐付けた状態で画像を管理する。すなわち、CPU90は、キーワード決定装置として機能する。具体的には、電子機器100では、ROM92あるいはHDD96に格納されているプログラム(キーワード決定プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(キーワード決定プログラムを含む)をCPU90が実行することにより、図2に示す機能が実現される。なお、キーワードとは、画像中に含まれる単語のうち、画像を撮影した撮影者が撮影を意図した(撮影者が撮影しようと考えた)と想定される単語を意味する。   As shown in FIG. 1, the electronic device 100 includes a CPU (Central Processing Unit) 90, a ROM (Read Only Memory) 92, a RAM (Random Access Memory) 94, a storage unit (here, an HDD (Hard Disk Drive)) 96, A network interface 97, a display unit 93, an input unit 95, a photographing unit 80, a portable storage medium drive 99, and the like are provided. Each component of the electronic device 100 is connected to a bus 98. The display unit 93 includes a liquid crystal display or the like, and the input unit 95 includes a touch panel, an input button, or the like. The imaging unit 80 performs imaging based on an instruction from the user via the input unit 95. In the electronic device 100, when managing an image captured by the capturing unit 80 with the HDD 96, the CPU 90 determines a keyword of the image and manages the image in a state in which the keyword is associated. That is, the CPU 90 functions as a keyword determination device. Specifically, in the electronic device 100, a program (including a keyword determination program) stored in the ROM 92 or the HDD 96 or a program read from the portable storage medium 91 by the portable storage medium drive 99 (a keyword determination program is stored). 2) is realized by the CPU 90 executing the function shown in FIG. Note that the keyword means a word that is assumed to be taken by the photographer who has taken the image (though the photographer wanted to photograph) among the words included in the image.

図2には、CPU90の機能ブロック図が概略的に示されている。図2に示すように、CPU90は、画像取得部12、看板領域推定部14、文字列抽出部16、文字認識部18、特定部としての単語検出部20、及び決定部としてのキーワード決定部22、として機能する。なお、図2には、HDD96等に格納されている文字認識辞書DB30及び記憶部としての単語DB32も図示されている。   FIG. 2 schematically shows a functional block diagram of the CPU 90. As shown in FIG. 2, the CPU 90 includes an image acquisition unit 12, a signboard region estimation unit 14, a character string extraction unit 16, a character recognition unit 18, a word detection unit 20 as a specifying unit, and a keyword determination unit 22 as a determination unit. , Function as. 2 also shows a character recognition dictionary DB 30 stored in the HDD 96 or the like and a word DB 32 as a storage unit.

画像取得部12は、撮影部80が撮影した画像を取得し、看板領域推定部14に送信する。   The image acquisition unit 12 acquires the image captured by the imaging unit 80 and transmits it to the signboard area estimation unit 14.

看板領域推定部14は、画像取得部12から受信した画像中から看板領域を推定して切り出しを行う。看板領域の推定方法としては、公知の方法(例えば、周他,「情景画像からの看板領域と看板中の情報抽出」,PRMU, No.102,2003など)を採用することができる。   The signboard area estimation unit 14 estimates and extracts a signboard area from the image received from the image acquisition unit 12. As a signboard area estimation method, a known method (for example, Zhou et al., “Extracting Signboard Area and Information in Signboard from Scene Image”, PRMU, No. 102, 2003, etc.) can be employed.

文字列抽出部16は、看板領域推定部14において切り出された看板領域を文字とそれ以外に分離して文字部分のみを画像として抽出する。なお、文字列抽出部16が抽出する画像を、文字列画像と呼ぶものとする。   The character string extraction unit 16 separates the signboard area cut out by the signboard area estimation unit 14 into characters and the others and extracts only the character part as an image. The image extracted by the character string extraction unit 16 is referred to as a character string image.

文字認識部18は、文字認識辞書DB30を参照して、文字列抽出部16が抽出した文字列画像に対し文字認識を実行し、文字認識結果を得る。なお、文字認識辞書DB30には、通常の文字認識処理において用いられる辞書データが格納されている。   The character recognition unit 18 performs character recognition on the character string image extracted by the character string extraction unit 16 with reference to the character recognition dictionary DB 30 to obtain a character recognition result. The character recognition dictionary DB 30 stores dictionary data used in normal character recognition processing.

単語検出部20は、文字認識部18による文字認識結果と、単語DB32に基づいて、看板領域内に存在している単語を検出する。図3には単語DB32のデータ構造が示されている。図3に示すように、単語DB32は、「単語」、「文字列通番」、「文字列」の各フィールドを有する。「単語」のフィールドには、画像のキーワードになりうる単語、例えば地名、駅名などが格納される。「文字列通番」のフィールドには登録文字列に割り当てられた通し番号が格納される。「文字列」のフィールドには、画像のキーワードになりうる単語に対応する1又は複数の文字体系の文字列が格納される。なお、文字体系とは、漢字表記、ひらがな表記、カタカナ表記、ローマ字表記、英語表記などを意味する。例えば、文字列「富士通城」「ふじつうじょう」「Fujitsu Castle」のように、使われている文字種が異なってもそれらの文字列が示す(意味する)共通の単語を「単語」とする。すなわち、「単語」は、共通する意味を有する1又は複数の文字列を代表する文字列であるともいえる。   The word detection unit 20 detects a word existing in the signboard area based on the character recognition result by the character recognition unit 18 and the word DB 32. FIG. 3 shows the data structure of the word DB 32. As shown in FIG. 3, the word DB 32 has fields of “word”, “character string serial number”, and “character string”. In the “word” field, words that can be keywords of the image, such as place names and station names, are stored. The “character string serial number” field stores a serial number assigned to the registered character string. The “character string” field stores a character string of one or more character systems corresponding to a word that can be a keyword of an image. The character system means kanji notation, hiragana notation, katakana notation, romaji notation, English notation, and the like. For example, a common word indicated (meaning) by a character string, such as the character strings “Fujitsu Castle”, “Fujitsu Ujo”, and “Fujitsu Castle”, even if the character types used are different. That is, it can be said that the “word” is a character string representing one or more character strings having a common meaning.

キーワード決定部22は、検出された単語の数が単数の場合、その単語をキーワードとして決定する。一方、検出された単語の数が複数の場合、キーワード決定部22は、看板領域内に存在していた文字列に基づいてキーワードを決定する。なお、キーワードの決定方法の詳細については、後述する。なお、CPU90では、キーワード決定部22が決定したキーワードと画像とを紐付けて、HDD96において画像を管理するものとする。   The keyword determination part 22 determines the word as a keyword, when the number of the detected words is single. On the other hand, when the number of detected words is plural, the keyword determination unit 22 determines a keyword based on the character string existing in the signboard area. Details of the keyword determination method will be described later. Note that the CPU 90 manages the image in the HDD 96 by associating the keyword determined by the keyword determination unit 22 with the image.

次に、CPU90によるキーワード決定処理について、図4のフローチャートに沿って詳細に説明する。   Next, the keyword determination process by the CPU 90 will be described in detail along the flowchart of FIG.

図4の処理では、ステップS10において、画像取得部12が、画像が撮影部80から入力されるまで待機する。この場合、撮影部80が画像を撮影し、撮影部80から画像が送信されてくると、画像取得部12は、ステップS12に移行する。   In the process of FIG. 4, in step S <b> 10, the image acquisition unit 12 waits until an image is input from the imaging unit 80. In this case, when the imaging unit 80 captures an image and the image is transmitted from the imaging unit 80, the image acquisition unit 12 proceeds to step S12.

ステップS12に移行すると、画像取得部12は、撮影部80から送信されてきた画像を取得する。画像取得部12は、取得した画像を看板領域推定部14に送信する。   In step S12, the image acquisition unit 12 acquires the image transmitted from the imaging unit 80. The image acquisition unit 12 transmits the acquired image to the signboard area estimation unit 14.

次いで、ステップS14では、看板領域推定部14が、看板領域を推定する。例えば、画像取得部12が図5(a)に示すような看板を撮影した画像を取得した場合、看板領域推定部14は、図5(b)において破線で示す範囲を看板領域として推定する。なお、看板領域推定部14は、上述したように、看板領域を公知の方法により推定する。なお、ステップS14において、看板領域推定部14が看板領域を推定できなかった場合、すなわち、画像中に看板領域が存在しなかった場合には、図4の全処理を終了すればよい。   Next, in step S14, the signboard area estimation unit 14 estimates a signboard area. For example, when the image acquisition unit 12 acquires an image obtained by photographing a signboard as shown in FIG. 5A, the signboard area estimation unit 14 estimates a range indicated by a broken line in FIG. 5B as a signboard area. In addition, the signboard area estimation part 14 estimates a signboard area by a well-known method as mentioned above. In step S14, when the signboard area estimation unit 14 cannot estimate the signboard area, that is, when the signboard area does not exist in the image, the entire process of FIG.

次いで、ステップS16では、文字列抽出部16が、看板領域から文字列画像を抽出する。そして、文字認識部18が、文字認識辞書DB30を参照し、文字列画像の文字認識を行う。図5(b)の看板領域の場合、文字認識部18による文字認識結果は、図5(c)のようになる。なお、図5(c)では、図3の単語DB32に登録されている文字列(登録文字列と呼ぶ)に下線を付している。   Next, in step S16, the character string extraction unit 16 extracts a character string image from the signboard area. Then, the character recognition unit 18 refers to the character recognition dictionary DB 30 and performs character recognition of the character string image. In the case of the signboard region of FIG. 5B, the character recognition result by the character recognition unit 18 is as shown in FIG. In FIG. 5C, a character string registered in the word DB 32 in FIG. 3 (referred to as a registered character string) is underlined.

次いで、ステップS18では、文字認識部18が、登録文字列が複数であるか否かを判断する。図5(c)の場合、登録文字列が3つ存在しているので、このステップS18の判断は肯定される。   Next, in step S18, the character recognition unit 18 determines whether there are a plurality of registered character strings. In the case of FIG. 5C, since there are three registered character strings, the determination in step S18 is affirmed.

ステップS18の判断が肯定された場合、ステップS20に移行し、単語検出部20は、単語DB32を参照して、文字認識結果の文字列(登録文字列)に対応する単語を特定する。図5(c)の場合、単語検出部20は、文字列「富士通城」と「ふじつうじょう」に対応する単語「富士通城」と、文字列「相模湖」に対応する単語「相模湖」を特定する。   When the determination in step S18 is affirmed, the process proceeds to step S20, and the word detection unit 20 refers to the word DB 32 and identifies a word corresponding to the character string (registered character string) of the character recognition result. In the case of FIG. 5C, the word detection unit 20 identifies the word “Fujitsu Castle” corresponding to the character strings “Fujitsu Castle” and “Fujitsujo” and the word “Sagami Lake” corresponding to the character string “Lake Sagami”. To do.

次いで、ステップS22では、キーワード決定部22が、特定された単語の中から、キーワードを決定する。ここでは、キーワード決定部22は、以下のような方法で画像のキーワードを決定する。   Next, in step S22, the keyword determination unit 22 determines a keyword from the identified words. Here, the keyword determination part 22 determines the keyword of an image with the following methods.

まず、キーワード決定部22は、ステップS20で特定された単語の画像中における検出回数Niを求める。図5(c)の例では、キーワード決定部22は、単語「富士通城」と「相模湖」のうち、1つ目の単語「富士通城」の検出回数N1(=2)を求めるとともに、2つ目の単語「相模湖」の検出回数N2(=1)を求める。 First, the keyword determining unit 22 obtains the detection number N i in the word image specified in step S20. In the example of FIG. 5C, the keyword determination unit 22 obtains the number of detections N 1 (= 2) of the first word “Fujitsu Castle” out of the words “Fujitsu Castle” and “Sagamiko” and 2 The number of detections N 2 (= 1) of the first word “Lake Sagami” is obtained.

次いで、キーワード決定部22は、Niによって定義されるキーワードらしさの度合いf(Ni)を次式(1)より計算する。 Then, the keyword determining section 22 calculates from the keyword likelihood degree f, defined (N i) the following equation (1) by N i.

Figure 0006287529
Figure 0006287529

ここで、f(Ni)は、検出回数Niを0から1の範囲に正規化した値である。図5(c)の例では、1つ目の単語「富士通城」のf(N1)は、
f(N1)=2/(2+1)=2/3≒0.67 …(2)
となり、2つ目の単語「相模湖」のf(N2)は、
f(N2)=1/(2+1)=1/3≒0.33 …(3)
となる。
Here, f (N i ) is a value obtained by normalizing the number of detections Ni to a range from 0 to 1. In the example of FIG. 5C, f (N 1 ) of the first word “Fujitsu Castle” is
f (N 1 ) = 2 / (2 + 1) = 2 / 3≈0.67 (2)
And f (N 2 ) of the second word “Sagamiko” is
f (N 2 ) = 1 / (2 + 1) = 1 / 3≈0.33 (3)
It becomes.

次いで、キーワード決定部22は、f(Ni)が最も大きい単語をキーワードとして決定する。上記例では、「富士通城」が図5(a)の画像に紐づくキーワードとして決定される。 Next, the keyword determination unit 22 determines a word having the largest f (N i ) as a keyword. In the above example, “Fujitsu Castle” is determined as a keyword associated with the image of FIG.

なお、画像のキーワードを複数設定できる場合には、キーワード決定部22は、f(Ni)が所定の閾値よりも大きい単語をキーワードとして決定してもよい。 When a plurality of image keywords can be set, the keyword determination unit 22 may determine a word having f (N i ) larger than a predetermined threshold as a keyword.

なお、f(Ni)が最も大きい単語をキーワードとして決定する場合、キーワード決定部22は、キーワードらしさの度合いf(Ni)として、Niそのものを用いることとしてもよい(f(Ni)=Ni)。 When the word having the largest f (N i ) is determined as a keyword, the keyword determination unit 22 may use Ni itself as the keyword-like degree f (N i ) (f (N i )). = N i ).

また、f(Ni)が最も大きい単語をキーワードとして決定する場合、2以上の単語のf(Ni)の値が等しくキーワードを決定できないような場合もある。このような場合には、公知技術(上記特許文献1)のように文字列の位置や大きさの情報を更に考慮して、キーワードを決定することとしてもよい。 In addition, when the word having the largest f (N i ) is determined as a keyword, the keyword may not be determined because the values of f (N i ) of two or more words are equal. In such a case, the keyword may be determined by further considering information on the position and size of the character string as in a known technique (the above-mentioned Patent Document 1).

なお、上記式(1)では、例えば、単語「富士通城」に対応する文字列として「富士通城」が2回、「ふじつうじょう」が1回検出されたりする場合がある。このような場合には、検出回数Niを全検出回数である3回とカウントしてもよいし、登録文字列の種類が検出された回数、すなわち漢字表記「富士通城」とひらがな表記「ふじつうじょう」の2回とカウントしてもよい。 In the above formula (1), for example, “Fujitsu Castle” may be detected twice and “Fujitsujo” may be detected once as a character string corresponding to the word “Fujitsu Castle”. In such a case, to the number of times of detection N i may be counted three times the total number of detections, number of types of registered character string is detected, i.e., Chinese characters "Fujitsu castle" and hiragana "Fuji It may be counted as 2 times.

以上により、図4の処理が終了する。一方、図4のステップS18の判断が否定された場合、すなわち、登録文字列が1つしか認識(検出)されなかった場合には、キーワード決定部22は、ステップS24に移行し、単語DB32に基づいてキーワードを決定する。すなわち、キーワード決定部22は、認識された1つの登録文字列により一意に定まる単語をキーワードとして決定する。その後は、図4の全処理を終了する。なお、登録文字列が1つも認識されなかった場合には、キーワードを決定できないので、ステップS24においてキーワードを決定せずに図4の全処理を終了する。なお、CPU90は、キーワードが決定できた画像については、HDD96においてキーワードを紐付けた状態で画像を管理する。   Thus, the process of FIG. 4 ends. On the other hand, if the determination in step S18 of FIG. 4 is negative, that is, if only one registered character string is recognized (detected), the keyword determination unit 22 proceeds to step S24 and stores it in the word DB 32. The keyword is determined based on this. That is, the keyword determination unit 22 determines a word uniquely determined by one recognized registered character string as a keyword. Thereafter, all the processes in FIG. 4 are terminated. If no registered character string is recognized, the keyword cannot be determined, and therefore the entire process of FIG. 4 is terminated without determining the keyword in step S24. Note that the CPU 90 manages the images for which keywords have been determined, with the keywords associated with each other in the HDD 96.

図6には、画像に含まれる看板領域の別例が示されている。図6のような看板領域(駅看板)においても上記と同様の処理を行うこととすればよい。図6の例では、単語「富士通」の登録文字列として、漢字表記の「富士通」、ひらがな表記の「ふじつう」、ローマ字表記の「Fujitsu」が検出され、単語「右隣」の登録文字列として、漢字表記の「右隣」、ローマ字表記の「Migitonari」が検出され、単語「左隣」の登録文字列として、漢字表記の「左隣」、ローマ字表記の「Hidaritonari」が検出される。したがって、キーワードらしさの度合いf(Ni)は、単語「富士通」が最も大きくなるため、キーワードとして1つの単語を決定する場合には、キーワード決定部22は、単語「富士通」をキーワードとして決定する。 FIG. 6 shows another example of the signboard area included in the image. The same processing as described above may be performed in a signboard area (station signboard) as shown in FIG. In the example of FIG. 6, the registered character string of the word “Fujitsu” is detected as “Fujitsu” in kanji, “Fujitsuu” in hiragana, and “Fujitsu” in romaji. As a registered character string of the word “left neighbor”, “kanji left” and “Hidaritonari” are detected as the registered character strings of the word “left neighbor”. Therefore, the degree of keyword likelihood f (N i ) is the largest for the word “Fujitsu”. Therefore, when determining one word as a keyword, the keyword determination unit 22 determines the word “Fujitsu” as a keyword. .

以上、詳細に説明したように、本実施形態によると、単語DB32には、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とが関連付けて記憶されており、単語検出部20は、画像に複数の文字列が含まれる場合に単語DB32を参照して、画像に含まれる各文字列が示す単語を特定する。そして、キーワード決定部22は、特定された単語を示す文字列の種類数や個数に基づいて、特定された単語の中から画像を示すキーワードを決定する。これにより、本実施形態では、ユーザが特定の説明板や案内板などの看板を撮影した画像に複数の文字列が含まれている場合であっても、多様な文字体系で表記されている単語をその画像のキーワード(その画像が意味するであろう、代表する文字列)として自動的に決定することができる。また、単語の位置やサイズでは適切にキーワードを決定することができない場合であっても、本実施形態の処理を行うことで、画像のキーワードとして適切なキーワードを決定することができる。   As described above in detail, according to the present embodiment, the word DB 32 stores a word that can be a keyword and a character string of one or more character systems indicating the word in association with each other. 20 identifies the word indicated by each character string included in the image with reference to the word DB 32 when the image includes a plurality of character strings. Then, the keyword determination unit 22 determines a keyword indicating an image from among the specified words based on the number of types and the number of character strings indicating the specified words. Thereby, in this embodiment, even if a user has a plurality of character strings included in an image obtained by photographing a signboard such as a specific explanation board or a guide board, words written in various character systems Can be automatically determined as a keyword of the image (a representative character string that the image will mean). Further, even when the keyword cannot be appropriately determined based on the position and size of the word, it is possible to determine an appropriate keyword as the keyword of the image by performing the processing of the present embodiment.

なお、上記実施形態では、キーワード決定部22が、1又は複数のキーワードを決定して画像に紐付ける場合について説明したが、これに限られるものではない。例えば、キーワード決定部22は、ステップS20で特定された単語のf(Ni)に基づいて、各単語に優先順位を付け、各単語を優先順位に従った並び順に並び替えて、画像に紐付けるようにしてもよい。すなわち、f(Ni)が大きい単語をf(Ni)が小さい単語よりも優先するように画像に紐付けるようにしてもよい。 In the above-described embodiment, the case where the keyword determination unit 22 determines one or a plurality of keywords and associates them with an image has been described. However, the present invention is not limited to this. For example, the keyword determination unit 22 prioritizes each word based on f (N i ) of the word specified in step S20, rearranges each word in the order of arrangement according to the priority order, and associates it with the image. You may make it attach. That may be f (N i) the word is large to give the cord the image to priority over the word f (N i) is small.

なお、上記実施形態では、電子機器100のCPU90が図2の各機能を有し、電子機器100内において図4の処理が全て行われる場合について説明したが、これに限られるものではない。例えば、図2の少なくとも一部の機能をPC(Personal Computer)やサーバに持たせ、図4の処理の少なくとも一部をPCやサーバに実行させるようにしてもよい。例えば、PCやサーバに図2の全機能を持たせ、電子機器100からPCやサーバに画像をアップロードする際に、PCやサーバにおいて画像のキーワードを決定するようにしてもよい。また、例えば、PCやサーバに単語検出部20及びキーワード決定部22の機能を持たせることとしてもよい。この場合、電子機器100からPCやサーバに画像をアップロードする際に、電子機器100からPCやサーバに対して文字認識結果を通知するようにし、PCやサーバでは、図4のステップS18〜S24の処理を実行するようにしてもよい。   In the embodiment described above, the CPU 90 of the electronic device 100 has each function of FIG. 2 and the processing of FIG. 4 is performed in the electronic device 100. However, the present invention is not limited to this. For example, a PC (Personal Computer) or server may have at least a part of the functions in FIG. 2, and at least a part of the processing in FIG. 4 may be executed by the PC or server. For example, the PC or server may have all the functions shown in FIG. 2, and when uploading an image from the electronic device 100 to the PC or server, the keyword of the image may be determined in the PC or server. Further, for example, the functions of the word detection unit 20 and the keyword determination unit 22 may be provided in a PC or a server. In this case, when the image is uploaded from the electronic device 100 to the PC or server, the character recognition result is notified from the electronic device 100 to the PC or server, and the PC or server performs steps S18 to S24 in FIG. Processing may be executed.

なお、図1の構成は一例である。すなわち、電子機器100の種類や必要な機能に応じて、構成の追加、削除、変更を行ってもよい。   The configuration of FIG. 1 is an example. That is, the configuration may be added, deleted, or changed according to the type of electronic device 100 or a necessary function.

なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。   The above processing functions can be realized by a computer. In that case, a program describing the processing contents of the functions that the processing apparatus should have is provided. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium (except for a carrier wave).

プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。   When the program is distributed, for example, it is sold in the form of a portable recording medium such as a DVD (Digital Versatile Disc) or a CD-ROM (Compact Disc Read Only Memory) on which the program is recorded. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。   The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. Further, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.

上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。   The above-described embodiment is an example of a preferred embodiment of the present invention. However, the present invention is not limited to this, and various modifications can be made without departing from the scope of the present invention.

なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部と、
画像に複数の文字列が含まれる場合、前記記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定する特定部と、
前記特定部が特定した単語を示す前記画像に含まれる文字列の種類数に基づいて、特定した単語の中から前記画像を示すキーワードを決定する決定部と、
を備えるキーワード決定装置。
(付記2) 前記決定部は、前記文字列の種類数が多い単語を前記文字列の種類数が少ない単語よりも優先して、前記キーワードを決定することを特徴とする付記1に記載のキーワード決定装置。
(付記3) 前記決定部は、前記特定部が特定した単語を示す文字列の個数に基づいて、前記画像を示すキーワードを決定することを特徴とする付記1又は2に記載のキーワード決定装置。
(付記4) 画像に複数の文字列が含まれる場合、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定し、
特定した前記単語を示す前記画像に含まれる文字列の種類数に基づいて、特定した前記単語の中から前記画像を示すキーワードを決定する、
処理をコンピュータに実行させるキーワード決定プログラム。
(付記5) 前記決定する処理では、前記文字列の種類数が多い単語を前記文字列の種類数が少ない単語よりも優先して、前記キーワードを決定することを特徴とする付記4に記載のキーワード決定プログラム。
(付記6) 前記決定する処理では、特定した単語を示す文字列の個数に基づいて、前記画像を示すキーワードを決定することを特徴とする付記4又は5に記載のキーワード決定プログラム。
(付記7) 画像に複数の文字列が含まれる場合、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定し、
特定した前記単語を示す前記画像に含まれる文字列の種類数に基づいて、特定した前記単語の中から前記画像を示すキーワードを決定する、
処理をコンピュータが実行するキーワード決定方法。
(付記8) 前記決定する処理では、前記文字列の種類数が多い単語を前記文字列の種類数が少ない単語よりも優先して、前記キーワードを決定することを特徴とする付記7に記載のキーワード決定方法。
(付記9) 前記決定する処理では、特定した単語を示す文字列の個数に基づいて、前記画像を示すキーワードを決定することを特徴とする付記7又は8に記載のキーワード決定方法。
In addition, the following additional remarks are disclosed regarding description of the above embodiment.
(Additional remark 1) The memory | storage part which memorize | stores in association with the word which can become a keyword, and the character string of the 1 or several character system which shows this word,
When the image includes a plurality of character strings, referring to the storage unit, a specifying unit that specifies a word indicated by each character string included in the image;
A determining unit that determines a keyword indicating the image from among the specified words based on the number of types of character strings included in the image indicating the word specified by the specifying unit;
A keyword determination device comprising:
(Supplementary note 2) The keyword according to supplementary note 1, wherein the determination unit prioritizes a word having a large number of types of character strings over a word having a small number of types of character strings. Decision device.
(Additional remark 3) The said determination part determines the keyword which shows the said image based on the number of the character strings which show the word which the said specific part specified, The keyword determination apparatus of Additional remark 1 or 2 characterized by the above-mentioned.
(Supplementary Note 4) When a plurality of character strings are included in an image, the word is included in the image with reference to a storage unit that stores a word that can be a keyword and a character string of one or a plurality of character systems that indicate the word. Identify the word indicated by each string
Determining a keyword indicating the image from the identified word based on the number of types of character strings included in the image indicating the identified word;
A keyword determination program that causes a computer to execute processing.
(Additional remark 5) The said determination WHEREIN: The word with many types of the said character string is given priority over the word with few types of the said character string, The said keyword is determined, It is characterized by the above-mentioned. Keyword decision program.
(Additional remark 6) The keyword determination program of Additional remark 4 or 5 which determines the keyword which shows the said image based on the number of the character strings which show the specified word in the said process to determine.
(Supplementary Note 7) When a plurality of character strings are included in an image, the word is included in the image with reference to a storage unit that stores a word that can be a keyword and a character string of one or more character systems indicating the word in association with each other. Identify the word indicated by each string
Determining a keyword indicating the image from the identified word based on the number of types of character strings included in the image indicating the identified word;
A keyword determination method in which processing is executed by a computer.
(Additional remark 8) The said determination WHEREIN: The said keyword is determined in preference to the word with many types of the said character string over the word with few said character string types. Keyword decision method.
(Additional remark 9) The keyword determination method of Additional remark 7 or 8 characterized by determining the keyword which shows the said image based on the number of the character strings which show the specified word in the said process to determine.

20 単語検出部(特定部)
22 キーワード決定部(決定部)
32 単語DB(記憶部)
90 CPU(キーワード決定装置)
20 Word detection part (specific part)
22 Keyword decision part (decision part)
32 Word DB (storage unit)
90 CPU (keyword determination device)

Claims (5)

キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部と、
画像に複数の文字列が含まれる場合、前記記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定する特定部と、
前記特定部が特定した単語を示す前記画像に含まれる文字列の種類数又は個数が多い単語を前記文字列の種類数又は個数が少ない単語よりも優先して、特定した単語の中から前記画像を示すキーワードを決定する決定部と、
を備えるキーワード決定装置。
A storage unit that stores a word that can be a keyword and a character string of one or more character systems that indicate the word;
When the image includes a plurality of character strings, referring to the storage unit, a specifying unit that specifies a word indicated by each character string included in the image;
The image indicating the word specified by the specifying unit is prioritized from the word having a large number or number of character strings included in the image over the word having a small number or number of character strings. A determination unit for determining a keyword indicating
A keyword determination device comprising:
前記決定部は、前記文字列の種類数又は個数が所定の閾値よりも多い単語を前記画像を示すキーワードとして決定することを特徴とする請求項1に記載のキーワード決定装置。 The keyword determination apparatus according to claim 1, wherein the determination unit determines a word having a number of types or the number of character strings larger than a predetermined threshold as a keyword indicating the image . 前記決定部は、前記画像に含まれる各文字列の位置及び/又は大きさに更に基づいて、前記画像を示すキーワードを決定することを特徴とする請求項1又は2に記載のキーワード決定装置。 The determination unit may further be based on the position and / or size of each character string included in the image, the keyword determining apparatus according to claim 1 or 2, characterized in that to determine the keyword indicating the image . 画像に複数の文字列が含まれる場合、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定し、
特定した前記単語を示す前記画像に含まれる文字列の種類数又は個数が多い単語を前記文字列の種類数又は個数が少ない単語よりも優先して、特定した前記単語の中から前記画像を示すキーワードを決定する、
処理をコンピュータに実行させるキーワード決定プログラム。
When an image includes a plurality of character strings, each character string included in the image is referenced with reference to a storage unit that stores a word that can be a keyword and a character string of one or more character systems that indicate the word Identify the word
The image indicating the identified word is given priority over words having a large number or number of character strings included in the image indicating the identified word over words having a small number or number of character strings. Determine keywords,
A keyword determination program that causes a computer to execute processing.
画像に複数の文字列が含まれる場合、キーワードとなりうる単語と該単語を示す1又は複数の文字体系の文字列とを関連付けて記憶する記憶部を参照して、前記画像に含まれる各文字列が示す単語を特定し、
特定した前記単語を示す前記画像に含まれる文字列の種類数又は個数が多い単語を前記文字列の種類数又は個数が少ない単語よりも優先して、特定した前記単語の中から前記画像を示すキーワードを決定する、
処理をコンピュータが実行するキーワード決定方法。
When an image includes a plurality of character strings, each character string included in the image is referenced with reference to a storage unit that stores a word that can be a keyword and a character string of one or more character systems that indicate the word Identify the word
The image indicating the identified word is given priority over words having a large number or number of character strings included in the image indicating the identified word over words having a small number or number of character strings. Determine keywords,
A keyword determination method in which processing is executed by a computer.
JP2014086039A 2014-04-18 2014-04-18 Keyword determining apparatus, keyword determining program, and keyword determining method Expired - Fee Related JP6287529B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014086039A JP6287529B2 (en) 2014-04-18 2014-04-18 Keyword determining apparatus, keyword determining program, and keyword determining method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014086039A JP6287529B2 (en) 2014-04-18 2014-04-18 Keyword determining apparatus, keyword determining program, and keyword determining method

Publications (2)

Publication Number Publication Date
JP2015207069A JP2015207069A (en) 2015-11-19
JP6287529B2 true JP6287529B2 (en) 2018-03-07

Family

ID=54603853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014086039A Expired - Fee Related JP6287529B2 (en) 2014-04-18 2014-04-18 Keyword determining apparatus, keyword determining program, and keyword determining method

Country Status (1)

Country Link
JP (1) JP6287529B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287168A (en) * 1991-03-15 1992-10-12 Ricoh Co Ltd Automatic keyword extracting method for filing
JPH08115330A (en) * 1994-10-14 1996-05-07 Hitachi Ltd Method for retrieving similar document and device therefor
JP3623998B2 (en) * 1995-01-27 2005-02-23 キヤノン株式会社 Image processing method and image processing apparatus
JP3727995B2 (en) * 1996-01-23 2005-12-21 キヤノン株式会社 Document processing method and apparatus
JP2006285406A (en) * 2005-03-31 2006-10-19 Kyocera Mita Corp Image-reading system, image-reading device, and file-storing program
JP2012084029A (en) * 2010-10-14 2012-04-26 Kyocera Mita Corp Document management device and document management program

Also Published As

Publication number Publication date
JP2015207069A (en) 2015-11-19

Similar Documents

Publication Publication Date Title
EP2813955A1 (en) Information association method and terminal
EP3128732A1 (en) Information processing method, information processing apparatus, and program
JP2007129434A (en) Information processor and method, and program
RU2643464C2 (en) Method and apparatus for classification of images
KR102236616B1 (en) Information processing apparatus, control method thereof, and storage medium
JP2010073114A6 (en) Image information retrieving apparatus, image information retrieving method and computer program therefor
JP2010073114A (en) Image information search device, image information search method, computer program for the same
US11062122B2 (en) Image candidate determination apparatus, image candidate determination method, program for controlling image candidate determination apparatus, and recording medium storing program
US20170364303A1 (en) Suggesting image files for deletion based on image file parameters
CN108781252A (en) A kind of image capturing method and device
WO2016006090A1 (en) Electronic apparatus, method, and program
JP2015008385A (en) Image selection device, imaging device, and image selection program
CN110795918B (en) Method, device and equipment for determining reading position
CN103353879B (en) Image processing method and apparatus
TW201136246A (en) System and method for restricting a user to read content of web pages
JP6729678B2 (en) Information processing apparatus, suspect information generation method and program
US9760582B2 (en) Information processing apparatus and information processing method
US20180139347A1 (en) Timed image deletion from a personal electronic device
KR101138873B1 (en) Method and apparatus for reducing the number of photo in photo album
JP6287529B2 (en) Keyword determining apparatus, keyword determining program, and keyword determining method
JP2006285847A (en) Image retrieval system and program
US8452102B2 (en) Image management apparatus, control method, and storage medium
US20120179676A1 (en) Method and apparatus for annotating image in digital camera
KR20140134844A (en) Method and device for photographing based on objects
EP4024347A2 (en) Image processing apparatus, image processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180122

R150 Certificate of patent or registration of utility model

Ref document number: 6287529

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees