JP2009135616A - Communication terminal, information processing method, and program - Google Patents
Communication terminal, information processing method, and program Download PDFInfo
- Publication number
- JP2009135616A JP2009135616A JP2007308098A JP2007308098A JP2009135616A JP 2009135616 A JP2009135616 A JP 2009135616A JP 2007308098 A JP2007308098 A JP 2007308098A JP 2007308098 A JP2007308098 A JP 2007308098A JP 2009135616 A JP2009135616 A JP 2009135616A
- Authority
- JP
- Japan
- Prior art keywords
- communication
- person
- image
- recognition result
- communication terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006854 communication Effects 0.000 title claims abstract description 283
- 238000004891 communication Methods 0.000 title claims abstract description 282
- 230000010365 information processing Effects 0.000 title claims abstract description 27
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 238000013500 data storage Methods 0.000 claims abstract description 34
- 238000012937 correction Methods 0.000 claims abstract description 16
- 238000003384 imaging method Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims 1
- 230000001815 facial effect Effects 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 20
- 238000010191 image analysis Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000003703 image analysis method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Collating Specific Patterns (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、外部と通信可能な携帯電話機等の移動体通信端末や通信機能付きのパーソナルコンピュータ、PDAなどの通信端末、情報処理方法及びプログラムに関するものである。 The present invention relates to a mobile communication terminal such as a mobile phone that can communicate with the outside, a personal computer with a communication function, a communication terminal such as a PDA, an information processing method, and a program.
従来、カメラで撮影した画像のデータに基づいて、その画像に含まれる人物の顔を認識して人物を特定する顔認識処理を行うことができる携帯電話機が知られている(例えば、特許文献1〜3)。この顔認識の結果は、携帯電話機を操作している利用者が予め登録された正規の利用者か否かの認証に用いることができる。
しかしながら、上記従来の携帯電話機のように画像に含まれる人物の顔を認識して人物を特定する場合は、その認識対象の画像中の顔の大きさ、向き、背景等の様々な要素によって顔認識の精度が低下してしまうという問題点がある。 However, when a person is identified by recognizing the face of the person included in the image as in the conventional mobile phone, the face depends on various factors such as the size, orientation, and background of the face in the image to be recognized. There is a problem that the accuracy of recognition is lowered.
本発明は以上の問題点に鑑みなされたものであり、その目的は、画像に含まれる人物の顔を認識して人物を特定するときの顔認識の精度を高めることができる通信端末、情報処理方法及びプログラムを提供することである。 The present invention has been made in view of the above problems, and a purpose of the present invention is to provide a communication terminal capable of improving the accuracy of face recognition when identifying a person by recognizing the face of the person included in the image, and information processing It is to provide a method and program.
本発明に係る通信端末は、外部と通信する通信手段と、通信相手先の人物の情報と対応付けて通信履歴情報を記憶する通信履歴記憶手段と、画像のデータを記憶する画像データ記憶手段と、前記画像のデータに基づいて該画像に含まれる人物の顔を認識して該人物を特定する顔認識手段と、前記通信履歴記憶手段に記憶されている通信履歴情報に基づいて、前記認識結果を修正する認識結果修正手段と、を備える。
ここで、上記外部との通信は、通信相手先と音声による通話や音声及び画像による通話を行うテレビ通話を行う電話の通信と、通信相手先とメールとやり取りを行うメールの通信とを含む。
この通信端末では、通信手段で通信する通信相手先と、顔認識の対象となる画像に含まれる人物とは、重複する可能性が高い。すなわち、顔認識手段によって認識処理される画像に含まれる人物は、通信履歴記憶手段に通信履歴情報の通信相手先の人物である可能性が高い。従って、通信履歴記憶手段に記憶されている通信履歴情報に基づいて、顔認識手段の認識結果を修正することにより、その認識結果で特定された人物が顔認識の対象の画像に含まれる真の人物である確率を高めることができる。よって、画像に含まれる人物の顔を認識して人物を特定するときの顔認識の精度を高めることができる。
A communication terminal according to the present invention includes a communication unit that communicates with the outside, a communication history storage unit that stores communication history information in association with information about a person of a communication partner, and an image data storage unit that stores image data. Recognizing the person's face included in the image based on the image data and identifying the person, and the recognition result based on the communication history information stored in the communication history storage unit. Recognition result correcting means for correcting.
Here, the communication with the outside includes communication of a telephone for performing a telephone call by voice or a call by voice and an image with a communication partner and mail communication for exchanging mail with the communication partner.
In this communication terminal, there is a high possibility that the communication partner communicating with the communication means and the person included in the face recognition target image overlap. That is, the person included in the image that is recognized and processed by the face recognition means is highly likely to be the person of the communication partner of the communication history information in the communication history storage means. Accordingly, by correcting the recognition result of the face recognition unit based on the communication history information stored in the communication history storage unit, the person specified by the recognition result is included in the true image included in the face recognition target image. The probability of being a person can be increased. Therefore, the accuracy of face recognition when identifying a person by recognizing the face of the person included in the image can be improved.
なお、前記通信端末において、複数の人物それぞれについて顔の認識に用いる複数の顔認識基準データを記憶する顔認識基準データ記憶手段を更に備え、前記顔認識手段は、前記画像に含まれる人物の顔を特徴付ける顔特徴データを抽出し、その抽出された顔特徴データと、前記顔認識基準データ記憶手段に記憶されている前記複数の顔認識基準データとを比較することにより、前記画像に含まれる人物を特定するものであってもよい。
この通信端末では、画像に含まれる人物の顔を特徴付ける顔特徴データと、顔認識基準データ記憶手段に予め記憶されている複数の顔認識基準データとを比較することにより、画像に含まれる人物の顔を効率よく且つ精度よく認識して当該人物を特定できる。
The communication terminal further includes face recognition reference data storage means for storing a plurality of face recognition reference data used for face recognition for each of a plurality of persons, wherein the face recognition means includes the face of the person included in the image. The person included in the image is extracted by comparing the extracted face feature data with the plurality of face recognition reference data stored in the face recognition reference data storage means. May be specified.
In this communication terminal, the facial feature data that characterizes the face of the person included in the image is compared with a plurality of face recognition reference data stored in advance in the face recognition reference data storage means, thereby determining the person's face included in the image. The person can be identified by efficiently and accurately recognizing the face.
また、前記通信端末において、前記画像データ記憶手段は、前記認識結果修正手段で修正された認識結果と前記画像のデータとを対応付けて記憶するものであってもよい。
この通信端末では、認識結果修正手段で修正された認識結果である人物の情報と、対応する画像のデータとを対応付けて記憶しておくことにより、その画像のデータを人物の情報で分類して保存したり検索したりすることができる。
In the communication terminal, the image data storage unit may store the recognition result corrected by the recognition result correction unit and the image data in association with each other.
In this communication terminal, the person information, which is the recognition result corrected by the recognition result correcting means, and the corresponding image data are stored in association with each other, whereby the image data is classified by the person information. Can be saved and searched.
また、前記通信端末において、前記認識結果修正手段は、前記通信履歴情報に基づいて前記通信相手先の人物との親密度を判定し、該親密度に基づいて前記認識結果を修正するものであってもよい。
この通信端末では、通信履歴情報に含まれる各通信相手先との通信の内容に応じて、当該通信端末の利用者と通信相手先の人物との親密度が変わるという傾向があるので、通信履歴情報に基づいて通信相手先の人物との親密度を判定することができる。そして、この判定して得られた親密度が高いほど、顔認識手段によって認識処理される画像に当該通信相手先の人物が含まれる確率が高くなる。従って、上記判定で得られた親密度に基づいて前記認識結果を修正することにより、顔認識の精度を更に高めることができる。
Further, in the communication terminal, the recognition result correcting means determines a closeness with the person of the communication partner based on the communication history information, and corrects the recognition result based on the closeness. May be.
In this communication terminal, since the intimacy between the user of the communication terminal and the person of the communication partner tends to change according to the content of communication with each communication partner included in the communication history information, the communication history Based on the information, it is possible to determine the familiarity with the person of the communication partner. And the higher the familiarity obtained by this determination, the higher the probability that the person of the communication partner is included in the image that is recognized by the face recognition means. Therefore, the accuracy of face recognition can be further improved by correcting the recognition result based on the familiarity obtained in the determination.
また、前記通信端末において、前記認識結果修正手段で用いる前記通信履歴情報は、前記通信相手先の人物ごとに記憶されている通信頻度、該通信相手先との通信が行われた日時から現在の日時までの経過時間、及び該通信相手先との通信の種類の少なくとも一つの情報であってもよい。
この通信端末では、顔認識手段によって認識処理される画像に通信相手先の人物が含まれる確率は、その通信相手先に対する前記通信頻度、前記経過時間及び前記通信の種類の少なくとも一つによって変わる場合が多い。従って、前記通信頻度、前記経過時間及び前記通信の種類の少なくとも一つの情報に基づいて、前記認識結果を修正することにより、顔認識の精度を更に高めることができる。
ここで、前記認識結果修正手段は、前記通信相手先の人物との通信頻度が多いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正するものであってもよい。通信相手先の人物との通信頻度が多いほど、その人物と通信端末の利用者との親密度が高くなる場合が多いため、画像に当該人物が含まれている確率が高いと判断して認識結果を修正することにより、顔認識の精度を更に高めることができる。
また、前記認識結果修正手段は、前記通信相手先の人物との通信に対する前記経過時間が短いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正するものであってもよい。通信相手先の人物との通信に対する前記経過時間が短いほど、その人物と通信端末の利用者との親密度が高くなる場合が多いため、画像に当該人物が含まれている確率が高いと判断して認識結果を修正することにより、顔認識の精度を更に高めることができる。
また、前記認識結果修正手段は、前記通信相手先の人物との通信の種類について、該人物への電話の発信、該人物からの電話の着信、該人物へのメールの送信、該人物からのメールの受信、の順に、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正するものであってもよい。通信相手先の人物への電話の発信、人物からの電話の着信、人物へのメールの送信、人物からのメールの受信、の順に、その人物と通信端末の利用者との親密度が高くなる場合が多い。そのため、画像に当該人物が含まれている確率が高いと判断して認識結果を修正することにより、顔認識の精度を更に高めることができる。
Further, in the communication terminal, the communication history information used by the recognition result correcting means is based on the communication frequency stored for each person of the communication partner and the date and time when communication with the communication partner is performed. It may be at least one piece of information on the elapsed time until the date and time and the type of communication with the communication partner.
In this communication terminal, the probability that a person of the communication partner is included in the image recognized and processed by the face recognition unit varies depending on at least one of the communication frequency, the elapsed time, and the type of communication with the communication partner. There are many. Therefore, the accuracy of face recognition can be further improved by correcting the recognition result based on at least one information of the communication frequency, the elapsed time, and the communication type.
Here, the recognition result correcting means determines that the probability that the person is included in the image is higher as the communication frequency with the person of the communication partner is higher, and corrects the recognition result. May be. As the frequency of communication with the person at the other end of the communication increases, the intimacy between the person and the user of the communication terminal often increases, so it is determined that the probability that the person is included in the image is high By correcting the result, the accuracy of face recognition can be further increased.
Further, the recognition result correcting means determines that the probability that the person is included in the image is higher as the elapsed time for communication with the person of the communication partner is shorter, and corrects the recognition result. It may be. The shorter the elapsed time for communication with the person at the other end of communication, the greater the intimacy between the person and the user of the communication terminal, so the probability that the person is included in the image is high. Then, the accuracy of face recognition can be further improved by correcting the recognition result.
In addition, the recognition result correcting means is configured to send a call to the person, receive a call from the person, send a mail to the person, The recognition result may be corrected by determining that there is a high probability that the person is included in the image in the order of reception of mail. The intimacy between the person and the user of the communication terminal increases in the order of making a call to the person at the other end of the communication, receiving a call from the person, sending mail to the person, and receiving mail from the person. There are many cases. For this reason, it is possible to further improve the accuracy of face recognition by determining that the probability that the person is included in the image is high and correcting the recognition result.
また、前記通信端末において、前記認識結果は、前記画像に含まれている人物について複数の候補者を提示するものであり、前記認識結果修正手段は、前記通信履歴情報に基づいて、前記認識結果に含める前記候補者を修正するものであってもよい。
この通信端末では、画像に含まれている人物について複数の候補者を認識結果として提示することにより、認識結果の全体としての精度を高めつつ、当該画像に含まれている人物を最終的に特定するときに当該通信端末の利用者が判断して選択できるようにすることができる。
ここで、前記認識結果の複数の候補者を表示する表示手段と、前記表示手段に表示された前記複数の候補者からいずれか一人を、前記画像に含まれる前記特定の人物として選択するための選択手段と、を更に備え、前記画像データ記憶手段は、前記選択手段で選択された人物の情報と前記画像のデータとを対応付けて記憶するものであってもよい。この場合は、複数の候補者のいずれか一人を特定の人物として選択する利用者による選択作業が容易になるとともに、画像データ記憶手段に画像のデータとを対応付けて記憶される人物が当該画像に含まれる人物である確率を高めることができる。
Further, in the communication terminal, the recognition result presents a plurality of candidates for a person included in the image, and the recognition result correcting means is configured to determine the recognition result based on the communication history information. The candidate to be included may be corrected.
In this communication terminal, by presenting a plurality of candidates as recognition results for the person included in the image, the person who is included in the image is finally identified while improving the accuracy of the recognition result as a whole. It is possible for the user of the communication terminal to judge and select when doing so.
Here, a display unit that displays a plurality of candidates of the recognition result, and one of the plurality of candidates displayed on the display unit is selected as the specific person included in the image Selecting means, and the image data storage means may store the information of the person selected by the selection means and the image data in association with each other. In this case, the selection work by the user who selects any one of the plurality of candidates as a specific person is facilitated, and the person stored in association with the image data in the image data storage means is the image. The probability of being a person included in can be increased.
また、前記通信端末において、画像を撮影する撮像手段を更に備え、前記顔認識対象の画像が、前記撮像手段で撮影した画像であってもよい。
この通信端末では、撮像手段で画像を撮影する人物は、当該通信端末で通信する通信相手先になる場合が多く、当該通信端末の利用者と親密である場合が多い。そのため、当該通信端末による通信相手先の人物と、撮像手段で撮影され顔認識の対象となる画像に含まれる人物とは、重複する可能性が更に高くなる。従って、画像に含まれる人物の顔を認識して人物を特定するときの顔認識の精度を更に高めることができる。
The communication terminal may further include an imaging unit that captures an image, and the face recognition target image may be an image captured by the imaging unit.
In this communication terminal, the person who captures an image with the imaging means is often a communication partner communicating with the communication terminal, and is often intimate with the user of the communication terminal. Therefore, there is a higher possibility that the person of the communication partner by the communication terminal and the person included in the image that is captured by the imaging unit and is the target of face recognition will overlap. Therefore, it is possible to further improve the accuracy of face recognition when identifying a person by recognizing the face of the person included in the image.
本発明に係る情報処理方法は、通信相手先の人物の情報と対応付けて通信履歴情報を記憶する通信端末における情報処理方法であって、画像のデータに基づいて該画像に含まれる人物の顔を認識して該人物を特定するステップと、前記通信履歴情報に基づいて前記認識結果を修正するステップと、を有する。
前記情報処理方法において、前記画像に含まれる人物の顔を特徴付ける顔特徴データを抽出し、その抽出された顔特徴データと、複数の人物それぞれについて顔の認識に用いる複数の顔認識基準データとを比較することにより、前記画像に含まれる人物を特定してもよい。
また、前記情報処理方法において、前修正された認識結果と前記画像のデータとを対応付けて記憶するステップを更に有してもよい。
また、前記情報処理方法において、前記通信履歴情報に基づいて前記通信相手先の人物との親密度を判定し、該親密度に基づいて前記認識結果を修正してもよい。
また、前記情報処理方法において、前記通信履歴情報は、前記通信相手先の人物ごとに記憶されている通信頻度、該通信相手先との通信が行われた日時から現在の日時までの経過時間、及び該通信相手先との通信の種類の少なくとも一つの情報であってもよい。
また、前記情報処理方法において、前記通信相手先の人物との通信頻度が多いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正してもよい。
また、前記情報処理方法において、前記通信相手先の人物との通信に対する前記経過時間が短いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正してもよい。
また、前記情報処理方法において、前記通信相手先の人物との通信の種類について、該人物への電話の発信、該人物からの電話の着信、該人物へのメールの送信、該人物からのメールの受信の順に、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正してもよい。
また、前記情報処理方法において、前記認識結果は、前記画像に含まれている人物について複数の候補者を提示するものであり、前記通信履歴情報に基づいて、前記認識結果に含める前記候補者を修正してもよい。
また、前記情報処理方法において、前記認識結果の複数の候補者を表示するステップと、前記複数の候補者から選択された人物の情報と前記画像のデータとを対応付けて記憶するステップと、を更に有してもよい。
また、前記情報処理方法において、前記顔認識対象の画像は、撮像手段で撮影した画像であってもよい。
An information processing method according to the present invention is an information processing method in a communication terminal that stores communication history information in association with information of a person of a communication partner, and includes a person's face included in the image based on image data And identifying the person, and correcting the recognition result based on the communication history information.
In the information processing method, face feature data characterizing a person's face included in the image is extracted, and the extracted face feature data and a plurality of face recognition reference data used for face recognition for each of a plurality of persons. A person included in the image may be specified by comparison.
The information processing method may further include a step of storing the previously corrected recognition result and the image data in association with each other.
Further, in the information processing method, closeness with the person of the communication partner may be determined based on the communication history information, and the recognition result may be corrected based on the closeness.
In the information processing method, the communication history information includes a communication frequency stored for each person of the communication partner, an elapsed time from a date and time when communication with the communication partner is performed, to a current date and time, And at least one piece of information of the type of communication with the communication partner.
In the information processing method, the recognition result may be corrected by determining that the probability that the person is included in the image is higher as the communication frequency with the person of the communication partner is higher.
In the information processing method, the recognition result may be corrected by determining that the probability that the person is included in the image is higher as the elapsed time for communication with the person of the communication partner is shorter. Good.
Further, in the information processing method, regarding the type of communication with the person of the communication partner, outgoing calls to the person, incoming calls from the person, transmission of mail to the person, mail from the person The recognition result may be corrected by determining that the probability that the person is included in the image is high in the order of reception.
Further, in the information processing method, the recognition result presents a plurality of candidates for a person included in the image, and the candidates included in the recognition result are determined based on the communication history information. It may be corrected.
Further, in the information processing method, a step of displaying a plurality of candidates of the recognition result, and a step of storing information on a person selected from the plurality of candidates and the image data in association with each other. Furthermore, you may have.
In the information processing method, the face recognition target image may be an image captured by an imaging unit.
本発明に係るプログラムは、通信相手先の人物の情報と対応付けて通信履歴情報を記憶する通信端末における情報処理を、当該通信端末のコンピュータを用いて実行させるためのプログラムであって、画像のデータに基づいて該画像に含まれる人物の顔を認識して該人物を特定するステップと、前記通信履歴情報に基づいて前記認識結果を修正するステップと、前記コンピュータを用いて実行させる。
前記プログラムにおいて、前記画像に含まれる人物の顔を特徴付ける顔特徴データを抽出し、その抽出された顔特徴データと、複数の人物それぞれについて顔の認識に用いる複数の顔認識基準データとを比較することにより、前記画像に含まれる人物を特定する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前修正された認識結果と前記画像のデータとを対応付けて記憶する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記通信履歴情報に基づいて前記通信相手先の人物との親密度を判定し、該親密度に基づいて前記認識結果を修正する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記通信履歴情報は、前記通信相手先の人物ごとに記憶されている通信頻度、該通信相手先との通信が行われた日時から現在の日時までの経過時間、及び該通信相手先との通信の種類の少なくとも一つの情報であってもよい。
また、前記プログラムにおいて、前記通信相手先の人物との通信頻度が多いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記通信相手先の人物との通信に対する前記経過時間が短いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記通信相手先の人物との通信の種類について、該人物への電話の発信、該人物からの電話の着信、該人物へのメールの送信、該人物からのメールの受信の順に、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記認識結果は、前記画像に含まれている人物について複数の候補者を提示するものであり、前記通信履歴情報に基づいて、前記認識結果に含める前記候補者を修正する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記認識結果の複数の候補者を表示するステップと、前記複数の候補者から選択された人物の情報と前記画像のデータとを対応付けて記憶する情報処理を、前記コンピュータを用いて実行させるものであってもよい。
また、前記プログラムにおいて、前記顔認識対象の画像は、撮像手段で撮影した画像であってもよい。
A program according to the present invention is a program for executing information processing in a communication terminal that stores communication history information in association with information on a person of a communication partner using a computer of the communication terminal. Recognizing the face of a person included in the image based on the data to identify the person, correcting the recognition result based on the communication history information, and using the computer.
In the program, face feature data characterizing a person's face included in the image is extracted, and the extracted face feature data is compared with a plurality of face recognition reference data used for face recognition for each of a plurality of persons. Thus, information processing for specifying a person included in the image may be executed using the computer.
Further, in the program, information processing for storing a previously corrected recognition result and the image data in association with each other may be executed using the computer.
Further, in the program, a closeness with the person of the communication partner is determined based on the communication history information, and information processing for correcting the recognition result based on the closeness is executed using the computer. It may be a thing.
In the program, the communication history information includes a communication frequency stored for each person of the communication partner, an elapsed time from the date and time when communication with the communication partner is performed, and the current date and time, and The information may be at least one type of communication with the communication partner.
Further, in the program, the information processing for correcting the recognition result by determining that the probability that the person is included in the image is higher as the communication frequency with the person of the communication partner is higher. May be used.
Further, in the program, information processing for correcting the recognition result by determining that the probability that the person is included in the image is higher as the elapsed time for communication with the person of the communication partner is shorter, It may be executed using the computer.
Further, in the program, regarding the type of communication with the person of the communication partner, making a call to the person, receiving a call from the person, sending mail to the person, receiving mail from the person In this order, information processing for determining the probability that the person is included in the image is high and correcting the recognition result may be executed using the computer.
Further, in the program, the recognition result presents a plurality of candidates for the person included in the image, and corrects the candidate included in the recognition result based on the communication history information. Information processing may be executed using the computer.
Further, in the program, the step of displaying a plurality of candidates of the recognition result, and the information processing for storing the information of the person selected from the plurality of candidates and the image data in association with each other, It may be executed by using.
In the program, the face recognition target image may be an image captured by an imaging unit.
本発明によれば、通信履歴情報に基づいて、顔認識手段の認識結果を修正することにより、その認識結果で特定された人物が顔認識の対象の画像に含まれる真の人物である確率を高めることができるので、画像に含まれる人物の顔を認識して人物を特定するときの顔認識の精度を高めることができるという効果がある。 According to the present invention, by correcting the recognition result of the face recognition unit based on the communication history information, the probability that the person specified by the recognition result is a true person included in the face recognition target image is calculated. Therefore, it is possible to improve the accuracy of face recognition when the face of a person included in an image is recognized and the person is specified.
以下、本発明を通信端末としての携帯電話機を用いたデータ共有システムに適用した実施形態について説明する。
図1は本発明の実施形態に係る携帯電話機を用いたデータ共有システムの一例を示す概略構成図である。このデータ共有システムは、携帯電話通信網10を含む通信ネットワークを介して構築された複数の利用者が所属する仮想的なコミュニティにおいて、各利用者の画像データを共有するものであり上記仮想的なコミュニティに所属する利用者の携帯電話機20、21と、各携帯電話機20、21と通信可能に携帯電話通信網10上に設けられたサーバ30とを用いて構成されている。各携帯電話機20、21は、携帯電話通信網10の基地局101の間に確立された無線通信回線を介して、携帯電話機等の電話機との間で、電話やメール等の通信を行うことができる。また、各携帯電話機20、21は、更にインターネット等の外部の通信ネットワークを介して、他のパーソナルコンピュータやPDA等の通信端末との間でメール等の通信を行うことができる。サーバ30は、携帯電話通信網10とゲートウェイを介して接続されるインターネット11などの他の通信ネットワーク上に設けてもよい。
Hereinafter, an embodiment in which the present invention is applied to a data sharing system using a mobile phone as a communication terminal will be described.
FIG. 1 is a schematic configuration diagram showing an example of a data sharing system using a mobile phone according to an embodiment of the present invention. This data sharing system shares image data of each user in a virtual community to which a plurality of users constructed via a communication network including the mobile
上記仮想的なコミュニティは、実空間でのコミュニティの場合と同様に、例えば同じ趣味を有する関係や家族・親類の関係などのある特定の関係を互いに有する複数の利用者(メンバー)で構成されるグループに対応する。この仮想的なコミュニティは、例えば、コミュニティを管理運営しようとする管理者が、コミュニティの名称、自分のメールアドレス、電話番号、氏名等の必要な登録情報をサーバ30に送信して所定の認証を受けることにより、通信ネットワーク上に構築することができる。管理者には、通信ネットワーク上でコミュニティを管理するための管理者用のID及びパスワードが設定される。コミュニティの所属する利用者(メンバー)は、例えば、自分のメールアドレス、電話番号、氏名等の必要な登録情報をサーバ30に送信して所定の認証を受けることにより登録される。この利用者登録は、新規コミュニティ構築時に行ってもいいし、その後の任意のタイミングで行ってもよい。
The virtual community is composed of a plurality of users (members) having a specific relationship such as a relationship having the same hobby or a family / relative relationship, as in the case of the community in the real space. Corresponds to the group. In this virtual community, for example, an administrator who manages and operates the community transmits necessary registration information such as the name of the community, his / her e-mail address, telephone number, and name to the
図2は、上記仮想的なコミュニティ上で画像データを共有するデータ共有システムを構成する携帯電話機20の機能的な構成要素を示すブロック図である。なお、携帯電話機21も同様に構成することができる。携帯電話機20は、サーバ30に送信してアップロードする送信対象の画像データを解析する画像解析機能(顔認識機能)を備えている。携帯電話機20は、他の携帯電話機等との間で電話の通信を行うための電話通信部(通信手段)200と、データ記憶部(データ記憶手段)210と、データ送信部(データ送信手段、通信手段)220と、予約設定部(予約設定手段)230と、画像関連情報入力部(画像関連情報入力手段)240と、画像関連情報付加部(画像関連情報付加手段)250と、画像解析部(顔認証手段)260と、認識結果修正部(認識結果修正手段)265と、データ受信部(データ受信手段、通信手段)270と、撮像部(撮像手段)280、表示部(表示手段)285と、選択情報入力部(選択手段)290とを備える。これらの各部の機能は、携帯電話機20に予め組み込まれたプログラムやユーザがダウンロードしたプログラムがCPU等からなるコンピュータに読み込まれることにより、そのプログラムと携帯電話機20の各種ハードウェア資源とが協働することによって実現される。このプログラムは、ROM等の半導体メモリや、光ディスク(CD−ROM、CD−R等)、磁気ディスク(FD、HD等)、磁気テープなどの記録媒体を記録した状態で受け渡しすることができ、コンピュータネットワークを介した通信によって受け渡しすることもできる。また、携帯電話機20は、ハードウェア資源として、CPU,RAM,ROM,ベースバンド処理部,無線通信モジュール,液晶パネル等によるディスプレイ,キー操作部,マイク、スピーカ、カメラ、メモリカード等を備える。
FIG. 2 is a block diagram showing functional components of the
上記無線通信モジュールは、例えばシンセサイザ、周波数変換器,高周波増幅器などにより構成され、携帯電話通信網10の基地局101との間で無線通信するための高周波信号処理を実行する。ベースバンド処理部は、外部の携帯電話機やサーバとの間で電話やデータ送受信の通信を行うためのデジタル処理を実行する。このベースバンド処理部と上記無線通信モジュールとの間はD/A変換器やA/D変換器を介して接続されている。また、マイクから出力されるアナログの音声信号は、図示しない音信号処理部でデジタル信号に変換され、ベースバンド処理部等に送られる。スピーカは、音信号処理部でデジタル信号から変換されたアナログ信号が入力され、通話中の音声を出力したり、メールの着信音、電話の呼び出し音、音楽などを出力したりする。なお、スピーカは、通話中の音声を聞くための受話器用スピーカ(レシーバ)と、着信音や音楽などを出力する外部出力用スピーカとを別々に設けて構成してもいいし、これらの受話器用スピーカ及び外部出力用スピーカを兼用するように一つのスピーカで構成してもよい。また、上記キー操作部は、例えば、データ入力キー(テンキー、*キー、#キー)、通話開始キー、終話キー、スクロールキー、多機能キー等の複数のキーで構成されている。このキー操作部115は、利用者が通話開始、終話、メニュー選択、画面切り換え等を指示したり情報を入力したりするときに用いられる。
The wireless communication module includes, for example, a synthesizer, a frequency converter, a high frequency amplifier, and the like, and executes high frequency signal processing for wireless communication with the
上記電話通信部200は、無線通信モジュール、ベースバンド処理部等を用いて構成され、他の携帯電話機等から電話を着呼したり他の携帯電話機等に対して電話を発呼したりしたときに、携帯電話通信網10を介して他の携帯電話機との間で確立された通話回線上で電話(通話)の通信処理を実行する。
The
上記データ記憶部210は、RAM、ROM、メモリカード等を用いて構成され、撮像部280等で取得したりサーバからダウンロードしたりすることによって利用者が取得した画像データを記憶する。また、データ記憶部210は、電話やメールの通信相手先の人物の情報と対応付けて通信履歴情報を記憶する通信履歴記憶手段や、複数の人物それぞれについて顔の認識に用いる複数の顔認識基準データを記憶する顔認識基準データ記憶手段としても機能する。上記通信履歴は、例えば、電話の着呼・発呼やメール送受信の通信の相手先(人物)の名前又はその識別情報のデータと、その通信の日時データとが対応付けられて記憶される。また、上記通信履歴情報は、データ記憶領域の空きがなくならないように、直近の所定件数(例えば100件)の通信履歴を残して記憶するようにしてもよい。
The
図3は、上記画像データ記憶手段としてデータ記憶部210に記憶する画像データ及びその付加情報の一例を示す説明図である。図示の例では、画像データ(本体)と、その画像データに関する基本情報、画像関連情報(取得関連情報、送信制御関連情報、タグ情報、画像解析結果)とを関連付けて記憶している。基本情報としては、ファイル名、ファイルタイプ(JPEG、PNG等)及びファイルサイズを記憶している。上記取得関連情報としては、例えば、該当する画像データを取得したときの携帯電話機の位置情報や取得(撮影)した日時情報を記憶している。上記送信制御関連情報としては、該当する画像データのサーバ30へのアップロード(送信)を指定するためのアップロードフラグ(送信指定情報)と、送信後に削除するか否かを指定するための削除フラグ(削除有無指定情報)とを記憶している。また、上記タグ情報としては、画像関連情報入力部240で入力されたタグ情報を記憶している。また、上記画像解析結果としては、で得られた画像解析部260における顔認識処理で得られた認識結果(例えば、各人物に一意にふられたID番号等の人物識別情報)や、その認識結果を通信履歴情報に基づいて修正した修正後の認識結果(人物識別情報)を記憶している。
FIG. 3 is an explanatory diagram showing an example of image data and its additional information stored in the
上記データ送信部220は、無線通信モジュール等を用いて構成され、携帯電話通信網10を介して、通信ネットワーク上のメールサーバにメールデータを送信したり、通信ネットワーク上のWEBサーバ等のコンテンツサーバに取得リクエストを送信したりする。また、データ送信部220は、予め設定した送信予約時刻に、アップロードフラグが「1」になっている送信対象の画像データをサーバ30に送信する。
The
上記送信予約時刻は、携帯電話通信網(通信ネットワーク)10における通信が閑散となるトラフィック閑散時間帯に設定するのが好ましい。例えば、トラフィック閑散時間帯として、携帯電話機による通話やデータ通信が少ない深夜帯を設定すれば、携帯電話通信網(通信ネットワーク)10の日中のトラフィック低減が可能になる。また、トラフィック閑散時間帯として、携帯電話機の利用がない深夜帯を設定すれば、データサイズが大きい画像データをアップロードする場合でも、そのデータのアップロード処理によって携帯電話機での他のサービスやアプリケーションを利用できなくなるという事態が発生することがない。更に、上記深夜帯などのトラフィック閑散時間帯に対して割安の通信料金(時間課金、データ量課金)が設定されている場合は、上記画像データのアップロードに対する通信料の低減を図ることもできる。 The transmission reservation time is preferably set in a traffic quiet time period in which communication in the cellular phone communication network (communication network) 10 is quiet. For example, if a midnight band with few calls and data communication by a mobile phone is set as a traffic off time, traffic during the daytime of the mobile phone communication network (communication network) 10 can be reduced. Also, if you set the midnight hours when you don't use your mobile phone as a busy hour, you can use other services and applications on your mobile phone by uploading that data even when you upload image data with a large data size. The situation that it becomes impossible to occur does not occur. Furthermore, when a cheap communication charge (hour charge, data amount charge) is set for the traffic off-hours such as the midnight, the communication charge for uploading the image data can be reduced.
上記予約設定部230は、キー操作部などで構成され、利用者が操作することにより、画像データをサーバ30に送信する送信予約時刻が設定される。この予約設定部230は、無線通信モジュール等を用い、サーバ30から受信した時刻指定情報に基づいて、前記送信予約時刻を自動設定するように構成してもよい。
The
上記画像関連情報入力部240は、キー操作部などで構成され、利用者が操作することにより、必要に応じて、データ記憶部210に記憶されている画像データに関連したタグ情報、例えば画像データの内容を識別するためのタグ情報(画像関連情報)が入力される。
上記画像関連情報付加部250は、CPUなどで構成され、画像関連情報入力部240でタグ情報が入力された場合に、そのタグ情報を送信対象の画像データに付加する。
The image-related
The image related
なお、上記タグ情報を入力する場合は、過去に使用された複数のタグ情報とその使用頻度とを対応付けたランキングデータをサーバ30から受信し、そのサーバ30から取得したランキングデータを表示するようにしてもよい。利用者は、表示されたランキングデータから選択して所望のタグ情報を入力することができる。ランキングデータ受信部(ランキングデータ受信手段)は、上記無線通信モジュール等を用いて構成され、ランキングデータ表示部(ランキングデータ表示手段)は、液晶パネル等のディプレイを用いて構成される。
When inputting the tag information, the ranking data obtained by associating a plurality of tag information used in the past with the usage frequency is received from the
上記画像解析部260は、CPUや認識エンジンなどで構成され、データ記憶部210に記憶されている画像データを読み出して解析し、その画像の種類を特定して解析結果として出力する。特に、この画像解析部260は、画像データに基づいて画像に含まれる人物の顔を認識して人物を特定する顔認識手段として機能する。例えば、画像が人物の顔画像を含む場合、その顔画像を解析してその人物を特定し、その人物の識別情報(人物識別情報)を認識結果(解析結果)として出力する。この顔認識のための画像解析の方法は、公知の様々な画像認識技術を採用することができる。例えば、認識する可能性がある複数の人物の基準となる顔認識基準データを対応する人物の情報と対応付けて保存した画像認識用の基準画像データベースを予め作成して登録しておき、その予め登録された基準画像データベースを用いて上記顔認識の画像解析を行って人物等の特定を行ってもよい。上記基準画像データベースには、例えば携帯電話機の利用者の知り合いである予め登録された複数の人物(例えば100名〜200名程度の人物)について顔認識基準データが人物の名前や識別情報等の人物情報と対応付けられている。また、この基準画像データベースは、人物の名前や識別情報をキーとして電話帳(アドレス帳)のデータテーブルとリンクさせておいてもよい。また、上記基準画像データベースには、携帯電話機の利用者が、撮像部280による撮影などによって取得した人物の画像データに基づいて、顔認識基準データ及び人物情報を適宜登録できるようにしてもよい。
The
なお、上記画像解析部260は、上記認識結果として、画像に含まれている人物について予め設定した所定人数の複数の候補者を特定し、それら複数の候補者それぞれについて、顔認識の正確さを表す指標値(スコア)を候補者の画像や名前等と一緒に提示する認識結果を出力するようにしてもよい。また、1つの画像データについて、被写体として複数の人物等を認識した場合は、その複数の人物等の識別情報を認識結果(解析結果)として出力する。この画像解析部260で認識結果として得られた人物識別情報は、例えば図3に示すように、手入力したタグ情報とは別に、送信対象の画像データに付加してもいいし、タグ情報の一部として付加してもよい。
The
上記認識結果修正部265は、CPUなどで構成され、データ記憶部210に記憶されている電話の発呼・着呼やメール送受信の通信履歴情報に基づいて、上記画像解析部260で得られた認識結果を修正する。ここで、上記認識結果の修正には、通信回数が多い順番に通信相手先を並べた場合の上位から予め設定して所定人数(例えば上位20名)の通信履歴情報のみを用いるようにしてもよい。なお、認識結果修正部265における処理の具体例については後述する。
The recognition
上記データ受信部270は、上記無線通信モジュール等を用いて構成され、携帯電話通信網10を介して、通信ネットワーク上のメールサーバからメールデータを受信したり、通信ネットワーク上のWEBサーバ等のコンテンツサーバから所望のコンテンツのデータを送信したりする。また、データ受信部270は、携帯電話機20の利用者が所属する仮想コミュニティについてサーバ30に画像データが追加されたときにサーバ30から送信される追加の画像データを、サーバ30から受信する。なお、上記追加の画像データは、予め設定された受信予約時刻になったときに受信するように制御してもよい。
The
また、上記受信予約時刻は、前述の送信予約時刻の場合と同様に、携帯電話通信網(通信ネットワーク)10における通信が閑散となるトラフィック閑散時間帯に設定するのが好ましい。例えば、トラフィック閑散時間帯として、携帯電話機による通話やデータ通信が少ない深夜帯を設定すれば、携帯電話通信網(通信ネットワーク)10の日中のトラフィック低減が可能になる。また、トラフィック閑散時間帯として、携帯電話機の利用がない深夜帯を設定すれば、データサイズが大きい画像データをダウンロードする場合でも、そのデータのダウンロード処理によって携帯電話機での他のサービスやアプリケーションを利用できなくなるという事態が発生することがない。しかも、深夜帯にデータのダウンロードが完了しているので、ダウンロードした画像データに基づいて画像を速やかに表示することができ、利用者の操作性が向上する。更に、上記深夜帯などのトラフィック閑散時間帯に対して割安の通信料金(時間課金、データ量課金)が設定されている場合は、上記画像データのダウンロードに対する通信料の低減を図ることもできる。 Further, the reception reservation time is preferably set in a traffic quiet time period in which communication in the cellular phone communication network (communication network) 10 is quiet, as in the case of the transmission reservation time described above. For example, if a midnight band with few calls and data communication by a mobile phone is set as a traffic off time, traffic during the daytime of the mobile phone communication network (communication network) 10 can be reduced. In addition, if you set the midnight hours when your mobile phone is not used as a busy hour, you can use other services and applications on your mobile phone by downloading the data even if you download large image data. The situation that it becomes impossible to occur does not occur. In addition, since the data download is completed in the middle of the night, the image can be quickly displayed based on the downloaded image data, and the operability for the user is improved. Furthermore, when a cheap communication charge (time charge, data amount charge) is set for the traffic off-hours such as the midnight, the communication charge for downloading the image data can be reduced.
上記撮像部280は、CCDやCMOS等の撮像デバイス(カメラ)で構成され、利用者が所定の撮影操作することにより、周囲の人物や風景などを撮影し、上記データ記憶部210に保存することができる。
The
上記表示部285は、LCD(液晶ディスプレイ)や有機EL(Organic Electroluminescence)、LED(Light-Emitting Diode)アレイ等で構成され、撮像部280等で取得した画像を表示したり、送受信対象のメールなどの各種情報を表示したりすることができる。また、表示部285は、上記画像解析部260で得られた認識結果や、上記認識結果修正部265で修正された認識結果を表示することができる。
The
上記選択情報入力部290は、キー操作部などで構成され、上記認識結果修正部265で修正された認識結果が複数の候補者を提示するものである場合に、表示部285に表示された複数の候補者からいずれか一人を画像に含まれる特定の人物として利用者が選択するときに用いられる。この選択情報入力部290で選択された人物の情報(人物識別情報)が、該当する画像のデータとを対応付けてデータ記憶部210に記憶される(図3参照)。
The selection
次に、上記認識結果修正部265における認識処理の修正処理の具体例について説明する。この例では、修正処理後の人物の顔認識の正確さを数値化して表す指標値として、次の(1)式で示す「総合スコアS」を定義している。
総合スコアS=Wf×Sf+Wc×Sc ・・・(1)
Next, a specific example of the recognition process correction process in the recognition
Overall score S = Wf × Sf + Wc × Sc (1)
ここで、上記(1)式における各変数の意味は以下のとおりである。なお、(1)式中の各加重値Wf及びWcの設定値は、利用者が表示部285に表示された設定画面でキー操作部を操作することにより、変更できるようにしてもよい。
Sf:顔認識技術による判定結果の点数(顔認識スコア)、
Wf:顔認識技術による判定結果に対する加重値、
Sc:通話・メールの通信履歴を定量化した点数(通信履歴スコア)、
Wc:通話・メールの通信履歴に対する加重値。
Here, the meaning of each variable in the above equation (1) is as follows. Note that the set values of the weight values Wf and Wc in the equation (1) may be changed by the user operating the key operation unit on the setting screen displayed on the
Sf: score (face recognition score) of determination result by face recognition technology,
Wf: weight value for the determination result by the face recognition technology,
Sc: A score (communication history score) obtained by quantifying the communication history of calls / mails,
Wc: Weighting value for call / mail communication history.
上記通信履歴スコアScは、携帯電話機20の利用者と通信相手先の人物との親密度を数値化した表した指標値であり、例えば次の計算方法で計算することができる。まず、特定人物との通信(電話の発信、電話の着信、メールの送信、メールの受信)の履歴を、{(k1,t1),(k2,t2),・・・,(kn,tn)}と想定する。ここで、各変数の意味は次のとおりである。
ki:通信の種類(電話の発信、電話の着信、メールの送信、メールの受信)、
ti:経過時間=現在の日時−通信を行った日時。
The communication history score Sc is an index value representing the intimacy between the user of the
ki: Type of communication (outgoing call, incoming call, sending mail, receiving mail),
ti: Elapsed time = current date / time-date / time of communication.
上記通信の履歴の変数を用いると、上記通信履歴スコアScは、例えば次の(2)式のように計算することができる。
Sc=SUM{i=1〜n}・{Wk(ki)×Wt(ti)} ・・・(2)
If the communication history variable is used, the communication history score Sc can be calculated, for example, by the following equation (2).
Sc = SUM {i = 1 to n} · {Wk (ki) × Wt (ti)} (2)
ここで、上記(2)式中の変数Wk(ki)及びWt(ti)はそれぞれ、通信の種類及び経過時間に関する加重値であり、例えば次のように設定する。
Wk(k)=1.0 (k=電話の発信)、
0.8 (k=電話の着信)、
0.6 (k=メールの送信)、
0.4 (k=メールの受信)。
Wt(t)=1.0 (t<1日)、
0.5 (1日≦t<3日)、
0.25 (3日≦t<7日)、
0.1 (7日≦t<30日)。
Here, the variables Wk (ki) and Wt (ti) in the above equation (2) are respectively weighted values related to the type of communication and the elapsed time, and are set as follows, for example.
Wk (k) = 1.0 (k = outgoing call),
0.8 (k = incoming call),
0.6 (k = send email),
0.4 (k = reception of mail).
Wt (t) = 1.0 (t <1 day),
0.5 (1 day ≤ t <3 days),
0.25 (3 days ≦ t <7 days),
0.1 (7 days ≦ t <30 days).
上記加重値Wk(ki)及びWt(ti)は、携帯電話機の利用者と通信相手先との間の親密度に対応し、その親密度を数値化したものである。上記設定例の場合、通信の種類についての加重値が大きい優先順位は、電話の発信>電話の着信>メールの送信>メールの受信であり、また、通信の経過時間が短いものほど加重値が大きくなっている。これらの加重値Wk(ki)及びWt(ti)の設定値は、利用者が表示部285に表示された設定画面でキー操作部を操作することにより、変更できるようにしてもよい。
The weighted values Wk (ki) and Wt (ti) correspond to the intimacy between the user of the mobile phone and the communication partner, and the intimacy is numerically expressed. In the case of the above setting example, the order of priority in which the weighting value for the type of communication is large is: outgoing call> incoming call> email transmission> mail reception. It is getting bigger. The set values of these weighted values Wk (ki) and Wt (ti) may be changed by the user operating the key operation unit on the setting screen displayed on the
表1は、画像に含まれる2人の人物A,Bに対する顔認識技術による判定結果の点数Sf及び人物A,Bとの間の通信履歴の具体例であり、表2は人物A,Bに対する顔認識の総合スコアSの計算の具体例である。なお、表2において、総合スコアSを計算する(1)式における加重値Wf及び通話・メールの通信履歴に対する加重値Wcは次のように設定した。
Wf=1.0、
Wc=5.0
Table 1 is a specific example of the score Sf of the determination result by the face recognition technology for the two persons A and B included in the image and the communication history between the persons A and B. Table 2 is for the persons A and B. It is a specific example of calculation of the total score S of face recognition. In Table 2, the weighting value Wf in the equation (1) for calculating the total score S and the weighting value Wc for the call / mail communication history are set as follows.
Wf = 1.0,
Wc = 5.0
通信履歴
人物A
80点
無し
人物B
75点
8時間前:電話の発信1件
2日前: 電話の発信1件、
電話の着信1件
5日前: メールの送信1件
Communication history person A
Person B without 80 points
75
1
Sf
通信履歴スコア
Sc
総合スコア
S
人物A
80点
0点
1.0×80+
5.0×0=
80点
人物B
75点
Wk(電話の発信)×Wt(8時間)+
Wk(電話の発信)×Wt(2日)+
Wk(電話の着信)×Wt(2日)+
Wk(メールの送信)×Wt(5日)=
1.0×1.0+
1.0×0.5+
0.8×0.5+
0.6×0.25=
2.05点
1.0×75+
5.0×2.05=
85.25点
Communication history score Sc
Overall score S
Person A
80 points 0 points 1.0 x 80+
5.0 × 0 =
80 person B
75 points Wk (call outgoing) x Wt (8 hours) +
Wk (outgoing phone call) x Wt (2 days) +
Wk (incoming call) x Wt (2 days) +
Wk (send mail) x Wt (5 days) =
1.0 × 1.0 +
1.0 × 0.5 +
0.8 x 0.5+
0.6 × 0.25 =
2.05 points 1.0 x 75+
5.0 × 2.05 =
85.25 points
図4は、人物を含む画像を撮影してから画像データを保存するまでの処理の一例を示すフローチャートである。まず、携帯電話機20の利用者は、キー操作部を操作し、撮像部280で撮影し、撮影した画像のデータをデータ記憶部210に一旦保存する(S1,S2)。次に、画像解析部260により、上記撮影した画像について顔認識の画像解析処理を実行し、その画像に含まれている人物に該当する確率が高いと判断した所定人数の候補者の情報(例えば、名前や人物識別情報)を、認識結果としてデータ記憶部210に保存する(S3,S4)。例えば、図5の枠内に示すように顔認識スコアSfが高い上位9名の候補者の情報を、認識結果としてデータ記憶部210に保存する。なお、図5の枠外の3名の人物は、上記9名の候補者から外れた人物であり、上記9名の候補者の次に顔認識スコアSfが高い人物である。図中の人物A,Bは、上記表示1及び2に示した人物A,Bに対応している。9名の候補者の中では人物Aの顔認識スコアSfが一番悪い。ここで、実際に人物の顔を含む画像について顔認識処理を行ったところ、図5に示すように顔認識スコアSfが高い上位9名の候補者のいずれかが当該画像に含まれている人物である確率は、92%であった。これに対し、顔認識スコアSfが一番高い1名に絞った場合は、30%であった。
FIG. 4 is a flowchart illustrating an example of processing from capturing an image including a person to storing image data. First, the user of the
次に、上記認識結果を、携帯電話機20の通信履歴情報に基づいて修正する(S5)。例えば、表示1及び2に示した人物A,Bの場合、通信履歴情報に基づいて修正した結果、人物Bの総合スコアSの値(85.25点)が人物Aの総合スコアの値(80点)よりも多くなっているので、図6に示すように上記9名の候補者から人物Aを外し、その代わりに、9名の候補者に人物Bを入れるように、認識結果が修正される。この認識結果の修正により、図6に示す9名の候補者のいずれかが当該画像に含まれている人物である確率は、94%まで高まった。そして、この人物Bを入れた9名が、最終的な候補者のリストとして表示部285に表示される(S6)。
Next, the recognition result is corrected based on the communication history information of the mobile phone 20 (S5). For example, in the case of the persons A and B shown in the
次に、上記表示部285の表示を見た利用者が、9名の候補者から画像に実際に含まれている人物を選択するようにキー操作部を操作すると、その選択された人物の人物識別情報が、データ記憶部210内の該当する画像データに対応付けられて自動保存される(S7,S8)。
Next, when the user who has viewed the display on the
以上、本実施形態によれば、撮像部280による撮影などで取得された画像について顔認識処理(画像解析処理)を実行するとともに、データ記憶部210に記憶されている通信履歴情報に基づいて、上記顔認識処理の認識結果を修正することにより、その認識結果で特定された人物が顔認識の対象の画像に含まれる真の人物である確率を高めることができるので、画像に含まれる人物の顔を認識して人物を特定するときの顔認識の精度を高めることができる。
As described above, according to the present embodiment, the face recognition process (image analysis process) is performed on the image acquired by the imaging by the
また、本実施形態によれば、画像データから人物の顔を特徴付ける顔特徴データを抽出し、その顔特徴データと、データ記憶部210の基準画像データベースに予め記憶されている複数の顔認識基準データとを比較することにより、画像に含まれる人物の顔を効率よく且つ精度よく認識して当該人物を特定できる。
Further, according to the present embodiment, face feature data characterizing a human face is extracted from the image data, and the face feature data and a plurality of face recognition reference data stored in advance in the reference image database of the
また、本実施形態によれば、認識結果修正部265で修正された認識結果である人物識別情報と、対応する画像のデータとを対応付けて記憶しておくことにより、その画像のデータを人物の情報で分類して保存したり検索したりすることができる。
Further, according to the present embodiment, the person identification information, which is the recognition result corrected by the recognition
また、本実施形態によれば、通信相手先の人物との親密度を、通信相手先との通信頻度、通信相手先との通信が行われた日時から現在の日時までの経過時間、及び通信相手先との通信の種類を用いて判定し、その判定で得られた親密度に対応する通信履歴スコアScに基づいて、前記認識結果の顔認識スコアSfを修正することにより、顔認識の精度を更に高めることができる。 Further, according to this embodiment, the familiarity with the person of the communication partner, the communication frequency with the communication partner, the elapsed time from the date and time when the communication with the communication partner was performed to the current date and time, and the communication By using the type of communication with the other party and correcting the face recognition score Sf of the recognition result based on the communication history score Sc corresponding to the familiarity obtained by the determination, the accuracy of face recognition Can be further increased.
また、本実施形態によれば、画像に含まれている人物について複数の候補者を認識結果として提示することにより、認識結果の全体としての精度を高めつつ、当該画像に含まれている人物を最終的に特定するときに携帯電話機の利用者が判断して選択できるようになる。特に、携帯電話機の利用者は、表示部285で確認しながらキー操作部を操作することができるので、複数の候補者のいずれか一人を特定の人物として選択する利用者による選択作業が容易になるともに、データ記憶部210に画像データとを対応付けて記憶される人物識別情報の精度も高めることができる。
In addition, according to the present embodiment, by presenting a plurality of candidates as recognition results for the person included in the image, the accuracy of the recognition result as a whole can be improved, and the person included in the image can be selected. The user of the mobile phone can judge and select when finally specifying. In particular, since the user of the mobile phone can operate the key operation unit while confirming with the
以上、本発明の好ましい実施形態を説明したが、特許請求の範囲に記載された技術的事項の範囲内において、開示した実施形態に種々の変更を加えることができる。 Although the preferred embodiments of the present invention have been described above, various modifications can be made to the disclosed embodiments within the scope of the technical matters described in the claims.
例えば、上記実施形態において、上記画像データは静止画のデータでもいいし、動画のデータでもよい。動画の画像データをサーバにアップロードして共有可能に保存する場合は、例えば動画の特定の画像フレームについて画像解析(顔認識)を行う。画像解析を行う画像フレームは、利用者が指定してもいいし、画像解析部が複数の画像フレームをスキャンして画像解析に好適な画像フレームを自動的に選択するようにしてもよい。 For example, in the above embodiment, the image data may be still image data or moving image data. When uploading image data of a moving image to a server and storing it in a shareable manner, for example, image analysis (face recognition) is performed on a specific image frame of the moving image. The image frame for image analysis may be specified by the user, or the image analysis unit may scan a plurality of image frames and automatically select an image frame suitable for image analysis.
また、上記実施形態では、通信端末が携帯電話機の場合について説明したが、本発明は、PHS、自動車電話機、通信機能を有する携帯情報端末(PDA)、通信機能を有するデジタルカメラ等、他の通信端末の場合についても適用でき、同様な効果が得られるものである。 Moreover, although the case where the communication terminal is a mobile phone has been described in the above embodiment, the present invention is not limited to other communication such as a PHS, a car phone, a personal digital assistant (PDA) having a communication function, a digital camera having a communication function, etc. It can be applied to the case of a terminal, and the same effect can be obtained.
10 携帯電話通信網
20,21 携帯電話機
30 サーバ
10 mobile
Claims (13)
前記画像のデータに基づいて該画像に含まれる人物の顔を認識して該人物を特定する顔認識手段と、
前記通信履歴記憶手段に記憶されている通信履歴情報に基づいて、前記認識結果を修正する認識結果修正手段と、
を備えたことを特徴とする通信端末。 A communication terminal comprising a communication means for communicating with the outside, a communication history storage means for storing communication history information in association with information on a person of a communication partner, and an image data storage means for storing image data. And
Face recognition means for recognizing a person's face included in the image based on the image data and identifying the person;
Recognition result correction means for correcting the recognition result based on communication history information stored in the communication history storage means;
A communication terminal comprising:
複数の人物それぞれについて顔の認識に用いる複数の顔認識基準データを記憶する顔認識基準データ記憶手段を更に備え、
前記顔認識手段は、前記画像に含まれる人物の顔を特徴付ける顔特徴データを抽出し、その抽出された顔特徴データと、前記顔認識基準データ記憶手段に記憶されている前記複数の顔認識基準データとを比較することにより、前記画像に含まれる人物を特定することを特徴とする通信端末。 The communication terminal according to claim 1, wherein
Face recognition reference data storage means for storing a plurality of face recognition reference data used for face recognition for each of a plurality of persons;
The face recognition means extracts face feature data characterizing a human face included in the image, and the extracted face feature data and the plurality of face recognition standards stored in the face recognition reference data storage means A communication terminal characterized by identifying a person included in the image by comparing with data.
前記画像データ記憶手段は、前記認識結果修正手段で修正された認識結果と前記画像のデータとを対応付けて記憶することを特徴とする通信端末。 In the communication terminal according to claim 1 or 2,
The image data storage means stores the recognition result corrected by the recognition result correction means and the image data in association with each other.
前記認識結果修正手段は、前記通信履歴情報に基づいて前記通信相手先の人物との親密度を判定し、該親密度に基づいて前記認識結果を修正することを特徴とする通信端末。 In the communication terminal according to any one of claims 1 to 3,
The communication terminal characterized in that the recognition result correcting means determines a closeness with the person of the communication partner based on the communication history information and corrects the recognition result based on the closeness.
前記認識結果修正手段で用いる前記通信履歴情報は、前記通信相手先の人物ごとに記憶されている通信頻度、該通信相手先との通信が行われた日時から現在の日時までの経過時間、及び該通信相手先との通信の種類の少なくとも一つの情報であることを特徴とする通信端末。 In the communication terminal in any one of Claims 1 thru | or 4,
The communication history information used by the recognition result correcting means includes a communication frequency stored for each person of the communication partner, an elapsed time from the date and time when communication with the communication partner is performed, and the current date and time, and A communication terminal comprising at least one piece of information of a type of communication with the communication partner.
前記認識結果修正手段は、前記通信相手先の人物との通信頻度が多いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正することを特徴とする通信端末。 The communication terminal according to claim 5, wherein
The communication result correcting means determines that the probability that the person is included in the image is higher as the communication frequency with the person of the communication partner is higher, and corrects the recognition result. Terminal.
前記認識結果修正手段は、前記通信相手先の人物との通信に対する前記経過時間が短いほど、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正することを特徴とする通信端末。 The communication terminal according to claim 5, wherein
The recognition result correcting means determines that the probability that the person is included in the image is higher as the elapsed time for communication with the person of the communication partner is shorter, and corrects the recognition result. Communication terminal.
前記認識結果修正手段は、前記通信相手先の人物との通信の種類について、該人物への電話の発信、該人物からの電話の着信、該人物へのメールの送信、該人物からのメールの受信の順に、前記画像に該人物が含まれている確率が高いと判断して前記認識結果を修正することを特徴とする通信端末。 The communication terminal according to claim 5, wherein
The recognition result correcting means is configured to send a call to the person, receive a call from the person, send a mail to the person, send a mail to the person, A communication terminal that corrects the recognition result by determining that the probability that the person is included in the image is high in the order of reception.
前記認識結果は、前記画像に含まれている人物について複数の候補者を提示するものであり、
前記認識結果修正手段は、前記通信履歴情報に基づいて、前記認識結果に含める前記候補者を修正することを特徴とする通信端末。 In the communication terminal according to any one of claims 1 to 8,
The recognition result presents a plurality of candidates for a person included in the image,
The said recognition result correction means corrects the said candidate included in the said recognition result based on the said communication history information, The communication terminal characterized by the above-mentioned.
前記表示手段に表示された前記認識結果の複数の候補者を表示する表示手段と、
前記複数の候補者からいずれか一人を、前記画像に含まれる特定の人物として選択するための選択手段と、更にを備え、
前記画像データ記憶手段は、前記選択手段で選択された人物の情報と前記画像のデータとを対応付けて記憶することを特徴とする通信端末。 The communication terminal according to claim 9, wherein
Display means for displaying a plurality of candidates for the recognition result displayed on the display means;
Selecting means for selecting any one of the plurality of candidates as a specific person included in the image; and
The communication terminal characterized in that the image data storage means stores information on the person selected by the selection means and the image data in association with each other.
画像を撮影する撮像手段を更に備え、
前記顔認識対象の画像が、前記撮像手段で撮影した画像であることを特徴とする通信端末。 In the communication terminal in any one of Claims 1 thru | or 10,
It further comprises imaging means for taking an image,
The communication terminal, wherein the face recognition target image is an image taken by the imaging means.
画像のデータに基づいて該画像に含まれる人物の顔を認識して該人物を特定するステップと、
前記通信履歴情報に基づいて前記認識結果を修正するステップと、を有することを特徴とする情報処理方法。 An information processing method in a communication terminal that stores communication history information in association with information on a person of a communication partner,
Recognizing a person's face included in the image based on image data and identifying the person;
Correcting the recognition result based on the communication history information.
画像のデータに基づいて該画像に含まれる人物の顔を認識して該人物を特定するステップと、
前記通信履歴情報に基づいて前記認識結果を修正するステップとを、
前記コンピュータを用いて実行させることを特徴とするプログラム。 A program for executing information processing in a communication terminal that stores communication history information in association with information on a person of a communication partner using a computer of the communication terminal,
Recognizing a person's face included in the image based on image data and identifying the person;
Correcting the recognition result based on the communication history information,
A program that is executed using the computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007308098A JP5236264B2 (en) | 2007-11-28 | 2007-11-28 | Communication terminal, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007308098A JP5236264B2 (en) | 2007-11-28 | 2007-11-28 | Communication terminal, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009135616A true JP2009135616A (en) | 2009-06-18 |
JP5236264B2 JP5236264B2 (en) | 2013-07-17 |
Family
ID=40867096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007308098A Active JP5236264B2 (en) | 2007-11-28 | 2007-11-28 | Communication terminal, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5236264B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110028811A (en) * | 2009-09-14 | 2011-03-22 | 엘지전자 주식회사 | Mobile terminal and information providing method thereof |
KR20140035544A (en) * | 2012-09-13 | 2014-03-24 | 엘지전자 주식회사 | Mobile terminal and cloud system |
US8953835B2 (en) | 2010-01-28 | 2015-02-10 | Pantech Co., Ltd. | Mobile terminal and method for forming human network using the same |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004127285A (en) * | 2002-09-13 | 2004-04-22 | Sony Corp | Image recognition apparatus, image recognition processing method and image recognition program |
JP2005086516A (en) * | 2003-09-09 | 2005-03-31 | Canon Inc | Imaging device, printer, image processor and program |
JP2006165821A (en) * | 2004-12-03 | 2006-06-22 | Nikon Corp | Portable telephone |
JP2007028077A (en) * | 2005-07-14 | 2007-02-01 | Noritsu Koki Co Ltd | Portable terminal |
JP2007041964A (en) * | 2005-08-04 | 2007-02-15 | Matsushita Electric Ind Co Ltd | Image processor |
-
2007
- 2007-11-28 JP JP2007308098A patent/JP5236264B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004127285A (en) * | 2002-09-13 | 2004-04-22 | Sony Corp | Image recognition apparatus, image recognition processing method and image recognition program |
JP2005086516A (en) * | 2003-09-09 | 2005-03-31 | Canon Inc | Imaging device, printer, image processor and program |
JP2006165821A (en) * | 2004-12-03 | 2006-06-22 | Nikon Corp | Portable telephone |
JP2007028077A (en) * | 2005-07-14 | 2007-02-01 | Noritsu Koki Co Ltd | Portable terminal |
JP2007041964A (en) * | 2005-08-04 | 2007-02-15 | Matsushita Electric Ind Co Ltd | Image processor |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110028811A (en) * | 2009-09-14 | 2011-03-22 | 엘지전자 주식회사 | Mobile terminal and information providing method thereof |
KR101615969B1 (en) * | 2009-09-14 | 2016-04-28 | 엘지전자 주식회사 | Mobile terminal and information providing method thereof |
US8953835B2 (en) | 2010-01-28 | 2015-02-10 | Pantech Co., Ltd. | Mobile terminal and method for forming human network using the same |
KR20140035544A (en) * | 2012-09-13 | 2014-03-24 | 엘지전자 주식회사 | Mobile terminal and cloud system |
KR101984088B1 (en) * | 2012-09-13 | 2019-05-30 | 엘지전자 주식회사 | Mobile terminal and cloud system |
Also Published As
Publication number | Publication date |
---|---|
JP5236264B2 (en) | 2013-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9015260B2 (en) | Communication terminal device, and recording medium for image storage, selection and email attachment | |
US20080320033A1 (en) | Method, Apparatus and Computer Program Product for Providing Association of Objects Using Metadata | |
MX2008016095A (en) | Image based dialing. | |
KR100630200B1 (en) | Method for operating calculator mode in the portable terminal | |
JP2004260657A (en) | Portable communication terminal device | |
JP5152045B2 (en) | Telephone device, image display method, and image display processing program | |
US7245943B2 (en) | Apparatus and method for inputting characters in a mobile communication terminal | |
US8760486B2 (en) | Method for providing phone book using business card recognition in mobile communication terminal and mobile communication terminal using the method | |
JP5236264B2 (en) | Communication terminal, information processing method, and program | |
KR100484245B1 (en) | Apparatus for automatic seaching and managementing a image phone book of mobile phone and method there of | |
JP5501815B2 (en) | Information communication equipment | |
JP2004178294A (en) | Mobile terminal displaying related e-mail, method of displaying e-mail, and program | |
KR100517337B1 (en) | The Method and apparatus for the management of the name card by using of mobile hand held camera phone | |
JP2008010935A (en) | Mobile radio terminal device | |
JP2007312262A (en) | Information processing apparatus, information processing method, information processing program, and mobile terminal | |
KR100630165B1 (en) | Method for searching phone number in wireless terminal | |
KR20060038787A (en) | Method for deleting/re-transmission of media data in mobile phone's | |
KR20080034248A (en) | Method for searching photo by facial recognition in mobile terminal | |
JP2005191979A (en) | Electronic equipment and communication terminal | |
KR20070065752A (en) | Method and system for dialing by using stored image for use in mobile communication terminal | |
US8761837B2 (en) | Communication device, communication history display method, and computer-readable recording medium recorded with communication history display program | |
JP2004297122A (en) | Portable communication method, portable communication system, and portable communication terminal used therefor | |
JP2007259275A (en) | Method and device for registering nickname at communication terminal | |
JP2014139839A (en) | Portable terminal and information providing method as well as programs therefor | |
KR100810199B1 (en) | Apparatus and method for displaying caller-id in mobile terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120427 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120726 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130327 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5236264 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |