JPWO2004039044A1 - Communication terminal, voiceprint information search server, personal information display system, personal information display method in communication terminal, personal information display program - Google Patents

Communication terminal, voiceprint information search server, personal information display system, personal information display method in communication terminal, personal information display program Download PDF

Info

Publication number
JPWO2004039044A1
JPWO2004039044A1 JP2004546371A JP2004546371A JPWO2004039044A1 JP WO2004039044 A1 JPWO2004039044 A1 JP WO2004039044A1 JP 2004546371 A JP2004546371 A JP 2004546371A JP 2004546371 A JP2004546371 A JP 2004546371A JP WO2004039044 A1 JPWO2004039044 A1 JP WO2004039044A1
Authority
JP
Japan
Prior art keywords
information
voiceprint
communication terminal
caller
personal information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004546371A
Other languages
Japanese (ja)
Inventor
悟 植山
悟 植山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Peripherals Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Peripherals Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Peripherals Ltd filed Critical Fujitsu Ltd
Publication of JPWO2004039044A1 publication Critical patent/JPWO2004039044A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • H04M3/385Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/57Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set
    • H04M1/575Means for retrieving and displaying personal data about calling party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42034Calling party identification service
    • H04M3/42042Notifying the called party of information on the calling party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/41Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6054Biometric subscriber identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

着信による通話開始時に、発信者の個人情報の表示を行う通信端末において、登録された個人の個人情報と個人の声紋情報とを対応づけて記憶するデータベースとしてのFLASH−ROM10と、着信による通話開始時に発信者の音声から発信者の声紋情報を抽出する声紋分析部6と、発信者の声紋情報とデータベース内の声紋情報とを比較することによりデータベース内の個人の中から発信者を特定するMPU7と、特定された発信者の個人情報を表示する表示部としてのLCD17とを備えた。FLASH-ROM 10 serving as a database for storing personal information and personal voiceprint information in association with each other in a communication terminal that displays the personal information of the caller at the start of the incoming call, and starting the incoming call Sometimes the voiceprint analysis unit 6 that extracts the voiceprint information of the caller from the voice of the caller, and the MPU 7 that identifies the caller from the individuals in the database by comparing the voiceprint information of the caller with the voiceprint information in the database. And an LCD 17 as a display unit for displaying personal information of the specified caller.

Description

本発明は、着信による通話開始時に発信者の声紋を用いて個人を特定し、その個人情報を画面に表示する通信端末、声紋情報検索サーバ、通信端末における個人情報表示方法、個人情報表示プログラムに関するものである。なお、通信端末には携帯電話機のような携帯端末も含まれる。  The present invention relates to a communication terminal, a voiceprint information search server, a personal information display method in a communication terminal, and a personal information display program for identifying an individual using a caller's voiceprint at the start of an incoming call and displaying the personal information on a screen. Is. The communication terminal includes a mobile terminal such as a mobile phone.

従来、通信端末を用いた通話等において、発信先の通信端末のユーザが発信元の通信端末のユーザ(発信者)を知るためには、通話開始時に発信者の名前を聞いたり、あるいは発信者の声から判断する必要がある。また、着信時に発信元の電話番号または名前を表示する機能を有する通信端末を用いて通話を行う場合は、ユーザは表示される電話番号または名前を視認することにより、発信元を認識することができる。この発信者の名前の表示は、例えば特開2001−218267号に知られており、携帯電話より発信される電波を送受信機にて受信し、その電波に含まれる携帯電話の電話番号を個人認証判定部にて個人認証データベースを用いて照合することにより行っている。
しかしながら、このような従来の技術においては、発信元の電話番号または名前を表示する通信端末を用いても、発信元の電話番号が複数の人に使われているような場合、例えば発信元の電話番号が企業や団体の電話番号である場合は、発信者個人を特定することができないという問題がある。また、発信元の通信端末を持ち主以外の個人が使用した場合は、発信元をその通信端末の持ち主と間違えてしまうという問題がある。
本発明は、このような問題を解決するためになされたものであり、着信による通話開始時に発信者の声紋を用いて発信者個人を特定し、発信者の個人情報を画面に表示できる通信端末、声紋情報検索サーバ、通信端末における個人情報表示方法、個人情報表示プログラムを提供することを目的とする。
Conventionally, in a call using a communication terminal or the like, in order for the user of the communication terminal of the call destination to know the user (caller) of the communication terminal of the call origin, It is necessary to judge from the voice. In addition, when a call is made using a communication terminal having a function of displaying a caller's telephone number or name when an incoming call is received, the user may recognize the caller by visually recognizing the displayed telephone number or name. it can. This caller name display is known, for example, in Japanese Patent Application Laid-Open No. 2001-218267. A radio wave transmitted from a mobile phone is received by a transmitter / receiver, and the mobile phone number included in the radio wave is personally authenticated. This is done by collating using a personal authentication database in the determination unit.
However, in such a conventional technique, even when a communication terminal that displays a caller's phone number or name is used, if the caller's phone number is used by multiple people, for example, When the telephone number is a telephone number of a company or organization, there is a problem that the individual sender cannot be specified. In addition, when an individual other than the owner uses the communication terminal of the sender, there is a problem that the sender is mistaken for the owner of the communication terminal.
The present invention has been made to solve such a problem, and can identify a caller using a voiceprint of a caller at the start of an incoming call and can display personal information of the caller on a screen. An object of the present invention is to provide a voiceprint information search server, a personal information display method in a communication terminal, and a personal information display program.

本発明の通信端末は、例えば登録された個人の個人情報と前記個人の声紋情報とを対応づけて記憶するデータベースと、着信による通話開始時に発信者の音声から前記発信者の声紋情報を抽出する声紋分析部と、前記発信者の声紋情報と前記データベース内の声紋情報とを比較することにより前記発信者についての前記データベース内の個人情報を特定する演算部と、特定された前記発信者の個人情報を表示する表示部とを備えてなるものである。
このような構成によれば、着信による通話開始時に、例えばユーザは表示部に表示される個人情報を視認等することにより発信者を特定することができる。なお、表示部は音声表示するものであっても良い。ここで、実施の形態1におけるデータベースとはFLASH−ROM10のことであり、声紋分析部とは声紋分析部6のことであり、演算部とはMPU7のことであり、表示部とはLCD17のことである。
また、本発明に係る通信端末においては、例えばユーザが前記発信者の個人情報を入力するための入力部を備え、前記声紋分析部から得られた前記発信者の声紋情報が前記データベースに登録されていない場合に、前記発信者の声紋情報と前記入力部から得られた前記発信者の個人情報とからなる組を前記データベースへ登録することを特徴とするものである。
このような構成によれば、通信端末内のデータベースに発信者の声紋情報が保存されていない場合、ユーザは入力部を用いて発信者の個人情報を入力し、通信端末内のデータベースに発信者の声紋情報と個人情報をリンクさせて保存することができる。なお、実施の形態1における入力部とはキーパッド18のことである。
また、本発明は、通信回線を介して通信端末と接続されることができる声紋情報検索サーバであって、例えば登録された個人の個人情報と前記個人の声紋情報とを対応づけて記憶するデータベースと、前記通信端末から声紋情報を含む情報を受信する受信部と、該受信部が受信した声紋情報と前記データベース内の声紋情報とを比較することにより、前記データベース内の個人情報(前記受信された声紋情報を持つ話者)を特定する演算部と、特定された前記データベース内の個人情報を前記通信端末へ送信する送信部とを備えてなるものである。
また、本発明は、通信回線を介して前記声紋情報検索サーバと接続されることができる通信端末であって、着信による通話開始時に発信者の音声から前記発信者の声紋情報を抽出する声紋分析部と、前記発信者の声紋情報を前記声紋情報検索サーバへ送信する送信部と、前記発信者の個人情報を前記声紋情報検索サーバから受信する受信部と、該受信部から得られる前記発信者の個人情報を表示する表示部とを備えてなるものである。
このような構成によれば、着信による通話開始時に、ユーザは表示部に表示される個人情報を視認等することにより発信者を特定することができる。また、声紋情報検索サーバが一括してデータベースを持ち、通信端末が個々にデータベースを持つ必要がないことから、通信端末の回路規模を低減することができる。なお、実施の形態2における声紋情報検索サーバとはサーバ40のことであり、通信端末とは通信端末1Aのことであり、データベースとは記憶部44のことであり、送信部と受信部とは信号処理部41のことであり、演算部とは制御部43のことであり、声紋分析部とは声紋分析部6のことであり、送信部と受信部とは信号処理部3のことであり、表示部とはLCD17のことである。
また、本発明に係る通信端末においては、発信者の個人情報を入力するための入力部を備え、例えば前記発信者の個人情報が前記声紋情報検索サーバから受信されない場合に、前記発信者の声紋情報と前記入力部から得られた前記発信者の個人情報とからなる組を前記声紋情報検索サーバのデータベースへ登録することを特徴とするものである。
このような構成によれば、声紋情報検索サーバ内のデータベースに発信者の声紋情報が保存されていない場合、ユーザは入力部を用いて個人情報を入力し、声紋情報検索サーバ内のデータベースに発信者の声紋情報と個人情報をリンクさせて保存することができる。なお、実施の形態2における入力部とはキーパッド18のことである。また、本発明によれば、これら声紋情報検索サーバと通信端末とから個人情報表示システムが構成される。
また、本発明は、通信回線を介して通信端末と接続されることができる声紋情報検索サーバであって、例えば登録された個人の個人情報と前記個人の声紋情報とを対応づけて記憶するデータベースと、通信端末から音声を含む情報を受信する受信部と、該受信部が受信した音声から声紋情報を抽出する声紋分析部と、該声紋分析部が抽出した声紋情報と前記データベース内の声紋情報とを比較することにより前記データベース内の個人情報を特定する演算部と、前記特定された前記データベース内の個人情報を前記通信端末へ送信する送信部とを備えてなるものである。
また、本発明は、通信回線を介して前記声紋情報検索サーバと接続されることができる通信端末であって、着信による通話開始時に発信者の音声を前記声紋情報検索サーバへ転送する送信部と、前記声紋情報検索サーバから前記発信者の個人情報を受信する受信部と、該受信部から得られる前記発信者の個人情報を表示する表示部とを備えてなるものである。
このような構成によれば、着信による通話開始時に、ユーザは表示部に表示される個人情報を視認等することにより発信者を特定することができる。また、通信端末に比べて演算性能の高い声紋情報検索サーバが声紋分析や比較を行うことにより、高速に個人を特定することができるとともに、通信端末が個々に声紋分析部やデータベースを持つ必要がないことから、通信端末の回路規模を低減することができる。なお、実施の形態3における声紋情報検索サーバとはサーバ60のことであり、通信端末とは通信端末50のことであり、データベースとは記憶部65のことであり、声紋分析とは声紋分析部64のことであり、送信部と受信部とは信号処理部61のことであり、演算部とは制御部63のことであり、送信部と受信部とは信号処理部3のことであり、表示部とはLCD17のことである。
また、本発明に係る通信端末においては、発信者の個人情報を入力するための入力部を備え、例えば前記発信者の個人情報が前記声紋情報検索サーバから受信されない場合に、前記発信者の声紋情報と前記入力部から得られた前記発信者の個人情報とからなる組を前記声紋情報検索サーバのデータベースへ登録することを特徴とするものである。
このような構成によれば、声紋情報検索サーバ内のデータベースに発信者の声紋情報が保存されていない場合、ユーザは入力部を用いて個人情報を入力し、声紋情報検索サーバ内のデータベースに発信者の声紋情報と個人情報をリンクさせて保存することができる。なお、実施の形態3における入力部とはキーパッド18のことである。また、本発明によれば、これら声紋情報検索サーバと通信端末により個人情報表示システムが構成される。
また、本発明は、着信による通話開始時に、発信者の個人情報の表示を行う通信端末における個人情報表示方法であって、例えば登録された個人の個人情報と前記個人の声紋情報を対応づけデータベースとして記憶するステップと、前記発信者の音声から前記発信者の声紋情報を抽出するステップと、前記発信者の声紋情報と前記データベース内の声紋情報とを比較することにより前記発信者についての前記データベース内の個人情報を特定するステップと、特定された前記発信者の個人情報を表示するステップとを備えてなる通信端末における個人情報表示方法を提供するものである。
また、本発明は、着信による通話開始時に、発信者の個人情報の表示をコンピュータに実行させるために、コンピュータにより読取可能な媒体に記憶された個人情報表示プログラムであって、例えば登録された個人の個人情報と前記個人の声紋情報を対応づけデータベースとして記憶するステップと、前記発信者の音声から前記発信者の声紋情報を抽出するステップと、前記発信者の声紋情報と前記データベース内の声紋情報とを比較することにより前記発信者についての前記データベース内の個人情報を特定するステップと、特定された前記発信者の個人情報を表示するステップとをコンピュータに実行させる個人情報表示プログラムを提供するものである。なお、このプログラムは、コンピュータにより読み取り可能な記憶媒体に記憶されることができ、記憶媒体としては、ROM、RAM等の半導体メモリ、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース等がある。
The communication terminal of the present invention extracts, for example, the voice print information of the caller from the database that stores the personal information of the registered individual and the personal voice print information in association with each other, and the voice of the caller at the start of the incoming call. A voiceprint analysis unit; a calculation unit that identifies personal information in the database for the sender by comparing the voiceprint information of the sender with voiceprint information in the database; and the identified individual of the sender And a display unit for displaying information.
According to such a configuration, at the start of an incoming call, for example, the user can identify the caller by visually checking the personal information displayed on the display unit. Note that the display unit may display a sound. Here, the database in the first embodiment is the FLASH-ROM 10, the voiceprint analysis unit is the voiceprint analysis unit 6, the calculation unit is the MPU 7, and the display unit is the LCD 17. It is.
In the communication terminal according to the present invention, for example, a user includes an input unit for inputting personal information of the caller, and the voiceprint information of the caller obtained from the voiceprint analysis unit is registered in the database. If not, a set consisting of the voiceprint information of the sender and the personal information of the sender obtained from the input unit is registered in the database.
According to such a configuration, when the voiceprint information of the caller is not stored in the database in the communication terminal, the user inputs the caller's personal information using the input unit, and the caller is stored in the database in the communication terminal. Voiceprint information and personal information can be linked and saved. The input unit in the first embodiment is the keypad 18.
Further, the present invention is a voiceprint information search server that can be connected to a communication terminal via a communication line, and stores, for example, a registered personal information and the personal voiceprint information in association with each other. And a receiving unit for receiving information including voiceprint information from the communication terminal, and comparing the voiceprint information received by the receiving unit with the voiceprint information in the database, thereby storing the personal information in the database (the received information). And a transmitter for transmitting the specified personal information in the database to the communication terminal.
Further, the present invention is a communication terminal that can be connected to the voiceprint information search server via a communication line, and extracts the voiceprint information of the caller from the voice of the caller at the start of the incoming call A transmitter that transmits the voiceprint information of the sender to the voiceprint information search server, a receiver that receives the personal information of the sender from the voiceprint information search server, and the sender obtained from the receiver And a display unit for displaying the personal information.
According to such a configuration, the user can specify the caller by visually recognizing the personal information displayed on the display unit at the start of the incoming call. Further, since the voiceprint information search server has a database in a lump and the communication terminals do not need to have a database individually, the circuit scale of the communication terminals can be reduced. In addition, the voiceprint information search server in Embodiment 2 is the server 40, the communication terminal is the communication terminal 1A, the database is the storage unit 44, and the transmission unit and the reception unit are The signal processing unit 41, the calculation unit is the control unit 43, the voice print analysis unit is the voice print analysis unit 6, and the transmission unit and the reception unit are the signal processing unit 3. The display unit is the LCD 17.
The communication terminal according to the present invention further includes an input unit for inputting the personal information of the caller. For example, when the personal information of the caller is not received from the voiceprint information search server, the voiceprint of the caller is provided. A set of information and personal information of the sender obtained from the input unit is registered in a database of the voiceprint information search server.
According to such a configuration, when the voiceprint information of the caller is not stored in the database in the voiceprint information search server, the user inputs personal information using the input unit, and sends the personal information to the database in the voiceprint information search server. A person's voiceprint information and personal information can be linked and stored. In the second embodiment, the input unit is the keypad 18. Further, according to the present invention, a personal information display system is constituted by the voiceprint information search server and the communication terminal.
Further, the present invention is a voiceprint information search server that can be connected to a communication terminal via a communication line, and stores, for example, a registered personal information and the personal voiceprint information in association with each other. A receiving unit for receiving information including voice from the communication terminal, a voiceprint analyzing unit for extracting voiceprint information from the voice received by the receiving unit, voiceprint information extracted by the voiceprint analyzing unit, and voiceprint information in the database Are provided with a calculation unit that specifies personal information in the database and a transmission unit that transmits the specified personal information in the database to the communication terminal.
Further, the present invention is a communication terminal that can be connected to the voiceprint information search server via a communication line, and transmits a voice of a caller to the voiceprint information search server at the start of a call by incoming call; A receiving unit that receives the sender's personal information from the voiceprint information search server, and a display unit that displays the sender's personal information obtained from the receiving unit.
According to such a configuration, the user can specify the caller by visually recognizing the personal information displayed on the display unit at the start of the incoming call. In addition, a voiceprint information search server with higher computing performance than a communication terminal can identify a person at high speed by performing voiceprint analysis and comparison, and the communication terminal needs to have a voiceprint analysis unit and a database individually. Therefore, the circuit scale of the communication terminal can be reduced. The voiceprint information search server in the third embodiment is the server 60, the communication terminal is the communication terminal 50, the database is the storage unit 65, and the voiceprint analysis is the voiceprint analysis unit. 64, the transmission unit and the reception unit are the signal processing unit 61, the arithmetic unit is the control unit 63, the transmission unit and the reception unit are the signal processing unit 3, The display unit is the LCD 17.
The communication terminal according to the present invention further includes an input unit for inputting the personal information of the caller. For example, when the personal information of the caller is not received from the voiceprint information search server, the voiceprint of the caller is provided. A set of information and personal information of the sender obtained from the input unit is registered in a database of the voiceprint information search server.
According to such a configuration, when the voiceprint information of the caller is not stored in the database in the voiceprint information search server, the user inputs personal information using the input unit, and sends the personal information to the database in the voiceprint information search server. A person's voiceprint information and personal information can be linked and stored. In the third embodiment, the input unit is the keypad 18. Further, according to the present invention, a personal information display system is constituted by these voiceprint information search servers and communication terminals.
The present invention is also a personal information display method in a communication terminal that displays personal information of a caller at the start of a call by incoming call, for example, a database that associates registered personal personal information and personal voiceprint information. Storing the caller's voiceprint information from the caller's voice, comparing the caller's voiceprint information with the voiceprint information in the database to compare the database of the caller The personal information display method in the communication terminal comprising the steps of specifying personal information in the communication terminal and displaying the personal information of the specified sender is provided.
The present invention is also a personal information display program stored on a computer-readable medium for causing a computer to display personal information of a caller at the start of an incoming call, for example, a registered individual Storing the personal information of the person and the voice print information of the person as a database, extracting the voice print information of the caller from the voice of the caller, the voice print information of the caller and the voiceprint information in the database Providing a personal information display program for causing a computer to execute the step of identifying personal information in the database for the sender by comparing the information and the step of displaying the personal information of the identified sender It is. This program can be stored in a computer-readable storage medium, such as a semiconductor memory such as ROM or RAM, a CD-ROM, a flexible disk, a DVD disk, a magneto-optical disk, or an IC card. And a portable storage medium such as a database for holding computer programs.

第1図は、本発明の実施の形態1に係る通信端末の構成の一例を示すブロック図である。
第2図は、本発明の実施の形態1に係る通信端末の発信者特定の動作の一例を示すフローチャートである。
第3図は、通信端末とサーバを備えた通信システムの構成の一例を示すブロック図である。
第4図は、本発明の実施の形態2に係るサーバの構成の一例を示すブロック図である。
第5図は、本発明の実施の形態2に係る通信端末の発信者特定の動作の一例を示すフローチャートである。
第6図は、本発明の実施の形態2に係るサーバの発信者特定の動作の一例を示すフローチャートである。
第7図は、本発明の実施の形態3に係る通信端末の構成の一例を示すブロック図である。
第8図は、本発明の実施の形態3に係るサーバの構成の一例を示すブロック図である。
第9図は、本発明の実施の形態3に係る通信端末の発信者特定の動作の一例を示すフローチャートである。
第10図は、本発明の実施の形態3に係るサーバの発信者特定の動作の一例を示すフローチャートである。
FIG. 1 is a block diagram showing an example of the configuration of a communication terminal according to Embodiment 1 of the present invention.
FIG. 2 is a flowchart showing an example of a caller specifying operation of the communication terminal according to Embodiment 1 of the present invention.
FIG. 3 is a block diagram illustrating an example of a configuration of a communication system including a communication terminal and a server.
FIG. 4 is a block diagram showing an example of the configuration of the server according to Embodiment 2 of the present invention.
FIG. 5 is a flowchart showing an example of a caller specifying operation of the communication terminal according to Embodiment 2 of the present invention.
FIG. 6 is a flowchart showing an example of the caller specifying operation of the server according to Embodiment 2 of the present invention.
FIG. 7 is a block diagram showing an example of the configuration of the communication terminal according to Embodiment 3 of the present invention.
FIG. 8 is a block diagram showing an example of the configuration of the server according to Embodiment 3 of the present invention.
FIG. 9 is a flowchart showing an example of the caller specifying operation of the communication terminal according to Embodiment 3 of the present invention.
FIG. 10 is a flowchart showing an example of the caller specifying operation of the server according to Embodiment 3 of the present invention.

以下、本発明の実施の形態について図面を参照して詳細に説明する。なお、本発明の実施の形態では、通信端末のうち無線通信を行う通信端末を例に挙げて説明する。
実施の形態1.
本実施の形態では、通信端末の着信における発信者特定において、通信端末が声紋分析を行い、声紋情報の検索を行い、個人情報の表示を行う例について説明する。
まず、通信端末の構成と動作について説明する。第1図は、本発明の実施の形態1に係る通信端末の構成の一例を示すブロック図である。第1図に示すように、この通信端末1は、送受信アンテナ2と信号処理部3とデータ処理部4と音声処理部5と声紋分析部6とMPU(Microprocessing Unit)7とRAM(Random Access Memory)8とROM(Read Only Memory)9とFLASH−ROM10と音源LSI(Large Scale Integrated Circuit)11とマイク12とスピーカ13と外部入出力部14とバイブレータ15とLED(Light Emitting Diode)16とLCD(Liquid Crystal Display)17とキーパッド18から構成される。
MPU7は、信号処理部3とデータ処理部4と音声処理部5と声紋分析部6とRAM8とROM9とFLASH−ROM10と音源LSI11と外部入出力部14とバイブレータ15とLED16とLCD17とキーパッド18と接続されており、それぞれの制御を行う。
送信動作において、信号処理部3は、データ処理部4からの非音声データと音声処理部5からの音声データを合成し、送受信アンテナ2を介して外部へ送信する。また受信動作において、信号処理部3は、送受信アンテナ2を介して受信した信号が音声以外の非音声データであればデータ処理部4へ出力し、音声データであれば音声処理部5へ出力する。
非音声データは、データ処理部4を介して文字や画像としてLCD17へ出力される。音声処理部5は、スピーカ13を介して音声データを音声として外部へ出力すると共に、声紋分析に必要な音声データを声紋分析部6へ出力する。また、音声処理部5は、マイク12を介して外部から受信した音声を音声データとして信号処理部3へ出力する。
声紋分析部6は、例えば特許第3280825号公報に開示されたような処理を用いて、受信した音声データに対して声紋分析を行い、周波数ごとの時間分布、発声時間、ピッチ周波数等からなる声紋情報を算出し、RAM8へ出力する。
ROM9は、MPU7のプログラム等を保存する。RAM8は、MPU7のプログラムの実行に必要な情報を保存する。また、RAM8は、声紋情報を一時的に保存する。FLASH−ROM10は、声紋情報と個人情報をリンクさせたデータベースを保存する。ここで個人情報とは、例えば名前、年齢、性別、会社名、電話番号、管理番号等である。
音源LSI11は着信音等を生成する。外部入出力部14は、外部のPC等とケーブル等を介してデータの入出力を行う。バイブレータ15は着信等に伴って振動を行う。LED16は着信等に伴って発光を行う。LCD17は文字や画像の表示を行う。キーパッド18は、ユーザからの個人情報等の入力を受け付ける。
次に、着信による通話開始時の発信者特定の動作について、第2図のフローチャートを用いて説明する。第2図は、実施の形態1に係る通信端末の発信者特定の動作の一例を示すフローチャートである。ある発信者から通信端末1へ着信があり、通話を開始すると(S1)、MPU7は声紋分析部6において発信者の音声の声紋分析を行い(S2)、その結果を発信者の声紋情報としてRAM8へ保存する。
次に、MPU7はRAM8に保存された発信者の声紋情報とFLASH−ROM10のデータベース内の声紋情報を比較することにより発信者の声紋情報の検索を行い(S3)、発信者の声紋情報がデータベースに登録済みであるか否かの判断を行う(S4)。発信者の声紋情報がデータベースに登録済みである場合(S4,Y)、MPU7は発信者の声紋情報にリンクした個人情報をデータベースから読み出してLCD17へ表示し(S5)、通信端末1のフローは終了する。
一方、発信者の声紋情報がデータベースに登録されていない場合(S4,N)、MPU7は、「この発信者の声紋情報は登録されていません。登録しますか?」のような未登録メッセージをLCD17へ表示する(S6)。この未登録メッセージを見たユーザは、キーパッド18を用いて発信者の声紋情報を登録するか否かを入力する。
ユーザからの入力が、登録を希望している場合(S7,Y)、MPU7はユーザがキーパッド18を用いて入力した発信者の個人情報を受け付け(S8)、発信者の声紋情報と発信者の個人情報をリンクさせ、FLASH−ROM10のデータベースへ保存し(S9)、通信端末1のフローは終了する。また、ユーザからの入力が、登録を希望していない場合(S7,N)、通信端末1のフローは終了する。
以上のような処理によれば、着信による通話開始時に、ユーザはLCD17に表示される個人情報を視認して発信者を特定することができる。また、通信端末1内のデータベースに発信者の声紋情報が保存されていない場合、ユーザは発信者の個人情報を入力し、通信端末1内のデータベースに発信者の声紋情報と個人情報をリンクさせて保存することができる。
実施の形態2.
本実施の形態では、通信端末の着信における発信者特定において、通信端末が声紋分析を行い、外部のサーバが声紋情報の検索を行い、通信端末が個人情報の表示を行う例について説明する。
第3図は、通信端末とサーバを備えた通信システム(個人情報表示システム)の構成の一例を示すブロック図である。第3図に示すように、この通信システムは、通信端末1Aと無線基地局20とサーバ40から構成される。通信端末1Aと無線基地局20は無線で通信を行い、無線基地局20とサーバ40は公衆網(通信回線)30を介して通信を行う。
まず、通信端末1Aの構成と動作について説明する。通信端末1Aは第1図に示した通信端末1と同様の構成を持つが、FLASH−ROM10はデータベースを持たない。またMPU7は、声紋分析部6から出力される声紋情報とキーパッド18から新規に入力された発信者の個人情報を信号処理部3からサーバ40へ送信し、信号処理部3がサーバ40から受信した発信者の個人情報をLCD17へ表示する。
次に、サーバ40の構成と動作について説明する。第4図は、本発明の実施の形態2に係るサーバの構成の一例を示すブロック図である。サーバ40は、信号処理部41とデータ処理部42と制御部43と記憶部44から構成される。制御部43は、信号処理部41とデータ処理部42と記憶部44と接続されており、それぞれの制御を行う。送信動作において、信号処理部41は、データ処理部4からのデータを通信端末1Aへ送信する。また受信動作において、信号処理部41は、通信端末1Aから受信したデータをデータ処理部42へ出力する。データ処理部42は、データを記憶部44へ出力する。記憶部44は、制御部43のプログラムやデータ処理部42からのデータ等を保存する。また、記憶部44は、声紋情報と個人情報をリンクさせたデータベースを保存する。
次に、着信による通話開始時の発信者特定の動作について、第5図と第6図のフローチャートを用いて説明する。第5図は、実施の形態2に係る通信端末の発信者特定の動作の一例を示すフローチャートである。第6図は、実施の形態2に係るサーバの発信者特定の動作の一例を示すフローチャートである。
通信端末1Aにおいて、ある発信者から着信があり、通話を開始すると(S11)、MPU7は声紋分析部6において発信者の音声の声紋分析を行い(S12)、その結果を発信者の声紋情報として、信号処理部3からサーバ40へ送信する(S13)。
サーバ40において、信号処理部41は通信端末1Aから発信者の声紋情報を受信し(S21)、制御部43は発信者の声紋情報と記憶部44のデータベース内の声紋情報を比較することにより発信者の声紋情報の検索を行い(S22)、発信者の声紋情報がデータベースに登録済みであるか否かの判断を行う(S23)。
サーバ40において、発信者の声紋情報がデータベースに登録済みである場合(S23,Y)、制御部43は発信者の声紋情報にリンクした個人情報をデータベースから読み出し、信号処理部41から通信端末1Aへ送信し(S24)、サーバ40のフローは終了する。
次に通信端末1Aにおいて、信号処理部3がサーバ40から個人情報を受信すると(S14,Y)、MPU7は受信した個人情報をLCD17へ表示し(S15)、通信端末1Aのフローは終了する。
サーバ40において、発信者の声紋情報がデータベースに登録されていない場合(S23,N)、制御部43は未登録を示す信号を、信号処理部41から通信端末1Aへ送信する(S25)。
次に通信端末1Aにおいて、信号処理部3がサーバ40から未登録を示す信号を受信すると(S14,N)、MPU7は「この発信者の声紋情報は登録されていません。登録しますか?」のような未登録メッセージをLCD17へ表示する(S16)。この未登録メッセージを見たユーザは、キーパッド18を用いて声紋情報を登録するか否かを入力する。
次に通信端末1Aにおいて、ユーザからの入力が、登録を希望している場合(S17,Y)、MPU7はユーザがキーパッド18を用いて入力した発信者の個人情報を受け付け(S18)、発信者の個人情報を信号処理部3からサーバ40へ送信し(S19)、通信端末1Aのフローは終了する。また、ユーザからの入力が、登録を希望していない場合(S17,N)、通信端末1Aのフローは終了する。
次にサーバ40において、信号処理部41が、ユーザにより入力された発信者の個人情報を通信端末1Aから受信した場合(S26,Y)、制御部43は発信者の声紋情報と発信者の個人情報をリンクさせ、記憶部44のデータベースへ保存し(S27)、サーバ40のフローは終了する。また、信号処理部41が、ユーザにより入力された発信者の個人情報を通信端末1Aから受信しない場合(S26,N)、サーバ40のフローは終了する。
以上のような処理によれば、着信による通話開始時に、ユーザはLCD17に表示される個人情報を視認して発信者を特定することができる。また、サーバ40内のデータベースに発信者の声紋情報が保存されていない場合、ユーザは発信者の個人情報を入力して通信端末1Aから送信し、サーバ40内のデータベースに発信者の声紋情報と個人情報をリンクさせて保存することができる。本実施の形態では、サーバ40が一括してデータベースを持ち、通信端末1Aが個々にデータベースを持つ必要がないことから、通信端末1Aの回路規模を低減することができる。
なお、本実施の形態では、通信端末1Aはデータベースを持たないとしたが、通信端末1Aにもデータベースを備え、通信端末1A内のデータベースに発信者の声紋情報がなければサーバ40内のデータベースを検索する構成としても良い。
実施の形態3.
本実施の形態では、通信端末の着信における発信者特定において、外部のサーバが声紋分析を行い、外部のサーバが声紋情報の検索を行い、通信端末が個人情報の表示を行う個人情報表示システムの例について説明する。
本実施の形態では、第3図と同様に通信端末とサーバを用いて発信者特定を行うが、通信端末1Aの代わりに通信端末50を備え、サーバ40の代わりにサーバ60を備える。
まず、通信端末50の構成と動作について説明する。第7図は、本発明の実施の形態3に係る通信端末の構成の一例を示すブロック図である。第7図において、第1図と同一符号は第1図に示された対象と同一又は相当物を示しており、ここでの説明を省略する。本実施の形態における通信端末50は、声紋分析部6を削除し、音声処理部5の代わりに音声処理部55を備える。音声処理部55は、音声データを音声としてスピーカ13を介して外部へ出力すると共に、声紋分析に必要な音声データを信号処理部3へ出力する。また、音声処理部55は、マイク12を介して外部から受信した音声を音声データとして信号処理部3へ出力する。
またFLASH−ROM10はデータベースを持たない。またMPU7は、音声処理部55から出力される音声データとキーパッド18から新規に入力された発信者の個人情報を信号処理部3からサーバ60へ送信し、信号処理部3がサーバ60から受信した発信者の個人情報をLCD17へ表示する。
次に、サーバ60の構成と動作について説明する。第8図は、本発明の実施の形態3に係るサーバの構成の一例を示すブロック図である。第8図において、第8図と同一符号は第8図に示された対象と同一又は相当物を示しており、ここでの説明を省略する。本実施の形態におけるサーバ60は、信号処理部41の代わりに信号処理部61を備え、制御部43の代わりに制御部63を備え、記憶部44の代わりに記憶部65を備え、さらに音声処理部62と声紋分析部64を備える。
制御部63は、信号処理部61とデータ処理部42と音声処理部62と声紋分析部64と記憶部65と接続されており、それぞれの制御を行う。送信動作において、信号処理部61は、データ処理部42からの非音声データを、通信端末50へ出力する。また受信動作において、信号処理部61は、受信した信号が音声以外の非音声データであればデータ処理部42へ出力し、音声データであれば音声処理部62へ出力する。
音声処理部62は、声紋分析に必要な音声データを声紋分析部64へ出力する。声紋分析部64は、第1図に示した声紋分析部6と同様に声紋情報を算出し、記憶部65へ出力する。記憶部65は、制御部63のプログラムやデータ処理部42からのデータ等を保存する。また、記憶部65は、声紋情報と個人情報をリンクさせたデータベースを保存する。さらに、記憶部65は、声紋分析部64で分析された声紋情報を一時的に保存する。
次に、着信による通話開始時の発信者特定の動作について、第9図と第10図のフローチャートを用いて説明する。第9図は、実施の形態3に係る通信端末の発信者特定の動作の一例を示すフローチャートである。第10図は、実施の形態3に係るサーバの発信者特定の動作の一例を示すフローチャートである。
通信端末50において、ある発信者から着信があり、通話を開始すると(S31)、MPU7は声紋分析に必要な発信者の音声を、信号処理部3からサーバ60へ転送する(S32)。
サーバ60において、信号処理部61は通信端末50から転送された音声を受信し(S41)、制御部63は声紋分析部64において発信者の音声の声紋分析を行い(S42)、その結果得られた発信者の声紋情報と記憶部65のデータベース内の声紋情報を比較することにより発信者の声紋情報の検索を行い(S43)、発信者の声紋情報がデータベースに登録済みであるか否かの判断を行う(S44)。
サーバ60において、発信者の声紋情報がデータベースに登録済みである場合(S44,Y)、制御部63は発信者の声紋情報にリンクした個人情報をデータベースから読み出し、信号処理部61から通信端末50へ送信し(S45)、サーバ60のフローは終了する。
次に通信端末50において、信号処理部3がサーバ60から個人情報を受信すると(S33,Y)、受信した個人情報をLCD17へ表示し(S34)、通信端末50のフローは終了する。
サーバ60において、発信者の声紋情報がデータベースに登録されていない場合(S44,N)、制御部63は未登録を示す信号を、信号処理部61から通信端末50へ送信する(S46)。
次に通信端末50において、信号処理部3がサーバ60から未登録を示す信号を受信すると(S33,N)、MPU7は「この発信者の声紋情報は登録されていません。登録しますか?」のような未登録メッセージをLCD17へ表示する(S35)。この未登録メッセージを見たユーザは、キーパッド18を用いて声紋情報を登録するか否かを入力する。
次に通信端末50において、ユーザからの入力が、登録を希望している場合(S36,Y)、MPU7はユーザがキーパッド18を用いて入力した発信者の個人情報を受け付け(S37)、発信者の個人情報を信号処理部3からサーバ60へ送信し(S38)、通信端末50のフローは終了する。また、ユーザからの入力が、登録を希望していない場合(S36,N)、通信端末50のフローは終了する。
次にサーバ60において、信号処理部61が、ユーザにより入力された発信者の個人情報を通信端末50から受信した場合(S47,Y)、制御部63は発信者の声紋情報と発信者の個人情報をリンクさせ、記憶部65のデータベースへ保存し(S48)、サーバ60のフローは終了する。また、信号処理部61が、ユーザにより入力された発信者の個人情報を通信端末50から受信しない場合(S47,N)、サーバ60のフローは終了する。
以上のような処理によれば、着信による通話開始時に、ユーザはLCD17に表示される個人情報を視認して発信者を特定することができる。また、サーバ60内のデータベースに発信者の声紋情報が保存されていない場合、ユーザは発信者の個人情報を入力して通信端末50から送信し、サーバ60内のデータベースに発信者の声紋情報と個人情報をリンクさせて保存することができる。本実施の形態では、通信端末50に比べて演算性能の高いサーバ60が声紋分析や比較を行うことにより、高速に個人を特定することができるとともに、通信端末50が個々に声紋分析部やデータベースを持つ必要がないことから、通信端末50の回路規模を低減することができる。
なお、実施の形態1から3において、無線通信を行う通信端末を例に挙げて説明したが、有線通信を行う通信端末にも本発明を適用することができる。また、表示部としてLCDを用いた視覚的な表示について説明したが、音声表示等を行うようにすることも可能である。以上、実施の形態1から3を説明したが、上述した実施の形態において説明された通信端末やサーバの構成及び動作は、本発明を実現するための一例であり、その構成は本発明の趣旨を逸脱しない範囲内において特に限定されず、適宜応用可能であることは言うまでもない。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the embodiment of the present invention, a communication terminal that performs wireless communication among communication terminals will be described as an example.
Embodiment 1 FIG.
In the present embodiment, an example will be described in which a communication terminal performs voiceprint analysis, searches for voiceprint information, and displays personal information when specifying a caller at an incoming call of the communication terminal.
First, the configuration and operation of the communication terminal will be described. FIG. 1 is a block diagram showing an example of the configuration of a communication terminal according to Embodiment 1 of the present invention. As shown in FIG. 1, the communication terminal 1 includes a transmission / reception antenna 2, a signal processing unit 3, a data processing unit 4, a voice processing unit 5, a voice print analysis unit 6, an MPU (Microprocessing Unit) 7, a RAM (Random Access Memory). ) 8, ROM (Read Only Memory) 9, FLASH-ROM 10, tone generator LSI (Large Scale Integrated Circuit) 11, microphone 12, speaker 13, external input / output unit 14, vibrator 15, LED (Light Emitting Diode) 16, and LCD A liquid crystal display 17 and a keypad 18 are included.
The MPU 7 includes a signal processing unit 3, a data processing unit 4, an audio processing unit 5, a voice print analysis unit 6, a RAM 8, a ROM 9, a FLASH-ROM 10, a sound source LSI 11, an external input / output unit 14, a vibrator 15, an LED 16, an LCD 17 and a keypad 18. And control each.
In the transmission operation, the signal processing unit 3 synthesizes the non-voice data from the data processing unit 4 and the voice data from the voice processing unit 5 and transmits the synthesized data to the outside via the transmission / reception antenna 2. In the reception operation, the signal processing unit 3 outputs to the data processing unit 4 if the signal received via the transmission / reception antenna 2 is non-voice data other than voice, and outputs to the voice processing unit 5 if the signal is voice data. .
The non-voice data is output to the LCD 17 as characters and images via the data processing unit 4. The voice processing unit 5 outputs the voice data to the outside as voice through the speaker 13 and outputs voice data necessary for voiceprint analysis to the voiceprint analysis unit 6. The audio processing unit 5 also outputs audio received from the outside via the microphone 12 to the signal processing unit 3 as audio data.
The voiceprint analysis unit 6 performs voiceprint analysis on the received voice data by using a process disclosed in, for example, Japanese Patent No. 3280825, and a voiceprint composed of a time distribution for each frequency, a voice time, a pitch frequency, and the like. Information is calculated and output to the RAM 8.
The ROM 9 stores a program of the MPU 7 and the like. The RAM 8 stores information necessary for executing the program of the MPU 7. The RAM 8 temporarily stores voiceprint information. The FLASH-ROM 10 stores a database in which voiceprint information and personal information are linked. Here, personal information includes, for example, name, age, gender, company name, telephone number, management number, and the like.
The tone generator LSI 11 generates a ring tone and the like. The external input / output unit 14 inputs / outputs data with an external PC or the like via a cable or the like. The vibrator 15 vibrates with an incoming call or the like. The LED 16 emits light when an incoming call is received. The LCD 17 displays characters and images. The keypad 18 receives input of personal information and the like from the user.
Next, a caller identification operation at the start of a call by incoming call will be described with reference to the flowchart of FIG. FIG. 2 is a flowchart showing an example of a caller specifying operation of the communication terminal according to the first embodiment. When there is an incoming call from a caller to the communication terminal 1 and a call is started (S1), the MPU 7 performs a voiceprint analysis of the caller's voice in the voiceprint analysis unit 6 (S2), and the result is stored in the RAM 8 as the voiceprint information of the caller. Save to
Next, the MPU 7 searches for the voiceprint information of the caller by comparing the voiceprint information of the caller stored in the RAM 8 with the voiceprint information in the database of the FLASH-ROM 10 (S3). It is determined whether or not it has already been registered (S4). When the caller's voiceprint information is already registered in the database (S4, Y), the MPU 7 reads out the personal information linked to the caller's voiceprint information from the database and displays it on the LCD 17 (S5), and the flow of the communication terminal 1 is as follows. finish.
On the other hand, if the caller's voiceprint information is not registered in the database (S4, N), the MPU 7 will send an unregistered message such as "This caller's voiceprint information is not registered. Do you want to register it?" Is displayed on the LCD 17 (S6). The user who sees this unregistered message uses the keypad 18 to input whether to register the caller's voiceprint information.
When the input from the user desires registration (S7, Y), the MPU 7 accepts the caller's personal information input by the user using the keypad 18 (S8), and the voiceprint information of the caller and the caller are received. Are stored in the database of the FLASH-ROM 10 (S9), and the flow of the communication terminal 1 ends. If the input from the user does not desire registration (S7, N), the flow of the communication terminal 1 ends.
According to the above processing, the user can identify the caller by visually recognizing the personal information displayed on the LCD 17 at the start of the incoming call. Further, when the voiceprint information of the caller is not stored in the database in the communication terminal 1, the user inputs the personal information of the caller, and links the voiceprint information of the caller and the personal information to the database in the communication terminal 1. Can be saved.
Embodiment 2. FIG.
In the present embodiment, an example will be described in which a communication terminal performs voiceprint analysis, an external server searches for voiceprint information, and a communication terminal displays personal information in specifying the caller at the incoming call of the communication terminal.
FIG. 3 is a block diagram showing an example of a configuration of a communication system (personal information display system) including a communication terminal and a server. As shown in FIG. 3, this communication system is composed of a communication terminal 1A, a radio base station 20, and a server 40. The communication terminal 1 </ b> A and the wireless base station 20 communicate wirelessly, and the wireless base station 20 and the server 40 communicate via a public network (communication line) 30.
First, the configuration and operation of the communication terminal 1A will be described. The communication terminal 1A has the same configuration as the communication terminal 1 shown in FIG. 1, but the FLASH-ROM 10 does not have a database. The MPU 7 transmits the voiceprint information output from the voiceprint analysis unit 6 and the personal information of the caller newly input from the keypad 18 from the signal processing unit 3 to the server 40, and the signal processing unit 3 receives the information from the server 40. The personal information of the sender is displayed on the LCD 17.
Next, the configuration and operation of the server 40 will be described. FIG. 4 is a block diagram showing an example of the configuration of the server according to Embodiment 2 of the present invention. The server 40 includes a signal processing unit 41, a data processing unit 42, a control unit 43, and a storage unit 44. The control unit 43 is connected to the signal processing unit 41, the data processing unit 42, and the storage unit 44, and controls each of them. In the transmission operation, the signal processing unit 41 transmits the data from the data processing unit 4 to the communication terminal 1A. In the reception operation, the signal processing unit 41 outputs the data received from the communication terminal 1 </ b> A to the data processing unit 42. The data processing unit 42 outputs the data to the storage unit 44. The storage unit 44 stores a program of the control unit 43, data from the data processing unit 42, and the like. The storage unit 44 stores a database in which voiceprint information and personal information are linked.
Next, a caller identification operation at the start of a call by incoming call will be described with reference to the flowcharts of FIGS. FIG. 5 is a flowchart showing an example of the caller specifying operation of the communication terminal according to the second embodiment. FIG. 6 is a flowchart showing an example of the caller specifying operation of the server according to the second embodiment.
When communication terminal 1A receives an incoming call from a certain caller and starts a call (S11), MPU 7 performs voiceprint analysis of the caller's voice in voiceprint analysis unit 6 (S12), and the result is used as the voiceprint information of the caller. Then, the signal processing unit 3 transmits it to the server 40 (S13).
In the server 40, the signal processing unit 41 receives the caller's voice print information from the communication terminal 1A (S21), and the control unit 43 sends the call by comparing the caller's voice print information with the voice print information in the storage unit 44. The voiceprint information of the sender is searched (S22), and it is determined whether or not the voiceprint information of the sender is already registered in the database (S23).
In the server 40, when the voiceprint information of the caller has been registered in the database (S23, Y), the control unit 43 reads the personal information linked to the voiceprint information of the caller from the database, and from the signal processing unit 41 to the communication terminal 1A. (S24), and the flow of the server 40 ends.
Next, in the communication terminal 1A, when the signal processing unit 3 receives personal information from the server 40 (S14, Y), the MPU 7 displays the received personal information on the LCD 17 (S15), and the flow of the communication terminal 1A ends.
In the server 40, when the voiceprint information of the caller is not registered in the database (S23, N), the control unit 43 transmits a signal indicating unregistration from the signal processing unit 41 to the communication terminal 1A (S25).
Next, in the communication terminal 1A, when the signal processing unit 3 receives a signal indicating unregistration from the server 40 (S14, N), the MPU 7 says, “The voiceprint information of this caller is not registered. Do you want to register? An unregistered message such as "is displayed on the LCD 17 (S16). The user who sees this unregistered message uses the keypad 18 to input whether to register voiceprint information.
Next, in the communication terminal 1A, when the input from the user desires to be registered (S17, Y), the MPU 7 accepts the personal information of the caller input by the user using the keypad 18 (S18), and sends the call. The personal information of the person is transmitted from the signal processing unit 3 to the server 40 (S19), and the flow of the communication terminal 1A ends. Further, when the input from the user does not desire registration (S17, N), the flow of the communication terminal 1A ends.
Next, in the server 40, when the signal processing unit 41 receives the personal information of the caller input by the user from the communication terminal 1A (S26, Y), the control unit 43 determines the voiceprint information of the caller and the personality of the caller. The information is linked and stored in the database of the storage unit 44 (S27), and the flow of the server 40 ends. When the signal processing unit 41 does not receive the caller's personal information input by the user from the communication terminal 1A (S26, N), the flow of the server 40 ends.
According to the above processing, the user can identify the caller by visually recognizing the personal information displayed on the LCD 17 at the start of the incoming call. If the sender's voiceprint information is not stored in the database in the server 40, the user inputs the sender's personal information and transmits it from the communication terminal 1A, and the sender's voiceprint information is stored in the database in the server 40. Personal information can be linked and saved. In the present embodiment, since the server 40 has a database collectively and the communication terminal 1A does not need to have a database individually, the circuit scale of the communication terminal 1A can be reduced.
In this embodiment, the communication terminal 1A does not have a database. However, the communication terminal 1A also has a database, and if the database in the communication terminal 1A does not have the voiceprint information of the caller, the database in the server 40 is used. It is good also as a structure to search.
Embodiment 3 FIG.
In the present embodiment, an external server performs voiceprint analysis, an external server searches for voiceprint information, and a communication terminal displays personal information in the identification of a caller at an incoming call of a communication terminal. An example will be described.
In the present embodiment, the caller identification is performed using the communication terminal and the server as in FIG. 3, but the communication terminal 50 is provided instead of the communication terminal 1A, and the server 60 is provided instead of the server 40.
First, the configuration and operation of the communication terminal 50 will be described. FIG. 7 is a block diagram showing an example of the configuration of the communication terminal according to Embodiment 3 of the present invention. In FIG. 7, the same reference numerals as those in FIG. 1 denote the same or corresponding parts as those in FIG. 1, and description thereof will be omitted here. The communication terminal 50 according to the present embodiment deletes the voiceprint analysis unit 6 and includes a voice processing unit 55 instead of the voice processing unit 5. The sound processing unit 55 outputs sound data as sound to the outside through the speaker 13 and outputs sound data necessary for voiceprint analysis to the signal processing unit 3. The audio processing unit 55 outputs audio received from the outside via the microphone 12 to the signal processing unit 3 as audio data.
The FLASH-ROM 10 does not have a database. Further, the MPU 7 transmits the voice data output from the voice processing unit 55 and the personal information of the caller newly input from the keypad 18 from the signal processing unit 3 to the server 60, and the signal processing unit 3 receives from the server 60. The personal information of the sender is displayed on the LCD 17.
Next, the configuration and operation of the server 60 will be described. FIG. 8 is a block diagram showing an example of the configuration of the server according to Embodiment 3 of the present invention. In FIG. 8, the same reference numerals as those in FIG. 8 denote the same or corresponding parts as those in FIG. 8, and description thereof will be omitted here. The server 60 in the present embodiment includes a signal processing unit 61 instead of the signal processing unit 41, a control unit 63 instead of the control unit 43, a storage unit 65 instead of the storage unit 44, and voice processing. A unit 62 and a voice print analysis unit 64 are provided.
The control unit 63 is connected to the signal processing unit 61, the data processing unit 42, the voice processing unit 62, the voice print analysis unit 64, and the storage unit 65, and controls each of them. In the transmission operation, the signal processing unit 61 outputs the non-voice data from the data processing unit 42 to the communication terminal 50. In the reception operation, the signal processing unit 61 outputs the received signal to the data processing unit 42 if the received signal is non-voice data other than voice, and outputs the received signal to the voice processing unit 62 if the received signal is voice data.
The voice processing unit 62 outputs voice data necessary for voiceprint analysis to the voiceprint analysis unit 64. The voiceprint analysis unit 64 calculates voiceprint information and outputs it to the storage unit 65 in the same manner as the voiceprint analysis unit 6 shown in FIG. The storage unit 65 stores a program of the control unit 63, data from the data processing unit 42, and the like. The storage unit 65 stores a database in which voiceprint information and personal information are linked. Further, the storage unit 65 temporarily stores the voiceprint information analyzed by the voiceprint analysis unit 64.
Next, a caller identification operation at the start of a call by incoming call will be described with reference to the flowcharts of FIG. 9 and FIG. FIG. 9 is a flowchart showing an example of a caller specifying operation of the communication terminal according to the third embodiment. FIG. 10 is a flowchart showing an example of the caller specifying operation of the server according to the third embodiment.
When there is an incoming call from a certain caller at the communication terminal 50 and a call is started (S31), the MPU 7 transfers the caller's voice necessary for voiceprint analysis from the signal processing unit 3 to the server 60 (S32).
In the server 60, the signal processing unit 61 receives the voice transferred from the communication terminal 50 (S41), and the control unit 63 performs voiceprint analysis of the caller's voice in the voiceprint analysis unit 64 (S42). The voiceprint information of the sender is searched by comparing the voiceprint information of the sender and the voiceprint information in the database of the storage unit 65 (S43), and whether or not the voiceprint information of the sender is already registered in the database. A determination is made (S44).
In the server 60, when the voiceprint information of the caller has been registered in the database (S44, Y), the control unit 63 reads the personal information linked to the voiceprint information of the caller from the database, and from the signal processing unit 61 to the communication terminal 50. (S45), the flow of the server 60 ends.
Next, in the communication terminal 50, when the signal processing unit 3 receives personal information from the server 60 (S33, Y), the received personal information is displayed on the LCD 17 (S34), and the flow of the communication terminal 50 ends.
In the server 60, when the voiceprint information of the caller is not registered in the database (S44, N), the control unit 63 transmits a signal indicating unregistration from the signal processing unit 61 to the communication terminal 50 (S46).
Next, in the communication terminal 50, when the signal processing unit 3 receives a signal indicating unregistration from the server 60 (S33, N), the MPU 7 says, “This caller's voiceprint information is not registered. Do you want to register? An unregistered message such as “is displayed on the LCD 17 (S35). The user who sees this unregistered message uses the keypad 18 to input whether to register voiceprint information.
Next, in the communication terminal 50, when the input from the user desires to register (S36, Y), the MPU 7 accepts the personal information of the caller input by the user using the keypad 18 (S37), and sends the call. The personal information of the person is transmitted from the signal processing unit 3 to the server 60 (S38), and the flow of the communication terminal 50 ends. If the input from the user does not desire registration (S36, N), the flow of the communication terminal 50 ends.
Next, in the server 60, when the signal processing unit 61 receives the caller's personal information input by the user from the communication terminal 50 (S47, Y), the control unit 63 sends the caller's voiceprint information and the caller's personal information. The information is linked and saved in the database of the storage unit 65 (S48), and the flow of the server 60 ends. When the signal processing unit 61 does not receive the caller's personal information input by the user from the communication terminal 50 (S47, N), the flow of the server 60 ends.
According to the above processing, the user can identify the caller by visually recognizing the personal information displayed on the LCD 17 at the start of the incoming call. If the sender's voiceprint information is not stored in the database in the server 60, the user inputs the sender's personal information and transmits it from the communication terminal 50, and the sender's voiceprint information is stored in the database in the server 60. Personal information can be linked and saved. In the present embodiment, the server 60 having a higher calculation performance than the communication terminal 50 can perform voiceprint analysis and comparison, whereby a person can be identified at a high speed, and the communication terminal 50 can individually identify a voiceprint analysis unit and a database. Therefore, the circuit scale of the communication terminal 50 can be reduced.
In Embodiments 1 to 3, the communication terminal that performs wireless communication has been described as an example. However, the present invention can also be applied to a communication terminal that performs wired communication. Moreover, although the visual display using LCD as a display part was demonstrated, it is also possible to perform an audio | voice display etc. Although the first to third embodiments have been described above, the configurations and operations of the communication terminals and servers described in the above-described embodiments are examples for realizing the present invention, and the configurations are the gist of the present invention. Needless to say, the present invention is not particularly limited within the range not departing from the above, and can be appropriately applied.

産業上の利用の可能性Industrial applicability

以上説明したように本発明によれば、着信による通話開始時に、画面に表示された発信者の個人情報を視認することにより、ユーザは発信者個人を正確に特定することができるようになり、例えば発信者を勘違いして相手に迷惑をかけるようなことを避けることができる。  As described above, according to the present invention, the user can accurately identify the individual caller by visually recognizing the caller's personal information displayed on the screen at the start of the incoming call. For example, it is possible to avoid annoying the other party by misunderstanding the caller.

Claims (12)

個人の個人情報と前記個人の声紋情報とを対応づけて記憶するデータベースと、
着信による通話開始時に発信者の音声から前記発信者の声紋情報を抽出する声紋分析部と、
前記発信者の声紋情報と前記データベース内の声紋情報とを比較することにより前記発信者についての前記データベース内の個人情報を特定する演算部と、
特定された前記発信者の個人情報を表示する表示部と、
を備えてなる通信端末。
A database for storing personal information and personal voiceprint information in association with each other;
A voiceprint analysis unit for extracting the voiceprint information of the caller from the voice of the caller at the start of a call by incoming call;
A computing unit that identifies personal information in the database for the sender by comparing the voiceprint information of the sender with voiceprint information in the database;
A display for displaying personal information of the identified caller;
A communication terminal comprising:
請求の範囲第1項に記載の通信端末において、
前記発信者の個人情報を入力するための入力部を備え、
前記発信者の声紋情報と前記入力部から得られた前記発信者の個人情報とからなる組を前記データベースへ登録することができる通信端末。
In the communication terminal according to claim 1,
An input unit for inputting personal information of the caller;
A communication terminal capable of registering, in the database, a set of the sender's voiceprint information and the sender's personal information obtained from the input unit.
通信回線を介して通信端末と接続されることができる声紋情報検索サーバであって、
個人の個人情報と前記個人の声紋情報とを対応づけて記憶するデータベースと、
前記通信端末から声紋情報を含む情報を受信する受信部と、
該受信部が受信した声紋情報と前記データベース内の声紋情報とを比較することにより、前記データベース内の個人情報を特定する演算部と、
特定された前記データベース内の個人情報を前記通信端末へ送信する送信部と、
を備えてなる声紋情報検索サーバ。
A voiceprint information search server that can be connected to a communication terminal via a communication line,
A database for storing personal information and personal voiceprint information in association with each other;
A receiving unit for receiving information including voiceprint information from the communication terminal;
A computing unit for identifying personal information in the database by comparing the voiceprint information received by the receiving unit with the voiceprint information in the database;
A transmitting unit that transmits the personal information in the identified database to the communication terminal;
A voiceprint information search server.
通信回線を介して請求の範囲第3項に記載の声紋情報検索サーバと接続されることができる通信端末であって、
着信による通話開始時に発信者の音声から前記発信者の声紋情報を抽出する声紋分析部と、
前記発信者の声紋情報を前記声紋情報検索サーバへ送信する送信部と、
前記発信者の個人情報を前記声紋情報検索サーバから受信する受信部と、
該受信部から得られる前記発信者の個人情報を表示する表示部と、
を備えてなる通信端末。
A communication terminal that can be connected to the voiceprint information search server according to claim 3 via a communication line,
A voiceprint analysis unit for extracting the voiceprint information of the caller from the voice of the caller at the start of a call by incoming call;
A transmission unit that transmits the voiceprint information of the sender to the voiceprint information search server;
A receiver that receives the personal information of the sender from the voiceprint information search server;
A display unit for displaying personal information of the caller obtained from the receiving unit;
A communication terminal comprising:
請求の範囲第4項に記載の通信端末において、
発信者の個人情報を入力するための入力部を備え、
前記発信者の声紋情報と前記入力部から得られた前記発信者の個人情報とからなる組を前記声紋情報検索サーバのデータベースへ登録することができる通信端末。
In the communication terminal according to claim 4,
It has an input unit for entering the caller's personal information,
A communication terminal capable of registering, in the database of the voiceprint information search server, a set consisting of the voiceprint information of the sender and the personal information of the sender obtained from the input unit.
請求の範囲第3項に記載の声紋情報検索サーバと、請求の範囲第4項に記載の通信端末とを備えてなる個人情報表示システム。A personal information display system comprising: the voiceprint information search server according to claim 3; and the communication terminal according to claim 4. 通信回線を介して通信端末と接続されることができる声紋情報検索サーバであって、
個人の個人情報と前記個人の声紋情報とを対応づけて記憶するデータベースと、
通信端末から音声を含む情報を受信する受信部と、
該受信部が受信した音声から声紋情報を抽出する声紋分析部と、
該声紋分析部が抽出した声紋情報と前記データベース内の声紋情報とを比較することにより前記データベース内の個人情報を特定する演算部と、
特定された前記データベース内の個人情報を前記通信端末へ送信する送信部と、
を備えてなる声紋情報検索サーバ。
A voiceprint information search server that can be connected to a communication terminal via a communication line,
A database for storing personal information and personal voiceprint information in association with each other;
A receiving unit for receiving information including voice from a communication terminal;
A voiceprint analysis unit for extracting voiceprint information from the voice received by the reception unit;
A computing unit for identifying personal information in the database by comparing the voiceprint information extracted by the voiceprint analysis unit with the voiceprint information in the database;
A transmitting unit that transmits the personal information in the identified database to the communication terminal;
A voiceprint information search server.
通信回線を介して請求の範囲第7項に記載の声紋情報検索サーバと接続されることができる通信端末であって、
着信による通話開始時に発信者の音声を前記声紋情報検索サーバへ転送する送信部と、
前記声紋情報検索サーバから前記発信者の個人情報を受信する受信部と、
該受信部から得られる前記発信者の個人情報を表示する表示部と、
を備えてなる通信端末。
A communication terminal that can be connected to the voiceprint information search server according to claim 7 via a communication line,
A transmission unit for transferring a caller's voice to the voiceprint information search server at the start of a call by an incoming call;
A receiving unit for receiving personal information of the caller from the voiceprint information search server;
A display unit for displaying personal information of the caller obtained from the receiving unit;
A communication terminal comprising:
請求の範囲第8項に記載の通信端末において、
発信者の個人情報を入力するための入力部を備え、
前記発信者の声紋情報と前記入力部から得られた前記発信者の個人情報とからなる組を前記声紋情報検索サーバのデータベースへ登録することができる通信端末。
In the communication terminal according to claim 8,
It has an input unit for entering the caller's personal information,
A communication terminal capable of registering, in the database of the voiceprint information search server, a set consisting of the voiceprint information of the sender and the personal information of the sender obtained from the input unit.
請求の範囲第7項に記載の声紋情報検索サーバと、請求の範囲第8項に記載の通信端末とを備えてなる個人情報表示システム。A personal information display system comprising: the voiceprint information search server according to claim 7; and the communication terminal according to claim 8. 着信による通話開始時に、発信者の個人情報の表示を行う通信端末における個人情報表示方法であって、
個人の個人情報と前記個人の声紋情報を対応づけデータベースとして記憶するステップと、
前記発信者の音声から前記発信者の声紋情報を抽出するステップと、
前記発信者の声紋情報と前記データベース内の声紋情報とを比較することにより前記発信者についての前記データベース内の個人情報を特定するステップと、
特定された前記発信者の個人情報を表示するステップと、
を備えてなる通信端末における個人情報表示方法。
A personal information display method in a communication terminal that displays personal information of a caller at the start of an incoming call,
Storing personal personal information and personal voiceprint information as a database,
Extracting the caller's voiceprint information from the caller's voice;
Identifying personal information in the database for the sender by comparing the voiceprint information of the sender with voiceprint information in the database;
Displaying personal information of the identified caller;
A personal information display method in a communication terminal comprising:
着信による通話開始時に、発信者の個人情報の表示をコンピュータに実行させるために、コンピュータにより読取可能な媒体に記憶された個人情報表示プログラムであって、
個人の個人情報と前記個人の声紋情報を対応づけデータベースとして記憶するステップと、
前記発信者の音声から前記発信者の声紋情報を抽出するステップと、
前記発信者の声紋情報と前記データベース内の声紋情報とを比較することにより前記発信者についての前記データベース内の個人情報を特定するステップと、
特定された前記発信者の個人情報を表示するステップと、
をコンピュータに実行させる個人情報表示プログラム。
A personal information display program stored in a computer-readable medium for causing a computer to display personal information of a caller at the start of an incoming call.
Storing personal personal information and personal voiceprint information as a database,
Extracting the caller's voiceprint information from the caller's voice;
Identifying personal information in the database for the sender by comparing the voiceprint information of the sender with voiceprint information in the database;
Displaying personal information of the identified caller;
Personal information display program that causes a computer to execute.
JP2004546371A 2002-10-23 2002-10-23 Communication terminal, voiceprint information search server, personal information display system, personal information display method in communication terminal, personal information display program Pending JPWO2004039044A1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2002/010999 WO2004039044A1 (en) 2002-10-23 2002-10-23 Communication terminal, voiceprint information search server, individual information display system, individual information display method at communication terminal, individual information display program

Publications (1)

Publication Number Publication Date
JPWO2004039044A1 true JPWO2004039044A1 (en) 2006-02-23

Family

ID=32170773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004546371A Pending JPWO2004039044A1 (en) 2002-10-23 2002-10-23 Communication terminal, voiceprint information search server, personal information display system, personal information display method in communication terminal, personal information display program

Country Status (2)

Country Link
JP (1) JPWO2004039044A1 (en)
WO (1) WO2004039044A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013164554A (en) * 2012-02-13 2013-08-22 Nikon Corp Electronic device

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241130A (en) * 2006-03-10 2007-09-20 Matsushita Electric Ind Co Ltd System and device using voiceprint recognition
JP2007318438A (en) * 2006-05-25 2007-12-06 Yamaha Corp Voice state data generating device, voice state visualizing device, voice state data editing device, voice data reproducing device, and voice communication system
JP5052929B2 (en) * 2007-03-20 2012-10-17 株式会社日立システムズ Reception system
JP4500324B2 (en) * 2007-03-27 2010-07-14 株式会社エヌ・ティ・ティ・ドコモ Voice authentication system
JP2008252849A (en) * 2007-03-30 2008-10-16 Nippon Telegraph & Telephone West Corp Information communication terminal and information communication system
JP5746920B2 (en) * 2011-06-23 2015-07-08 株式会社Nttドコモ Server device and speaker confirmation system
JP6201279B2 (en) * 2012-03-22 2017-09-27 日本電気株式会社 Server, server control method and control program, information processing system, information processing method, portable terminal, portable terminal control method and control program
JP6636787B2 (en) * 2015-12-01 2020-01-29 Necプラットフォームズ株式会社 User identification device, user identification system, and user identification program
WO2020054189A1 (en) * 2018-09-11 2020-03-19 株式会社セレンディピティー Information processing system, information processing method, and storage medium having information processing program stored therein
JP7484138B2 (en) 2019-11-20 2024-05-16 株式会社リコー Search terminal device, search system, and search method
CN111933151A (en) * 2020-08-16 2020-11-13 云知声智能科技股份有限公司 Method, device and equipment for processing call data and storage medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001274907A (en) * 2000-03-24 2001-10-05 Nec Shizuoka Ltd Caller recognition system and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013164554A (en) * 2012-02-13 2013-08-22 Nikon Corp Electronic device

Also Published As

Publication number Publication date
WO2004039044A1 (en) 2004-05-06

Similar Documents

Publication Publication Date Title
US6985744B2 (en) Cellular phone and a base station thereof
CN109274405B (en) Data transmission method and device, electronic equipment and computer readable medium
KR100678212B1 (en) Method for controlling information of emotion in wireless terminal
JPWO2004039044A1 (en) Communication terminal, voiceprint information search server, personal information display system, personal information display method in communication terminal, personal information display program
WO2004023366A1 (en) System for electronically settling by using mobile phone and method thereof
US20070147592A1 (en) Telephone and program
KR20090097292A (en) Method and system for providing speech recognition by using user images
US20070201683A1 (en) Telephone apparatus
CN111385798B (en) Electronic apparatus and control method thereof
US20040138892A1 (en) Control system
US20040015353A1 (en) Voice recognition key input wireless terminal, method, and computer readable recording medium therefor
US20050105699A1 (en) Communications terminal, voice spectrum information search server, individual information display system, individual information display method in communications terminal and individual information display program
JP4349590B2 (en) Phones and programs
JP2002199089A (en) Mobile telephone set
JP5236264B2 (en) Communication terminal, information processing method, and program
KR20060054548A (en) Apparatus and method for alarming a call or message received in mobile terminal equipment
JP2000013866A (en) Communication system, information device, data communication method and data reception method
JP5049577B2 (en) Communication terminal device and computer program therefor
KR20020072637A (en) System for the voice exchange index using wireless communication terminal and the same method
JP5746920B2 (en) Server device and speaker confirmation system
KR20030073972A (en) Apparatus and method for display caller ID by character image in mobile phone
JPH11187084A (en) Ring back tone registering method, receiver and ring back tone registering device
KR100429376B1 (en) Method and the System for Downloading the Calling Sound of Mobile-Phone
US20070081652A1 (en) Method and system for identification of importance of communications
JP2004336450A (en) Cellular telephone

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060929

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070123