WO2005117398A1 - 電話機およびプログラム - Google Patents

電話機およびプログラム Download PDF

Info

Publication number
WO2005117398A1
WO2005117398A1 PCT/JP2005/009866 JP2005009866W WO2005117398A1 WO 2005117398 A1 WO2005117398 A1 WO 2005117398A1 JP 2005009866 W JP2005009866 W JP 2005009866W WO 2005117398 A1 WO2005117398 A1 WO 2005117398A1
Authority
WO
WIPO (PCT)
Prior art keywords
telephone
voice
personality
voice input
input
Prior art date
Application number
PCT/JP2005/009866
Other languages
English (en)
French (fr)
Inventor
Tomonori Ikumi
Tomonari Kakino
Original Assignee
Toshiba Tec Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Tec Kabushiki Kaisha filed Critical Toshiba Tec Kabushiki Kaisha
Priority to US10/555,294 priority Critical patent/US20070147592A1/en
Publication of WO2005117398A1 publication Critical patent/WO2005117398A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/247Telephone sets including user guidance or feature selection means facilitating their use
    • H04M1/2474Telephone terminals specially adapted for disabled people
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/57Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set

Definitions

  • the present invention relates to a telephone and a program.
  • a telephone answering support apparatus Z method as disclosed in Patent Document 1 has been proposed.
  • the telephone answering support device Z method of Patent Document 1 is based on the fact that the received voice data power also identifies the caller so that it is possible to easily identify the other party in the telephone reception business of a company or an organization. It recognizes the contents of the voice data and decides who will interact with those information skills.
  • identification of a caller from voice data in the telephone response support device Z method of Patent Document 1 is based on the fact that the received voice data power also identifies the caller so that it is possible to easily identify the other party in the telephone reception business of a company or an organization. It recognizes the contents of the voice data and decides who will interact with those information skills.
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2003-158579
  • the present invention provides a telephone connected to a telephone line, wherein a registered voice input unit for receiving voice input of a person who needs to register in advance, and a personality of voice signal received by the registered voice input unit.
  • a first feature amount extraction unit for extracting a personality feature amount to be represented, a storage unit for storing the personality feature amount extracted by the feature amount extraction unit in a storage unit, and a voice input from the telephone line.
  • the stored personality feature is compared with the personality feature stored in the storage unit, and the sender of the voice signal input from the telephone line is a person whose personality feature is registered in the storage unit.
  • a registration voice input unit for receiving a voice input of a person who requires registration in advance and a registration voice input unit for receiving the voice input
  • a first feature value extraction unit for extracting a personality feature value representing the personality of the voice signal
  • a storage unit for storing the personality feature value extracted by the feature value extraction unit in a storage unit, and the telephone line
  • a telephone voice input unit for receiving an input of a power voice; a voice signal power received by the telephone voice input unit; a second characteristic amount extracting unit for extracting a personality characteristic amount representing personality; and the storage unit by the storage unit.
  • a registrant selection unit that selects at least one of the persons whose personality feature amounts are registered in the unit, and a personality feature amount registered in the storage unit of the registrant selected by the registrant selection unit.
  • the second feature value extraction unit A determination unit that determines whether or not the sender of the input voice signal is a person whose personality characteristics are registered in the storage unit; And a judgment result notifying unit for notifying the judgment result by the judging unit.
  • Still another aspect of the present invention is to provide a computer system for controlling a telephone connected to a telephone line.
  • a registered voice input function for receiving an input of voice of a person who needs to be registered in advance, and a personality characteristic amount representing individuality from a voice signal received by the registered voice input function.
  • a first feature value extraction function to be extracted a storage function of storing the personality feature value extracted by the feature value extraction function in a storage unit, a telephone voice input function for receiving a voice input from the telephone line,
  • a second feature value extraction function for extracting a personality feature value representing the individuality of the voice signal received by the telephone voice input function; a personality feature value extracted by the second feature value extraction function; and the storage.
  • the personality feature amount stored in the storage unit is compared to determine whether or not the sender of the voice signal input from the telephone line is a person whose personality feature amount is registered in the storage unit. Judgment function and previous A determination result notifying function for notifying the determination result by the determination function, the causes the computer to perform.
  • FIG. 1 is a plan view showing a telephone according to a first embodiment of the present invention.
  • FIG. 2 is a block diagram showing a configuration of a telephone.
  • FIG. 3 is a functional block diagram showing functions of the telephone.
  • FIG. 4 is a flowchart showing a flow of a caller identification process.
  • FIG. 5 is a block diagram showing a configuration of a telephone according to a second embodiment of the present invention.
  • a cordless telephone is applied as the telephone according to the present embodiment.
  • FIG. 1 is a plan view showing the telephone 1
  • FIG. 2 is a block diagram showing a configuration of the telephone 1.
  • telephone 1 of the present embodiment has a base unit 2 connected to a PSTN (Public Switched Telephone Network) 4 And a slave unit 3 that performs wireless communication with each other.
  • PSTN Public Switched Telephone Network
  • Master unit 2 includes a CPU (Central Processing Unit) 6 that controls each unit!
  • the CPU 6 has a ROM (Read Only Memory) 7 as a storage medium in which fixed data such as a control program executed by the CPU 6 is written, and updates variable data such as work data.
  • a RAM (Random Access Memory) 8 to be written is connected via a system bus 9.
  • Such a CPU 6 includes an NCU (Network Control Unit) 10 connected to the PSTN 4, an RF (Radio-Frequency) unit 11 that is a wireless means for the slave unit 3, a keyboard 12, and a speaker 13 that is a voice emitting means.
  • a power supply circuit 14 and a display 15 are connected via a system bus 9.
  • the keyboard 12 has a numeric key 12a from ⁇ 0 '' to ⁇ 9 '' for inputting numbers, and a registration for a user or a registrant such as a close relative of the user to set the operation mode of the telephone 1 to the registration mode. It has an appearance structure in which mode setting buttons 12b and the like are arranged.
  • the base unit 2 of the telephone 1 of the present embodiment is provided with two LEDs 16 and 17 as light emitting means, and a light emission control circuit 18 for controlling the light emission of these LEDs 16 and 17 is also a system. It is connected to the CPU 6 via the system bus 9.
  • the LED 16 emits blue light
  • the LED 17 emits red light.
  • the slave unit 3 also includes a CPU 20 for controlling each unit.
  • a ROM 21 and a RAM 22 are connected to the CPU 20 via a system bus 23.
  • Such a CPU 20 includes an RF unit 24 as a wireless means for the base unit 2, a keyboard 25, a speaker 26, a microphone 27 functioning as an audio input unit, and a rechargeable power supply 28. Connected via
  • Registered voice input means 30 accepts voice input from microphone 27 of handset 3.
  • the sound quality conversion means 31 converts the voice received by the registered voice input means 30 into telephone voice quality (4KHz, 8Bit for a general telephone line).
  • the sound quality conversion means 31 outputs the registered voice converted to the telephone voice quality to the first feature quantity extraction means 32.
  • the voice input from the microphone mouth phone 27 of the slave unit 3 is converted to the telephone voice quality by the sound quality conversion means 31 because the quality of the source signals is more reliably registered.
  • These are the powers that can judge whether or not there is human power. When the performance of the microphone 27 is low, or when it is expected that the difference in sound quality can be absorbed by the first feature amount extracting means 32, the sound quality converting means 31 may not be provided.
  • the first feature amount extracting means 32 Upon receiving the registered voice converted to the telephone voice quality, the first feature amount extracting means 32 extracts a personality feature amount such as a cepstrum coefficient having personality, and extracts the extracted personality feature amount. Is stored in the RAM 8 serving as a storage unit. This completes the procedure for registering a telephone caller.
  • a personality feature amount such as a cepstrum coefficient having personality
  • the telephone voice input means 33 receives the voice of the telephone caller via the NCU 10 when an external force is applied to the telephone 1.
  • the second feature value extracting means 34 extracts a personality feature value such as a cepstrum coefficient having personality from the voice of the telephone caller received by the telephone voice input means 33.
  • the determination means 35 compares the feature amount stored in the RAM 8 as a storage unit with the newly extracted feature amount of the telephone caller, and determines whether or not the voice is the voice of the registrant. Then, the result is outputted to the judgment result notifying means 36.
  • the judgment result notifying means 36 causes one of the two LEDs 16, 17 to emit light according to the judgment result by the judging means 35. For example, it is set so that the blue LED 16 emits light when the caller is a registrant, and the red LED 17 emits light when the caller is not a registrant. With this setting, a close relative of the user can tell the user that if the red LED 17 is illuminated, they must not trust the phone because it is a call from another person, and a "fraud" It is possible to avoid encountering such damages.
  • the registered voice input means 30 the sound quality conversion means 31, the first feature quantity extraction means 32, the telephone voice input means 33, the second feature quantity extraction means 34, the determination means 35, and the determination result notification as described above.
  • the flow of the caller identification processing by means 36 refer to the flowchart of FIG. This will be described in detail.
  • step S1 it is determined whether or not the operation mode of the telephone 1 is the registration mode.
  • This mode determination is specified by an operation such as operating the registration mode setting button 12b of the keyboard 12 by the registrant, such as the user or a close relative of the user, and determines whether the registration mode setting button 12b has been operated. It is determined whether the mode is the registration mode or the normal normal conversation mode.
  • the operation mode of the telephone 1 is the registration mode (Y in step S1)
  • the telephone voice quality generally telephone line In this case, convert to 4KHz, 8Bit) (Step S2).
  • the registered voice power converted into the telephone voice quality is extracted as personality features such as cepstrum coefficients having personality (step S3), and the extracted personality features (registrant features) are extracted.
  • the data is stored in the storage unit RAM8 (step S4).
  • steps S2 to S4 may be repeated!
  • step S1 when it is determined that the operation mode of the telephone 1 is the normal interactive mode (N in step S1), when the external force is also applied to the telephone 1 by the telephone force S, the telephone caller's When the voice is received (step S5), personality features (sender features) such as cepstrum coefficients having personality are extracted (step S6).
  • the registrant features registered in advance in the registration mode are called from the RAM 8 (step S7), and the called registrant features are sequentially compared with the sender feature extracted in step S6 (step S8). .
  • the registrant feature is temporarily stored in the RAM 8 as a candidate feature (step S10). If the candidate feature has already been stored in the RAM 8, the candidate feature is rewritten to a new candidate feature. become.
  • the processing of steps S8 to S10 is repeated until the comparison of all registrant features with the sender feature extracted in step S6 is completed (Y in step S11).
  • step S12 the sender feature and the candidate feature are compared.
  • step S13 If the difference between the two feature values is smaller than a preset threshold (Y in step S13), it is determined that the caller is a registrant, and the blue LED 16 is illuminated (step S14). . On the other hand, when the difference between the two feature amounts is larger than the preset threshold value (N in step S13), it is determined that the telephone caller is not a registrant, and the red LED 17 is turned on (step S15).
  • a user living alone such as an elderly person, will receive a blue LED 16 when a telephone is externally applied to the telephone 1, and a registrant such as a close relative if the telephone is used. It is convinced that the conversation is with the person, and when the red LED 17 emits light, it is understood that the conversation is with a non-registrant such as a close relative. In other words, when the red LED 17 is lit during conversation with a person who gives the name of a registrant such as a close relative, it becomes possible to be alert that another person lies.
  • the personality feature quantity representing the personality of the person who needs to be registered in advance which is input from the microphone 27 functioning as the voice input unit, is extracted and stored in the storage unit. It is stored in a certain RAM8.
  • the personality feature representing the personality of the voice signal from the telephone line PSTN4 is extracted, and the personality and the personality feature stored in the RAM 8 are extracted. Are compared, and it is determined whether or not the sender of the voice signal input from the PSTN 4 which is the telephone line is a person whose personality feature is registered in the RAM 8, and the determination result is notified.
  • the blue LED 16 or the red LED 17 is caused to emit light.
  • the output of the determination result may be notified by voice or the like. Specifically, if it is determined that the caller is a registrant, a voice such as “Registration” or “Mr. If it is determined that there is, it can be realized by outputting a voice such as "This is a telephone from an unregistered human power" from the speaker 13 provided in the base unit 2 of the telephone 1. When it is determined that the call is from an unregistered person, a warning such as "please be careful” can also be issued.
  • the voice is also effective to output the voice only when it is determined that the user is unregistered, without outputting the determination result so that the conversation is not hindered when the user is determined to be a registrant. Further, it is possible to cause interference with the sound input from the microphone 27 of the slave 3 and the output sound to the speaker 26 with the speaker 13 provided in the master 2 of the telephone 1. In other words, the message "Unregistered phone" is heard to the user at the same time as the caller, and the user is warned that the call is from a stranger. It is possible to inform the caller that the phone has a speaker recognition function, that is, a phone with a "fraud" countermeasure function.
  • step S8 of the present embodiment the called registrant feature and the sender feature extracted in step S6 are sequentially compared.
  • the personality feature is registered.
  • a registrant selection key (not shown) set for each registrant is prepared in advance on the keyboard 12, and for example, the registrant selection key on which a registrant such as a close relative named by the caller is set is operated.
  • one of the persons whose personality features are registered in the RAM 8 as the storage unit is selected (registrant selection means), and the personality features of the registrant selected by operating the registrant selection key are displayed. You may make it compare with the sender characteristic amount extracted in step S6. As a result, the comparison of the feature values can be performed quickly, and the processing can be reduced.
  • two or more registrants may be selected at the same time.
  • the registrant is registered by inputting the voice through the PSTN4 which is a power telephone line described in the case where the voice is input from the microphone 27 of the slave unit 3 and directly set to the telephone 1. This is different from the embodiment.
  • Authentication means 37 performs authentication when a registrant attempts to register voice through PSTN4. This authentication can be realized by sending a password or the like by DTMF (Dial Tone Multi Frequency). By transmitting the personal identification number and the like by DTMF at the time of registration in this way, the registrant can be limited to the close relatives of the user.
  • DTMF Dial Tone Multi Frequency
  • the registered voice input means 30 accepts the voice of the caller via the NCU 10 when an external force is applied to the telephone 1, and inputs the registered voice only when the authentication is performed by the authentication means 37.
  • the voice received by the means 30 is output to the first feature quantity extracting means 32.
  • the voice of the telephone caller is received via the NCU 10, there is no need to convert the received voice to telephone voice quality (4KHz, 8Bit for a general telephone line) as in the first embodiment.
  • the first feature quantity extracting means 32 Upon receiving the voice output from the registered voice input means 30, the first feature quantity extracting means 32 extracts a personality feature quantity such as a cepstrum coefficient having personality, and extracts the extracted personality feature quantity. Is stored in the RAM 8 serving as a storage unit. This completes the procedure for registering a telephone caller.
  • a personality feature quantity such as a cepstrum coefficient having personality
  • the telephone voice input means 33 receives the voice of the telephone caller via the NCU 10 when an external force is applied to the telephone 1.
  • the second feature amount extraction means 34 is a function of the telephone caller's sound received by the telephone voice input means 33. From the voice, a personality feature amount such as a cepstrum coefficient having personality is extracted.
  • the determination unit 35 compares the feature amount stored in the RAM 8 as a storage unit with the newly extracted feature amount of the telephone caller to determine whether or not the voice is the voice of the registrant. Then, the result is outputted to the judgment result notifying means 36.
  • the determination result notifying means 36 causes one of the two LEDs 16, 17 to emit light according to the determination result by the determining means 35. For example, it is set so that the blue LED 16 emits light when the caller is a registrant, and the red LED 17 emits light when the caller is not a registrant. With this setting, a close relative of the user can tell the user that if the red LED 17 is illuminated, they must not trust the phone because it is a call from another person, and a "fraud" It is possible to avoid encountering such damages.
  • a personality feature quantity representing personality is extracted from a voice signal of a person who needs to be registered in advance through a PSTN 4 which is a telephone line, and the RAM 8 serving as a storage unit is extracted. Is stored in On the other hand, when the telephone is strong, the voice signal strength from the telephone line PSTN4 is extracted, and the personality features representing personality are extracted and the personality features stored in the RAM 8 are extracted. Is compared, and it is determined whether or not the sender of the voice signal input from the PSTN4, which is the telephone line, is a person whose personality feature is registered in the RAM 8, and the determination result is notified.
  • the personality feature is stored in the RAM 8, and if the telephone is from an unregistered person, the fact is notified. In this way, if an elderly person living alone uses his / her telephone 1 as a registrant, he / she can protect the elderly person living alone from damage such as “scams”.
  • the program may be downloaded from a network such as the Internet and installed in a nonvolatile ROM or the like.
  • the storage device storing the program in the server on the transmission side is also a storage medium of the present invention.
  • the program may be operated on a predetermined OS (Operating System), and in that case, the OS may perform a part of execution of various processes described later, It is included as a part of a group of program files that compose predetermined application software and OS.
  • OS Operating System
  • a mobile phone or the like may be used instead of the cordless telephone 1 as a telephone.
  • two feature value extraction means such as a first feature value extraction means for performing authentication at the time of registration and a second feature value extraction means for performing authentication when the telephone is actually activated.
  • first feature value extracting means and the second feature value extracting means may be the same feature value extracting means.

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

 一人暮らしのお年寄りなどを“詐欺”等の被害から護るために、予め登録を要する者の音声信号から個人性を表す個人性特徴量を抽出して記憶部に記憶し、電話がかかってきた場合には、電話回線からの音声信号から個人性を表す個人性特徴量を抽出し、当該個人性特徴量と記憶部に記憶した個人性特徴量とを比較して電話回線から入力された音声信号の発信者が記憶部に個人性特徴量が登録されている者であるか否かを判定し、判定結果を報知する。これにより、個人性特徴量が記憶部に記憶されていない未登録者からの電話であった場合にはその旨が報知される。

Description

明 細 書
電話機およびプログラム
技術分野
[0001] 本発明は、電話機およびプログラムに関する。
背景技術
[0002] 従来、話者認識技術の応用として、例えば特許文献 1に示されるような電話応答支 援装置 Z方法が提案されている。特許文献 1の電話応答支援装置 Z方法は、企業 や団体の電話受付業務において、対話の相手を容易に特定することが可能となるよ うに、受信した音声データ力も発呼者を識別するとともに、音声データの内容を認識 して、それらの情報力 対話の相手を決定するというものである。このような特許文献 1の電話応答支援装置 Z方法における音声データからの発呼者の識別においては
、特定の決まった言葉を対象に識別を行う「テキスト依存型」の話者認識技術が用い られている。
[0003] 特許文献 1 :日本国の特開 2003— 158579公報
発明の開示
[0004] ところで、近年においては、親族になりすまして一人暮らしのお年寄りの家に電話を かけて交通事故の示談金等の名目で金銭をだましとる、いわゆる"詐欺"が多発して いる。このような"詐欺"が成立する要因は、だます側が自分力もは名乗らないことと、 交通事故に遭ったなどという非日常的な状況に瀕した場合のように、冷静に話し相手 が本当に自分の親族であるかどうかを判断できない状況にあるため、電話の相手が 自分の親族であるとお年寄りが錯覚してしまうことである。
[0005] そこで、特許文献 1の電話応答支援方法を用いて、受信した音声データから発呼 者を識別するとともに、音声データの内容を認識して、それらの情報から対話の相手 を決定するとことが考えられる。
[0006] ところが、 "詐欺"のようなシーンにおいては、悪意がある発呼者が予め決められた 言葉を必ず発話するとは限らないため、言葉を指定しないで自由な発話中に識別を 行う「テキスト独立型」の話者認識を行う必要があるが、一般に「テキスト独立型」は「 テキスト依存型」に比べてより多くの計算量を要することになる。特に、登録者が複数 Vヽた場合に全ての登録者に対し、間違 ヽなく登録者本人であるかを確認する「話者 認証」を行う事は困難である。
[0007] 本発明は、一人暮らしのお年寄りなどを"詐欺"等の被害から護ることができる電話 機およびプログラムを提供することを目的とする。
[0008] 本発明は、電話回線に接続される電話機において、予め登録を要する者の音声の 入力を受け付ける登録音声入力部と、前記登録音声入力部により受け付けた音声信 号カゝら個人性を表す個人性特徴量を抽出する第 1特徴量抽出部と、前記特徴量抽 出部により抽出された個人性特徴量を記憶部に記憶する記憶部と、前記電話回線か らの音声の入力を受け付ける電話音声入力部と、前記電話音声入力部により受け付 けた音声信号カゝら個人性を表す個人性特徴量を抽出する第 2特徴量抽出部と、前 記第 2特徴量抽出部により抽出した個人性特徴量と前記記憶部に記憶された個人 性特徴量とを比較し、前記電話回線から入力された音声信号の発信者が前記記憶 部に個人性特徴量が登録されている者である力否かを判定する判定部と、前記判定 部による判定結果を報知する判定結果報知部と、を備える。
[0009] 別の面力も見た本発明は、電話回線に接続される電話機において、予め登録を要 する者の音声の入力を受け付ける登録音声入力部と、前記登録音声入力部により受 け付けた音声信号カゝら個人性を表す個人性特徴量を抽出する第 1特徴量抽出部と、 前記特徴量抽出部により抽出された個人性特徴量を記憶部に記憶する記憶部と、 前記電話回線力 の音声の入力を受け付ける電話音声入力部と、前記電話音声入 力部により受け付けた音声信号力 個人性を表す個人性特徴量を抽出する第 2特徴 量抽出部と、前記記憶部により前記記憶部に個人性特徴量が登録されている者のう ち少なくとも一人を選択する登録者選択部と、前記登録者選択部によって選択され た登録者の前記記憶部に登録されている個人性特徴量と前記第 2特徴量抽出部に より抽出した個人性特徴量とを比較し、前記電話回線力 入力された音声信号の発 信者が前記記憶部に個人性特徴量が登録されている者である力否かを判定する判 定部と、前記判定部による判定結果を報知する判定結果報知部と、を備える。
[0010] 更に別の面力 見た本発明は、電話回線に接続される電話機を制御するコンビュ 一タに読取可能なプログラムであって、予め登録を要する者の音声の入力を受け付 ける登録音声入力機能と、前記登録音声入力機能により受け付けた音声信号から個 人性を表す個人性特徴量を抽出する第 1特徴量抽出機能と、前記特徴量抽出機能 により抽出された個人性特徴量を記憶部に記憶する記憶機能と、前記電話回線から の音声の入力を受け付ける電話音声入力機能と、前記電話音声入力機能により受 け付けた音声信号カゝら個人性を表す個人性特徴量を抽出する第 2特徴量抽出機能 と、前記第 2特徴量抽出機能により抽出した個人性特徴量と前記記憶部に記憶され た個人性特徴量とを比較し、前記電話回線から入力された音声信号の発信者が前 記記憶部に個人性特徴量が登録されている者である力否かを判定する判定機能と、 前記判定機能による判定結果を報知する判定結果報知機能と、を前記コンピュータ に実行させる。
図面の簡単な説明
[0011] [図 1]本発明の第一の実施の形態の電話機を示す平面図である。
[図 2]電話機の構成を示すブロック図である。
[図 3]電話機の機能を示す機能ブロック図である。
[図 4]発信者識別処理の流れを示すフローチャートである。
[図 5]本発明の第二の実施の形態の電話機の構成を示すブロック図である。
発明を実施するための最良の形態
[0012] [第一の実施の形態]
本発明の第一の実施の形態を図 1ないし図 4に基づいて説明する。本実施の形態 の電話機としては、コードレス電話機が適用されている。
[0013] ここで、図 1は電話機 1を示す平面図、図 2は電話機 1の構成を示すブロック図であ る。図 1および図 2に示すように、本実施の形態の電話機 1は、電話回線である PST N (Public Switched Telephone Network) 4と商用電源 5とに接続された親機 2と、この 親機 2と無線通信する子機 3とを互いに独立に設けた構造となっている。
[0014] 親機 2は、各部を制御する CPU (Central Processing Unit) 6を備えて!/ヽる。この CP U6には、 CPU6が実行する制御プログラム等の固定データが書き込まれている記憶 媒体である ROM (Read Only Memory) 7と、ワークデータ等の可変データを更新自 在に書き込む RAM (Random Access Memory) 8とがシステムバス 9を介して接続され ている。このような CPU6には、 PSTN4に接続された NCU (Network Control Unit) 10と、子機 3との無線手段である RF (Radio- Frequency)ユニット 11と、キーボード 12 と、発声手段であるスピーカ 13と、電源回路 14と、ディスプレイ 15とがシステムバス 9 を介して接続されている。キーボード 12は、数字を入力するための「0」から「9」まで の置数キー 12a、ユーザもしくはユーザの近親者等である登録者が電話機 1の動作 モードを登録モードに設定するための登録モード設定ボタン 12b等を配列した外観 構造を有している。
[0015] 力!]えて、本実施の形態の電話機 1の親機 2には、発光手段である 2つの LED16, 1 7が配設されており、これらの LED16, 17の発光を制御する発光制御回路 18もシス テムバス 9を介して CPU6に接続されている。なお、 LED16は青色に発光し、 LED1 7は赤色には発光する。
[0016] 一方、子機 3も、各部を制御する CPU20を備えて!/、る。この CPU20には、 ROM2 1と、 RAM22とがシステムバス 23を介して接続されている。このような CPU20には、 親機 2との無線手段である RFユニット 24と、キーボード 25と、スピーカ 26と、音声入 力部として機能するマイクロフォン 27と、充電式の電源 28とがシステムバス 23を介し て接続されている。
[0017] 次に、電話機 1の親機 2に内蔵された ROM7に格納された制御プログラムに従って CPU6が実行する各種の演算処理のうち、本実施の形態の特長的な処理について 以下に説明する。
[0018] ここで、電話機 1の親機 2に内蔵された CPU6が実行する各種の演算処理により実 現される機能について説明する。図 3に示すように、電話機 1においては、登録音声 入力手段 30、音質変換手段 31、第 1特徴量抽出手段 32、電話音声入力手段 33、 第 2特徴量抽出手段 34、判定手段 35、判定結果報知手段 36の各機能が、 CPU6 が実行する各種の演算処理により実現されている。なお、リアルタイム性が重要視さ れる場合には、処理を高速化する必要がある。そのためには、論理回路(図示せず) を別途設け、論理回路の動作により各種機能を実現するようにするのが望ま 、。
[0019] 登録音声入力手段 30は、子機 3のマイクロフォン 27からの音声の入力を受け付け る。
[0020] 音質変換手段 31は、登録音声入力手段 30で受け付けた音声を電話音声品質 (一 般電話回線の場合 4KHz、 8Bit)に変換する。音質変換手段 31は、電話音声品質 に変換された登録音声を第 1特徴量抽出手段 32に出力する。このように子機 3のマ イク口フォン 27から入力された音声を音質変換手段 31により電話音声品質に変換す るようにしたのは、源信号の質が同等であった方が確実に登録者力否かを判定でき る力らである。なお、マイクロフォン 27の性能が低い場合や、第 1特徴量抽出手段 32 で音質の差が吸収できると見込める場合には、音質変換手段 31はなくても良い。
[0021] 第 1特徴量抽出手段 32は、電話音声品質に変換された登録音声を受け取ると、例 えば個人性を有するケプストラム係数などの個人性特徴量を抽出し、この抽出した個 人性特徴量を記憶部である RAM8に記憶する。以上により、電話発信者の登録の 手続きが完了する。
[0022] 電話音声入力手段 33は、この電話機 1に外部力も電話力かかってきた場合、 NCU 10経由で電話発信者の音声を受け取る。
[0023] 第 2特徴量抽出手段 34は、電話音声入力手段 33で受け取った電話発信者の音 声から、例えば個人性を有するケプストラム係数などの個人性特徴量を抽出する。
[0024] 判定手段 35は、記憶部である RAM8に記憶されている特徴量と、新たに抽出され た電話発信者の特徴量の比較を行い、登録者の音声であるカゝ否かを判定し、その結 果を判定結果報知手段 36に出力する。
[0025] 判定結果報知手段 36は、判定手段 35による判定結果に応じて、 2つの LED16, 1 7のいずれか一方を発光させる。例えば、電話発信者が登録者であった場合には青 色の LED16が発光し、電話発信者が登録者でな力つた場合には赤色の LED17が 発光するように設定しておく。このように設定しておけば、ユーザの近親者はユーザ に対し、赤色の LED17が発光している場合は他人からの電話であるから信用しては いけないと教示しておけば、 "詐欺"等の被害に会うことは避けられる。
[0026] ここで、上述したような登録音声入力手段 30、音質変換手段 31、第 1特徴量抽出 手段 32、電話音声入力手段 33、第 2特徴量抽出手段 34、判定手段 35、判定結果 報知手段 36による発信者識別処理の流れにつ!、て図 4のフローチャートを参照して 詳細に説明する。
[0027] 図 4に示すように、ステップ S1においては、電話機 1の動作モードが登録モードで ある力否かを判定する。このモード判定は、ユーザもしくはユーザの近親者等である 登録者がキーボード 12の登録モード設定ボタン 12bを操作する等の動作で指定さ れるもので、登録モード設定ボタン 12bが操作されたか否かで、登録モードであるか 通常の通常対話モードであるかが判定される。
[0028] 電話機 1の動作モードが登録モードであると判定した場合には (ステップ S1の Y)、 子機 3のマイクロフォン 27から入力された音声を受信すると、電話音声品質 (一般電 話回線の場合 4KHz、 8Bit)に変換する (ステップ S 2)。
[0029] その後、電話音声品質に変換された登録音声力 個人性を有するケプストラム係 数などの個人性特徴量を抽出し (ステップ S3)、この抽出した個人性特徴量 (登録者 特徴量)を記憶部である RAM8に記憶する (ステップ S4)。以上により、電話発信者 の登録の手続きが完了する。すなわち、本実施の形態は、一人暮らしのお年寄りな どが電話機 1を使う場合において、お年寄りの近親者などが電話機 1に直接設定を 行うことにより、お年寄りの近親者などが登録者となる場合を想定している。
[0030] このような電話発信者の登録の手続きを複数人について行いたい場合には、ステツ プ S2〜S4の処理を繰り返せば良!、。
[0031] 一方、電話機 1の動作モードが通常対話モードであると判定した場合には (ステツ プ S1の N)、電話機 1に外部力も電話力 Sかかってきた場合に NCU10経由で電話発 信者の音声を受信すると (ステップ S5)、例えば個人性を有するケプストラム係数など の個人性特徴量 (発信者特徴量)を抽出する (ステップ S6)。
[0032] 続いて、登録モードで予め登録した登録者特徴量を RAM8から呼び出し (ステップ S7)、呼び出した登録者特徴量とステップ S6で抽出した発信者特徴量とを順次比較 する (ステップ S8)。呼び出した 1つの登録者特徴量とステップ S6で抽出した発信者 特徴量との比較の結果、呼び出した 1つの登録者特徴量がステップ S6で抽出した発 信者特徴量に最も近!ヽと判断した場合には (ステップ S9の Y)、当該登録者特徴量を 候補者特徴量として RAM8に一時的に記憶する (ステップ S 10)。なお、既に RAM8 に候補者特徴量が記憶されて ヽる場合には、新たな候補者特徴量に書き換えること になる。ステップ S8〜S10の処理は、全ての登録者特徴量とステップ S6で抽出した 発信者特徴量との比較が終わるまで (ステップ S 11の Y)、繰り返される。
[0033] 以上のようにして最も発信者に近い候補者が選択されると、ステップ S12に進み、 発信者特徴量と候補者特徴量とを比較する。ここでは、 2つの特徴量の差が予め設 定された閾値より大き 、か小さ!/、かの判定が行われる。
[0034] 2つの特徴量の差が予め設定された閾値より小さい場合には (ステップ S 13の Y)、 電話発信者が登録者であると判定し、青色の LED16を発光させる (ステップ S14)。 一方、 2つの特徴量の差が予め設定された閾値より大きい場合には (ステップ S13の N)、電話発信者が登録者でないと判定し、赤色の LED17を発光させる (ステップ S1 5)。
[0035] 以上により、一人暮らしのお年寄りなどのユーザは、電話機 1に外部から電話がか 力つてきた場合にぉ 、て、青色の LED16が発光して 、る場合には近親者等の登録 者との会話であると確信でき、赤色の LED17が発光している場合には近親者等の 登録者でない者との会話であることがわかる。すなわち、近親者等の登録者の名前 を名乗る相手との会話中に赤色の LED17が発光している場合には、他人が嘘をつ Vヽて 、る事を警戒できるようになる。
[0036] このように本実施の形態によれば、音声入力部として機能するマイクロフォン 27から 入力させた予め登録を要する者の音声信号力 個人性を表す個人性特徴量が抽出 され、記憶部である RAM8に記憶される。一方、電話が力かってきた場合には、電話 回線である PSTN4からの音声信号力 個人性を表す個人性特徴量が抽出され、当 該個人性特徴量と RAM8に記憶された個人性特徴量とが比較され、電話回線であ る PSTN4から入力された音声信号の発信者が RAM8に個人性特徴量が登録され ている者である力否かが判定され、判定結果が報知される。これにより、電話機 1に 外部から電話力 Sかかってきた場合において、個人性特徴量が RAM8に記憶されて いない未登録者力もの電話であった場合にはその旨が報知されることにより、一人暮 らしのお年寄りなどが電話機 1を使用する際に近親者等を登録者としておけば、一人 暮らしのお年寄りなどを"詐欺"等の被害から護ることが可能になる。
[0037] なお、本実施の形態においては、青色の LED16または赤色の LED17を発光させ ることにより、会話の相手が登録者である力否かを報知するようにした力 これに限る ものではなぐ判定結果の出力を音声等によって報知するようにしても良い。具体的 には、電話発信者が登録者であると判定された場合、「登録です」「〇〇さんです (〇 〇は人の名前)」等の音声を、電話発信者が未登録者であると判定された場合には「 登録していない人力ゝらの電話です。」等の音声を電話機 1の親機 2に備えたスピーカ 13から出力することで実現できる。また、未登録者からの電話と判定された場合には 、「注意してください」等の警告も合わせて発することも可能である。さらに、登録者と 判定された場合には会話を妨げな 、ように判定結果出力は行わずに、未登録者と判 定された場合にのみ音声出力することも有効である。さらに、電話機 1の親機 2に備 えたスピーカ 13ではなぐ子機 3のマイクロフォン 27から入力された音声やスピーカ 2 6への出力音に混信させることも可能である。即ち、「未登録者力もの電話です」とい うメッセージをユーザに対して聞力せると同時に発信者に対しても聞こえるようにし、 ユーザに対しては知らない人からの電話であることの警告を、発信者に対しては、話 者認識機能付の電話機であること、即ち"詐欺"対策機能付電話機であることを知ら しめることが実現でさる。
[0038] また、本実施の形態のステップ S8においては、呼び出した登録者特徴量とステップ S6で抽出した発信者特徴量とを順次比較するようにしたが、個人性特徴量が登録さ れている登録者毎に設定される登録者選択キー(図示せず)をキーボード 12に予め 用意しておき、例えば発信者が名乗った近親者等の登録者が設定されている登録 者選択キーを操作することにより記憶部である RAM8に個人性特徴量が登録されて いる者のうち一人を選択し (登録者選択手段)、登録者選択キーの操作によって選択 された登録者の個人性特徴量とステップ S6で抽出した発信者特徴量とを比較するよ うにしても良い。これにより、特徴量の比較を速やかに実行することが可能になり、処 理の軽減ィ匕を図ることが可能になる。なお、複数の登録者選択キーを操作することに より、二人以上を同時に選択するようにしても良い。
[0039] [第二の実施の形態]
次に、本発明の第二の実施の形態について図 5を参照して説明する。なお、前述し た第一の実施の形態と同一部分は同一符号で示し説明も省略する。第一の実施の 形態においては、音声を子機 3のマイクロフォン 27から入力して電話機 1に直接設定 を行う場合について説明した力 電話回線である PSTN4を通じて音声を入力して登 録者を登録する点で第一の実施の形態とは異なるものである。
[0040] ここで、本実施の形態の電話機 1の親機 2に内蔵された CPU6が実行する各種の 演算処理により実現される機能について説明する。図 5に示すように、電話機 1にお いては、認証手段 37、登録音声入力手段 30、第 1特徴量抽出手段 32、電話音声入 力手段 33、第 2特徴量抽出手段 34、判定手段 35、判定結果報知手段 36の各機能 力 CPU6が実行する各種の演算処理により実現されている。なお、リアルタイム性 が重要視される場合には、処理を高速化する必要がある。そのためには、論理回路( 図示せず)を別途設け、論理回路の動作により各種機能を実現するようにするのが望 ましい。
[0041] 認証手段 37は、登録者が PSTN4を通じて音声の登録を行おうとした場合、認証を 行う。この認証は、暗証番号等を DTMF (Dial Tone Multi Frequency)で送ることで実 現することができる。このように登録の際に、暗証番号等を DTMFで送るようにするこ とで、登録者をユーザの近親者等に制限することができる。
[0042] 登録音声入力手段 30は、この電話機 1に外部力も電話力かかってきた場合、 NCU 10経由で電話発信者の音声を受け付け、認証手段 37で認証された場合にのみ、登 録音声入力手段 30で受け付けた音声を第 1特徴量抽出手段 32に出力する。この場 合、 NCU10経由で電話発信者の音声を受け付けるので、第一の実施の形態のよう に受け付けた音声を電話音声品質 (一般電話回線の場合 4KHz、 8Bit)に変換する 必要はない。
[0043] 第 1特徴量抽出手段 32は、登録音声入力手段 30から出力された音声を受け取る と、例えば個人性を有するケプストラム係数などの個人性特徴量を抽出し、この抽出 した個人性特徴量を記憶部である RAM8に記憶する。以上により、電話発信者の登 録の手続きが完了する。
[0044] 電話音声入力手段 33は、この電話機 1に外部力も電話力かかってきた場合、 NCU 10経由で電話発信者の音声を受け取る。
[0045] 第 2特徴量抽出手段 34は、電話音声入力手段 33で受け取った電話発信者の音 声から、例えば個人性を有するケプストラム係数などの個人性特徴量を抽出する。
[0046] 判定手段 35は、記憶部である RAM8に記憶されている特徴量と、新たに抽出され た電話発信者の特徴量の比較を行い、登録者の音声であるカゝ否かを判定し、その結 果を判定結果報知手段 36に出力する。
[0047] 判定結果報知手段 36は、判定手段 35による判定結果に応じて、 2つの LED16, 1 7のいずれか一方を発光させる。例えば、電話発信者が登録者であった場合には青 色の LED16が発光し、電話発信者が登録者でな力つた場合には赤色の LED17が 発光するように設定しておく。このように設定しておけば、ユーザの近親者はユーザ に対し、赤色の LED17が発光している場合は他人からの電話であるから信用しては いけないと教示しておけば、 "詐欺"等の被害に会うことは避けられる。
[0048] なお、第一の実施の形態のように、電話機 1を購入して設置する際にまず直接登録 を行 ヽ、その後第二の実施の形態のように PSTN4を経由して登録を行うようにしても 良い。人間の声は本人の成長や体形の変化、あるいは風邪をひいた等体調の変化 でその特徴が変化することが知られている。通常、話者認識技術を利用する場合は この声質の変化に対応するため、定期的に登録を更新するなどの運用が図られてい る力 この更新を PSTN4を通じて行うことで、更新の度に電話機 1のあるところまで行 く必要がなくなる。
[0049] このように本実施の形態によれば、電話回線である PSTN4を通じて入力させた予 め登録を要する者の音声信号から個人性を表す個人性特徴量が抽出され、記憶部 である RAM8に記憶される。一方、電話が力かってきた場合には、電話回線である P STN4からの音声信号力 個人性を表す個人性特徴量が抽出され、当該個人性特 徴量と RAM8に記憶された個人性特徴量とが比較され、電話回線である PSTN4か ら入力された音声信号の発信者が RAM8に個人性特徴量が登録されている者であ る力否かが判定され、判定結果が報知される。これにより、電話機 1に外部から電話 力 Sかかってきた場合にぉ 、て、個人性特徴量が RAM8に記憶されて 、な 、未登録 者からの電話であった場合にはその旨が報知されることにより、一人暮らしのお年寄 りなどが電話機 1を使用する際に近親者等を登録者としておけば、一人暮らしのお年 寄りなどを"詐欺"等の被害力 護ることが可能になる。 [0050] なお、各実施の形態においては、記憶媒体として ROM7を適用した力 ROM7の みならず、半導体メモリ等、各種方式のメディアを用いることができる。また、インター ネットなどのネットワークからプログラムをダウンロードし、不揮発性の ROM等にインス トールするようにしてもよい。この場合に、送信側のサーバでプログラムを記憶してい る記憶装置も、この発明の記憶媒体である。なお、プログラムは、所定の OS (Operati ng System)上で動作するものであってもよいし、その場合に後述の各種処理の一部 の実行を OSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトや OSなどを構成する一群のプログラムファイルの一部として含まれているものであって ちょい。
[0051] また、各実施の形態においては、電話機としてコードレス電話機 1を適用した力 こ れに限るものではなぐ携帯電話等であっても良い。
[0052] さらに、各実施の形態において、登録時に認証を行う第 1特徴量抽出手段と実際に 電話が力かってきたときに認証を行う第 2特徴量抽出手段というように、 2つの特徴量 抽出手段を有する形態として説明したが、第 1特徴量抽出手段と第 2特徴量抽出手 段とは同一の特徴量抽出手段としても良い。

Claims

請求の範囲
[1] 電話回線に接続される電話機において、
予め登録を要する者の音声の入力を受け付ける登録音声入力手段と、 前記登録音声入力手段により受け付けた音声信号から個人性を表す個人性特徴 量を抽出する第 1特徴量抽出手段と、
前記特徴量抽出手段により抽出された個人性特徴量を記憶部に記憶する記憶手 段と、
前記電話回線からの音声の入力を受け付ける電話音声入力手段と、
前記電話音声入力手段により受け付けた音声信号から個人性を表す個人性特徴 量を抽出する第 2特徴量抽出手段と、
前記第 2特徴量抽出手段により抽出した個人性特徴量と前記記憶部に記憶された 個人性特徴量とを比較し、前記電話回線力 入力された音声信号の発信者が前記 記憶部に個人性特徴量が登録されている者である力否かを判定する判定手段と、 前記判定手段による判定結果を報知する判定結果報知手段と、
を備えることを特徴とする電話機。
[2] 前記音声入力手段は、前記電話回線を通じて音声を通信するための音声入力を 受け付ける、ことを特徴とする請求項 1記載の電話機。
[3] 前記音声入力手段は、前記電話回線力もの音声の入力を受け付ける、ことを特徴 とする請求項 1記載の電話機。
[4] 前記登録音声入力手段で受け付けた音声を電話音声品質に変換する音質変換手 段を備える、ことを特徴とする請求項 1記載の電話機。
[5] 2色の発光手段を備えており、
前記判定結果報知手段は、前記判定手段による判定結果に応じて 2色の前記発 光手段のうち、いずれか一方の前記発光手段を発光させる、
ことを特徴とする請求項 1記載の電話機。
[6] 発声手段を備えており、
前記判定結果報知手段は、前記判定手段による判定結果を、前記発声手段を介 して出力する、 ことを特徴とする請求項 1記載の電話機。
[7] 前記判定結果報知手段は、前記判定手段による判定結果を、音声入力部から入 力された音声に混信させる、
ことを特徴とする請求項 1記載の電話機。
[8] 電話回線に接続される電話機において、
予め登録を要する者の音声の入力を受け付ける登録音声入力手段と、 前記登録音声入力手段により受け付けた音声信号から個人性を表す個人性特徴 量を抽出する第 1特徴量抽出手段と、
前記特徴量抽出手段により抽出された個人性特徴量を記憶部に記憶する記憶手 段と、
前記電話回線からの音声の入力を受け付ける電話音声入力手段と、
前記電話音声入力手段により受け付けた音声信号から個人性を表す個人性特徴 量を抽出する第 2特徴量抽出手段と、
前記記憶手段により前記記憶部に個人性特徴量が登録されている者のうち少なく とも一人を選択する登録者選択手段と、
前記登録者選択手段によって選択された登録者の前記記憶部に登録されている 個人性特徴量と前記第 2特徴量抽出手段により抽出した個人性特徴量とを比較し、 前記電話回線から入力された音声信号の発信者が前記記憶部に個人性特徴量が 登録されている者である力否かを判定する判定手段と、
前記判定手段による判定結果を報知する判定結果報知手段と、
を備えることを特徴とする電話機。
[9] 予め登録を要する者の認証を行う認証手段を備え、
前記登録音声入力手段は、前記認証手段で認証された場合にのみ、受け付けた 音声を前記第 1特徴量抽出手段に出力する、
ことを特徴とする請求項 8記載の電話機。
[10] 電話回線に接続される電話機を制御するコンピュータに読取可能なプログラムであ つて、
予め登録を要する者の音声の入力を受け付ける登録音声入力機能と、 前記登録音声入力機能により受け付けた音声信号から個人性を表す個人性特徴 量を抽出する第 1特徴量抽出機能と、
前記特徴量抽出機能により抽出された個人性特徴量を記憶部に記憶する記憶機 能と、
前記電話回線力 の音声の入力を受け付ける電話音声入力機能と、
前記電話音声入力機能により受け付けた音声信号力 個人性を表す個人性特徴 量を抽出する第 2特徴量抽出機能と、
前記第 2特徴量抽出機能により抽出した個人性特徴量と前記記憶部に記憶された 個人性特徴量とを比較し、前記電話回線力 入力された音声信号の発信者が前記 記憶部に個人性特徴量が登録されている者である力否かを判定する判定機能と、 前記判定機能による判定結果を報知する判定結果報知機能と、
を前記コンピュータに実行させることを特徴とするプログラム。
PCT/JP2005/009866 2004-05-28 2005-05-30 電話機およびプログラム WO2005117398A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US10/555,294 US20070147592A1 (en) 2004-05-28 2005-05-30 Telephone and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-159572 2004-05-28
JP2004159572A JP4157077B2 (ja) 2004-05-28 2004-05-28 電話機

Publications (1)

Publication Number Publication Date
WO2005117398A1 true WO2005117398A1 (ja) 2005-12-08

Family

ID=35451252

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/009866 WO2005117398A1 (ja) 2004-05-28 2005-05-30 電話機およびプログラム

Country Status (4)

Country Link
US (1) US20070147592A1 (ja)
JP (1) JP4157077B2 (ja)
CN (1) CN1806424A (ja)
WO (1) WO2005117398A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014048534A (ja) * 2012-08-31 2014-03-17 Sogo Keibi Hosho Co Ltd 話者認識装置、話者認識方法及び話者認識プログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006038955A (ja) * 2004-07-22 2006-02-09 Docomo Engineering Tohoku Inc 声紋認識システム
CN101447188B (zh) * 2007-11-27 2011-06-15 北京金运昭德数字科技有限公司 数字声纹鉴定系统及确认和辨认方法
US10008206B2 (en) * 2011-12-23 2018-06-26 National Ict Australia Limited Verifying a user
JP2015079315A (ja) * 2013-10-16 2015-04-23 正光 下島 認証システム、認証方法、プログラム及び当該プログラムを記録したコンピュータ読み取り可能な記録媒体
CN105100362A (zh) * 2014-05-20 2015-11-25 中兴通讯股份有限公司 诈骗通话识别方法、防诈骗方法、通话终端
WO2015194148A1 (ja) 2014-06-17 2015-12-23 日本電気株式会社 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体
JP7308109B2 (ja) * 2019-09-12 2023-07-13 シャープ株式会社 通信装置
CN110600042B (zh) * 2019-10-10 2020-10-23 公安部第三研究所 一种伪装语音说话人性别识别的方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63236456A (ja) * 1987-03-25 1988-10-03 Toshiba Corp 電話端末着信制御装置
JPH01195749A (ja) * 1988-01-30 1989-08-07 Toshiba Corp 通信端末システム
JPH04349747A (ja) * 1991-05-27 1992-12-04 Fujitsu General Ltd 電話装置
JPH05300226A (ja) * 1992-04-17 1993-11-12 Nippon Telegr & Teleph Corp <Ntt> 不要電話排除装置および不要電話排除装置付き電話機
JPH05316198A (ja) * 1992-05-11 1993-11-26 Sekisui Chem Co Ltd 発呼者認識電話装置
JP2001223788A (ja) * 2000-02-08 2001-08-17 Aipakku:Kk 電話受信選択方法及び装置
JP2002094612A (ja) * 2000-09-14 2002-03-29 Nec Corp 携帯電話機
JP2005184618A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Ind Co Ltd 音声認証装置、音声認証システム及び音声認証方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6728546B1 (en) * 1999-03-23 2004-04-27 Legerity, Inc. Computer peripheral base station for a cordless telephone
JP2002320028A (ja) * 2001-04-23 2002-10-31 Nec Corp 携帯端末装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63236456A (ja) * 1987-03-25 1988-10-03 Toshiba Corp 電話端末着信制御装置
JPH01195749A (ja) * 1988-01-30 1989-08-07 Toshiba Corp 通信端末システム
JPH04349747A (ja) * 1991-05-27 1992-12-04 Fujitsu General Ltd 電話装置
JPH05300226A (ja) * 1992-04-17 1993-11-12 Nippon Telegr & Teleph Corp <Ntt> 不要電話排除装置および不要電話排除装置付き電話機
JPH05316198A (ja) * 1992-05-11 1993-11-26 Sekisui Chem Co Ltd 発呼者認識電話装置
JP2001223788A (ja) * 2000-02-08 2001-08-17 Aipakku:Kk 電話受信選択方法及び装置
JP2002094612A (ja) * 2000-09-14 2002-03-29 Nec Corp 携帯電話機
JP2005184618A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Ind Co Ltd 音声認証装置、音声認証システム及び音声認証方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014048534A (ja) * 2012-08-31 2014-03-17 Sogo Keibi Hosho Co Ltd 話者認識装置、話者認識方法及び話者認識プログラム

Also Published As

Publication number Publication date
US20070147592A1 (en) 2007-06-28
JP2005341383A (ja) 2005-12-08
CN1806424A (zh) 2006-07-19
JP4157077B2 (ja) 2008-09-24

Similar Documents

Publication Publication Date Title
WO2005117398A1 (ja) 電話機およびプログラム
US7289796B2 (en) Mobile communications terminal device and method for identifying incoming call for use with the same
US8224397B2 (en) Wireless headset with voice announcement
JP4349590B2 (ja) 電話機およびプログラム
JP7349281B2 (ja) 制御装置および制御装置の制御方法
KR20070018189A (ko) 이동통신단말기에서 수신제한장치 및 방법
WO2006042042A1 (en) Silent accept for incoming telephone calls
JPH0918550A (ja) 呼出音可変移動通信用端末機器
KR100622896B1 (ko) 선택적 음성인식 기능을 갖는 이동통신 단말기 및 그 방법
JPS60206254A (ja) 電話装置
JP7339804B2 (ja) 制御装置、通信機器および制御装置の制御方法
JP3226888B2 (ja) 呼出音設定方法および呼出音設定システム
JP2006013672A (ja) 電話機
JP3663823B2 (ja) コードレス電話機
JPH11341567A (ja) 携帯電話端末
JP2004200985A (ja) 通話音声のテキスト変換システム
JP4222742B2 (ja) 移動体無線端末
KR100469688B1 (ko) 이동통신 단말기의 착신 벨소리 설정방법
KR100732962B1 (ko) 발신자정보를 이용한 음성벨 출력 방법
JPH11331367A (ja) 携帯通信装置およびその利用者識別方法
KR100594004B1 (ko) 이동 통신 단말기의 음성 변조 장치 및 방법
JP2004194008A (ja) 電話機
KR101166189B1 (ko) 음성 데이터를 이용한 알람 기능이 구비된 이동통신 단말기및 그 동작방법
KR100689464B1 (ko) 벨소리 제어 장치 및 방법
JP2000112491A (ja) 文字類似度判定装置およびその方法並びに音声認識装置およびその方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200580000533.9

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Ref document number: DE

WWE Wipo information: entry into national phase

Ref document number: 2007147592

Country of ref document: US

Ref document number: 10555294

Country of ref document: US

122 Ep: pct application non-entry in european phase
WWP Wipo information: published in national office

Ref document number: 10555294

Country of ref document: US