JP2009239806A - Portable terminal unit, voice input method of portable terminal unit and voice input program - Google Patents

Portable terminal unit, voice input method of portable terminal unit and voice input program Download PDF

Info

Publication number
JP2009239806A
JP2009239806A JP2008085664A JP2008085664A JP2009239806A JP 2009239806 A JP2009239806 A JP 2009239806A JP 2008085664 A JP2008085664 A JP 2008085664A JP 2008085664 A JP2008085664 A JP 2008085664A JP 2009239806 A JP2009239806 A JP 2009239806A
Authority
JP
Japan
Prior art keywords
application
portable terminal
microphone
microphones
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008085664A
Other languages
Japanese (ja)
Inventor
Eiji Utsunomiya
栄二 宇都宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2008085664A priority Critical patent/JP2009239806A/en
Publication of JP2009239806A publication Critical patent/JP2009239806A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a portable terminal unit for inputting voice in an optimal state from an objective sound source. <P>SOLUTION: M pieces (M is an integer of 2 or more) of microphones 11a-11f are arranged in a different position in a portable terminal 1, and a voice signal from a plurality of these microphones 11a-11f is inputted to an acoustic processing part 36 via a microphone input part 61 and a microphone switching part 62. The microphone switching part 62 selects and switches N channels (M≥N) from M pieces of voice inputs in response to the setting function application and the acoustic processing application. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、通常の音声通話の他、カメラを利用したビデオ撮影、画面を見ながらのブラウジングトーク等が行える携帯端末装置、携帯端末の音声入力方法、音声入力プログラムに関する。   The present invention relates to a mobile terminal device capable of performing video shooting using a camera, browsing talk while watching a screen, etc., a voice input method of a mobile terminal, and a voice input program in addition to a normal voice call.

近年の携帯端末は多機能化が図れられており、通常の音声通話の他、カメラを利用したビデオ撮影、テレビ電話のような画面を見ながらのブラウジングトーク等が行えるものが登場してきている。通常の音声通話だけを行う従来の携帯端末では、専ら携帯端末をハンドセットと同様に扱われるため、例えば特許文献1に示すように、音声入力は、携帯端末の下部に配設された1つのマイクロホンに限られている。しかしながら、このような多機能化が図れられた携帯端末では、携帯端末の下部のマイクロホンが音声入力として常に最適であるとは限らない。   In recent years, mobile terminals have been multi-functionalized, and in addition to normal voice calls, video cameras using cameras, browsing conversations while watching a screen like a videophone, etc. have appeared. In a conventional portable terminal that performs only a normal voice call, the portable terminal is handled in the same way as a handset. Therefore, for example, as shown in Patent Document 1, a voice input is performed by a single microphone disposed at a lower portion of the portable terminal. It is limited to. However, in a portable terminal with such multi-functionality, the microphone at the bottom of the portable terminal is not always optimal for voice input.

例えば、ビデオ撮影では、携帯端末の反対側に配置されたカメラを被写体に向けて撮影を行っており、携帯端末の下部のマイクロホンでは、被写体の音源方向にマイクロホンを向けることができない。このため、携帯端末の機能や音源の位置に応じて、最適な状態で音声入力を行えるようにしたものが要望されている。   For example, in video shooting, shooting is performed with a camera disposed on the opposite side of the mobile terminal facing the subject, and the microphone at the bottom of the mobile terminal cannot point the microphone toward the sound source of the subject. For this reason, there is a demand for a device that allows voice input in an optimum state according to the function of the mobile terminal and the position of the sound source.

なお、録音装置においては、例えば、特許文献2に記載されているように、指向性の特性の異なる2つのマイクロホンを設け、特定の方向からの音源と全体の方向からの音源とに応じて、2つのマイクロホンを使い分けることが記載されている。しかしながら、特許文献に記載されているものは、録音機において、録音モードに応じて2つのマイクロホンを切り替えるものであり、携帯端末での使用を考慮されたものではない。
特開2007−134759号公報 特開平11−243597号公報
In the recording device, for example, as described in Patent Document 2, two microphones having different directivity characteristics are provided, and according to a sound source from a specific direction and a sound source from the entire direction, It is described that two microphones are used properly. However, what is described in Patent Document 2 switches two microphones in accordance with a recording mode in a recording device, and is not intended for use with a portable terminal.
JP 2007-134759 A Japanese Patent Laid-Open No. 11-243597

上述のように、通常の音声通話の他、カメラを利用したビデオ撮影、ブラウジングトーク等が行える携帯端末では、携帯端末の下部の1つのマイクロホンだけでは、満足な音声入力を行えない。このため、複数のマイクロホンを用意し、携帯端末の機能や音源の位置に応じて、最適な状態で音声入力を行えるようにすることが要望される。   As described above, in a portable terminal capable of performing video shooting using a camera, browsing talk, etc. in addition to a normal voice call, satisfactory voice input cannot be performed with only one microphone at the bottom of the portable terminal. For this reason, it is desired to prepare a plurality of microphones so that voice input can be performed in an optimum state according to the function of the mobile terminal and the position of the sound source.

そこで、本発明は、上述の課題を鑑みてなされたものであり、目的とする音源から最適な状態で音声入力を行えるようにした携帯端末装置、携帯端末の音声入力方法、音声入力プログラムを提供することを目的とする。   Accordingly, the present invention has been made in view of the above-described problems, and provides a portable terminal device, a portable terminal voice input method, and a voice input program capable of performing voice input in an optimal state from a target sound source. The purpose is to do.

本発明は、上述の課題を鑑みて、以下の事項を提案している。   The present invention proposes the following items in view of the above-described problems.

(1)本発明は、異なる位置に配置されたM個(Mは2以上の整数)のマイクロホンと、設定機能アプリケーションに応じて、M個のマイクロホンの中からNチャネル(Nは整数、M≧N)の音声入力を選択して切り替えるマイクロホン切替部とを備えたことを特徴とする携帯端末装置を提案している。   (1) The present invention relates to M microphones (M is an integer of 2 or more) arranged at different positions, and N channels (N is an integer, M ≧) from among M microphones according to the setting function application. N) has proposed a portable terminal device comprising a microphone switching unit that selects and switches a voice input.

本発明によれば、異なる位置に配置されたM個のマイクロホンの中から、携帯端末の機能や音源の位置に応じたマイクロホンを選択して切り替えることで、最適な状態で音声入力を行える。   According to the present invention, voice input can be performed in an optimal state by selecting and switching a microphone corresponding to the function of the mobile terminal and the position of the sound source from among the M microphones arranged at different positions.

(2)本発明は、(1)の携帯端末装置において、設定機能アプリケーションが音声通話のアプリケーションの場合には、通常の音声通話で雑音抑圧アプリケーションにより周辺雑音の除去を行い、ユーザの口元に来るマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とすることを特徴とする携帯端末装置を提案している。   (2) According to the present invention, in the mobile terminal device of (1), when the setting function application is a voice call application, ambient noise is removed by a noise suppression application in a normal voice call and comes to the user's mouth. A portable terminal device has been proposed in which a microphone is used for collecting sound and another microphone is used for collecting ambient noise.

本発明によれば、設定機能アプリケーションが音声通話のアプリケーションの場合には、異なる位置に配置されたM個のマイクロホンの中から、ユーザの口元に来るマイクロホンを音声の集音用として選択することで、最適な状態で音声入力を行える。   According to the present invention, when the setting function application is a voice call application, a microphone that comes to the user's mouth is selected from among M microphones arranged at different positions for collecting sound. Voice input can be performed in an optimal state.

(3)本発明は、(1)の携帯端末装置において、設定機能アプリケーションがビデオ撮影のアプリケーションの場合には、音源分離アプリケーションにより、どの位置のマイクロホンが主音となるかを判定し、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とすることを特徴とする携帯端末装置を提案している。   (3) According to the present invention, in the mobile terminal device of (1), when the setting function application is a video shooting application, it is determined by the sound source separation application which position the microphone is the main sound, and is determined as the main sound. There has been proposed a portable terminal device characterized in that the collected microphone is used for collecting sound and the other microphone is used for collecting ambient noise.

本発明によれば、設定機能アプリケーションがビデオ撮影の場合には、異なる位置に配置されたM個のマイクロホンの中から、音源分離アプリケーションにより、主音と判定されたマイクロホンを音声の集音用として選択することで、最適な状態で音声入力を行える。   According to the present invention, when the setting function application is video shooting, a microphone that is determined as a main sound by the sound source separation application is selected from among M microphones arranged at different positions for collecting sound. By doing so, voice input can be performed in an optimal state.

(4)本発明は、(1)の携帯端末装置において、設定機能アプリケーションがブラウジングトークのアプリケーションの場合には、音源分離アプリケーションにより、どの位置のマイクロホンが主音となるかを判定し、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とし、さらに、集音用としたマイクロホンに対して、エコー抑圧アプリケーションによりエコーを除去することを特徴とする携帯端末装置を提案している。   (4) According to the present invention, in the mobile terminal device of (1), when the setting function application is a browsing talk application, it is determined by the sound source separation application which position the microphone is the main sound, and is determined as the main sound. A portable terminal characterized in that the collected microphone is used for collecting sound, the other microphone is used for collecting ambient noise, and echoes are removed from the microphone used for collecting sound by an echo suppression application. A device is proposed.

本発明によれば、設定機能アプリケーションがブラジングトークの場合には、異なる位置に配置されたM個のマイクロホンの中から、音源分離アプリケーションにより、主音と判定されたマイクロホンを音声の集音用として選択することで、最適な状態で音声入力を行える。   According to the present invention, when the setting function application is browsing talk, a microphone determined as a main sound by the sound source separation application from among M microphones arranged at different positions is used for collecting sound. By selecting, voice input can be performed in an optimal state.

(5)本発明は、異なる位置にM個(Mは2以上の整数)のマイクロホンを配置し、設定機能アプリケーション及び音響処理アプリケーションに応じて、M個のマイクロホンからNチャネル(M≧N)の音声入力を切り替えることを特徴とする携帯端末の音声入力方法を提案している。   (5) In the present invention, M microphones (M is an integer of 2 or more) are arranged at different positions, and N channels (M ≧ N) are selected from the M microphones according to the setting function application and the sound processing application. A voice input method of a portable terminal characterized by switching voice input has been proposed.

本発明によれば、異なる位置に配置されたM個のマイクロホンの中から、携帯端末の機能や音源の位置に応じたマイクロホンを選択して切り替えることで、最適な状態で音声入力を行える。   According to the present invention, voice input can be performed in an optimal state by selecting and switching a microphone corresponding to the function of the mobile terminal and the position of the sound source from among the M microphones arranged at different positions.

(6)本発明は、異なる位置にM個(Mは2以上の整数)のマイクロホンを配置し、設定機能アプリケーションに応じて、前記M個のマイクロホンからNチャネル(M≧N)の音声入力を切り替える携帯端末の音声入力方法をコンピュータに実行させるための携帯端末の音声入力プログラムであって、設定機能アプリケーションを判定するステップと、前記設定機能アプリケーションに応じて、音響処理アプリケーションを設定するステップと、前記設定機能アプリケーション及び前記音響処理アプリケーションに応じて、前記M個のマイクロホンからの音声入力を切り替えるステップと、をコンピュータに実行させるための携帯端末の音声入力プログラムを提案している。   (6) In the present invention, M microphones (M is an integer of 2 or more) are arranged at different positions, and N channels (M ≧ N) are input from the M microphones according to the setting function application. A voice input program of a portable terminal for causing a computer to execute a voice input method of the portable terminal to be switched, and a step of determining a setting function application; a step of setting an acoustic processing application according to the setting function application; According to the setting function application and the sound processing application, a voice input program of a portable terminal is proposed for causing a computer to execute a step of switching voice input from the M microphones.

本発明によれば、異なる位置に配置されたM個のマイクロホンの中から、携帯端末の機能や音源の位置に応じたマイクロホンを選択して切り替えることで、最適な状態で音声入力を行える。   According to the present invention, voice input can be performed in an optimal state by selecting and switching a microphone corresponding to the function of the mobile terminal and the position of the sound source from among the M microphones arranged at different positions.

本発明によれば、異なる位置にM個(Mは2以上の整数)のマイクロホンが配置されており、この複数のマイクロホンからの音声信号は、設定機能アプリケーションに応じて、選択して切り替えられる。これにより、各設定アプリケーション毎に、目的とする音源から最適な状態で音声入力を行える。   According to the present invention, M microphones (M is an integer of 2 or more) are arranged at different positions, and audio signals from the plurality of microphones are selected and switched according to the setting function application. Thereby, voice input can be performed in an optimum state from the target sound source for each setting application.

以下、本発明の実施の形態について図面を参照しながら説明する。なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. Note that the constituent elements in the present embodiment can be appropriately replaced with existing constituent elements and the like, and various variations including combinations with other existing constituent elements are possible. Therefore, the description of the present embodiment does not limit the contents of the invention described in the claims.

図1は、本発明が適用できる携帯端末1の外観構成を示すものである。この例では、携帯端末1は折り畳み自在の構造となっており、図1(A)は、携帯端末1の内側となる部分(キーパッド面)の各部の配置を示し、図1(B)は、外側となる各部(バッテリー面)の配置を示すものである。   FIG. 1 shows an external configuration of a mobile terminal 1 to which the present invention can be applied. In this example, the portable terminal 1 has a foldable structure. FIG. 1A shows the arrangement of each part (keypad surface) on the inner side of the portable terminal 1, and FIG. The arrangement of each part (battery surface) on the outside is shown.

図1(A)に示すように、携帯端末1の内側には、3つのマイクロホン11a〜11cが配置される。携帯端末1の内側となる部分の上端には、レシーバ12が配置される。   As shown in FIG. 1A, three microphones 11a to 11c are arranged inside the mobile terminal 1. A receiver 12 is disposed at the upper end of the portion that is inside the mobile terminal 1.

また、携帯端末1の内側となる部分の上方には、液晶ディスプレイ13が配置される。液晶ディスプレイ13には、各種の文字や画像が表示される。すなわち、電話利用時には、液晶ディスプレイ13に、着信や送信の電話番号や住所録が表示される。   In addition, a liquid crystal display 13 is disposed above a portion that is inside the mobile terminal 1. Various characters and images are displayed on the liquid crystal display 13. That is, when using the telephone, the incoming and outgoing telephone numbers and address book are displayed on the liquid crystal display 13.

また、インターネットを利用時には、液晶ディスプレイ13に、インターネットのウェブ画面や、送受信メールが表示される。また、カメラ撮影時には、液晶ディスプレイ13がビューファインダとして用いられる他、撮影したカメラ画像が液晶ディスプレイ13に表示される。   Further, when using the Internet, an Internet web screen and transmitted / received mail are displayed on the liquid crystal display 13. At the time of camera photographing, the liquid crystal display 13 is used as a viewfinder, and the photographed camera image is displayed on the liquid crystal display 13.

携帯端末1の内側となる部分の下方には、テンキー(*キーや#キーを含む)14、カーソルキー15、決定キー16、発着信キー17a、17b等が配置される。テンキー14は、電話番号の入力、メールや電話帳作成時の文字入力等に用いられる。カーソルキー15は、液晶ディスプレイ13に表示されるカーソルを移動させて、各種の選択入力等を行うのに用いられる。決定キー16は、選択実行を行うのに用いられる。発着信キー17a、17は、電話回線での発着信を行うのに用いられる。また、スピーカ19は、ブラウジングトーク利用時に通話の相手の音声を再生するのに用いられる。   A numeric keypad (including * key and # key) 14, a cursor key 15, an enter key 16, and outgoing / incoming keys 17 a and 17 b, etc. are arranged below the portion inside the mobile terminal 1. The numeric keypad 14 is used for inputting a telephone number, inputting characters when creating a mail or a telephone directory, and the like. The cursor key 15 is used to move the cursor displayed on the liquid crystal display 13 and perform various selection inputs. The decision key 16 is used for performing selection. The outgoing / incoming keys 17a, 17 are used for making outgoing / incoming calls on a telephone line. The speaker 19 is used for reproducing the voice of the other party when using the browsing talk.

携帯端末1の外側には、図2(B)に示すように、3つのマイクロホン11d〜11fと、カメラ部18とが配置される。カメラ部18は、静止画やビデオ撮影に利用される。   As shown in FIG. 2B, three microphones 11 d to 11 f and a camera unit 18 are arranged outside the mobile terminal 1. The camera unit 18 is used for still images and video shooting.

図2は、本発明が適用できる携帯端末1の主要部の内部構成を示すものである。図2において、主制御部21は、CPU(Central
Processing Unit)等からなり、携帯端末の全体の動作の制御を行っている。
FIG. 2 shows an internal configuration of a main part of the mobile terminal 1 to which the present invention can be applied. In FIG. 2, the main control unit 21 is a CPU (Central
The operation of the mobile terminal is controlled.

プロラムメモリ22には、ブートプログラム、基本プログラム、音声通話アプリケーション、ビデオ撮影アプリケーション、ブラウジングトークアプリケーション等各種のアプリケーションプログラムが保存されている。   The program memory 22 stores various application programs such as a boot program, a basic program, a voice call application, a video shooting application, and a browsing talk application.

メモリ23には、各種のプリセットデータ、電話帳データ、メールのデータ、電話履歴、位置履歴、行動履歴、写真情報等、各種のデータが記憶される。   The memory 23 stores various data such as various preset data, telephone directory data, mail data, telephone history, position history, action history, and photo information.

大容量メモリ24は、フラッシュメモリ等からなり、GPSナビゲーションに使う地図情報等や動画情報等が記憶される。   The large-capacity memory 24 is composed of a flash memory or the like, and stores map information and moving image information used for GPS navigation.

操作部27は、ユーザからの入力操作が行われる。操作部27には、テンキー14や、カーソルキー15、決定キー16、発着信キー17a、17b等が含まれる。   The operation unit 27 performs an input operation from the user. The operation unit 27 includes a numeric keypad 14, a cursor key 15, an enter key 16, outgoing / incoming keys 17a, 17b, and the like.

近距離通信部28は、他の周辺機器との無線で接続してデータの送受信を行うものである。通信方式としては、例えば、Bluetooth(登録商標)が用いられる。   The short-range communication unit 28 is connected to other peripheral devices wirelessly to transmit / receive data. As a communication method, for example, Bluetooth (registered trademark) is used.

表示部29は、液晶ディスプレイ13(図1参照)からなり、表示部29は、各種の文字や画像の表示に用いられる。表示処理部30は、表示部29の表示制御を行っている。   The display unit 29 includes the liquid crystal display 13 (see FIG. 1), and the display unit 29 is used for displaying various characters and images. The display processing unit 30 performs display control of the display unit 29.

音響処理部36は、入力音声信号や出力音声信号の処理を行っている。音響処理部36に対して、複数のマイクロホン11a〜11f、レシーバ12及びスピーカ19が設けられる。音響処理部36は、例えば、DSP(Digital
Signal Processor)から構成されており、音響処理アプリケーションとして、雑音抑圧アプリケーションと、音源分離アプリケーションと、エコー抑圧アプリケーションと、エコライザアプリケーション等が実現できる。
The acoustic processing unit 36 performs processing of input audio signals and output audio signals. A plurality of microphones 11 a to 11 f, a receiver 12, and a speaker 19 are provided for the acoustic processing unit 36. The sound processing unit 36 is, for example, a DSP (Digital
Signal processor), and as a sound processing application, a noise suppression application, a sound source separation application, an echo suppression application, an equalizer application, and the like can be realized.

雑音抑圧アプリケーションは、周辺雑音の抑圧と除去を行うためのアプリケーションである。音源分離アプリケーションは、目的音の方向特定とその収録を行うためのアプリケーションである。エコー抑圧アプリケーションは、通話に支障を与えるエコーを抑圧するためのアプリケーションである。エコライザアプリケーションは、音声や声質等を調整するためのアプリケーションである。   The noise suppression application is an application for suppressing and removing ambient noise. The sound source separation application is an application for specifying the direction of the target sound and recording the target sound. The echo suppression application is an application for suppressing an echo that interferes with a call. The equalizer application is an application for adjusting voice and voice quality.

無線部33は、基地局との間で、電波の送受信を行うものである。通信方式としては、どのような通信方式を用いても良い。通信制御部34は、基地局との間で通信する信号の制御を行っている。   The radio unit 33 transmits and receives radio waves to and from the base station. Any communication method may be used as the communication method. The communication control unit 34 controls signals communicated with the base station.

カメラ部18は、カメラ撮影を行うものである。カメラ部18には、レンズ等の光学系37と、CCD(Charge
Coupled Device)等のイメージセンサからなる撮像部38とが含まれる。カメラ部18に対して、イメージセンサの撮像信号を処理する映像信号処理部39が設けられる。
The camera unit 18 performs camera shooting. The camera unit 18 includes an optical system 37 such as a lens and a CCD (Charge).
And an imaging unit 38 formed of an image sensor such as Coupled Device). For the camera unit 18, a video signal processing unit 39 for processing an image signal of the image sensor is provided.

GPS機能部41は、複数の衛星からの電波を受信して、現在地を即位するものである。RFIDリーダ42は、電子マネー等を利用する場合に、近距離通信を行うものである。   The GPS function unit 41 receives radio waves from a plurality of satellites and coordinates the current location. The RFID reader 42 performs near field communication when using electronic money or the like.

上述のように、本発明の実施形態の携帯端末では、カメラ部18が設けられており、通常の音声通話の他、カメラを利用したビデオ撮影、画面を見ながらのブラウジングトークを行うことができる。   As described above, in the mobile terminal according to the embodiment of the present invention, the camera unit 18 is provided, and in addition to a normal voice call, video shooting using the camera and browsing talk while watching the screen can be performed. .

また、本発明の実施形態の携帯端末では、その内側にマイクロホン11a〜11cが配設され、その外側にマイクロホン11d〜11fが配設されている。これら複数のマイクロホン11a〜11fは、携帯端末の設定機能アプリケーションに応じて、どのマイクロホンを使うのかが切り替えられる。   In the portable terminal according to the embodiment of the present invention, the microphones 11a to 11c are arranged on the inner side, and the microphones 11d to 11f are arranged on the outer side. The plurality of microphones 11a to 11f can be switched which microphone is used according to the setting function application of the portable terminal.

つまり、図3は、本発明の実施形態の機能ブロック図を示すものである。図3に示すように、携帯端末1には、異なる位置にM個(Mは2以上の整数であり、ここでは6個)のマイクロホン11a〜11fが配設されており、この複数のマイクロホン11a〜11fからの音声信号は、マイクロホン入力部61、マイクロホン切替部62を介して、音響処理部36に入力される。マイクロホン切替部62は、設定機能アプリケーション及び音響処理アプリケーションに応じて、M個の音声入力からNチャネル(M≧N)を選択して切り替える。   That is, FIG. 3 shows a functional block diagram of the embodiment of the present invention. As shown in FIG. 3, the mobile terminal 1 is provided with M microphones 11a to 11f (M is an integer equal to or greater than 2, here 6) at different positions, and the plurality of microphones 11a. To 11f are input to the acoustic processing unit 36 via the microphone input unit 61 and the microphone switching unit 62. The microphone switching unit 62 selects and switches N channels (M ≧ N) from M audio inputs in accordance with the setting function application and the sound processing application.

音響処理部36は、音響アプリケーションとして、雑音抑圧アプリケーションA1と、音源分離アプリケーションA2と、エコー抑圧アプリケーションA3と、エコライザアプリケーションA4等が実現できる。   The acoustic processing unit 36 can realize a noise suppression application A1, a sound source separation application A2, an echo suppression application A3, an equalizer application A4, and the like as acoustic applications.

主制御部21は、通常の音声通話アプリケーションB1の他、カメラ部18を利用したビデオ撮影のアプリケーションB2、画面を見ながらのブラウジングトークのアプリケーションB3等の設定機能アプリケーションが行うことができる。   In addition to the normal voice call application B1, the main control unit 21 can perform setting function applications such as a video shooting application B2 using the camera unit 18 and a browsing talk application B3 while viewing the screen.

主制御部21により設定機能アプリケーションが設定されると、これに応じて、音響処理部36に対する音響条件が指定され、音響処理部36で行う音響処理アプリケーションが設定され、マイクロホン入力部61及びマイクロホン切替部62が制御される。   When the setting function application is set by the main control unit 21, the acoustic conditions for the acoustic processing unit 36 are designated in accordance with this, the acoustic processing application performed by the acoustic processing unit 36 is set, and the microphone input unit 61 and the microphone switching are set. The unit 62 is controlled.

例えば、設定機能アプリケーションが通常の音声通話のアプリケーションB1の場合には、通話している利用者の音声を鮮明に収録でき、利用者以外の音声や周辺雑音を除去することが望まれる。そのためには、音響アプリケーションを雑音抑圧アプリケーションA1として周辺雑音の除去を行うことが有効である。そこで、通常の音声通話で雑音抑圧アプリケーションにより周辺雑音の除去を行う場合には、ユーザの口元に来るマイクロホン11aを音声の集音用とし、他のマイクロホン(1又は複数)を周辺ノイズの集音用とする。   For example, when the setting function application is a normal voice call application B1, it is desirable to be able to clearly record the voice of the user who is calling and to remove the voice other than the user and the ambient noise. For this purpose, it is effective to remove the ambient noise using the acoustic application as the noise suppression application A1. Therefore, when the ambient noise is removed by a noise suppression application in a normal voice call, the microphone 11a at the user's mouth is used for voice collection, and the other microphone (s) are collected for ambient noise. For use.

設定機能アプリケーションがカメラを利用したビデオ撮影のアプリケーションB2の場合には、ビデオ撮影の被写体の音声を鮮明に収録できることが望まれる。そのためには、雑音抑圧アプリケーションA1を使って、周辺雑音の除去を行うことが有効である。また、音源分離アプリケーションA2により、目的音の方向を特定し、カメラ方向に搭載されている複数のマイクロホンのうち目的とする方向に向けられたマイクロホンを収録に利用することが望まれる。   In the case where the setting function application is a video shooting application B2 using a camera, it is desired that the sound of the video shooting subject can be clearly recorded. For this purpose, it is effective to remove the ambient noise using the noise suppression application A1. In addition, it is desired that the direction of the target sound is specified by the sound source separation application A2, and a microphone directed in the target direction among a plurality of microphones mounted in the camera direction is used for recording.

そこで、ビデオ撮影では、音源分離アプリケーションA2により、どの位置のマイクロホンが主音となるかを判定する。そして、雑音抑圧アプリケーションA1で周辺雑音の除去を行う場合には、マイクロホン11a〜11fのうち、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホン(1又は複数)を周辺ノイズの集音用とする。   Therefore, in video shooting, the sound source separation application A2 determines which position of the microphone is the main sound. When the noise suppression application A1 removes ambient noise, among the microphones 11a to 11f, the microphone determined to be the main sound is used for sound collection, and the other microphone (one or more) is used as ambient noise. For sound collection.

設定機能アプリケーションがブラウジングトークのアプリケーションB3の場合には、通話している利用者の音声を鮮明に収録できることが望まれる。そのためには、雑音抑圧アプリケーションA1で周辺雑音の除去を行うことが有効である。また、ブラウジングトークのアプリケーションB3の場合には、携帯端末1のスピーカ19から出力される通話相手の音声が回り込んで通話機能に影響を及ぼさないことが望まれる。   When the setting function application is the browsing talk application B3, it is desirable that the voice of the user who is making a call can be clearly recorded. For this purpose, it is effective to remove ambient noise with the noise suppression application A1. In the case of the browsing talk application B3, it is desirable that the voice of the other party of the call output from the speaker 19 of the mobile terminal 1 does not affect the call function.

そのためには、エコー抑圧アプリケーションA3が有効である。また、音源分離アプリケーションA2により、目的音の方向特定し、カメラ方向に搭載されている複数のマイクロホンのうち目的とする方向に向けられたものを集音用にすることが望まれる。そこで、ブラウジングトークのアプリケーションB3では、音源分離アプリケーションA2により、どの位置のマイクロホンが主音となるかを判定する。   For this purpose, the echo suppression application A3 is effective. In addition, it is desired that the direction of the target sound is specified by the sound source separation application A2, and a microphone directed in the target direction among a plurality of microphones mounted in the camera direction is used for collecting sound. Therefore, in the browsing talk application B3, the sound source separation application A2 determines which position of the microphone is the main sound.

そして、雑音抑圧アプリケーションA1で周辺雑音の除去を行う場合には、マイクロホン11a〜11fのうち、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホン(1又は複数)を周辺ノイズの集音用とする。そして、集音用としたマイクロホンに対して、エコー抑圧アプリケーションA3を用いる。   When the noise suppression application A1 removes ambient noise, among the microphones 11a to 11f, the microphone determined to be the main sound is used for sound collection, and the other microphone (one or more) is used as ambient noise. For sound collection. Then, the echo suppression application A3 is used for the microphone used for sound collection.

図4は、本発明の実施形態の処理を示すフローチャートである。
図4において、主制御部21は、設定機能アプリケーションが通常の音声通話のアプリケーションB1かどうかを判断し(ステップS1)、設定機能アプリケーションが通常の音声通話のアプリケーションB1なら、主制御部21は音響処理部36の音響アプリケーションを雑音抑圧アプリケーションA1に設定し(ステップS2)、ユーザの口元に来るマイクロホン11aを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とする(ステップS3)。
FIG. 4 is a flowchart showing processing of the embodiment of the present invention.
In FIG. 4, the main control unit 21 determines whether the setting function application is a normal voice call application B1 (step S1). If the setting function application is a normal voice call application B1, the main control unit 21 performs acoustic The acoustic application of the processing unit 36 is set to the noise suppression application A1 (step S2), the microphone 11a coming to the user's mouth is used for collecting sound, and the other microphones are used for collecting ambient noise (step S3). .

設定機能アプリケーションが音声通話ではない場合には、主制御部21は、設定機能アプリケーションがビデオ撮影のアプリケーションB2かどうかを判断する(ステップS4)。設定機能アプリケーションがビデオ撮影のアプリケーションB2なら、主制御部21は音響処理部36の音響アプリケーションを音源分離アプリケーションA2に設定し、どの位置に主音となる音源があるかを判定する(ステップS5)。   When the setting function application is not a voice call, the main control unit 21 determines whether or not the setting function application is a video shooting application B2 (step S4). If the setting function application is the video shooting application B2, the main control unit 21 sets the sound application of the sound processing unit 36 to the sound source separation application A2, and determines at which position the sound source that is the main sound is present (step S5).

そして、音響処理部36の音響アプリケーションを雑音抑圧アプリケーションA1に設定し(ステップS6)、マイクロホン11a〜11fのうち、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とする(ステップS7)。   Then, the acoustic application of the acoustic processing unit 36 is set to the noise suppression application A1 (step S6), and among the microphones 11a to 11f, the microphone determined to be the main sound is used for collecting sound, and the other microphones are used for ambient noise. The sound is collected (step S7).

設定機能アプリケーションがビデオ撮影でない場合には、主制御部21は、設定機能アプリケーションがブラウジングトークのアプリケーションB3かどうかを判断する(ステップS8)。設定機能アプリケーションがブラウジングトークのアプリケーションB3なら、主制御部21は音響処理部36の音響アプリケーションを音源分離アプリケーションA2に設定し(ステップS9)、どの位置に主音となる音源があるかを判定する。   When the setting function application is not video shooting, the main control unit 21 determines whether the setting function application is the browsing talk application B3 (step S8). If the setting function application is the browsing talk application B3, the main control unit 21 sets the sound application of the sound processing unit 36 to the sound source separation application A2 (step S9), and determines in which position the sound source that is the main sound is present.

そして、音響処理部36の音響アプリケーションを雑音抑圧アプリケーションA1に設定し(ステップS10)、マイクロホン11a〜11fのうち、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とし(ステップS11)、さらに、音響処理部36の音響アプリケーションとしてエコー抑圧アプリケーションA3を動作させ(ステップS12)、エコー抑圧処理を行う。   Then, the acoustic application of the acoustic processing unit 36 is set to the noise suppression application A1 (step S10), and among the microphones 11a to 11f, the microphone determined to be the main sound is used for collecting sound, and the other microphones are used for ambient noise. For the sound collection (step S11), the echo suppression application A3 is operated as the sound application of the sound processing unit 36 (step S12), and the echo suppression process is performed.

なお、上述の例では、折り畳み型の携帯端末の内側に3つのマイクロホン11a〜11cを配置し、携帯端末1の外側には、3つのマイクロホン11d〜11fを配置したが、本発明は、2つ以上のマイクロホンをどのように配置しても良い。   In the above-described example, the three microphones 11a to 11c are arranged inside the folding portable terminal, and the three microphones 11d to 11f are arranged outside the portable terminal 1. However, in the present invention, two microphones are used. The above microphones may be arranged in any way.

図5は、折り畳み型の携帯端末でのマイクロホン11の配置例である。図6はスライド型の携帯端末でのマイクロホン11の配置例である。図7はストレート型の携帯端末でのマイクロホン11の配置例である。その他、各種のマイクロホンの配置が考えられる。   FIG. 5 is an arrangement example of the microphones 11 in a foldable portable terminal. FIG. 6 shows an arrangement example of the microphones 11 in a slide type mobile terminal. FIG. 7 shows an arrangement example of the microphone 11 in a straight type portable terminal. In addition, various microphone arrangements are possible.

以上説明したように、本発明の実施形態では、異なる位置に複数のマイクロホンを配置し、設定機能アプリケーションに応じて、複数のマイクロホンからの音声入力を切り替えるようにしている。これにより、目的とする音源から最適な状態で、音声入力を行うことができる。   As described above, in the embodiment of the present invention, a plurality of microphones are arranged at different positions, and the sound input from the plurality of microphones is switched according to the setting function application. Thereby, voice input can be performed in an optimal state from the target sound source.

本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications can be made without departing from the gist of the present invention.

なお、ソースとなるアプリケーションプログラムや音響処理アプリケーションプログラムは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体等のコンピュータ読み取り可能な記録媒体で提供される。また、ソースとなるプログラムは、コンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されても良い。   The source application program and the sound processing application program are provided on a computer-readable recording medium such as a portable medium such as a flexible disk, a magneto-optical disk, a ROM, or a CD-ROM. The source program may be transmitted from a computer system to another computer system via a transmission medium or by a transmission wave in the transmission medium.

ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、ソースとなるプログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The source program may be a program for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

本発明の実施形態の携帯端末の外観構成の説明に用いる正面図及び背面図である。It is the front view and back view used for description of the external appearance structure of the portable terminal of embodiment of this invention. 本発明の実施形態の携帯端末の内部構成の説明に用いるブロック図である。It is a block diagram used for description of the internal structure of the portable terminal of the embodiment of the present invention. 本発明の実施形態の携帯端末の音声入力の説明に用いる機能ブロック図である。It is a functional block diagram used for description of the voice input of the portable terminal of the embodiment of the present invention. 本発明の実施形態の携帯端末の音声入力の説明に用いるフローチャートである。It is a flowchart used for description of the voice input of the portable terminal of embodiment of this invention. 本発明の実施形態の携帯端末におけるマイクロホンの配置の説明図である。It is explanatory drawing of arrangement | positioning of the microphone in the portable terminal of embodiment of this invention. 本発明の実施形態の携帯端末におけるマイクロホンの配置の説明図である。It is explanatory drawing of arrangement | positioning of the microphone in the portable terminal of embodiment of this invention. 本発明の実施形態の携帯端末におけるマイクロホンの配置の説明図である。It is explanatory drawing of arrangement | positioning of the microphone in the portable terminal of embodiment of this invention.

符号の説明Explanation of symbols

1:携帯端末
11、11a〜11f:マイクロホン
12:レシーバ
18:カメラ部
19:スピーカ
21:主制御部
61:マイクロホン入力部
62:マイクロホン切替部
1: mobile terminal 11, 11a-11f: microphone 12: receiver 18: camera unit 19: speaker 21: main control unit 61: microphone input unit 62: microphone switching unit

Claims (6)

異なる位置に配置されたM個(Mは2以上の整数)のマイクロホンと、
設定機能アプリケーションに応じて、前記M個のマイクロホンの中からNチャネル(M≧N)の音声入力を選択して切り替えるマイクロホン切替部と、
を備えたことを特徴とする携帯端末装置。
M microphones (M is an integer of 2 or more) arranged at different positions;
A microphone switching unit that selects and switches an N-channel (M ≧ N) audio input from the M microphones according to a setting function application;
A portable terminal device comprising:
前記設定機能アプリケーションが音声通話のアプリケーションの場合には、通常の音声通話で雑音抑圧アプリケーションにより周辺雑音の除去を行い、ユーザの口元に来るマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とすることを特徴とする請求項1に記載の携帯端末装置。   When the setting function application is a voice call application, the ambient noise is removed by a noise suppression application in a normal voice call, the microphone that comes to the user's mouth is used for voice collection, and the other microphone is the ambient noise. The portable terminal device according to claim 1, wherein the portable terminal device is used for collecting sound. 前記設定機能アプリケーションがビデオ撮影のアプリケーションの場合には、音源分離アプリケーションにより、どの位置のマイクロホンが主音となるかを判定し、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とすることを特徴とする請求項1に記載の携帯端末装置。   When the setting function application is a video shooting application, it is determined by the sound source separation application which microphone is the main sound, the microphone determined to be the main sound is used for collecting sound, and other microphones are used. The portable terminal device according to claim 1, wherein the portable terminal device is used for collecting ambient noise. 前記設定機能アプリケーションがブラウジングトークのアプリケーションの場合には、音源分離アプリケーションにより、どの位置のマイクロホンが主音となるかを判定し、主音と判断されたマイクロホンを音声の集音用とし、他のマイクロホンを周辺ノイズの集音用とし、さらに、集音用としたマイクロホンに対して、エコー抑圧アプリケーションによりエコーを除去することを特徴とする請求項1に記載の携帯端末装置。   If the setting function application is a browsing talk application, the sound source separation application determines which microphone is the main sound, the microphone determined to be the main sound is used for sound collection, and other microphones are used. 2. The portable terminal device according to claim 1, wherein the microphone is used for collecting ambient noise, and further, echo is removed from the microphone used for collecting sound by an echo suppression application. 異なる位置にM個(Mは2以上の整数)のマイクロホンを配置し、
設定機能アプリケーション及び音響処理アプリケーションに応じて、前記M個のマイクロホンからNチャネル(M≧N)の音声入力を切り替えることを特徴とする携帯端末の音声入力方法。
M microphones (M is an integer of 2 or more) are placed at different positions.
A voice input method of a portable terminal, wherein voice input of N channels (M ≧ N) is switched from the M microphones according to a setting function application and a sound processing application.
異なる位置にM個(Mは2以上の整数)のマイクロホンを配置し、設定機能アプリケーションに応じて、前記M個のマイクロホンからNチャネル(M≧N)の音声入力を切り替える携帯端末の音声入力方法をコンピュータに実行させるための携帯端末の音声入力プログラムであって、
設定機能アプリケーションを判定するステップと、
前記設定機能アプリケーションに応じて、音響処理アプリケーションを設定するステップと、
前記設定機能アプリケーション及び前記音響処理アプリケーションに応じて、前記M個のマイクロホンからの音声入力を切り替えるステップと、
をコンピュータに実行させるための携帯端末の音声入力プログラム。
A voice input method for a portable terminal in which M microphones (M is an integer of 2 or more) are arranged at different positions and N channel (M ≧ N) voice inputs are switched from the M microphones according to a setting function application. A voice input program for a portable terminal for causing a computer to execute
Determining a setting function application;
Setting a sound processing application according to the setting function application;
Switching audio input from the M microphones according to the setting function application and the acoustic processing application;
A voice input program of a portable terminal for causing a computer to execute.
JP2008085664A 2008-03-28 2008-03-28 Portable terminal unit, voice input method of portable terminal unit and voice input program Pending JP2009239806A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008085664A JP2009239806A (en) 2008-03-28 2008-03-28 Portable terminal unit, voice input method of portable terminal unit and voice input program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008085664A JP2009239806A (en) 2008-03-28 2008-03-28 Portable terminal unit, voice input method of portable terminal unit and voice input program

Publications (1)

Publication Number Publication Date
JP2009239806A true JP2009239806A (en) 2009-10-15

Family

ID=41253184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008085664A Pending JP2009239806A (en) 2008-03-28 2008-03-28 Portable terminal unit, voice input method of portable terminal unit and voice input program

Country Status (1)

Country Link
JP (1) JP2009239806A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004201015A (en) * 2002-12-18 2004-07-15 Nec Access Technica Ltd Mobile telephone set with plurality of microphones and voice picking-up method of mobile telephone set
JP2006101457A (en) * 2004-09-30 2006-04-13 Canon Inc Mobile terminal device
JP2008035356A (en) * 2006-07-31 2008-02-14 Ricoh Co Ltd Noise canceler, sound collecting device having noise canceler, and portable telephone having noise canceler

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004201015A (en) * 2002-12-18 2004-07-15 Nec Access Technica Ltd Mobile telephone set with plurality of microphones and voice picking-up method of mobile telephone set
JP2006101457A (en) * 2004-09-30 2006-04-13 Canon Inc Mobile terminal device
JP2008035356A (en) * 2006-07-31 2008-02-14 Ricoh Co Ltd Noise canceler, sound collecting device having noise canceler, and portable telephone having noise canceler

Similar Documents

Publication Publication Date Title
US7450977B2 (en) Mobile communication terminal
US20090047995A1 (en) Portable communication device having a dual camera module with a common image sensor element
JP2004191820A (en) Mobile phone terminal with camera
JP4264170B2 (en) Imaging apparatus and control method thereof
WO2003065692A1 (en) Cellular telephone
KR101460712B1 (en) Mobile communication device and control method thereof
KR101199349B1 (en) Mobile phone having image communication function
JP2004166159A (en) Cellular phone with built-in camera
JP4440079B2 (en) Communication terminal
KR101151607B1 (en) Method and Mobile Communication Terminal for Making Image Call List by Using Captured Image
JP2009239806A (en) Portable terminal unit, voice input method of portable terminal unit and voice input program
KR100557184B1 (en) Method for displaying images in a terminal with a camera and two indications
KR100420681B1 (en) Mobile phone and method for transmitting and compounding image and sound using mobile phone
KR20050042852A (en) Mobile communication terminal display method using touch screen
EP1650933A1 (en) Mobile communication terminal device
JP4336893B2 (en) Mobile communication terminal, communication control method, and communication control program
JP5679277B2 (en) Mobile phone terminal device with camera and display method of mobile terminal device with camera
KR100678027B1 (en) Mobile terminal having camera function and its image processing method
JP2012100135A (en) Portable communication terminal and computer software of the same
JP4222968B2 (en) Mobile phone with digital camera and control method thereof
JP2006101457A (en) Mobile terminal device
CN101185320A (en) Image display system, terminal device, image display method, and program
JP2006157410A (en) Communications terminal and method of controlling communication mode
JP2005318347A (en) Imaging device, and image recording method and program
JP4324733B2 (en) Image transmission apparatus, transmission control method, and transmission control program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120424