JP2006221270A - Multitask system and method of mobile terminal device with voice recognition function - Google Patents
Multitask system and method of mobile terminal device with voice recognition function Download PDFInfo
- Publication number
- JP2006221270A JP2006221270A JP2005032007A JP2005032007A JP2006221270A JP 2006221270 A JP2006221270 A JP 2006221270A JP 2005032007 A JP2005032007 A JP 2005032007A JP 2005032007 A JP2005032007 A JP 2005032007A JP 2006221270 A JP2006221270 A JP 2006221270A
- Authority
- JP
- Japan
- Prior art keywords
- voice command
- voice
- terminal device
- function
- portable terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
Description
本発明は携帯端末装置のマルチタスクシステムに関する。特に、本発明は、操作性を改善する、音声認識機能を備えた携帯端末装置のマルチタスクシステムに関する。 The present invention relates to a multitask system of a mobile terminal device. In particular, the present invention relates to a multitask system for a portable terminal device having a voice recognition function, which improves operability.
携帯電話機、PHS(簡易携帯電話機)、PDA(携帯情報端末)を含む携帯端末装置の多くは、複数の機能、通話、通信手段を有していることは周知である。
複数の機能、通話、通信手段を同時に処理するマルチタスク機能を有していることも周知である。例えば、ユーザがメールを作成しながら局番117の時報を聞くことも可能である。
It is well known that many portable terminal devices including a cellular phone, a PHS (simple cellular phone), and a PDA (personal digital assistant) have a plurality of functions, telephone calls, and communication means.
It is also well known that it has a multitasking function that simultaneously processes a plurality of functions, calls, and communication means. For example, it is also possible for the user to listen to the time signal of the
しかしながら、携帯端末装置では携帯に便利なように小型にしたものが多く、複数の機能、複数の通信手段を同時に処理するマルチタスクを利用したい場合などその操作部、表示部が小さいために、通常のデスクトップ型のコンピュータに使用されるディスプレイ装置、キーボードから入力する場合と比較すると、操作上かなりの困難性を伴う場合が多く、使用上問題があった。 However, there are many portable terminal devices that are made compact for convenience of carrying, and the operation unit and display unit are usually small, such as when you want to use multitasking that simultaneously processes multiple functions and multiple communication means. Compared with the case of inputting from a display device or a keyboard used in a desktop type computer of this type, there are many cases where the operation is considerably difficult and there is a problem in use.
本発明の問題点に関連して以下の従来の技術が開示されている。
従来、外部の機器を必要とせず、特別な操作も行うことなく折り畳み式携帯通信端末でハンズフリー通話を行うため、折り畳み式携帯通信端末のヒンジ部に送話部を設け、蓋部に受話部を設け、端末の筐体を開いて通常の通話を行う際には、内側に設けられた送話部および受話部が用いられ、端末には、筐体が折り畳まれたことを検知するセンサと、折り畳まれたときに蓋部および本体部の間に何かが挟まれているかどうかを検知するセンサが設けられ、筐体が折り畳まれ、例えばシャツの胸ポケットに挟まれると、これらのセンサに検知され、送話部および受話部が自動的に送話部および受話部に切り換えられ、端末の筐体を折り畳んでポケットを挟み込むだけで、ハンズフリー通話ができるものがある(例えば、特許文献1参照)。
The following conventional techniques are disclosed in relation to the problems of the present invention.
Conventionally, in order to perform a hands-free call with a foldable mobile communication terminal without requiring an external device and performing no special operation, a transmitter is provided in the hinge part of the foldable mobile communication terminal, and a receiver is provided in the cover part. When the terminal casing is opened and a normal call is made, a transmitter and a receiver provided on the inside are used, and the terminal includes a sensor that detects that the casing is folded. Sensors that detect whether something is sandwiched between the lid and the body when folded are provided, and when the housing is folded, for example, in a chest pocket of a shirt, these sensors Detected, the transmitting unit and the receiving unit are automatically switched to the transmitting unit and the receiving unit, and there is one that can perform a hands-free call by simply folding the terminal housing and pinching the pocket (for example, Patent Document 1). reference).
しかしながら、上記特許文献1では、送話部、受話部の位置を改善し、ハンズフリー通話を可能にし操作性を向上しているが、本発明の問題点で指摘したように、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する点が示唆されていない。
また、従来、緊急事態の発生時に、緊急事態の内容を正確に検知し的確な処理を実現できる緊急通報受付装置を提供するため、緊急事態の発生を音声または画像で通報する携帯端末からの緊急通報を受け付ける緊急通報受付装置であって、該緊急通報受付装置は、前記音声を認識する音声認識手段を備え、該認識手段は音声認識用キーワードを格納したデータベースを備え、該データベースをもとに前記音声を認識し、認識結果に基づいて前記通報内容を解析し、解析結果に基づいて前記緊急通報を最適の関係部署に通報するものがある(例えば、特許文献2参照)。
However, in the above-mentioned Patent Document 1, the positions of the transmitter and receiver are improved, enabling hands-free calling and improving operability. However, as pointed out in the problem of the present invention, There is no suggestion of improving the difficulty of multitasking operability with a small operation unit and display unit.
In addition, in the past, in order to provide an emergency call reception device that can accurately detect the contents of an emergency and realize accurate processing when an emergency occurs, an emergency from a mobile terminal that reports the occurrence of an emergency by voice or image An emergency call receiving device for receiving a report, the emergency call receiving device comprising voice recognition means for recognizing the voice, the recognition means comprising a database storing voice recognition keywords, based on the database There is one that recognizes the voice, analyzes the contents of the report based on the recognition result, and reports the emergency call to the optimum related department based on the analysis result (for example, see Patent Document 2).
しかしながら、上記特許文献2では、音声認識機能により通報内容を解析し、緊急事態の発生時に緊急事態の内容を正確に検知し、的確な処理を実現しているが、本発明の問題点で指摘したように、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する点が示唆されていない。
また、従来、音声認識機能を有効に利用して、各種機能を簡単に操作実行可能にするため、本発明の音声認識機能付き制御装置は、音声認識結果に基づき所定の機能を実行する装置であって、所定の機能は外部操作による複数の動作手順を経て実行されるものであってこれら外部操作による動作手順を省いて直接所定の機能が実行されるよう当該所定の機能の実行指示に関連付けて所定の音声コマンドを登録可能な登録手段を備え、そして、入力音声が登録手段に登録された音声コマンドに一致すると認識された場合にその音声コマンドに関連付けられた実行指示に基づき直接所定の機能を実行させる制御手段を備えるように構成した。この構成によれば、音声認識機能を有効に利用でき、各種機能を簡単に操作実行できるものがある(例えば、特許文献3参照)。
However, in the above-mentioned Patent Document 2, the content of the notification is analyzed by the voice recognition function, and the content of the emergency is accurately detected when the emergency occurs, and the accurate processing is realized. As described above, there is no suggestion of improving the difficulty of multitasking operability by the small operation unit and display unit of the mobile terminal device.
Conventionally, the control device with a voice recognition function according to the present invention is a device that executes a predetermined function based on a voice recognition result in order to make it possible to easily execute various functions by effectively using the voice recognition function. The predetermined function is executed through a plurality of operation procedures by an external operation, and is associated with the execution instruction of the predetermined function so that the predetermined function is directly executed without the operation procedure by the external operation. Registration means capable of registering a predetermined voice command, and when it is recognized that the input voice matches the voice command registered in the registration means, a predetermined function is directly set based on an execution instruction associated with the voice command. It was comprised so that the control means to perform may be provided. According to this configuration, there is one that can effectively use the voice recognition function and can easily execute various functions (for example, see Patent Document 3).
しかしながら、上記特許文献3では、音声認識機能を用いて、各種機能を簡単に操作実行するようにしているが、本発明の問題点で指摘したように、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する点が示唆されていない。
また、従来、簡単な操作で指紋認証を行ない、移動無線端末などのセキュリティを高めるため、移動無線端末機の電源スイッチに指紋読取部を設け、電源スイッチを押すと指紋認証が行なわれ、指紋登録部に登録した指紋と一致したら移動無線端末機を動作させる。さらに、マイクから入力された音声の声紋を、声紋登録部に登録された声紋と照合し、一致したら通話可能とし、通話開始後一定時間経過したら、タイマ部により電源をオフにし、動作状態のままでの紛失や盗難の場合でも、不正使用を防止でき、スイッチを押すという簡単な操作だけで指紋認証ができ、移動無線端末機のセキュリティを高めることができ、また、通話スイッチに多段スイッチを用いて、半押しで指紋認証と乱数発生を行ない、全押しで通話を行なうようにすることもできる(例えば、特許文献4参照)。
However, in Patent Document 3, various functions are easily operated and executed using the voice recognition function. However, as pointed out in the problem of the present invention, the small operation unit and display unit of the portable terminal device There is no suggestion of improving the difficulty of multitasking due to.
Conventionally, in order to perform fingerprint authentication with a simple operation and increase the security of mobile radio terminals, etc., a fingerprint reader is provided in the power switch of the mobile radio terminal, and fingerprint authentication is performed when the power switch is pressed. If it matches the fingerprint registered in the unit, the mobile radio terminal is operated. Furthermore, the voice print of the voice input from the microphone is checked against the voice print registered in the voice print registration unit, and if it matches, the call can be made. After a certain period of time has elapsed after the call starts, the power is turned off by the timer unit and the operation state remains unchanged. Even if the phone is lost or stolen, unauthorized use can be prevented, fingerprint authentication can be performed simply by pressing the switch, the security of the mobile wireless terminal can be increased, and a multi-stage switch is used for the call switch. Thus, it is possible to perform fingerprint authentication and random number generation by half-pressing and to make a call by fully pressing (see, for example, Patent Document 4).
しかしながら、上記特許文献4では、声紋の照合を行い、セキュリティを高めているが、本発明の問題点で指摘したように、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する点が示唆されていない。
また、従来、例えば自動車から電話をかけるといった動作を使用者の音声入力により簡単でかつ確実に行うことができる音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車を提供するため、音声入力手段と、音声入力手段に入力された音声信号を認識して処理する音声認識手段と、呼び出したい対象や対象に対応する特定の行為をあらかじめ登録しているデータ登録手段と、音声認識手段で認識された音声により、データ登録手段中の呼び出して操作したい対象を指定して、その後、この対象に対応する特定の行為を音声認識手段で認識された音声により指定するための処理手段とを備えるものがある(例えば、特許文献5参照)。
However, in Patent Document 4, voiceprints are collated and security is improved. However, as pointed out in the problem of the present invention, it is difficult to operate multitasking by a small operation unit and display unit of the mobile terminal device. There is no suggestion of improving sex.
Conventionally, for example, an electronic device with a voice operation function, a voice operation method in an electronic device, and an electronic device with a voice operation function can be easily and reliably performed by a user's voice input, such as making a call from a car. In order to provide a motor vehicle equipped with, voice input means, voice recognition means for recognizing and processing a voice signal input to the voice input means, and data that pre-registers a target to be called and a specific action corresponding to the target The target to be called and operated in the data registration unit is specified by the voice recognized by the registration unit and the voice recognition unit, and then a specific action corresponding to this target is specified by the voice recognized by the voice recognition unit. And a processing means for doing this (for example, see Patent Document 5).
しかしながら、上記特許文献5では、使用者の音声入力により簡単でかつ確実に動作を行うようにしているが、本発明の問題点で指摘したように、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する点が示唆されていない。
また、従来、音声入力部から入力された音声情報に基づいて音声コマンドに対応する処理内容を実行するか、または別に設定された処理内容を実行するかを自動判定して利用するため、音声に対応する音声情報を記憶した音声認識辞書と、音声情報に対応する音声コマンドを予め記憶した音声コマンドテーブルと、音声を入力する音声入力部と、入力された音声から音声情報を音声認識辞書に基づいて認識する音声認識部と、音声情報と音声コマンドテーブルの音声コマンドとが一致するか否かを比較する音声コマンド比較部と、音声情報と音声コマンドとが一致する場合、その音声コマンドに対応する処理内容を実行する音声コマンド実行部と、音声情報と音声コマンドとが一致しない場合、音声情報に対し別に設定された処理内容を実行する音声情報処理部とからなる(例えば、特許文献6参照)。
However, in the above-mentioned Patent Document 5, the operation is easily and reliably performed by the user's voice input. However, as pointed out in the problem of the present invention, the small operation unit and the display unit of the portable terminal device are used. There is no suggestion of improving the difficulty of multitasking operability.
In addition, conventionally, it is automatically determined whether to execute the processing content corresponding to the voice command based on the voice information input from the voice input unit or to execute the processing content set separately. A voice recognition dictionary storing corresponding voice information, a voice command table storing voice commands corresponding to the voice information in advance, a voice input unit for inputting voice, and voice information from the inputted voice based on the voice recognition dictionary If the voice information and voice command match, the voice command comparison unit for comparing whether the voice information and voice command in the voice command table match, and the voice information and voice command correspond to the voice command. If the voice command execution unit that executes the processing content does not match the voice information and the voice command, the processing content set separately for the voice information is executed. Comprising a speech information processing unit that (for example, see Patent Document 6).
しかしながら、上記特許文献6では、入力した音声情報について音声コマンドか否かを音声認識し、音声コマンドの場合には対応する処理内容を実行し、音声コマンドでない場合には別の処理内容を実行するようにしているが、本発明の問題点で指摘したように、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する点が示唆されていない。 However, in the above-mentioned patent document 6, whether or not the input voice information is a voice command is recognized as a voice command, the corresponding processing content is executed in the case of a voice command, and another processing content is executed in the case of not being a voice command. However, as pointed out in the problems of the present invention, there is no suggestion of improving the difficulty of multitasking operability by the small operation unit and display unit of the portable terminal device.
したがって、本発明は上記問題点に鑑みて、小さな操作部、表示部によるマルチタスクの困難性を改善する、音声認識機能を備えた携帯端末装置のマルチタスクシステムを提供することを目的とする。 Therefore, in view of the above problems, an object of the present invention is to provide a multitask system of a portable terminal device having a voice recognition function, which improves the difficulty of multitasking by a small operation unit and a display unit.
本発明は前記問題点を解決するために、音声認識機能を備えた携帯端末装置のマルチタスクシステムにおいて、前記携帯端末装置の機能の呼び出し、機能の実行を定義した音声コマンドを登録する音声コマンド登録部と、押下期間中に前記携帯端末装置のマイクロフォンからの音声を音声コマンドとして入力するための音声コマンド入力ボタンと、前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンに入力した音声を音声認識処理し、認識結果を音声コマンドとして前記音声コマンド登録部に登録させる音声コマンド登録処理部と、前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンから音声コマンドを入力し、前記音声コマンド入力ボタンの押下解除後に入力した音声コマンドを音声認識処理し、認識結果が前記音声コマンド登録部に登録されている音声コマンドと一致し受理された場合には受理した音声コマンドに対応する機能を呼び出し、機能の操作を実行する音声コマンド処理部とを備えることを特徴とする、音声認識機能を備えた携帯端末装置のマルチタスクシステムを提供する。 In order to solve the above problems, the present invention provides a voice command registration for registering a voice command defining a function call of the portable terminal device and execution of the function in a multitask system of a portable terminal device having a voice recognition function. A voice command input button for inputting voice from the microphone of the portable terminal device as a voice command during the pressing period, and voice recognition processing for the voice input to the microphone during the pressing period of the voice command input button A voice command registration processing unit for registering a recognition result as a voice command in the voice command registration unit, and inputting a voice command from the microphone during a pressing period of the voice command input button, and releasing the pressing of the voice command input button. The voice command input later is processed by voice recognition. A voice command processing unit that calls a function corresponding to the received voice command when the voice command registered in the voice command registration unit is received and is received, and performs a function operation; Provided is a multitask system of a portable terminal device having a voice recognition function.
また、前記携帯端末装置の操作キーと前記音声コマンド処理部とが独立して前記携帯端末装置の機能を呼び出し、機能を実行する。
また、前記音声コマンド登録処理部は、前記携帯端末装置の複数の機能を選択可能に表示部にアイコン表示させ、選択された機能に対して前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンに入力した音声を音声認識処理し、認識結果を音声コマンドとして登録させる。
In addition, the operation key of the mobile terminal device and the voice command processing unit independently call the function of the mobile terminal device and execute the function.
In addition, the voice command registration processing unit displays a plurality of functions of the portable terminal device as icons on the display unit, and inputs the selected function to the microphone during the pressing period of the voice command input button. The recognized voice is subjected to voice recognition processing, and the recognition result is registered as a voice command.
また、前記音声コマンド登録処理部は、前記携帯端末装置の複数の機能を選択可能に表示部にアイコン表示させ、選択された機能名を表示し機能名の発音の録音をガイドする画面、録音後音声認識処理した認識結果の登録をガイドする画面、登録完了の画面を表示する。
また、前記音声コマンド処理部は、前記携帯端末装置の複数の機能を選択可能に表示部に表示させたアイコン表示から選択された音声入力の機能に対して前記音声コマンド入力ボタンが押下された場合、前記音声コマンド登録部に登録された音声コマンドの一覧表示を行い、目的の音声コマンドの選択実行を可能にする。
The voice command registration processing unit displays a plurality of functions of the portable terminal device as icons on the display unit, displays a selected function name, and guides recording of the pronunciation of the function name, after recording A screen for guiding the registration of the recognition result after the speech recognition processing and a screen for completing the registration are displayed.
When the voice command input button is pressed with respect to the voice input function selected from the icon display displayed on the display unit so that a plurality of functions of the portable terminal device can be selected. A list of voice commands registered in the voice command registration unit is displayed, and a target voice command can be selected and executed.
また、前記音声コマンド処理部は、認識結果として音声コマンドを受理した場合コマンド受理通知音を鳴らし、音声コマンドを受理しない場合コマンド不受理通知音を鳴らす。
また、前記音声コマンド処理部は、音声合成機能を有し、音声コマンドを受理した場合受理した音声コマンドを音声合成で前記携帯端末装置のスピーカから復唱する。
また、前記音声コマンド処理部は、前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンから音声コマンドを入力し、前記音声コマンド入力ボタンの押下解除前に一定時間を経過した場合には入力した音声コマンドを音声認識処理する。
The voice command processing unit sounds a command acceptance notification sound when a voice command is accepted as a recognition result, and a command non-acceptance notification sound when a voice command is not accepted.
The voice command processing unit has a voice synthesis function. When a voice command is received, the voice command processing unit repeats the received voice command from the speaker of the portable terminal device by voice synthesis.
In addition, the voice command processing unit inputs a voice command from the microphone during a pressing period of the voice command input button, and when a predetermined time has elapsed before releasing the voice command input button, the input voice command Voice recognition processing.
また、前記音声コマンド処理部は、機能の操作を実行させた後に前記音声コマンド入力ボタンが押下後無言で音声コマンドの入力が無く押下解除された場合には実行している機能の操作を強制終了させる。
前記音声コマンド処理部は声紋解析機能を有し、前記音声コマンド登録処理部Cは、前記音声コマンド登録部にマイクロフォンから入力したユーザの声紋を登録させ、前記音声コマンド処理部は、音声コマンドの音声認識処理の前にマイクロフォンから入力した声紋の解析を行う。
In addition, the voice command processing unit forcibly terminates the operation of the function that is being executed when the voice command input button is silent after the function operation is performed and the voice command is not input and the press is released. Let
The voice command processing unit has a voiceprint analysis function, the voice command registration processing unit C causes the voice command registration unit to register a user's voiceprint input from a microphone, and the voice command processing unit The voice print input from the microphone is analyzed before the recognition process.
また、前記音声コマンド入力ボタンはノンロックタイプのボタンで前記携帯端末装置の側面に位置する。
また、前記音声コマンド入力ボタンは前記携帯端末装置のテンキー、機能キー、ポインティングデバイスの中から1つを選択して用いられる。
また、前記音声コマンド処理は、メール、カメラ、電卓、メモ、インターネット、辞書、電話帳、スケジュール、リモコン、音声入力の機能の呼び出し、機能の操作の実行を行う。
The voice command input button is a non-lock type button and is located on the side of the portable terminal device.
The voice command input button is used by selecting one of the ten key, function key, and pointing device of the portable terminal device.
In addition, the voice command processing performs mail, camera, calculator, memo, Internet, dictionary, phone book, schedule, remote control, voice input function call, and function operation.
また、前記リモコンの機能には赤外線を用いるテレビジョン、無線LAN用の電波を用いるサーバー、BLUETOOTH用の電波を用いる冷蔵庫、照明を含む家電製品のリモコンの機能を含む。
また、前記携帯端末装置のマルチタスクシステムは、操作キーでメールの機能を読み出しメールを作成しながら、前記音声コマンド処理部では、電話帳の機能を呼び出し、時報を聞く機能の操作処理を可能にする。
The functions of the remote control include the functions of a television using infrared rays, a server using radio waves for wireless LAN, a refrigerator using radio waves for BLUETOOTH, and a remote control for home appliances including lighting.
In addition, the multi-task system of the portable terminal device allows the voice command processing unit to call the phone book function and perform the operation processing of the function to listen to the time signal while creating the mail by reading the mail function with the operation key. To do.
また、前記携帯端末装置は折り畳み式であり、内側、外側に一対のマイクロフォン、スピーカ、さらに、前記携帯端末装置の開閉を検出する開閉検出センサを有し、前記携帯端末装置が開いている場合に内側の一対のマイクロフォン、スピーカのみを有効にし、前記携帯端末装置が閉じている場合には外側の一対のマイクロフォン、スピーカのみを有効にし、前記音声コマンド処理部は、前記携帯端末装置が開いている場合には内側のマイクロフォンから音声コマンドを入力し、前記携帯端末装置が閉じている場合には外側のマイクロフォンから音声コマンドを入力する。 The portable terminal device is foldable, and has a pair of microphones and speakers on the inside and outside, and an open / close detection sensor for detecting opening and closing of the portable terminal device, and the portable terminal device is open. Only the inner pair of microphones and speakers are enabled, and when the portable terminal device is closed, only the outer pair of microphones and speakers is enabled, and the voice command processing unit is open for the portable terminal device. In this case, a voice command is input from the inner microphone, and when the portable terminal device is closed, a voice command is input from the outer microphone.
また、前記携帯端末装置のマルチタスクシステムは、前記携帯端末装置を開いた状態で操作キーでメールの機能を読み出しメールを作成しながら、前記音声コマンド処理部では、テレビジョンの機能を呼び出し、テレビ電源を入れる機能の操作を可能にし、操作キーによるメール作成が終了し前記携帯端末装置が閉じた状態で、テレビジョンのボリューム調整、チャンネル切り替えの機能の操作を行う。 Further, the multi-task system of the mobile terminal device reads out a mail function with an operation key and creates a mail while the mobile terminal device is open, while the voice command processing unit calls a television function, The operation of the function to turn on the power is made possible, and the operation of the function of adjusting the volume of the television and switching the channel is performed in the state where the creation of the mail by the operation key is completed and the portable terminal device is closed.
また、前記携帯端末装置のマルチタスクシステムは、前記音声コマンド処理部では、前記携帯端末装置が閉じた状態で、テレビジョンの機能を呼び出し、テレビ電源を入れる機能の操作、ボリューム調整、チャンネル切り替えの機能の操作を行う。
また、本発明は、音声認識機能を備えた携帯端末装置のマルチタスク方法において、前記携帯端末装置の複数の機能から1つを選択し、音声コマンド入力ボタンの押下期間中に前記携帯端末装置のマイクロフォンから音声を入力する工程と、入力した前記音声を音声認識処理する工程と、音声認識処理した認識結果を、前記携帯端末装置の機能の呼び出し、機能の実行を定義した音声コマンドとして登録する工程と、前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンに音声コマンドを入力する工程と、前記音声コマンド入力ボタンの押下解除後に入力した音声コマンドの音声認識処理を行う工程と、音声コマンドを音声認識処理した認識結果と登録された音声コマンドが一致する場合に音声コマンドを受理する工程と、受理した音声コマンドに対応する前期携帯端末装置の機能を呼び出し、機能の操作を実行する工程とを備えることを特徴とする、音声認識機能を備えた携帯端末装置のマルチタスク方法を提供する。
Further, in the multi-task system of the mobile terminal device, the voice command processing unit is configured to call a television function in a state where the mobile terminal device is closed, to operate a function to turn on a TV, adjust a volume, and switch a channel. Perform function operations.
According to another aspect of the present invention, there is provided a multitasking method for a mobile terminal device having a voice recognition function, wherein one of a plurality of functions of the mobile terminal device is selected and the mobile terminal device is operated during a period of pressing a voice command input button. A step of inputting voice from a microphone, a step of performing voice recognition processing on the input voice, and a step of registering the recognition result obtained by the voice recognition processing as a voice command defining calling of the function of the mobile terminal device and execution of the function A step of inputting a voice command to the microphone during the pressing period of the voice command input button, a step of performing voice recognition processing of the voice command input after releasing the pressing of the voice command input button, and voice recognition of the voice command A process of accepting a voice command when the processed recognition result matches a registered voice command; Call the function of the previous term portable terminal device corresponding to the voice command, characterized in that it comprises a step of performing an operation function, provides a multitasking method for a portable terminal apparatus having a speech recognition function.
以上説明したように、本発明によれば、携帯端末装置の複数の機能から1つを選択し音声コマンド入力ボタンの押下期間中に携帯端末装置のマイクロフォンから音声を入力し、入力した音声を音声認識処理し、音声認識処理した認識結果を、携帯端末装置の機能の呼び出し、機能の実行を定義した音声コマンドとして登録し、音声コマンド入力ボタンの押下期間中にマイクロフォンに音声コマンドを入力し、音声コマンド入力ボタンの押下解除後に入力した音声コマンドの音声認識処理を行い、音声コマンドを音声認識処理した認識結果と登録された音声コマンドが一致する場合に音声コマンドを受理し、受理した音声コマンドに対応する前期携帯端末装置の機能を呼び出し、機能の操作を実行するようにしたので、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する。画面表示を必要としない音声コマンドによる機能実行と、キー操作による機能実行が独立して実行できるので、小さな筐体でも容易に2つの機能を同時に利用できるようになるためである。 As described above, according to the present invention, one of a plurality of functions of the mobile terminal device is selected, voice is input from the microphone of the mobile terminal device while the voice command input button is pressed, and the input voice is voiced. The recognition result obtained by the recognition process and the voice recognition process is registered as a voice command that defines the function call of the mobile terminal device and the execution of the function, and the voice command is input to the microphone while the voice command input button is pressed. Performs voice recognition processing for voice commands that are entered after the command input button is released, and accepts voice commands when the recognition results obtained by voice recognition processing for voice commands match the registered voice commands. Since the function of the mobile terminal device is called and the operation of the function is executed, the small operation of the mobile terminal device is performed. Parts, to improve the difficulty of the operation of multitasking by the display unit. This is because the function execution by the voice command that does not require the screen display and the function execution by the key operation can be executed independently, so that the two functions can be easily used even in a small casing.
また、携帯端末装置の有する機能/操作全般に対して音声コマンドが登録できるので、多機能で複数の通信手段をもった携帯端末装置においても、目的の機能実行のためにその手段を気にすることなく、ユーザの嗜好に合わせて操作性を向上することができる。
また、ボタン操作と音声入力のみでユーザの携帯端末装置が有する機能を実行/終了できるので、暗闇においても容易に操作できる。
In addition, since voice commands can be registered for all functions / operations of the portable terminal device, even in a portable terminal device having multiple functions and a plurality of communication means, the means is taken care of for executing the desired function. Therefore, operability can be improved according to the user's preference.
In addition, since the functions of the user's portable terminal device can be executed / terminated only by a button operation and voice input, it can be easily operated even in the dark.
また、携帯端末装置の筐体を閉じたままでユーザの携帯端末装置が有する機能を実行できるので、画面表示、バックライトなどの使用が少なくて済み省電力化できる。
音声コマンドの音声認識処理の前にマイクロフォン入力した音声の声紋の解析を行うようにしたので、第3者による不正使用、隣人の声などによる誤動作を防止することが可能になる。
In addition, since the functions of the user's portable terminal device can be executed with the casing of the portable terminal device closed, the use of screen display, backlight, etc. can be reduced, and power can be saved.
Since the voice print of the voice input by the microphone is analyzed before the voice command voice recognition processing, it is possible to prevent an unauthorized use by a third party and a malfunction due to a neighbor's voice.
以下、本発明の実施の形態について図面を参照して説明する。
図1は本発明に係る、音声認識機能を備えた携帯端末装置のマルチタスクシステムの概略を説明する全体図である。
本図に示すように、携帯端末装置111は複数の機能、通話、通信手段を備え、一例として折り畳み式であり、操作キー113、アンテナ118、表示部119を有し、アンテナ118から図示しない基地局に対する電波114を介して携帯電話回線、固定電話回線を含む電話回線/インターネット134に接続し通話、通信を行い、さらに、無線LAN用の電波116を介してサーバー136に接続しファイル管理、プリンタ出力を行い、赤外線115を介してテレビジョン135に接続しテレビジョン135のリモートコントロールを行い、さらに、図示しないパーソナルコンピュータと通信を行い、BLUETOOTH用の電波117を介して家電製品、例えば、冷蔵庫137に接続し、冷蔵庫137の在庫管理、鮮度管理等を行う機能を有し、プログラムで制御される。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is an overall view illustrating an outline of a multitask system of a mobile terminal device having a voice recognition function according to the present invention.
As shown in the figure, the mobile
さらに、携帯端末装置111は操作キー113を用いてユーザがマルチタスクを実行する機能を有し、例えば、メールを作成しながら局番117の時報を聞く機能を有する。
さらに、上記のマルチタスクと共に、以下に詳細に説明するように、本発明は、携帯端末装置111の音声認識機能を用いた音声入力による操作機能と操作キー113による操作機能を独立してユーザがマルチタスクを実行する機能を有し、例えば、操作キー113を用いてメールを作成しながら音声入力により局番117の時報を聞く機能を有する。
Further, the mobile
Further, as will be described in detail below, together with the above multitasking, the present invention allows the user to independently operate the voice input operation function using the voice recognition function of the mobile
さらに、携帯端末装置111には音声コマンド入力ボタン121が設けられ、音声コマンド入力ボタン121は、例えば、携帯端末装置111の側面に位置し、ノンロックタイプのボタンであり、ボタン押下期間中一定時間内のみ入力した音声を音声コマンド112として入力可能とし、予め登録された対応動作として携帯端末装置111の有する通話、通信機能を含む諸機能を利用することができる。ここに、音声コマンド112は、音声認識機能を用いた音声入力により、携帯端末装置111の操作機能を実行するため、後述するように、ユーザが予め登録した携帯端末装置111の機能の呼び出し、機能の実行を定義した音声キーワードである。
Further, the mobile
特に、上記の携帯端末装置111のマルチタスク機能では、携帯端末装置111の表示部119の画面表示を必要としない機能実行に対して音声認識による機能を実行させ、表示部119の画面表示を必要とする機能実行に対して操作キー113による機能を実行させるようにし、操作キー113、表示部119の小さな携帯端末装置111の有する機能の同時利用を容易にしてユーザの負担を軽減する。
In particular, in the multitask function of the mobile
図2は図1の携帯端末装置111の概略を示す外観図である。本図(a)に示すように、折り畳み式の携帯端末装置111の筐体を開いた内側には第1系統として、内側マイクロフォン122、内側スピーカ123が設けられ、内側スピーカ123は前述のアンテナ118、表示部119、音声コマンド入力ボタン121と共に上部側に位置する。
さらに、内側マイクロフォン122は、前述の操作キー113と共に下部側に位置する。
FIG. 2 is an external view schematically showing the mobile
Further, the
本図(b)に示すように、折り畳み式の携帯端末装置111の筐体を閉じた上部側の外側には第2系統として、外側マイクロフォン124、外側スピーカ125が設けられる。外側マイクロフォン124は、携帯端末装置111の筐体を開いた状態から閉じた状態にした場合、外側スピーカ125よりも下側に位置する。
図3は図1の携帯端末装置111の概略構成を示すブロック図である。本図に示すように、携帯端末装置111には無線部140が設けられ、無線部140はアンテナ118により基地局に対する電波114、無線LAN用の電波116の送受信を行う。
As shown in FIG. 4B, an
FIG. 3 is a block diagram showing a schematic configuration of the mobile
無線部140にはマイク/スピーカ系統切替スイッチ132、133が接続され、マイク/スピーカ系統切替スイッチ132、133は第1系統の内側マイクロフォン122、内側スピーカ123、第2系統の外側マイクロフォン124、外側スピーカ125を切り替えて無線部140への接続、切断を行うスイッチデバイスである。
無線部140には制御部141が接続され、制御部141はCPU(中央演算装置)で構成され、携帯端末装置111全体の制御を行い、特に後述するスピーカ/マイク切替部141A、音声コマンド処理部141B、音声コマンド登録処理部141Cを備える。
Microphone / speaker system changeover switches 132 and 133 are connected to the
A
制御部141にはメモリ126が接続され、メモリ126は携帯端末装置111の制御プログラム、例えば、メール、カメラ、電卓、メモ、インターネット、辞書、電話帳、スケジュール、近距離通信、音声入力のプログラムを格納するほか、制御データ、画像、リモコンデータなど携帯端末装置111で扱う様々なデータを格納し、特に後述する音声コマンド登録部126Aを備える。
A
さらに、携帯端末装置111には表示部119が接続され、表示部119はLCD(液晶表示部)で構成され、表示部119はメール、カメラ、電卓、メモ、インターネット、辞書、電話帳、スケジュール、近距離通信、音声入力の機能をアイコン表示し、画像、メール等の表示を行う。
さらに、制御部141には開閉検出センサ127が接続され、開閉検出センサ127は携帯端末装置111の筐体の開閉状態を検出するセンサであり、制御部141は閉状態の場合、表示部119のLCDのバックライトを消灯し、表示部119の画面を非表示にする。
Furthermore, a
Further, an open /
さらに、制御部141には音声コマンド入力ボタン121が接続され、制御部141は、内側マイクロフォン122又は外側マイクロフォン125に入力した音声を音声コマンド112として、無線部140を経由して、前述のように、音声コマンド入力ボタン121の押下状態にて音声による音声コマンド112を受け付ける。
さらに、制御部141にはカメラ128が接続され、制御部141はカメラ128により撮影された画像を表示部119に表示させ、メモリ126に格納させる。
Furthermore, a voice
Further, a
制御部141には操作キー113が接続され、操作キー113はテンキー、機能キーを含んだキーボード、ポインティングデバイスからなるボタンスイッチ郡で構成される。
さらに、制御部141にはIr(Infrared)入出力回路129が接続され、Ir入出力回路129は赤外線通信及び赤外線リモコン制御を行うための赤外線115の入出力回路である。
An
Further, an Ir (Infrared) input /
さらに、制御部141にはBLUETOOTH回路130が接続され、BLUETOOTH回路130はBLUETOOTH用の電波117で近距離通信を行うための回路である。
次に、制御部141のスピーカ/マイク切替部141Aは、開閉検出センサ127の開閉検出により携帯端末装置111の筐体の開閉状態に応じて、マイク/スピーカ系統切替スイッチ132、133に対してマイク/スピーカ系統切替信号131を出力し、第1系統の内側マイクロフォン122、内側スピーカ123と第2系統の外側マイクロフォン124、外側スピーカ125との動作が切り替えられる。
Further, a
Next, the speaker /
すなわち、携帯端末装置111の筐体の開状態で第1系統の内側マイクロフォン122、内側スピーカ123が動作し第2の系統の外側マイクロフォン124、外側スピーカ1
25の動作が停止し、携帯端末装置111の筐体の閉状態では逆に第2系統の外側マイクロフォン124、外側スピーカ125が動作し、第1系統の内側マイクロフォン122、内側スピーカ123の動作が停止する。
That is, the first microphone
In the closed state of the casing of the portable
携帯端末装置111の筐体の開閉状態によって第1系統(内側)の内側マイクロフォン122、内側スピーカ123、第2系統(外側)外側マイクロフォン124、外側スピーカ125が切り替わるため、携帯端末装置111の筐体を開いた状態のみならず携帯端末装置111の筐体を閉じた状態でも音声コマンド112による実行が可能となる。
さらに、制御部141の音声コマンド処理部141Bは、音声コマンド入力ボタン121を用いて、内側マイクロフォン122又は外側マイクロフォン124から無線部140を経由して入力した音声を音声認識処理により音声コマンド112の解析を行い、音声認識処理により解析した音声コマンド112と予め登録しておいた音声コマンド112が一致した際に携帯端末装置111の機能を呼び出して操作を実行する。
Since the first system (inner side)
Furthermore, the voice
さらに、制御部141の音声コマンド登録処理部141Cは音声コマンド入力ボタン121を用いて、内側マイクロフォン122又は外側マイクロフォン124から無線部140を経由して入力した音声を音声認識処理により解析を行い、解析結果を音声コマンド112としてメモリ126の音声コマンド登録部126Aに登録する。
なお、図3を用いて、携帯端末装置111の概略構成を説明したが、表示部119のLCD、カメラ128は、当業者にとってよく知られており、また、本発明とは直接関係しないので、それらの詳細な説明は省略する。
Further, the voice command registration processing unit 141C of the
Although the schematic configuration of the portable
図4は表示部119に表示される機能表示のメニューを説明する概略図である。本図に示すように、携帯端末装置111が有する機能を選択するための待ち受け画面であるメニューが表示部119に表示され、メニューには各機能に対してアイコンが一覧表示される。一例として、表示部119に表示されるアイコンの上段の左側からメール、カメラ、電卓の機能がアイコン表示され、中断の左側からメモ、インターネット、辞書の機能がアイコン表示され、下段の左側から電話帳、スケジュール、近距離通信の機能等がアイコン表示される。操作キー113を用いて、4角で囲うカーソルを操作キー113で操作して所望のアイコンが選択される。
FIG. 4 is a schematic diagram for explaining a function display menu displayed on the
これらの機能を動作させるプログラムはメモリ126に格納され、メニューに一覧表示されたアイコンを操作キー113で選択されると、制御部141により動作が実行される。この他に、前述の音声認識機能、音声合成機能を動作させるプログラムがメモリ126に格納され、制御部141により動作が実行される。
図5は図3における制御部141の音声コマンド登録処理部141Cの動作画面例で赤外線115によるテレビジョン135のリモコン機能に対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、携帯端末装置111に内蔵される赤外線115によるテレビジョン135のリモコン機能を用いて、「テレビ電源をONにする」音声コマンド112として「テレビデンゲン」を音声コマンド登録部126Aに登録する場合について説明する。
A program for operating these functions is stored in the
FIG. 5 is a control flow diagram illustrating the registration of the
ステップ41において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、近距離通信のアイコンの選択を可能にする。
ステップ42において、近距離通信のアイコン選択で、近距離通信のメニュー画面が表示部119に表示され、この近距離通信のメニューの画面には、赤外線通信、赤外線リモコン、BLUETOOTH、無線LANの機能の一覧が文字表示される。操作キー113を用いて、表示部119で赤外線リモコンの文字表示の選択を可能にする。選択を間違えた場合には「戻る」キーを押下して選択のやり直しを行うことが可能である。以下同様である。
In step 41, first, the function is displayed on the menu screen of the
In
ステップ43において、赤外線リモコンの文字表示を選択した場合、表示部119に赤外線リモコンのメニューの画面が表示され、この赤外線リモコンのメニューの画面にはテレビ、ビデオ、ユーザ設定の機能の一覧が文字表示される。操作キー113を用いて、表示部119でテレビの文字表示を選択することが可能になる。ユーザ設定はテレビ、ビデオ以外の機能がある場合、ユーザ設定で行うことができることを意味する。以下同様である。
If character display of the infrared remote control is selected in
ステップ44において、テレビの文字表示を選択した場合、表示部119にはテレビリモコンの実行画面に遷移する。この実行画面には、画面に従い、チャンネル切替え(CH+、CH−)、ボリューム調整(VOL+、VOL−)、電源(PWR)などのキーが表示され、操作キー113を用いて、該当するキーを押下することで、テレビジョン135に対して赤外線115のデータを送信することができるようになっている。
If the television character display is selected in step 44, the
ステップ45において、本実施例では、テレビリモコンの電源[PWR」に該当するキーについて音声コマンド112を登録したいので、音声コマンド入力ボタン121を押下しながら、操作キー113を用いて電源「PWR」に該当するキーを実行画面に従って押下し音声コマンド登録モードにする。この場合、電源「PWR」のキーが押下されたことによる赤外線115のデータが携帯端末装置111からテレビジョン135に対して送信されることはない。音声コマンド入力ボタン121の押下時には送信禁止とするためである。以下同様である。
In
ステップ46において、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「テレビデンゲン」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「テレビデンゲン」との音声コマンド112を音声認識処理する。発音を間違えた場合には「中止」キーを押下し発音のやり直しを行うことが可能である。「中止」キーの押下の説明については以下同様である。
In
ステップ47において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「テレビデンゲン」との音声コマンド112を登録処理させる。
ステップ48において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In
In
このようにして、「テレビデンゲン」との音声コマンド112の登録動作は、テレビリモコン機能の呼び出し動作と電源キー押下の動作を登録したことになる。
テレビリモコンのボリューム調整に該当するキーについて音声コマンド112を登録する場合、同様にして、ステップ45〜48において、「ボリュームアップ」、「ボリュームダウン」との音声コマンド112の登録動作を行う。この登録動作は、テレビリモコン機能の呼び出し動作とボリューム調整の動作を登録したことになる。
In this manner, the registration operation of the
When the
テレビリモコンのチャンネル切替に該当するキーについて音声コマンド112を登録する場合、同様にして、ステップ45〜48において、「チャンネルアップ」、「チャンネルダウン」との音声コマンド112の登録動作を行う。この登録動作は、テレビリモコン機能の呼び出し動作とチャンネル切替の動作を登録したことになる。
When the
図6は図5の第1の変形例で時報に対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、携帯端末装置111に内蔵される電話帳の機能を用いて、「時報」を聞く音声コマンド112として「ジホウ」を音声コマンド登録部126Aに登録する場合について説明する。
ステップ51において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、電話帳のアイコンの選択を可能にする。
FIG. 6 is a control flowchart for explaining the registration of the
In step 51, first, the function is displayed on the menu screen of the
ステップ52において、電話帳のアイコンの選択で、電話帳の画面が表示部119に表示され、電話帳の画面には相手氏名、名称とこれに対する電話番号の対の一覧が表示される。操作キー113を用いて、表示部119で「時報 117」を選択する。本実施例では局番117に電話をかける音声コマンド112を登録したいので、カーソルで「時報 117」を選択している状態で音声コマンド入力ボタン121を押下しながら、操作キー113を用いて発呼キー(オフフックキー)を押下し音声コマンド登録モードにする。この場合、発呼キー押下により局番117に電話がつながることはない。音声コマンド入力ボタン121が押下されているためである。
In
ステップ53において、「時報 117」を選択した状態で音声コマンド入力ボタン121を押下しながら、発呼キーを押下した場合、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「ジホウ」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「ジホウ」との音声コマンド112を音声認識処理する。
In
ステップ54において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「ジホウ」との音声コマンド112を登録処理させる。
ステップ55において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In step 54, the voice command registration processing unit 141C causes the
In
このようにして、「ジホウ」との音声コマンド112の登録動作は、電話帳の機能の呼び出し動作と時報を聞く動作を登録したことになる。
In this way, the registration operation of the
図7は図5の第2の変形例で天気予報に対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、携帯端末装置111に内蔵されるインターネットの機能を用いて、「天気予報」の情報を得る音声コマンド112として「テンキヨホウ」を音声コマンド登録部126Aに登録する場合について説明する。
ステップ61において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、インターネットのアイコン選択を可能にする。
FIG. 7 is a control flowchart for explaining the registration of the
In
ステップ62において、インターネットのアイコンの選択で、URL(Uniform Resource Locator)の入力を行うテキストボックスが表示部119に表示され、テキストボックスに天気予報のURLを入力し、画面表示に従い接続キーを押下することで好みの天気予報を閲覧することが可能になる。本実施例では、天気予報をインターネットで閲覧する音声コマンド112を登録したいので、テキストボックスにユーザ指定の天気予報のURLを入力した後、音声コマンド入力ボタン121を押下しながら、画面表示に従い接続キーを押下することで音声コマンド登録モードにする。この場合、接続キー押下によりインターネットに接続されることはない。音声コマンド入力ボタン121が押下されているからである。
In step 62, a text box for inputting a URL (Uniform Resource Locator) is displayed on the
ステップ63において、音声コマンド入力ボタン121を押下しながら接続キーを押下すると、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「テンキヨホウ」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「テンキヨホウ」との音声コマンド112を音声認識処理する。
In
ステップ64において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「テンキヨホウ」との音声コマンド112を登録処理させる。
ステップ65において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In step 64, the voice command registration processing unit 141C causes the
In
このようにして、「テンキヨホウ」との音声コマンド112の登録動作は、インターネットの機能の呼び出し動作とテンキヨホウを閲覧する動作を登録したことになる。
In this way, the registration operation of the
図8は図5の第3の変形例でカメラシャッタに対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、携帯端末装置111に内蔵されるカメラ128に対して、「カメラシャッタ」の動作をさせる音声コマンド112として「カメラシャッタ」を音声コマンド登録部126Aに登録する場合について説明する。
ステップ71において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、カメラ128のアイコン選択を可能にする。
FIG. 8 is a control flowchart for explaining the registration of the
In
ステップ72において、カメラ128のアイコン選択で、カメラ128の画面が表示部119に表示され、カメラ128の画面にはカメラシャッタ、再生、ユーザ設定の一覧が表示される。操作キー113を用いて、表示部119で「カメラシャッタ」の選択を可能にする。本実施例では、「カメラシャッタ」に該当する文字表示について音声コマンド112を登録したいので、音声コマンド入力ボタン121を押下しながら、操作キー113を用いて「カメラシャッタ」に該当する文字表示を実行画面にしたがって押下し音声コマンド登録モードにする。この場合、実際にカメラシャッタが切られることはない。音声コマンド入力ボタン121が押されているからである。
In step 72, when the icon of the
ステップ73において、音声コマンド入力ボタンを押下しながら、「カメラシャッタ」を選択した場合、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「カメラシャッタ」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「カメラシャッタ」との音声コマンド112を音声認識処理する。
If “camera shutter” is selected while pressing the voice command input button in step 73, the voice command registration processing unit 141C displays a voice command registration screen on the
ステップ74において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「カメラシャッタ」との音声コマンド112を登録処理させる。
ステップ75において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In
In
このようにして、「カメラシャッタ」との音声コマンド112の登録動作は、カメラ128の機能の呼び出し動作とカメラシャッタの実行動作を登録したことになる。
撮影した写真の再生を行う場合にはカメラ128の再生に該当するキーについて音声コマンド112を登録する場合、同様にして、ステップ72〜75において、「サイセイ」との音声コマンド112の登録動作を行う。この登録動作は、カメラ機能の呼び出し動作と再生の動作を登録したことになる。
In this manner, the registration operation of the
In the case where the photographed picture is reproduced, when the
図9は図5の第4の変形例で無線LAN用の電波116によるサーバー136に対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、携帯端末装置111に内蔵される無線LAN用の電波116によるサーバー136へのアクセス機能を用いて、「プリンタ出力」を行う音声コマンド112として「プリンタシュツリョク」を音声コマンド登録部126Aに登録する場合について説明する。
FIG. 9 is a control flowchart for explaining the registration of the
ステップ81において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、近距離通信のアイコン選択を可能にする。
ステップ82において、近距離通信のアイコンを選択した場合、表示部119に近距離通信のメニュー画面が表示され、この近距離通信のメニューの画面には、赤外線通信、赤外線リモコン、BLUETOOTH、無線LANの機能の一覧が文字表示される。操作キー113を用いて、表示部119で無線LANの文字表示を選択することが可能になる。
In
If the near field communication icon is selected in
ステップ83において、無線LANの文字表示を選択した場合、表示部119に無線LANのメニューの画面が表示され、この無線LANのメニューの画面にはサーバー136に対するプリンタ出力、ファイル管理、ユーザ設定の機能の一覧が文字表示される。操作キー113を用いて、表示部119でプリンタ出力の文字表示を選択することが可能になる。本実施例では、「プリンタ出力」に該当する文字表示について音声コマンド112を登録したいので、音声コマンド入力ボタン121を押下しながら、操作キー113を用いて「プリンタ出力」に該当する文字表示を実行画面にしたがって押下し音声コマンド登録モードにする。この場合、実際にプリンタ出力されることはない。音声コマンド入力ボタン121が押されているからである。
If the character display of the wireless LAN is selected in
ステップ84において、音声コマンド入力ボタン121を押下しながら、プリンタ出力の文字表示を選択した場合、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「プリンタシュツリョク」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「プリンタシュツリョク」との音声コマンド112を音声認識処理する。
In
ステップ85において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「プリンタシュツリョク」との音声コマンド112を登録処理させる。
ステップ86において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In
In step 86, when the registration process of the
このようにして、「プリンタシュツリョク」との音声コマンド112の登録動作は、無線LANの機能の呼び出し動作とプリンタ出力を行う動作を登録したことになる。
さらに、サーバー136に対してファイル管理に該当するキーについて音声コマンド112を登録する場合、同様にして、ステップ83〜86において、「ファイルカンリ」との音声コマンド112の登録動作を行う。この登録動作は、サーバー136へのアクセス機能の呼び出し動作とファイル管理の動作を登録したことになる。
In this way, the registration operation of the
Further, when the
図10は図5の第5の変形例でBLUETOOTH用の電波117による冷蔵庫137に対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、携帯端末装置111に内蔵されるBLUETOOTH用の電波117による冷蔵庫137へのリモコン機能を用いて、「在庫管理」を行う音声コマンド112として「ザイコカンリ」を音声コマンド登録部126Aに登録する場合について説明する。
FIG. 10 is a control flowchart for explaining the registration of the
ステップ91において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、近距離通信のアイコン選択を可能にする。
ステップ92において、近距離通信のアイコン選択で、近距離通信のメニュー画面が表示部119に表示され、この近距離通信のメニューの画面には、赤外線通信、赤外線リモコン、BLUETOOTH、無線LANの機能の一覧が文字表示される。操作キー113を用いて、表示部119でBLUETOOTHの文字表示の選択を可能にする。
In step 91, first, when the user uses the
In step 92, the near-field communication menu screen is displayed on the
ステップ93において、BLUETOOTHの文字表示を選択した場合、表示部119にBLUETOOTHのメニューの画面が表示され、このBLUETOOTHのメニューの画面には冷蔵庫、照明を含む家電製品、ユーザ設定のリモコン機能の一覧が文字表示される。
ステップ94において、冷蔵庫137を選択した場合、表示部119に冷蔵庫のメニュー画面が表示され、在庫管理、鮮度管理、ユーザ設定の機能の一覧が文字表示される。操作キー113を用いて、表示部119で冷蔵庫の文字表示の選択を可能にする。本実施例では、「在庫管理」に該当する文字表示について音声コマンド112を登録したいので、音声コマンド入力ボタン121を押下しながら、操作キー113を用いて「在庫管理」に該当する文字表示を実行画面にしたがって押下し音声コマンド登録モードにする。この場合、BLUETOOTHの電波が実際に出力されることはない。音声コマンド入力ボタン121が押下されているからである。
When the BLUETOOTH character display is selected in step 93, the BLUETOOTH menu screen is displayed on the
If the
ステップ95において、音声コマンド入力ボタン121を押下しながら、「在庫管理」の文字表示を選択した場合、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「ザイコカンリ」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「ザイコカンリ」との音声コマンド112を音声認識処理する。
In
ステップ96において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「ザイコカンリ」との音声コマンド112を登録処理させる。
ステップ97において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In step 96, the voice command registration processing unit 141C causes the
In
このようにして、「ザイコカンリ」との音声コマンド112の登録動作は、冷蔵庫137のリモコン機能の呼び出し動作と在庫管理を行う動作を登録したことになる。
このようにして、「ザイコカンリ」との音声コマンド112の登録動作は、冷蔵庫137の機能の呼び出し動作と在庫管理を行う動作を登録したことになる。
さらに、冷蔵庫137に対して鮮度管理に該当するキーについて音声コマンド112を登録する場合、同様にして、ステップ94〜97において、「センドカンリ」との音声コマンド112の登録動作を行う。この登録動作は、冷蔵庫137へのリモコン機能の呼び出し動作と鮮度管理の動作を登録したことになる。
In this way, the registration operation of the
In this way, the registration operation of the
Further, when the
さらに、家電製品として図示しない照明に対して照明電源に該当するキーについて音声コマンド112を登録する場合、同様にして、ステップ93〜97において、「テントウ」又は「ショウトウ」との音声コマンド112の登録動作を行う。この登録動作は、照明へのリモコン機能の呼び出し動作と照明電源の動作を登録したことになる。
Further, when the
図11は図5の第6の変形例でメール読み上げに対する音声コマンド112の登録を説明する制御フロー図である。一例として、本図を用いて、メール読み上げの機能を用いて、「メール読み上げ」を行う音声コマンド112として「メールヨミアゲ」を音声コマンド登録部126Aに登録する場合について説明する。
ステップ101において、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、メールのアイコン選択を可能にする。
FIG. 11 is a control flowchart for explaining the registration of the
In step 101, first, the function is displayed on the menu screen of the
ステップ102において、メールのアイコン選択で、メールのメニュー画面が表示部119に表示され、このメールのメニューの画面には、メール読み上げの機能が文字表示される。操作キー113を用いて、メール読み上げの文字表示の選択を可能にする。本実施例では、「メール読み上げ」に該当する文字表示について音声コマンド112を登録したいので、音声コマンド入力ボタン121を押下しながら、操作キー113を用いて「メール読み上げ」に該当する文字表示を実行画面にしたがって押下し音声コマンド登録モードにする。この場合、実際にメール読み上げが実行されることはない。音声コマンド入力ボタン121が押されているからである。
In
ステップ103において、音声コマンド入力ボタン121を押下しながら、「メール読み上げ」の文字表示を選択した場合、音声コマンド登録処理部141Cは、表示部119に音声コマンド登録の画面を表示させ、押下すべきキーの内容確認を促し、画面の表示に従い、操作キー113を用いて「録音」キーを押下して、内側マイクロフォン122に向って、画面が切り替わってから一定時間内(例えば5秒以内)に、例えば、「メールヨミアゲ」と音声コマンド112を発音させる。録音後音声コマンド登録処理部141Cは「メールヨミアゲ」との音声コマンド112を音声認識処理する。
In
ステップ104において、音声コマンド登録処理部141Cは、音声認識処理により認識した結果を表示部119に表示させる。認識結果に問題がなく、操作キー113を用いて登録キーが押下された場合には、メモリ126の音声コマンド登録部126Aに「メールヨミアゲ」との音声コマンド112を登録処理させる。
ステップ105において、音声コマンド112の登録処理が完了すると、音声コマンド登録処理部141Cは表示部119に登録完了の表示を行わせる。「OK」キーを押下することにより、機能表示の画面が携帯端末装置111の待ち受け画面になる。
In
In step 105, when the registration process of the
このようにして、「メールヨミアゲ」との音声コマンド112の登録動作は、メール機能の呼び出し動作とメール読み上げを行う動作を登録したことになる。
次に、音声コマンド処理部141Bの動作例を説明する
図12は図3における制御部141の音声コマンド処理部141Bの動作画面を説明する制御フロー図である。
In this manner, the registration operation of the
Next, an operation example of the voice
本図に示すように、ステップ201A、201Bにおいて、まず、ユーザによる操作キー113の使用で、表示部119のメニューの画面に機能表示が行われ、音声入力のアイコンの選択を可能にする。
ステップ202において、音声コマンド入力ボタン121を押下しながら、音声入力のアイコンの選択で、音声コマンド処理モードになり、音声コマンドメニュー画面が表示される。音声コマンドメニュー画面には音声コマンド登録処理部141Cで登録処理された機能名、読み出し動作名が、例えば、以下のように、表示される。
As shown in this figure, in steps 201A and 201B, first, the function display is performed on the menu screen of the
In
機能名 呼び出し名
1.カメラ ・カメラシャッタ
・サイセイ
2.テレビリモコン ・テレビデンゲン
・ボリュームアップ
・ボリュームダウン
・チャンネルアップ
・チャンネルダウン
3.レイゾウコ ・ザイコカンリ
リモコン ・センドカンリ
4.インターネット ・テンキヨホウ
5.デンワチョウ ・ジホウ
6.メール ・メールヨミアゲ
7.ショウメイ ・ショウメイデンゲン
リモコン
8.ムセンラン ・プリンタシュツリョク
・ファイルカンリ
Function name Call name Camera and camera shutter
・ Seisei 2. TV remote control
·volume up
・ Volume down
・ Channel up
-Channel down 3. Reizoko ・ Zaikokanri Remote control ・ Sendkanri4. Internet ・ Tenkiyohou 5. Denwacho Jihou 6. Mail ・ Mail Yomiage7. Shomei Shomeidengen Remote control
8). Musenlan ・ Printer
・ File handling
このように、ユーザの携帯端末装置111の音声コマンド登録処理部141Cに登録されている全ての音声コマンド112を一覧表示するメニューを設け、一覧管理が可能になる。音声コマンドメニューを選択し、一覧表示から目的の音声コマンド112を、操作キー113を用いて、選択実行することが可能になる。また、ユーザが音声コマンド112である読み出し名を覚えていなくでも、表示を見れば、読み出し動作名を発音することも可能である。
音声コマンド処理部141Bは、ユーザがテレビデンゲンと発音すれば、この音声認識を行い、音声コマンド登録部126Aに登録されている音声コマンド112と比較し、一致し、テレビデンゲンの音声コマンド112を後述するように受理すると、テレビ電源のON、OFFの動作の実行を開始する。
このように、少ない操作で機能を実行できるショートカット機能のような使い方ができる。
In this way, a menu for displaying a list of all voice commands 112 registered in the voice command registration processing unit 141C of the user's portable
The voice
In this way, it can be used like a shortcut function that can execute a function with few operations.
なお、一覧表示のメニューには編集機能があり、一覧表示の配列を編集することが可能である。
ステップ203において、音声コマンド処理部141Bは、例えば、テレビデンゲンとの音声コマンド112を受理すれば、表示部119にテレビリモコンが表示され、テレビデンゲンのON、OFFの動作が表示される。
The list display menu has an editing function, and the array of the list display can be edited.
In
また、音声コマンド処理部141Bは、例えば、ユーザがメールヨミアゲと発音すれば、この音声認識を行い、音声コマンド登録部126Aに登録されている音声コマンド112と比較し、一致し、メールヨミアゲの音声コマンド112を受理すれば、メールの音声合成を行い、メールの読み上げを実行する。
図13は図12における制御部141の音声コマンド処理部141Bの動作例を説明するフローチャートを示す図である。
Further, the voice
FIG. 13 is a flowchart illustrating an operation example of the voice
ステップ201において、まず、音声コマンド処理部141Bは、マイクロフォン122又はマイクロフォン124から入力した音声を音声コマンド112として認識させるため、ユーザが音声コマンド入力ボタン121を押下した場合にはステップ202に進む。ユーザが音声コマンド入力ボタン121を押下し音声コマンド112を発音した後に音声コマンド入力ボタン121の押下を解除した場合にはステップ215に進む。
In step 201, first, the voice
ステップ202において、音声コマンド処理部141Bは、音声コマンド入力ボタン121が押下された場合、スピーカ/マイク切替部141Aに対して、開閉検出センサ127の検出情報により携帯端末装置111の筐体が開閉状態か否かを判断させる。
ステップ203において、音声コマンド処理部141Bは、携帯端末装置111の筐体が開いた状態の場合、マイク/スピーカ系統切替スイッチ132、133を切り替えし、内側マイクロフォン122、内側スピーカ123を有効にし、ステップ205に進む。
In
In
ステップ204において、音声コマンド処理部141Bは、携帯端末装置111の筐体が閉じた状態の場合、マイク/スピーカ系統切替スイッチ132、133を切り替え、外側マイクロフォン124、外側スピーカ125を有効にする。
ステップ205において、音声コマンド処理部141Bは音声コマンド入力カウンタ(図示しない)のインクリメント処理を行う。
In step 204, when the casing of the mobile
In
ステップ206において、音声コマンド処理部141Bは、内側マイクロフォン122又は外側マイクロフォン124から音声コマンド112の入力処理を行う。
ステップ207において、音声コマンド処理部141Bは音声コマンド入力カウンタの上限値を越えたか否かを判断する。超えない場合、ステップ208に進まず、処理を終了し、超えるのを待ち又は音声コマンド入力ボタン121の押下の解除を待つ。
In
In
ステップ208において、音声コマンド処理部141Bは、音声コマンド入力カウンタの上限値を越えた場合、入力した音声コマンド112について音声認識解析の処理を行う。
ステップ209において、音声コマンド処理部141Bは、音声認識解析の処理をした結果、メモリ126の音声コマンド登録部126Aに、図5〜図11に説明したように、予め登録されている音声コマンド112と一致するか否かを判断する。一致しない場合、ステップ212に進む。
In
In
ステップ210において、音声コマンド処理部141Bは、一致する場合、音声コマンド112を受理した旨の合図としてコマンド受理通知音(ピピッ)を内側スピーカ123又は外側スピーカ125から出力し鳴らす。
ステップ211において、音声コマンド処理部141Bは、音声コマンド112に該当し、予め登録しておいた機能、操作を実行し、本処理を終了する。
In step 210, if they match, the voice
In
ステップ212において、音声コマンド処理部141Bは、音声コマンド112を受理しなかった合図としてコマンド不受理通知音(ピピピ)を内側スピーカ123又は外側スピーカ125から出力し鳴らす。
ステップ213において、音声コマンド処理部141Bは、現在動作中の音声コマンド処理があれば、動作を終了する。
In
In step 213, the voice
ステップ214において、音声コマンド処理部141Bは音声コマンド入力カウンタ=0とし、初期化を行い、本処理を終了する。
ステップ215において、音声コマンド入力カウンタ=0か否かを判断する。音声コマンド入力カウンタ=0なら処理を終了する。音声コマンド入力カウンタ=0でない場合にはステップ208に進む。ユーザが音声コマンド112の入力を終えて、音声コマンド入力ボタン121の押下を解除した場合、音声コマンド112の音声認識解析が行われる。
In step 214, the voice
In
したがって、本発明によれば、携帯端末装置の小さな操作部、表示部によるマルチタスクの操作性の困難性を改善する。画面表示を必要としない音声コマンドによる機能実行と、キー操作による機能実行が独立して実行できるので、小さな筐体でも容易に2つの機能を同時に利用できるようになるためである。
また、携帯端末装置の有する機能/操作全般に対して音声コマンドが登録できるので、多機能で複数の通信手段をもった携帯端末装置においても、目的の機能実行のためにその手段を気にすることなく、ユーザの嗜好に合わせて操作性を向上することができる。
Therefore, according to the present invention, the difficulty of multitasking operability by the small operation unit and display unit of the portable terminal device is improved. This is because the function execution by the voice command that does not require the screen display and the function execution by the key operation can be executed independently, so that the two functions can be easily used even in a small casing.
In addition, since voice commands can be registered for all functions / operations of the portable terminal device, even in a portable terminal device having multiple functions and a plurality of communication means, the means is taken care of for executing the desired function. Therefore, operability can be improved according to the user's preference.
また、ボタン操作と音声入力のみでユーザの携帯端末装置が有する機能を実行/終了できるので、暗闇においても容易に操作できる。
また、携帯端末装置の筐体を閉じたままでユーザの携帯端末装置が有する機能を実行できるので、画面表示、バックライトなどの使用が少なくて済み省電力化できる。
次に、図12の動作例を参照して、代表的な例の説明を行う。
In addition, since the functions of the user's portable terminal device can be executed / terminated only by a button operation and voice input, it can be easily operated even in the dark.
In addition, since the functions of the user's portable terminal device can be executed with the casing of the portable terminal device closed, the use of screen display, backlight, etc. can be reduced, and power can be saved.
Next, a representative example will be described with reference to the operation example of FIG.
図13の動作例を参照して、時報に対する音声コマンド112による機能の実行処理例を以下に説明する。
例えば、ユーザが操作キー113によりメールを作成しながら局番117の時報を聞く場合、ユーザは音声コマンド入力ボタン121を押下したまま(ステップ201:Y)、所定時間内に予め登録しておいた音声コマンド112「ジホウ」を第1系統の内側マイクロフォン122に向って発音し、音声データの入力を行う(ステップ202〜206)。
With reference to the operation example of FIG. 13, the example of the function execution process by the audio |
For example, when the user listens to the time signal of the
ユーザが所定時間内に「ジホウ」を発音し終え押下していた音声コマンド入力ボタン121を解除した場合(ステップ201、215)、入力された音声データは音声認識による音声コマンド解析処理が行われる(ステップ208)。
解析の結果、ユーザが予め登録しておいた音声コマンド112と一致すると、通知音「ピピッ」(ステップ210)と共に音声コマンド112「ジホウ」の対応動作として、ユーザが予め登録しておいた、局番117のダイヤル実行を開始する(ステップ211)。
When the user releases the voice
As a result of the analysis, if the
時報を聞き終えた後、通話中の電話回線を切断する場合は、ユーザは無言のまま音声コマンド入力ボタン121のみを短時間押下することで、終話処理することが可能になる。
無言のまま音声コマンド入力ボタン121を短時間押下することで、音声コマンド入力ボタン121の開放時(ステップ201:N)、音声コマンド入力カウンタが0でない判別(ステップ215)となり、また無声入力のため音声コマンド解析処理(ステップ208:N)となるため、コマンド不受理の判断(ステップ209)となるため、コマンド不受理の通知音「ピピピ」(ステップ212)と共に、現在動作中の音声コマンド112「ジホウ」が強制終了(ステップ213)することになるためである。以下同様である。
When the telephone line during a call is disconnected after having finished listening to the time signal, the user can perform the end-of-call process by pressing only the voice
When the voice
このようにして、操作キー113でメールを作成しつつ音声入力でジホウを聞くことが可能になる。
In this way, it is possible to listen to Jiho by voice input while creating a mail with the
図13の動作例を参照して、テレビジョン135に対する音声コマンド112による機能の実行処理例を以下に説明する。
例えば、ユーザが操作キー113によりメールを作成しながらテレビジョン135を見る場合、ユーザは音声コマンド入力ボタン121を押下したまま(ステップ201:Y)、所定時間内に予め登録しておいた音声コマンド112「テレビデンゲン」を第1系統の内側マイクロフォン122に向って発音し、音声データの入力を行う(ステップ202〜206)。
With reference to the operation example of FIG. 13, an example of a function execution process by the
For example, when the user views the
ユーザが所定時間内に「テレビデンゲン」を発音し終え押下していた音声コマンド入力ボタン121を解除した場合(ステップ201、215)、入力された音声データは音声認識による音声コマンド解析処理が行われる(ステップ208)。
解析の結果、ユーザが予め登録しておいた音声コマンド112と一致すると、通知音「ピピッ」(ステップ210)と共に音声コマンド112「テレビデンゲン」の対応動作として、ユーザが予め登録しておいた、テレビジョン135の電源がON又はOFFする実行を開始する(ステップ211)。
When the user releases the voice
As a result of the analysis, when the
メール作成後には携帯端末装置111の筐体を閉じると、第2系統の外側マイクロフォン124に切り替わり、音声入力でテレビジョン135のボリューム調整、チャンネル切り替えのリモコンとして使用可能である。このように、携帯端末装置111の筐体を閉じてもリモコンの機能を持たせるので、表示部119のLCDのバックライトの電力消費を防止できる。
When the case of the portable
このようにして、操作キー113でメールを作成しながら音声入力でテレビジョン135のリモコン制御を行うことが可能になる。
In this way, it is possible to perform remote control of the
図13の動作例を参照して、カメラ128に対する音声コマンド112による機能の実行処理として、操作キー113でメール作成しながら、音声コマンド入力ボタン121を押下し「カメラシャッタ」の音声入力でカメラ128により撮影を行い撮影した写真を、操作キー113でメールに貼り付けることができる。
Referring to the operation example of FIG. 13, as a function execution process by the
図13の動作例を参照して、サーバー136に対する音声コマンド112による機能の実行処理例として、操作キー113でカメラ128の写真の再生をしながら、音声コマンド入力ボタン121を押下し「プリンタシュツリョク」の音声入力で必要な写真をサーバー136に対してプリンタ出力を行うことができる。
Referring to the operation example of FIG. 13, as an example of function execution processing by the
図13の動作例を参照して、冷蔵庫137に対する音声コマンド112による機能の実行処理として、操作キー113で携帯電話をしながら、音声コマンド入力ボタン121を押下し「ザイコカンリ」の音声入力で冷蔵庫137に在る料理の素材の種類、量の情報を得て、不足している素材の配達、買出しを通話の相手に頼むことができる。
Referring to the operation example of FIG. 13, as a function execution process by the
図13の動作例を参照して、携帯端末装置111の筐体を閉じた状態で、テレビジョン135、冷蔵庫137に対して音声コマンド入力ボタン121を押下して外側マイクロフォン124を用いて音声入力によりリモコン機能を実行させることができる。
通常、携帯端末装置111のリモコン機能は筐体を開いて操作キー113を用いて行うが、操作キー113を使用する必要がなくなるためである。
Referring to the operation example of FIG. 13, with the casing of the portable
Normally, the remote control function of the mobile
図3において、制御部141の音声コマンド処理部141Bは音声認識処理による音声コマンド解析処理を行うとして説明したが、さらに、声紋解析機能を備え、音声コマンド登録処理部141Cは、メモリ126の音声コマンド登録部126Aに内側マイクロフォン122又は外側マイクロフォン124から入力したユーザの音声の声紋を登録し、音声コマンド処理部141Bは、音声コマンドの音声認識処理の前に内側マイクロフォン122又は外側マイクロフォン124から入力した音声の声紋の解析を行う。これにより、第3者による不正使用、隣人の声などによる誤動作を防止することが可能になる。
In FIG. 3, the voice
図13において、音声コマンド処理部141Bが音声コマンド112の解析処理の結果、音声コマンド112が一致し、音声コマンド112を受理した場合、音声コマンド受理通知音「ピピッ」を内側スピーカ123又は外側スピーカ125より鳴らすと説明したが、音声コマンド処理部141Bは、音声コマンド通知音「ピピッ」に代わり、50音の音声データによる音声合成により受理した音声コマンド112、例えば、「ジホウ」などを内側スピーカ123又は外側スピーカ125から復唱させる。これにより、正しく音声コマンド112が受理されたかどうかをユーザ本人が確認することができる。
In FIG. 13, when the
図1において、内側マイクロフォン122又は外側マイクロフォン124から入力した音声を音声コマンド112として認識するために音声コマンド入力ボタン121を押下するとして説明したが、音声コマンド入力ボタン121は専用のボタンである必要は無く、既存のテンキー、機能キー等を含んだ操作キー113、ポインティングデバイス等で代替してもよい。これにより、システムの簡素化が図れる。
In FIG. 1, it has been described that the voice
以上の説明は折り畳み式の携帯端末装置について行ったが、本発明は、これに限定されず、折りたたみ式ではない棒状の携帯端末装置にも利用可能であり、さらに、携帯電話機、PHS(簡易携帯電話機)、PDA(携帯情報端末)にも利用可能である。 The above description has been given with respect to a foldable portable terminal device, but the present invention is not limited to this, and can also be applied to a rod-shaped portable terminal device that is not foldable. It can also be used for a telephone) and a PDA (personal digital assistant).
111…携帯端末装置
112…音声コマンド
113…操作キー
114…基地局に対する電波
115…赤外線
116…無線LAN用の電波
117…BLUETOOTH用の電波
118…アンテナ
119…表示部
121…音声コマンド入力ボタン
122…内側マイクロフォン
123…内側スピーカ
124…外側マイクロフォン
125…外側スピーカ
126…メモリ
126A…音声コマンド登録部
127…開閉検出センサ
128…カメラ
129…Ir入出力回路
130…BLUETOOTH回路
131…マイク/スピーカ系統切替信号
132、133…マイク/スピーカ系統切替スイッチ
134…電話回線/インターネット
135…テレビジョン
136…サーバー
137…冷蔵庫
140…無線部
141…制御部
141A…スピーカ/マイク切替部
141B…音声コマンド処理部
141C…音声コマンド登録処理部
111 ... mobile
Claims (19)
前記携帯端末装置の機能の呼び出し、機能の実行を定義した音声コマンドを登録する音声コマンド登録部と、
押下期間中に前記携帯端末装置のマイクロフォンからの音声を音声コマンドとして入力するための音声コマンド入力ボタンと、
前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンに入力した音声を音声認識処理し、認識結果を音声コマンドとして前記音声コマンド登録部に登録させる音声コマンド登録処理部と、
前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンから音声コマンドを入力し、前記音声コマンド入力ボタンの押下解除後に入力した音声コマンドを音声認識処理し、認識結果が前記音声コマンド登録部に登録されている音声コマンドと一致し受理された場合には受理した音声コマンドに対応する機能を呼び出し、機能の操作を実行する音声コマンド処理部とを備えることを特徴とする、音声認識機能を備えた携帯端末装置のマルチタスクシステム。 In a multitask system of a mobile terminal device having a voice recognition function,
A voice command registration unit for registering a voice command that defines function call and function execution of the mobile terminal device;
A voice command input button for inputting voice from the microphone of the portable terminal device as a voice command during the pressing period;
A voice command registration processing unit that performs voice recognition processing on voice input to the microphone during a period during which the voice command input button is pressed, and registers a recognition result in the voice command registration unit as a voice command;
A voice command is input from the microphone during the pressing period of the voice command input button, the voice command input after releasing the pressing of the voice command input button is subjected to voice recognition processing, and a recognition result is registered in the voice command registration unit. A mobile terminal having a voice recognition function, comprising: a voice command processing unit that calls a function corresponding to the received voice command and executes a function operation when the voice command is received in accordance with the received voice command Multitask system of equipment.
前記携帯端末装置の複数の機能から1つを選択し、音声コマンド入力ボタンの押下期間中に前記携帯端末装置のマイクロフォンから音声を入力する工程と、
入力した前記音声を音声認識処理する工程と、
音声認識処理した認識結果を、前記携帯端末装置の機能の呼び出し、機能の実行を定義した音声コマンドとして登録する工程と、
前記音声コマンド入力ボタンの押下期間中に前記マイクロフォンに音声コマンドを入力する工程と、
前記音声コマンド入力ボタンの押下解除後に入力した音声コマンドの音声認識処理を行う工程と、
音声コマンドを音声認識処理した認識結果と登録された音声コマンドが一致する場合に音声コマンドを受理する工程と、
受理した音声コマンドに対応する前期携帯端末装置の機能を呼び出し、機能の操作を実行する工程とを備えることを特徴とする、音声認識機能を備えた携帯端末装置のマルチタスク方法。 In a multitasking method of a mobile terminal device having a voice recognition function,
Selecting one of a plurality of functions of the mobile terminal device and inputting a voice from the microphone of the mobile terminal device during a period of pressing a voice command input button;
Voice recognition processing of the input voice;
Registering the recognition result of the speech recognition processing as a voice command that defines the function call of the mobile terminal device and the execution of the function;
Inputting a voice command to the microphone during a period of pressing of the voice command input button;
Performing voice recognition processing of a voice command input after releasing the voice command input button;
Accepting a voice command when the recognition result obtained by performing voice recognition processing on the voice command matches the registered voice command;
A multitasking method for a mobile terminal device having a voice recognition function, comprising: calling a function of the mobile terminal device corresponding to the received voice command and executing a function operation.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005032007A JP2006221270A (en) | 2005-02-08 | 2005-02-08 | Multitask system and method of mobile terminal device with voice recognition function |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005032007A JP2006221270A (en) | 2005-02-08 | 2005-02-08 | Multitask system and method of mobile terminal device with voice recognition function |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006221270A true JP2006221270A (en) | 2006-08-24 |
Family
ID=36983583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005032007A Pending JP2006221270A (en) | 2005-02-08 | 2005-02-08 | Multitask system and method of mobile terminal device with voice recognition function |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006221270A (en) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009049653A (en) * | 2007-08-17 | 2009-03-05 | Mobi Techno:Kk | Telephone terminal unit and speech recognition system using the same |
JP2012088813A (en) * | 2010-10-15 | 2012-05-10 | Kyocera Corp | Electronic device and control method |
WO2014054794A1 (en) * | 2012-10-05 | 2014-04-10 | 京セラ株式会社 | Electronic apparatus, control method, and control program |
JP2016502302A (en) * | 2012-12-07 | 2016-01-21 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | Audio background control method, mobile terminal, and non-transitory computer-readable storage medium |
JP2019087994A (en) * | 2017-10-19 | 2019-06-06 | リブレ ワイヤレス テクノロジーズ インコーポレイテッドLibre Wireless Technologies, Inc. | Multi-protocol audio/voice iot device and related system |
JP2019087927A (en) * | 2017-11-09 | 2019-06-06 | 東京瓦斯株式会社 | Infrared operation system |
JP2019135831A (en) * | 2012-09-20 | 2019-08-15 | 三星電子株式会社Samsung Electronics Co.,Ltd. | User device situation recognition service providing method and apparatus |
JP2019185733A (en) * | 2018-04-11 | 2019-10-24 | 百度在線網絡技術(北京)有限公司 | Voice control method, terminal equipment, cloud server and system |
US10684821B2 (en) | 2012-09-20 | 2020-06-16 | Samsung Electronics Co., Ltd. | Context aware service provision method and apparatus of user device |
US11227595B2 (en) | 2018-08-27 | 2022-01-18 | Kyocera Corporation | Electronic device with speech recognition function, control method of electronic device with speech recognition function, and recording medium |
US11410647B2 (en) | 2018-08-27 | 2022-08-09 | Kyocera Corporation | Electronic device with speech recognition function, control method of electronic device with speech recognition function, and recording medium |
JP7475079B2 (en) | 2020-09-08 | 2024-04-26 | 株式会社ユピテル | Apparatus and program |
US12002463B2 (en) | 2018-03-07 | 2024-06-04 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
-
2005
- 2005-02-08 JP JP2005032007A patent/JP2006221270A/en active Pending
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009049653A (en) * | 2007-08-17 | 2009-03-05 | Mobi Techno:Kk | Telephone terminal unit and speech recognition system using the same |
JP2012088813A (en) * | 2010-10-15 | 2012-05-10 | Kyocera Corp | Electronic device and control method |
JP2019135831A (en) * | 2012-09-20 | 2019-08-15 | 三星電子株式会社Samsung Electronics Co.,Ltd. | User device situation recognition service providing method and apparatus |
US11907615B2 (en) | 2012-09-20 | 2024-02-20 | Samsung Electronics Co., Ltd. | Context aware service provision method and apparatus of user device |
US11048474B2 (en) | 2012-09-20 | 2021-06-29 | Samsung Electronics Co., Ltd. | Context aware service provision method and apparatus of user device |
US10684821B2 (en) | 2012-09-20 | 2020-06-16 | Samsung Electronics Co., Ltd. | Context aware service provision method and apparatus of user device |
JP2014075104A (en) * | 2012-10-05 | 2014-04-24 | Kyocera Corp | Electronic apparatus, control method, and control program |
WO2014054794A1 (en) * | 2012-10-05 | 2014-04-10 | 京セラ株式会社 | Electronic apparatus, control method, and control program |
JP2016502302A (en) * | 2012-12-07 | 2016-01-21 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | Audio background control method, mobile terminal, and non-transitory computer-readable storage medium |
JP2019087994A (en) * | 2017-10-19 | 2019-06-06 | リブレ ワイヤレス テクノロジーズ インコーポレイテッドLibre Wireless Technologies, Inc. | Multi-protocol audio/voice iot device and related system |
JP7410640B2 (en) | 2017-10-19 | 2024-01-10 | リブレ ワイヤレス テクノロジーズ インコーポレイテッド | Multiprotocol audio/voice IoT devices and related systems |
JP2019087927A (en) * | 2017-11-09 | 2019-06-06 | 東京瓦斯株式会社 | Infrared operation system |
US12002463B2 (en) | 2018-03-07 | 2024-06-04 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
JP2019185733A (en) * | 2018-04-11 | 2019-10-24 | 百度在線網絡技術(北京)有限公司 | Voice control method, terminal equipment, cloud server and system |
US11127398B2 (en) | 2018-04-11 | 2021-09-21 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method for voice controlling, terminal device, cloud server and system |
US11410647B2 (en) | 2018-08-27 | 2022-08-09 | Kyocera Corporation | Electronic device with speech recognition function, control method of electronic device with speech recognition function, and recording medium |
US11227595B2 (en) | 2018-08-27 | 2022-01-18 | Kyocera Corporation | Electronic device with speech recognition function, control method of electronic device with speech recognition function, and recording medium |
JP7475079B2 (en) | 2020-09-08 | 2024-04-26 | 株式会社ユピテル | Apparatus and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006221270A (en) | Multitask system and method of mobile terminal device with voice recognition function | |
JP4975813B2 (en) | Remote control by voice | |
KR100804855B1 (en) | Method and apparatus for a voice controlled foreign language translation device | |
CN106791921A (en) | The processing method and processing device of net cast | |
US20070094613A1 (en) | Method and apparatus for establishing and displaying wait screen image in portable terminal | |
KR100630200B1 (en) | Method for operating calculator mode in the portable terminal | |
JP2007280179A (en) | Portable terminal | |
CN110349578A (en) | Equipment wakes up processing method and processing device | |
JP2007310650A (en) | Information processing apparatus | |
CN106775377A (en) | The control method of gesture identifying device, equipment and gesture identifying device | |
CN104679386B (en) | The method and apparatus of recording processing | |
US8295449B2 (en) | Method and system for creating audio identification messages | |
JP2002247670A (en) | Remote controller and mobile telephone | |
WO2020133864A1 (en) | Terminal control method employing protective cover, mobile terminal, and computer storage medium | |
CN109325337A (en) | Unlocking method and device | |
CN108766427A (en) | Sound control method and device | |
CN108446226A (en) | Using abnormal processing method | |
JP3571254B2 (en) | Intercom equipment | |
CN106789554A (en) | The method and device of short message treatment | |
CN110290526A (en) | A kind of data access method, device and medium | |
CN108735212A (en) | Sound control method and device | |
CN104660819B (en) | Mobile device and the method for accessing file in mobile device | |
US7136677B2 (en) | Portable terminal | |
CN111381688B (en) | Method and device for real-time transcription and storage medium | |
KR100678103B1 (en) | Method for displaying menu in the mobile phone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081014 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090225 |