JP2007047671A - Pattern recognition device and pattern recognition method - Google Patents

Pattern recognition device and pattern recognition method Download PDF

Info

Publication number
JP2007047671A
JP2007047671A JP2005234445A JP2005234445A JP2007047671A JP 2007047671 A JP2007047671 A JP 2007047671A JP 2005234445 A JP2005234445 A JP 2005234445A JP 2005234445 A JP2005234445 A JP 2005234445A JP 2007047671 A JP2007047671 A JP 2007047671A
Authority
JP
Japan
Prior art keywords
pattern recognition
command
input information
user input
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005234445A
Other languages
Japanese (ja)
Inventor
Kenichiro Nakagawa
賢一郎 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005234445A priority Critical patent/JP2007047671A/en
Publication of JP2007047671A publication Critical patent/JP2007047671A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To prevent an excessive setting value that can affect subsequent operations from being set, when the user sets the operating parameters of a pattern recognition utilizing pattern recognition. <P>SOLUTION: When a user's input is decided as an operation parameter change command of a pattern recognition by the pattern recognition, pattern recognition is conducted again for the user's input which has been held, using the operation parameter changed. If the results of the two pattern recognitions are different, it is decided that the operation parameter of the pattern recognition set by the user is an excessive value, and warning information is presented to the user. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、音声、手書き文字といった情報を入力し、それをパタン認識する装置、方法およびその方式を記録した媒体に関するものである。   The present invention relates to an apparatus and method for inputting information such as voice and handwritten characters and recognizing the pattern, and a medium recording the method.

近年、パタン認識の技術発展は目覚しく、様々な製品への搭載が進んでいる。
一般的なパタン認識とは、ユーザが入力した特徴パラメータを、前もって収集された標準パターン(認識対象)と比較し、最も尤度の高いスコアを出した標準パターンを認識結果として出力する処理である。このパタン認識を用いた情報入力は、キーボードを介したテキスト入力のような画一的な入力とは異なり、ある程度の「入力揺れ」に対して寛容的であるという特徴がある。
In recent years, the technology for pattern recognition has been remarkably developed, and it has been installed in various products.
General pattern recognition is a process in which a feature parameter input by a user is compared with a standard pattern (recognition target) collected in advance, and a standard pattern with the highest likelihood score is output as a recognition result. . The information input using pattern recognition is characterized by being tolerant to a certain degree of “input fluctuation”, unlike a uniform input such as text input via a keyboard.

例えば、音声をパタン認識する音声認識という技術がある。この認識技術では、標準パタンを収集した話者とは異なる話者の発声、ある程度の言いよどみ、アクセントの異なりも吸収して認識を行うことが可能である。このように、「入力揺れ」を吸収し得るパタン認識技術は、子供やお年よりといった機器に不慣れなユーザでも操作しやすい入力装置を提供する重要な基盤要素である。   For example, there is a technique called voice recognition that recognizes a voice pattern. With this recognition technology, it is possible to perform recognition by absorbing the utterance of a speaker different from the speaker who collected the standard pattern, a certain amount of stagnation, and a difference in accent. As described above, the pattern recognition technology capable of absorbing “input fluctuation” is an important basic element for providing an input device that can be easily operated even by a user who is unfamiliar with devices such as children and the elderly.

現在、一般的に用いられているパタン認識技術とは、音声を認識する音声認識技術、動的/静的な手書き文字を認識する手書き文字認識、手やマウスの軌跡を動きを認識するジェスチャ認識、顔や虹彩といったユーザの身体的な特徴を認識するバイオメトリクス認識等がある。これらのいくつかは既に実際に製品化されている。   Currently used pattern recognition technologies are: speech recognition technology for recognizing speech, handwritten character recognition for recognizing dynamic / static handwritten characters, and gesture recognition for recognizing movements of the hand and mouse trajectories. And biometrics recognition for recognizing a user's physical features such as face and iris. Some of these have already been commercialized.

又、従来例としては、例えば特許文献1と特許文献2をあげることが出来る。
特開2005−117541号公報 特開2003−67167号公報
Moreover, as a prior art example, patent document 1 and patent document 2 can be mention | raise | lifted, for example.
JP 2005-117541 A JP 2003-67167 A

ここでは、パタン認識処理として音声認識を例として考える。   Here, speech recognition is considered as an example of pattern recognition processing.

ユーザは、「右」や「コピー開始」のように、機器を操作するコマンドを音声で入力できる一方、「枝狩りパラメータを20に設定」といったパタン認識処理の動作に関わる設定コマンドを発声することも当然可能である。   The user can input a command for operating the device, such as “right” or “start copying”, while uttering a setting command related to the operation of the pattern recognition process, such as “set branching parameter to 20”. Of course it is also possible.

ここで例として挙げた枝狩り処理とは、パタン認識で用いられる処理高速化の技術である。この枝狩り処理は、どの程度行うかを枝狩りパラメータという数値で制御することが可能である。一般的に枝狩り処理を強く効かせると認識速度は向上するが、認識精度は下がる傾向がある。このため、あまり過剰な値を設定してしまうと、以後のユーザ入力が全く成功しなくなる恐れがある。   The branch picking process given here as an example is a technique for speeding up the process used in pattern recognition. How much this branch hunting process is performed can be controlled by a numerical value called a branch hunting parameter. In general, when the branch picking process is strongly applied, the recognition speed is improved, but the recognition accuracy tends to be lowered. For this reason, if an excessive value is set, subsequent user input may not be successful at all.

このようなシステムの動作に致命的な影響が出る設定コマンドに対しては、下のような対話を用いて、ユーザの確認をとることが一般的である。   For setting commands that have a fatal effect on the operation of such a system, it is common to confirm the user using the following dialogue.

ユーザ:「枝狩りパラメータを20に設定」
システム:「枝狩りパラメータを20に変更すると、以後の動作に支障が出る恐れがありますがよろしいですか?」
ユーザ :「はい」
このような対話で確認を取ることは、過剰な設定がされることを未然に防ぐという意味で効果がある。しかし、ユーザの声質や機器が置かれた環境によって、どのような値で支障が出るかどうかは異なる。例えば、ユーザの声質が標準パタンとマッチしており、環境雑音が比較的少ない場合、強めの枝狩り処理を行ったとしても、以後の認識に支障が出ることは少ない。逆に、ユーザの声質が標準パタンからかけ離れている場合や、加算性/乗算性雑音が多い環境では、控えめな枝狩りパラメータであっても以後の認識動作が全く成功しない恐れがある。
User: “Set branch picking parameter to 20”
System: “Is it possible to change the branch picking parameter to 20?
User: “Yes”
Taking confirmation in such a dialogue is effective in the sense of preventing an excessive setting. However, depending on the voice quality of the user and the environment in which the device is placed, the value at which the trouble occurs varies. For example, when the user's voice quality matches the standard pattern and the environmental noise is relatively low, even if a strong branch hunting process is performed, the subsequent recognition hardly occurs. On the other hand, when the user's voice quality is far from the standard pattern or in an environment where there are many additive / multiplicative noises, there is a possibility that the subsequent recognition operation will not succeed at all even with a modest branch hunting parameter.

このように、パタン認識用パラメータのどの値までが安全であるかは、装置を設計する段階で決めることはできない。そして、このことを考慮し、パタン認識用パラメータをユーザに設定させる先行技術は存在しない。   In this way, it is impossible to determine up to which value of the pattern recognition parameter is safe at the stage of designing the apparatus. In view of this, there is no prior art that allows a user to set a pattern recognition parameter.

本発明にかかるパタン認識装置は、ユーザ入力情報を取り込むユーザ入力情報取り込み手段、前記ユーザ入力情報を格納するユーザ入力情報格納手段、パタン認識の動作を決定するパタン認識用パラメータを格納したパタン認識パラメータ格納手段、前記パタン認識用パラメータを用いて前記ユーザ入力情報をパタン認識し、第一のコマンドに変換する第一のパタン認識手段、第一のコマンドを出力する出力手段、前記第一のコマンドが前記パタン認識用パラメータを変更するコマンドである場合、このコマンド通りのパタン認識用パラメータを用い、前記ユーザ入力情報格納手段で格納されたユーザ入力情報を再びパタン認識し、第二のコマンドに変換する第二のパタン認識手段、第一のコマンドと第二のコマンドを比較する比較手段からなる。   A pattern recognition apparatus according to the present invention includes a user input information capturing unit that captures user input information, a user input information storage unit that stores the user input information, and a pattern recognition parameter that stores a pattern recognition parameter that determines a pattern recognition operation. Storage means, first pattern recognition means for recognizing the user input information using the pattern recognition parameter, and converting it to a first command, output means for outputting a first command, and the first command In the case of a command for changing the pattern recognition parameter, the user recognition information stored in the user input information storage means is recognized again and converted into a second command using the pattern recognition parameter according to the command. From the second pattern recognition means, the comparison means for comparing the first command and the second command That.

本発明では、ユーザの入力がパタン認識用パラメータ変更コマンドであった場合、そのユーザ入力をパラメータ変更後に再び認識させ、パラメータ変更前,変更後の認識結果が異なる場合に,ユーザに対して警告を出力することが可能となる。これにより、設定されたパタン認識用パラメータが過剰なものかどうかを判定できるようになる。   In the present invention, when the user input is a pattern recognition parameter change command, the user input is recognized again after the parameter change, and a warning is given to the user when the recognition results before and after the parameter change differ. It becomes possible to output. This makes it possible to determine whether the set pattern recognition parameters are excessive.

以下、図面を参照しながら本発明の好適な実施例について説明していく。   Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.

図1は、本発明のパタン認識装置の機能構成図である。図2は、本特許のパタン認識装置の動作フローである。ここでは、これらの図を用いて説明する。また、説明の都合上、パタン認識処理として音声認識を例として説明する。   FIG. 1 is a functional configuration diagram of the pattern recognition apparatus of the present invention. FIG. 2 is an operation flow of the pattern recognition apparatus of this patent. Here, it demonstrates using these figures. For convenience of explanation, voice recognition is described as an example of pattern recognition processing.

本発明のパタン認識装置(101)は、入力デバイス(102)と繋がっており、ここからユーザによる入力情報を取り込む。この入力デバイスはマイクロフォンやマウス、カメラ等が考えられる。また、ユーザ入力情報とは、ユーザが発声した音声情報や、ユーザの動きが撮影された動画情報等が考えられる。入力されたユーザ入力情報はユーザ入力取り込み部(106)から装置内に取り込まれる(S201)。   The pattern recognition device (101) of the present invention is connected to an input device (102), and takes in input information from the user. The input device may be a microphone, a mouse, a camera, or the like. The user input information may be voice information uttered by the user, moving picture information in which the user's movement is captured, or the like. The input user input information is captured from the user input capturing unit (106) into the apparatus (S201).

取り込まれたユーザ入力情報は、ユーザ入力格納部(103)と第一のパタン認識部(107)に送られる。ユーザ入力格納部では、ユーザ入力情報を装置内の格納領域にユーザ入力情報(104)として格納する(S202)。音声認識の場合は、ユーザの発声波形データ、あるいは音響分析後の特徴パラメータを格納する。   The captured user input information is sent to the user input storage unit (103) and the first pattern recognition unit (107). The user input storage unit stores the user input information as user input information (104) in a storage area in the apparatus (S202). In the case of speech recognition, user utterance waveform data or feature parameters after acoustic analysis are stored.

一方、第一のパタン認識部では、送られてきたユーザ入力情報を、装置内に格納されたパタン認識用パラメータ(105)を用いてパタン認識する(S203)。この時のパタン認識は既存の技術を用いるため説明は省略するが、一般的には確率密度分布やニューラルネットワークを用いることが多い。パタン認識用パラメータとは、これらパタン認識を行う際に用いられる各種のパラメータであり、パタン認識処理アルゴリズムで用いられる各種定数がこれに当たる。例えば、パタン認識処理で用いられる枝狩りの閾値等がパタン認識用パラメータの一つである。枝狩りとは、見込みのなさそうな候補の計算を途中で打ち切る処理であり、パタン認識の計算量削減に貢献する処理である。   On the other hand, the first pattern recognition unit recognizes the transmitted user input information using the pattern recognition parameter (105) stored in the apparatus (S203). The pattern recognition at this time uses an existing technique, and thus the description thereof is omitted. In general, a probability density distribution or a neural network is often used. The pattern recognition parameters are various parameters used when performing pattern recognition, and various constants used in the pattern recognition processing algorithm correspond to this. For example, a branch hunting threshold value used in the pattern recognition process is one of the pattern recognition parameters. Branch picking is a process that cancels the calculation of a candidate that seems unlikely, and contributes to a reduction in the amount of calculation for pattern recognition.

第一のパタン認識部で認識処理が終了すると、認識結果がパタン認識用パラメータ変更コマンドであるかを判定する(S204)。もし、これがパタン認識用パラメータに関わるものではなかった場合、認識結果はコマンド出力部(109)に送られる。例えば、ユーザ入力(ユーザ発声)が「コピー開始」や「右へ移動」等と認識された場合、これはパタン認識用パラメータに関わるものではない。そのため、認識結果はコマンド出力部から装置外に出力される(S205)。   When the recognition process is completed in the first pattern recognition unit, it is determined whether the recognition result is a pattern recognition parameter change command (S204). If this is not related to the pattern recognition parameter, the recognition result is sent to the command output unit (109). For example, when the user input (user utterance) is recognized as “copy start”, “move right”, etc., this is not related to the parameter for pattern recognition. Therefore, the recognition result is output from the command output unit to the outside of the apparatus (S205).

もし、第一のパタン認識部の認識結果がパタン認識用パラメータ変更コマンドであった場合、その結果は第二のパタン認識部(108)に送られる。例えば、「枝狩り閾値を40に変更せよ」という認識結果であった場合、この認識結果はパタン認識用パラメータに関わるものである。そのため、この認識結果は第二のパタン認識部に送られる。   If the recognition result of the first pattern recognition unit is a pattern recognition parameter change command, the result is sent to the second pattern recognition unit (108). For example, when the recognition result is “Change the branch hunting threshold to 40”, the recognition result relates to the pattern recognition parameter. Therefore, this recognition result is sent to the second pattern recognition unit.

第二のパタン認識部では、第一のパタン認識部の認識結果であるパタン認識用パラメータ変更コマンドを受け、パタン認識用パラメータを一時的に変更する。上の例を用いると、枝狩り閾値を一時的に40に変更する。そして、枝狩り閾値以外のパタン認識用パラメータは機器に格納されたものをそのまま使い、先に格納されたユーザ入力情報(104)を再びパタン認識する(S206)。   The second pattern recognition unit receives the pattern recognition parameter change command, which is the recognition result of the first pattern recognition unit, and temporarily changes the pattern recognition parameter. Using the above example, temporarily change the branch picking threshold to 40. Then, as the pattern recognition parameters other than the branch hunting threshold, those stored in the device are used as they are, and the user input information (104) stored earlier is again recognized as a pattern (S206).

第一のパタン認識と第二のパタン認識が終わると、それぞれの認識結果はコマンド比較部(110)に送られる。ここでは、二つの認識部からの認識結果を比較し、それぞれの結果が等しいかを判定する(S207)。もしこれらの認識結果が異なる場合、ユーザが入力したパタン認識用パラメータ変更コマンドは、そのユーザ入力にとって過剰なものであったと判断することができる。このようなパタン認識用パラメータを設定してしまうと、少なくとも今回の認識は成功しなかったことになり、次回からの処理も成功しない恐れがある。しかし、このように、パタン認識用パラメータの変更前に一度試すことで、ユーザ入力のパタン認識用パラメータが過剰な値かどうかを判定することが可能である。   When the first pattern recognition and the second pattern recognition are completed, the respective recognition results are sent to the command comparison unit (110). Here, the recognition results from the two recognition units are compared, and it is determined whether each result is equal (S207). If these recognition results are different, it can be determined that the pattern recognition parameter change command input by the user is excessive for the user input. If such a pattern recognition parameter is set, at least the current recognition has not been successful, and there is a possibility that the next processing will not be successful. However, it is possible to determine whether or not the user-recognized pattern recognition parameter is an excessive value by trying once before changing the pattern recognition parameter.

図3は、本発明の実施例2のパタン認識装置の機能構成図である。ここでは、図1と同じ部分は同じ番号を割り振っており、その部分の説明は省略する。
先に述べたように、コマンド比較部(110)において、第一のパタン認識部(107)と第二のパタン認識部(108)の認識結果が異なると判断された場合、ユーザが入力したパタン認識用パラメータ変更コマンドは、その入力にとって過剰なものであったと判断される。その場合、装置の警告出力部(302)にその旨が通知され、ディスプレイやスピーカといった装置外の出力デバイス(301)を介し、警告情報が出力される。例えば、スピーカから「枝狩り閾値を40に変更すると、次回からの認識性能に影響が出る恐れがあります」という音声メッセージを流す。
FIG. 3 is a functional configuration diagram of the pattern recognition apparatus according to the second embodiment of the present invention. Here, the same parts as those in FIG. 1 are assigned the same numbers, and the description of those parts is omitted.
As described above, when the command comparison unit (110) determines that the recognition results of the first pattern recognition unit (107) and the second pattern recognition unit (108) are different, the pattern input by the user is determined. It is determined that the recognition parameter change command is excessive for the input. In that case, the warning output unit (302) of the apparatus is notified of this, and warning information is output via the output device (301) outside the apparatus such as a display and a speaker. For example, a voice message such as “If the branch picking threshold is changed to 40, the recognition performance from the next time may be affected” is sent from a speaker.

もしコマンド比較部で、第一のパタン認識部(107)と第二のパタン認識部(108)の認識結果が等しいと判断された場合、その旨はパタン認識用パラメータ変更部(303)に送られる。ここでは、第一のパタン認識部の認識結果通りにパタン認識用パラメータを変更する。先の例では、枝狩り閾値を40という値に設定する。   If the command comparison unit determines that the recognition results of the first pattern recognition unit (107) and the second pattern recognition unit (108) are equal, a message to that effect is sent to the pattern recognition parameter change unit (303). It is done. Here, the pattern recognition parameters are changed according to the recognition result of the first pattern recognition unit. In the previous example, the branch hunting threshold is set to a value of 40.

これらにより、ユーザが入力したパタン認識用パラメータ変更コマンドが過剰な値であった場合、ユーザに対して警告を発することが可能となる。   As a result, if the pattern recognition parameter change command input by the user is an excessive value, a warning can be issued to the user.

図4(A)、(B)は、本発明のパタン認識装置を携帯情報端末に実装した例である。   4A and 4B show an example in which the pattern recognition apparatus of the present invention is mounted on a portable information terminal.

この装置で行うパタン認識はオンライン手書き文字認識であり、ユーザ入力情報としてオンライン手書き情報を受け取るものである。なお、携帯情報端末(401)にはタッチパネル(403)が装備されており、ユーザはスタイラス(402)等を用いて手書き文字情報(404)を入力するものとする。   The pattern recognition performed by this apparatus is online handwritten character recognition and receives online handwritten information as user input information. The portable information terminal (401) is equipped with a touch panel (403), and the user inputs handwritten character information (404) using a stylus (402) or the like.

ユーザは、スケジューラやメーラといったアプリケーションを、手書き文字入力やGUIを用いて操作することが可能である。また、その手書き文字認識の動作を、認識用パラメータ変更用コマンドにより変更することが可能である。例えば、図4(A)のように、手書き文字認識の速度を高速にする旨を装置に通知することができる。   The user can operate applications such as a scheduler and a mailer by using handwritten character input or GUI. Further, the operation for recognizing handwritten characters can be changed by a recognition parameter changing command. For example, as shown in FIG. 4A, the apparatus can be notified that the speed of handwritten character recognition is to be increased.

装置内では、この手書き文字入力が第一の手書き文字認識部に送られ、「高速処理」という認識用パラメータ変更コマンドであると解釈される。すると、認識速度が一時的に「高速」に設定され、第二の手書き文字認識部が先の手書き文字情報を再度認識する。   In the apparatus, this handwritten character input is sent to the first handwritten character recognition unit, and is interpreted as a recognition parameter change command “high-speed processing”. Then, the recognition speed is temporarily set to “high speed”, and the second handwritten character recognition unit recognizes the previous handwritten character information again.

もし、第二の手書き文字認識が、先の手書き文字情報を「高速処理」として認識できなかった場合、そのユーザが入力した手書き文字は、高速処理ではうまくいかないと判断することができる。つまり、そのユーザが今後入力する手書き文字においても、高速処理では不都合が出ることが予想されるため、その旨を警告情報(405)としてユーザに通知する。   If the second handwritten character recognition cannot recognize the previous handwritten character information as “high-speed processing”, it can be determined that the handwritten character input by the user is not successful in the high-speed processing. That is, even for handwritten characters that the user will input in the future, it is expected that inconvenience will be caused by high-speed processing, so that the user is notified as warning information (405).

このように、本発明のパタン認識装置は、オンライン手書き文字認識にも適応することが可能である。   Thus, the pattern recognition apparatus of the present invention can be applied to online handwritten character recognition.

図5(A)、(B)は、本発明のパタン認識装置を複写機に実装した例である。   FIGS. 5A and 5B show an example in which the pattern recognition apparatus of the present invention is mounted on a copying machine.

この装置で行うパタン認識はオフライン手書き文字認識であり、ユーザ入力情報としてオフライン手書き情報を受け取るものである。なお、ユーザは複写機を操作するユーザ設定情報(502)を設定用紙(501)に手書きし、それを複写機の原稿台から読み込ませることで、複写機を操作するものとする。   The pattern recognition performed by this apparatus is offline handwritten character recognition, and receives offline handwritten information as user input information. It is assumed that the user operates the copying machine by handwriting user setting information (502) for operating the copying machine on the setting sheet (501) and reading it from the document table of the copying machine.

例えば図5(A)のように、「濃度補正+40」という内容のユーザ入力情報が装置に取り込まれたとする。装置内の第一の手書き文字認識部は、この手書き文字入力を「濃度補正を+40にせよ」というコマンドであると解釈する。ここでは、複写機の手書き文字認識処理が前処理として画像の濃度補正を行っており、濃度補正のパラメータを認識用パラメータとして保持していたとする。すると「濃度補正を+40にせよ」は認識用パラメータ変更コマンドと判断される。そして、ユーザの指示通り、濃度補正値を一時的に40増加させ、第二の手書き文字認識部が先の手書き文字情報を再度認識する。   For example, as shown in FIG. 5A, it is assumed that user input information having a content of “density correction + 40” is taken into the apparatus. The first handwritten character recognition unit in the apparatus interprets this handwritten character input as a command “make density correction +40”. Here, it is assumed that the handwritten character recognition process of the copying machine performs image density correction as preprocessing, and holds the density correction parameters as recognition parameters. Then, “Set density correction to +40” is determined as a recognition parameter change command. Then, as indicated by the user, the density correction value is temporarily increased by 40, and the second handwritten character recognition unit recognizes the previous handwritten character information again.

もし、第二の手書き文字認識が、先のユーザ入力を「濃度補正+40」として認識できなかった場合、そのユーザ入力に対して濃度補正を40増加させることは過剰な設定である。そして、そのユーザが今後入力する手書き文字においても、濃度補正を40増加させることにより認識性能が低下する恐れがある。そのため、複写機の操作パネル(503)の情報提示領域(504)に、警告情報(505)としてその旨をユーザに通知する。   If the second handwritten character recognition cannot recognize the previous user input as “density correction + 40”, it is an excessive setting to increase the density correction by 40 with respect to the user input. And also in the handwritten character which the user inputs from now on, there exists a possibility that recognition performance may fall by increasing density correction by 40. Therefore, the user is notified as warning information (505) in the information presentation area (504) of the operation panel (503) of the copying machine.

このように、本発明のパタン認識装置は、オフライン手書き文字認識にも適応することが可能である。   Thus, the pattern recognition apparatus of the present invention can be applied to off-line handwritten character recognition.

図6(A)、(B)は、本発明のパタン認識装置をカメラサーバに実装した例である。   6A and 6B are examples in which the pattern recognition apparatus of the present invention is mounted on a camera server.

この装置で行うパタン認識はジェスチャ認識であり、ユーザ入力情報としてユーザのジェスチャを動画情報として受け取る。カメラサーバ(601)は、ユーザ(604)のジェスチャ動作をカメラ(602)から取り込み、それをカメラサーバの操作コマンドとして認識する。   The pattern recognition performed by this apparatus is gesture recognition, and a user's gesture is received as moving image information as user input information. The camera server (601) captures the gesture operation of the user (604) from the camera (602) and recognizes it as an operation command of the camera server.

ユーザは一般的な操作コマンドの他に、ジェスチャ認識の認識用パラメータ変更コマンドも入力することが可能である。他の実施例同様、ユーザの認識用パラメータ変更コマンドが過剰な値である場合、カメラサーバ上のスクリーン(603)から警告情報(605)を通知することが可能である。   The user can input a recognition parameter change command for gesture recognition in addition to a general operation command. As in the other embodiments, when the user's recognition parameter change command has an excessive value, the warning information (605) can be notified from the screen (603) on the camera server.

このように、本発明のパタン認識装置は、ジェスチャ認識にも適応することが可能である。   As described above, the pattern recognition apparatus of the present invention can also be applied to gesture recognition.

なお、本発明の目的は、前述した実施例の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成されることは言うまでもない。   An object of the present invention is to supply a storage medium recording a program code of software that realizes the functions of the above-described embodiments to a system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the storage medium. Needless to say, this can also be achieved by reading and executing the program code stored in.

この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。   In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention.

プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。   As a storage medium for supplying the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.

また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) operating on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.

さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Further, after the program code read from the storage medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. It goes without saying that the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.

実施例1の機能構成図である。3 is a functional configuration diagram of Embodiment 1. FIG. 実施例1の動作フローである。2 is an operation flow according to the first embodiment. 実施例2の機能構成図である。6 is a functional configuration diagram of Embodiment 2. FIG. (A)実施例3の携帯情報端末の概観例である。 (B)実施例3の携帯情報端末の警告出力例である。(A) It is an example of an outline of the portable information terminal of Example 3. (B) It is a warning output example of the portable information terminal of Example 3. (A)実施例4の複写機に読み込ませる設定用紙の例である。 (B)実施例4の複写機の操作パネルと警告出力例である。(A) This is an example of setting paper to be read by the copying machine of the fourth embodiment. (B) Example of operation panel and warning output of copying machine of embodiment 4. (A)実施例5のカメラサーバの概観例である。 (B)実施例5のカメラサーバの警告出力例である。(A) It is an example of an external appearance of the camera server of Example 5. FIG. (B) It is an example of a warning output of the camera server of Example 5.

Claims (9)

ユーザ入力情報を取り込むユーザ入力情報取り込み手段、
前記ユーザ入力情報を格納するユーザ入力情報格納手段、
パタン認識の動作を決定するパタン認識用パラメータを格納したパタン認識パラメータ格納手段、
前記パタン認識用パラメータを用いて前記ユーザ入力情報をパタン認識し、第一のコマンドに変換する第一のパタン認識手段、
第一のコマンドを出力する出力手段、
前記第一のコマンドが前記パタン認識用パラメータを変更するコマンドである場合、このコマンド通りのパタン認識用パラメータを用い、前記ユーザ入力情報格納手段で格納されたユーザ入力情報を再びパタン認識し、第二のコマンドに変換する第二のパタン認識手段、
第一のコマンドと第二のコマンドを比較する比較手段とを備えたことを特徴とするパタン認識装置。
User input information capturing means for capturing user input information;
User input information storage means for storing the user input information;
Pattern recognition parameter storage means for storing pattern recognition parameters for determining the pattern recognition operation;
A first pattern recognition means for recognizing the user input information using the pattern recognition parameter and converting it to a first command;
Output means for outputting the first command;
When the first command is a command for changing the pattern recognition parameter, using the pattern recognition parameter according to the command, the user input information stored in the user input information storage means is recognized again, and the first command Second pattern recognition means for converting to a second command,
A pattern recognizing device comprising a comparing means for comparing the first command and the second command.
前記比較手段が第一のコマンドと第二のコマンドとが異なると判断した場合、ユーザ入力のパタン認識用パラメータ変更コマンドが過剰な設定であったとみなし、エラー又は警告をユーザに提示する提示手段を更に備えることを特徴とする請求項1記載のパタン認識装置。   When the comparing means determines that the first command and the second command are different, it is considered that the user input pattern recognition parameter change command is an excessive setting, and presenting means for presenting an error or warning to the user The pattern recognition device according to claim 1, further comprising: 前記比較手段が第一のコマンドと第二のコマンドとが同じであると判断した場合、ユーザ入力のパタン認識用パラメータ変更コマンドが過剰な設定ではないとみなし、前記パタン認識用パラメータを変更する変更手段を備えることを特徴とする請求項1記載のパタン認識装置。   When the comparison means determines that the first command and the second command are the same, it is assumed that the user-recognized pattern recognition parameter change command is not an excessive setting, and the change to change the pattern recognition parameter The pattern recognition apparatus according to claim 1, further comprising means. 前記ユーザ入力情報は音声入力情報であり、前記パタン認識処理とは音声認識処理であることを特徴とする請求項1記載のパタン認識装置。   The pattern recognition apparatus according to claim 1, wherein the user input information is voice input information, and the pattern recognition process is a voice recognition process. 前記ユーザ入力情報は手書き文字入力情報であり、前記パタン認識処理とは手書き文字認識処理であることを特徴とする請求項1記載のパタン認識装置。   The pattern recognition apparatus according to claim 1, wherein the user input information is handwritten character input information, and the pattern recognition process is a handwritten character recognition process. 前記ユーザ入力情報は画像入力情報であり、前記パタン認識処理とは画像認識処理であることを特徴とする請求項1記載のパタン認識装置。   2. The pattern recognition apparatus according to claim 1, wherein the user input information is image input information, and the pattern recognition process is an image recognition process. 前記ユーザ入力情報はジェスチャ入力情報であり、前記パタン認識処理とはジェスチャ認識処理であることを特徴とする請求項1記載のパタン認識装置。   The pattern recognition apparatus according to claim 1, wherein the user input information is gesture input information, and the pattern recognition process is a gesture recognition process. ユーザ入力情報を取り込むユーザ入力情報取り込み工程、
前記ユーザ入力情報を格納するユーザ入力情報格納工程、
パタン認識の動作を決定するパタン認識用パラメータを格納したパタン認識パラメータ格納工程、
前記パタン認識用パラメータを用いて前記ユーザ入力情報をパタン認識し、第一のコマンドに変換する第一のパタン認識工程、
第一のコマンドを出力する出力工程、
前記第一のコマンドが前記パタン認識用パラメータを変更するコマンドである場合、このコマンド通りのパタン認識用パラメータを用い、前記ユーザ入力情報格納手段で格納されたユーザ入力情報を再びパタン認識し、第二のコマンドに変換する第二のパタン認識工程、
第一のコマンドと第二のコマンドを比較する比較工程とを備えたことを特徴とするパタン認識方法。
User input information capturing step for capturing user input information;
A user input information storage step for storing the user input information;
A pattern recognition parameter storage step storing pattern recognition parameters for determining pattern recognition operation;
A first pattern recognition step of recognizing the user input information using the pattern recognition parameter and converting it to a first command;
An output process for outputting the first command;
When the first command is a command for changing the pattern recognition parameter, using the pattern recognition parameter according to the command, the user input information stored in the user input information storage means is recognized again, and the first command A second pattern recognition process to convert to a second command,
A pattern recognition method comprising a comparison step of comparing a first command and a second command.
請求項8記載のパタン認識方法をコンピュータに実行させるための制御プログラム。   A control program for causing a computer to execute the pattern recognition method according to claim 8.
JP2005234445A 2005-08-12 2005-08-12 Pattern recognition device and pattern recognition method Withdrawn JP2007047671A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005234445A JP2007047671A (en) 2005-08-12 2005-08-12 Pattern recognition device and pattern recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005234445A JP2007047671A (en) 2005-08-12 2005-08-12 Pattern recognition device and pattern recognition method

Publications (1)

Publication Number Publication Date
JP2007047671A true JP2007047671A (en) 2007-02-22

Family

ID=37850523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005234445A Withdrawn JP2007047671A (en) 2005-08-12 2005-08-12 Pattern recognition device and pattern recognition method

Country Status (1)

Country Link
JP (1) JP2007047671A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022160475A (en) * 2017-08-01 2022-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ Information processing method, device, and vehicle
US11893104B2 (en) 2017-08-01 2024-02-06 Panasonic Intellectual Property Corporation Of America Management system, vehicle, and information processing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022160475A (en) * 2017-08-01 2022-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ Information processing method, device, and vehicle
US11893104B2 (en) 2017-08-01 2024-02-06 Panasonic Intellectual Property Corporation Of America Management system, vehicle, and information processing method
JP7465915B2 (en) 2017-08-01 2024-04-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ Information processing method, device, and vehicle

Similar Documents

Publication Publication Date Title
JP6903808B2 (en) Real-time handwriting recognition management
JP4708913B2 (en) Information processing method and information processing apparatus
US7496513B2 (en) Combined input processing for a computing device
JP4401155B2 (en) Dialog management method and apparatus between user and agent
US7848917B2 (en) Common word graph based multimodal input
JP7143916B2 (en) Information processing device, information processing method, and program
JP2006048628A (en) Multimodal input method
WO2015188952A1 (en) Portable electronic equipment and method of operating a user interface
US20140022184A1 (en) Speech and gesture recognition enhancement
JP2009501965A (en) Handwriting recognition using neural network
KR20090045190A (en) A method and apparatus for recognition of handwritten symbols
JP2007010971A (en) Speech recognition method and speech recognition apparatus
CN110335608B (en) Voiceprint verification method, voiceprint verification device, voiceprint verification equipment and storage medium
KR20210017090A (en) Method and electronic device for converting handwriting input to text
JP2010128015A (en) Device and program for determining erroneous recognition in speech recognition
US11900931B2 (en) Information processing apparatus and information processing method
CN111862943B (en) Speech recognition method and device, electronic equipment and storage medium
CN111506183A (en) Intelligent terminal and user interaction method
JP2007047671A (en) Pattern recognition device and pattern recognition method
Heckmann Audio-visual word prominence detection from clean and noisy speech
CN110991155B (en) Text correction method, device and medium
CN115881133A (en) Method, apparatus, device and storage medium for interaction
KR100831991B1 (en) Information processing method and information processing device
KR102153220B1 (en) Method for outputting speech recognition results based on determination of sameness and appratus using the same
JPH0830290A (en) Voice input possible information processing device and its malprocessing detection method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081104