JP5145287B2 - Input error warning device - Google Patents

Input error warning device Download PDF

Info

Publication number
JP5145287B2
JP5145287B2 JP2009115927A JP2009115927A JP5145287B2 JP 5145287 B2 JP5145287 B2 JP 5145287B2 JP 2009115927 A JP2009115927 A JP 2009115927A JP 2009115927 A JP2009115927 A JP 2009115927A JP 5145287 B2 JP5145287 B2 JP 5145287B2
Authority
JP
Japan
Prior art keywords
input
error
word
storage unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009115927A
Other languages
Japanese (ja)
Other versions
JP2010266965A (en
Inventor
雄司 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2009115927A priority Critical patent/JP5145287B2/en
Publication of JP2010266965A publication Critical patent/JP2010266965A/en
Application granted granted Critical
Publication of JP5145287B2 publication Critical patent/JP5145287B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、ユーザから入力される入力語に応じて入力誤りを警告する入力誤り警告装置に関する。   The present invention relates to an input error warning device that warns an input error according to an input word input by a user.

コンピュータ装置がユーザからの文字入力を受け付ける際、誤入力を防ぐための入力支援を行なう技術が提案されている。例えば、特許文献1には、文字入力を受け付けるキーボードの文字配列とユーザ毎のタイプミスの癖とに基づいて、入力文字と、この入力文字に対応する補正文字との組み合わせを補正ルールとして記憶し、記憶した補正ルールに基づいて入力文字の補正を行なう技術が提案されている。特許文献2には、記憶された補正ルールが利用される毎に、補正ルール毎の重み付けを更新することでユーザの誤り癖を学習し、更新した重み付けに応じてユーザから入力された入力文字を補正する技術が記載されている。   There has been proposed a technique for providing input support for preventing erroneous input when a computer apparatus receives character input from a user. For example, Patent Literature 1 stores a combination of an input character and a correction character corresponding to the input character as a correction rule based on a character arrangement of a keyboard that accepts character input and a typo error for each user. A technique for correcting an input character based on a stored correction rule has been proposed. In Patent Document 2, every time a stored correction rule is used, the weight of each correction rule is updated to learn the user's error habits, and the input characters input from the user according to the updated weight are stored. Techniques for correction are described.

特開平4−245319号公報JP-A-4-245319 特開平5−252799号公報JP-A-5-252799

しかしながら、上述の技術は、キーボード操作の際のタイプミスに基づいて生成された補正ルールによって誤入力の補正を行なうものである。ここで、例えばオペレータが企業製品に関する問い合わせ等を電話で受け付けてコンピュータ装置に入力したり、紙媒体に印刷または記載された文を読み取ってコンピュータ装置に入力したりする場合には、タイプミスによる誤入力の他に、ユーザの聞き取り間違いや読み取り間違いに基づく誤入力が発生する場合があると考えられる。上述のようなタイプミスに基づく補正ルールによっては、このような誤入力を適切に検出することができない。ここで、コンピュータ装置がオペレータからの文字入力を受け付ける際には、聞き取り間違いや読み取り間違いに基づく誤入力をオペレータに警告することが望ましい。   However, the above-described technique corrects an erroneous input by using a correction rule generated based on a typo at the time of keyboard operation. Here, for example, when an operator receives an inquiry about a company product by telephone and inputs it to the computer device, or reads a sentence printed or written on a paper medium and inputs it to the computer device, an error due to a typo is made. In addition to the input, it is considered that an erroneous input based on a user's listening error or reading error may occur. Depending on the correction rule based on the typo as described above, such an erroneous input cannot be detected appropriately. Here, when the computer device accepts a character input from the operator, it is desirable to warn the operator of an erroneous input based on a hearing error or a reading error.

本発明は、このような状況に鑑みてなされたもので、聞き取り間違いや読み取り間違いに基づく誤入力を、より精度良く検出してユーザに警告する入力誤り警告装置を提供することを目的とする。   The present invention has been made in view of such a situation, and an object of the present invention is to provide an input error warning device that detects an erroneous input based on a mistake in reading or a reading error with higher accuracy and warns the user.

上述した課題を解決するために、本発明は、定められた文字情報である正解語と、パターン認識処理により文字情報を検出する処理対象である処理対象データに含まれる正解語の数を示す第1の出現数と、ユーザに入力された文字情報に含まれる正解語の数を示す第2の出現数とが対応付けられて記憶される出現数記憶部と、正解語と、正解語が誤読された結果である誤り語と、パターン認識処理によって正解語が誤り語として誤読された数を示す第1の誤り数と、ユーザによって正解語が誤り語として誤読された数を示す第2の誤り数とが対応付けられて記憶される誤り数記憶部と、第1の誤り数に対する第2の誤り数の信頼性の高さの度合いを示す重み係数が記憶される重み係数記憶部と、正解語に対応する第1の出現数と、第2の出現数と、第1の誤り数と、第2の誤り数と、重み係数とに基づいて、正解語が誤り語として誤読される誤り率を算出する誤り率算出部と、ユーザから入力される文字情報を受付ける入力部と、入力部に入力された文字情報が、誤り語として誤り数記憶部に記憶されており、かつ、誤り語に応じて誤り率算出部が算出した誤り率が予め定められた閾値を超えていると判定すると、誤り語に対応する正解語を出力する警告部と、を備えることを特徴とする。   In order to solve the above-described problem, the present invention provides a correct word that is predetermined character information and a number of correct words that are included in processing target data that is processing target for detecting character information by pattern recognition processing. An appearance number storage unit in which the number of occurrences of 1 and the second number of appearances indicating the number of correct words included in the character information input by the user are associated with each other, the correct word, and the correct word are misread A first error number indicating the number of error words that have been misread as error words by the pattern recognition process, and a second error indicating the number of error words that have been misread by the user as error words A number of errors stored in association with the number, a weighting coefficient storage for storing a weighting factor indicating the degree of reliability of the second number of errors relative to the first number of errors, and a correct answer First occurrence and second occurrence corresponding to the word An error rate calculation unit that calculates an error rate in which a correct word is misread as an error word based on the first error count, the second error count, and a weighting factor, and character information input from a user And the character information input to the input unit is stored as an error word in the error number storage unit, and the error rate calculated by the error rate calculation unit according to the error word is predetermined. And a warning unit that outputs a correct word corresponding to the error word when it is determined that the threshold value is exceeded.

また、本発明は、入力部に入力された文字情報についての修正入力を受け付ける修正入力部と、修正入力部に入力された文字情報に含まれる正解語の数を算出し、算出した数を出現数記憶部に記憶された第2の出現数に加算して記憶させる出現数算出部と、入力部に入力された文字情報と、修正入力部に入力された文字情報とを比較して差分を検出し、差分が存在する文字について、入力部に入力された文字を誤り語とし、修正入力部に入力された文字を正解語とする数を算出し、算出した数を誤り数記憶部に記憶された第2の誤り数に加算して記憶させる誤り数算出部と、正解語に対応する第1の出現数と、第2の出現数と、第1の誤り数と、第2の誤り数とに基づいて、重み係数を算出し、重み係数記憶部に記憶させる重み係数算出部と、を備えることを特徴とする。   Further, the present invention calculates the number of correct words included in the character information input to the correction input unit, the correction input unit that receives the correction input of the character information input to the input unit, and the calculated number appears. The appearance number calculation unit for adding and storing the second appearance number stored in the number storage unit, the character information input to the input unit, and the character information input to the correction input unit are compared, and the difference is calculated. Detects and calculates the number of characters that have a difference between the character input to the input unit as an error word and the character input to the correction input unit as a correct word, and stores the calculated number in the error number storage unit An error number calculation unit to be added to and stored in the second error number, a first appearance number corresponding to the correct word, a second appearance number, a first error number, and a second error number And a weighting factor calculation unit that calculates a weighting factor and stores the weighting factor in a weighting factor storage unit; Characterized in that it comprises a.

また、本発明は、パターン認識処理は、処理対象データである画像データから文字情報を検出する文字認識処理と、処理対象データである音声データから文字情報を検出する音声認識処理とのいずれかであることを特徴とする。   Further, according to the present invention, the pattern recognition processing is performed by any one of character recognition processing for detecting character information from image data that is processing target data and voice recognition processing for detecting character information from voice data that is processing target data. It is characterized by being.

また、本発明は、ユーザの属性を示すユーザ情報が記憶されるユーザ属性情報記憶部を備え、出現数記憶部には、ユーザの属性毎に第2の出現数が記憶され、誤り数記憶部には、ユーザの属性毎に第2の誤り数が記憶され、重み係数記憶部には、ユーザの属性毎に重み係数が記憶され、誤り率算出部は、ユーザの属性毎に誤り率を算出することを特徴とする。   In addition, the present invention includes a user attribute information storage unit that stores user information indicating user attributes, and the appearance number storage unit stores a second appearance number for each user attribute, and an error number storage unit Stores the second error count for each user attribute, the weight coefficient storage unit stores the weight coefficient for each user attribute, and the error rate calculation unit calculates the error rate for each user attribute. It is characterized by doing.

また、本発明は、誤り率算出部は、正解語に対応する第1の出現数をnとし、第2の出現数をnとし、第1の誤り数をeとし、第2の誤り数をeとし、重み係数をTとして、正解語が誤り語として誤読される誤り率Pを以下式(a) In the present invention, the error rate calculation unit sets the first number of appearances corresponding to the correct word to n 0 , the second number of appearances to n 1 , the first number of errors to e 0 , When the number of errors is e 1 and the weighting factor is T, the error rate P in which the correct word is misread as an error word is expressed by the following equation (a)

Figure 0005145287
Figure 0005145287

によって算出することを特徴とする。   It is characterized by calculating by.

また、本発明は、修正入力部は、複数回の段階に亘って修正入力を受付け、重み係数算出部は、複数段階のうち最後の段階において誤り率算出部によって算出された誤り率をPとし、正解語に対応する第1の出現数をnとし、第2の出現数をnとし、第1の誤り数をeとし、第2の誤り数をeとして、重み係数Tを以下式(b) In the present invention, the correction input unit accepts correction input over a plurality of stages, and the weighting factor calculation unit sets P as the error rate calculated by the error rate calculation unit in the last stage among the plurality of stages. The first occurrence number corresponding to the correct word is n 0 , the second occurrence number is n 1 , the first error number is e 0 , the second error number is e 1 , and the weight coefficient T is Formula (b) below

Figure 0005145287
Figure 0005145287

によって算出することを特徴とする。   It is characterized by calculating by.

以上説明したように、本発明によれば、入力誤り警告装置は、定められた文字情報である正解語と、パターン認識処理により文字情報を検出する処理対象である処理対象データに含まれる正解語の数を示す第1の出現数と、ユーザに入力された文字情報に含まれる正解語の数を示す第2の出現数と、正解語が誤読された結果である誤り語と、パターン認識処理によって正解語が誤り語として誤読された数を示す第1の誤り数と、ユーザによって正解語が誤り語として誤読された数を示す第2の誤り数と、第1の誤り数に対する第2の誤り数の信頼性の度合いを示す重み係数とに基づいて、正解語が誤り語として誤読される誤り率を算出し、ユーザから入力される文字情報が誤り語として記憶されており、かつ、誤り語に応じて算出した誤り率が予め定められた閾値を超えていると判定すると、誤り語に対応する正解語を出力するようにしたので、パターン認識処理による検出された文字情報についての誤り数と、ユーザにより入力された文字情報についての誤り数との間に存在する相関関係に基づいてユーザから入力される文字情報の誤り率を算出することができ、ユーザの聞き取り間違いや読み取り間違いに基づく誤入力を、より精度良く検出してユーザに警告することが可能となる。   As described above, according to the present invention, the input error warning device includes a correct word that is predetermined character information and a correct word that is included in processing target data that is a processing target for detecting character information by pattern recognition processing. A first appearance number indicating the number of words, a second appearance number indicating the number of correct words included in the character information input by the user, an error word that is a result of misreading the correct word, and pattern recognition processing The first error number indicating the number of correct words misread as an error word, the second error number indicating the number of correct word misreads as an error word by the user, and the second error number with respect to the first error number Based on the weighting factor indicating the degree of reliability of the number of errors, the error rate at which the correct word is misread as an error word is calculated, the character information input from the user is stored as the error word, and the error Error rate calculated for each word If it is determined that a predetermined threshold value is exceeded, the correct word corresponding to the error word is output, so the number of errors for the character information detected by the pattern recognition process and the character information input by the user It is possible to calculate the error rate of the character information input from the user based on the correlation existing between the number of errors about and the error input based on the user's listening error and reading error more accurately. It becomes possible to warn the user.

本発明の一実施形態による入力システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the input system by one Embodiment of this invention. 本発明の一実施形態による入力項目の表示例を示す図である。It is a figure which shows the example of a display of the input item by one Embodiment of this invention. 本発明の一実施形態による入力項目の表示例を示す図である。It is a figure which shows the example of a display of the input item by one Embodiment of this invention. 本発明の一実施形態により記憶される入力情報のデータ例を示す図である。It is a figure which shows the example of data of the input information memorize | stored by one Embodiment of this invention. 本発明の一実施形態により記憶される出現数のデータ例を示す図である。It is a figure which shows the example of data of the number of appearance memorize | stored by one Embodiment of this invention. 本発明の一実施形態により記憶される誤り数のデータ例を示す図である。It is a figure which shows the example of data of the number of errors memorize | stored by one Embodiment of this invention. 本発明の一実施形態により記憶される重み係数のデータ例を示す図である。It is a figure which shows the example of data of the weighting coefficient memorize | stored by one Embodiment of this invention. 本発明の一実施形態により出現数と誤り数とを記憶させる動作例を示す図である。It is a figure which shows the operation example which memorize | stores the number of appearances and the number of errors by one Embodiment of this invention. 本発明の一実施形態により警告情報を出力する動作例を示す図である。It is a figure which shows the operation example which outputs warning information by one Embodiment of this invention.

以下、本発明の一実施形態について、図面を参照して説明する。
図1は、本実施形態による入力システム1の構成を示すブロック図である。入力システム1は、オペレータ入力端末100と、入力装置200と、修正入力端末300と、入力誤り警告装置400とのコンピュータ装置を備えており、それぞれのコンピュータ装置はネットワークを介して接続される。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing the configuration of the input system 1 according to the present embodiment. The input system 1 includes computer devices such as an operator input terminal 100, an input device 200, a correction input terminal 300, and an input error warning device 400, and the respective computer devices are connected via a network.

オペレータ入力端末100は、ディスプレイなどの表示部やキーボードやマウス等の入力部を備えたコンピュータ端末であり、オペレータから入力される入力情報を受け付ける。オペレータ入力端末100は、例えば、企業製品等への顧客からの問い合わせ内容に応じた入力項目が含まれる入力画面を表示部に表示させ、表示させた入力項目に応じてオペレータから入力される入力情報を受け付ける。本実施形態では、オペレータは、顧客によって紙媒体に手書きで記載された顧客の氏名、住所、電話番号、問い合わせ内容などの文字を読み取り、読み取った文字を入力情報としてオペレータ入力端末100に入力する。オペレータ入力端末100は、オペレータから入力された入力情報を、入力装置200に送信する。   The operator input terminal 100 is a computer terminal that includes a display unit such as a display and an input unit such as a keyboard and a mouse, and receives input information input from an operator. The operator input terminal 100 displays, for example, an input screen including input items corresponding to the inquiry contents from a customer to a company product or the like on the display unit, and input information input from the operator according to the displayed input items Accept. In the present embodiment, the operator reads characters such as a customer's name, address, telephone number, and inquiry content written by hand on the paper medium by the customer, and inputs the read characters to the operator input terminal 100 as input information. The operator input terminal 100 transmits input information input from the operator to the input device 200.

ここで、オペレータ入力端末100に入力される入力情報は、顧客によって紙媒体に手書きで記載された文字がオペレータによって読み取られて入力される情報であり、氏名や住所などに誤読による表記の誤りや揺れがある場合があると考えられる。これにより、同一の情報が異なる情報として入力されている場合があると考えられる。例えば、顧客により紙媒体に手書きで記載された顧客の氏名を示す「青田」の文字が、オペレータによって「青井」と誤読されて入力されるような場合があると考えられる。   Here, the input information that is input to the operator input terminal 100 is information that is input by the operator reading characters that are handwritten on a paper medium by the customer. There may be shaking. Thereby, it is considered that the same information may be input as different information. For example, it may be considered that the character “Aoda” indicating the name of the customer written by hand on a paper medium by the customer may be misread as “Aoi” by the operator and input.

入力装置200は、オペレータ入力端末100または修正入力端末300に入力された入力情報が送信されて記憶されるコンピュータ装置であり、入力制御部210と、オペレータ情報記憶部220と、入力情報記憶部230とを備えている。
入力制御部210は、問い合わせ内容の入力画面をオペレータ入力端末100または修正入力端末300に送信し、送信した入力画面に応じてオペレータ入力端末100または修正入力端末300に入力されて送信される入力情報を受信する。ここでは、入力装置200はウェブサーバの機能を備えており、HTTP(HyperText Transfer Protocol)通信等によりオペレータ入力端末100または修正入力端末300と通信を行う。入力制御部210がオペレータ入力端末100または修正入力端末300に送信する入力画面は、例えばHTML(HyperText Markup Language)により記述されたウェブページである。
The input device 200 is a computer device in which input information input to the operator input terminal 100 or the correction input terminal 300 is transmitted and stored, and includes an input control unit 210, an operator information storage unit 220, and an input information storage unit 230. And.
The input control unit 210 transmits an inquiry content input screen to the operator input terminal 100 or the correction input terminal 300, and input information transmitted to the operator input terminal 100 or the correction input terminal 300 according to the transmitted input screen. Receive. Here, the input device 200 has a web server function, and communicates with the operator input terminal 100 or the correction input terminal 300 through HTTP (HyperText Transfer Protocol) communication or the like. The input screen that the input control unit 210 transmits to the operator input terminal 100 or the correction input terminal 300 is a web page described in, for example, HTML (HyperText Markup Language).

ここで、入力制御部210が問い合わせ内容の入力画面を送信する際には、予めログイン処理のためのオペレータ情報入力画面を送信し、ログイン処理が成功した場合に問い合わせ内容の入力画面をオペレータ入力端末100に送信する。ここでは、入力制御部210は、オペレータ入力端末100または修正入力端末300に、オペレータを識別するオペレータID(Identifier)と、オペレータIDに対応する定められたパスワードとの入力項目が含まれるオペレータ情報入力画面を送信し、送信したオペレータ情報入力画面に応じてオペレータ入力端末100または修正入力端末300から送信されるオペレータ情報を受け付ける。入力制御部210は、オペレータ入力端末100から受信したオペレータIDとパスワードとの組み合わせに一致するオペレータ情報がオペレータ情報記憶部220に記憶されているか否かを判定し、記憶されていると判定した場合にはログイン成功と判定し、記憶されていないと判定した場合にはログイン失敗と判定する。入力制御部210は、このようなログイン処理により、ログイン成功と判定した場合には、ログインしたオペレータのオペレータIDを自身の記憶領域に記憶するとともに、問い合わせ内容入力画面をオペレータ入力端末100に送信する。一方、ログイン失敗と判定した場合には、問い合わせ内容入力画面をオペレータ入力端末100に送信せず、入力情報の送信を受け付けずに処理を終了する。本実施形態における入力システム1では、このようなオペレータ情報に対応付けて入力情報を記憶しておくことにより、入力情報を入力したオペレータの履歴情報を記憶することができる。   Here, when the input control unit 210 transmits an inquiry content input screen, an operator information input screen for login processing is transmitted in advance, and when the login processing is successful, the inquiry content input screen is displayed as an operator input terminal. To 100. Here, the input control unit 210 inputs operator information in which the operator input terminal 100 or the correction input terminal 300 includes input items of an operator ID (Identifier) for identifying the operator and a defined password corresponding to the operator ID. The screen is transmitted, and operator information transmitted from the operator input terminal 100 or the correction input terminal 300 is accepted according to the transmitted operator information input screen. When the input control unit 210 determines whether operator information that matches the combination of the operator ID and password received from the operator input terminal 100 is stored in the operator information storage unit 220, and determines that it is stored Is determined to be successful login, and if it is determined that it is not stored, it is determined that login failed. When it is determined that the login is successful by such login processing, the input control unit 210 stores the operator ID of the logged-in operator in its own storage area and transmits an inquiry content input screen to the operator input terminal 100. . On the other hand, if it is determined that the login has failed, the inquiry content input screen is not transmitted to the operator input terminal 100, and the process is terminated without accepting transmission of input information. In the input system 1 according to the present embodiment, the history information of the operator who has input the input information can be stored by storing the input information in association with such operator information.

また、入力制御部210は、送信した問い合わせ内容入力画面に応じてオペレータ入力端末100に文字が入力される毎に入力情報を受信して、入力誤り警告装置400に送信する。入力制御部210は、入力情報に含まれる文字が、一定以上の割合で誤って入力される文字である場合に入力誤り警告装置400から送信される警告情報に含まれる正解語を、オペレータ入力端末100に送信して表示させる。例えば、図2、図3は、オペレータ入力端末100に正解語が送信され、送信された正解語がオペレータ入力端末100における入力画面に表示された場合の表示例を示す図である。例えば、図2(a)は、符号a1が示すテキストボックスにユーザから文字「犬」が入力された場合に、符号a2に示すように、ドロップダウン形式にて入力された文字に対応する正解語である「大」が表示された例である。ここでは、例えばAjaxの技術を適用することにより、このようなリアルタイムの情報表示を行うことができる。図2(b)は、符号2に示されるように、ドロップダウン形式で表示された正解語である「大」が選択された表示例を示す図である。例えば、この状態でキーボードのエンターキーが押下されると、選択された正解語「大」が、テキストボックスb1に入力される。図3は、「氏名」の入力項目に対応するテキストボックスa1に、「青田」の文字が入力され、入力された文字に応じた正解語「青井」が表示されている例である。   Further, the input control unit 210 receives input information and transmits it to the input error warning device 400 every time a character is input to the operator input terminal 100 in accordance with the transmitted inquiry content input screen. The input control unit 210 displays the correct word included in the warning information transmitted from the input error warning device 400 when the characters included in the input information are characters that are erroneously input at a certain ratio or more. 100 to display. For example, FIGS. 2 and 3 are diagrams illustrating display examples when the correct word is transmitted to the operator input terminal 100 and the transmitted correct word is displayed on the input screen of the operator input terminal 100. FIG. For example, FIG. 2A shows a correct word corresponding to a character input in a drop-down format as indicated by reference symbol a2 when the character “dog” is input from the user to a text box indicated by reference symbol a1. This is an example in which “Large” is displayed. Here, such real-time information display can be performed by applying, for example, the Ajax technique. FIG. 2B is a diagram illustrating a display example in which “Large” which is a correct word displayed in a drop-down format is selected, as indicated by reference numeral 2. For example, when the enter key of the keyboard is pressed in this state, the selected correct word “Large” is input to the text box b1. FIG. 3 shows an example in which the character “Aota” is input in the text box a1 corresponding to the input item “name” and the correct word “Aoi” corresponding to the input character is displayed.

図1に戻り、オペレータ情報記憶部220には、予め登録されたオペレータに対応するオペレータ情報が記憶されている。オペレータ情報には、例えば、オペレータを識別するオペレータIDに対応付けられて、氏名、年齢、性別、作業経験年数、ログインを行なうためのパスワードなどを示す属性情報が含まれる。作業経験年数は、対応するオペレータが、紙媒体に記載された文字を読み取り、オペレータ入力端末100に入力する作業を行っている経験年数を示す情報である。このような作業経験年数が記憶されていることにより、作業経験年数毎の入力誤り数の統計値などを算出することが可能となる。また、オペレータ情報記憶部220に記憶されたオペレータ情報は、上述したように、入力制御部210によってオペレータのログイン処理が行われる際に読み出される。   Returning to FIG. 1, operator information corresponding to an operator registered in advance is stored in the operator information storage unit 220. The operator information includes, for example, attribute information indicating a name, age, sex, years of work experience, password for login, and the like in association with an operator ID for identifying the operator. The work experience years are information indicating the years of experience in which the corresponding operator performs the work of reading the characters written on the paper medium and inputting them to the operator input terminal 100. By storing such work experience years, it is possible to calculate a statistical value of the number of input errors for each work experience years. Further, the operator information stored in the operator information storage unit 220 is read when the operator login process is performed by the input control unit 210 as described above.

入力情報記憶部230には、オペレータ入力端末100から送信された入力情報が記憶される。図4は、入力情報記憶部230に記憶される入力情報のデータ例を示す図である。入力情報記憶部230には、入力情報IDと、入力番号と、オペレータIDとに対応付けられて入力情報が記憶される。入力情報IDは、入力情報を識別する識別情報である。入力番号は、入力情報が修正者により修正されて入力される際に付与される情報である。ここでは、入力番号が「1」であれば、対応する入力情報は初回の入力情報であることを示し、入力番号が「2」であれば、対応する入力情報は、既に入力された入力情報が修正者により修正され修正入力端末300に入力された入力情報であることを示している。オペレータIDは、対応する入力情報を入力したオペレータを識別する情報である。例えば、図4のデータ例では、入力情報IDが「1」であり、入力番号が「1」である入力情報がオペレータID「1」のオペレータによって入力され、記憶されている。また、入力情報IDが「1」である入力情報に対し、オペレータID「2」のオペレータによって氏名「青田」が「青井」に修正され、入力番号「2」に対応付けられて記憶されている。このように、入力情報記憶部230には、オペレータ入力端末100から送信される入力情報と、入力情報が記憶された後に修正入力端末300から送信される修正された入力情報とが記憶される。   The input information storage unit 230 stores input information transmitted from the operator input terminal 100. FIG. 4 is a diagram illustrating an example of input information data stored in the input information storage unit 230. The input information storage unit 230 stores input information in association with the input information ID, the input number, and the operator ID. The input information ID is identification information that identifies input information. The input number is information given when input information is corrected and input by a corrector. Here, if the input number is “1”, it indicates that the corresponding input information is the first input information. If the input number is “2”, the corresponding input information is input information that has already been input. Indicates that the input information has been corrected by the corrector and input to the correction input terminal 300. The operator ID is information for identifying an operator who has input corresponding input information. For example, in the data example of FIG. 4, the input information ID “1” and the input number “1” are input and stored by the operator with the operator ID “1”. Also, for the input information whose input information ID is “1”, the name “Aoda” is corrected to “Aoi” by the operator with the operator ID “2” and stored in association with the input number “2”. . As described above, the input information storage unit 230 stores the input information transmitted from the operator input terminal 100 and the corrected input information transmitted from the corrected input terminal 300 after the input information is stored.

図1に戻り、修正入力端末300は、オペレータ入力端末100と同様の構成であり、入力装置200に記憶された入力情報を読み出して表示し、表示した入力情報に応じて修正者であるオペレータから入力される修正済の入力情報を受け付ける。修正入力端末300に修正済の入力情報を入力するオペレータは、修正入力端末300によって入力装置200から読み出され表示される入力情報と、他の入力情報や予め登録された顧客情報などとを比較して、誤り語を正解語として修正したり、同一の顧客の情報についての表記揺れを修正したりして、修正済の入力情報を修正入力端末300に入力する。修正入力端末300は、入力された修正済の入力情報を入力装置200に送信する。修正入力端末300が送信した入力情報は、読み出した入力情報の入力情報IDに対応付けられ、入力番号に「2」が付与されて入力情報記憶部230に記憶される。   Returning to FIG. 1, the correction input terminal 300 has the same configuration as the operator input terminal 100, reads and displays the input information stored in the input device 200, and the operator who is the corrector according to the displayed input information. Accepts corrected input information to be input. The operator who inputs the corrected input information to the corrected input terminal 300 compares the input information read and displayed from the input device 200 by the corrected input terminal 300 with other input information or customer information registered in advance. Then, the corrected input information is input to the correction input terminal 300 by correcting the error word as a correct word or correcting the notation fluctuation of the same customer information. The corrected input terminal 300 transmits the input corrected input information to the input device 200. The input information transmitted by the modified input terminal 300 is associated with the input information ID of the read input information, and “2” is assigned to the input number and stored in the input information storage unit 230.

ここで、顧客からの問い合わせ内容に関する入力情報について、例えば顧客毎、顧客の属性毎に入力情報を管理しようとする場合、入力情報に誤りや表記揺れが存在すれば、コンピュータ処理によって情報を一元管理し、有用な統計等を算出することは困難である。このため、入力情報に含まれる情報は、他の入力情報に含まれる情報と実質的に同一である場合には、同一の表記により記憶されていることが望ましい。例えば、上述したように、同一の人物が「青田」と「青井」との氏名に対応付けられて異なる問い合わせ内容が記憶されている場合には、異なる人物として統計が算出されることになり、またいずれの氏名が正しいものであるかを機械的に判定することはできない。そこで、修正者であるオペレータが、修正入力端末300に表示される入力情報を参照して、複数の入力情報のうち、同一人物に対応する入力情報の氏名等の表記が同一となるように修正した修正済入力情報を、修正入力端末300に入力する。   Here, with regard to input information related to the contents of inquiries from customers, for example, when trying to manage input information for each customer and for each customer attribute, if there is an error or fluctuation in the input information, the information is centrally managed by computer processing However, it is difficult to calculate useful statistics. For this reason, when the information included in the input information is substantially the same as the information included in the other input information, it is desirable that the information is stored in the same notation. For example, as described above, when different inquiry contents are stored in association with the names of “Aoda” and “Aoi”, the statistics are calculated as different persons. Also, it is not possible to determine mechanically which name is correct. Therefore, the operator who is the corrector refers to the input information displayed on the correction input terminal 300 and corrects the input information corresponding to the same person in the input information corresponding to the same person among the plurality of input information. The corrected input information is input to the correction input terminal 300.

入力誤り警告装置400は、オペレータから入力される入力情報に応じて、入力情報を誤り語とする場合に対応する正解語を検出して出力するコンピュータ装置である。入力誤り警告装置400は、処理対象データ入力部410と、パターン認識処理部420と、文字情報入力部430と、誤りパターン記憶部440と、出現数算出部450と、誤り数算出部460と、誤り率算出部470と、重み係数算出部480と、警告部490とを備えている。   The input error warning device 400 is a computer device that detects and outputs the correct word corresponding to the case where the input information is an error word in accordance with the input information input from the operator. The input error warning device 400 includes a processing target data input unit 410, a pattern recognition processing unit 420, a character information input unit 430, an error pattern storage unit 440, an appearance number calculation unit 450, an error number calculation unit 460, An error rate calculation unit 470, a weight coefficient calculation unit 480, and a warning unit 490 are provided.

処理対象データ入力部410には、パターン認識処理部420により文字情報が検出される処理対象である処理対象データが入力される。本実施形態では、処理対象データ入力部410に入力される処理対象データは、文字が含まれる画像データを適用して説明する。画像データは、文字認識(OCR(Optical Character Recognition))処理によって文字入力の誤り率を算出するためのサンプルとして用いられる。例えば、画像データは、特定の文字コードにおいて定められた全ての文字が含まれる文字コード表が印刷された紙媒体をスキャナなどにより読み取った情報が適用できる。   The processing target data input unit 410 receives processing target data that is a processing target for which character information is detected by the pattern recognition processing unit 420. In the present embodiment, the processing target data input to the processing target data input unit 410 will be described by applying image data including characters. The image data is used as a sample for calculating a character input error rate by character recognition (OCR (Optical Character Recognition)). For example, as image data, information obtained by reading a paper medium on which a character code table including all characters defined in a specific character code is printed by a scanner or the like can be applied.

パターン認識処理部420は、処理対象データ入力部410に入力された処理対象データについてパターン認識処理を行い、処理対象データに含まれる文字情報を検出する。本実施形態では、パターン認識処理部420は、処理対象データ入力部410に入力される画像データを読み込んでパターン認識処理を行い、画像データに含まれる文字の形態に基づいて解析した文字情報が含まれるパターン認識処理結果を生成し、自身の記憶領域に記憶する。ここで、パターン認識処理結果に含まれる文字情報には、画像データにおける文字の歪みや汚れなどによって、誤って解析された文字情報が含まれる場合があると考えられる。例えば、パターン認識処理によって「大」の文字が誤読され、「犬」の文字として出力されるような場合がある。   The pattern recognition processing unit 420 performs pattern recognition processing on the processing target data input to the processing target data input unit 410, and detects character information included in the processing target data. In the present embodiment, the pattern recognition processing unit 420 reads the image data input to the processing target data input unit 410, performs pattern recognition processing, and includes character information analyzed based on the form of characters included in the image data. Pattern recognition processing result is generated and stored in its own storage area. Here, it is considered that the character information included in the pattern recognition processing result may include character information that is erroneously analyzed due to character distortion or dirt in the image data. For example, there may be a case where a “large” character is misread by the pattern recognition process and output as a “dog” character.

文字情報入力部430には、処理対象データ入力部410に入力された画像データに対応する文字情報が入力され、記憶される。ここでは、例えば、ユーザは、コンピュータ装置のテキストエディタなどに、画像データに対応する文字情報を入力して文書ファイルを生成させ、生成された文書ファイルを画像変換することよって処理対象データ入力部410に入力する処理対象データを生成させる。これにより、処理対象データがパターン認識処理部420によって解析され記憶されたパターン認識処理結果と、文字情報入力部430に記憶された文字情報とを比較することで、文字認識処理による読み取り間違いを検出することが可能である。   In the character information input unit 430, character information corresponding to the image data input to the processing target data input unit 410 is input and stored. Here, for example, the user inputs character information corresponding to the image data into a text editor of a computer device to generate a document file, and converts the generated document file into an image, thereby converting the processing target data input unit 410. The processing target data to be input to is generated. As a result, the pattern recognition processing result obtained by analyzing and storing the processing target data by the pattern recognition processing unit 420 is compared with the character information stored in the character information input unit 430, thereby detecting a reading error due to the character recognition processing. Is possible.

誤りパターン記憶部440は、出現数記憶部441と、誤り数記憶部442と、重み係数記憶部443とを備えており、入力情報の誤りパターンを示す情報が記憶される。
出現数記憶部441には、定められた正解語毎に、文字情報入力部430に入力された文字情報に含まれる文字と、入力情報記憶部230に記憶された入力情報に含まれる文字とが正解語として記憶され、正解語毎に、文字情報入力部430に入力された文字情報または入力情報記憶部230に記憶された入力情報から正解語が検出された数が出現数として対応付けられて記憶される。
The error pattern storage unit 440 includes an appearance number storage unit 441, an error number storage unit 442, and a weight coefficient storage unit 443, and stores information indicating an error pattern of input information.
The number-of-appearance storage unit 441 includes, for each predetermined correct word, characters included in the character information input to the character information input unit 430 and characters included in the input information stored in the input information storage unit 230. The correct word is stored, and for each correct word, the number of correct words detected from the character information input to the character information input unit 430 or the input information stored in the input information storage unit 230 is associated as the number of appearances. Remembered.

図5は、出現数記憶部441に記憶される出現数のデータ例を示す図である。出現数記憶部441には、正解語と、OCR出現数と、人手による総合出現数と、作業経験年数1年未満出現数と、作業経験年数1年以上出現数とが対応付けられて記憶される。正解語には、文字情報入力部430に入力された文字情報に含まれる文字と、入力情報記憶部230に記憶された入力情報に含まれる文字との全てが含まれる。OCR出現数は、対応する正解語が文字情報入力部430に入力された文字情報から検出された数である。人手による総合出現数は、対応する正解語が入力情報記憶部230に記憶された入力情報に含まれる数である。作業経験年数1年未満出現数は、対応する正解語が、人手による総合出現数のうち作業経験年数1年未満のオペレータにより入力された入力情報に含まれる数である。作業経験年数1年以上出現数は、対応する正解語が、人手による総合出現数のうち作業経験年数1年以上のオペレータにより入力された入力情報に含まれる数である。   FIG. 5 is a diagram illustrating a data example of the number of appearances stored in the appearance number storage unit 441. In the appearance number storage unit 441, the correct word, the OCR appearance number, the total number of manual appearances, the number of work experience years less than one year, and the number of work experience years more than one year are stored in association with each other. The The correct word includes all of the characters included in the character information input to the character information input unit 430 and the characters included in the input information stored in the input information storage unit 230. The OCR appearance number is the number of corresponding correct words detected from the character information input to the character information input unit 430. The total number of manual appearances is the number of corresponding correct words included in the input information stored in the input information storage unit 230. The number of appearances of less than one year of work experience is the number of corresponding correct words included in the input information input by an operator who has less than one year of work experience among the total number of appearances by hand. The number of appearances of one year or more of work experience is a number in which the corresponding correct word is included in input information input by an operator who has one or more years of work experience among the total number of appearances by hand.

例えば、この例では、文字情報入力部430に入力された文字情報に、「大」の文字が20000文字、「小」の文字が15000文字、「ほ」の文字が60000文字含まれていることが検出され、入力情報記憶部230に記憶された入力情報に、「大」の文字が5000文字、「小」の文字が4000文字、「ほ」の文字が10000文字含まれていることが検出されたことを示している。   For example, in this example, the character information input to the character information input unit 430 includes 20000 characters for “Large”, 15000 characters for “Small”, and 60000 characters for “H”. Is detected, and it is detected that the input information stored in the input information storage unit 230 includes 5000 characters of “Large”, 4000 characters of “Small”, and 10,000 characters of “H”. It has been shown.

出現数記憶部441には、出現数算出部450によって算出された出現数が記憶される。出現数算出部450は、入力情報記憶部230に記憶された入力情報に含まれる文字と、文字情報入力部430に入力される文字情報に含まれる文字とのそれぞれについて出現数を算出し、出現数記憶部441に記憶させる。この際、出現数算出部450は、入力情報記憶部230に記憶されたオペレータIDに対応付けられた作業経験年数をオペレータ情報記憶部220から読み出す。出現数算出部450は、作業経験年数が1年未満であるか1年以上であるかを判定し、判定結果に基づいて出現数を算出し、出現数記憶部441に記憶させる。   The appearance number storage unit 441 stores the number of appearances calculated by the appearance number calculation unit 450. The appearance number calculation unit 450 calculates the number of appearances for each of the characters included in the input information stored in the input information storage unit 230 and the characters included in the character information input to the character information input unit 430. The number is stored in the number storage unit 441. At this time, the appearance number calculation unit 450 reads the work experience years associated with the operator ID stored in the input information storage unit 230 from the operator information storage unit 220. The appearance number calculation unit 450 determines whether the work experience year is less than one year or more than one year, calculates the appearance number based on the determination result, and stores the appearance number in the appearance number storage unit 441.

誤り数記憶部442には、出現数記憶部441に記憶された正解語と、その正解語が誤読された誤り語と、誤読された回数とを示す誤り数とが対応付けられて記憶される。図6は、誤り数記憶部442に記憶される誤り数のデータ例を示す図である。誤り数記憶部442には、正解語と、誤り語と、OCR誤り数と、人手による総合誤り数と、作業経験年数1年未満誤り数と、作業経験年数1年以上誤り数とが対応付けられて記憶されている。   In the error number storage unit 442, the correct word stored in the appearance number storage unit 441, the error word in which the correct word is misread, and the number of errors indicating the number of misreads are stored in association with each other. . FIG. 6 is a diagram illustrating an example of data on the number of errors stored in the error number storage unit 442. In the error number storage unit 442, the correct word, the error word, the number of OCR errors, the total number of manual errors, the number of errors of less than one year of work experience, and the number of errors of one year or more of work experience are associated with each other. Is remembered.

OCR誤り数は、出現数記憶部441に記憶されたOCR出現数のうち、正解語がパターン認識処理部420によって対応する誤り語に誤読された数を示す。人手による総合誤り数は、出現数記憶部441に記憶された人手による総合出現数のうち、正解語がオペレータによって対応する誤り語に誤読された数を示す。作業経験年数1年未満誤り数は、人手による総合出現数のうち作業経験年数1年未満のオペレータにより誤読され入力された入力情報に含まれる数を示す。作業経験年数1年以上誤り数は、人手による総合出現数のうち作業経験年数1年以上のオペレータにより誤読され入力された入力情報に含まれる数を示す。   The number of OCR errors indicates the number of correct words that have been misread as corresponding error words by the pattern recognition processing unit 420 among the OCR appearance numbers stored in the appearance number storage unit 441. The total number of manual errors indicates the number of correct words that are erroneously read by the operator as the corresponding error words out of the total number of manual appearances stored in the appearance number storage unit 441. The number of errors of less than one year of work experience indicates the number included in the input information misread by the operator having less than one year of work experience out of the total number of appearances by hand. The number of errors for one year or more of work experience indicates the number included in the input information misread and input by an operator having a work experience of one year or more out of the total number of appearances by hand.

誤り数記憶部442には、誤り数算出部460によって算出された誤り数が記憶される。例えば、誤り数算出部460は、パターン認識処理部420に記憶されたパターン認識処理結果と、文字情報入力部430に記憶された文字情報とを比較し、OCRにより正解語が誤り語として誤読された数であるOCR誤り数を算出し、誤り数記憶部442に記憶させる。また、誤り数算出部460は、入力情報記憶部230に記憶された入力情報のうち、入力番号「1」として記憶された入力情報と、入力番号「2」として記憶された入力情報とを比較し、入力番号が「1」である入力情報に含まれる文字と、入力番号が「2」である入力情報に含まれる文字との差分を検出する。そして、差分を検出した文字について、入力番号が「1」である入力情報に含まれる文字を誤り語とし、入力番号が「2」である入力情報に含まれる文字を正解語として、人手による総合誤り数を算出して、誤り数記憶部442に記憶させる。この際、誤り数算出部460は、入力情報記憶部230に記憶されたオペレータIDに対応付けられた作業経験年数をオペレータ情報記憶部220から読み出す。誤り数算出部460は、作業経験年数が1年未満であるか1年以上であるかを判定し、判定結果に基づいて誤り数を算出し、誤り数記憶部442に記憶させる。   In the error number storage unit 442, the error number calculated by the error number calculation unit 460 is stored. For example, the error count calculation unit 460 compares the pattern recognition processing result stored in the pattern recognition processing unit 420 with the character information stored in the character information input unit 430, and the correct word is misread as an error word by OCR. The number of OCR errors which is the calculated number is calculated and stored in the error number storage unit 442. Further, the error number calculation unit 460 compares the input information stored as the input number “1” and the input information stored as the input number “2” among the input information stored in the input information storage unit 230. Then, the difference between the character included in the input information whose input number is “1” and the character included in the input information whose input number is “2” is detected. Then, for the character from which the difference is detected, the character included in the input information whose input number is “1” is set as an error word, and the character included in the input information whose input number is “2” is set as a correct word. The number of errors is calculated and stored in the error number storage unit 442. At this time, the error number calculation unit 460 reads the work experience years associated with the operator ID stored in the input information storage unit 230 from the operator information storage unit 220. The error number calculation unit 460 determines whether the work experience year is less than one year or more than one year, calculates the error number based on the determination result, and stores the error number in the error number storage unit 442.

重み係数記憶部443には、OCR誤り数に対する人手による誤り数の信頼性の高さの度合いを示す重み係数が記憶される。重み係数は、正解語の誤り率が算出される際に参照される。また、重み係数は、定められた1以上の数値であり、初期値としては予め定められた値が記憶されており、重み係数算出部480によって算出された重み係数によって更新されて記憶される。   The weighting coefficient storage unit 443 stores a weighting coefficient indicating the degree of reliability of the number of manual errors with respect to the number of OCR errors. The weight coefficient is referred to when the error rate of the correct word is calculated. The weighting factor is a predetermined numerical value of 1 or more, and a predetermined value is stored as an initial value, and is updated and stored with the weighting factor calculated by the weighting factor calculation unit 480.

誤り率算出部470は、出現数記憶部441に記憶された出現数と、誤り数記憶部442に記憶された誤り数と、重み係数記憶部443に記憶された重み係数とに基づいて、誤り数記憶部442に記憶された正解語が誤り語として誤読される確率を示す誤り率を算出する。ここでは、誤り率算出部470は、正解語に対応するOCR出現数をnとし、人手による総合出現数をnとし、OCR誤り数をeとし、人手による総合誤り数をeとし、重み係数をTとして、正解語が誤り語として誤読される誤り率Pを以下式(1)によって算出する。 Based on the number of appearances stored in the number of appearances storage unit 441, the number of errors stored in the number of errors storage unit 442, and the weighting factor stored in the weighting factor storage unit 443, the error rate calculation unit 470 An error rate indicating the probability that the correct word stored in the number storage unit 442 is misread as an error word is calculated. Here, the error rate calculation unit 470 sets the number of OCR appearances corresponding to the correct word to n 0 , sets the total number of manual appearances to n 1 , sets the number of OCR errors to e 0, and sets the total number of manual errors to e 1. The error rate P at which the correct word is misread as an error word is calculated by the following equation (1), where T is a weighting factor.

Figure 0005145287
Figure 0005145287

ここで、オペレータ入力端末100や修正入力端末300には、入力情報が複数回の段階に亘って入力されることとなる。各段階における誤り率の算出式は、より具体的には、出現数記憶部441に記憶されたOCR出現数をnとし、入力情報記憶部230に記憶された入力番号が1である入力情報に基づいて出現数記憶部441に記憶された人手による総合出現数をnとし、入力情報記憶部230に記憶された入力番号が2である入力情報に基づいて出現数記憶部441に記憶された人手による総合出現数をnとする。以降、入力情報記憶部230に記憶された入力番号をiとすると、出現数記憶部441に記憶された人手による総合出現数をnとする。 Here, input information is input to the operator input terminal 100 and the correction input terminal 300 over a plurality of stages. More specifically, the calculation formula of the error rate at each stage is the input information in which the OCR appearance number stored in the appearance number storage unit 441 is n 0 and the input number stored in the input information storage unit 230 is 1. Overall the number of occurrences and n 1 manual stored in the appearance count storage unit 441 based on, is stored in the occurrence count storage unit 441 based on the input information stored input number is 2 in the input information storage unit 230 Let n 2 be the total number of appearances made manually. Hereinafter, if the input number stored in the input information storage unit 230 is i, the total number of manual appearances stored in the appearance number storage unit 441 is n i .

また、誤り数記憶部442に記憶されるOCR誤り数をeとし、入力情報記憶部230に記憶された入力番号が1である入力情報に基づいて誤り数記憶部442に記憶された人手による総合誤り数をeとし、入力情報記憶部230に記憶された入力番号が2である入力情報に基づいて誤り数記憶部442に記憶された人手による総合出現数をeとする。以降、入力情報記憶部230に記憶された入力番号をiとすると、誤り数記憶部442に記憶された人手による総合誤り数をeとする。また、重み係数記憶部443に記憶された重み係数をTとする。 Further, the number of OCR errors stored in the error number storage unit 442 is set to e 0, and the input number stored in the input information storage unit 230 is manually stored in the error number storage unit 442 based on the input information of 1 The total number of errors is e 1, and the total number of manual appearances stored in the error number storage unit 442 based on the input information whose input number is 2 stored in the input information storage unit 230 is e 2 . Hereinafter, if the input number stored in the input information storage unit 230 is i, the total number of manual errors stored in the error number storage unit 442 is set to e i . The weighting factor stored in the weighting factor storage unit 443 is T.

ここで、パターン認識処理に基づく誤り数と、人手による修正処理に基づく誤り数とにおいては、人手による修正処理に基づく誤り数の方がより信頼性が高いと仮定して、誤り率算出部470は、人手による修正処理に基づく誤り数に対して1以上の重み係数を乗算して誤り率を算出する。例えば、誤り率算出部470は、段階2における誤り率P(Step2)を、以下式(2)によって算出する。   Here, regarding the number of errors based on the pattern recognition process and the number of errors based on the manual correction process, it is assumed that the number of errors based on the manual correction process is more reliable, and the error rate calculation unit 470. Calculates the error rate by multiplying the number of errors based on manual correction processing by one or more weighting factors. For example, the error rate calculation unit 470 calculates the error rate P (Step 2) in stage 2 by the following equation (2).

Figure 0005145287
Figure 0005145287

同様に、段階3における誤り率P(Step3)を、以下式(3)によって算出する。   Similarly, the error rate P (Step 3) in stage 3 is calculated by the following equation (3).

Figure 0005145287
Figure 0005145287

ここで、誤り率算出部470は、入力情報を入力したオペレータのオペレータIDに対応する属性毎に異なる重み係数を適用して誤り率を算出するようにしても良い。例えば、作業経験年数が少ない場合には大きい値を、作業経験年数が多い場合には小さい値を重み係数として算出する。また、例えば、入力情報を入力したオペレータのオペレータIDに対応する年齢が高い場合には小さい値を、年齢が低い場合には大きい値を重み係数として算出する。   Here, the error rate calculation unit 470 may calculate the error rate by applying a different weighting factor for each attribute corresponding to the operator ID of the operator who has input the input information. For example, a large value is calculated as the weighting coefficient when the work experience years are small, and a small value is calculated when the work experience years is large. Further, for example, a small value is calculated as the weighting factor when the age corresponding to the operator ID of the operator who has input the input information is high, and a large value is calculated when the age is low.

重み係数算出部480は、出現数記憶部441に記憶された出現数と、誤り数記憶部442に記憶された誤り数とに基づいて、重み係数を算出する。ここで、重み係数算出部480は、複数段階のうち最後の段階において誤り数記憶部442によって算出された誤り率をPとし、正解語に対応するOCR出現数をnとし、人手による総合出現数をnとし、OCR誤り数をeとし、人手による総合誤り数をeとして、重み係数Tを以下式(4)によって算出する。

Figure 0005145287
ここでは、入力情報記憶部230に同一の入力情報IDに対応付けられた複数の入力番号に応じた入力情報が記憶されている場合には、より後の段階における入力情報に基づいて算出された誤り率の方がより信頼性が高いと考えられる。そこで、最後の段階での誤り率がより正しいとして、誤り率算出部470は、一つ前の段階において算出した誤り率が、最後の段階において算出した誤り率となるような重み係数Tを算出し、算出した重み係数を、重み係数記憶部443に記憶させる。 The weighting factor calculation unit 480 calculates a weighting factor based on the appearance number stored in the appearance number storage unit 441 and the error number stored in the error number storage unit 442. Here, the weighting factor calculation unit 480 sets P as the error rate calculated by the error number storage unit 442 in the last step among the plurality of steps, sets n 0 as the number of OCR appearances corresponding to the correct word, and makes the total appearance by hand. The number is n 1 , the number of OCR errors is e 0 , the total number of manual errors is e 1 , and the weight coefficient T is calculated by the following equation (4).
Figure 0005145287
Here, when input information corresponding to a plurality of input numbers associated with the same input information ID is stored in the input information storage unit 230, it is calculated based on the input information at a later stage. The error rate is considered to be more reliable. Therefore, assuming that the error rate at the last stage is more correct, the error rate calculation unit 470 calculates a weighting factor T such that the error rate calculated at the previous stage becomes the error rate calculated at the last stage. Then, the calculated weighting coefficient is stored in the weighting coefficient storage unit 443.

例えば、重み係数算出部480が重み係数を算出する時点で、段階3が最後の段階であるとすると、段階2における誤り率が、段階3における誤り率と一致するようなTの値を算出する。このような条件を満たすTをTnewとすると、誤り率P(Step3)とTnewとの関係は以下式(5)のように表すことができる。 For example, assuming that stage 3 is the last stage when the weighting coefficient calculation unit 480 calculates the weighting coefficient, the value of T is calculated such that the error rate in stage 2 matches the error rate in stage 3. . When such a condition is satisfied T and T new, relationship between T new error rate P (Step3) can be expressed as: Equation (5).

Figure 0005145287
Figure 0005145287

これをTnewについて解くと、以下式(6)のように表すことができる。 When this is solved for T new , it can be expressed as in equation (6) below.

Figure 0005145287
Figure 0005145287

重み係数算出部480は、上記式(6)により算出した重み係数Tnewを、重み係数記憶部443に記憶させる。 Weight coefficient calculation unit 480, a weighting factor T new calculated by the equation (6), is stored in the weight coefficient storage unit 443.

同様に、段階4が最後の段階であれば、段階4における誤り率が、段階3における誤り率となるようなTの値を算出する。このような条件を満たすTをTnewとすると、誤り率P(Step4)とTnewとの関係は以下式(7)のように表すことができる。 Similarly, if stage 4 is the last stage, the value of T is calculated such that the error rate in stage 4 becomes the error rate in stage 3. When such a condition is satisfied T and T new, relationship between T new error rate P (Step4) can be expressed as: Equation (7).

Figure 0005145287
Figure 0005145287

これをTnewについて解くと、以下式(8)のように表すことができる。 When this is solved for T new , it can be expressed as shown in equation (8) below.

Figure 0005145287
Figure 0005145287

ここで、重み係数算出部480は、出現数記憶部441に記憶された出現数や、誤り数記憶部442に記憶された誤り数が、作業経験年数などの属性毎に記憶されている場合には、属性毎に重み係数を算出する。   Here, the weight coefficient calculation unit 480 stores the number of appearances stored in the appearance number storage unit 441 and the number of errors stored in the error number storage unit 442 for each attribute such as the number of years of work experience. Calculates a weighting factor for each attribute.

警告部490は、入力装置200から送信される、オペレータ入力端末100に入力された入力情報を受信する。警告部490は、受信した入力情報に含まれる文字情報が、誤り語として誤り数記憶部442に記憶されているか否かを判定する。警告部490は、受信した入力情報に含まれる文字情報が、誤り語として誤り数記憶部442に記憶されていないと判定すれば、警告情報を送信しない。一方、警告部490は、受信した入力情報に含まれる文字情報が、誤り語として誤り数記憶部442に記憶されていると判定すれば、その誤り語に応じて誤り率算出部470が算出した誤り率が、予め定められた閾値を超えているか否かを判定する。警告部490は、誤り語に応じて誤り率算出部470が算出した誤り率が、予め定められた閾値を超えていると判定すると、その誤り語に対応する正解語を、警告情報として入力装置200に送信する。ここで、警告部490は、入力情報に含まれる文字情報に対応する複数の正解語を誤り数記憶部442から検出し、検出した複数の正解語のうち、対応する誤り率が閾値を超えるものが複数存在すれば、複数の正解語を、例えば誤り率の降順に並べて、入力装置200に送信する。一方、警告部490は、誤り語に応じて誤り率算出部470が算出した誤り率が、予め定められた閾値を超えていないと判定すれば、警告情報を送信しない。   The warning unit 490 receives input information transmitted from the input device 200 and input to the operator input terminal 100. The warning unit 490 determines whether the character information included in the received input information is stored in the error count storage unit 442 as an error word. If the warning unit 490 determines that the character information included in the received input information is not stored in the error count storage unit 442 as an error word, the warning unit 490 does not transmit the warning information. On the other hand, if the warning unit 490 determines that the character information included in the received input information is stored in the error count storage unit 442 as an error word, the error rate calculation unit 470 calculates the error word according to the error word. It is determined whether the error rate exceeds a predetermined threshold. When the warning unit 490 determines that the error rate calculated by the error rate calculation unit 470 according to the error word exceeds a predetermined threshold, the correct word corresponding to the error word is input as warning information to the input device. 200. Here, the warning unit 490 detects a plurality of correct words corresponding to the character information included in the input information from the error number storage unit 442, and among the detected plurality of correct words, the corresponding error rate exceeds a threshold value. If there are a plurality of correct words, a plurality of correct words are arranged in descending order of error rates, for example, and transmitted to the input device 200. On the other hand, if the warning unit 490 determines that the error rate calculated by the error rate calculation unit 470 according to the error word does not exceed a predetermined threshold, the warning unit 490 does not transmit the warning information.

次に、本実施形態による入力システム1の動作例を説明する。図8は、入力システム1が、入力誤り警告装置400の誤りパターン記憶部440に情報を記憶させる動作例を示すフローチャートである。
出現数算出部450は、修正入力端末300に入力され入力制御部210に送信された
正解語が、出現数記憶部441に記憶されているか否かを判定する(ステップS1)。出現数算出部450は、正解語が出現数記憶部441に記憶されていると判定すると(ステップS1:YES)、出現数記憶部441に記憶された正解語に対応する出現数に1を加算した値を記憶させる(ステップS2)。ここでは、人手による総合出現数と、オペレータの属性情報に応じた経験年数別の出現数との双方の値を増加させる。
Next, an operation example of the input system 1 according to the present embodiment will be described. FIG. 8 is a flowchart illustrating an operation example in which the input system 1 stores information in the error pattern storage unit 440 of the input error warning device 400.
The appearance number calculation unit 450 determines whether or not the correct word input to the correction input terminal 300 and transmitted to the input control unit 210 is stored in the appearance number storage unit 441 (step S1). If the appearance number calculation unit 450 determines that the correct word is stored in the appearance number storage unit 441 (step S1: YES), the appearance number calculation unit 450 adds 1 to the appearance number corresponding to the correct word stored in the appearance number storage unit 441. The stored value is stored (step S2). Here, the value of both the total number of appearances manually and the number of appearances according to the years of experience according to the attribute information of the operator is increased.

誤り数算出部460は、修正された正解語と誤り語との組み合わせが、誤り数記憶部442に記憶されているか否かを判定する(ステップS4)。誤り数算出部460によって、正解語と誤り語との組み合わせが誤り数記憶部442に記憶されていると判定されると(ステップS4:YES)、誤り数記憶部442に記憶された正解語と誤り語との組み合わせに対応する誤り数に1を増加した値を記憶させる(ステップS5)。重み係数算出部480は、誤りパターン記憶部440に記憶された出現数と、誤り数記憶部442に記憶された誤り数とに基づいて重み係数を算出し、算出した重み係数を重み係数記憶部443に記憶させ(ステップS7)、処理を終了する。   The error number calculation unit 460 determines whether or not the combination of the corrected correct word and the error word is stored in the error number storage unit 442 (step S4). If it is determined by the error number calculation unit 460 that the combination of the correct word and the error word is stored in the error number storage unit 442 (step S4: YES), the correct word stored in the error number storage unit 442 A value obtained by incrementing the number of errors corresponding to the combination with the error word by 1 is stored (step S5). The weighting factor calculation unit 480 calculates a weighting factor based on the number of appearances stored in the error pattern storage unit 440 and the number of errors stored in the error number storage unit 442, and the calculated weighting factor is used as the weighting factor storage unit. It memorize | stores in 443 (step S7), and complete | finishes a process.

一方、ステップS1において、出現数算出部450が、正解語は出現数記憶部441に記憶されていないと判定すると(ステップS1:NO)、出現数記憶部441に、その正解語についてのデータを新たに追加し、出現数「1」を対応付けて記憶させる(ステップS3)。また、ステップS4において、誤り数算出部460によって正解語と誤り語との組み合わせが誤り数記憶部442に記憶されていると判定されると(ステップS4:NO)、誤り数記憶部442に、正解語と誤り語との組み合わせのデータを新たに追加し、誤り数「1」を対応付けて記憶させ(ステップS6)、ステップS7に進む。   On the other hand, when the appearance number calculation unit 450 determines in step S1 that the correct word is not stored in the appearance number storage unit 441 (step S1: NO), the appearance number storage unit 441 stores data regarding the correct word. Newly added and the number of appearances “1” is stored in association with each other (step S3). In step S4, if the error number calculation unit 460 determines that the combination of the correct word and the error word is stored in the error number storage unit 442 (step S4: NO), the error number storage unit 442 stores Data of a combination of a correct word and an error word is newly added, the number of errors “1” is stored in association with each other (step S6), and the process proceeds to step S7.

次に、図9を参照して、オペレータから入力される入力情報に応じて、入力システム1が警告情報を出力する動作例を説明する。
ここでは、オペレータ入力端末100に入力されたオペレータ情報に応じたログイン処理が成功すると、入力制御部210は、ログインされたオペレータIDに対応する尾オペレータの属性情報をオペレータ情報記憶部220から読み出す(ステップS11)。オペレータ入力端末100に、入力装置200から送信された問合せ内容の入力画面が表示されると、オペレータは、入力項目毎に入力情報を入力する。オペレータ入力端末100は、オペレータから入力された入力情報を、入力誤り警告装置400に送信する。警告部490は、オペレータ入力端末100から送信された入力情報に含まれる文字(入力語)を誤り語とする誤り数が、誤り数記憶部442に記憶されているか否かを判定する(ステップS12)。
Next, an operation example in which the input system 1 outputs warning information in accordance with input information input from an operator will be described with reference to FIG.
Here, when the login process according to the operator information input to the operator input terminal 100 is successful, the input control unit 210 reads out the tail operator attribute information corresponding to the logged-in operator ID from the operator information storage unit 220 ( Step S11). When the input screen for the inquiry content transmitted from the input device 200 is displayed on the operator input terminal 100, the operator inputs input information for each input item. The operator input terminal 100 transmits the input information input from the operator to the input error warning device 400. The warning unit 490 determines whether or not the number of errors having the character (input word) included in the input information transmitted from the operator input terminal 100 as an error word is stored in the error number storage unit 442 (step S12). ).

警告部490が、オペレータ入力端末100から送信された入力語を誤り語とする誤り数が誤り数記憶部442に記憶されていると判定すると(ステップS12:YES)、誤り率算出部470は、ステップS11で読み出されたオペレータの属性情報に含まれる作業経験年数を、入力装置200のオペレータ情報記憶部220から読み出し、読み出した経験年数に応じた誤り数を誤り数記憶部442から読み出す。また、誤り率算出部470は、オペレータIDに対応する経験年数に応じた重み係数を、重み係数記憶部443から読み出す(ステップS13)。   When the warning unit 490 determines that the number of errors having the input word transmitted from the operator input terminal 100 as an error word is stored in the error number storage unit 442 (step S12: YES), the error rate calculation unit 470 The work experience years included in the operator attribute information read in step S11 is read from the operator information storage unit 220 of the input device 200, and the number of errors corresponding to the read experience years is read from the error number storage unit 442. Further, the error rate calculation unit 470 reads a weighting factor corresponding to the years of experience corresponding to the operator ID from the weighting factor storage unit 443 (step S13).

誤り率算出部470は、読み出した出現数と、誤り数と、重み係数とに基づいて、誤り率を算出する(ステップS14)。警告部490は、算出した誤り率と、予め定められた閾値とを比較し、誤り率が閾値を超えると判定すると、入力情報に対応する正解語が含まれる警告情報を、オペレータ入力端末100に送信する(ステップS15)。ここで、誤り率が閾値を超えない場合は、警告部490は警告情報を送信しない。そして、オペレータ入力端末100に表示された警告情報に応じて、オペレータが警告された正解語を選択すると、オペレータ入力端末100は、選択された正解語を入力誤り警告装置400に送信する(ステップS16)。   The error rate calculation unit 470 calculates an error rate based on the read appearance number, error number, and weighting factor (step S14). When the warning unit 490 compares the calculated error rate with a predetermined threshold and determines that the error rate exceeds the threshold, the warning unit 490 sends warning information including a correct word corresponding to the input information to the operator input terminal 100. Transmit (step S15). Here, when the error rate does not exceed the threshold, the warning unit 490 does not transmit warning information. When the operator selects the correct word that has been warned in accordance with the warning information displayed on the operator input terminal 100, the operator input terminal 100 transmits the selected correct word to the input error warning device 400 (step S16). ).

誤り数算出部460は、オペレータ入力端末100から送信された正解語を受信すると(ステップS16)、誤り数記憶部442に記憶された誤り数を更新して記憶させる(ステップS17)。一方、ステップS12において、警告部490が、オペレータ入力端末100から送信された入力情報に含まれる文字を誤り語とする誤り数が誤り数記憶部442に記憶されていないと判定すると(ステップS12:NO)、警告部490は警告処理を終了する。また、ステップS16において、警告情報に応じた修正入力が送信されなかった場合(ステップS16:NO)、警告部490は警告処理を終了する。   When the error count calculation unit 460 receives the correct word transmitted from the operator input terminal 100 (step S16), the error count calculation unit 460 updates and stores the error count stored in the error count storage unit 442 (step S17). On the other hand, when the warning unit 490 determines in step S12 that the number of errors having the character included in the input information transmitted from the operator input terminal 100 as an error word is not stored in the error number storage unit 442 (step S12: NO), the warning unit 490 ends the warning process. In step S16, when the correction input corresponding to the warning information is not transmitted (step S16: NO), the warning unit 490 ends the warning process.

なお、本実施形態では、処理対象データ入力部410に入力されるサンプルの画像データは、特定の文字コードにおいて定められた全ての文字が含まれる文字コード表が印刷された紙媒体をスキャナなどにより読み取った情報であるとしたが、例えば、顧客によって問い合わせ内容が記載された紙媒体がスキャナなどによって電子化された画像データなどを適用しても良い。   In the present embodiment, sample image data input to the processing target data input unit 410 is a paper medium on which a character code table including all characters defined in a specific character code is printed using a scanner or the like. Although it is the read information, for example, image data obtained by digitizing a paper medium on which inquiry contents are written by a customer by a scanner or the like may be applied.

また、本実施形態では、オペレータ入力端末100と修正入力端末300とを異なるコンピュータ端末として説明したが、同一のオペレータが、同一のコンピュータ端末を用いて、紙媒体からの読み取り入力と、入力情報の修正入力との双方を行っても良い。
また、本実施形態では、入力装置200がウェブサーバの機能を備え、HTTP通信等によるオペレータ入力端末100から送信される入力情報を受信することとしたが、オペレータ入力端末100と入力装置200とは、他の通信方法によって情報の送受信を行なうようにしても良い。また、例えばオペレータ入力端末100と入力装置200とが備える機能部を単一のコンピュータ装置が備えるように構成したり、入力装置200と修正入力端末300とが備える機能部を単一のコンピュータ装置が備えるように構成したり、オペレータ入力端末100と入力装置200と修正入力端末300との全てが備える機能部を単一のコンピュータ装置が備えるように構成するようにしても良い。
Further, in the present embodiment, the operator input terminal 100 and the correction input terminal 300 are described as different computer terminals. However, the same operator uses the same computer terminal to read input from a paper medium and input information. You may perform both correction input.
In the present embodiment, the input device 200 has a web server function and receives input information transmitted from the operator input terminal 100 by HTTP communication or the like. However, the operator input terminal 100 and the input device 200 are different from each other. Information may be transmitted and received by other communication methods. Further, for example, a single computer device may be configured to include a functional unit included in the operator input terminal 100 and the input device 200, or a single computer device may include a functional unit included in the input device 200 and the correction input terminal 300. It may be configured to include a functional unit included in all of the operator input terminal 100, the input device 200, and the correction input terminal 300, or may be configured to include a single computer device.

また、本実施形態では、オペレータ情報記憶部220に記憶されたオペレータの属性情報のうち、作業経験年数毎に誤り率等を算出する例を示したが、年齢毎に誤り率等を算出するようにしても良いし、性別毎に誤り率等を算出するようにしても良い。入力システム1の管理者は、入力情報の内容などに応じて、誤り率を算出するために有用な属性毎に誤り率等を算出するようにしても良い。   Further, in the present embodiment, an example in which the error rate and the like are calculated for each year of work among the operator attribute information stored in the operator information storage unit 220 has been shown. However, the error rate and the like are calculated for each age. Alternatively, an error rate or the like may be calculated for each gender. The administrator of the input system 1 may calculate an error rate or the like for each attribute useful for calculating the error rate according to the content of the input information.

また、本実施形態では、処理対象データ入力部410には処理対象データとして画像データが入力され、パターン認識処理部420は文字認識処理を行って処理対象データに含まれる文字情報を検出する例を示したが、処理対象データ入力部410には処理対象データとして音声データが入力され、パターン認識処理部420は音声認識処理を行って処理対象データに含まれる文字情報を検出してパターン認識処理結果を出力するようにしても良い。   In this embodiment, image data is input as processing target data to the processing target data input unit 410, and the pattern recognition processing unit 420 performs character recognition processing to detect character information included in the processing target data. As shown, voice data is input to the processing target data input unit 410 as processing target data, and the pattern recognition processing unit 420 performs voice recognition processing to detect character information included in the processing target data and performs pattern recognition processing results. May be output.

また、本実施形態では、例えば、作業経験年数のようなオペレータの属性毎に、誤り率や重み係数を算出するようにしたが、例えば、入力項目(例えば、氏名、住所、電話番号など)毎に異なる誤り率や重み係数を算出するようにしても良いし、字種(例えば、漢字・平仮名混じり、漢字のみ、平仮名のみ、カタカナのみ、数字・記号のみなど)毎に異なる誤り率や重み係数を算出するようにしても良い。   In this embodiment, for example, the error rate and the weighting factor are calculated for each attribute of the operator such as years of work experience. For example, for each input item (for example, name, address, telephone number, etc.) Different error rates and weighting factors may be calculated, and different error rates and weighting factors for each character type (for example, kanji / hirakana mixed, kanji only, hiragana only, katakana only, numbers / symbols, etc.) May be calculated.

以上説明したように、本実施形態の入力システム1によれば、パターン認識処理による誤読と、オペレータにより文字が読み取られる際の誤読とに相関関係があることを利用して入力誤りを検出して警告するため、オペレータによる実際の入力誤りが蓄積される前にも、より精度の高い正解語と誤り語との組み合わせに基づいて入力誤りの警告を行うことが可能となる。また、オペレータにより実際に入力された入力情報と、修正済の入力情報とに基づいて入力語の誤り率を再算出し、オペレータの入力誤りを学習することで、より正確に入力誤りの警告を行うことが可能となる。   As described above, according to the input system 1 of the present embodiment, an input error is detected by utilizing the fact that there is a correlation between misreading by pattern recognition processing and misreading when a character is read by an operator. In order to warn, it is possible to warn of an input error based on a combination of a correct word and an error word with higher accuracy before an actual input error by the operator is accumulated. In addition, by recalculating the error rate of the input word based on the input information actually input by the operator and the corrected input information, and learning the input error of the operator, the input error warning is more accurately performed. Can be done.

さらに、入力情報を入力するオペレータの作業経験年数や年齢、性別などの属性に基づいて誤り率を算出することが可能であるため、より正確な誤り推定を行うことが可能である。また、出現数と誤り数との比に基づいて誤り率を算出するため、記憶された件数が少ない入力語や、複数の入力項目に同時に誤りが発生しているような場合にも、入力誤りを推定することが可能である。   Furthermore, since it is possible to calculate an error rate based on attributes such as years of work experience, age, and sex of an operator who inputs input information, more accurate error estimation can be performed. In addition, since the error rate is calculated based on the ratio between the number of occurrences and the number of errors, input errors can occur even when input words with a small number of stored words or errors occur simultaneously in multiple input items. Can be estimated.

なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより入力誤りの警告を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   Note that a program for realizing the function of the processing unit in the present invention is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed, thereby executing an input error warning. May be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

1 入力システム
100 オペレータ入力端末
200 入力装置
210 入力制御部
220 オペレータ情報記憶部
230 入力情報記憶部
300 修正入力端末
400 入力誤り警告装置
410 処理対象データ入力部
420 パターン認識処理部
430 文字情報入力部
440 誤りパターン記憶部
441 出現数記憶部
442 誤り数記憶部
443 重み係数記憶部
450 出現数算出部
460 誤り数算出部
470 誤り率算出部
480 重み係数算出部
490 警告部
DESCRIPTION OF SYMBOLS 1 Input system 100 Operator input terminal 200 Input device 210 Input control part 220 Operator information storage part 230 Input information storage part 300 Correction input terminal 400 Input error warning device 410 Processing target data input part 420 Pattern recognition processing part 430 Character information input part 440 Error pattern storage unit 441 Appearance number storage unit 442 Error number storage unit 443 Weight coefficient storage unit 450 Appearance number calculation unit 460 Error number calculation unit 470 Error rate calculation unit 480 Weight coefficient calculation unit 490 Warning unit

Claims (6)

定められた文字情報である正解語と、パターン認識処理により文字情報を検出する処理対象である処理対象データに含まれる前記正解語の数を示す第1の出現数と、ユーザに入力された文字情報に含まれる前記正解語の数を示す第2の出現数とが対応付けられて記憶される出現数記憶部と、
前記正解語と、前記正解語が誤読された結果である誤り語と、前記パターン認識処理によって前記正解語が前記誤り語として誤読された数を示す第1の誤り数と、前記ユーザによって前記正解語が前記誤り語として誤読された数を示す第2の誤り数とが対応付けられて記憶される誤り数記憶部と、
前記第1の誤り数に対する前記第2の誤り数の信頼性の高さの度合いを示す重み係数が記憶される重み係数記憶部と、
前記正解語に対応する前記第1の出現数と、前記第2の出現数と、前記第1の誤り数と、前記第2の誤り数と、前記重み係数とに基づいて、前記正解語が前記誤り語として誤読される誤り率を算出する誤り率算出部と、
ユーザから入力される文字情報を受付ける入力部と、
前記入力部に入力された前記文字情報が、前記誤り語として前記誤り数記憶部に記憶されており、かつ、当該誤り語に応じて前記誤り率算出部が算出した前記誤り率が予め定められた閾値を超えていると判定すると、当該誤り語に対応する前記正解語を出力する警告部と、
を備えることを特徴とする入力誤り警告装置。
A correct word that is defined character information, a first appearance number that indicates the number of correct words included in the processing target data that is a processing target for detecting character information by pattern recognition processing, and a character input by the user An appearance number storage unit that stores the second appearance number indicating the number of correct words included in the information in association with each other;
The correct word, an error word that is a result of misreading the correct word, a first error number that indicates the number of misread words as the error word by the pattern recognition process, and the correct answer by the user An error number storage unit in which a second error number indicating the number of words misread as the error word is associated and stored;
A weighting coefficient storage unit that stores a weighting coefficient indicating a degree of reliability of the second error number with respect to the first error number;
Based on the first number of occurrences, the second number of occurrences, the first number of errors, the second number of errors, and the weighting factor corresponding to the correct word, An error rate calculation unit for calculating an error rate misread as the error word;
An input unit for receiving character information input by the user;
The character information input to the input unit is stored as the error word in the error number storage unit, and the error rate calculated by the error rate calculation unit is determined in advance according to the error word. A warning unit that outputs the correct word corresponding to the error word;
An input error warning device comprising:
前記入力部に入力された前記文字情報についての修正入力を受け付ける修正入力部と、
前記修正入力部に入力された前記文字情報に含まれる前記正解語の数を算出し、算出した数を前記出現数記憶部に記憶された前記第2の出現数に加算して記憶させる出現数算出部と、
前記入力部に入力された文字情報と、前記修正入力部に入力された文字情報とを比較して差分を検出し、差分が存在する文字について、前記入力部に入力された文字を誤り語とし、前記修正入力部に入力された文字を正解語とする数を算出し、算出した数を前記誤り数記憶部に記憶された前記第2の誤り数に加算して記憶させる誤り数算出部と、
前記正解語に対応する前記第1の出現数と、前記第2の出現数と、前記第1の誤り数と、前記第2の誤り数とに基づいて、前記重み係数を算出し、前記重み係数記憶部に記憶させる重み係数算出部と、
を備えることを特徴とする請求項1に記載の入力誤り警告装置。
A correction input unit that receives a correction input for the character information input to the input unit;
The number of occurrences of calculating the number of correct words included in the character information input to the correction input unit, and adding the calculated number to the second number of appearances stored in the appearance number storage unit to be stored A calculation unit;
The character information input to the input unit and the character information input to the correction input unit are compared to detect a difference, and the character input to the input unit is used as an error word for a character having a difference. An error number calculation unit that calculates a number that uses the character input to the correction input unit as a correct word and adds the calculated number to the second error number stored in the error number storage unit; ,
Based on the first number of appearances, the second number of appearances, the first number of errors, and the second number of errors corresponding to the correct word, the weight coefficient is calculated, and the weight A weight coefficient calculation unit to be stored in the coefficient storage unit;
The input error warning device according to claim 1, further comprising:
前記パターン認識処理は、前記処理対象データである画像データから文字情報を検出する文字認識処理と、前記処理対象データである音声データから文字情報を検出する音声認識処理とのいずれかである
ことを特徴とする請求項1または請求項2に記載の入力誤り警告装置。
The pattern recognition process is one of a character recognition process for detecting character information from image data that is the processing target data and a voice recognition process for detecting character information from voice data that is the processing target data. The input error warning device according to claim 1, wherein the input error warning device is a warning.
前記ユーザの属性を示すユーザ情報が記憶されるユーザ属性情報記憶部を備え、
前記出現数記憶部には、前記ユーザの属性毎に前記第2の出現数が記憶され、
前記誤り数記憶部には、前記ユーザの属性毎に前記第2の誤り数が記憶され、
前記重み係数記憶部には、前記ユーザの属性毎に前記重み係数が記憶され、
前記誤り率算出部は、前記ユーザの属性毎に前記誤り率を算出する
ことを特徴とする請求項1から請求項3のいずれか1項に記載の入力誤り警告装置。
A user attribute information storage unit for storing user information indicating the attribute of the user;
In the appearance number storage unit, the second appearance number is stored for each attribute of the user,
The error number storage unit stores the second error number for each attribute of the user,
The weighting coefficient storage unit stores the weighting coefficient for each attribute of the user,
The input error warning device according to any one of claims 1 to 3, wherein the error rate calculation unit calculates the error rate for each attribute of the user.
前記誤り率算出部は、前記正解語に対応する前記第1の出現数をnとし、前記第2の出現数をnとし、前記第1の誤り数をeとし、前記第2の誤り数をeとし、前記重み係数をTとして、前記正解語が前記誤り語として誤読される誤り率Pを以下式(a)
Figure 0005145287
によって算出する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の入力誤り警告装置。
The error rate calculation unit sets the first number of appearances corresponding to the correct word as n 0 , sets the second number of appearances as n 1 , sets the first number of errors as e 0 , When the number of errors is e 1 and the weighting factor is T, the error rate P in which the correct word is misread as the error word is expressed by the following equation (a)
Figure 0005145287
The input error warning device according to claim 1, wherein the input error warning device is calculated by:
前記修正入力部は、複数回の段階に亘って前記修正入力を受付け、
前記重み係数算出部は、前記複数段階のうち最後の段階において前記誤り率算出部によって算出された前記誤り率をPとし、前記正解語に対応する前記第1の出現数をnとし、前記第2の出現数をnとし、前記第1の誤り数をeとし、前記第2の誤り数をeとして、重み係数Tを以下式(b)
Figure 0005145287
によって算出する
ことを特徴とする請求項2から請求項5のいずれか1項に記載の入力誤り警告装置。
The correction input unit receives the correction input over a plurality of stages;
The weighting factor calculation unit sets the error rate calculated by the error rate calculation unit in the last step among the plurality of steps as P, sets the first appearance number corresponding to the correct word as n 0, and The second occurrence number is n 1 , the first error number is e 0 , the second error number is e 1 , and the weight coefficient T is expressed by the following equation (b)
Figure 0005145287
The input error warning device according to claim 2, wherein the input error warning device is calculated by:
JP2009115927A 2009-05-12 2009-05-12 Input error warning device Active JP5145287B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009115927A JP5145287B2 (en) 2009-05-12 2009-05-12 Input error warning device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009115927A JP5145287B2 (en) 2009-05-12 2009-05-12 Input error warning device

Publications (2)

Publication Number Publication Date
JP2010266965A JP2010266965A (en) 2010-11-25
JP5145287B2 true JP5145287B2 (en) 2013-02-13

Family

ID=43363911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009115927A Active JP5145287B2 (en) 2009-05-12 2009-05-12 Input error warning device

Country Status (1)

Country Link
JP (1) JP5145287B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7170279B2 (en) 2017-07-20 2022-11-14 パナソニックIpマネジメント株式会社 Computer device, computer system, method and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04245319A (en) * 1991-01-30 1992-09-01 Omron Corp Input error corrector
JP2004265004A (en) * 2003-02-28 2004-09-24 Techno Network Shikoku Co Ltd System and method for acknowledging error in inputting character string of peculiar information

Also Published As

Publication number Publication date
JP2010266965A (en) 2010-11-25

Similar Documents

Publication Publication Date Title
CN111046152B (en) Automatic FAQ question-answer pair construction method and device, computer equipment and storage medium
CN106650398B (en) Verification code identification system and identification method of mobile platform
US10402163B2 (en) Intelligent data extraction
US6549752B2 (en) Apparatus and method accumulating cases to be learned
JP6528147B2 (en) Accounting data entry support system, method and program
US9218568B2 (en) Disambiguating data using contextual and historical information
WO2019196302A1 (en) Voiceprint recognition-based identity authentication method, server and storage medium
US20140370480A1 (en) Storage medium, apparatus, and method for information processing
CN110990546B (en) Intelligent question-answer corpus updating method and device
CN110083808B (en) Cheating judgment method, device, equipment and storage medium based on user answers
CN106484132B (en) Input error correction method and input method device
CN110162973B (en) Webshell file detection method and device
WO2016200408A1 (en) Hybrid classification system
JP2020177426A (en) Information processor and program
JP5145287B2 (en) Input error warning device
US20180314820A1 (en) Encoding of security codes
JP2011128761A (en) Information processing program and information processing method
JP2015138458A (en) Information processing system, information processing device and program
CN110851828A (en) Malicious URL monitoring method and device based on multi-dimensional features and electronic equipment
CN114065187B (en) Abnormal login detection method and device, computing equipment and storage medium
JP4451188B2 (en) Information processing system and control method of information processing system
JP2019152727A (en) Information processing device, information processing system, and program
JP2019074807A (en) Information processing device and program
US9443139B1 (en) Methods and apparatus for identifying labels and/or information associated with a label and/or using identified information
CN113868210A (en) Validity verification method, system, equipment and storage medium for imported data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5145287

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250