JP2023129001A - Information processing device and information processing program - Google Patents

Information processing device and information processing program Download PDF

Info

Publication number
JP2023129001A
JP2023129001A JP2022033730A JP2022033730A JP2023129001A JP 2023129001 A JP2023129001 A JP 2023129001A JP 2022033730 A JP2022033730 A JP 2022033730A JP 2022033730 A JP2022033730 A JP 2022033730A JP 2023129001 A JP2023129001 A JP 2023129001A
Authority
JP
Japan
Prior art keywords
character string
key
language
information processing
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022033730A
Other languages
Japanese (ja)
Inventor
勇人 木下
Isato Kinoshita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2022033730A priority Critical patent/JP2023129001A/en
Publication of JP2023129001A publication Critical patent/JP2023129001A/en
Pending legal-status Critical Current

Links

Abstract

To register a key character string with fluctuations allowed thereto when the key character string can have a problem with being translated into another language.SOLUTION: An information processing device 10 includes a CPU 11. The CPU 11 sets, as a key character string, a character string of a first language to which a character string specified from an image is made to correspond; translates the key character string into a plurality of different second languages other than the first language; retranslates into the first language, each of a plurality of translated character strings that are obtained by translating the plurality of different second languages; and registers, when a character string that does not match the key character string is included in the plurality of retranslated character strings that are obtained by retranslation into the first language, the character string of the first language that has a similar meaning as the key character string, as a similar word.SELECTED DRAWING: Figure 3

Description

本発明は、情報処理装置及び情報処理プログラムに関する。 The present invention relates to an information processing device and an information processing program.

例えば、特許文献1には、画像内の文字を認識して翻訳する場合に、翻訳後の文章の存在する領域の関係の乱れを抑制する画像処理装置が記載されている。この画像処理装置は、画像内の文字領域を抽出する領域抽出手段と、領域抽出手段によって抽出された文字領域内の文字を認識する文字認識手段と、文字認識手段による認識結果を翻訳する翻訳手段と、領域抽出手段によって抽出された文字領域内の文字の方向及び翻訳手段によって翻訳された言語の文字の方向が異なる場合であって、文字領域内の文字の方向を回転処理又は反転処理させた場合の文字の方向と、翻訳された言語の文字の方向との関係に基づいて、領域抽出手段によって抽出された文字領域を含めて、画像の構成を回転の処理又は反転の処理のいずれかによって変更する変更手段と、を具備する。文字の方向は、行内の文字列の方向、行の方向、又はこれらの組み合わせである。 For example, Patent Document 1 describes an image processing device that suppresses disturbances in the relationship between regions in which translated sentences exist when recognizing and translating characters in an image. This image processing device includes a region extraction means for extracting a character region within an image, a character recognition means for recognizing characters in the character region extracted by the region extraction means, and a translation means for translating the recognition result by the character recognition means. and the direction of the characters in the character region extracted by the region extraction means and the direction of the characters in the language translated by the translation means are different, and the direction of the characters in the character region is rotated or reversed. Based on the relationship between the direction of the characters in the case and the direction of the characters in the translated language, the composition of the image, including the character region extracted by the region extraction means, is rotated or reversed. and a changing means for changing. The character direction is the direction of a character string within a line, the direction of a line, or a combination thereof.

また、特許文献2には、キーバリューの関係を利用した文字列抽出技術で、個々のユーザそれぞれに対してその者に対応した文字列抽出結果を提供する情報処理装置が記載されている。この情報処理装置は、プロセッサを備え、プロセッサは、電子文書を利用するユーザのユーザ情報に対応する1以上のキーを特定し、電子文書の中から1以上のキーに対応する第1文字列を特定し、第1文字列に対応する第2文字列を電子文書の中から抽出する。 Further, Patent Document 2 describes an information processing device that provides character string extraction results corresponding to each individual user using a character string extraction technique that utilizes key-value relationships. This information processing device includes a processor, the processor identifies one or more keys corresponding to user information of a user using the electronic document, and selects a first character string corresponding to the one or more keys from the electronic document. A second character string corresponding to the first character string is extracted from the electronic document.

特開2010-231812号公報Japanese Patent Application Publication No. 2010-231812 特開2021-064209号公報Japanese Patent Application Publication No. 2021-064209

ところで、帳票等の読取画像をOCR(Optical Character Recognition:光学文字認識)し、キーとなる文字列(以下、「キー文字列」という。)を特定し、そのキー文字列の周辺に位置する文字列をバリュー(以下、「バリュー文字列」という。)として抽出する技術(以下、「キーバリュー抽出」という。)がある。キーバリュー抽出は、帳票等の確認訂正に利用され、登録されているキー文字列が複数あることによって、様々な帳票のバリュー文字列を抽出することができる。例えば、「氏名」というキー文字列しか登録されていない場合、「名前」という項目を含んだ帳票には対応できないため、キー文字列に揺らぎをもたせて、「氏名」、「名前」が登録されていることが望ましい。 By the way, a read image of a form or the like is subjected to OCR (Optical Character Recognition) to identify a key character string (hereinafter referred to as "key character string"), and to identify characters located around the key character string. There is a technique (hereinafter referred to as "key-value extraction") for extracting a string as a value (hereinafter referred to as "value character string"). Key-value extraction is used to check and correct documents, etc., and by having a plurality of registered key strings, it is possible to extract value strings of various documents. For example, if only the key string "Name" is registered, it will not be possible to handle a form that includes the item "Name", so the key string will be made to fluctuate and "Name" and "First Name" will be registered. It is desirable that

キーバリュー抽出では、例えば、英語等で登録されたキー文字列を、日本語等の他の言語に翻訳して用いる場合がある。しかしながら、キー文字列を翻訳した翻訳語が意図した翻訳語でないと、誤ったバリュー文字列を抽出してしまう場合がある。 In key-value extraction, for example, a key character string registered in English or the like may be translated into another language such as Japanese and used. However, if the translated word of the key string is not the intended translated word, an incorrect value string may be extracted.

このため、翻訳に問題がありそうなキー文字列に対してはなるべく多くの類似語を登録し、キー文字列に揺らぎをもたせることが望ましい。 For this reason, it is desirable to register as many similar words as possible for key character strings that are likely to have translation problems, and to create fluctuations in the key character strings.

本開示は、キー文字列を他の言語に翻訳して用いる場合に、翻訳に問題がありそうなキー文字列に揺らぎをもたせて登録することができる情報処理装置及び情報処理プログラムを提供することを目的とする。 The present disclosure provides an information processing device and an information processing program that can register key character strings that are likely to have translation problems with fluctuations when the key character strings are translated into another language and used. With the goal.

上記目的を達成するために、第1態様に係る情報処理装置は、プロセッサを備え、前記プロセッサが、画像から特定する文字列に対応させる第1言語の文字列をキー文字列として設定し、前記キー文字列を前記第1言語以外の複数の異なる第2言語に翻訳し、前記複数の異なる第2言語に翻訳して得られた複数の翻訳済み文字列の各々を、前記第1言語に再翻訳し、前記第1言語に再翻訳して得られた複数の再翻訳済み文字列の中に、前記キー文字列と一致しない文字列が含まれている場合に、前記キー文字列と意味が類似する、前記第1言語の文字列を類似語として登録する。 In order to achieve the above object, an information processing apparatus according to a first aspect includes a processor, and the processor sets a character string in a first language to correspond to a character string identified from an image as a key character string, and A key string is translated into a plurality of different second languages other than the first language, and each of the plurality of translated strings obtained by the translation into the plurality of different second languages is translated into the first language. If a plurality of retranslated character strings obtained by translating and retranslating into the first language includes a character string that does not match the key character string, Similar character strings in the first language are registered as similar words.

また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記第2言語が、前記画像に記載された言語である。 Further, in an information processing apparatus according to a second aspect, in the information processing apparatus according to the first aspect, the second language is a language written in the image.

また、第3態様に係る情報処理装置は、第1態様又は第2態様に係る情報処理装置において、前記プロセッサが、前記キー文字列と意味が類似する、前記第1言語の文字列を画面に表示させ、表示させた文字列のうち、ユーザによって選択された文字列を前記類似語として登録する。 Further, in the information processing device according to a third aspect, in the information processing device according to the first aspect or the second aspect, the processor displays a character string in the first language that is similar in meaning to the key character string on the screen. The character string selected by the user among the displayed character strings is registered as the similar word.

また、第4態様に係る情報処理装置は、第3態様に係る情報処理装置において、前記画面が、前記複数の再翻訳済み文字列を表示し、前記キー文字列と一致しない文字列の表示形態が、前記キー文字列と一致する文字列の表示形態と異なっている。 Further, in the information processing apparatus according to a fourth aspect, in the information processing apparatus according to the third aspect, the screen displays the plurality of retranslated character strings, and a display form of a character string that does not match the key character string is provided. is different from the display form of the character string that matches the key character string.

また、第5態様に係る情報処理装置は、第1態様又は第2態様に係る情報処理装置において、前記プロセッサが、前記キー文字列と意味が類似する、前記第1言語の文字列のうち、前記キー文字列との間の意味の近さを示す指標値が閾値以上の文字列を前記類似語として登録する。 Furthermore, in the information processing apparatus according to the first aspect or the second aspect, the processor selects a character string in the first language that is similar in meaning to the key character string. A character string whose index value indicating the closeness of meaning with the key character string is equal to or greater than a threshold value is registered as the similar word.

また、第6態様に係る情報処理装置は、第1態様~第5態様の何れか1態様に係る情報処理装置において、前記プロセッサが、前記画像に対して確認訂正を行う際に、当該画像から前記キー文字列に対応する文字列を特定する場合に、前記キー文字列を前記第2言語に翻訳して複数の翻訳候補を生成し、前記類似語として登録された前記第1言語の文字列を用いて、前記複数の翻訳候補の中から、前記キー文字列の翻訳語を選択する。 Further, in the information processing apparatus according to a sixth aspect, in the information processing apparatus according to any one of the first to fifth aspects, when the processor performs confirmation correction on the image, When identifying a character string corresponding to the key character string, the key character string is translated into the second language to generate a plurality of translation candidates, and the character string in the first language is registered as the similar word. is used to select a translated word for the key character string from among the plurality of translation candidates.

また、第7態様に係る情報処理装置は、第6態様に係る情報処理装置において、前記プロセッサが、前記類似語として登録された前記第1言語の文字列を前記第2言語に翻訳して翻訳済み類似語を生成し、前記複数の翻訳候補の各々と、前記翻訳済み類似語との間の意味の近さを示す指標値を算出し、前記複数の翻訳候補の中から、前記指標値が最も高い翻訳候補を、前記キー文字列の翻訳語として選択する。 Further, in the information processing device according to a seventh aspect, in the information processing device according to the sixth aspect, the processor translates the character string in the first language registered as the similar word into the second language. Generate translated similar words, calculate an index value indicating the closeness of meaning between each of the plurality of translation candidates and the translated similar word, and select the index value from among the plurality of translation candidates. The highest translation candidate is selected as the translated word for the key string.

また、第8態様に係る情報処理装置は、第7態様に係る情報処理装置において、前記プロセッサが、前記選択した翻訳語を用いて、前記画像から、当該翻訳語に対応する文字列を特定し、特定した文字列の周囲に位置する文字列をバリュー文字列として抽出する。 Further, in the information processing apparatus according to an eighth aspect, in the information processing apparatus according to the seventh aspect, the processor uses the selected translated word to identify a character string corresponding to the translated word from the image. , character strings located around the identified character string are extracted as value character strings.

また、第9態様に係る情報処理装置は、第8態様に係る情報処理装置において、前記プロセッサが、前記選択した翻訳語が適切でない場合、前記バリュー文字列の抽出後に、当該翻訳語を修正した文字列を前記第1言語に再翻訳し、前記第1言語に再翻訳して得られた文字列を、前記類似語として登録する。 Further, in the information processing device according to a ninth aspect, in the information processing device according to the eighth aspect, if the selected translated word is not appropriate, the processor corrects the translated word after extracting the value character string. The character string is retranslated into the first language, and the character string obtained by the retranslation into the first language is registered as the similar word.

更に、上記目的を達成するために、第10態様に係る情報処理プログラムは、画像から特定する文字列に対応させる第1言語のキー文字列を設定し、前記キー文字列を前記第1言語以外の複数の異なる第2言語に翻訳し、前記複数の異なる第2言語に翻訳して得られた複数の翻訳済み文字列の各々を、前記第1言語に再翻訳し、前記第1言語に再翻訳して得られた複数の再翻訳済み文字列の中に、前記キー文字列と一致しない文字列が含まれている場合に、前記キー文字列と意味が類似する、前記第1言語の文字列を類似語として登録することを、コンピュータに実行させる。 Furthermore, in order to achieve the above object, the information processing program according to the tenth aspect sets a key string in a first language to correspond to a string identified from an image, and sets the key string in a language other than the first language. into a plurality of different second languages, retranslate each of the plurality of translated character strings obtained by translating into the plurality of different second languages into the first language, and retranslate them into the first language. If a plurality of retranslated character strings obtained by translation include a character string that does not match the key character string, a character in the first language that is similar in meaning to the key character string. Causes the computer to register columns as synonyms.

第1態様及び第10態様によれば、キー文字列を他の言語に翻訳して用いる場合に、翻訳に問題がありそうなキー文字列に揺らぎをもたせて登録することができる、という効果を有する。 According to the first aspect and the tenth aspect, when a key character string is translated into another language and used, a key character string that is likely to have a problem in translation can be registered with fluctuations. have

第2態様によれば、キー文字列を画像に記載された言語に翻訳して用いる場合に、翻訳に問題がありそうなキー文字列に揺らぎを持たせて登録することができる、という効果を有する。 According to the second aspect, when a key character string is translated into a language written in an image and used, key character strings that are likely to have translation problems can be registered with fluctuations. have

第3態様によれば、ユーザの意図する文字列を類似語として登録することができる、という効果を有する。 According to the third aspect, there is an effect that the character string intended by the user can be registered as a similar word.

第4態様によれば、ユーザが一見してキー文字列と一致しない文字列を把握することができる、という効果を有する。 According to the fourth aspect, there is an effect that the user can grasp character strings that do not match the key character string at a glance.

第5態様によれば、キー文字列と意味が近い文字列を類似語として自動的に登録することができる、という効果を有する。 According to the fifth aspect, there is an effect that a character string having a similar meaning to a key character string can be automatically registered as a similar word.

第6態様によれば、確認訂正を行う際に、類似語として登録された第1言語の文字列を考慮しない場合と比較して、適切なキー文字列の翻訳語を得ることができる、という効果を有する。 According to the sixth aspect, when performing confirmation and correction, it is possible to obtain an appropriate translated word for the key string compared to the case where the first language string registered as a similar word is not considered. have an effect.

第7態様によれば、複数の翻訳候補の中から、翻訳済み類似語と最も意味が近い翻訳候補を、キー文字列の翻訳語として自動的に選択することができる、という効果を有する。 According to the seventh aspect, it is possible to automatically select the translation candidate whose meaning is closest to the translated similar word from among the plurality of translation candidates as the translated word of the key character string.

第8態様によれば、確認訂正を行う際に、翻訳済み類似語と意味が離れた翻訳語を用いる場合と比較して、適切なキーバリュー抽出を行うことができる、という効果を有する。 According to the eighth aspect, when performing confirmation and correction, it is possible to perform appropriate key-value extraction compared to the case where a translated word whose meaning is different from the translated similar word is used.

第9態様によれば、適切でない翻訳語を修正した文字列を類似語として考慮しない場合と比較して、類似語の精度を向上させることができる、という効果を有する。 According to the ninth aspect, there is an effect that the accuracy of similar words can be improved compared to the case where a character string obtained by correcting an inappropriate translated word is not considered as a similar word.

実施形態に係る情報処理システムの構成の一例を示す図である。1 is a diagram illustrating an example of the configuration of an information processing system according to an embodiment. 実施形態に係る情報処理装置の電気的な構成の一例を示すブロック図である。FIG. 1 is a block diagram illustrating an example of an electrical configuration of an information processing device according to an embodiment. 実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。FIG. 1 is a block diagram illustrating an example of a functional configuration of an information processing device according to an embodiment. 実施形態に係るキー設定画面の一例を示す正面図である。FIG. 3 is a front view showing an example of a key setting screen according to the embodiment. 実施形態に係る翻訳確認リストがポップアップ表示されたキー設定画面の一例を示す正面図である。It is a front view showing an example of a key setting screen on which a translation confirmation list according to an embodiment is displayed as a pop-up. 実施形態に係る類語リストがポップアップ表示されたキー設定画面の一例を示す正面図である。FIG. 3 is a front view showing an example of a key setting screen on which a synonym list according to the embodiment is displayed as a pop-up. 実施形態に係る類似語が選択された類語リストの一例を示す正面図である。FIG. 3 is a front view showing an example of a synonym list from which similar words are selected according to the embodiment. 実施形態に係る類語登録ボタンが押下された類語リストの一例を示す正面図である。It is a front view showing an example of the synonym list when the synonym registration button according to the embodiment is pressed. 実施形態に係る情報処理プログラムによるキー文字列設定処理の流れの一例を示すフローチャートである。It is a flow chart which shows an example of the flow of key character string setting processing by an information processing program concerning an embodiment. 比較例に係る確認訂正画面を示す正面図である。FIG. 7 is a front view showing a confirmation/correction screen according to a comparative example. 実施形態に係る情報処理装置の機能的な構成の別の例を示すブロック図である。FIG. 2 is a block diagram illustrating another example of the functional configuration of the information processing device according to the embodiment. 実施形態に係るキー翻訳候補生成結果の一例を示す図である。It is a figure showing an example of a key translation candidate generation result concerning an embodiment. 実施形態に係る確認訂正画面の一例を示す正面図である。It is a front view showing an example of a confirmation correction screen concerning an embodiment. 実施形態に係る確認訂正画面の別の例を示す正面図である。FIG. 7 is a front view showing another example of the confirmation/correction screen according to the embodiment. 実施形態に係る情報処理プログラムによるキーバリュー抽出処理の流れの一例を示すフローチャートである。It is a flow chart which shows an example of the flow of key value extraction processing by an information processing program concerning an embodiment.

以下、図面を参照して、本開示の技術を実施するための形態の一例について詳細に説明する。なお、動作、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符号を付与し、重複する説明を適宜省略する場合がある。各図面は、本開示の技術を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本開示の技術は、図示例のみに限定されるものではない。また、本実施形態では、本開示の技術と直接的に関連しない構成や周知な構成については、説明を省略する場合がある。 Hereinafter, an example of a form for implementing the technology of the present disclosure will be described in detail with reference to the drawings. Note that components and processes that have the same operations, functions, and functions are given the same reference numerals throughout the drawings, and overlapping explanations may be omitted as appropriate. The drawings are only schematically illustrated to provide a thorough understanding of the technology of the disclosure. Therefore, the technology of the present disclosure is not limited to the illustrated example. Further, in this embodiment, descriptions of configurations that are not directly related to the technology of the present disclosure or well-known configurations may be omitted.

図1は、本実施形態に係る情報処理システム100の構成の一例を示す図である。 FIG. 1 is a diagram showing an example of the configuration of an information processing system 100 according to the present embodiment.

図1に示すように、本実施形態に係る情報処理システム100は、情報処理装置10と、読取装置30と、管理者端末40Aと、作業者端末40Bと、を備えている。本実施形態に係る情報処理装置10は、例えば、サーバコンピュータ、パーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータ装置とされる。但し、情報処理装置10は、ユーザの指示に従って画像に関する機能(スキャナ機能、コピー機能、プリント機能等)を実行する画像形成装置であってもよい。この場合、読取装置30は不要となる。 As shown in FIG. 1, the information processing system 100 according to the present embodiment includes an information processing device 10, a reading device 30, an administrator terminal 40A, and a worker terminal 40B. The information processing device 10 according to the present embodiment is, for example, a general-purpose computer device such as a server computer or a personal computer (PC). However, the information processing device 10 may be an image forming device that executes image-related functions (scanner function, copy function, print function, etc.) according to user instructions. In this case, the reading device 30 becomes unnecessary.

本実施形態に係る情報処理装置10は、帳票等の画像(以下、「帳票画像」という。)をOCR処理し、キー文字列を特定し、そのキー文字列の周辺に位置する文字列をバリュー文字列(値)として抽出する機能(キーバリュー抽出)を備えている。なお、本実施形態では、画像の一例として帳票画像を示して説明するが、帳票画像に限定されるものではない。 The information processing apparatus 10 according to the present embodiment performs OCR processing on an image such as a form (hereinafter referred to as a "form image"), identifies a key character string, and converts character strings located around the key character string into values. It has a function (key-value extraction) to extract it as a character string (value). Note that in this embodiment, a form image will be shown and described as an example of the image, but the image is not limited to a form image.

情報処理装置10は、読取装置30、管理者端末40A、及び作業者端末40Bの各々とネットワークNを介して接続される。なお、ネットワークNには、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。ネットワークNの接続形態に制約はなく、有線、無線、又は有線と無線が混在した形態の何れであってもよい。 The information processing device 10 is connected to each of the reading device 30, the administrator terminal 40A, and the worker terminal 40B via a network N. Note that the Internet, LAN (Local Area Network), WAN (Wide Area Network), etc. are applied to the network N. There are no restrictions on the connection form of the network N, and it may be wired, wireless, or a combination of wired and wireless.

読取装置30は、スキャナ等の読取装置であり、帳票原稿を光学的に読み取って得られた帳票画像を情報処理装置10に入力する。管理者端末40Aは、帳票業務を管理する業務管理者が使用する端末装置である。作業者端末40Bは、キーバリュー抽出により得られた結果に対して確認訂正を行う作業担当者が使用する端末装置である。管理者端末40A及び作業者端末40Bには、例えば、PC等の汎用的なコンピュータ装置が適用される。 The reading device 30 is a reading device such as a scanner, and inputs a document image obtained by optically reading a document document into the information processing device 10 . The administrator terminal 40A is a terminal device used by a business manager who manages document business. The worker terminal 40B is a terminal device used by a worker who confirms and corrects the results obtained by key-value extraction. For example, a general-purpose computer device such as a PC is applied to the administrator terminal 40A and the worker terminal 40B.

図1に示すように、読取装置30は、ある帳票原稿Dを読み取り、読み取って得られた帳票画像を情報処理装置10に入力する。情報処理装置10は、読取装置30から入力された帳票画像に対してOCR処理を行う。このOCR処理では、例えば、「請求番号 12345」という記載を含む帳票画像に対して、「請求番号」をキー(属性)として含むキー定義ファイルを予め登録しておく。そして、帳票画像をOCR処理し、キーである「請求番号」を特定し、特定した「請求番号」の周辺に位置する「12345」をバリュー(値)として抽出する。 As shown in FIG. 1, the reading device 30 reads a certain form document D and inputs the obtained form image to the information processing device 10. The information processing device 10 performs OCR processing on the form image input from the reading device 30. In this OCR process, for example, a key definition file containing "call number" as a key (attribute) is registered in advance for a form image containing the description "call number 12345." Then, the form image is subjected to OCR processing, the key "call number" is specified, and "12345" located around the specified "call number" is extracted as a value.

図2は、本実施形態に係る情報処理装置10の電気的な構成の一例を示すブロック図である。 FIG. 2 is a block diagram showing an example of the electrical configuration of the information processing device 10 according to the present embodiment.

図2に示すように、本実施形態に係る情報処理装置10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、入出力インタフェース(I/O)14と、記憶部15と、表示部16と、操作部17と、通信部18と、を備えている。 As shown in FIG. 2, the information processing device 10 according to the present embodiment includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, and an input/output interface (I). /O) 14, a storage section 15, a display section 16, an operation section 17, and a communication section 18.

CPU11、ROM12、RAM13、及びI/O14は、バスを介して各々接続されている。I/O14には、記憶部15と、表示部16と、操作部17と、通信部18と、を含む各機能部が接続されている。これらの各機能部は、I/O14を介して、CPU11と相互に通信可能とされる。 The CPU 11, ROM 12, RAM 13, and I/O 14 are each connected via a bus. Each functional section including a storage section 15, a display section 16, an operation section 17, and a communication section 18 is connected to the I/O 14. Each of these functional units can communicate with the CPU 11 via the I/O 14.

CPU11、ROM12、RAM13、及びI/O14によって制御部が構成される。制御部は、情報処理装置10の一部の動作を制御するサブ制御部として構成されてもよいし、情報処理装置10の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はICチップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。 A control unit is configured by the CPU 11, ROM 12, RAM 13, and I/O 14. The control unit may be configured as a sub-control unit that controls a part of the operation of the information processing device 10, or may be configured as a part of a main control unit that controls the entire operation of the information processing device 10. . For example, an integrated circuit such as an LSI (Large Scale Integration) or an IC chipset is used for a part or all of each block of the control section. Individual circuits may be used for each of the above blocks, or a part or all of them may be integrated. Each of the blocks described above may be provided integrally, or some blocks may be provided separately. Moreover, in each of the above-mentioned blocks, a part thereof may be provided separately. The integration of the control section is not limited to LSI, but a dedicated circuit or a general-purpose processor may also be used.

記憶部15としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部15には、本実施形態に係るキーバリュー抽出を実行するための情報処理プログラム15Aが記憶される。なお、この情報処理プログラム15Aは、ROM12に記憶されていてもよい。 As the storage unit 15, for example, a HDD (Hard Disk Drive), an SSD (Solid State Drive), a flash memory, etc. are used. The storage unit 15 stores an information processing program 15A for executing key-value extraction according to this embodiment. Note that this information processing program 15A may be stored in the ROM 12.

情報処理プログラム15Aは、例えば、情報処理装置10に予めインストールされていてもよい。情報処理プログラム15Aは、不揮発性の記憶媒体に記憶して、又はネットワークを介して配布して、情報処理装置10に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。 The information processing program 15A may be installed in the information processing device 10 in advance, for example. The information processing program 15A may be realized by being stored in a nonvolatile storage medium, or distributed via a network, and installed in the information processing device 10 as appropriate. Note that examples of nonvolatile storage media include CD-ROM (Compact Disc Read Only Memory), magneto-optical disk, HDD, DVD-ROM (Digital Versatile Disc Read Only Memory), flash memory, memory card, etc. Ru.

表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)、有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部17には、例えば、キーボード、マウス等の操作入力用のデバイスが設けられている。表示部16及び操作部17は、情報処理装置10のユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。 For example, a liquid crystal display (LCD), an organic EL (electroluminescence) display, or the like is used for the display unit 16. The display unit 16 may integrally include a touch panel. The operation unit 17 is provided with an operation input device such as a keyboard and a mouse. The display unit 16 and the operation unit 17 receive various instructions from the user of the information processing device 10. The display unit 16 displays various information such as the results of processing executed in response to instructions received from the user and notifications regarding the processing.

通信部18は、一例として、インターネット、LAN、WAN等のネットワークNに接続されており、読取装置30、管理者端末40A、及び作業者端末40Bの各々との間でネットワークNを介して通信が可能とされる。 The communication unit 18 is connected to a network N such as the Internet, LAN, WAN, etc., and communicates with each of the reading device 30, the administrator terminal 40A, and the worker terminal 40B via the network N. It is considered possible.

ところで、上述したように、キーバリュー抽出では、例えば、英語等で登録されたキー文字列を、日本語等の他の言語に翻訳して用いる場合がある。しかしながら、キー文字列を翻訳した翻訳語が意図した翻訳語でないと、誤ったバリュー文字列を抽出してしまう場合がある。このため、翻訳に問題がありそうなキー文字列に対してはなるべく多くの類似語を登録し、キー文字列に揺らぎをもたせることが望ましい。 By the way, as described above, in key-value extraction, for example, a key character string registered in English or the like may be translated into another language such as Japanese and used. However, if the translated word of the key string is not the intended translated word, an incorrect value string may be extracted. For this reason, it is desirable to register as many similar words as possible for key character strings that are likely to have translation problems, and to create fluctuations in the key character strings.

本実施形態に係る情報処理装置10は、帳票画像から特定する文字列に対応させる第1言語のキー文字列を設定し、第1言語のキー文字列を第1言語以外の複数の異なる第2言語に翻訳し、第2言語の複数の翻訳済み文字列の各々を、第1言語に再翻訳し、第1言語の複数の再翻訳済み文字列の中に、キー文字列と一致しない文字列が含まれている場合に、キー文字列と意味が類似する、第1言語の文字列を類似語として登録する。 The information processing device 10 according to the present embodiment sets a key character string in a first language to correspond to a character string specified from a form image, and sets the key character string in the first language to a plurality of different second language characters other than the first language. language, each of the plurality of translated strings in the second language is retranslated into the first language, and a string that does not match the key string is found in the plurality of retranslated strings in the first language. is included, a character string in the first language that is similar in meaning to the key character string is registered as a similar word.

具体的に、本実施形態に係る情報処理装置10のCPU11は、記憶部15に記憶されている情報処理プログラム15AをRAM13に書き込んで実行することにより、図3に示す各部として機能する。なお、CPU11は、プロセッサの一例である。 Specifically, the CPU 11 of the information processing device 10 according to the present embodiment functions as each unit shown in FIG. 3 by writing the information processing program 15A stored in the storage unit 15 into the RAM 13 and executing it. Note that the CPU 11 is an example of a processor.

図3は、本実施形態に係る情報処理装置10の機能的な構成の一例を示すブロック図である。なお、図3の構成例は、キー文字列設定処理時における構成を示している。 FIG. 3 is a block diagram showing an example of the functional configuration of the information processing device 10 according to the present embodiment. Note that the configuration example in FIG. 3 shows the configuration at the time of key character string setting processing.

図3に示すように、本実施形態に係る情報処理装置10のCPU11は、キー設定部11A、翻訳処理部11B、翻訳結果提示部11C、及び類似語登録部11Dとして機能する。 As shown in FIG. 3, the CPU 11 of the information processing device 10 according to the present embodiment functions as a key setting section 11A, a translation processing section 11B, a translation result presentation section 11C, and a similar term registration section 11D.

記憶部15には、設定DB(Data Base:データベース)151が記憶されている。設定DB151には、帳票画像毎にキー定義ファイルが登録される。キー定義ファイルでは、帳票画像に含まれるキー文字列と、その類似語(類語1、類語2)との組み合わせが定義されている。 A setting DB (Data Base) 151 is stored in the storage unit 15 . A key definition file is registered in the setting DB 151 for each form image. In the key definition file, combinations of key character strings included in the form image and their similar words (synonym 1, synonym 2) are defined.

キー設定部11Aは、帳票画像から特定する文字列に対応させる第1言語の文字列をキー文字列として設定する。具体的には、一例として、図4に示すキー設定画面を管理者端末40Aに表示させ、業務管理者によるキー設定の入力を受け付ける。 The key setting unit 11A sets a character string in the first language that corresponds to a character string specified from the form image as a key character string. Specifically, as an example, the key setting screen shown in FIG. 4 is displayed on the administrator terminal 40A, and input of key settings by the business manager is accepted.

図4は、本実施形態に係るキー設定画面50の一例を示す正面図である。 FIG. 4 is a front view showing an example of the key setting screen 50 according to the present embodiment.

図4に示すキー設定画面50は、管理者端末40Aに表示され、業務管理者によるキー設定の入力を受け付ける画面である。キー設定画面50は、キーバリュー抽出を行う際のキー文字列を言語に対応付けて設定するための画面である。図4の例では、帳票の種類が「納品書」であり、「納品書」に応じたキー文字列が設定可能とされる。キー設定画面50は、言語設定欄50A、キー文字列設定欄50B、及び翻訳確認ボタン51A~51Cを含む。言語設定欄50Aは、キー文字列の言語を設定する欄であり、キー文字列設定欄50Bは、1つ以上のキー文字列を設定する欄である。 The key setting screen 50 shown in FIG. 4 is displayed on the administrator terminal 40A, and is a screen that accepts input of key settings by the business manager. The key setting screen 50 is a screen for setting key character strings in association with languages when performing key value extraction. In the example of FIG. 4, the type of document is "delivery note", and a key character string can be set according to "delivery note". The key setting screen 50 includes a language setting field 50A, a key character string setting field 50B, and translation confirmation buttons 51A to 51C. The language setting field 50A is a field for setting the language of a key character string, and the key character string setting field 50B is a field for setting one or more key character strings.

図4に示すように、言語設定欄50Aには、設定言語の一例として「English」が設定されている。「English」、つまり、英語は、第1言語の一例である。また、キー文字列設定欄50Bには、キー文字列の一例として、「Address」、「Name」、及び「Title」が設定されている。これらの「Address」、「Name」、及び「Title」の各々に対して、それぞれ翻訳確認ボタン51A、51B、51Cが対応付けられている。翻訳確認ボタン51A、51B、51Cの各々は、それぞれのキー文字列に対応する翻訳確認リスト(後述)をポップアップ表示するためのボタンである。 As shown in FIG. 4, "English" is set in the language setting column 50A as an example of the setting language. "English", that is, English, is an example of a first language. Further, in the key character string setting field 50B, "Address", "Name", and "Title" are set as examples of key character strings. Translation confirmation buttons 51A, 51B, and 51C are associated with each of these "Address," "Name," and "Title." Each of the translation confirmation buttons 51A, 51B, and 51C is a button for pop-up displaying a translation confirmation list (described later) corresponding to each key character string.

翻訳処理部11Bは、キー文字列を第1言語以外の複数の異なる第2言語に翻訳し、複数の異なる第2言語に翻訳して得られた複数の翻訳済み文字列の各々を、第1言語に再翻訳する。具体的には、一例として、第1言語が英語である場合、第2言語は日本語、中国語、フランス語、スペイン語等とされる。第2言語は、キーバリュー抽出の対象とする帳票画像に記載された言語(例えば、日本語)が含まれていることが望ましい。翻訳処理には、例えば、既存の翻訳エンジンが用いられる。例えば、キー文字列が「Title」であれば、日本語で「肩書」に翻訳され、更に、英語で「Position」に再翻訳される。 The translation processing unit 11B translates the key string into a plurality of different second languages other than the first language, and translates each of the plurality of translated strings obtained by translating into the plurality of different second languages into the first language. Retranslate into language. Specifically, as an example, when the first language is English, the second language is Japanese, Chinese, French, Spanish, etc. It is desirable that the second language includes the language written in the form image targeted for key-value extraction (for example, Japanese). For example, an existing translation engine is used for the translation process. For example, if the key string is "Title", it is translated into "Title" in Japanese, and then retranslated into "Position" in English.

翻訳結果提示部11Cは、第1言語(例えば、英語)に再翻訳して得られた複数の再翻訳済み文字列を表示させる。具体的には、一例として、図5に示す翻訳確認リストをポップアップ表示させる。 The translation result presentation unit 11C displays a plurality of retranslated character strings obtained by retranslating into the first language (for example, English). Specifically, as an example, a translation confirmation list shown in FIG. 5 is displayed as a pop-up.

図5は、本実施形態に係る翻訳確認リスト53がポップアップ表示されたキー設定画面50の一例を示す正面図である。 FIG. 5 is a front view showing an example of the key setting screen 50 on which the translation confirmation list 53 according to the present embodiment is displayed as a pop-up.

図5に示すキー設定画面50には、翻訳確認ボタン51Cへのカーソル52による押下に応じて翻訳確認リスト53がポップアップ表示される。翻訳確認リスト53は、第1言語のキー文字列(例えば、「Title」)に対応して、第2言語毎の翻訳結果及び第1言語への再翻訳結果を含むリストである。図5の例では、第1言語が英語であり、第2言語がフランス語、日本語、スペイン語、ロシア語、中国語(簡体)、及びベトナム語である。第1言語及び第2言語の組み合わせは、例えば、業務管理者によって適宜設定可能とされる。 On the key setting screen 50 shown in FIG. 5, a translation confirmation list 53 is pop-up displayed in response to pressing the translation confirmation button 51C with the cursor 52. The translation confirmation list 53 is a list that includes translation results for each second language and retranslation results into the first language, corresponding to a key character string (for example, "Title") in the first language. In the example of FIG. 5, the first language is English, and the second languages are French, Japanese, Spanish, Russian, Chinese (simplified), and Vietnamese. For example, the combination of the first language and the second language can be set as appropriate by the business manager.

ここで、翻訳確認リスト53に含まれる再翻訳済み文字列のうち、キー文字列と一致しない文字列の表示形態は、キー文字列と一致する文字列の表示形態と異なっていることが望ましい。図5の例では、キー文字列と一致しない文字列を矩形で囲んで表示している。但し、キー文字列と一致しない文字列の色を変化させてもよいし、文字列に下線を付してもよいし、文字列を斜体にしてもよく、その表示形態は特に限定されるものではない。これにより、業務管理者が一見してキー文字列と一致しない文字列及び言語を把握することができる。また、翻訳確認リスト53は、類語候補ボタン54を含む。類語候補ボタン54は、再翻訳結果に問題がある場合に、キー文字列に対応する類似語のリストである類語リスト(後述)をポップアップ表示するためのボタンである。なお、ここでは、翻訳確認リスト53の再翻訳結果の中にキー文字列と一致しない文字列が含まれている場合に、業務担当者によってキー文字列の翻訳に問題があると判断される。 Here, among the retranslated character strings included in the translation confirmation list 53, it is desirable that the display form of character strings that do not match the key character string be different from the display form of character strings that match the key character string. In the example of FIG. 5, character strings that do not match the key character string are displayed surrounded by a rectangle. However, the color of character strings that do not match the key character string may be changed, the character strings may be underlined, the character strings may be italicized, and the display form is particularly limited. isn't it. This allows the business manager to grasp character strings and languages that do not match the key character string at first glance. The translation confirmation list 53 also includes a synonym candidate button 54. The synonym candidate button 54 is a button for pop-up displaying a synonym list (described later), which is a list of similar words corresponding to the key character string, when there is a problem with the retranslation result. Here, if the re-translation results in the translation confirmation list 53 include a character string that does not match the key character string, the person in charge of the business determines that there is a problem with the translation of the key character string.

類似語登録部11Dは、第1言語(例えば、英語)に再翻訳して得られた複数の再翻訳済み文字列の中に、キー文字列と一致しない文字列が含まれている場合に、キー文字列と意味が類似する、第1言語の文字列を類似語として登録する。例えば、類似語登録部11Dは、キー文字列と意味が類似する、第1言語の文字列を画面に表示させ、表示させた文字列のうち、ユーザ(例えば、業務管理者)によって選択された文字列を類似語として登録する。キー文字列と意味が類似する文字列は、例えば、予め準備した類似語辞書を用いてもよいし、機械学習により予め学習された学習済みモデルを用いて推測してもよい。具体的には、一例として、図6に示す類語リストをポップアップ表示させる。 When a plurality of retranslated character strings obtained by retranslating into the first language (for example, English) include a character string that does not match the key character string, the similar word registration unit 11D A character string in the first language that is similar in meaning to the key character string is registered as a similar word. For example, the similar word registration unit 11D displays character strings in the first language that are similar in meaning to the key character string, and selects a character string selected by the user (for example, a business manager) from among the displayed character strings. Register a string as a similar word. Character strings similar in meaning to the key character string may be estimated using, for example, a dictionary of similar words prepared in advance, or a learned model trained in advance by machine learning. Specifically, as an example, a synonym list shown in FIG. 6 is displayed as a pop-up.

図6は、本実施形態に係る類語リスト55がポップアップ表示されたキー設定画面50の一例を示す正面図である。 FIG. 6 is a front view showing an example of the key setting screen 50 on which a synonym list 55 according to the present embodiment is pop-up displayed.

図6に示すキー設定画面50には、類語候補ボタン54へのカーソル52による押下に応じて類語リスト55がポップアップ表示される。類語リスト55は、第1言語のキー文字列(例えば、「Title」)の類似語を含むリストである。つまり、キー文字列の類似語は、類似語登録部11Dにより推測され、類語リスト55として表示される。図6の例では、キー文字列である「Title」と意味が類似する類似語として、「heading」、「position」、及び「theme」が表示される。なお、翻訳確認リスト53に表示される再翻訳結果と、類語リスト55に表示される類似語とは一致していなくてもよい。また、類語リスト55は、選択された類似語を登録するための類語登録ボタン56を含む。 On the key setting screen 50 shown in FIG. 6, a synonym list 55 pops up in response to a press of the synonym candidate button 54 with the cursor 52. The synonym list 55 is a list that includes words similar to the key character string (for example, "Title") in the first language. In other words, similar words of the key character string are estimated by the similar word registration section 11D and displayed as a synonym list 55. In the example of FIG. 6, "heading," "position," and "theme" are displayed as similar words having similar meanings to the key character string "Title." Note that the retranslation results displayed in the translation confirmation list 53 and the similar words displayed in the synonym list 55 do not have to match. The synonym list 55 also includes a synonym registration button 56 for registering the selected similar word.

図7は、本実施形態に係る類似語が選択された類語リスト55の一例を示す正面図である。 FIG. 7 is a front view showing an example of the synonym list 55 from which similar words are selected according to the present embodiment.

図7に示す類語リスト55は、カーソル52による選択操作に応じて類似語が選択された状態を示している。図7の例では、類語リスト55の中の「heading」及び「theme」が選択されている。なお、選択可能な類似語は1つ以上であればよく、1つでも、複数でもよい。 The synonym list 55 shown in FIG. 7 shows a state in which similar words have been selected according to the selection operation using the cursor 52. In the example of FIG. 7, "heading" and "theme" in the synonym list 55 are selected. Note that the number of selectable similar words may be one or more, and may be one or more.

図8は、本実施形態に係る類語登録ボタン56が押下された類語リスト55の一例を示す正面図である。 FIG. 8 is a front view showing an example of the synonym list 55 when the synonym registration button 56 according to the present embodiment is pressed.

図8に示す類語リスト55は、類語登録ボタン56がカーソル52により押下された状態を示している。この場合、選択された類似語が設定DB151に登録される。具体的に、図8の例では、キー文字列(例えば、「Title」)に対応付けて、類似語として、「heading」及び「theme」を含むキー定義ファイルが設定DB151に登録される。 The synonym list 55 shown in FIG. 8 shows a state in which the synonym registration button 56 is pressed by the cursor 52. In this case, the selected similar word is registered in the setting DB 151. Specifically, in the example of FIG. 8, a key definition file including "heading" and "theme" as similar words is registered in the setting DB 151 in association with a key character string (for example, "Title").

ここで、上記の例では、キー文字列の類似語を含む類語リスト55を画面に表示させ、ユーザ(例えば、業務担当者)が選択した類似語を登録する形態について説明したが、類似語の登録を自動的に行うようにしてもよい。具体的に、類似語登録部11Dは、第1言語(例えば、英語)に再翻訳して得られた複数の再翻訳済み文字列の中に、キー文字列(例えば、「Title」)と一致しない文字列が含まれている場合に、キー文字列と意味が類似する、第1言語の文字列のうち、キー文字列との間の意味の近さを示す指標値が閾値以上の文字列を類似語として登録する。なお、ここでいう指標値は、例えば、自然言語処理を用いて導出される。自然言語処理には、例えば、文字列の意味を「意味ベクトル」として数値化する手法、例えば、「Word2vec」等の手法が適用される。なお、閾値には、ユーザにより適切な値が設定される。 Here, in the above example, the synonym list 55 containing the similar words of the key character string is displayed on the screen, and the similar word list 55 selected by the user (for example, the person in charge of business) is registered. Registration may be performed automatically. Specifically, the similar word registration unit 11D selects a key character string (e.g., "Title") that matches a key character string (e.g., "Title") among a plurality of retranslated character strings obtained by retranslating into the first language (e.g., English). Among the character strings in the first language that are similar in meaning to the key character string, the character string for which the index value indicating the closeness of meaning between the key character string and the key character string is greater than or equal to the threshold value Register as a similar word. Note that the index value here is derived using, for example, natural language processing. For natural language processing, for example, a method of quantifying the meaning of a character string as a "semantic vector", such as "Word2vec", is applied. Note that the threshold value is set to an appropriate value by the user.

次に、図9を参照して、本実施形態に係る情報処理装置10がキー文字列設定処理を実行する際の作用について説明する。 Next, with reference to FIG. 9, the operation when the information processing apparatus 10 according to the present embodiment executes the key character string setting process will be described.

図9は、本実施形態に係る情報処理プログラム15Aによるキー文字列設定処理の流れの一例を示すフローチャートである。 FIG. 9 is a flowchart showing an example of the flow of key character string setting processing by the information processing program 15A according to the present embodiment.

まず、情報処理装置10に対して、キー文字列設定処理の実行が指示されると、CPU11により情報処理プログラム15Aが起動され、以下のステップを実行する。 First, when the information processing device 10 is instructed to execute a key character string setting process, the information processing program 15A is activated by the CPU 11 and executes the following steps.

図9のステップS101では、CPU11が、一例として、上述の図4に示すキー設定画面50を管理者端末40Aに表示させる。 In step S101 of FIG. 9, the CPU 11 causes the administrator terminal 40A to display the key setting screen 50 shown in FIG. 4, as an example.

ステップS102では、CPU11が、管理者端末40Aに表示されたキー設定画面50から、ある帳票画像(例えば、納品書)について、ユーザ(例えば、業務管理者)による第1言語(例えば、英語)のキー文字列(例えば、「Title」)の設定を受け付ける。 In step S102, the CPU 11 uses the key setting screen 50 displayed on the administrator terminal 40A to select the first language (for example, English) by the user (for example, a business manager) for a certain form image (for example, a delivery note). Accepts the setting of a key character string (for example, "Title").

ステップS103では、CPU11が、管理者端末40Aに表示されたキー設定画面50の翻訳確認ボタン(例えば、翻訳確認ボタン51C)がユーザ(例えば、業務担当者)により押下されたか否かを判定する。業務担当者により翻訳確認ボタン51Cが押下されたと判定した場合(肯定判定の場合)、ステップS104に移行し、業務担当者により翻訳確認ボタン51Cが押下されないと判定した場合(否定判定の場合)、ステップS103で待機となる。 In step S103, the CPU 11 determines whether the translation confirmation button (for example, the translation confirmation button 51C) on the key setting screen 50 displayed on the administrator terminal 40A has been pressed by the user (for example, a business person). If it is determined that the translation confirmation button 51C has been pressed by the person in charge of business (in the case of an affirmative determination), the process moves to step S104, and if it is determined that the translation confirmation button 51C has not been pressed by the person in charge of business (in the case of negative determination), The process goes on standby in step S103.

ステップS104では、CPU11が、一例として、上述の図5に示す翻訳確認リスト53を管理者端末40Aにポップアップ表示させる。この場合、翻訳確認リスト53に含まれる複数の再翻訳済み文字列の中に、キー文字列と一致しない文字列が含まれている場合に、ユーザ(例えば、業務担当者)はキー文字列の翻訳に問題があると判断し、類似語の登録を行う。 In step S104, the CPU 11 causes the administrator terminal 40A to pop-up display the translation confirmation list 53 shown in FIG. 5, as an example. In this case, if a character string that does not match the key string is included in the multiple retranslated character strings included in the translation confirmation list 53, the user (for example, a business person) It is determined that there is a problem with the translation and a similar word is registered.

ステップS105では、CPU11が、管理者端末40Aにポップアップ表示された翻訳確認リスト53の類語候補ボタン54がユーザ(例えば、業務担当者)により押下されたか否かを判定する。業務担当者により類語候補ボタン54が押下されたと判定した場合(肯定判定の場合)、ステップS106に移行し、業務担当者により類語候補ボタン54が押下されないと判定した場合(否定判定の場合)、ステップS105で待機となる。 In step S105, the CPU 11 determines whether or not the synonym candidate button 54 of the translation confirmation list 53 pop-up displayed on the administrator terminal 40A has been pressed by the user (for example, a business person). If it is determined that the synonym candidate button 54 has been pressed by the business person (in the case of an affirmative determination), the process moves to step S106, and if it is determined that the synonym candidate button 54 has not been pressed by the business person (in the case of a negative determination), The process goes on standby in step S105.

ステップS106では、CPU11が、一例として、上述の図6に示す類語リスト55を管理者端末40Aにポップアップ表示させる。そして、一例として、上述の図7に示すように、類語リスト55から1つ以上の類似語の選択を受け付ける。 In step S106, the CPU 11 causes the above-described synonym list 55 shown in FIG. 6 to be displayed as a pop-up on the administrator terminal 40A, as an example. Then, as an example, as shown in FIG. 7 described above, selection of one or more similar words from the synonym list 55 is accepted.

ステップS107では、CPU11が、一例として、上述の図8に示すように、管理者端末40Aにポップアップ表示された類語リスト55の類語登録ボタン56がユーザ(例えば、業務担当者)により押下されたか否かを判定する。業務担当者により類語登録ボタン56が押下されたと判定した場合(肯定判定の場合)、ステップS108に移行し、業務担当者により類語登録ボタン56が押下されないと判定した場合(否定判定の場合)、ステップS107で待機となる。 In step S107, the CPU 11 determines, for example, whether or not the user (for example, a business person) has pressed the synonym registration button 56 of the synonym list 55 pop-up displayed on the administrator terminal 40A, as shown in FIG. 8 described above. Determine whether If it is determined that the synonym registration button 56 has been pressed by the person in charge of business (in the case of an affirmative determination), the process moves to step S108, and if it is determined that the synonym registration button 56 has not been pressed by the person in charge of business (in the case of negative determination), The process goes on standby in step S107.

ステップS108では、CPU11が、類語リスト55から選択された類似語が設定DB151に登録し、本情報処理プログラム15Aによるキー文字列設定処理を終了する。具体的に、図8の例では、キー文字列(例えば、「Title」)と、類似語として、「heading」及び「theme」との組み合わせが定義されたキー定義ファイルが設定DB151に登録される。 In step S108, the CPU 11 registers the similar words selected from the synonym list 55 in the setting DB 151, and ends the key character string setting process by the information processing program 15A. Specifically, in the example of FIG. 8, a key definition file in which a combination of a key character string (for example, "Title") and similar words "heading" and "theme" is defined is registered in the setting DB 151. .

ここで、上記の例では、キー文字列の類似語を含む類語リスト55を画面に表示させ、ユーザ(例えば、業務担当者)が選択した類似語を登録する形態について説明したが、類似語の登録を自動的に行うようにしてもよい。具体的に、第1言語(例えば、英語)に再翻訳して得られた複数の再翻訳済み文字列の中に、キー文字列(例えば、「Title」)と一致しない文字列が含まれている場合に、キー文字列と意味が類似する、第1言語の文字列のうち、キー文字列との間の意味の近さを示す指標値が閾値以上の文字列を類似語として登録する。 Here, in the above example, the synonym list 55 containing the similar words of the key character string is displayed on the screen, and the similar word list 55 selected by the user (for example, the person in charge of business) is registered. Registration may be performed automatically. Specifically, if a character string that does not match the key character string (e.g. "Title") is included in the multiple retranslated character strings obtained by retranslating into the first language (e.g. English), If so, among character strings in the first language that are similar in meaning to the key character string, character strings for which an index value indicating the closeness of meaning between the key character string and the key character string is equal to or higher than a threshold value are registered as similar words.

このように本実施形態によれば、キーバリュー抽出に用いるキー文字列を他の言語に翻訳して用いる場合に、翻訳に問題がありそうなキー文字列については1つ以上の類似語を登録することが可能とされる。 As described above, according to the present embodiment, when a key string used for key value extraction is translated into another language and used, one or more similar words are registered for the key string that is likely to have a problem in translation. It is possible to do so.

次に、上述の設定DB151に登録された類似語を用いてキーバリュー抽出を行う情報処理装置10の形態について説明する。 Next, a configuration of the information processing device 10 that performs key-value extraction using similar words registered in the above-mentioned setting DB 151 will be described.

まず、図10を参照して、類似語を用いずにキーバリュー抽出を行う場合の比較例について説明する。 First, with reference to FIG. 10, a comparative example in which key-value extraction is performed without using similar words will be described.

図10は、比較例に係る確認訂正画面60を示す正面図である。確認訂正画面60は、キーバリュー抽出による抽出結果を確認訂正するために、作業者端末40Bに表示される画面である。 FIG. 10 is a front view showing a confirmation/correction screen 60 according to a comparative example. The confirmation/correction screen 60 is a screen displayed on the operator terminal 40B for confirming/correcting the extraction results obtained by key-value extraction.

図10に示す確認訂正画面60は、帳票画像61、キーバリュー抽出結果62、及び修正ボタン63を含む。図10の比較例では、キー文字列が英語であり、帳票画像に記載された言語は日本語である。このため、英語のキー文字列が日本語のキー文字列に翻訳される。例えば、英語のキー文字列「Name」が、日本語のキー文字列「氏名」に翻訳される。この結果、バリュー文字列として、「富士太郎」が抽出される。同様に、英語のキー文字列「Address」が、日本語のキー文字列「住所」に翻訳される。この結果、バリュー文字列として、「東京都千代田区1-1」が抽出される。しかし、英語のキー文字列「Title」は、日本語のキー文字列「肩書」に翻訳され、この結果、バリュー文字列として、「部長」が抽出される。つまり、「Title」は「題名」と翻訳され、バリュー文字列として「納品書」が抽出されることを期待するところ、意図しない「肩書」と翻訳してしまったため、誤ったバリュー文字列が抽出されてしまう。 The confirmation/correction screen 60 shown in FIG. 10 includes a form image 61, a key value extraction result 62, and a correction button 63. In the comparative example of FIG. 10, the key character string is English, and the language written in the form image is Japanese. Therefore, English key strings are translated into Japanese key strings. For example, the English key string "Name" is translated into the Japanese key string "Name." As a result, "Fujitaro" is extracted as the value character string. Similarly, the English key string "Address" is translated into the Japanese key string "Address." As a result, "1-1, Chiyoda-ku, Tokyo" is extracted as the value character string. However, the English key character string "Title" is translated into the Japanese key character string "Title", and as a result, "Manager" is extracted as the value character string. In other words, "Title" is translated as "title" and we expected "delivery note" to be extracted as the value string, but because it was translated as "title" which was not intended, the wrong value string was extracted. It will be done.

図11は、本実施形態に係る情報処理装置10の機能的な構成の別の例を示すブロック図である。なお、図11の構成例は、キーバリュー抽出処理時における構成を示している。 FIG. 11 is a block diagram showing another example of the functional configuration of the information processing device 10 according to this embodiment. Note that the configuration example in FIG. 11 shows the configuration at the time of key-value extraction processing.

図11に示すように、本実施形態に係る情報処理装置10のCPU11は、画像登録部11E、言語判定部11F、翻訳候補生成部11G、翻訳語選択部11H、キーバリュー抽出部11J、及び確認訂正処理部11Kとして機能する。 As shown in FIG. 11, the CPU 11 of the information processing device 10 according to the present embodiment includes an image registration section 11E, a language determination section 11F, a translation candidate generation section 11G, a translated word selection section 11H, a key value extraction section 11J, and a confirmation section 11E. It functions as a correction processing section 11K.

記憶部15には、設定DB151及び抽出結果DB152が記憶されている。設定DB151には、上述のキー文字列設定処理により得られた、キー文字列と類似語との組み合わせが定義されたキー定義ファイルが登録されている。抽出結果DB152には、帳票画像からキーバリュー抽出された抽出結果が登録される。 The storage unit 15 stores a setting DB 151 and an extraction result DB 152. The setting DB 151 registers a key definition file in which combinations of key character strings and similar words obtained by the above-described key character string setting process are defined. In the extraction result DB 152, the extraction results obtained by extracting key values from the form image are registered.

画像登録部11Eは、例えば、帳票原稿を読取装置30により読み取って得られた帳票画像を、確認訂正を行う対象として記憶部15に登録する。帳票画像は、一例として、上述の図10に示すように、日本語で記載された画像である。 The image registration unit 11E registers, for example, a form image obtained by reading a form document with the reading device 30 in the storage unit 15 as a target to be checked and corrected. The form image is, for example, an image written in Japanese, as shown in FIG. 10 described above.

言語判定部11Fは、画像登録部11Eにより登録された帳票画像の言語の種類を判定する。言語の種類は、ユーザ(例えば、作業担当者)が判定してもよいし、既存の言語判定アルゴリズムを用いて自動的に判定してもよい。 The language determination unit 11F determines the language type of the form image registered by the image registration unit 11E. The type of language may be determined by a user (for example, a worker), or may be automatically determined using an existing language determination algorithm.

翻訳候補生成部11Gは、帳票画像からキー文字列(例えば、「Title」)に対応する文字列を特定する場合に、キー文字列を第2言語(例えば、日本語)に翻訳して複数の翻訳候補を生成する。 When specifying a character string corresponding to a key character string (for example, "Title") from a form image, the translation candidate generation unit 11G translates the key character string into a second language (for example, Japanese) and converts it into multiple languages. Generate translation candidates.

翻訳語選択部11Hは、キー文字列の類似語として登録された第1言語の文字列を用いて、複数の翻訳候補の中から、キー文字列の翻訳語を選択する。なお、翻訳語の選択は、複数の翻訳候補を作業者端末40Bに表示させ、ユーザ(例えば、作業担当者)が行ってもよいし、自動的に選択してもよい。自動的に選択する場合、キー文字列の類似語として登録された第1言語の文字列を第2言語に翻訳して翻訳済み類似語を生成し、複数の翻訳候補の各々と、翻訳済み類似語との間の意味の近さを示す指標値を算出し、複数の翻訳候補の中から、指標値が最も高い翻訳候補を、キー文字列の翻訳語として選択する。具体的には、一例として、図12に示すように、キー翻訳候補を生成し、生成したキー翻訳候補の中からキー文字列の翻訳語を選択する。 The translation word selection unit 11H selects a translation word for the key character string from among a plurality of translation candidates using the first language character string registered as a similar word to the key character string. Note that the selection of a translation word may be performed by a user (for example, a worker) by displaying a plurality of translation candidates on the worker terminal 40B, or may be selected automatically. When selecting automatically, the string in the first language registered as a similar word of the key string is translated into the second language to generate translated similar words, and each of the multiple translation candidates is matched with the translated similar word. An index value indicating the similarity of meaning between the words and the word is calculated, and the translation candidate with the highest index value is selected from among the plurality of translation candidates as the translated word of the key character string. Specifically, as an example, as shown in FIG. 12, key translation candidates are generated, and a translated word for the key character string is selected from the generated key translation candidates.

図12は、本実施形態に係るキー翻訳候補生成結果の一例を示す図である。図12の例では、キー文字列が「Title」である場合に、キー翻訳候補として、「題名」、「肩書」、及び「称号」が生成される。 FIG. 12 is a diagram illustrating an example of key translation candidate generation results according to this embodiment. In the example of FIG. 12, when the key character string is "Title", "title", "title", and "title" are generated as key translation candidates.

図12の例では、キー文字列(例えば、「Title」)の類似語として登録された第1言語の文字列は、一例として、上述の図8に示すように、「heading」及び「theme」とされる。そして、これらの第1言語の文字列を、第2言語に翻訳して翻訳済み類似語を生成する。例えば、「heading」は「題目」に翻訳され、「theme」は「主題」に翻訳される。更に、複数の翻訳候補の各々と、翻訳済み類似語との間の意味の近さを示す指標値を算出する。指標値は、上述したように、例えば、自然言語処理を用いて算出される。自然言語処理には、例えば、文字列の意味を「意味ベクトル」として数値化する手法、例えば、「Word2vec」等の手法が適用される。図12の例では、キー翻訳候補「題名」の場合、翻訳済み類似語「題目」、「主題」の各々との間の指標値(近似値)はそれぞれ「9.3」、「9.1」と算出され、これらの平均値は「9.2」と算出される。また、キー翻訳候補「肩書」の場合、翻訳済み類似語「題目」、「主題」の各々との間の指標値(近似値)はそれぞれ「5.6」、「4.2」と算出され、これらの平均値は「4.9」と算出される。また、キー翻訳候補「称号」の場合、翻訳済み類似語「題目」、「主題」の各々との間の指標値(近似値)はそれぞれ「3.3」、「4.5」と算出され、これらの平均値は「3.9」と算出される。 In the example of FIG. 12, the first language character strings registered as similar words to the key character string (for example, "Title") are, for example, "heading" and "theme" as shown in FIG. 8 above. It is said that Then, these character strings in the first language are translated into the second language to generate translated similar words. For example, "heading" is translated to "title" and "theme" is translated to "subject." Furthermore, an index value indicating the similarity in meaning between each of the plurality of translation candidates and the translated similar word is calculated. The index value is calculated using natural language processing, for example, as described above. For natural language processing, for example, a method of quantifying the meaning of a character string as a "semantic vector", such as "Word2vec", is applied. In the example of FIG. 12, in the case of the key translation candidate "title", the index values (approximate values) between the translated similar words "title" and "subject" are "9.3" and "9.1," respectively. ”, and their average value is calculated as “9.2”. In addition, in the case of the key translation candidate "title", the index values (approximate values) between the translated similar words "title" and "subject" are calculated as "5.6" and "4.2", respectively. , the average value of these is calculated as "4.9". In addition, in the case of the key translation candidate "title", the index values (approximate values) between the translated similar words "title" and "subject" are calculated as "3.3" and "4.5", respectively. , the average value of these is calculated as "3.9".

複数のキー翻訳候補の中から、指標値(近似値)が最も高いキー翻訳候補を、キー文字列(例えば、「Title」)の翻訳語として選択する。図12の例では、指標値(近似値)の平均値が最も高いキー翻訳候補「題名」が、キー文字列(例えば、「Title」)の翻訳語として選択される。なお、翻訳済み類似語は、1つ以上であればよく、翻訳済み類似語が1つの場合には、平均値ではなく、指標値(近似値)自体を比較すればよい。 Among the plurality of key translation candidates, the key translation candidate with the highest index value (approximate value) is selected as the translated word of the key character string (for example, "Title"). In the example of FIG. 12, the key translation candidate "Title" with the highest average value of index values (approximate values) is selected as the translated word of the key character string (for example, "Title"). Note that the number of translated similar words may be one or more, and if there is one translated similar word, the index value (approximate value) itself may be compared instead of the average value.

キーバリュー抽出部11Jは、翻訳語選択部11Hにより選択された翻訳語を用いて、帳票画像から、当該翻訳語に対応する文字列を特定し、特定した文字列の周囲に位置する文字列をバリュー文字列として抽出する。 The key value extraction unit 11J uses the translated word selected by the translated word selection unit 11H to identify a character string corresponding to the translated word from the form image, and extracts character strings located around the identified character string. Extract as a value string.

確認訂正処理部11Kは、一例として、図13に示すように、キーバリュー抽出結果を含む確認訂正画面を作業者端末40Bに表示させ、ユーザ(例えば、作業担当者)から確認訂正を受け付け、受け付けた確認訂正を反映したキーバリュー抽出結果を抽出結果DB152に登録する。 For example, as shown in FIG. 13, the confirmation/correction processing unit 11K displays a confirmation/correction screen including the key value extraction results on the worker terminal 40B, receives confirmation/correction from the user (for example, a worker), and accepts the confirmation/correction. The key value extraction result reflecting the confirmation and correction is registered in the extraction result DB 152.

図13は、本実施形態に係る確認訂正画面60の一例を示す正面図である。確認訂正画面60は、キーバリュー抽出による抽出結果を確認訂正するために、作業者端末40Bに表示される画面である。 FIG. 13 is a front view showing an example of the confirmation/correction screen 60 according to this embodiment. The confirmation/correction screen 60 is a screen displayed on the operator terminal 40B for confirming/correcting the extraction results obtained by key-value extraction.

図13に示す確認訂正画面60は、帳票画像61、キーバリュー抽出結果62、及び修正ボタン63を含む。図13の例では、キー文字列が英語であり、帳票画像に記載された言語は日本語である。このため、英語のキー文字列が日本語のキー文字列に翻訳される。例えば、英語のキー文字列「Name」が、日本語のキー文字列「氏名」に翻訳される。この結果、バリュー文字列として、「富士太郎」が抽出される。同様に、英語のキー文字列「Address」が、日本語のキー文字列「住所」に翻訳される。この結果、バリュー文字列として、「東京都千代田区1-1」が抽出される。英語のキー文字列「Title」は、日本語のキー文字列「題名」に翻訳され、この結果、バリュー文字列として、「納品書」が抽出される。 The confirmation/correction screen 60 shown in FIG. 13 includes a form image 61, a key value extraction result 62, and a correction button 63. In the example of FIG. 13, the key character string is English, and the language written in the form image is Japanese. Therefore, English key strings are translated into Japanese key strings. For example, the English key string "Name" is translated into the Japanese key string "Name." As a result, "Fujitaro" is extracted as the value character string. Similarly, the English key string "Address" is translated into the Japanese key string "Address." As a result, "1-1, Chiyoda-ku, Tokyo" is extracted as the value character string. The English key string "Title" is translated into the Japanese key string "Title", and as a result, "Delivery note" is extracted as the value string.

図13の例では、キー文字列(例えば、「Title」)の類似語として予め登録された第1言語の文字列(例えば、「heading」、[theme])を第2言語に翻訳して得られた翻訳済み類似語(例えば、「題目」、「主題」)と、複数の翻訳候補の各々(例えば、「題名」、「肩書」、「称号」)との間の意味の近さを示す指標値を算出し、複数の翻訳候補の中から、指標値が最も高い翻訳候補が、キー文字列の翻訳語として選択される。図13の例では、意図した「題名」がキー文字列の翻訳語となるため、正しいバリュー文字列「納品書」が抽出される。 In the example of FIG. 13, a character string in the first language (e.g., "heading", [theme]) registered in advance as a similar word to a key character string (e.g., "Title") is translated into the second language. Indicates the closeness in meaning between the translated similar word (e.g., "title", "subject") and each of the multiple translation candidates (e.g., "title", "title", "designation") The index value is calculated, and the translation candidate with the highest index value is selected from among the plurality of translation candidates as the translated word of the key character string. In the example of FIG. 13, the intended "title" is the translated word for the key string, so the correct value string "delivery note" is extracted.

また、確認訂正処理部11Kは、一例として、図14に示すように、翻訳語選択部11Hにより選択された翻訳語が適切でない場合、バリュー文字列の抽出後に、当該翻訳語を修正した文字列を第1言語に再翻訳し、第1言語に再翻訳して得られた文字列を、類似語として設定DB151に登録するようにしてもよい。 For example, as shown in FIG. 14, if the translation word selected by the translation word selection section 11H is not appropriate, the confirmation correction processing section 11K generates a character string that corrects the translated word after extracting the value character string. may be re-translated into the first language, and the character string obtained by the re-translation into the first language may be registered in the setting DB 151 as a similar word.

図14は、本実施形態に係る確認訂正画面60の別の例を示す正面図である。確認訂正画面60は、キーバリュー抽出による抽出結果を確認訂正するために、作業者端末40Bに表示される画面である。 FIG. 14 is a front view showing another example of the confirmation/correction screen 60 according to this embodiment. The confirmation/correction screen 60 is a screen displayed on the operator terminal 40B for confirming/correcting the extraction results obtained by key-value extraction.

図14に示す確認訂正画面60は、帳票画像61、キーバリュー抽出結果62、及び修正ボタン63を含む。図14の例では、英語のキー文字列「Title」が、意図しない日本語のキー文字列「肩書」に翻訳され、この結果、バリュー文字列として、「部長」が誤って抽出されている。このとき、ユーザ(例えば、作業担当者)の操作により修正ボタン63が押下されると、ユーザ(例えば、作業担当者)による修正を受け付ける。図14の例では、「肩書」が「題目」に修正され、「部長」が「納品書」に修正される。この場合、修正した「題目」を第1言語に再翻訳して得られた「heading」が、キー文字列の類似語として設定DB151に登録される。なお、「heading」が既に登録されている場合には、そのまま上書き登録してもよいし、「類似語として既に登録されています。」等のメッセージを表示してユーザ(例えば、作業担当者)に通知してもよい。 The confirmation/correction screen 60 shown in FIG. 14 includes a form image 61, a key value extraction result 62, and a correction button 63. In the example of FIG. 14, the English key string "Title" is translated into the unintended Japanese key string "Title", and as a result, "Manager" is erroneously extracted as the value string. At this time, when the correction button 63 is pressed by the user (for example, the person in charge of the work), the correction by the user (for example, the person in charge of the work) is accepted. In the example of FIG. 14, "Title" is modified to "Title" and "Manager" is modified to "Delivery Note." In this case, "heading" obtained by retranslating the corrected "title" into the first language is registered in the setting DB 151 as a similar word to the key character string. If "heading" has already been registered, you can simply overwrite it, or display a message such as "This has already been registered as a similar word" and let the user (for example, the person in charge of the work) may be notified.

次に、図15を参照して、本実施形態に係る情報処理装置10がキーバリュー抽出処理を実行する際の作用について説明する。 Next, with reference to FIG. 15, the operation when the information processing apparatus 10 according to the present embodiment executes the key-value extraction process will be described.

図15は、本実施形態に係る情報処理プログラム15Aによるキーバリュー抽出処理の流れの一例を示すフローチャートである。 FIG. 15 is a flowchart showing an example of the flow of key-value extraction processing by the information processing program 15A according to the present embodiment.

まず、情報処理装置10に対して、キーバリュー抽出処理の実行が指示されると、CPU11により情報処理プログラム15Aが起動され、以下のステップを実行する。 First, when the information processing device 10 is instructed to execute a key value extraction process, the information processing program 15A is activated by the CPU 11 and executes the following steps.

図15のステップS111では、CPU11が、帳票原稿を読取装置30により読み取って得られた帳票画像を、確認訂正を行う対象として記憶部15に登録する。帳票画像は、一例として、上述の図13に示すように、日本語で記載された画像である。 In step S111 in FIG. 15, the CPU 11 registers the form image obtained by reading the form document with the reading device 30 in the storage unit 15 as a subject to be checked and corrected. The form image is, for example, an image written in Japanese, as shown in FIG. 13 described above.

ステップS112では、CPU11が、ステップS111で登録した帳票画像の言語の種類を判定する。言語の種類は、ユーザ(例えば、作業担当者)が判定してもよいし、既存の言語判定アルゴリズムを用いて自動的に判定してもよい。
In step S112, the CPU 11 determines the language type of the form image registered in step S111. The type of language may be determined by a user (for example, a worker), or may be automatically determined using an existing language determination algorithm.

ステップS113では、CPU11が、帳票画像からキー文字列(例えば、「Title」)に対応する文字列を特定するために、キー文字列を第2言語(例えば、日本語)に翻訳して複数の翻訳候補を生成する。 In step S113, the CPU 11 translates the key string into a second language (e.g. Japanese) and converts it into a plurality of languages in order to identify a string corresponding to the key string (e.g. "Title") from the form image. Generate translation candidates.

ステップS114では、CPU11が、キー文字列の類似語として予め登録された第1言語の文字列を用いて、複数の翻訳候補の中から、キー文字列の翻訳語を選択する。なお、翻訳語の選択は、複数の翻訳候補を作業者端末40Bに表示させ、ユーザ(例えば、作業担当者)が行ってもよいし、自動的に選択してもよい。自動的に選択する場合、キー文字列の類似語として登録された第1言語の文字列を第2言語に翻訳して翻訳済み類似語を生成し、複数の翻訳候補の各々と、翻訳済み類似語との間の意味の近さを示す指標値を算出し、複数の翻訳候補の中から、指標値が最も高い翻訳候補を、キー文字列の翻訳語として選択する。具体的には、一例として、上述の図12に示すように、キー翻訳候補を生成し、生成したキー翻訳候補の中からキー文字列の翻訳語を選択する。 In step S114, the CPU 11 selects a translation word for the key string from among a plurality of translation candidates, using a first language string registered in advance as a similar word to the key string. Note that the selection of a translation word may be performed by a user (for example, a worker) by displaying a plurality of translation candidates on the worker terminal 40B, or may be selected automatically. When selecting automatically, the string in the first language registered as a similar word of the key string is translated into the second language to generate translated similar words, and each of the multiple translation candidates is matched with the translated similar word. An index value indicating the similarity of meaning between the words and the word is calculated, and the translation candidate with the highest index value is selected from among the plurality of translation candidates as the translated word of the key character string. Specifically, as an example, as shown in FIG. 12 described above, key translation candidates are generated, and a translated word of the key character string is selected from the generated key translation candidates.

ステップS115では、CPU11が、ステップS114で選択した翻訳語を用いて、帳票画像に対してキーバリュー抽出を行う。 In step S115, the CPU 11 performs key-value extraction on the form image using the translated word selected in step S114.

ステップS116では、CPU11が、一例として、上述の図13に示すように、キーバリュー抽出結果を含む確認訂正画面60を作業者端末40Bに表示させる。 In step S116, the CPU 11 causes the operator terminal 40B to display a confirmation/correction screen 60 including the key value extraction results, as shown in FIG. 13 described above, for example.

ステップS117では、CPU11が、作業者端末40Bに表示された確認訂正画面60に含まれる翻訳語が適切か否か、つまり、確認訂正画面60の修正ボタン63が押下されたか否かを判定する。翻訳語が適切、つまり、修正ボタン63が押下されないと判定した場合(肯定判定の場合)、ステップS118に移行し、翻訳語が適切でない、つまり、修正ボタン63が押下されたと判定した場合(否定判定の場合)、ステップS119に移行する。 In step S117, the CPU 11 determines whether the translated word included in the confirmation/correction screen 60 displayed on the worker terminal 40B is appropriate, that is, whether the correction button 63 on the confirmation/correction screen 60 has been pressed. If it is determined that the translated word is appropriate, that is, the correction button 63 has not been pressed (in the case of an affirmative determination), the process moves to step S118, and if it is determined that the translated word is not appropriate, that is, the correction button 63 has been pressed (in the case of a negative determination), the process moves to step S118. (in the case of determination), the process moves to step S119.

ステップS118では、CPU11が、作業者端末40Bに表示された確認訂正画面60にて確認訂正されたキーバリュー抽出結果を抽出結果DB152に登録し、本情報処理プログラム15Aによるキーバリュー抽出処理を終了する。 In step S118, the CPU 11 registers the key value extraction result that has been confirmed and corrected on the confirmation/correction screen 60 displayed on the worker terminal 40B in the extraction result DB 152, and ends the key value extraction process by the information processing program 15A. .

一方、ステップS119では、CPU11が、一例として、上述の図14に示すように、作業者端末40Bに表示された確認訂正画面60から、ユーザ(例えば、作業担当者)による翻訳語及びバリュー文字列の修正を受け付ける。 On the other hand, in step S119, the CPU 11, for example, as shown in FIG. Accepts corrections.

ステップS120では、CPU11が、ステップS119で修正した翻訳語を第1言語に再翻訳する。 In step S120, the CPU 11 retranslates the translated word corrected in step S119 into the first language.

ステップS121では、CPU11が、ステップS120で再翻訳した文字列を、キー文字列の類似語として設定DB151に登録し、ステップS118に移行する。一例として、上述の図14に示すように、「肩書」が「題目」に修正され、「部長」が「納品書」に修正される。この場合、修正した「題目」を第1言語に再翻訳して得られた「heading」が、キー文字列の類似語として設定DB151に登録される。なお、「heading」が既に登録されている場合には、そのまま上書き登録してもよいし、「類似語として既に登録されています。」等のメッセージを表示してユーザ(例えば、作業担当者)に通知してもよい。 In step S121, the CPU 11 registers the character string retranslated in step S120 in the setting DB 151 as a similar word to the key character string, and proceeds to step S118. As an example, as shown in FIG. 14 above, "Title" is modified to "Title" and "Manager" is modified to "Delivery Note." In this case, "heading" obtained by retranslating the corrected "title" into the first language is registered in the setting DB 151 as a similar word to the key character string. If "heading" has already been registered, you can either overwrite it, or display a message such as "This has already been registered as a similar word" and let the user (for example, the person in charge of the work) may be notified.

このように本実施形態によれば、キー文字列の類似語を予め登録しておき、キー文字列の翻訳語の特定に用いることにより、意図した翻訳語を得ることができ、正しいバリュー文字列を抽出することが可能とされる。 As described above, according to the present embodiment, by registering similar words of the key string in advance and using them to specify the translated word of the key string, the intended translated word can be obtained and the correct value string can be obtained. It is possible to extract

なお、上記各実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば、CPU:Central Processing Unit、等)や、専用のプロセッサ(例えば、GPU:Graphics processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。 Note that in each of the above embodiments, a processor refers to a processor in a broad sense, and includes a general-purpose processor (e.g., CPU: Central Processing Unit, etc.) and a dedicated processor (e.g., GPU: Graphics Processing Unit, ASIC: Application). (Specific Integrated Circuit, FPGA: Field Programmable Gate Array, Programmable Logic Device, etc.).

また、上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は、上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。 Further, the operation of the processor in each of the above embodiments may be performed not only by one processor, but also by a plurality of processors located at physically separate locations. Further, the order of each operation of the processor is not limited to the order described in each of the above embodiments, and may be changed as appropriate.

以上、実施形態に係る情報処理装置を例示して説明した。実施形態は、情報処理装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な非一時的記憶媒体の形態としてもよい。 The information processing apparatus according to the embodiment has been described above as an example. The embodiment may be in the form of a program for causing a computer to execute the functions of each unit included in the information processing device. Embodiments may take the form of a computer readable non-transitory storage medium having these programs stored thereon.

その他、上記実施形態で説明した情報処理装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。 In addition, the configuration of the information processing apparatus described in the above embodiments is merely an example, and may be changed according to the situation without departing from the spirit of the invention.

また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。 Furthermore, the process flow of the program described in the above embodiment is only an example, and unnecessary steps may be deleted, new steps may be added, or the processing order may be changed without departing from the main purpose. good.

また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。 Further, in the above embodiment, a case has been described in which the processing according to the embodiment is realized by a software configuration using a computer by executing a program, but the present invention is not limited to this. The embodiments may be realized by, for example, a hardware configuration or a combination of a hardware configuration and a software configuration.

10 情報処理装置
11 CPU
11A キー設定部
11B 翻訳処理部
11C 翻訳結果提示部
11D 類似語登録部
11E 画像登録部
11F 言語判定部
11G 翻訳候補生成部
11H 翻訳語選択部
11J キーバリュー抽出部
11K 確認訂正処理部
12 ROM
13 RAM
14 I/O
15 記憶部
15A 情報処理プログラム
16 表示部
17 操作部
18 通信部
30 読取装置
40A 管理者端末
40B 作業者端末
50 キー設定画面
60 確認訂正画面
100 情報処理システム
151 設定DB
152 抽出結果DB
10 Information processing device 11 CPU
11A Key setting section 11B Translation processing section 11C Translation result presentation section 11D Similar word registration section 11E Image registration section 11F Language determination section 11G Translation candidate generation section 11H Translation word selection section 11J Key value extraction section 11K Confirmation correction processing section 12 ROM
13 RAM
14 I/O
15 Storage unit 15A Information processing program 16 Display unit 17 Operation unit 18 Communication unit 30 Reading device 40A Administrator terminal 40B Operator terminal 50 Key setting screen 60 Confirmation/correction screen 100 Information processing system 151 Setting DB
152 Extraction result DB

Claims (10)

プロセッサを備え、
前記プロセッサは、
画像から特定する文字列に対応させる第1言語の文字列をキー文字列として設定し、
前記キー文字列を前記第1言語以外の複数の異なる第2言語に翻訳し、
前記複数の異なる第2言語に翻訳して得られた複数の翻訳済み文字列の各々を、前記第1言語に再翻訳し、
前記第1言語に再翻訳して得られた複数の再翻訳済み文字列の中に、前記キー文字列と一致しない文字列が含まれている場合に、前記キー文字列と意味が類似する、前記第1言語の文字列を類似語として登録する
情報処理装置。
Equipped with a processor,
The processor includes:
Set a character string in the first language that corresponds to the character string specified from the image as a key character string,
translating the key string into a plurality of different second languages other than the first language;
retranslating each of the plurality of translated character strings obtained by translating into the plurality of different second languages into the first language,
If a plurality of retranslated character strings obtained by retranslating into the first language include a character string that does not match the key character string, the meaning is similar to the key character string. An information processing device that registers character strings in the first language as similar words.
前記第2言語は、前記画像に記載された言語である
請求項1に記載の情報処理装置。
The information processing device according to claim 1, wherein the second language is a language written in the image.
前記プロセッサは、前記キー文字列と意味が類似する、前記第1言語の文字列を画面に表示させ、表示させた文字列のうち、ユーザによって選択された文字列を前記類似語として登録する
請求項1又は請求項2に記載の情報処理装置。
The processor displays character strings in the first language that are similar in meaning to the key character strings on the screen, and registers a character string selected by the user from among the displayed character strings as the similar word. The information processing device according to claim 1 or claim 2.
前記画面は、前記複数の再翻訳済み文字列を表示し、
前記キー文字列と一致しない文字列の表示形態は、前記キー文字列と一致する文字列の表示形態と異なっている
請求項3に記載の情報処理装置。
The screen displays the plurality of retranslated character strings,
The information processing apparatus according to claim 3, wherein a display form of a character string that does not match the key character string is different from a display form of a character string that matches the key character string.
前記プロセッサは、前記キー文字列と意味が類似する、前記第1言語の文字列のうち、前記キー文字列との間の意味の近さを示す指標値が閾値以上の文字列を前記類似語として登録する
請求項1又は請求項2に記載の情報処理装置。
The processor selects, among character strings in the first language that are similar in meaning to the key character string, character strings for which an index value indicating the closeness of meaning between the key character string and the key character string is equal to or greater than a threshold, as the similar word. The information processing device according to claim 1 or 2, wherein the information processing device is registered as:
前記プロセッサは、前記画像に対して確認訂正を行う際に、当該画像から前記キー文字列に対応する文字列を特定する場合に、前記キー文字列を前記第2言語に翻訳して複数の翻訳候補を生成し、
前記類似語として登録された前記第1言語の文字列を用いて、前記複数の翻訳候補の中から、前記キー文字列の翻訳語を選択する
請求項1~請求項5の何れか1項に記載の情報処理装置。
When identifying a character string corresponding to the key character string from the image when confirming and correcting the image, the processor translates the key character string into the second language and performs multiple translations. generate candidates,
A translated word for the key character string is selected from among the plurality of translation candidates using the character string in the first language registered as the similar word. The information processing device described.
前記プロセッサは、前記類似語として登録された前記第1言語の文字列を前記第2言語に翻訳して翻訳済み類似語を生成し、
前記複数の翻訳候補の各々と、前記翻訳済み類似語との間の意味の近さを示す指標値を算出し、
前記複数の翻訳候補の中から、前記指標値が最も高い翻訳候補を、前記キー文字列の翻訳語として選択する
請求項6に記載の情報処理装置。
The processor translates the character string in the first language registered as the similar word into the second language to generate a translated similar word,
calculating an index value indicating the closeness of meaning between each of the plurality of translation candidates and the translated similar word;
The information processing device according to claim 6, wherein a translation candidate with the highest index value is selected as a translated word of the key character string from among the plurality of translation candidates.
前記プロセッサは、前記選択した翻訳語を用いて、前記画像から、当該翻訳語に対応する文字列を特定し、特定した文字列の周囲に位置する文字列をバリュー文字列として抽出する
請求項7に記載の情報処理装置。
7. The processor uses the selected translated word to identify a character string corresponding to the translated word from the image, and extracts character strings located around the identified character string as a value character string. The information processing device described in .
前記プロセッサは、前記選択した翻訳語が適切でない場合、前記バリュー文字列の抽出後に、当該翻訳語を修正した文字列を前記第1言語に再翻訳し、前記第1言語に再翻訳して得られた文字列を、前記類似語として登録する
請求項8に記載の情報処理装置。
If the selected translated word is not appropriate, the processor re-translates a character string in which the translated word is corrected into the first language after extracting the value character string, and obtains a result by re-translating the translated word into the first language. The information processing device according to claim 8, wherein the character string that has been entered is registered as the similar word.
画像から特定する文字列に対応させる第1言語のキー文字列を設定し、
前記キー文字列を前記第1言語以外の複数の異なる第2言語に翻訳し、
前記複数の異なる第2言語に翻訳して得られた複数の翻訳済み文字列の各々を、前記第1言語に再翻訳し、
前記第1言語に再翻訳して得られた複数の再翻訳済み文字列の中に、前記キー文字列と一致しない文字列が含まれている場合に、前記キー文字列と意味が類似する、前記第1言語の文字列を類似語として登録することを、
コンピュータに実行させるための情報処理プログラム。
Set the key string of the first language that corresponds to the string specified from the image,
translating the key string into a plurality of different second languages other than the first language;
retranslating each of the plurality of translated character strings obtained by translating into the plurality of different second languages into the first language,
If a plurality of retranslated character strings obtained by retranslating into the first language include a character string that does not match the key character string, the meaning is similar to the key character string. Registering the character string in the first language as a similar word,
An information processing program that is executed by a computer.
JP2022033730A 2022-03-04 2022-03-04 Information processing device and information processing program Pending JP2023129001A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022033730A JP2023129001A (en) 2022-03-04 2022-03-04 Information processing device and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022033730A JP2023129001A (en) 2022-03-04 2022-03-04 Information processing device and information processing program

Publications (1)

Publication Number Publication Date
JP2023129001A true JP2023129001A (en) 2023-09-14

Family

ID=87973072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022033730A Pending JP2023129001A (en) 2022-03-04 2022-03-04 Information processing device and information processing program

Country Status (1)

Country Link
JP (1) JP2023129001A (en)

Similar Documents

Publication Publication Date Title
KR101006749B1 (en) Handwriting recognition in electronic devices
US20080133444A1 (en) Web-based collocation error proofing
US20120004898A1 (en) Contextual Input Method
JP2014142951A (en) Modular system and method for managing chinese, japanese and korean linguistic data in electronic form
US20060217959A1 (en) Translation processing method, document processing device and storage medium storing program
US10140260B2 (en) Intelligent text reduction for graphical interface elements
JP2003223437A (en) Method of displaying candidate for correct word, method of checking spelling, computer device, and program
KR20100015958A (en) Multi-mode input method editor
US10503808B2 (en) Time user interface with intelligent text reduction
US20220222292A1 (en) Method and system for ideogram character analysis
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JP2018010532A (en) Information processing device, program and information processing method
US20200320255A1 (en) Language Processing Method and Device
US11100318B2 (en) Information processing apparatus and non-transitory computer readable medium
CN109445900B (en) Translation method and device for picture display
JP2023129001A (en) Information processing device and information processing program
JP7315420B2 (en) How to adapt and modify text
JP2007018158A (en) Character processor, character processing method, and recording medium
JP2021111157A (en) Information processing device and information processing program
JP7481999B2 (en) Dictionary editing device, dictionary editing method, and dictionary editing program
JP2854000B2 (en) Search device
US20230409830A1 (en) Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method
JP4050745B2 (en) Text input system
JP2022074852A (en) Dictionary editing device, dictionary editing method, and dictionary editing program
CN116894443A (en) Intelligent translation system