JP2017027237A - Information processing apparatus, and program - Google Patents

Information processing apparatus, and program Download PDF

Info

Publication number
JP2017027237A
JP2017027237A JP2015143363A JP2015143363A JP2017027237A JP 2017027237 A JP2017027237 A JP 2017027237A JP 2015143363 A JP2015143363 A JP 2015143363A JP 2015143363 A JP2015143363 A JP 2015143363A JP 2017027237 A JP2017027237 A JP 2017027237A
Authority
JP
Japan
Prior art keywords
language
ocr
destination
information
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015143363A
Other languages
Japanese (ja)
Inventor
広茂 野中
Hiroshige Nonaka
広茂 野中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015143363A priority Critical patent/JP2017027237A/en
Publication of JP2017027237A publication Critical patent/JP2017027237A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)

Abstract

PROBLEM TO BE SOLVED: To enable specification of a language to be a recognition object in OCR processing.SOLUTION: An image reader 16 scans a manuscript to generate document data, and an OCR processor 18 applies OCR processing to the document data to generate character data. The destination (transmission destination) of the data is also chosen. When a default OCR language is associated with the destination in destination information 24, the OCR language is specified as the language to be a recognition object in the OCR processing by the OCR processor 18. When the default OCR language is not associated with the destination, a recognition object language is specified on the basis of destination information on the destination.SELECTED DRAWING: Figure 2

Description

本発明は、情報処理装置及びプログラムに関する。   The present invention relates to an information processing apparatus and a program.

原稿を読み取る(スキャンする)ことにより文書データを生成し、その文書データに対してOCR(optical character recognition)処理(光学文字認識処理)を適用する場合がある。また、ファクシミリ送信された文書データに対してOCR処理を適用する場合もある。   In some cases, document data is generated by reading (scanning) a document, and OCR (optical character recognition) processing (optical character recognition processing) is applied to the document data. In some cases, OCR processing is applied to document data transmitted by facsimile.

特許文献1に記載の装置においては、原稿画像に配置される宛先、件名及び本文の記載領域の座標情報が記憶されている。スキャンによって得られた文書データから、その座標情報が示す領域の文書データが抽出され、その抽出された文書データに対してOCR処理が適用される。   In the apparatus described in Japanese Patent Application Laid-Open No. H10-228707, the destination information, subject name, and coordinate information of the description area of the text are stored in the document image. Document data in an area indicated by the coordinate information is extracted from the document data obtained by scanning, and OCR processing is applied to the extracted document data.

特許文献2に記載の装置においては、ファクシミリ送信する際に、受信装置がOCR機能に対応しているか否かが確認され、受信装置がOCR機能に対応している場合、OCR処理の対象領域が指定される。   In the apparatus described in Patent Document 2, it is confirmed whether or not the receiving apparatus supports the OCR function when performing facsimile transmission. If the receiving apparatus supports the OCR function, the target area for the OCR processing is It is specified.

特開2005−244411号公報JP 2005-244411 A 特開2000−165569号公報JP 2000165655 A

OCR処理が適用される場合、一般的に、認識対象の言語(例えば、英語、日本語、ベトナム語等)を事前に選択する必要がある。その言語を選択する手法として、対象文書データから認識対象の言語を自動的に特定しようとする技術が知られている。しかし、その特定精度が低い場合があり、また、その特定のために要する処理時間が増大するという問題が生じる。そのため、一般的には、ユーザによって認識対象の言語が指定されている。この場合、ユーザの手間がかかるという問題が生じる。   When the OCR process is applied, it is generally necessary to select a language to be recognized (for example, English, Japanese, Vietnamese, etc.) in advance. As a method for selecting the language, a technique for automatically specifying a recognition target language from target document data is known. However, there are cases where the identification accuracy is low, and there is a problem that the processing time required for the identification increases. Therefore, in general, the language to be recognized is specified by the user. In this case, there is a problem that it takes time and effort for the user.

本発明の目的は、OCR処理において認識対象となる言語が、対象文書のデータから認識対象の言語を自動的に特定しようとする場合と比べて、ユーザの手間をかけることなく特定されるようにすることにある。   An object of the present invention is to identify a language to be recognized in the OCR process without taking time and effort of the user as compared with a case in which the language to be recognized is automatically specified from the data of the target document. There is to do.

請求項1に係る発明は、文書データにOCR処理を適用することにより文字データを生成するOCR処理手段と、前記文字データの送信先として選択された宛先にOCR言語が対応付けられている場合、当該OCR言語を前記OCR処理において認識対象となる言語として特定する特定手段と、を有する情報処理装置である。   In the invention according to claim 1, when an OCR language is associated with an OCR processing unit that generates character data by applying OCR processing to document data, and a destination selected as a transmission destination of the character data, And an identifying unit that identifies the OCR language as a language to be recognized in the OCR process.

請求項2に係る発明は、宛先に関する宛先情報と、当該宛先に対して設定されたOCR言語を示すOCR言語情報と、を対応付けて記憶する記憶手段を更に有し、前記特定手段は、前記文字データの送信先として選択された宛先に対応付けられているOCR言語を前記認識対象となる言語として特定する、ことを特徴とする請求項1に記載の情報処理装置である。   The invention according to claim 2 further includes storage means for storing destination information related to a destination and OCR language information indicating an OCR language set for the destination in association with each other, The information processing apparatus according to claim 1, wherein an OCR language associated with a destination selected as a transmission destination of character data is specified as the language to be recognized.

請求項3に係る発明は、前記特定手段は、前記文字データの送信先として選択された宛先にOCR言語が対応付けられていない場合、前記文字データの宛先に関する宛先情報であって言語の特定が可能な情報を含む宛先情報に基づいて、前記認識対象となる言語を特定する、ことを特徴とする請求項1又は請求項2に記載の情報処理装置。   The invention according to claim 3 is characterized in that, when the OCR language is not associated with the destination selected as the transmission destination of the character data, the specifying means is destination information relating to the destination of the character data, and the language is specified. The information processing apparatus according to claim 1, wherein the language to be recognized is specified based on destination information including possible information.

請求項4に係る発明は、前記特定手段によって前記認識対象となる複数の言語が特定された場合、当該複数の言語を示す情報を、言語の優先順位に従って出力する出力手段を更に有する、ことを特徴とする請求項3に記載の情報処理装置である。   The invention according to claim 4 further includes output means for outputting information indicating the plurality of languages according to the priority order of the languages when the plurality of languages to be recognized are specified by the specifying means. The information processing apparatus according to claim 3, wherein the information processing apparatus is an information processing apparatus.

請求項5に係る発明は、前記特定手段によって前記認識対象となる複数の言語が特定された場合、当該複数の言語を示す情報を、前記宛先情報に基づく優先順位に従って出力する出力手段を更に有する、ことを特徴とする請求項3に記載の情報処理装置である。   The invention according to claim 5 further includes output means for outputting information indicating the plurality of languages in accordance with the priority order based on the destination information when the plurality of languages to be recognized are specified by the specifying means. The information processing apparatus according to claim 3.

請求項6に係る発明は、前記特定手段によって特定された言語をOCR言語として前記文字データの宛先に対応付けて登録する登録手段を更に有する、ことを特徴とする請求項3から請求項5のいずれか一項に記載の情報処理装置である。   The invention according to claim 6 further comprises registration means for registering the language specified by the specifying means as an OCR language in association with the destination of the character data. It is an information processing apparatus as described in any one.

請求項7に係る発明は、前記特定手段は、他の装置からファクシミリ送信された前記文書データを受け、前記文書データの送信元を前記宛先として処理することにより、前記認識対象となる言語を特定する、ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理装置である。   According to a seventh aspect of the invention, the specifying unit specifies the language to be recognized by receiving the document data transmitted by facsimile from another device and processing the source of the document data as the destination. The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.

請求項8に係る発明は、前記特定手段は、他の装置からファクシミリ送信された前記文書データを受け、前記文書データの転送先を前記宛先として処理することにより、前記認識対象となる言語を特定する、ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理装置である。   The invention according to claim 8 is characterized in that the specifying means receives the document data transmitted by facsimile from another device and processes the transfer destination of the document data as the destination, thereby specifying the language to be recognized. The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.

請求項9に係る発明は、コンピュータを、文書データにOCR処理を適用することにより文字データを生成するOCR処理手段と、前記文字データの宛先にOCR言語が対応付けられている場合、当該OCR言語を前記OCR処理において認識対象となる言語として特定する特定手段と、として機能させるプログラムである。   According to the ninth aspect of the present invention, when an OCR processing unit that generates character data by applying OCR processing to document data and an OCR language is associated with the destination of the character data, Is specified as a language to be recognized in the OCR process.

請求項1,2,9に記載の発明によると、ユーザの手間をかけることなくOCR処理において認識対象となる言語が特定される。   According to the first, second, and ninth aspects of the invention, the language to be recognized in the OCR process is specified without taking the user's trouble.

請求項3に記載の発明によると、宛先にOCR言語が対応付けられていない場合であっても、認識対象の言語が特定される。   According to the third aspect of the present invention, the language to be recognized is specified even when the OCR language is not associated with the destination.

請求項4,5に記載の発明によると、認識対象の言語の選択が容易となり得る。   According to the fourth and fifth aspects of the present invention, the language to be recognized can be easily selected.

請求項6に記載の発明によると、次回以降においては、宛先に対応付けられた言語が認識対象の言語として使用され得る。   According to the sixth aspect of the present invention, the language associated with the destination can be used as the language to be recognized from the next time onward.

請求項7,8に記載の発明によると、ファクシミリ送信された文書データに対するOCR処理に適用される言語が特定される。   According to the seventh and eighth aspects of the present invention, the language to be applied to the OCR process for the document data transmitted by facsimile is specified.

本発明の実施形態に係る画像形成システムを示すブロック図である。1 is a block diagram illustrating an image forming system according to an embodiment of the present invention. 本実施形態に係る画像形成装置を示すブロック図である。1 is a block diagram illustrating an image forming apparatus according to an exemplary embodiment. 本実施形態に係る画像形成装置による処理の一例を示すフローチャートである。5 is a flowchart illustrating an example of processing by the image forming apparatus according to the present embodiment. アドレス帳の一例を示す図である。It is a figure which shows an example of an address book. 画像形成装置の画面の一例を示す図である。3 is a diagram illustrating an example of a screen of the image forming apparatus. FIG. アドレス帳の別の例を示す図である。It is a figure which shows another example of an address book. 文字コードと言語の対応関係を説明するための図である。It is a figure for demonstrating the correspondence of a character code and a language. 画像形成装置の画面の一例を示す図である。3 is a diagram illustrating an example of a screen of the image forming apparatus. FIG.

図1には、本発明の実施形態に係る画像処理システムとしての画像形成システムの一例が示されている。画像形成システムは、情報処理装置としての画像形成装置10を含む。画像形成装置10は、ネットワーク等の通信経路Nに接続されている。また、1又は複数の端末装置(一例として、端末装置12A,12B,12C)が通信経路Nに接続されている。なお、端末装置12A,12B,12Cを区別する必要がない場合には、これらを「端末装置12」と称することとする。   FIG. 1 shows an example of an image forming system as an image processing system according to an embodiment of the present invention. The image forming system includes an image forming apparatus 10 as an information processing apparatus. The image forming apparatus 10 is connected to a communication path N such as a network. One or a plurality of terminal devices (terminal devices 12A, 12B, 12C as an example) are connected to the communication path N. In addition, when it is not necessary to distinguish terminal device 12A, 12B, 12C, these shall be called "terminal device 12".

情報処理装置としての画像形成装置10は、スキャン機能(画像読取機能)と、OCR(optical character recognition)機能と、他の装置との間でデータを送受信する機能と、を備えている。なお、画像形成装置10は、スキャン機能以外の機能として、プリンタ機能、コピー機能及びファクシミリ機能の中の少なくとも1つの機能を備えていてもよい。   The image forming apparatus 10 as an information processing apparatus includes a scan function (image reading function), an OCR (optical character recognition) function, and a function for transmitting / receiving data to / from other apparatuses. Note that the image forming apparatus 10 may include at least one of a printer function, a copy function, and a facsimile function as a function other than the scan function.

端末装置12は、PC(パーソナルコンピュータ)、タブレットPC、スマートフォン又は携帯電話等の装置であり、他の装置との間でデータを送受信する機能を備えている。   The terminal device 12 is a device such as a PC (personal computer), a tablet PC, a smartphone, or a mobile phone, and has a function of transmitting and receiving data to and from other devices.

図2には、画像形成装置10の構成が示されている。   FIG. 2 shows the configuration of the image forming apparatus 10.

通信部14は通信インターフェースであり、他の装置にデータを送信する機能、及び、他の装置からデータを受信する機能を備えている。画像読取部16はスキャナであり、原稿をスキャン(読み取る)ことにより文書データを生成する。文書データは画像データを含む概念であってもよい。   The communication unit 14 is a communication interface, and has a function of transmitting data to another device and a function of receiving data from another device. The image reading unit 16 is a scanner, and generates document data by scanning (reading) a document. The document data may be a concept including image data.

OCR処理部18は、文書データにOCR処理を適用することにより文字データを生成する。OCR処理部18は、1又は複数の認識対象言語に対応しており、設定された認識対象言語に従ってOCR処理を実行する。例えば、認識対象言語として「日本語」が設定されると、OCR処理部18は、日本語を認識対象言語としてOCR処理を実行する。本実施形態では、例えばスキャンによって文書データが生成され、その文書データにOCR処理が適用されることにより文字データが生成される。そして、文書データと文字データが、宛先として指定された端末装置12に通信部14によって送信される。   The OCR processing unit 18 generates character data by applying OCR processing to document data. The OCR processing unit 18 corresponds to one or a plurality of recognition target languages, and executes OCR processing according to the set recognition target languages. For example, when “Japanese” is set as the recognition target language, the OCR processing unit 18 executes the OCR process using Japanese as the recognition target language. In the present embodiment, for example, document data is generated by scanning, and character data is generated by applying OCR processing to the document data. Then, the communication unit 14 transmits the document data and the character data to the terminal device 12 designated as the destination.

UI部20はユーザインターフェースであり、表示部と操作部とを含む。表示部は、例えば液晶ディスプレイ等の表示装置であり、操作部は、例えば操作パネル等の入力装置である。   The UI unit 20 is a user interface and includes a display unit and an operation unit. The display unit is a display device such as a liquid crystal display, and the operation unit is an input device such as an operation panel.

記憶部22はハードディスク等の記憶装置である。記憶部22には宛先情報24が記憶されている。この宛先情報24は、データの宛先(送信先)を示す情報であり、例えば管理者等によって作成されて記憶部22に記憶される。宛先情報24には、宛先名、会社名、Fax番号、電子メールアドレス、使用されるサーバのアカウント、等の宛先に関する属性情報が含まれており、これらの属性情報が互いに対応付けられている。宛先情報24には1又は複数の宛先が含まれており、個々の宛先毎に各属性情報が登録されている。また、宛先情報24には、属性情報として、デフォルトのOCR言語を示すOCR言語情報が含まれている場合がある。デフォルトのOCR言語は、OCR処理において認識対象となるデフォルトの言語であり、認識対象言語の候補の一例であるとも言える。例えば、個々の宛先毎にデフォルトのOCR言語が対応付けられている場合がある。もちろん、宛先にデフォルトのOCR言語が対応付けられていない場合もある。なお、記憶部22には文書データ等のデータが記憶されてもよい。   The storage unit 22 is a storage device such as a hard disk. The storage unit 22 stores destination information 24. The destination information 24 is information indicating a data destination (transmission destination), and is created by, for example, an administrator and stored in the storage unit 22. The destination information 24 includes attribute information related to the destination, such as a destination name, company name, fax number, e-mail address, and server account to be used, and these attribute information are associated with each other. The destination information 24 includes one or a plurality of destinations, and each piece of attribute information is registered for each destination. Further, the destination information 24 may include OCR language information indicating a default OCR language as attribute information. The default OCR language is a default language that is a recognition target in the OCR process, and can be said to be an example of a recognition target language candidate. For example, a default OCR language may be associated with each destination. Of course, the default OCR language may not be associated with the destination. The storage unit 22 may store data such as document data.

制御部26は画像形成装置10の各部の動作を制御する。また、制御部26は、OCR言語特定部28と登録部30とを含む。   The control unit 26 controls the operation of each unit of the image forming apparatus 10. The control unit 26 includes an OCR language specifying unit 28 and a registration unit 30.

OCR言語特定部28は、OCR処理において認識対象となる言語を特定する機能を備えている。例えば、宛先情報24において、データの送信先として選択された宛先にデフォルトのOCR言語が対応付けられている場合、OCR言語特定部28は、そのデフォルトのOCR言語を認識対象言語として特定する。また、選択された宛先にデフォルトのOCR言語が対応付けられていない場合、OCR言語特定部28は、宛先情報24に含まれる属性情報に基づいて認識対象言語を推定する。このOCR言語特定部28による処理については、図2以降の図面を参照して詳しく説明する。   The OCR language specifying unit 28 has a function of specifying a language to be recognized in OCR processing. For example, in the destination information 24, when the default OCR language is associated with the destination selected as the data transmission destination, the OCR language specifying unit 28 specifies the default OCR language as the recognition target language. When the default OCR language is not associated with the selected destination, the OCR language specifying unit 28 estimates the recognition target language based on the attribute information included in the destination information 24. The processing by the OCR language specifying unit 28 will be described in detail with reference to the drawings after FIG.

登録部30は、宛先を画像形成装置10に登録する機能を備えている。例えば、UI部20を用いて宛先の各属性情報が管理者等によって入力されると、登録部30は、入力された属性情報を含む宛先情報24を記憶部22に記憶させる。また、登録部30は、デフォルトのOCR言語を宛先に登録する機能を備えている。この登録処理により、デフォルトのOCR言語を示す情報が宛先情報24に追加される。   The registration unit 30 has a function of registering a destination in the image forming apparatus 10. For example, when each attribute information of the destination is input by the administrator or the like using the UI unit 20, the registration unit 30 causes the storage unit 22 to store the destination information 24 including the input attribute information. Further, the registration unit 30 has a function of registering a default OCR language as a destination. By this registration processing, information indicating the default OCR language is added to the destination information 24.

ファクシミリ部32は、他の装置からファクシミリ送信された文書データを受信する機能、他の装置に文書データをファクシミリ送信する機能を備えている。   The facsimile unit 32 has a function of receiving document data transmitted by facsimile from another apparatus and a function of transmitting document data by facsimile to another apparatus.

次に、図3に示されているフローチャートを参照して、画像形成装置10による処理について説明する。ここでは、スキャンOCR処理が実行される場合について説明する。スキャンOCR処理が実行されると、原稿がスキャンされて文書データが生成され、その文書データにOCR処理が適用されて文字データが生成され、文書データと文字データが、宛先として指定された端末装置12に送信される。   Next, processing performed by the image forming apparatus 10 will be described with reference to the flowchart shown in FIG. Here, a case where the scan OCR process is executed will be described. When the scan OCR process is executed, the document is scanned to generate document data, the OCR process is applied to the document data to generate character data, and the terminal device in which the document data and the character data are designated as destinations 12 is transmitted.

まず、原稿が画像形成装置10にセットされ、制御部26の制御の下、UI部20に設定画面が表示される。その設定画面において、ユーザによってスキャンOCR処理機能が選択される(S01)。   First, a document is set on the image forming apparatus 10, and a setting screen is displayed on the UI unit 20 under the control of the control unit 26. On the setting screen, the scan OCR processing function is selected by the user (S01).

次に、制御部26の制御の下、設定画面にアドレス帳(宛先情報24)が表示される。そして、そのアドレス帳に含まれる複数の宛先の中から、目的の宛先がユーザによって選択される(S02)。   Next, under the control of the control unit 26, the address book (destination information 24) is displayed on the setting screen. Then, the target destination is selected by the user from the plurality of destinations included in the address book (S02).

アドレス帳(宛先情報24)において、その選択された宛先にデフォルトのOCR言語が対応付けられている場合(S03,Yes)、OCR言語特定部28は、そのデフォルトのOCR言語を、OCR処理において認識対象となる言語として特定する(S04)。特定された言語を示す情報は、例えば、認識対象言語の候補として設定画面に表示される。   When the default OCR language is associated with the selected destination in the address book (destination information 24) (S03, Yes), the OCR language specifying unit 28 recognizes the default OCR language in the OCR process. The target language is specified (S04). The information indicating the identified language is displayed on the setting screen as a recognition target language candidate, for example.

一方、宛先情報24において、その選択された宛先にデフォルトのOCR言語が対応付けられていない場合(S03,No)、OCR言語特定部28は、その宛先の属性情報(例えば、宛先名、Fax番号、電子メールアドレスのドメイン等)に基づいて、認識対象言語を推定する(S05)。OCR言語特定部28は、例えば、宛先名等に使用されている文字のコードや電子メールアドレスのドメイン等に基づいて、認識対象言語を推定する。推定された言語を示す情報は、例えば、認識対象言語の候補として設定画面に表示される。宛先の属性情報(例えば、宛先名、Fax番号、電子メールアドレスのドメイン等)は、OCR言語の特定が可能な情報に相当する。別の例として、選択された宛先に対応付けられているデフォルトのOCR言語が、OCR処理部18が対応していない言語の場合、ステップS05の処理によって認識対象言語が推定されてもよい。   On the other hand, when the default OCR language is not associated with the selected destination in the destination information 24 (S03, No), the OCR language specifying unit 28 sets the attribute information of the destination (for example, destination name, fax number). The recognition target language is estimated based on the email address domain, etc. (S05). The OCR language specifying unit 28 estimates a recognition target language based on, for example, a character code used in a destination name, a domain of an e-mail address, or the like. The information indicating the estimated language is displayed on the setting screen as a recognition target language candidate, for example. Destination attribute information (for example, destination name, fax number, domain of e-mail address, etc.) corresponds to information that can specify the OCR language. As another example, when the default OCR language associated with the selected destination is a language that the OCR processing unit 18 does not support, the recognition target language may be estimated by the process of step S05.

次に、ユーザによってスキャンOCR処理の実行が指示されると、画像読取部16によって原稿がスキャンされ、これにより文書データが生成される(S06)。そして、OCR処理部18によって文書データにOCR処理が適用され、これにより文字データが生成される(S07)。一例として、ステップS04又はS05にて特定された言語が認識対象言語として用いられてOCR処理が実行される。なお、ステップS04又はS05にて言語が特定された場合であっても、その特定された言語以外の言語がユーザによって認識対象言語として指定されてもよい。この場合、ユーザによって指定された言語が認識対象言語として用いられてOCR処理が実行される。次に、文書データと文字データが、宛先として指定された端末装置12に送信される(S08)。なお、文字データのみが宛先に送信されてもよいし、文書データのみが送信されてもよい。   Next, when the execution of the scan OCR process is instructed by the user, the document is scanned by the image reading unit 16, thereby generating document data (S06). Then, the OCR processing unit 18 applies the OCR processing to the document data, thereby generating character data (S07). As an example, the OCR process is executed using the language specified in step S04 or S05 as the recognition target language. Even when the language is specified in step S04 or S05, a language other than the specified language may be designated as a recognition target language by the user. In this case, the OCR process is executed using the language designated by the user as the recognition target language. Next, the document data and the character data are transmitted to the terminal device 12 designated as the destination (S08). Only character data may be transmitted to the destination, or only document data may be transmitted.

以上のように、本実施形態では、選択された宛先にデフォルトのOCR言語が対応付けられている場合、そのデフォルトのOCR言語が認識対象言語の候補として特定され、ユーザに提示される。また、選択された宛先にデフォルトのOCR言語が対応付けられていない場合、その宛先の属性情報から認識対象言語の候補が推定され、ユーザに提示される。このように、宛先が選択されることに応じて、認識対象言語が自動的に特定されることになる。また、特定された認識対象言語を用いてOCR処理が実行された場合、ユーザは認識対象言語を選択せずに済むため、ユーザの手間が軽減される。   As described above, in the present embodiment, when the default OCR language is associated with the selected destination, the default OCR language is specified as a recognition target language candidate and presented to the user. If the default OCR language is not associated with the selected destination, a recognition target language candidate is estimated from the attribute information of the destination and presented to the user. In this way, the recognition target language is automatically specified in accordance with the selection of the destination. In addition, when the OCR process is executed using the identified recognition target language, the user does not have to select the recognition target language, so that the user's effort is reduced.

以下、具体的な実施例について説明する。   Specific examples will be described below.

(実施例1)
図4,5を参照して実施例1について説明する。実施例1においては、データの送信先として選択された宛先にデフォルトのOCR言語が対応付けられているものとする。
Example 1
Example 1 will be described with reference to FIGS. In the first embodiment, it is assumed that a default OCR language is associated with a destination selected as a data transmission destination.

図4には、宛先情報24の一例としてのアドレス帳が示されている。このアドレス帳には、宛先名(宛先の氏名)、姓、名、会社名(宛先の人物が所属する会社の名称)、Fax番号、電子メールアドレス、使用されるサーバのアカウント、OCR言語、等の宛先に関する属性情報が含まれており、これらの属性情報が互いに対応付けられている。各属性情報は、例えば管理者等によって予め画像形成装置10に登録される。例えば、UI部20に宛先登録画面が表示され、管理者等は、その宛先登録画面上にて宛先毎の各属性情報を入力する。登録部30は、入力された情報を宛先情報24として記憶部22に記憶させる。アドレス帳(宛先情報24)には1又は複数の宛先が含まれており、個々の宛先毎に各属性情報が登録されている。図4に示されている宛先には、OCR言語(一例として日本語)を示すOCR言語情報が対応付けられている。このOCR言語は、OCR処理に用いられるデフォルトの言語である。このOCR言語情報は、管理者等によって予め登録された情報である。例えば、個々の宛先毎にOCR言語が設定され、各宛先にOCR言語情報が対応付けられている。もちろん、宛先にOCR言語情報が対応付けられていない場合もある。なお、アドレス帳においては、同一人物に対して複数の宛先が登録されていてもよい。この場合、個々の宛先毎に同一又は異なるデフォルトのOCR言語が対応付けられていてもよいし、一部の宛先にデフォルトのOCR言語が対応付けられていてもよい。   FIG. 4 shows an address book as an example of the destination information 24. The address book includes a destination name (name of the destination), a surname, a first name, a company name (name of the company to which the destination person belongs), a fax number, an e-mail address, a server account used, an OCR language, and the like. Attribute information relating to the destination of the destination is included, and these attribute information are associated with each other. Each attribute information is registered in the image forming apparatus 10 in advance by, for example, an administrator. For example, a destination registration screen is displayed on the UI unit 20, and an administrator or the like inputs each piece of attribute information for each destination on the destination registration screen. The registration unit 30 stores the input information as destination information 24 in the storage unit 22. The address book (destination information 24) includes one or a plurality of destinations, and each piece of attribute information is registered for each destination. The destination shown in FIG. 4 is associated with OCR language information indicating the OCR language (Japanese as an example). This OCR language is a default language used for OCR processing. This OCR language information is information registered in advance by an administrator or the like. For example, an OCR language is set for each destination, and OCR language information is associated with each destination. Of course, OCR language information may not be associated with the destination. In the address book, a plurality of destinations may be registered for the same person. In this case, the same or different default OCR language may be associated with each destination, or the default OCR language may be associated with some of the destinations.

図5には、UI部20に表示される画面の一例が示されている。例えば、上記のステップS01にてスキャンOCR処理機能がユーザによって選択されると、設定画面がUI部20に表示される。図5の(A)には、デフォルトの設定画面の一例が示されている。この設定画面には、制御部26の制御の下、一例として、宛先欄、解像度欄、用紙サイズ欄、文書データのフォーマット欄、カラーモード欄、圧縮率欄、及び、OCR処理欄、等が表示される。宛先欄は、データの送信先である宛先を入力するための欄である。例えば、ユーザがUI部20を使用して「アドレス帳ボタン」を押下すると、制御部26によって、アドレス帳(宛先情報24)に登録されている宛先の一覧が設定画面に表示される。その一覧の中から選択された宛先が、データの送信先として設定される。もちろん、アドレス帳からではなく、ユーザによって宛先が直接入力されてもよい。解像度、用紙サイズ、フォーマット、カラーモード、及び、圧縮率は、スキャン処理条件である。デフォルトの設定画面には、デフォルトのスキャン処理条件を示す情報が表示されており、この条件はユーザによって変更されてもよい。スキャン処理条件の欄に入力された条件に従ってスキャンが実行される。OCR処理欄は、ユーザがOCR処理の実行又は不実行を選択するための欄であるとともに、ユーザが認識対象言語を選択するための欄である。例えばユーザによってOCR処理欄が指定されると、制御部26によって、OCR処理部18が対応している認識対象言語の一覧が設定画面に表示される。その一覧の中から選択された言語が、認識対象言語としてOCR処理部18に設定される。なお、デフォルトの状態では、OCR処理は不実行(OCR処理は「しない」)に設定されている。OCR処理を文書データに適用する場合には、ユーザがOCR処理欄を指定し、OCR処理を実行(OCR処理を「する」)に設定する。これにより、OCR処理が文書データに適用されることになる。   FIG. 5 shows an example of a screen displayed on the UI unit 20. For example, when the scan OCR processing function is selected by the user in step S01, a setting screen is displayed on the UI unit 20. FIG. 5A shows an example of a default setting screen. For example, a destination field, a resolution field, a paper size field, a document data format field, a color mode field, a compression rate field, and an OCR processing field are displayed on the setting screen under the control of the control unit 26. Is done. The destination column is a column for inputting a destination which is a data transmission destination. For example, when the user presses the “address book button” using the UI unit 20, the control unit 26 displays a list of destinations registered in the address book (destination information 24) on the setting screen. A destination selected from the list is set as a data transmission destination. Of course, the destination may be directly input by the user, not from the address book. The resolution, paper size, format, color mode, and compression rate are scan processing conditions. Information indicating default scan processing conditions is displayed on the default setting screen, and the conditions may be changed by the user. Scanning is executed in accordance with the conditions entered in the column of scan processing conditions. The OCR processing column is a column for the user to select execution or non-execution of the OCR processing, and a column for the user to select a recognition target language. For example, when the OCR processing column is designated by the user, the control unit 26 displays a list of recognition target languages supported by the OCR processing unit 18 on the setting screen. The language selected from the list is set in the OCR processing unit 18 as a recognition target language. In the default state, the OCR process is set to non-execution (the OCR process is “not performed”). When the OCR process is applied to the document data, the user designates the OCR process field and sets the OCR process to be executed (OCR process is “executed”). Thereby, the OCR process is applied to the document data.

図5の(B)には、宛先選択後の設定画面の一例が示されている。例えば、図4に示されている宛先がユーザによって選択されると、その宛先名(例えば「富士たろう」)が設定画面に表示される。その宛先にはデフォルトのOCR言語が対応付けられている。この場合、OCR言語特定部28によって、その宛先に対応付けられているデフォルトのOCR言語が認識対象言語として特定され、そのOCR言語を示す情報がOCR処理欄に表示される。デフォルトのOCR言語は認識対象言語の候補であり、OCR処理欄にはその候補を示す情報が表示される。図4に示されている宛先には、デフォルトのOCR言語として「日本語」が対応付けられているため、「日本語」が認識対象言語として特定され、OCR処理欄には文字列「日本語」が表示される。この段階でスキャン実行ボタン(Scan実行ボタン)がユーザによって押下されると、画像読取部16によって、スキャン処理条件の欄に入力された条件に従ってスキャンが実行され、これにより文書データが生成される。そして、OCR処理部18によって、その文書データに対してOCR処理が適用され、これより文字データが生成される。このとき、OCR処理欄で指定されたOCR言語が認識対象言語として用いられる。OCR処理欄にデフォルトのOCR言語が表示されている場合、そのデフォルトのOCR言語(例えば日本語)が認識対象言語として用いられてOCR処理が実行される。文字データが生成されると、文書データと文字データが、通信部14によって、宛先(例えば特定の端末装置12)に送信される。   FIG. 5B shows an example of a setting screen after selecting a destination. For example, when the destination shown in FIG. 4 is selected by the user, the destination name (for example, “Fuji Taro”) is displayed on the setting screen. A default OCR language is associated with the destination. In this case, the OCR language specifying unit 28 specifies the default OCR language associated with the destination as the recognition target language, and information indicating the OCR language is displayed in the OCR processing column. The default OCR language is a recognition target language candidate, and information indicating the candidate is displayed in the OCR processing column. Since “Japanese” is associated with the destination shown in FIG. 4 as the default OCR language, “Japanese” is identified as the recognition target language, and the character string “Japanese” is displayed in the OCR processing column. Is displayed. When a scan execution button (Scan execution button) is pressed by the user at this stage, the image reading unit 16 executes a scan according to the conditions input in the scan processing condition column, thereby generating document data. Then, the OCR processing unit 18 applies OCR processing to the document data, thereby generating character data. At this time, the OCR language specified in the OCR processing column is used as the recognition target language. When the default OCR language is displayed in the OCR processing column, the default OCR language (for example, Japanese) is used as the recognition target language, and the OCR processing is executed. When the character data is generated, the document data and the character data are transmitted to the destination (for example, a specific terminal device 12) by the communication unit 14.

以上のように、実施例1においては、宛先にデフォルトのOCR言語が対応付けられており、そのデフォルトのOCR言語が、認識対象言語の候補として特定されてユーザに提示される。宛先に対応付けられているOCR言語は、その宛先にて使用される言語であると推定される。それ故、その宛先に対応付けられているOCR言語を認識対象言語の候補として提示することにより、宛先にて使用されると想定される言語、つまり宛先の環境に適していると推定されるOCR言語が、認識対象言語の候補としてユーザに提示される。すなわち、宛先に送信されるデータに適していると推定されるOCR言語が、ユーザに提示される。また、デフォルトのOCR言語を用いてOCR処理が実行された場合、ユーザは認識対象言語を選択せずに済むため、ユーザの手間が軽減される。   As described above, in the first embodiment, the default OCR language is associated with the destination, and the default OCR language is specified as a recognition target language candidate and presented to the user. The OCR language associated with the destination is presumed to be a language used at the destination. Therefore, by presenting the OCR language associated with the destination as a recognition target language candidate, the OCR that is assumed to be suitable for the language assumed to be used at the destination, that is, the destination environment. The language is presented to the user as a recognition target language candidate. That is, the OCR language presumed to be suitable for the data transmitted to the destination is presented to the user. In addition, when the OCR process is executed using the default OCR language, the user does not have to select a recognition target language, so that the user's trouble is reduced.

(実施例2)
次に、実施例2について説明する。実施例2においては、デフォルトのOCR言語とは別の言語が認識対象言語として設定される。まず、上記の実施例1で説明したように、デフォルトのOCR言語(例えば「日本語」)が特定される。この場合において、認識対象言語がユーザによって変更される。例えば、図5の(A)、(B)に示されている「OCR処理欄」がユーザによって指定されると、OCR処理部18が対応している認識対象言語の一覧が設定画面に表示される。その一覧の中からユーザによって認識対象言語が選択された場合、その選択された認識対象言語を用いてOCR処理が実行される。例えば、認識対象言語の一覧の中に、「英語」、「フランス語」、「ドイツ語」、「ベトナム語」、「ロシア語」、等の言語が含まれており、それらの中から「英語」が選択されたものとする。この場合、「英語」が認識対象言語であり、その認識対象言語を用いてOCR処理が実行される。
(Example 2)
Next, Example 2 will be described. In the second embodiment, a language different from the default OCR language is set as the recognition target language. First, as described in the first embodiment, a default OCR language (for example, “Japanese”) is specified. In this case, the recognition target language is changed by the user. For example, when the “OCR processing column” shown in FIGS. 5A and 5B is designated by the user, a list of recognition target languages supported by the OCR processing unit 18 is displayed on the setting screen. The When a recognition target language is selected from the list by the user, the OCR process is executed using the selected recognition target language. For example, the list of languages to be recognized includes languages such as “English”, “French”, “German”, “Vietnamese”, “Russian”, etc., among which “English” Is selected. In this case, “English” is the recognition target language, and the OCR process is executed using the recognition target language.

ユーザによって認識対象言語がデフォルトのOCR言語から他の言語に変更された場合、登録部30は、変更後の言語を、選択された宛先の新たなデフォルトOCR言語として登録してもよい。つまり、選択された宛先に対応付けられているデフォルトのOCR言語が、ユーザによって選択された言語に変更される。この場合、次回以降の処理において、新たなデフォルトのOCR言語が用いられる。   When the recognition target language is changed from the default OCR language to another language by the user, the registration unit 30 may register the changed language as a new default OCR language of the selected destination. That is, the default OCR language associated with the selected destination is changed to the language selected by the user. In this case, a new default OCR language is used in the subsequent processing.

別の例として、ユーザによって選択された言語をデフォルトのOCR言語として登録するか否かを、ユーザに確認するようにしてもよい。例えば、ユーザがUI部20を利用して登録指示を与えると、デフォルトのOCR言語が、ユーザによって選択された言語に変更される。一方、ユーザによって登録指示が与えられない場合、デフォルトのOCR言語は変更されない。   As another example, the user may confirm whether or not to register the language selected by the user as the default OCR language. For example, when the user gives a registration instruction using the UI unit 20, the default OCR language is changed to the language selected by the user. On the other hand, when the registration instruction is not given by the user, the default OCR language is not changed.

(実施例3)
次に、実施例3について説明する。実施例3では、宛先の指定よりも先にOCR言語が指定されるものとする。例えば、図5の(A)、(B)に示されている「OCR処理欄」がユーザによって指定され、OCR処理が実行(OCR処理を「する」)に設定され、認識対象言語が指定される。別の例として、OCR言語特定部28は、UI部20に表示されている画面に用いられている言語を、認識対象言語として特定してもよい。例えば、画面に用いられている言語が「日本語」である場合、「日本語」が認識対象言語として特定される。ユーザによって指定された言語又は画面の言語を示す情報が、OCR処理欄に表示される。次に、アドレス帳(宛先情報24)から特定の宛先がユーザによって選択された場合、OCR言語特定部28は、以下の処理を実行する。つまり、OCR処理が実行(OCR処理を「する」)に設定されており、かつ、ユーザによって選択された宛先に対応付けられているデフォルトのOCR言語が、OCR処理欄に表示されているOCR言語(既に選択されている言語)と異なっている場合、OCR言語特定部28は、確認情報を設定画面に表示させる。例えば、宛先に対応付けられているデフォルトのOCR言語を認識対象言語として使用するか否かをユーザに確認するための確認情報が、ポップアップ等の態様で設定画面に表示される。ユーザによってデフォルトのOCR言語が選択された場合には、デフォルトのOCR言語が認識対象言語として設定され、それ以外の言語(例えば既に選択されている言語や新たに選択された言語等)が選択された場合、それ以外の言語が認識対象言語として設定される。そして、スキャン実行がユーザによって指定されると、上記のようにして設定されたOCR言語によるOCR処理が実行される。
(Example 3)
Next, Example 3 will be described. In the third embodiment, it is assumed that the OCR language is specified before the destination is specified. For example, the “OCR processing column” shown in FIGS. 5A and 5B is designated by the user, the OCR processing is set to execute (OCR processing is “performed”), and the recognition target language is designated. The As another example, the OCR language specifying unit 28 may specify the language used in the screen displayed on the UI unit 20 as the recognition target language. For example, when the language used for the screen is “Japanese”, “Japanese” is specified as the recognition target language. Information indicating the language specified by the user or the language of the screen is displayed in the OCR processing column. Next, when a specific destination is selected by the user from the address book (destination information 24), the OCR language specifying unit 28 executes the following processing. In other words, the OCR process is set to execute (“Perform OCR process”), and the default OCR language associated with the destination selected by the user is the OCR language displayed in the OCR process column. If it is different from (already selected language), the OCR language specifying unit 28 displays confirmation information on the setting screen. For example, confirmation information for confirming to the user whether or not to use the default OCR language associated with the destination as the recognition target language is displayed on the setting screen in a form such as a pop-up. When the default OCR language is selected by the user, the default OCR language is set as a recognition target language, and other languages (for example, a language already selected, a newly selected language, etc.) are selected. In other cases, other languages are set as recognition target languages. When the scan execution is designated by the user, the OCR process in the OCR language set as described above is executed.

(実施例4)
次に、図6から図8を参照して実施例4について説明する。実施例4では、データの送信先として選択された宛先にデフォルトのOCR言語が対応付けられていないものとする。
Example 4
Next, Embodiment 4 will be described with reference to FIGS. In the fourth embodiment, it is assumed that the default OCR language is not associated with the destination selected as the data transmission destination.

図6には、宛先情報24の一例としてのアドレス帳が示されている。このアドレス帳には、図4に示されているアドレス帳と異なり、OCR言語情報が含まれていない。つまり、このアドレス帳に示されている宛先には、デフォルトのOCR言語が設定されていないことになる。OCR言語情報以外の属性情報は、図4に示されている情報と同種の情報である。このように、宛先情報24に含まれる1又は複数の宛先の中には、デフォルトのOCR言語が設定されている宛先が含まれている場合もあれば、デフォルトのOCRが設定されていない宛先が含まれている場合もある。もちろん、全ての宛先にデフォルトのOCR言語が設定されていてもよいし、全ての宛先においてデフォルトのOCR言語が設定されていなくてもよい。   FIG. 6 shows an address book as an example of the destination information 24. Unlike the address book shown in FIG. 4, this address book does not include OCR language information. That is, the default OCR language is not set for the destination indicated in the address book. The attribute information other than the OCR language information is the same type of information as that shown in FIG. As described above, one or a plurality of destinations included in the destination information 24 may include a destination for which a default OCR language is set, or a destination for which a default OCR is not set. May be included. Of course, the default OCR language may be set for all destinations, or the default OCR language may not be set for all destinations.

ユーザによって選択された宛先にデフォルトのOCR言語が対応付けられていない場合、OCR言語特定部28は、当該宛先の属性情報に基づいて認識対象言語を推定する。具体的には、以下に示す処理1〜3のいずれかの処理によって認識対象言語が推定される。   When the default OCR language is not associated with the destination selected by the user, the OCR language specifying unit 28 estimates the recognition target language based on the attribute information of the destination. Specifically, the recognition target language is estimated by any one of processes 1 to 3 described below.

(処理1)
処理1では、OCR言語特定部28は、当該宛先の属性である「宛先名」、「姓」、「名」、「会社名」に使用されてる言語の文字コード(文字バイト情報)を特定し、その文字コードに基づいて認識対象言語を特定する。図7には、文字コードテーブルの一例が示されている。その文字コードテーブルにおいては、文字コードと言語との対応関係が示されている。この文字コードテーブルは予め作成されて、画像形成装置10の記憶部22に予め記憶されている。OCR言語特定部28は、その文字コードテーブルを参照することにより、宛先の属性に使用されている言語を特定し、その言語を認識対象言語として特定する。図6に示す例では、「宛先名」、「姓」及び「名」に使用されている言語は全て日本語であるため、「日本語」が認識対象言語として特定される。特定された言語を示す情報は、認識対象言語の候補として設定画面に表示される。そして、スキャンOCR処理の実行が指示されると、特定された言語が認識対象言語として用いられてOCR処理が実行される。もちろん、ユーザによって、特定された言語以外の言語が認識対象言語として選択されてもよい。
(Process 1)
In the process 1, the OCR language specifying unit 28 specifies the character code (character byte information) of the language used for the “destination name”, “last name”, “first name”, and “company name” as the attributes of the destination The recognition target language is specified based on the character code. FIG. 7 shows an example of a character code table. In the character code table, the correspondence between the character code and the language is shown. This character code table is created in advance and stored in advance in the storage unit 22 of the image forming apparatus 10. The OCR language specifying unit 28 specifies the language used for the destination attribute by referring to the character code table, and specifies the language as the recognition target language. In the example shown in FIG. 6, since the languages used for “destination name”, “last name”, and “first name” are all Japanese, “Japanese” is specified as the recognition target language. Information indicating the identified language is displayed on the setting screen as a recognition target language candidate. When the execution of the scan OCR process is instructed, the specified language is used as the recognition target language, and the OCR process is executed. Of course, a language other than the specified language may be selected as a recognition target language by the user.

(処理2)
上記の処理1において、属性「宛先名」、「姓」、「名」、「会社名」から複数の言語が特定される場合、処理2が実行される。例えば、「宛先名」に使用されている言語が「日本語」であり、「会社名」に使用されている言語が「英語」である場合、「日本語」と「英語」が、認識対象言語の候補として特定されることになる。この場合、優先表示条件に基づく優先順位に従って、特定された各言語を示す情報が、認識対象言語の候補として設定画面に表示される。例えば、認識対象言語の表示順位を示す言語テーブルが予め作成されて記憶部22に記憶されている。この言語テーブルに登録されている認識対象言語は、OCR処理部18が対応している言語である。制御部26は、特定された複数の言語を、言語テーブルが示す表示順位に従って設定画面に表示させる。例えば、言語テーブルにおいて、1番に「英語」、2番に「フランス語」、3番に「ドイツ語」、4番に「中国語」、5番に「日本語」が割り当てられているものとする。この言語テーブルに従うと、設定画面には、「英語」、「フランス語」、「ドイツ語」、「中国語」、「日本語」の順番で、各言語を示す情報が認識対象言語の候補として表示される。例えば、「英語」を示す情報が最上位に表示され、その他の言語を示す情報が表示順位に従って表示される。制御部26は、宛先の属性情報から特定された言語に応じて、言語テーブルに示されている表示順位を変更する。例えば、制御部26は、宛先の属性情報から特定された言語を上位に表示するよう制御し、特定されなかった言語を下位に表示するよう制御する。具体例を挙げて説明すると、属性「宛先名」に使用されている言語が「日本語」であり、属性「会社名」に使用されている言語が「英語」である場合、制御部26は、表示順位として、1番に「英語」、2番に「日本語」、3番に「フランス語」、4番に「ドイツ語」、5番に「中国語」を割り当てる。これにより、設定画面には、「英語」、「日本語」、「フランス語」、「ドイツ語」、「中国語」の順番で、各言語を示す情報が認識対象言語の候補として表示される。その結果、元々は5番目に表示されるはずであった「日本語」が2番目に表示され、属性情報から特定されなかった言語がより下位に表示されることになる。
(Process 2)
If a plurality of languages are identified from the attributes “destination name”, “last name”, “first name”, and “company name” in the above process 1, process 2 is executed. For example, if the language used for "Destination Name" is "Japanese" and the language used for "Company Name" is "English", "Japanese" and "English" will be recognized It will be identified as a language candidate. In this case, information indicating each identified language is displayed on the setting screen as a recognition target language candidate in accordance with the priority order based on the priority display condition. For example, a language table indicating the display order of recognition target languages is created in advance and stored in the storage unit 22. The recognition target language registered in the language table is a language supported by the OCR processing unit 18. The control unit 26 displays the specified plurality of languages on the setting screen according to the display order indicated by the language table. For example, in the language table, “English” is assigned to No. 1, “French” to No. 2, “German” to No. 3, “Chinese” to No. 4, “Japanese” to No. 5 To do. According to this language table, the setting screen displays information indicating each language as a candidate for recognition language in the order of “English”, “French”, “German”, “Chinese”, “Japanese”. Is done. For example, information indicating “English” is displayed at the top, and information indicating other languages is displayed according to the display order. The control unit 26 changes the display order shown in the language table in accordance with the language specified from the destination attribute information. For example, the control unit 26 performs control so that the language specified from the attribute information of the destination is displayed at the upper level, and displays the language not specified at the lower level. To explain with a specific example, when the language used for the attribute “destination name” is “Japanese” and the language used for the attribute “company name” is “English”, the control unit 26 As the display order, “English” is assigned to No. 1, “Japanese” to No. 2, “French” to No. 3, “German” to No. 4, and “Chinese” to No. 5. As a result, information indicating each language is displayed as a recognition target language candidate in the order of “English”, “Japanese”, “French”, “German”, and “Chinese” on the setting screen. As a result, “Japanese”, which should have been displayed fifth, is displayed second, and the language not specified from the attribute information is displayed lower.

処理2の別の例として、特定された言語が使用されている属性の数に応じて表示順位を変更してもよい。例えば、属性の数が多いほど、当該言語の表示順位を上位に表示する。具体例を挙げて説明すると、属性「宛先名」、「姓」、「名」に使用されている言語が「日本語」であり、「会社名」に使用されている言語が「英語」であるとする。つまり、「日本語」が3つの属性にて使用されており、「英語」が1つの属性に使用されている。この場合、制御部26は、表示順位として、1番目に「日本語」、2番目に「英語」、3番目に「フランス語」、4番目に「ドイツ語」、5番目に「中国語」を割り当てる。これにより、設定画面には、「日本語」が最上位に表示される。別の例として、言語テーブルに含まれている言語群の中で、OCR言語特定部28によって特定された言語のみが、認識対象言語の候補として表示されてもよい。上記の例では、「日本語」と「英語」を示す情報が認識対象言語の候補として表示され、「フランス語」、「ドイツ語」及び「中国語」を示す情報は表示されない。   As another example of the process 2, the display order may be changed according to the number of attributes in which the specified language is used. For example, the higher the number of attributes, the higher the display order of the language. For example, the language used for the attributes “destination name”, “last name”, and “first name” is “Japanese”, and the language used for “company name” is “English”. Suppose there is. That is, “Japanese” is used for three attributes, and “English” is used for one attribute. In this case, the control unit 26 displays “Japanese” first, “English” second, “French” third, “German” fourth, “Chinese” fifth, and “Chinese” fifth. assign. As a result, “Japanese” is displayed at the top on the setting screen. As another example, only the language specified by the OCR language specifying unit 28 in the language group included in the language table may be displayed as a recognition target language candidate. In the above example, information indicating “Japanese” and “English” is displayed as a recognition target language candidate, and information indicating “French”, “German”, and “Chinese” is not displayed.

なお、宛先の属性情報から1つの言語が認識対象言語として特定された場合も、その言語が優先的に表示されるようにしてもよい。例えば、上述したように言語テーブルに示されている表示順位が変更され、複数の言語の中で、その特定された1つの言語を示す情報が最上位に表示されてもよい。具体例を挙げて説明すると、「日本語」のみが認識対象言語として特定された場合、「日本語」を示す情報が最上位に表示され、他の言語を示す情報が下位に表示される。   Even when one language is specified as a recognition target language from the attribute information of the destination, the language may be displayed with priority. For example, as described above, the display order shown in the language table may be changed, and information indicating one specified language may be displayed at the top of the plurality of languages. To explain with a specific example, when only “Japanese” is specified as the recognition target language, information indicating “Japanese” is displayed at the top and information indicating other languages is displayed at the lower level.

(処理3)
処理3では、OCR言語特定部28は、宛先の属性情報として登録されている「電子メールアドレス」のドメインやサーバのドメインに基づいて、認識対象言語を推定する。例えば、ドメインの文字列と言語との対応関係を示すドメインテーブルが予め作成されて記憶部22に記憶される。OCR言語特定部28は、そのドメインテーブルを参照することにより、登録されている電子メールアドレスやサーバのドメインに対応する言語を、認識対象言語として特定する。具体例を挙げて説明すると、電子メールアドレスのドメインに「.jp」が含まれている場合、「日本語」が認識対象言語として特定される。また、ドメインに「.cn」が含まれている場合、「中国語」が認識対象言語として特定され、ドメインに「.ru」が含まれている場合、「キリル文字」が認識対象言語として特定される。特定された言語を示す情報は、認識対象言語の候補として設定画面に表示される。また、Fax番号として国際番号が使用されている場合には、Fax番号から言語が特定されてもよい。
(Process 3)
In the process 3, the OCR language specifying unit 28 estimates the recognition target language based on the domain of the “e-mail address” or the domain of the server registered as the destination attribute information. For example, a domain table indicating a correspondence relationship between a domain character string and a language is created in advance and stored in the storage unit 22. The OCR language specifying unit 28 specifies a language corresponding to a registered electronic mail address or server domain as a recognition target language by referring to the domain table. To explain with a specific example, when “.jp” is included in the domain of the e-mail address, “Japanese” is specified as the recognition target language. In addition, when “.cn” is included in the domain, “Chinese” is specified as the recognition target language, and when “.ru” is included in the domain, “Cyrillic” is specified as the recognition target language. Is done. Information indicating the identified language is displayed on the setting screen as a recognition target language candidate. When an international number is used as the fax number, the language may be specified from the fax number.

例えば、宛先の属性として「宛先名」、「姓」、「名」、「会社名」が登録されていない場合に、処理3が実行される。もちろん、これらが登録されている場合であっても、処理3が実行されてもよい。処理3によって複数の言語が特定された場合には、上記の処理2に従って、各言語を示す情報が優先順位に従って表示されてもよい。また、処理3によって1つの言語のみが特定された場合であっても、その言語を示す情報が上位に表示され、他の言語を示す情報が下位に表示されてもよい。   For example, when “destination name”, “last name”, “first name”, and “company name” are not registered as the attributes of the destination, the process 3 is executed. Of course, even if these are registered, the process 3 may be executed. When a plurality of languages are specified by the process 3, information indicating each language may be displayed according to the priority order according to the process 2. Further, even when only one language is specified by the process 3, the information indicating the language may be displayed at the upper level and the information indicating the other language may be displayed at the lower level.

以下、実施例4について更に詳しく説明する。図8には、UI部20に表示される画面の一例が示されている。例えば、上記のステップS01にてスキャンOCR処理機能がユーザによって選択されると、設定画面がUI部20に表示される。図8の(A)には、デフォルトの設定画面の一例が示されている。この設定画面は、図5の(A)に示されている画面と同じ画面である。例えば、ユーザがUI部20を使用して「アドレス帳ボタン」を押下すると、制御部26によって、アドレス帳(宛先情報24)に登録されている宛先の一覧が設定画面に表示される。その一覧の中から選択された宛先が、データの送信先として設定される。また、ユーザによってOCR処理欄が指定されると、制御部26によって、OCR処理部18が対応している認識対象言語の一覧が設定画面に表示される。例えば、上述した言語テーブルに登録されている認識対象言語の一覧が表示される。その一覧の中から選択された言語が、認識対象言語としてOCR処理部18に設定される。OCR処理を文書データに適用する場合、ユーザがOCR処理欄を指定し、OCR処理を実行(OCR処理を「する」)に設定する。これにより、OCR処理が文書データに適用されることになる。   Hereinafter, Example 4 will be described in more detail. FIG. 8 shows an example of a screen displayed on the UI unit 20. For example, when the scan OCR processing function is selected by the user in step S01, a setting screen is displayed on the UI unit 20. FIG. 8A shows an example of a default setting screen. This setting screen is the same screen as the screen shown in FIG. For example, when the user presses the “address book button” using the UI unit 20, the control unit 26 displays a list of destinations registered in the address book (destination information 24) on the setting screen. A destination selected from the list is set as a data transmission destination. When the OCR processing field is designated by the user, the control unit 26 displays a list of recognition target languages supported by the OCR processing unit 18 on the setting screen. For example, a list of recognition target languages registered in the language table described above is displayed. The language selected from the list is set in the OCR processing unit 18 as a recognition target language. When applying the OCR process to document data, the user designates the OCR process field and sets the OCR process to be executed (OCR process is “executed”). Thereby, the OCR process is applied to the document data.

図8の(B)には、宛先選択後の設定画面の一例が示されている。例えば、図6に示されている宛先がユーザによって選択されると、その宛先名(例えば「富士たろう」)が設定画面に表示される。その宛先にはデフォルトのOCR言語が対応付けられていない。この場合、上記の処理1〜3が実行されることになる。例えば処理1,3の結果として、「宛先名」や「電子メールアドレス」等から1つの言語が認識対象言語として特定された場合、その特定された言語を示す情報が、認識対象言語の候補としてOCR処理欄に表示される。また、複数の言語が認識対象言語として特定された場合、処理2の結果として、各言語を示す情報が優先順位に従って表示される。図8の(B)には、複数の認識対象言語の候補が表示されている。これらは、処理2による優先順位に従って表示されている。例えば、1番目に「日本語」が表示され、2番目に「中国語」が表示され、3番目に「英語」が表示され、4番目に「フランス語」が表示されている。複数の候補の中からユーザによって特定の認識対象言語が選択されると、その選択された認識対象言語がOCR処理部18に設定される。そして、ユーザによってスキャン実行ボタンが押下されると、画像読取部16によってスキャンが実行され、これにより文書データが生成される。そして、OCR処理部18によって、その文書データに対してOCR処理が適用され、これにより文字データが生成される。このとき、OCR処理欄で指定されたOCR言語が認識対象言語として用いられる。文字データが生成されると、文書データと文字データが、通信部14によって、宛先(例えば特定の端末装置12)に送信される。   FIG. 8B shows an example of a setting screen after selecting a destination. For example, when the destination shown in FIG. 6 is selected by the user, the destination name (for example, “Fuji Taro”) is displayed on the setting screen. The destination is not associated with a default OCR language. In this case, the above processes 1 to 3 are executed. For example, when one language is identified as a recognition target language from “destination name”, “e-mail address”, or the like as a result of processes 1 and 3, information indicating the identified language is used as a recognition target language candidate. Displayed in the OCR processing column. Further, when a plurality of languages are specified as recognition target languages, information indicating each language is displayed according to the priority order as a result of the process 2. In FIG. 8B, a plurality of recognition target language candidates are displayed. These are displayed according to the priority order by the process 2. For example, “Japanese” is displayed first, “Chinese” is displayed second, “English” is displayed third, “French” is displayed fourth, and so forth. When a specific recognition target language is selected by the user from a plurality of candidates, the selected recognition target language is set in the OCR processing unit 18. When the scan execution button is pressed by the user, the image reading unit 16 performs a scan, thereby generating document data. Then, the OCR processing unit 18 applies OCR processing to the document data, thereby generating character data. At this time, the OCR language specified in the OCR processing column is used as the recognition target language. When the character data is generated, the document data and the character data are transmitted to the destination (for example, a specific terminal device 12) by the communication unit 14.

また、登録部30は、上記のOCR処理にて利用された言語を、選択された宛先のデフォルトのOCR言語として登録してもよい。この場合、宛先の属性情報に、その言語を示す情報が追加される。別の例として、上記のOCR処理にて利用された言語をデフォルトのOCR言語として登録するか否かを、ユーザに確認するようにしてもよい。例えば、ユーザがUI部20を利用して登録指示を与えると、OCR処理にて利用された言語が、選択された宛先のデフォルトのOCR言語として登録される。一方、ユーザによって登録指示が与えられない場合、OCR処理にて利用された言語は、デフォルトのOCR言語として登録されない。   Further, the registration unit 30 may register the language used in the OCR process as the default OCR language of the selected destination. In this case, information indicating the language is added to the destination attribute information. As another example, the user may confirm whether or not to register the language used in the OCR process as the default OCR language. For example, when the user gives a registration instruction using the UI unit 20, the language used in the OCR process is registered as the default OCR language of the selected destination. On the other hand, when the registration instruction is not given by the user, the language used in the OCR process is not registered as the default OCR language.

以上のように、実施例4によると、宛先にデフォルトのOCR言語が対応付けられていない場合、宛先の属性情報から認識対象言語の候補が特定されてユーザに提示される。宛先名やドメイン等から特定される言語は、その宛先にて使用される言語であると推定される。それ故、その宛先の属性情報から特定された言語を示す情報を優先的に提示することにより、宛先にて使用されると想定される言語、つまり宛先の環境に適していると推定されるOCR言語が、優先的にユーザに提示される。すなわち、宛先に送信されるデータに適していると推定されるOCR言語が、優先的にユーザに提示される。例えば、「宛先名」や「姓」等の属性に日本語が使用されている場合、その宛先に送信されるデータには日本語が使用されていると推定され、OCR言語として日本語が適していると推定される。それ故、宛先の属性情報から特定された言語を認識対象言語の候補として提示することにより、宛先に送信されるデータに適していると推定されるOCR言語(例えば「日本語」)が、優先的に提示される。また、特定された言語を用いてOCR処理が実行された場合、ユーザは認識対象言語を選択せずに済むため、ユーザの手間が軽減される。   As described above, according to the fourth embodiment, when the default OCR language is not associated with the destination, a recognition target language candidate is specified from the attribute information of the destination and presented to the user. The language specified from the destination name, domain, etc. is presumed to be the language used at the destination. Therefore, by preferentially presenting information indicating the language specified from the attribute information of the destination, it is assumed that the language assumed to be used at the destination, that is, the OCR estimated to be suitable for the destination environment. The language is preferentially presented to the user. That is, the OCR language presumed to be suitable for the data transmitted to the destination is preferentially presented to the user. For example, when Japanese is used for attributes such as “destination name” and “surname”, it is presumed that Japanese is used for data transmitted to the destination, and Japanese is suitable as the OCR language. It is estimated that Therefore, the OCR language (for example, “Japanese”) presumed to be suitable for the data transmitted to the destination by presenting the language specified from the attribute information of the destination as a candidate for the recognition target language has priority. Presented. Further, when the OCR process is executed using the specified language, the user does not have to select a recognition target language, so that the user's trouble is reduced.

なお、上記の実施例1〜4ではファクシミリ部32は利用されないため、ファクシミリ部32は画像形成装置10に設けられていなくてもよい。   In the first to fourth embodiments, since the facsimile unit 32 is not used, the facsimile unit 32 may not be provided in the image forming apparatus 10.

(実施例5)
次に、実施例5について説明する。実施例5では、他の装置から画像形成装置10に文書データがファクシミリ送信され、ファクシミリ部32によってその文書データが受信される。そして、その文書データに対してOCR処理が適用される。一例として、ファクシミリ受信された文書データとOCR処理によって生成された文字データが、画像形成装置10から他の装置(例えば特定の端末装置12)に送信(転送)される。以下、実施例5について詳しく説明する。
(Example 5)
Next, Example 5 will be described. In the fifth embodiment, document data is transmitted by facsimile from another apparatus to the image forming apparatus 10, and the document data is received by the facsimile unit 32. Then, OCR processing is applied to the document data. As an example, document data received by facsimile and character data generated by OCR processing are transmitted (transferred) from the image forming apparatus 10 to another apparatus (for example, a specific terminal apparatus 12). Hereinafter, Example 5 will be described in detail.

まず、データの転送先の装置が画像形成装置10に登録される。例えば、制御部26によって、設定画面がUI部20に表示される。ユーザは、その設定画面上において、転送先の装置(例えば特定の端末装置12)の宛先を設定し、OCR処理を実行(OCR処理を「する」)に設定する。   First, a data transfer destination apparatus is registered in the image forming apparatus 10. For example, the setting screen is displayed on the UI unit 20 by the control unit 26. On the setting screen, the user sets the destination of the transfer destination device (for example, the specific terminal device 12), and sets the execution of the OCR processing (“OCR processing is performed”).

他の装置からファクシミリ送信された文書データには、当該他の装置を特定するための送信元情報が付帯されている。送信元情報には、例えば、Fax番号、送信元名、等が含まれている。OCR言語特定部28は、その送信元情報を参照することにより、OCR処理において認識対象となる言語を特定する。例えば、OCR言語特定部28は、宛先情報24において送信元情報を検索する。宛先情報24に送信元に対応する宛先が含まれている場合、上記の実施例1〜4に対応する処理が実行される。例えば、送信元情報に含まれるFax番号と同一のFax番号が設定された宛先が宛先情報24に含まれている場合や、送信元情報に含まれる送信元名と同一の宛先名が設定された宛先が宛先情報24に含まれている場合、その宛先を利用して認識対象言語が特定される。   Document data transmitted by facsimile from another apparatus is accompanied by transmission source information for specifying the other apparatus. The transmission source information includes, for example, a fax number, a transmission source name, and the like. The OCR language specifying unit 28 specifies a language to be recognized in the OCR process by referring to the transmission source information. For example, the OCR language specifying unit 28 searches for transmission source information in the destination information 24. When the destination information 24 includes a destination corresponding to the transmission source, the processing corresponding to the first to fourth embodiments is executed. For example, when the destination information 24 includes a destination having the same Fax number as the Fax number included in the transmission source information, or the same destination name as the transmission source name included in the transmission source information is set. When the destination is included in the destination information 24, the recognition target language is specified using the destination.

例えば、送信元に対応する宛先にデフォルトのOCR言語が対応付けられている場合、上記の実施例1〜3と同様に、OCR言語特定部28は、デフォルトのOCR言語を認識対象言語として特定する。その他の処理は、実施例1〜3と同様である。つまり、デフォルトのOCR言語を示す情報が認識対象言語の候補として設定画面に表示される。   For example, when the default OCR language is associated with the destination corresponding to the transmission source, the OCR language specifying unit 28 specifies the default OCR language as the recognition target language as in the first to third embodiments. . Other processes are the same as in the first to third embodiments. That is, information indicating the default OCR language is displayed on the setting screen as a recognition target language candidate.

一方、送信元に対応する宛先にデフォルトのOCR言語が対応付けられていない場合、上記の実施例4と同様に、OCR言語特定部28は、その宛先の属性情報に基づいて認識対象言語を特定する。その他の処理は、実施例4と同様である。つまり、1又は複数の言語を示す情報が、認識対象言語の候補として設定画面に表示される。また、優先順位に従って複数の言語を示す情報が表示されてもよい。別の例として、OCR言語特定部28は、特定された複数の言語の中で優先順位が最も高い言語を、認識対象言語として特定してもよい。   On the other hand, when the default OCR language is not associated with the destination corresponding to the transmission source, the OCR language specifying unit 28 specifies the recognition target language based on the attribute information of the destination as in the fourth embodiment. To do. Other processes are the same as those in the fourth embodiment. That is, information indicating one or a plurality of languages is displayed on the setting screen as a recognition target language candidate. Information indicating a plurality of languages may be displayed according to the priority order. As another example, the OCR language specifying unit 28 may specify the language having the highest priority among the specified languages as the recognition target language.

認識対象言語がOCR処理部18に設定され、ファクシミリ部32によってファクシミリ受信された文書データに対してOCR処理が適用される。これにより、文字データが生成される。そして、文書データと文字データは、通信部14によって宛先(例えば特定の端末装置12)に送信される。   The recognition target language is set in the OCR processing unit 18, and the OCR processing is applied to the document data received by facsimile by the facsimile unit 32. Thereby, character data is generated. Then, the document data and the character data are transmitted to the destination (for example, a specific terminal device 12) by the communication unit 14.

送信元に対応する宛先に対応付けられているデフォルトのOCR言語や、送信元の属性情報から特定されたOCR言語は、その送信元にて使用される言語であると推定される。それ故、これらのOCR言語を認識対象言語の候補として提示することにより、その送信元から送信された文書データに適していると推定されるOCR言語が、認識対象言語の候補としてユーザに提示される。例えば、デフォルトのOCR言語が日本語である場合や、送信元の属性情報から特定された言語が日本語である場合、その送信元からファクシミリ送信された文書データには日本語が使用されていると推定され、OCR言語として日本語が適していると推定される。それ故、デフォルトのOCR言語や宛先の属性情報から特定された言語を、認識対象言語の候補として提示することにより、当該文書データに適していると推定される言語が、提示されることになる。また、特定された言語を用いてOCR処理が実行された場合、ユーザは認識対象言語を選択せずに済むため、ユーザの手間が軽減される。   The default OCR language associated with the destination corresponding to the transmission source and the OCR language specified from the transmission source attribute information are presumed to be languages used by the transmission source. Therefore, by presenting these OCR languages as recognition target language candidates, the OCR languages estimated to be suitable for the document data transmitted from the transmission source are presented to the user as recognition target language candidates. The For example, when the default OCR language is Japanese, or when the language specified from the attribute information of the transmission source is Japanese, Japanese is used for the document data transmitted by facsimile from the transmission source. It is estimated that Japanese is suitable as the OCR language. Therefore, a language that is estimated to be suitable for the document data is presented by presenting the language specified from the default OCR language or the destination attribute information as a candidate language to be recognized. . Further, when the OCR process is executed using the specified language, the user does not have to select a recognition target language, so that the user's trouble is reduced.

(実施例6)
次に、実施例6について説明する。実施例6では、実施例5と同様に、他の装置からファクシミリ送信された文書データにOCR処理が適用され、文書データと文字データが他の装置(例えば特定の端末装置12)に送信(転送)される。以下、実施例6について詳しく説明する。
(Example 6)
Next, Example 6 will be described. In the sixth embodiment, as in the fifth embodiment, OCR processing is applied to document data transmitted by facsimile from another device, and the document data and character data are transmitted (transferred) to another device (for example, a specific terminal device 12). ) Hereinafter, Example 6 will be described in detail.

実施例5と同様に、データの転送先に装置が画像形成装置10に登録される。例えば、ユーザが、UI部20に表示された設定画面上において、転送先の装置(例えば特定の端末装置12)の宛先を設定し、OCR処理を実行(OCR処理を「する」)に設定する。   As in the fifth embodiment, the apparatus is registered in the image forming apparatus 10 as the data transfer destination. For example, the user sets the destination of a transfer destination device (for example, a specific terminal device 12) on the setting screen displayed on the UI unit 20, and sets the execution of the OCR processing (“OCR processing is“ performed ”). .

OCR言語特定部28は、その転送先(宛先)の情報を利用して認識対象言語を特定する。宛先情報24において、転送先(宛先)にデフォルトのOCR言語が対応付けられている場合、上記の実施例1〜3と同様に、デフォルトのOCR言語が認識対象言語として特定される。その他の処理は、実施例1〜3と同様である。つまり、デフォルトのOCR言語を示す情報が認識対象言語の候補として設定画面に表示される。   The OCR language specifying unit 28 specifies the recognition target language using the information of the transfer destination (destination). In the destination information 24, when the default OCR language is associated with the transfer destination (destination), the default OCR language is specified as the recognition target language as in the first to third embodiments. Other processes are the same as in the first to third embodiments. That is, information indicating the default OCR language is displayed on the setting screen as a recognition target language candidate.

一方、宛先情報24において、転送先(宛先)にデフォルトのOCR言語が対応付けられていない場合、上記の実施例4と同様に、その転送先(宛先)の属性情報に基づいて認識対象言語が特定される。その他の処理は、実施例4と同様である。つまり、1又は複数の言語を示す情報が、認識対象言語の候補として設定画面に表示される。また、優先順位に従って複数の言語を示す情報が表示されてもよい。別の例として、特定された複数の言語の中で優先順位が最も高い言語が、認識対象言語として特定されてもよい。   On the other hand, in the destination information 24, when the default OCR language is not associated with the transfer destination (destination), the recognition target language is determined based on the attribute information of the transfer destination (destination) as in the fourth embodiment. Identified. Other processes are the same as those in the fourth embodiment. That is, information indicating one or a plurality of languages is displayed on the setting screen as a recognition target language candidate. Information indicating a plurality of languages may be displayed according to the priority order. As another example, the language with the highest priority among the plurality of specified languages may be specified as the recognition target language.

認識対象言語がOCR処理部18に設定され、ファクシミリ部32によってファクシミリ受信された文書データに対してOCR処理が適用される。これにより、文字データが生成される。そして、文書データと文字データは、通信部14によって宛先(例えば特定の端末装置12)に送信される。   The recognition target language is set in the OCR processing unit 18, and the OCR processing is applied to the document data received by facsimile by the facsimile unit 32. Thereby, character data is generated. Then, the document data and the character data are transmitted to the destination (for example, a specific terminal device 12) by the communication unit 14.

転送先に対応付けられているOCR言語や、転送先の属性情報から特定されたOCR言語は、その転送先にて使用される言語であると推定される。それ故、これらのOCR言語を認識対象言語の候補として提示することにより、転送先に転送されるデータに適していると推定されるOCR言語が、認識対象言語の候補としてユーザに提示される。例えば、デフォルトのOCR言語が日本語である場合や、転送先の属性情報から特定された言語が日本語である場合、その転送先に転送されるデータには日本語が使用されていると推定され、OCR言語として日本語が適していると推定される。それ故、デフォルトのOCR言語や転送先の属性情報から特定された言語を、認識対象言語の候補として提示することにより、当該文書データに適していると推定される言語が、提示されることになる。また、特定された言語を用いてOCR処理が実行された場合、ユーザは認識対象言語を選択せずに済むため、ユーザの手間が軽減される。   The OCR language associated with the transfer destination and the OCR language specified from the attribute information of the transfer destination are presumed to be languages used at the transfer destination. Therefore, by presenting these OCR languages as recognition target language candidates, the OCR languages estimated to be suitable for the data transferred to the transfer destination are presented to the user as recognition target language candidates. For example, if the default OCR language is Japanese or the language specified from the transfer destination attribute information is Japanese, it is estimated that Japanese is used for the data transferred to the transfer destination. It is estimated that Japanese is suitable as the OCR language. Therefore, by presenting the language specified from the default OCR language or the attribute information of the transfer destination as a recognition target language candidate, a language estimated to be suitable for the document data is presented. Become. Further, when the OCR process is executed using the specified language, the user does not have to select a recognition target language, so that the user's trouble is reduced.

上記の実施形態においては、宛先に対応付けられたデフォルトのOCR言語、又は、宛先の属性情報から特定された言語が、認識対象言語の候補として用いられる。これに対して、過去に行われたスキャンOCR処理の履歴情報を利用して認識対象言語を特定する手法が考えられる。具体的には、履歴情報として、データの過去の送信先(宛先)と、その文書データに対するOCR処理に用いられた認識対象言語と、を対応付けて管理しておく。そして、新たにスキャンOCR処理を実行するときには、その履歴情報から宛先に対応する認識対象言語を特定することが考えられる。しかし、過去にスキャンOCR処理が適用されたことのない宛先、つまり一度もスキャンOCR処理が適用されたことのない宛先については履歴情報が存在しないため、そのような宛先が指定された場合には、認識対象言語の候補が特定されないことになる。これに対して、本実施形態では仮に履歴情報が存在しない場合であっても、つまり、スキャンOCR処理の適用が1回目の宛先であっても、認識対象言語の候補が特定される。このように本実施形態によると、履歴情報に依存せずに認識対象言語の候補が特定される。また、個々のスキャンOCR処理の履歴を管理しようとすると、その履歴情報が膨大となることがあるため、履歴情報を格納するためのメモリの容量を増大する必要がある。これに対して、本実施形態では宛先情報を管理すれば済むため、履歴情報を管理する場合と比べて少ない容量のメモリを用いれば済む。また、OCR処理部18が多数のOCR言語に対応している場合において、一部のOCR言語の利用頻度が高く、他のOCR言語の利用頻度が低い又は他のOCR言語が全く利用されていない場合、履歴情報によると、当該他のOCR言語を利用したいときでもその言語が候補として提示されることがない。そのため、ユーザが当該他のOCR言語を選択することが困難となる。これに対して本実施形態によると、履歴情報によらずに認識対象言語の候補が特定されるので、利用頻度の低い言語であっても認識対象言語の候補として提示される場合がある。そのため、利用頻度の低い言語の選択が容易になる。以上のように、本実施形態によると、履歴情報を用いた場合に生じ得る問題が解消される。履歴情報を用いた場合の問題は、ファクシミリ送信された文書データにOCR処理を適用する場合においても生じ得る。本実施形態によると、その問題も解消される。   In the above embodiment, the default OCR language associated with the destination or the language specified from the destination attribute information is used as a recognition target language candidate. On the other hand, a method of specifying a recognition target language using history information of scan OCR processing performed in the past is conceivable. Specifically, as history information, a past transmission destination (destination) of data and a recognition target language used for the OCR processing for the document data are managed in association with each other. When a new scan OCR process is executed, it is conceivable that the recognition target language corresponding to the destination is specified from the history information. However, since there is no history information for a destination for which scan OCR processing has not been applied in the past, that is, for destinations for which scan OCR processing has never been applied, when such a destination is designated, Thus, the recognition target language candidate is not specified. On the other hand, in this embodiment, even if history information does not exist, that is, even if the application of the scan OCR process is the first destination, the recognition target language candidate is specified. As described above, according to this embodiment, the recognition target language candidate is specified without depending on the history information. In addition, when trying to manage the history of individual scan OCR processing, the history information may become enormous, so it is necessary to increase the capacity of the memory for storing the history information. On the other hand, in the present embodiment, it is only necessary to manage the destination information, so that it is sufficient to use a memory having a smaller capacity than the case of managing the history information. In addition, when the OCR processing unit 18 supports a large number of OCR languages, the usage frequency of some OCR languages is high, the usage frequency of other OCR languages is low, or other OCR languages are not used at all. In this case, according to the history information, even when it is desired to use the other OCR language, that language is not presented as a candidate. Therefore, it becomes difficult for the user to select the other OCR language. On the other hand, according to the present embodiment, the recognition target language candidate is specified without using the history information, so even a language with low usage frequency may be presented as a recognition target language candidate. Therefore, it becomes easy to select a language with low usage frequency. As described above, according to the present embodiment, problems that may occur when history information is used are solved. Problems with the use of history information can also occur when OCR processing is applied to document data transmitted by facsimile. According to this embodiment, the problem is also solved.

また、本実施形態では、同姓同名の複数の宛先がアドレス帳に登録されている場合であっても、個々の宛先に対応付けられたデフォルトのOCR言語、又は、個々の宛先の属性情報から特定された言語が、個々の宛先に適用される認識対象言語の候補として特定される。これにより、個々の宛先を区別して、個々の宛先に適した認識対象言語の候補が特定される。   Further, in the present embodiment, even when a plurality of destinations having the same name and the same name are registered in the address book, they are identified from the default OCR language associated with each destination or the attribute information of each destination. The recognized language is identified as a recognition target language candidate to be applied to each destination. Thereby, each destination is distinguished and the recognition target language candidate suitable for each destination is specified.

上記の画像形成装置10,10Aは、一例としてハードウェア資源とソフトウェアとの協働により実現される。具体的には、画像形成装置10,10Aは、図示しないCPU等のプロセッサを備えている。当該プロセッサが、図示しない記憶装置に記憶されたプログラムを読み出して実行することにより、画像形成装置10,10Aの各部の機能が実現される。上記プログラムは、CDやDVD等の記録媒体を経由して、又は、ネットワーク等の通信経路を経由して、記憶装置に記憶される。または、画像形成装置10,10Aの各部は、例えばプロセッサや電子回路等のハードウェア資源により実現されてもよい。その実現においてメモリ等のデバイスが利用されてもよい。別の例として、画像形成装置10,10Aの各部は、DSP(Digital Signal Processor)やFPGA(Field Programmable Gate Array)等によって実現されてもよい。   The image forming apparatuses 10 and 10A described above are realized by cooperation of hardware resources and software as an example. Specifically, the image forming apparatuses 10 and 10A include a processor such as a CPU (not shown). The processor reads out and executes a program stored in a storage device (not shown), thereby realizing the functions of the units of the image forming apparatuses 10 and 10A. The program is stored in the storage device via a recording medium such as a CD or DVD, or via a communication path such as a network. Alternatively, each unit of the image forming apparatuses 10 and 10A may be realized by hardware resources such as a processor and an electronic circuit. In the realization, a device such as a memory may be used. As another example, each unit of the image forming apparatuses 10 and 10A may be realized by a DSP (Digital Signal Processor), an FPGA (Field Programmable Gate Array), or the like.

10,10A 画像形成装置、16 画像読取部、18 OCR処理部、24 宛先情報、26 制御部、28 OCR言語特定部、30 登録部、32 ファクシミリ部。   10, 10A image forming apparatus, 16 image reading unit, 18 OCR processing unit, 24 destination information, 26 control unit, 28 OCR language specifying unit, 30 registration unit, 32 facsimile unit.

Claims (9)

文書データにOCR処理を適用することにより文字データを生成するOCR処理手段と、
前記文字データの送信先として選択された宛先にOCR言語が対応付けられている場合、当該OCR言語を前記OCR処理において認識対象となる言語として特定する特定手段と、
を有する情報処理装置。
OCR processing means for generating character data by applying OCR processing to document data;
A specifying means for specifying the OCR language as a language to be recognized in the OCR process when an OCR language is associated with the destination selected as the transmission destination of the character data;
An information processing apparatus.
宛先に関する宛先情報と、当該宛先に対して設定されたOCR言語を示すOCR言語情報と、を対応付けて記憶する記憶手段を更に有し、
前記特定手段は、前記文字データの送信先として選択された宛先に対応付けられているOCR言語を前記認識対象となる言語として特定する、
ことを特徴とする請求項1に記載の情報処理装置。
Storage means for storing destination information related to the destination and OCR language information indicating the OCR language set for the destination in association with each other;
The specifying unit specifies an OCR language associated with a destination selected as a transmission destination of the character data as the language to be recognized;
The information processing apparatus according to claim 1.
前記特定手段は、前記文字データの送信先として選択された宛先にOCR言語が対応付けられていない場合、前記文字データの宛先に関する宛先情報であって言語の特定が可能な情報を含む宛先情報に基づいて、前記認識対象となる言語を特定する、
ことを特徴とする請求項1又は請求項2に記載の情報処理装置。
When the OCR language is not associated with the destination selected as the transmission destination of the character data, the specifying means includes destination information regarding the destination of the character data and including information that can specify the language. Based on the recognition target language,
The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.
前記特定手段によって前記認識対象となる複数の言語が特定された場合、当該複数の言語を示す情報を、言語の優先順位に従って出力する出力手段を更に有する、
ことを特徴とする請求項3に記載の情報処理装置。
In the case where a plurality of languages to be recognized are specified by the specifying means, there is further provided an output means for outputting information indicating the plurality of languages in accordance with language priorities
The information processing apparatus according to claim 3.
前記特定手段によって前記認識対象となる複数の言語が特定された場合、当該複数の言語を示す情報を、前記宛先情報に基づく優先順位に従って出力する出力手段を更に有する、
ことを特徴とする請求項3に記載の情報処理装置。
In the case where a plurality of languages to be recognized are specified by the specifying unit, the output unit further includes an output unit that outputs information indicating the plurality of languages according to a priority order based on the destination information.
The information processing apparatus according to claim 3.
前記特定手段によって特定された言語をOCR言語として前記文字データの宛先に対応付けて登録する登録手段を更に有する、
ことを特徴とする請求項3から請求項5のいずれか一項に記載の情報処理装置。
Registration means for registering the language specified by the specifying means as an OCR language in association with the destination of the character data;
The information processing apparatus according to any one of claims 3 to 5, wherein
前記特定手段は、他の装置からファクシミリ送信された前記文書データを受け、前記文書データの送信元を前記宛先として処理することにより、前記認識対象となる言語を特定する、
ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理装置。
The specifying means receives the document data transmitted by facsimile from another apparatus, and specifies the language to be recognized by processing the source of the document data as the destination.
The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.
前記特定手段は、他の装置からファクシミリ送信された前記文書データを受け、前記文書データの転送先を前記宛先として処理することにより、前記認識対象となる言語を特定する、
ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理装置。
The specifying unit specifies the language to be recognized by receiving the document data transmitted by facsimile from another apparatus and processing the transfer destination of the document data as the destination.
The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.
コンピュータを、
文書データにOCR処理を適用することにより文字データを生成するOCR処理手段と、
前記文字データの宛先にOCR言語が対応付けられている場合、当該OCR言語を前記OCR処理において認識対象となる言語として特定する特定手段と、
として機能させるプログラム。
Computer
OCR processing means for generating character data by applying OCR processing to document data;
When an OCR language is associated with the destination of the character data, a specifying unit that specifies the OCR language as a language to be recognized in the OCR processing;
Program to function as.
JP2015143363A 2015-07-17 2015-07-17 Information processing apparatus, and program Pending JP2017027237A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015143363A JP2017027237A (en) 2015-07-17 2015-07-17 Information processing apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015143363A JP2017027237A (en) 2015-07-17 2015-07-17 Information processing apparatus, and program

Publications (1)

Publication Number Publication Date
JP2017027237A true JP2017027237A (en) 2017-02-02

Family

ID=57950523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015143363A Pending JP2017027237A (en) 2015-07-17 2015-07-17 Information processing apparatus, and program

Country Status (1)

Country Link
JP (1) JP2017027237A (en)

Similar Documents

Publication Publication Date Title
US10862878B2 (en) Information processing device, information management method, and information processing system
US9648180B2 (en) Information processing system performing operation based on tag information, information processing device, portable terminal and non-transitory computer readable recording medium
US11122170B2 (en) Information processing apparatus, control method for information processing apparatus, and program
US11825039B2 (en) Scanning system including message sharing system, printing system, image processing apparatus, and method
KR20240020719A (en) Information processing apparatus, storage medium, and storing method
JP2019117622A (en) Image processing system and image processing program
US11171954B2 (en) Server and non-transitory computer-readable recording medium storing computer-readable instructions for server
JP2018005295A (en) Program and mobile terminal
US9288348B2 (en) Communication apparatus that selects destination from job history, communication method, and non-transitory computer readable medium
JP2013145483A (en) Image processing system, image processing method and program
US11800032B2 (en) Apparatus, information processing method, and storage medium
JP4645731B2 (en) Image processing apparatus, image data management method, and computer program
US10180770B2 (en) Information processing device and non-transitory computer readable medium
CN107707780B (en) Information processing apparatus, information processing method, and computer program
US20190155873A1 (en) Document processing apparatus and non-transitory computer readable medium storing program
JP2016096393A (en) Information processing apparatus, system, information processing method, and program
JP2018092569A (en) Information processing system, information processing device, information processing method, and program
JP2017027237A (en) Information processing apparatus, and program
JP2017027100A (en) Image processing device and image processing program
US20190052769A1 (en) Method for transmitting and receiving fax by using application, and image forming apparatus for performing same
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
JP2020048082A (en) Information processing device and program
US11647128B2 (en) Management apparatus, management system, and recording medium
US20210075923A1 (en) Data transmission apparatus, and control method thereof
JP2017162080A (en) Device, information processing system, display control method, and program