JP5235499B2 - Information processing apparatus, image forming apparatus, program, and document data configuration method - Google Patents
Information processing apparatus, image forming apparatus, program, and document data configuration method Download PDFInfo
- Publication number
- JP5235499B2 JP5235499B2 JP2008135892A JP2008135892A JP5235499B2 JP 5235499 B2 JP5235499 B2 JP 5235499B2 JP 2008135892 A JP2008135892 A JP 2008135892A JP 2008135892 A JP2008135892 A JP 2008135892A JP 5235499 B2 JP5235499 B2 JP 5235499B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- type
- document data
- character
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Record Information Processing For Printing (AREA)
Description
本発明は、文書データの文書種別を判別して文書データを構成する情報処理装置、画像形成装置、プログラム及び文書データ構成方法に関する。 The present invention relates to an information processing apparatus, an image forming apparatus, a program, and a document data configuration method that configure document data by determining the document type of the document data.
報告書やレポートなどで紙文書や電子文書(以下、単に文書という)を回覧したり提出する場面は極めて多い。ユーザは報告書やレポートなどの使用目的、使用場面等に応じて文書を作成する度に、適切な文章に推敲したりレイアウトを検討する。ところで、文書のレイアウトは文書の種類や使用場面に応じて定まっている場合が多い(例えば、特許文献1参照。)。特許文献1には、スキャンした文書のレイアウトに基づいて、文書の種類を特定しその種類毎に分類して電子化する文書処理装置が記載されている。
特許文献1に記載されているように、文書のレイアウトは文書の種類や使用場面等に応じて定まっているが、これまで文書の種類に応じて自動的にレイアウトを定めたり文章を推敲することはできなかった。このため、ユーザは文書の種類や使用場面に応じて適切な言葉やレイアウトを調べて文書を作成する必要があるという問題があった。
As described in
本発明は、上記課題に鑑み、文書作成における表現の決定や構成の設定を容易にする情報処理装置、画像形成装置、プログラム及び文書データ構成方法を提供することを目的とする。 In view of the above problems, an object of the present invention is to provide an information processing apparatus, an image forming apparatus, a program, and a document data configuration method that facilitate determination of expression and setting of a configuration in document creation.
上記課題に鑑み、本発明は、文書データの文書種別と対応づけて、該文書種別の文書データにて用いられる文字又は文字列を記憶する文書種別情報記憶手段と、文書データを入力する文書データ入力手段と、前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段と、前記種別判定手段が判定した文書データの文書種別に応じて、前記文書構成情報記憶手段に記憶された前記文書構成情報に従い入力された文書データの体裁を整える文書構成手段と、文書種別毎に、誤字、脱字及び文法誤用以外の校正前の文字又は文字列に対応づけて、校正後の文字又は文字列を記憶した校正情報記憶手段と、前記文書データ入力手段により入力された文書データに、前記校正情報記憶手段に記憶された校正前の文字又は文字列が記憶されている場合、前記種別判定手段が判定した、入力された文書データの文書種別に応じて、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正する校正手段と、を有し、前記文書構成手段は、前記文書構成情報を構成例と共に表示し、文書データの任意の文字列に前記文書構成情報を適用する操作が受け付けられた場合、前記任意の文字列の体裁を整える、ことを特徴とする情報処理装置を提供する。 In view of the above problems, the present invention relates to document type information storage means for storing characters or character strings used in document data of the document type in association with the document type of the document data, and document data for inputting the document data. Based on the document type stored in the document type information storage unit in association with the character or character string included in the document data input by the input unit and the document data input unit, the document type of the input document data is determined. A type determination unit that performs document configuration information storage that stores, for each document type, document configuration information that specifies one or more fonts, sizes, and thicknesses of characters of document data, or an arrangement of characters or character strings; The format of the document data input according to the document configuration information stored in the document configuration information storage unit according to the document type of the document data determined by the type determination unit. A document structure unit to arrange, for each document type, typographical, in association with the caret before calibration other than and grammatical misuse character or string, and calibration information storage means for storing character or character string after calibration, the document data When the pre-proofreading character or character string stored in the proofreading information storage unit is stored in the document data input by the input unit, the document type of the input document data determined by the type determination unit And proofreading means for proofreading the character or character string before proofreading with the proofread character or character string stored in the proofreading information storage means, and the document composition means constitutes the document composition information. displays with examples, when an operation to apply the document structure information in any string of the document data has been accepted, adjust the appearance of the arbitrary character string, to provide an information processing apparatus characterized by .
本発明によれば、文書データの文書種別を判定して、文書種別に適切な文書構成に再構成することができる。
本発明によれば、文書種別に応じて文書データを校正することができる。
According to the present invention, it is possible to determine the document type of the document data and reconfigure the document structure to be appropriate for the document type.
According to the present invention, document data can be calibrated according to the document type.
本発明によれば、文書種別に応じて文書データを校正することができる。 According to the present invention, document data can be calibrated according to the document type.
また、本発明の一形態において、前記種別判定手段は、前記文書データ入力手段により入力された文書データが含む文字又は文字列のうち、前記文書種別情報記憶手段に記憶された数を文書種別毎にカウントし、カウントされた数が最も大きい文書種別の文書データであると判定する、ことを特徴とする。 Further, in one aspect of the present invention, the type determination unit calculates the number stored in the document type information storage unit among the characters or character strings included in the document data input by the document data input unit for each document type. And the document data is determined to be document data of the document type having the largest counted number.
本発明によれば、文書データに文書種別の異なる文字又は文字列が含まれていても、文書種別を適切に判定することができる。 According to the present invention, it is possible to appropriately determine the document type even if the document data includes characters or character strings having different document types.
また、本発明の一形態において、種別判定手段が、文書データ入力手段により入力された文書データを事務や取引等で用いられるビジネス文書と判定した場合、文書構成手段は、ビジネス文書の文書構成情報に従い、文書データの箇条書きの行頭に行頭記号を付加する、ことを特徴とする。 In one embodiment of the present invention, when the type determination unit determines that the document data input by the document data input unit is a business document used in office work or transaction, the document configuration unit includes document configuration information of the business document. According to the above, a bullet is added to the beginning of the bulleted list of the document data.
本発明によれば、ビジネス文書に対し、箇条書きの行頭に自動的に記号を付加できるのでユーザの利便性が向上する。 According to the present invention, since a symbol can be automatically added to a bulleted line of a business document, convenience for the user is improved.
また、本発明の一形態において、前記種別判定手段が、前記文書データ入力手段により入力された文書データを事務や取引等で用いられるビジネス文書と判定した場合、 前記文書構成手段は、ビジネス文書の前記文書構成情報に従い、文書データに含まれた日時情報又は場所情報を所定の位置に配置する、ことを特徴とする。 In one embodiment of the present invention, when the type determination unit determines that the document data input by the document data input unit is a business document used in office work or transaction, the document configuration unit includes: According to the document configuration information, date / time information or location information included in the document data is arranged at a predetermined position.
本発明によれば、ビジネス文書に対し、日時や場所を適切な位置に配置できるのでユーザの利便性が向上する。 According to the present invention, the user's convenience is improved because the date and place can be arranged at an appropriate position for the business document.
また、本発明の一形態において、前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、前記文書構成手段は、年賀状の前記文書構成情報に従い、文書データに含まれる新年の挨拶を構成する文字のフォントを毛筆体に変換する、ことを特徴とする。 In one embodiment of the present invention, when the type determination unit determines that the document data input by the document data input unit is a new year card, the document configuration unit converts the document data into document data according to the document configuration information of the new year card. The font of the character which comprises the greeting of the contained New Year is converted into a brush body, It is characterized by the above-mentioned.
本発明によれば、年賀状の新年の挨拶を毛筆体に変換できるのでユーザの利便性が向上する。 According to the present invention, the New Year's greeting on the New Year's card can be converted into a brush brush, which improves user convenience.
また、本発明の一形態において、前記文書構成情報記憶手段は、十二支の干支毎に、各干支に対応した動物の画像データを記憶しており、前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、前記文書構成手段は、文書データを入力した年の次の年の干支に対応した動物の画像データを前記文書構成情報記憶手段から抽出し、年賀状の前記文書構成情報に従い、前記年賀状の所定の位置に配置する、ことを特徴とする。 In one embodiment of the present invention, the document configuration information storage means stores animal image data corresponding to each zodiac for each of the twelve zodiac signs, and the type determination means uses the document data input means. When it is determined that the input document data is a New Year's card, the document composition means extracts image data of animals corresponding to the zodiac of the year following the year in which the document data was input from the document composition information storage means, According to the document configuration information, it is arranged at a predetermined position on the New Year's card.
本発明によれば、年賀状に干支に適した画像データを貼り付けることができるので、ユーザの利便性が向上する。 According to the present invention, since image data suitable for the zodiac signs can be pasted on the New Year's card, the convenience for the user is improved.
また、本発明の一形態において、前記校正手段は、文書データに含まれた校正前の文字又は文字列と共に、複数の校正後の文字又は文字列を表示装置に表示し、複数の校正後の文字又は文字列のうちポインティングデバイスにより選択された文字又は文字列を用いて、文書データの校正前の文字又は文字列を校正する、ことを特徴とする。 In one embodiment of the present invention, the proofreading unit displays a plurality of proofread characters or character strings on a display device together with the proofread characters or character strings included in the document data, and Characters or character strings before proofreading of document data are calibrated using characters or character strings selected by a pointing device among the characters or character strings.
本発明によれば、複数の候補から適切な校正後の文字又は文字列を選択することができる。 According to the present invention, it is possible to select an appropriate proofread character or character string from a plurality of candidates.
文書作成における表現の決定や構成の設定を容易にする情報処理装置、画像形成装置、プログラム及び文書データ構成方法を提供することができる。 It is possible to provide an information processing apparatus, an image forming apparatus, a program, and a document data configuration method that make it easy to determine an expression and set a configuration in document creation.
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。 The best mode for carrying out the present invention will be described below with reference to the drawings.
本実施形態の情報処理装置は、文書に含まれる文言から文書の種別(以下、文書種別という)を判定し、文書種別に応じて表現を校正すると共に文書構成の体裁を整える。これにより、ユーザが文書の種類に応じて表現を校正したり文書構成を定めることなく、文書種別に応じて適切な表現及び文書構成にすることができるので、ユーザの利便性を向上させることができる。 The information processing apparatus according to the present embodiment determines a document type (hereinafter referred to as a document type) from a word included in the document, corrects the expression according to the document type, and arranges the appearance of the document structure. As a result, the user's convenience can be improved because the user can make an appropriate expression and document structure according to the document type without proofreading the expression according to the document type or determining the document structure. it can.
なお、文書種別とは、文書が使用される場面に応じて定まる文書の種類、例えば、ビジネス文書、年賀状、プロジェクターにより投影されるプレゼンテーション資料、歓送迎会等の案内状、等である。また、ビジネス文書には、企画書、見積書、成果報告書、出張報告書等、種々のものがありこれらを区別することも可能であるが、以下では単にビジネス文書という。 The document type is a document type determined according to the scene where the document is used, for example, a business document, a New Year's card, a presentation material projected by a projector, a greeting card for a welcome party, and the like. In addition, there are various business documents such as a plan document, an estimate document, a result report, a business trip report, and the like, and these can be distinguished.
また、表現を校正するとは、誤字、脱字及び文法誤用以外の適切でない言い回しを修正することをいう。誤字脱字、文法的な誤り、文章の表記ゆれ、等を修正してもよい。また、文書構成とは、例えば段落毎の配置位置、センタリング・左詰め・右詰め、文字のフォント、サイズ、太字・細字の別、文字や背景の色、箇条書き部の行頭記号、段落の枠の有無、等をいう。 Also, proofreading an expression means correcting an inappropriate wording other than typos, omissions, and grammatical misuse. You may correct typographical errors, grammatical errors, text swaying, etc. The document structure includes, for example, the position of each paragraph, centering / left-justified / right-justified, character font, size, bold / thin type, character / background color, bullet point bullet, paragraph frame The presence or absence, etc.
図1は、文書種別を判定する情報処理装置111がネットワークNを介して画像形成装置110と接続された印刷システムの概略構成を示す図である。情報処理装置111は、例えばPC(パーソナルコンピュータ)、携帯電話、PDA(Personal Digital(Data) Assistants)、PHS(Personal Handyphone System)等のコンピュータにより構成される。画像形成装置110は、プリンタ、ファクシミリ装置、スキャナ装置、MFP(Multi Function Printer)等、文書を印刷、送信、保存する文書の出力装置である。
FIG. 1 is a diagram illustrating a schematic configuration of a printing system in which an
例えば、ユーザはワープロソフトウェアなどのアプリケーションプログラムを起動した後、情報処理装置111のキーボード112及びマウス113を操作して文字を入力する。入力された文字は順次ディスプレイ114に反映され、最終的には文書や表等が生成される。以下、文書データや電子メールなど文字を含むデータをテキストデータという。テキストデータがバイナリファイルに保存されるかテキストファイルに保存されるかは問わない。
For example, after starting an application program such as word processing software, the user inputs characters by operating the
本実施形態の情報処理装置111は、テキストデータを構成する自立語(主に日本語の場合)や単語(主に英語の場合)を抽出し、文書種別情報データベース(以下、DBという)を参照し、テキストデータの文書種別を判定する。自立語を日本語の構成要素と、単語は英語の構成要素としたが、他の言語であっても自立語や単語に相当する構成要素から文書種別を判定できる。
The
また、例えば、情報処理装置111がテキストデータを受信したり、可搬型の記憶媒体128に記憶されたテキストデータを読み出し、記憶装置126に記憶した場合、情報処理装置111はテキストデータに含まれる自立語や単語に基づき、テキストデータの文書種別を判定する。
Further, for example, when the
図2は、情報処理装置111のハードウェア構成例を示す図である。情報処理装置111は、バスBで相互に接続されているRAM(Random Access Memory )121、ROM(Read-Only Memory)122、入力装置(図1のキーボード112、マウス113に相当)112,113、NIC(Network Interface Card)123、ドライブ装置124、表示制御部125、記憶装置126及びCPU127とを有する。
FIG. 2 is a diagram illustrating a hardware configuration example of the
RAM121は、OSやプログラムを実行する作業メモリになり、ROM122はBIOSなどOSを起動するためのプログラムや設定ファイルを記憶している。入力装置112、113はキーボードやマウスなど、ユーザからの様々な操作を入力するためのデバイスである。NIC123は、ネットワークNに接続するためのインターフェイスであり、TCP(Transmission Control Protocol )/IP(Internet Protocol)等のプロトコル処理を実行する。ドライブ装置124は、CD−RWやメモリカード等の記憶媒体128が着脱可能に構成されており、記憶媒体128にプログラムやデータを書き込む際に使用され、また、記憶媒体128に記録されたプログラムやデータを読み込み、記憶装置126に送出する。
The RAM 121 serves as a working memory for executing the OS and programs, and the
表示制御部125は、アプリケーションソフトウェアが指示する画面情報に基づき所定の解像度や色数等で、GUI(Graphical User Interface)画面を形成し、操作に必要な各種ウィンドウやデータ等をディスプレイ114に表示する。
The
記憶装置126は、HDD(ハードディスクドライブ)やフラッシュメモリなど不揮発性メモリであり、OS、アプリケーションソフトウェア、プログラム134が記憶されている。CPU127は、OS、アプリケーションソフトウェア及びプログラム134を記憶装置126からロードして実行することで種々の機能を提供すると共に、情報処理装置111が行う処理を統括的に制御する。
The
また、記憶装置126には、後述する文書種別情報DB131、校正情報DB132及び文書構成情報DB133が記憶されている。
The
情報処理装置111が実行するプログラム134は、記録媒体128に記憶して配布されるか、所定のサーバからネットワークNを介して配布される。プログラム134を記録した記録媒体128がドライブ装置124にセットされると、プログラム134が記録媒体128からドライブ装置124を介して記憶装置126にインストールされる。また、サーバからプログラムが送信された場合、NIC123を介して記憶装置126にインストールされる。
The
CPU127がプログラム134を実行することで、テキストデータの種別を判定する文書種別判定手段22、テキストデータの表現を校正する表現校正手段23、テキストデータの文書構成の体裁を整える文書構成手段24、文字列を抽出する文字列抽出手段25と、が実現される。次述するように、表現校正手段23はワープロソフトウェアなどのアプリケーションソフトウェア27の表現を校正し、文書構成手段24は同様にアプリケーションソフトウェア27の表示画面を利用するので、アプリケーションソフトウェア27のアドインなどで構成されることが好ましい。
When the
図3は、情報処理装置111の機能構成図を示す。文書種別判定手段22はテキストデータ20から文書種別を判定するので、OS上ではテキストデータ20を入力するためのアプリケーションソフトウェア27が実行されている。アプリケーションソフトウェア27は、例えば、ワープロソフトウェア、表計算ソフトウェア、電子メールソフトウェア等、テキストデータ20を入力しうるものであればよい。
FIG. 3 shows a functional configuration diagram of the
文字列抽出手段25及び文書種別判定手段22は、情報処理装置111の起動と共に実行されるか、アプリケーションソフトウェア27の起動に伴い実行される。また、表現校正手段23及び文書構成手段24は、ユーザの所定の操作により起動する。
The character
キーボード112は指でキーを操作することで情報処理装置111に文字を入力する。ユーザがキーを押すと、対応するキーコード(例えば、ASCIIコード)が情報処理装置111に送られる。キーコードは例えばBIOS(Basic Input Output System)により対応する文字コードに変換される。なお、キーボード112はタッチパネルや手書き文字入力、音声入力等、文字に対応したキーコードを発生するものであればよい。
The
テキストを日本語で入力する場合、ユーザの操作によりIM(Input Method)21が起動し、文字コードはIM21により日本語に変換される。変換せずに直接テキストを入力する場合は、文字コードは直接アプリケーションソフトウェア27及び文書種別判定手段22に入力される。
When text is input in Japanese, IM (Input Method) 21 is activated by a user operation, and the character code is converted into Japanese by
IM21は、一連の文字コードを日本語等の言語に変換する、いわゆる、かな漢字変換システムである。例えば、キーボード112から「N・O・U・K・I」と入力された場合、IM21は辞書を参照して一連の文字コードを「のうき」と変換すると共に、所定の操作や設定に応じて「納期」や「農機」等に変換することを可能にする。「納期」と変換した場合には「納」「期」それぞれに対応する2つの文字コードが生成される。なお、文字コードは、Unicode、JISコード、シフトJISコード等、いずれであってもよい。以下、文書種別を判定する言葉を種別判定語という。
The
文字列抽出手段25は、所定の文字又は文字列を抽出する。文字列抽出手段25は、テキストデータ20の文字コードを1語1語参照し、テキストデータ20から文書種別情報DB131に登録されている種別判定語を抽出する。また、辞書を参照しながらテキストデータ20の例えば一文ごとに周知の日本語構文解析を行い係り受け関係を抽出し、文節の区分や自立語を抽出してから種別判定語を抽出してもよい。
The character string extraction means 25 extracts a predetermined character or character string. The character
そして、文書種別判定手段22は、文書種別情報DB131に登録された種別判定語に対応つけられた文書種別をテキストデータ20の文書種別として判定する。
Then, the document
図4は、情報処理装置111の機能構成図の他の一例を示す。なお、図4において図3と同一構成部には同一の符号を付しその説明は省略する。図3では、キーボード112からテキストデータ20を入力する形態について説明したが、1つのファイルに含まれるテキストデータ20からも同様に文書種別を判定することができる。
FIG. 4 shows another example of a functional configuration diagram of the
情報処理装置111が電子メール等で受信したテキストデータ20はいったん記憶装置126に記憶される。アプリケーションソフトウェア27はテキストデータ20を読み出しディスプレイ114に表示したり音声で読み上げたりするが、その際に、文書種別判定手段22はテキストデータ20を抽出し、図3と同様に、種別判定語から文書種別を判定することができる。
The
〔文書種別の判定〕
文書種別の判定について説明する。図5は、文書種別情報DB131に記憶される情報の一例を示す。図5では、種々の種別判定語に文書種別が対応づけられている。例えば、「調査」、「資料」、「納期」、「企業」、「成果」にはビジネス文書の文書種別が、「謹賀新年」、「明けまして」、「元旦」、「賀正」、「賀春」には年賀状の文書種別が、「ビール」、「飲み放題」、「パーティ」、「歓迎会」、「歌い放題」には案内状の文書種別が、それぞれ対応づけられている。
[Determination of document type]
The determination of the document type will be described. FIG. 5 shows an example of information stored in the document
文書種別判定手段22はテキストデータ20が含む、文書種別を特徴づける種別判定語に基づき文書種別情報DB131を参照して、それぞれの種別判定語に対応づけられた文書種別を抽出する。そして、例えば、1つのテキストデータ20毎に文書種別を判定する。
The document
なお、1つのテキストデータ20から異なる文書種別が検出された場合、検出された回数が最も多い文書種別に属すると判定する。文書種別判定手段22は、メタデータとして文書種別を示す情報をテキストデータ20に付加する。
When a different document type is detected from one
図6は、文書種別情報DB131のより詳細な構成を示す図である。図6では文書種別に対応づけて、種別判定語及び種別判定語を構成する文字の文字コードが登録されている。したがって、文書種別判定手段22は、テキストデータ20に含まれた種別判定語と文書種別情報DB131の一連の文字コードを比較することで、種別判定語に対応する文書種別を抽出することができる。
FIG. 6 is a diagram showing a more detailed configuration of the document
図7は、文書種別判定手段22が文書種別を判定する手順を示すフローチャート図である。まず、情報処理装置111にテキストデータ20が入力される。例えば、「競争力のある製品を核にして開拓推進を行う。」というテキストデータ20が入力される。
FIG. 7 is a flowchart showing a procedure in which the document
文書種別判定手段22は、テキストデータ20の文字コード、8B23「競」、9188「争」、97CD「力」…8A6A「核」…8A4A「開」、91F1「拓」…から、文書種別情報DB131に登録された種別判定語に一致する文字列を抽出する(S20)。そして、抽出された種別判定語を用いて文書種別を判定する(S30)。
The document type determination means 22 uses the character code of the
テキストデータ20から「核」、「開拓」、「推進」という種別判定語が抽出されるが、これらはビジネス文書の文書種別に対応づけられているので、文書種別判定手段22はこのテキストデータ20をビジネス文書の文書種別と判定する。
The type determination words “nuclear”, “development”, and “promotion” are extracted from the
〔表現校正〕
文書種別に応じた表現校正について説明する。表現校正手段23は文書種別判定手段22が判定した文書種別に応じて、テキストデータ20の表現を校正する。
[Proofreading]
The expression proofreading according to the document type will be described. The expression proofreading means 23 proofreads the expression of the
ビジネス文書、年賀状、プレゼンテーション資料、歓送迎会等の案内状、では好ましい表現が決まっていたり、使用すべきでない表現が知られている(以下、被修正表現という)。本実施形態では、文書種別が検出された後、テキストデータ20に被修正表現が含まれていた場合、被修正表現を校正する。被修正表現と校正後の表現は、校正情報DB132に記憶されている。
In business documents, New Year's cards, presentation materials, greeting cards such as welcome and farewell parties, expressions that are preferred or should not be used are known (hereinafter referred to as corrected expressions). In the present embodiment, after the document type is detected, if the corrected expression is included in the
図8は、校正情報DB132に記憶される情報の一例を示す。校正情報DB132では、文書種別毎に、被修正表現と校正後の表現が対応づけて記憶されている。例えば、ビジネス文書の場合、「開拓を行う」という被修正表現に「開拓推進」という表現が対応づけられており、また、「調査を行う」という被修正表現に「精査」という表現が対応づけられている。このように誤用ではない表現でも、よりビジネスに適した表現に校正することができる。
FIG. 8 shows an example of information stored in the
同様に、マナー上、修正した方がよい被修正表現について校正後の表現を対応づけておくことができる。
・お名前を頂戴できますでしょうか → お名前を伺えますでしょうか
・おまちください → おまちいただけますか
・後で → 後ほど
・一応 → 念のため
・今 → ただ今
・すぐ → 早速
・すごく → 非常に
・調査を行う → 精査する
・多分 → 推測するところ
・だれ → どなた
・どこ → どちら
・どう → どのように
・前に → 以前に
また、例えば年賀状の場合、漢字で記載した方が好ましい被修正表現に、校正後の表現を対応づけられている。
・あけまして → 明けまして
また、年賀状では、マナー上、修正した方がよい被修正表現に、校正後の表現が対応づけられている。「迎春」は簡略表現なので目上の人に対しては好ましくない。
・迎春 → 謹賀新年
また、年賀状で使用しがちな二重表現となる被修正表現に、校正後の表現が対応づけられている。「新年 あけましておめでとうございます」は、「新年」と「明けまして」の意味が重複する。
・新年 あけましておめでとうございます → 新年 おめでとうございます
また、年賀状では忌み言葉を避けるのがマナーであるので、忌み言葉に当たる被修正表現には校正後の表現が対応づけられている。
・去年 → 昨年
・枯れる → 乾燥する
・滅びる → なくなる
表現校正手段23は、文書種別に応じて校正情報DB132を参照して、テキストデータ20に含まれる被修正表現を校正後の表現に置き換える。図9は、表現校正手段23が文書種別に応じて表現を校正する手順を示すフローチャート図である。
Similarly, the corrected expression that should be corrected in manners can be associated with the corrected expression.
・ Can you give me your name → Can you ask me for your name ・ Please wait → Can I wait for you ・ Later → Later ・ For the time being → Just in case ・ Now → Right now → Immediately → Very → Very Investigate-> scrutinize-maybe-guess-who-who-who-where-how-how-before-before Also, for example, in the case of New Year cards An expression after proofreading is associated with the expression.
・ New Year → New Year In the New Year's card, the corrected expression should be corrected in the manners and should be corrected. “Welcome Spring” is a simple expression and is not desirable for the superior.
・ New Year's greeting → Tsuruga New Year In addition, the expression after proofreading is associated with the corrected expression that is the double expression that is often used in New Year's cards. “Happy New Year” has the same meaning as “New Year” and “Happy New Year”.
・ Happy New Year → Congratulations on the New Year Also, in New Year's cards, since it is a manner to avoid the abomination, the corrected expression corresponding to the apocalypse is associated with the corrected expression.
Last year → Last year, withering → Drying and ruining → Loss The expression proofreading means 23 refers to the
まず、情報処理装置111にテキストデータ20が入力される(S10)。例えば、「競争力のある製品を核にして開拓を行う。」というテキストデータ20が入力される。また、表現校正手段23は文書種別判定手段22が判定した文書種別を取得する(S110)。そして、校正情報DB132を参照して、被修正表現を校正後の表現に校正する(S120)。
First,
なお、表現校正手段23はアプリケーションソフトウェア27に、被修正表現を校正後の表現に置き換えるよう要求する。
The expression proofing means 23 requests the
図10は、ディスプレイ114に表示されるテキストデータ20の構成例を示す図である。校正前のテキストデータ20は「競争力のある製品を核にして開拓を行う。」であるが、「開拓を行う」がビジネス文書では被修正表現なので、テキストデータ20は「競争力のある製品を核にして開拓推進する。」に校正される。校正後の表現は、ユーザが把握できるよう下線を付されたり四角で囲まれたり、反転表示したり、色を変えて表現される。なお、校正後の表現を表示し、ユーザが校正を許可したら校正してもよい。
FIG. 10 is a diagram illustrating a configuration example of the
また、被修正表現によっては校正後の表現に複数の候補がある場合があるが、この場合は、複数の候補を選択可能とすることが好ましい。図11は校正後の表現の複数の候補が表示されたテキストデータ20の一例を示す。例えば、表現校正手段23は被修正表現「開拓を行う」に下線を付したり四角で囲む等して表示し、ユーザがマウス113で右クリックすると複数の候補を表示する。ユーザは複数の候補の中からテキストデータ20に適切な表現を選択できる。
Further, depending on the corrected expression, there may be a plurality of candidates in the expression after proofreading. In this case, it is preferable that a plurality of candidates can be selected. FIG. 11 shows an example of
〔文書構成の体裁の調整〕
文書種別に応じた文書構成の体裁の調整について説明する。文書構成手段24は、文書種別判定手段22が判定した文書種別に応じて、テキストデータ20の文書構成の体裁を整える。
[Adjustment of document structure]
The adjustment of the appearance of the document structure according to the document type will be described. The
ビジネス文書、年賀状、プレゼンテーション資料、歓送迎会等の案内状、では好ましい文書構成が決まっている場合が多い。本実施形態では、文書種別に応じて種々の文書構成を予め用意しておき、その文書構成にテキストデータ20の文書構成の体裁を整えることで、ユーザが文書構成を設定する煩わしさを低減する。文書種別毎の文書構成を指定する文書構成情報は文書構成情報DB133に記憶されている。
Business documents, New Year's cards, presentation materials, and invitations such as welcome and farewell parties often have favorable document configurations. In the present embodiment, various document configurations are prepared in advance according to document types, and the document configuration of the
<ビジネス文書>
図12は、ビジネス文書の文書構成の一例を示す。図12の文書構成例は、例えばA4の用紙の領域にテキストデータ20を配置するよう、複数の文字配置欄31〜36を有する。
<Business document>
FIG. 12 shows an example of the document configuration of a business document. The document configuration example of FIG. 12 includes a plurality of character arrangement fields 31 to 36 so that the
文字配置欄31〜36は、用紙に対する左上のコーナの位置が定められていると共に、フォント、文字のサイズ、太字・細字、センタリング、行間隔、文字間隔、文字色、等、予め設定されている。なお、「件名欄」など「」で囲まれた文字列はテキストデータ20を配置すると自動的に削除される。
In the character arrangement fields 31 to 36, the position of the upper left corner with respect to the paper is determined, and font, character size, bold / thin, centering, line spacing, character spacing, character color, etc. are set in advance. . It should be noted that a character string surrounded by “” such as “subject field” is automatically deleted when the
例えば、文字配置欄31は、用紙の右上に配置され、文書構成手段24がテキストデータ20の文書構成の体裁を整える日付をOSから取得して設定する。また、文字配置欄31にはテキストデータ20の作成者の氏名が配置される。作成者の氏名は、情報処理装置111にログインしたユーザの氏名が自動的に取得される。
For example, the
文字配置欄32は、テキストデータ20の件名を配置する欄で、例えば、ゴシック体で16〜20ポイントの文字をセンタリングして配置する欄である。文字配置欄33は、テキストデータ20の概略、背景、要約等を配置する欄で、例えば、明朝体で10.5ポイントの文字を左詰して配置する欄である。また、文字配置欄34,35は、テキストデータ20が伝達する核となる内容を配置する欄で、例えば、明朝体で10.5ポイントの文字を左詰して配置する欄である。文字配置欄34、35は、テキストデータ20によっては複数存在した方が便利であるため、図示するように複数用意されている(図では2個)。また、箇条書きのテキストデータ20に対応するため文字配置欄35には、番号(1)〜(3)が予め設定されている。また、文字配置欄36は、定型的に通知する内容を配置する欄で、例えば、明朝体で10.5ポイントの文字をセンタリングして配置する欄である。図ではさらに文字配置欄36を影つきの四角で囲むことで、通知する内容に視認しやすくしている。なお、この他、テキストデータ20を提出する宛先を示す欄、テキストデータ20の内容の問い合わせ先を示す欄、Jpegなど文字以外のオブジェクトを貼り付ける欄、等を設けてもよい。
The
文書構成手段24は、テキストデータ20を解析し、文字配置欄31〜36にテキストデータ20を配置する。図13は、文書構成手段24が、テキストデータ20を文書構成情報に従い構成する手順を示すフローチャート図である。
The
すでにユーザは、テキストデータ20をワープロソフトウェアなどのアプリケーションソフトウェア27で編集中であり、文書種別判定手段22により文書種別はビジネス文書であると判定されている。そして、ユーザが所定のメニューから文書構成手段24を起動すると図13のフローチャート図がスタートする。なお、文書構成の体裁の調整を容易にするため、テキストデータ20の所定範囲を選択してから文書構成手段24を起動してもよい。文書構成手段24は起動されると、日付とユーザの氏名をOSから取得し、文字配置欄31に配置する。
The user is already editing the
ここで、テキストデータ20は図14(a)に示すように次の文章であったとする。
これからの取組方法
市場調査
競合他社の調査
パンフレット作成
まず、文書構成手段24は、テキストデータ20の1行目の末尾に句読点があるか否か判定する(S210)。句読点がない場合は、テキストデータ20の件名である可能性が高いので、文書構成手段24は1行目を件名に対応した欄に配置する(S220)。図12では、文字配置欄32に「これからの取組方法」が配置される。
Here, it is assumed that the
Future Approach Method Market Research Competitor Survey Pamphlet Creation First, the document composition means 24 determines whether there is a punctuation mark at the end of the first line of the text data 20 (S210). If there is no punctuation mark, there is a high possibility that the subject of the
ついで、文書構成手段24は、段落に箇条書きがあるか否かを判定する(S230)。なお、段落とは、例えば字下げして始まる行から次に字下げのある行の直前をいう。箇条書きは、各行の最初に、「・」「(1)」「I」「◆」「A.」等の記号が付されることが多いので、これらの記号が検出された場合、箇条書きがあると判定する。また、箇条書きは行の終わりに句点「。」を付さないので、句点がない場合は箇条書きであると判定する。これらのいずれかを満たす場合に箇条書きであると判定してもよいし、全てを満たす場合に箇条書きであると判定しもよい。
Next, the
また、箇条書きの段落の次の段落は、1行空けて記載されることがあるので、箇条書きの段落は空行の手前までとすることができる。また、箇条書きの次の文が句点「。」で終了している場合は、句点「。」で終了する文の手前の行までを箇条書きを含む段落であると判定する。 In addition, since the paragraph following the bulleted paragraph may be described with one line left blank, the bulleted paragraph may be before the blank line. If the next sentence after the bulleted list ends with a punctuation mark “.”, The line preceding the sentence ending with the punctuation mark “.” Is determined to be a paragraph including the bulleted list.
図14(a)のテキストデータ20では、「市場調査」「競合他社の調査」「パンフレット作成」に句点「。」がないので、この3行は箇条書きを含む段落と判定される。段落の終了は、テキストデータ20の終了に一致している。
In the
段落に箇条書きがある場合(S230のYes)、文書構成手段24はその段落を箇条書きに対応した欄に配置する(S240)。図12では、箇条書きに対応した文字配置欄35に「市場調査」「競合他社の調査」「パンフレット作成」が配置される。
If there is a list item in the paragraph (Yes in S230), the
ついで、文書構成手段24は、「日時」又は「場所」の文字列があるか否かを判定する(S250)。なお、「日時」又は「場所」を含むことに加え、行の終わりに句点「。」が付されていないことを判定基準にくわえてもよい。
Next, the
「日時」又は「場所」の文字列がある場合(S250のYes)、日時、場所を含む段落は、定型的に通知する内容の段落であるので、文書構成手段24は、図12の文字配置欄36に配置する(S270)。 If there is a character string “date and time” or “place” (Yes in S250), the paragraph including the date and time and the place is a paragraph with the contents to be notified in a typical manner, and therefore the document composing means 24 performs the character arrangement of FIG. It arranges in the column 36 (S270).
文書構成手段24は、「日時」の後に連続して含まれる文字列(例えば20XX年1月1日)、「場所」の後に連続して含まれる文字列(例えばXX公園)を通知欄に配置する。
The
段落に「日時」又は「場所」の文字列がない場合(S250のNo)、文書構成手段24は上方の文字配置欄から順番に段落を配置する(S260)。図12では、文字配置欄33,34に配置される。
If there is no “date” or “place” character string in the paragraph (No in S250), the
文書構成手段24は以上の処理を段落毎にテキストデータ20が終了するまで繰り返す(S280)。
The
図14(b)は、文書構成手段24が図14(a)のテキストデータ20を文書構成した結果の一例を示す。「これからの取組方法」は文字配置欄32に配置されたので、大きめの文字かつ太文字に変更され、「市場調査」「競合他社の調査」「パンフレット作成」は文字配置欄35に配置されたので、行頭に(1)〜(3)の番号が付与されている。
FIG. 14B shows an example of a result of the
したがって、ユーザがテキストデータ20を入力するだけで、文書種別が判定され、表現が校正されると共に、文書種別に応じてテキストデータ20を適切に文書構成することができる。
Therefore, only by the user inputting the
ところで、図12のように紙面全体の文書構成を決定するのでなく、段落毎やユーザが選択した範囲など、紙面の一部のみの文書構成の体裁を整えてもよい。この場合、文書構成情報DB133には、文字配置欄32〜36が個別に登録されていて、ユーザの操作に応じて文字配置欄32〜36と同様の文書構成ボックスが一覧表示され、ユーザの選択に応じて、テキストデータ20が選択された文書構成ボックスのいずれかの文書構成の体裁に整える。
図15は、ディスプレイ114に表示されたテキストデータ20と文書構成ボックス41〜44の一例を示す。ユーザが所定のメニューから文書構成手段24を起動すると、アプリケーションソフトウェア27がフレームに分割され、文書構成ボックス41〜44が表示される。
By the way, instead of determining the document configuration of the entire page as shown in FIG. 12, the appearance of the document configuration of only a part of the page, such as each paragraph or a range selected by the user, may be arranged. In this case, the
FIG. 15 shows an example of the
文書構成ボックス41〜44は、「件名用」など概略の用途を表示すると共に、選択を容易にするため各文書構成ボックス41〜44のフォント、太字・細字、文字のサイズ、センタリング・左詰め・右詰め、等が表示されている。また、実際にテキストデータ20の文書構成の体裁を整えた場合の例として、「×××…」で示す文字列が表示されている。ユーザは、文書構成ボックス41〜44からテキストデータ20に適切な文書構成を選択することができる。
The
<年賀状>
続いて、年賀状の文書構成について説明する。図16は、年賀状の文書構成の一例を示す。図16の文書構成例は、例えばハガキ内の領域にテキストデータ20を配置するよう複数の文字配置欄37〜39を有し、また、イラスト欄40を有する。
<New Year's card>
Next, the document structure of New Year's cards will be described. FIG. 16 shows an example of a document structure for New Year's cards. The document configuration example of FIG. 16 has a plurality of
文字配置欄37〜39は、ハガキに対する左上のコーナの位置が定められていると共に、フォント、文字のサイズ、太字・細字、行間隔、文字間隔、文字色、等、予め設定されている。 In the character arrangement fields 37 to 39, the position of the upper left corner with respect to the postcard is determined, and font, character size, bold / thin character, line interval, character interval, character color, and the like are set in advance.
例えば、文字配置欄37は、新年の挨拶を配置する欄で、毛筆体で20〜24ポイントの文字を配置する欄である。また、文字配置欄38は、その他の文章を配置する欄で、例えば、毛筆体で12ポイントの文字を配置する欄である。文字配置欄39は、新年の西暦を設定する欄で、文書構成手段24がOSから取得した西暦に1を足して設定する。
For example, the
また、イラスト欄40は、JPEG、GIF、TIFF等の画像データを配置する欄である。イラスト欄40に配置する画像データは予め文書構成情報DB133に登録されている。ユーザが優先的にイラスト欄40に配置する画像データを設定しておいてもよいし、干支に応じて自動的に配置してもよい。文書構成情報DB133には、干支毎の画像データが記憶されている。また、画像データの好みはユーザによって異なるので、年齢に対応づけて干支の画像データが記憶されている。例えば、年齢層が低いユーザ向けに、干支の動物を擬人化したアニメーション的な画像データが記憶されており、年齢層が高いユーザ向けに、干支の動物のイラストに松をモチーフにしたイラストがあしらわれた画像データが記憶されている。なお、ユーザの年齢は情報処理装置111に登録されている。
The
文書構成手段24は、テキストデータ20を解析し、文字配置欄37、38にテキストデータ20を配置する。図17は、文書構成手段24がテキストデータ20を文書構成する手順を示すフローチャート図である。
The
すでにユーザは、テキストデータ20をワープロソフトウェアなどのアプリケーションソフトウェア27で編集中であり、文書種別判定手段22により文書種別は年賀状であると判定されている。そして、ユーザが所定のメニューから文書構成手段24を起動すると図17のフローチャート図がスタートする。なお、文書構成の体裁の調整を容易にするため、テキストデータ20の所定範囲を選択してから文書構成手段24を起動してもよい。文書構成手段24は起動されると、西暦をOSから取得し、文字配置欄39に配置する。
The user is already editing the
ここで、テキストデータ20は図18(a)に示すように次の文章であったとする。
謹賀新年
旧年中は大変お世話になりました
今年もよろしくお願い致します
まず、文書構成手段24は、テキストデータ20から新年の挨拶を検出する(S310)。文書種別が年賀状であるので、謹賀新年、賀正などの新年の挨拶が検出される。
Here, it is assumed that the
Thank you very much for your help during the old year of Tsuruga New Year. First of all, the document composing means 24 detects the greeting of the New Year from the text data 20 (S310). Since the document type is a New Year's card, New Year greetings such as Tsuruga New Year and Kasho are detected.
そして、文書構成手段24は検出した新年の挨拶を対応した欄に配置する(S320)。図16では、文字配置欄37に「謹賀新年」が配置される。
Then, the
ついで、文書構成手段24は、その他の文章を対応する欄に配置する(S330)。図18(a)のテキストデータ20では、「旧年中は大変お世話になりました 今年もよろしくお願い致します」が、文字配置欄38に配置される。「謹賀新年」やその他の文のフォント等をユーザの年齢層に適当なフォント等で記載してもよい。
Next, the
ついで、文書構成手段24は、干支に応じた画像データをイラスト欄40に配置する(S340)。文書構成手段24は、西暦から対応する干支を算出し、ユーザの年齢層に適当な画像データを文書構成情報DB133から抽出して、イラスト欄40に配置する。画像データの大きさとイラスト欄40の大きさが一致しない場合は、拡大又は縮小してもよい。
Next, the
図18(b)は、文書構成手段24が図18(a)のテキストデータ20を文書構成した結果の一例を示す。「謹賀新年」は文字配置欄37に配置されたので、毛筆体かつ大きめの文字で配置されている。イラスト欄40には干支(卯年の場合)にちなんでウサギの画像データが配置されている。
FIG. 18B shows an example of a result of document composition of the
したがって、ユーザがテキストデータ20を入力するだけで、文書種別が判定され、表現が校正されると共に、文書種別に応じてテキストデータ20を適切に文書構成することができる。
Therefore, only by the user inputting the
〔変形例〕
上述した実施形態では情報処理装置111が文書種別を判定し、表現を校正し、また、文書構成の体裁を整えたが、画像形成装置110が同様な処理を行ってもよい。
[Modification]
In the embodiment described above, the
画像形成装置110はコンピュータを搭載しているのでプログラム134を実行することで、文書種別判定手段22、表現校正手段23、文書構成手段24及び文字列抽出手段25として機能できる。
Since the
テキストデータ20を例えば印刷する場合、テキストデータ20は文字コードのまま画像形成装置110に送信される場合と、情報処理装置111でラスタデータに変換されてから画像形成装置110に送信される場合があるが、オフィスユースでは文字コードのまま画像形成装置110に送信されるので、画像形成装置110は上述した実施形態と同様に文書種別を判定し、表現を校正し、また、文書構成の体裁を整えることができる。
For example, when printing the
図19は、画像形成装置110が文書種別を判定する手順のシーケンス図を示す。情報処理装置111のアプリケーションソフトウェア27は画像形成装置110にテキストデータ20の印刷を要求する(S410)。テキストデータ20の送信時、情報処理装置111はテキストデータ20と共に、文書種別に応じた表現の校正及び文書構成の体裁の調整を要求する情報を添付する。
FIG. 19 shows a sequence diagram of a procedure in which the
この情報に基づき画像形成装置110の文字列抽出手段25は文字列を抽出し(S420)、文書種別判定手段22はテキストデータ20の文書種別を判定する(S430)。
Based on this information, the character
ついで、表現校正手段23は文書種別に応じて表現を校正し(S440)、文書構成手段24は文書構成の体裁を整える(S450)。印刷手段は体裁が整えられた文書構成のテキストデータ20を印刷することができる(S460)。印刷が終了すると、画像形成装置110は印刷終了を示す情報を情報処理装置111に送信する(S470)。
Next, the expression proofreading means 23 proofreads the expression according to the document type (S440), and the document composition means 24 arranges the appearance of the document structure (S450). The printing means can print the
なお、印刷の前に、文書構成手段24が配置したテキストデータ20の配置をイメージデータにして情報処理装置111に送信し、ユーザが印刷を許可した場合に、調整後の文書構成で印刷してもよい。また、ネットワークNを介して接続されたサーバにより文書構成の体裁の調整を要求し、印刷のみを画像形成装置110にて実行してもよい。
Before printing, the arrangement of the
本変形例によれば、画像形成装置110がテキストデータ20の文書構成の体裁を自動的に調整するので、各情報処理装置111が文書種別判定手段22、表現校正手段23、文書構成手段24及び文字列抽出手段25を備える必要がなく、情報処理装置111のコストを低減できる。
According to this modification, since the
本実施例では公序良俗を害するおそれの高い文書種別を判定し、このような文書種別のテキストデータ20の転送の禁止し、また、公的機関に通報する情報処理装置111について説明する。公序良俗を害するおそれの高いテキストデータ20とは、例えば、読んだ者に羞恥心や不快感を呼び起こさせ、また、世間体を著しく害する単語を含むものである。本実施例では、一例として、迷惑な単語、いじめの単語、ストーカー用単語、反社会性単語を含むテキストデータ20を、公序良俗を害するおそれがあるものとする。
In this embodiment, an
公序良俗を害するおそれの高いテキストデータ20は、作成者がテキストデータ20を作成した以降であれば判定可能となるが、作成者が本実施形態の情報処理装置111を適用することは考えにくい。また、公序良俗を害するおそれの高いテキストデータ20は、主に電子メールで送信されたり、電子掲示板に投稿されることが多い。このため、受信者、電子掲示板の管理人、又は、プロバイダのメールサーバ等が使用する情報処理装置111が、文書種別を判定することが考えられる。したがって、電子メールや投稿用のポストデータが作成者の端末から送信された以降であれば、テキストデータ20の文書種別を判別できる。
The
ところで、公序良俗を害するおそれが高い文書種別であると判定された場合、受信者に送信する必要性は低く、また、電子掲示板に掲示する必要性も低い。受信者に送信したり、電子掲示板に掲示してしまうと、公序良俗を害するおそれが高いテキストデータ20を送信者が作成することを助長することにもなる。このため、公序良俗を害するおそれが高いテキストデータ20は、プロバイダのメールサーバが受信者への送信を禁止することが好ましい。また、公序良俗を害するおそれが高いか否か不明な場合(必ずしも公序良俗を害するとは言えない場合)、例えば、迷惑な単語等を削除して受信者へ送信してもよい。いずれにしても、受信者が公序良俗を害するおそれが高いテキストデータ20を受信したり、掲示板で見たりして不快な思いをすることを防止できる。
By the way, when it is determined that the document type has a high possibility of harming public order and morals, it is less necessary to transmit to the recipient, and the necessity to post on the electronic bulletin board is also low. If it is sent to the receiver or posted on the electronic bulletin board, it will help the sender to create
また、公序良俗を害するおそれが高い電子メール等を送信する送信者を識別する情報(例えば、電子メールの送信者のメールアドレス、ポストデータを送信した端末のIPアドレス等)を記録しておけば、犯罪性の高い悪質な電子メールや電子掲示板の送信者の特定に結びつけることができる。なお、テキストデータ20の文書種別の判定方法は電子メールとポストデータで同じなので、以下では、主に電子メールを例に説明する。
In addition, if information that identifies a sender who sends an e-mail or the like that is likely to harm public order and morals (for example, the e-mail address of the e-mail sender, the IP address of the terminal that sent the post data, etc.) is recorded, It can be linked to the identification of the sender of malicious e-mail or bulletin board with high criminal characteristics. Note that the method for determining the document type of the
〔機能構成図〕
図20は、情報処理装置111の機能構成図の一例を示す。なお、図20において図4と同一構成部には同一の符号を付しその説明は省略する。上記のとおり、図20の情報処理装置111は、例えば、プロバイダや携帯電話事業者のSMTPサーバ、POPサーバである。情報処理装置111が電子メール等で受信したテキストデータ20はいったん記憶装置126に記憶され、転送する前に文書種別判定手段22がテキストデータ20を抽出し、種別判定語から文書種別を判定する。
[Function configuration diagram]
FIG. 20 shows an example of a functional configuration diagram of the
また、転送禁止手段28は、公序良俗を害するおそれが高いテキストデータ20の転送を禁止する。転送の禁止とは、テキストデータ20が電子メールの場合は、例えば、SMTPサーバからPOPサーバへの転送の禁止、POPサーバから受信者の端末への送信の禁止である。また、テキストデータ20が電子掲示板への投稿用のポストデータの場合、ポストデータを端末で表示するために端末に送信することを禁止する。
Further, the transfer prohibiting means 28 prohibits the transfer of the
また、公序良俗を害するおそれが高いか否か不明な場合は、表現校正手段23はテキストデータ20から種別判定語を削除した後、電子メールの転送を許可する。また、プロパティ情報記録手段26は、プロパティ情報DB135に公序良俗を害するおそれが高いテキストデータ20を送信した送信者などのプロパティ情報を記録する。さらに、通報手段27は、プロパティ情報DB135を参照して、公序良俗を害するおそれが高いテキストデータ20を多く送信する送信者を警察などの公的機関に通報する。
If it is unclear whether the public order and morals are likely to be harmed, the expression proofreading means 23 deletes the type determination word from the
〔文書種別の判定〕
公序良俗を害するおそれの高いテキストデータ20の文書種別の判定について説明する。図21は、文書種別情報DB131に記憶される情報の一例を示す。図21では文書種別に対応づけて、種別判定語及び種別判定語を構成する文字の文字コードが登録されている。図21では、公序良俗を害するおそれの高い文書種別として、迷惑文書、いじめ文書、ストーカー文書、反社会文書、を挙げた。
[Determination of document type]
The determination of the document type of the
文書種別判定手段22は、テキストデータ20に含まれた種別判定語と文書種別情報DB131の一連の文字コードを比較することで、種別判定語に対応する文書種別を抽出することができる。例えば、「エッチ」「淫ら」「人妻」「ホテル直行」には迷惑文書の文書種別が対応づけられており、「死ね」「うざい」「きもい」にはいじめ文書の文書種別が対応づけられており、「会いたい」にはストーカ文書の文書種別が対応づけられており、「拳銃」「ダイナマイト」には反社会文書の文書種別が対応づけられている。
The document
文書種別判定手段22は、種別判定語に基づき文書種別情報DB131を参照して、1つのテキストデータ20毎に、それぞれの種別判定語に対応づけられた文書種別を抽出する。そして、所定数以上(例えば、3個以上)の種別判定語が抽出された場合、文書種別判定手段22は、抽出された種別判定語に対応づけられた文書種別であると判定する。なお、1つのテキストデータ20から異なる文書種別が検出された場合、検出された回数が最も多い文書種別に属すると判定すればよい。本実施例ではどの文書種別と判定しても、それらは公序良俗を害するおそれが高いテキストデータ20であり、種別判定語が削除されたり、転送が禁止される点で同じであるが、このように厳密に区別しておくことで文書種別毎の処理も可能となる(例えば、通報する公的機関を切り替える)。
The document
また、種別判定語が所定数未満(例えば、3個未満)の場合、文書種別判定手段22は、公序良俗を害するおそれが高いか否か不明であると判定する。
When the number of type determination words is less than a predetermined number (for example, less than 3), the document
〔文書種別の判定に応じた処理〕
文書種別判定手段22が文書種別を判定した結果、テキストデータ20は、公序良俗を害するおそれがない、公序良俗を害するおそれが高い、又は、公序良俗を害するおそれが高いか否か不明の、3つの態様に区分することができる。公序良俗を害するおそれがない場合、テキストデータ20はそのまま転送が許可される。
[Processing according to document type determination]
As a result of the document type determination means 22 determining the document type, the
公序良俗を害するおそれが高いか否か不明の場合、テキストデータ20から種別判定語が削除される。例えば、「お前うざい、きもい」というテキストデータ20の場合、テキストデータ20は受信者は「お前(不適切な表現があるので省略しました)、(不適切な表現があるので省略しました)」というテキストデータ20を受信することになる。受信者が不快な思いをすることを防止できる。
If it is unclear whether there is a high risk of harming public order and morals, the type determination word is deleted from the
なお、この場合も、プロパティ情報記録手段26が、プロパティ情報DB135にこのテキストデータ20を送信した送信者などのプロパティ情報を記録しておくことができる。公序良俗を害するおそれが高いかどうか不明な場合にも、プロパティ情報DB135に記録することで、例えば悪意のある送信者が、1回に送信するテキストデータ20に含まれる文書種別判定語の数を少なくし、送信回数を増やしてテキストデータ20を送信する場合にも、該送信者を抽出することができる。
Also in this case, the property information recording means 26 can record property information such as the sender who transmitted the
一方、「あの映画きもい、出演者が死ぬ場面も多いし…」というテキストデータ20の場合、「あの映画(不適切な表現があるので省略しました)、出演者が(不適切な表現があるので省略しました)場面も多いし…」に修正されたテキストデータ20が受信者に送信される。このテキストデータ20は、種別判定語はあるが、実際には映画の内容を論評したものであるで、受信者又は受信者から通知された送信者が、メールサーバに元のテキストデータ20の再送を要求すると、種別判定語が削除されていないテキストデータ20が受信者に送信される。
On the other hand, in the case of the
したがって、テキストデータ20に種別判定語が含まれていても、実際の内容を人間が判別して、元のテキストデータ20を送信することができる。プロパティ情報をプロパティ情報DB135に記録した場合、再送要求によってプロパティ情報から削除される。
Therefore, even if the
テキストデータ20の再送要求が面倒なユーザ、種別判定語を厭わないユーザは、メールサーバに登録される、公序良俗を害するおそれが高いか否か不明なテキストデータ20の配信にかかるポリシーに、削除せず配信するよう設定することができる。
Users who are troublesome to request re-sending of
公序良俗を害するおそれが高い場合、転送禁止手段28はテキストデータ20の転送を禁止し、また、プロパティ情報記録手段26はプロパティ情報DB135にテキストデータ20のプロパティ情報を記録する。
When there is a high possibility of harming public order and morals, the
図22は、プロパティ情報DB135に記録されるプロパティ情報の一例を示す。図22に示すように、プロパティ情報DB135に記録されるプロパティ情報は、送信者の電子メールアドレス、受信者(宛先)の電子メールアドレス、文書種別、種別判定語の数、送信日時、等である。したがって、公序良俗を害するおそれが高いテキストデータ20を送信する送信者及び受信者の電子メールアドレスを検出でき、日時からその頻度、種別判定語の数から悪質さを把握できる。
FIG. 22 shows an example of property information recorded in the
なお、プロパティ情報だけでなく、テキストデータ20そのものを記録しておくことが好ましい。後述する公的機関への通報時には重要な証拠となるからである。
It is preferable to record not only the property information but also the
図23は、文書種別判定手段22が文書種別を判定する手順を示すフローチャート図である。まず、情報処理装置111に電子メールなどのテキストデータ20が送信される。例えば、テキストデータ20が「うざい、うざい、うざい、うざい…。」というテキストデータ20であるとすると、文書種別判定手段22は、「うざい」の文字コード、82A4「う」、82B4「ざ」、82A2「い」を検出して、文書種別情報DB131に登録された種別判定語から「うざい」を一致する文字列として抽出する(S20)。そして、抽出された種別判定語を用いて文書種別を判定する(S30)。
FIG. 23 is a flowchart showing a procedure in which the document
テキストデータ20から「うざい」という種別判定語が抽出されるが、これらはいじめ文書の文書種別に対応づけられているので、文書種別判定手段22はこのテキストデータ20をいじめ文書の文書種別と判定する。
Although the type determination word “Uzai” is extracted from the
情報処理装置111は、公序良俗を害するおそれの程度に応じて、テキストデータ20を処理する(S40)。まず、公序良俗を害するおそれがない場合、文書種別判定手段22はテキストデータ20の転送を許可する。
The
公序良俗を害するおそれが高い場合、転送禁止手段28はテキストデータ20の転送を禁止する(S60)。そして、プロパティ情報記録手段26は、そのテキストデータ20を送信した送信者の電子メールアドレス、受信者の電子メールアドレス、文書種別、種別判定語の数、送信日時をプロパティ情報DB135に記録する。また、公序良俗を害するおそれが高いかどうか不明な場合、表現校正手段23はテキストデータ20から種別判定語を削除する(S80)。そして、文書種別判定手段22はテキストデータ20の転送を許可する(S90)。公序良俗を害するおそれが高いかどうか不明な場合にも、プロパティ情報DB135に記録する。
If there is a high possibility of harming public order and morals, the transfer prohibiting means 28 prohibits the transfer of the text data 20 (S60). Then, the property
〔公的機関への通報〕
図23のような手順により、公序良俗を害するおそれが高いテキストデータ20を受信者に送信することを防止できる。しかしながら、送信回数が多い悪質なテキストデータ20については、警察や管轄省庁などの公的機関へ通報することが好ましい。例えば、電子メールや電子掲示板上の発言でも、刑法上の名誉毀損罪や民法上の不法行為、ストーカー規制法のストーカー行為、等に該当する場合がある。公的機関は種々あるが、文書種別に応じて通報先を切り替えることが好ましい。例えば、迷惑文書、ストーカー文書、反社会文書の場合は警察に、いじめ文書の場合はいじめ相談窓口や文部科学省、教育委員会、校長、等である。
[Reports to public institutions]
With the procedure as shown in FIG. 23, it is possible to prevent the
通報手段27は、プロパティ情報DB135に記録された送信者の電子メールアドレス等を解析して、例えば10回以上の送信のように悪質なテキストデータ20の送信について、公的機関へ通報する。悪質な送信行為には、例えば次のような態様がある。
a)一人の送信者から → 一人の受信者
b)一人の送信者から → 複数の受信者
c)複数の送信者から → 一人の受信者
d)複数の送信者から → 複数の受信者
a)の態様は、例えば、迷惑文書、ストーカー文書やいじめ文書のように、特定の加害者Aが特定の被害者Bにテキストデータ20を送信する態様である。b)の態様は、例えば、特定の加害者Aが、特定の被害者Bの名誉毀損等のため複数の第三者X〜Zにテキストデータ20を送信する態様、又は、特定の加害者Aが、反社会文書を複数の第三者X〜Zにテキストデータ20を送信する態様である。c)の態様は、例えば、いじめ文書のように、特定の複数の加害者A、A'、A''が特定の被害者Bにテキストデータ20を送信する態様である。また、d)の態様は、例えば、特定の加害者A、A'、A''等が、特定の被害者Bの名誉毀損等のため複数の第三者X〜Zにテキストデータ20を送信する態様である。
The reporting means 27 analyzes the sender's e-mail address or the like recorded in the
a) From one sender → One recipient b) From one sender → Multiple recipients c) From multiple senders → One recipient d) From multiple senders → Multiple recipients a) This mode is a mode in which the specific perpetrator A transmits the
公序良俗を害する態様としては、a)及びc)の態様が最も多いと考えられる。これに対し、b)d)の態様は、第三者X〜Zの電子メールアドレスを特定の加害者A等が取得している必要があり、また、第三者X〜Zは特定の被害者Bの知人である必要があるため、公序良俗を害する態様としては少ない。 Aspects a) and c) are thought to be the most common aspects of harming public order and morals. On the other hand, the aspect of b) d) requires that a specific perpetrator A or the like obtains the e-mail address of the third party X to Z, and the third party X to Z Since it is necessary to be an acquaintance of the person B, there are few aspects that harm public order and morals.
したがって、最も簡単に加害者Aを特定するには、プロパティ情報DB135に記録された送信者の電子メールアドレスの数が多い(例えば10以上)送信者を抽出すればよい( a)b)の態様)。また、送信者が複数の電子メールアドレスを使い分けて、テキストデータ20を送信する場合でも、テキストデータ20の宛先になることが多い(例えば、10回以上)受信者のメールアドレスが特定できる( c)の態様)。この場合でもいじめやストーカー等の行為であるとしてよいので、同じ受信者のメールアドレスに送信した複数の送信者が通報の対象となる。したがって、電子メールを用いて公序良俗を害するおそれが高いテキストデータ20を送信する態様のほとんど(a)〜c))に対し有効である。
Therefore, in order to identify the perpetrator A most easily, it is only necessary to extract a sender having a large number (for example, 10 or more) of the sender's e-mail addresses recorded in the property information DB 135 (a) b) ). Further, even when the sender uses a plurality of e-mail addresses to transmit the
なお、b)やd)の態様は、電子メールよりも電子掲示板の態様に近いので、テキストデータ20を電子掲示板にアップロードした端末のIPアドレスが、送信者(アップロードした者)を特定する手がかりとなる。このため、プロパティ情報記録手段26は、端末のIPアドレスをプロパティ情報DB135に記録する。
Since the aspects of b) and d) are closer to those of electronic bulletin boards than e-mails, the IP address of the terminal that uploaded the
通報手段27は、プロパティ情報DB135に記録された数の多い送信者の電子メールアドレス、又は、記録された数の多い受信者の電子メールアドレスに送信した送信者の電子メールアドレスを公的機関に通報する。より好ましくは、公的機関への送信時に、プロバイダの電子証明やタイムスタンプを添付することで、通報手段27の通報の証拠機能が向上する。
The
これにより公的機関は、プロバイダ責任制限法及び関連するガイドラインに基づきプロバイダ等に送信者の情報を開示するよう要求でき、送信者の情報から実際の住所、氏名、連絡先等を特定することができるようになる。 This allows public organizations to request the provider to disclose the sender's information based on the Provider Liability Limitation Law and related guidelines, and specify the actual address, name, contact information, etc. from the sender's information. Will be able to.
図24は、通報手段27がテキストデータ20の送信者を抽出する手順を示すフローチャート図の一例を示す。図24のフローチャート図は、例えば、所定のサイクル時間(1日1回)毎に繰り返し実行される。
FIG. 24 shows an example of a flowchart showing a procedure for the reporting means 27 to extract the sender of the
まず、通報手段27は、プロパティ情報DB135に例えば10以上記録された送信者の電子メールアドレスを抽出する(S510)。これによりa)及びb)の態様の送信者を検出することができる。
First, the reporting means 27 extracts the sender's e-mail address recorded in the
ついで、通報手段27は、プロパティ情報DB135に例えば10以上記録された受信者に送信する送信者の電子メールアドレスを抽出する(S520)。これによりc)の態様の送信者を検出することができる。
Next, the notification means 27 extracts the sender's e-mail address to be transmitted to the receiver recorded in the
かかる処理により、単に公序良俗を害するおそれの高いテキストデータ20の送信を禁止するだけでなく公的機関に通報することができるので、自動的に証拠保存され、公的機関も犯罪検挙がしやすくなり、さらなる犯罪を抑止することができるようになる。
This process not only prohibits the transmission of
20 テキストデータ
21 IM(インプットメソッド)
22 文書種別判定手段
23 表現校正手段
24 文書構成手段
26 プロパティ情報記録手段
27 通報手段
28 転送禁止手段
31〜39 文字配置欄
40 イラスト欄
110 画像形成装置
111 情報処理装置
112 キーボード
113 マウス
114 ディスプレイ
126 記憶装置
131 文書種別情報DB
132 校正情報DB
133 文書構成情報DB
134 プログラム
135 プロパティ情報DB
20
22 Document
132 Calibration information DB
133 Document configuration information DB
134
Claims (10)
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段と、
前記種別判定手段が判定した文書データの文書種別に対応づけて前記文書構成情報記憶手段に記憶された前記文書構成情報に基づき、入力された文書データの体裁を整える文書構成手段と、
文書種別毎に、誤字、脱字及び文法誤用以外の校正前の文字又は文字列に対応づけて、校正後の文字又は文字列を記憶した校正情報記憶手段と、
前記文書データ入力手段により入力された文書データに、前記校正情報記憶手段に記憶された校正前の文字又は文字列が記憶されている場合、
前記種別判定手段が判定した、入力された文書データの文書種別に応じて、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正する校正手段と、を有し、
前記文書構成手段は、前記文書構成情報を構成例と共に表示し、文書データの任意の文字列に前記文書構成情報を適用する操作が受け付けられた場合、前記任意の文字列の体裁を整える、ことを特徴とする情報処理装置。 Document type information storage means for storing characters or character strings used in the document data of the document type in association with the document type of the document data;
Document data input means for inputting document data;
A type determination unit that determines the document type of the input document data based on the document type stored in the document type information storage unit in association with the character or character string included in the document data input by the document data input unit. When,
Document configuration information storage means for storing document configuration information for designating one or more fonts, sizes, thicknesses of characters of document data or arrangement positions of characters or character strings for each document type,
A document composition unit that arranges the appearance of the input document data based on the document structure information stored in the document structure information storage unit in association with the document type of the document data determined by the type determination unit;
A proofreading information storage means for storing a proofread character or character string in association with a character or character string before proofreading other than typographical error, omission and grammatical misuse for each document type,
When the document data input by the document data input unit stores characters or character strings before calibration stored in the calibration information storage unit,
A calibrating unit that calibrates a character or character string before proofreading with a calibrated character or character string stored in the proofreading information storage unit according to the document type of the input document data determined by the type determining unit. Have
The document configuration means displays the document configuration information together with a configuration example, and when an operation to apply the document configuration information to an arbitrary character string of document data is accepted, arranges the appearance of the arbitrary character string. An information processing apparatus characterized by the above.
ことを特徴とする請求項1記載の情報処理装置。 The type determination unit counts the number stored in the document type information storage unit among the characters or character strings included in the document data input by the document data input unit, for each document type. It is determined that the document data is the largest document type.
The information processing apparatus according to claim 1 .
前記文書構成手段は、ビジネス文書の前記文書構成情報に従い、文書データの箇条書きの行頭に行頭記号を付加する、
ことを特徴とする請求項1又は2記載の情報処理装置。 When the type determination unit determines that the document data input by the document data input unit is a business document used in office work or transactions,
The document composition means adds a bullet to the beginning of a bulleted list of document data in accordance with the document structure information of a business document.
The information processing apparatus according to claim 1 or 2 .
前記文書構成手段は、ビジネス文書の前記文書構成情報に従い、文書データに含まれた日時情報又は場所情報を所定の位置に配置する、
ことを特徴とする請求項1〜3いずれか1項記載の情報処理装置。 When the type determination unit determines that the document data input by the document data input unit is a business document used in office work or transactions,
The document configuration means arranges date and time information or location information included in document data at a predetermined position in accordance with the document configuration information of a business document.
The information processing apparatus according to any one of claims 1 to 3 .
前記文書構成手段は、年賀状の前記文書構成情報に従い、文書データに含まれる新年の挨拶を構成する文字のフォントを毛筆体に変換する、
ことを特徴とする請求項1又は2項記載の情報処理装置。 When the type determination unit determines that the document data input by the document data input unit is a New Year's card,
The document composition means converts a font of characters constituting a New Year greeting included in the document data into a brush in accordance with the document structure information of a New Year card.
The information processing apparatus according to claim 1 or 2 .
前記種別判定手段が、前記文書データ入力手段により入力された文書データを年賀状と判定した場合、
前記文書構成手段は、文書データを入力した年の次の年の干支に対応した動物の画像データを前記文書構成情報記憶手段から抽出し、年賀状の前記文書構成情報に従い、前記年賀状の所定の位置に配置する、
ことを特徴とする請求項1又は2項記載の情報処理装置。 The document configuration information storage means stores image data of animals corresponding to each zodiac for each zodiac,
When the type determination unit determines that the document data input by the document data input unit is a New Year's card,
The document composition means extracts the animal image data corresponding to the zodiac of the year following the year in which the document data was input from the document composition information storage means, and according to the document structure information of the new year card, a predetermined position of the new year card To place in the
The information processing apparatus according to claim 1 or 2 .
文書データに含まれた校正前の文字又は文字列と共に、複数の校正後の文字又は文字列を表示装置に表示し、
複数の校正後の文字又は文字列のうちポインティングデバイスにより選択された文字又は文字列を用いて、文書データの校正前の文字又は文字列を校正する、
ことを特徴とする請求項1記載の情報処理装置。 The calibration means includes
A plurality of characters or character strings after proofreading are displayed on the display device together with the characters or character strings before proofreading included in the document data,
Using a character or character string selected by a pointing device among a plurality of proofread characters or character strings, the character or character string before proofreading of document data is proofread.
The information processing apparatus according to claim 1 .
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段と、
前記種別判定手段が判定した文書データの文書種別に対応づけて前記文書構成情報記憶手段に記憶された前記文書構成情報に基づき、入力された文書データの体裁を整える文書構成手段と、
文書種別毎に、誤字、脱字及び文法誤用以外の校正前の文字又は文字列に対応づけて、校正後の文字又は文字列を記憶した校正情報記憶手段と、
前記文書データ入力手段により入力された文書データに、前記校正情報記憶手段に記憶された校正前の文字又は文字列が記憶されている場合、
前記種別判定手段が判定した、入力された文書データの文書種別に応じて、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正する校正手段と、を有し、
前記文書構成手段は、前記文書構成情報を構成例と共に表示し、文書データの任意の文字列に前記文書構成情報を適用する操作が受け付けられた場合、前記任意の文字列の体裁を整える、ことを特徴とする画像形成装置。 Document type information storage means for storing characters or character strings used in the document data of the document type in association with the document type of the document data;
Document data input means for inputting document data;
A type determination unit that determines the document type of the input document data based on the document type stored in the document type information storage unit in association with the character or character string included in the document data input by the document data input unit. When,
Document configuration information storage means for storing document configuration information for designating one or more fonts, sizes, thicknesses of characters of document data or arrangement positions of characters or character strings for each document type,
A document composition unit that arranges the appearance of the input document data based on the document structure information stored in the document structure information storage unit in association with the document type of the document data determined by the type determination unit;
A proofreading information storage means for storing a proofread character or character string in association with a character or character string before proofreading other than typographical error, omission and grammatical misuse for each document type,
When the document data input by the document data input unit stores characters or character strings before calibration stored in the calibration information storage unit,
A calibrating unit that calibrates a character or character string before proofreading with a calibrated character or character string stored in the proofreading information storage unit according to the document type of the input document data determined by the type determining unit. Have
The document configuration means displays the document configuration information together with a configuration example, and when an operation to apply the document configuration information to an arbitrary character string of document data is accepted, arranges the appearance of the arbitrary character string. An image forming apparatus.
文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段、から情報を読み取るコンピュータを、
文書データを入力する文書データ入力手段と、
前記文書データ入力手段により入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定する種別判定手段と、
前記種別判定手段が判定した文書データの文書種別に対応づけて前記文書構成情報記憶手段に記憶された前記文書構成情報に基づき、入力された文書データの体裁を整える文書構成手段と、
文書種別毎に、誤字、脱字及び文法誤用以外の校正前の文字又は文字列に対応づけて、校正後の文字又は文字列を記憶した校正情報記憶手段と、
前記文書データ入力手段により入力された文書データに、前記校正情報記憶手段に記憶された校正前の文字又は文字列が記憶されている場合、
前記種別判定手段が判定した、入力された文書データの文書種別に応じて、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正する校正手段と、として機能させ、
前記文書構成情報を構成例と共に表示し、文書データの任意の文字列に前記文書構成情報を適用する操作が受け付けられた場合、前記任意の文字列の体裁を整える、処理を実行させるプログラム。 Document type information storage means for storing characters or character strings used in the document type in association with the document type of the document data;
A computer that reads information from a document configuration information storage unit that stores document configuration information that specifies one or more fonts, sizes, and thicknesses of characters of document data, or arrangement positions of characters or character strings for each document type ,
Document data input means for inputting document data;
A type determination unit that determines the document type of the input document data based on the document type stored in the document type information storage unit in association with the character or character string included in the document data input by the document data input unit. When,
A document composition unit that arranges the appearance of the input document data based on the document structure information stored in the document structure information storage unit in association with the document type of the document data determined by the type determination unit;
A proofreading information storage means for storing a proofread character or character string in association with a character or character string before proofreading other than typographical error, omission and grammatical misuse for each document type,
When the document data input by the document data input unit stores characters or character strings before calibration stored in the calibration information storage unit,
A calibrating unit that calibrates a character or character string before proofreading with a calibrated character or character string stored in the proofreading information storage unit according to the document type of the input document data determined by the type determining unit. Function as,
A program for displaying the document configuration information together with a configuration example and executing a process for adjusting the appearance of the arbitrary character string when an operation for applying the document configuration information to an arbitrary character string of document data is received .
種別判定手段が、文書データの文書種別と対応づけて、該文書種別で用いられる文字又は文字列を記憶する文書種別情報記憶手段を参照して、入力された文書データが含む文字又は文字列に対応づけて前記文書種別情報記憶手段に記憶された文書種別に基づき、入力された文書データの文書種別を判定するステップと、
文書構成手段が、判定された文書データの文書種別に応じて、文書種別毎に、文書データの文字のフォント、サイズ、太さ、又は、文字若しくは文字列の配置位置の一以上を指定する文書構成情報を記憶する文書構成情報記憶手段を参照して、前記文書構成情報記憶手段に記憶された前記文書構成情報に従い、入力された文書データの体裁を整えるステップと、
文書種別毎に、誤字、脱字及び文法誤用以外の校正前の文字又は文字列に対応づけて、校正後の文字又は文字列を記憶した校正情報記憶手段の、校正前の文字又は文字列が、前記文書データ入力手段により入力された場合、
前記種別判定手段が判定した、入力された文書データの文書種別に応じて、校正手段が、前記校正情報記憶手段に記憶された校正後の文字又は文字列により校正前の文字又は文字列を校正するステップと、
前記文書構成手段が、前記文書構成情報を構成例と共に表示し、文書データの任意の文字列に前記文書構成情報を適用する操作が受け付けられた場合、前記任意の文字列の体裁を整えるステップと、
を有することを特徴とする文書データ構成方法。 Inputting document data from the document data input means;
The type determination unit refers to the document type information storage unit that stores the character or character string used in the document type in association with the document type of the document data, and sets the character or character string included in the input document data. Determining the document type of the input document data based on the document type stored in the document type information storage unit in association with the document type;
A document in which the document composition unit designates one or more fonts, sizes, and thicknesses of characters of document data, or arrangement positions of characters or character strings for each document type according to the document type of the determined document data. Referring to the document configuration information storage means for storing the configuration information, and adjusting the format of the input document data in accordance with the document configuration information stored in the document configuration information storage means;
For each document type, the character or character string before proofreading of the proofreading information storage means storing the character or character string after proofreading in correspondence with the character or character string before proofreading other than typographical error, omission and grammatical misuse, When input by the document data input means,
In accordance with the document type of the input document data determined by the type determining unit, the calibrating unit calibrates the character or character string before proofreading with the calibrated character or character string stored in the proofreading information storage unit. And steps to
The document composition means displaying the document structure information together with a configuration example, and when an operation to apply the document structure information to an arbitrary character string of document data is accepted, adjusting the appearance of the arbitrary character string; ,
A document data construction method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008135892A JP5235499B2 (en) | 2007-10-12 | 2008-05-23 | Information processing apparatus, image forming apparatus, program, and document data configuration method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007266536 | 2007-10-12 | ||
JP2007266536 | 2007-10-12 | ||
JP2008135892A JP5235499B2 (en) | 2007-10-12 | 2008-05-23 | Information processing apparatus, image forming apparatus, program, and document data configuration method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009110497A JP2009110497A (en) | 2009-05-21 |
JP5235499B2 true JP5235499B2 (en) | 2013-07-10 |
Family
ID=40571889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008135892A Expired - Fee Related JP5235499B2 (en) | 2007-10-12 | 2008-05-23 | Information processing apparatus, image forming apparatus, program, and document data configuration method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5235499B2 (en) |
CN (1) | CN101408875A (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011248499A (en) * | 2010-05-25 | 2011-12-08 | Nec Corp | Character input device, character input control method, and character input control program |
JP6284302B2 (en) * | 2013-04-02 | 2018-02-28 | 株式会社タダノ | Boom telescopic pattern selection device |
WO2015162737A1 (en) | 2014-04-23 | 2015-10-29 | 株式会社東芝 | Transcription task support device, transcription task support method and program |
JP2014149873A (en) * | 2014-05-14 | 2014-08-21 | Nec Corp | Character input device, character input control method, and character input control program |
CN108733635B (en) * | 2017-04-24 | 2021-12-03 | 珠海金山办公软件有限公司 | Text information display method and device |
CN109543023B (en) * | 2018-09-29 | 2020-09-08 | 中国石油化工股份有限公司石油勘探开发研究院 | Document classification method and system based on trie and LCS algorithm |
CN112530533B (en) * | 2020-11-30 | 2024-04-02 | 北京百度网讯科技有限公司 | Medical record document detection method and device and electronic equipment |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0776958B2 (en) * | 1988-01-11 | 1995-08-16 | 株式会社東芝 | Document shaping device |
JPH0728792A (en) * | 1993-07-14 | 1995-01-31 | Matsushita Electric Ind Co Ltd | Method and device for documentation |
JPH08329070A (en) * | 1995-05-30 | 1996-12-13 | Toshiba Corp | Device for revising document |
JP3997790B2 (en) * | 2002-02-15 | 2007-10-24 | コニカミノルタビジネステクノロジーズ株式会社 | Program and style sheet selection device |
-
2008
- 2008-05-23 JP JP2008135892A patent/JP5235499B2/en not_active Expired - Fee Related
- 2008-09-17 CN CNA2008102129721A patent/CN101408875A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN101408875A (en) | 2009-04-15 |
JP2009110497A (en) | 2009-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5235499B2 (en) | Information processing apparatus, image forming apparatus, program, and document data configuration method | |
US8630852B2 (en) | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program | |
US9772989B2 (en) | Template management apparatus, non-transitory computer readable medium, and template management method | |
CN100581214C (en) | Image processing apparatus and image processing method | |
US9049324B2 (en) | Data processing device and data processing method for creating a file in a specified format or outputting a file in a determined format | |
US20090254799A1 (en) | System for creating graphical display from text | |
CN100444150C (en) | Electronic mail equipment | |
JP2014174923A (en) | Document processor, document processing method, and document processing program | |
JP2009104231A (en) | Information processor, sound output device, symbol display device, image forming apparatus, user attribute determination method, and program | |
JP3923850B2 (en) | Electronic document creation system | |
IES20060361A2 (en) | Electronic document conversion | |
JP6809005B2 (en) | Translation equipment, translation systems and programs | |
US20200310699A1 (en) | Management apparatus and terminal apparatus | |
JP6311347B2 (en) | Information processing apparatus, information processing system, and program | |
JP7379987B2 (en) | Information processing device and program | |
JP7271987B2 (en) | Information processing device and program | |
JP6123278B2 (en) | Data creation apparatus and data creation method | |
US8908200B2 (en) | Method and apparatus to generate XHTML-print contents | |
JP2006276904A (en) | Facsimile device | |
JP2000148613A (en) | Electronic mail system, electronic mail transmitting and receiving terminal device, and computer-readable storage medium with electronic mail transmitting and receiving program stored therein | |
JP2009129231A (en) | Electronic data automatic printing terminal, electronic data automatic printing method, and electronic data automatic printing program | |
JP6217314B2 (en) | Form processing system and program | |
JP7414554B2 (en) | Information processing device, control method and program | |
US10609246B1 (en) | System and method for ascertaining and printing supplemental forms identified from content of a scanned base form | |
JP7172436B2 (en) | IMAGE FORMING APPARATUS, IMAGE FORMING SYSTEM, CONTROL METHOD AND CONTROL PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121127 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |