JP2017040857A - Information processor and information processing program - Google Patents
Information processor and information processing program Download PDFInfo
- Publication number
- JP2017040857A JP2017040857A JP2015163596A JP2015163596A JP2017040857A JP 2017040857 A JP2017040857 A JP 2017040857A JP 2015163596 A JP2015163596 A JP 2015163596A JP 2015163596 A JP2015163596 A JP 2015163596A JP 2017040857 A JP2017040857 A JP 2017040857A
- Authority
- JP
- Japan
- Prior art keywords
- character
- display mode
- type
- characters
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Controls And Circuits For Display Device (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、情報処理装置及び情報処理プログラムに関する。 The present invention relates to an information processing apparatus and an information processing program.
スマートフォンの画面や、ディスプレイの画面における文字表示は、フォントと呼ばれる文字データを用いて表示される。フォントでは、カタカナ、ひらがな、漢字、記号等の文字種別が異なるものの、形状が類似する文字がある。以降、文字の形状を字形という。文字種別が異なり、字形が類似する文字の例として、例えば、カタカナの「カ」と漢字の「力」(ちから)、カタカナの「ロ」と漢字の「口」(くち)、漢字の「一」(いち)とカタカナの「ー」(長音)、等がある。 Character display on a smartphone screen or a display screen is displayed using character data called a font. As fonts, there are characters with similar shapes, although they have different character types such as katakana, hiragana, kanji, and symbols. Hereinafter, the character shape is referred to as a character shape. Examples of characters with different character types and similar character shapes include, for example, katakana “ka” and kanji “power” (chikara), katakana “ro” and kanji “mouth” (kuchi), and kanji “one”. "(1) and Katakana"-"(long sound).
文字種別が異なり字形が類似する他の文字が存在する文字は、通常視認性に問題となることはないが、例えば、下記の文字列のように誤読を引き起こしやすい場合がある。
例)1.シュート力の差
2.ギリシャリスク一服
3.コンサートの夕べ
4.Type−MO00は04月06日にお届けです。
Characters having other characters with different character types and similar character shapes usually do not pose a problem in visibility, but may easily cause misreading, such as the following character string.
Example) 1. Difference in
例1の場合には、カタカナの文字に続く漢字の「力」(ちから)が、カタカナの「カ」と類似する字形であるため、ユーザは、単語の境界を誤り、誤読する可能性がある。例2の場合には、カタカナの文字に続く漢字の「一」(いち)が、長音を示す「ー」と類似する字形であるため、ユーザは、単語の境界を誤り、誤読する可能性がある。例3の文字列は、漢字の「夕」と、続くひらがなの「べ」とが一体となって、カタカナの「タベ」という単語に誤読される可能性がある。例4の文字列は、英字の「O」と、続く数字の「0」とが類似する字形であるため、誤読を引き起こす可能性がある。 In the case of Example 1, the kanji “power” (beginning) following the katakana character has a character shape similar to katakana “ka”, so the user may misread the word boundary and misread it. . In the case of Example 2, since the Chinese character “1” (1) following the katakana character has a character shape similar to “-” indicating a long sound, the user may misread the word boundary and misread it. is there. In the character string of Example 3, the kanji “Even” and the subsequent hiragana “be” may be mistakenly read as “tabe” in katakana. In the character string of Example 4, the letter “O” and the subsequent number “0” have similar character shapes, which may cause misreading.
上記例のような文字列中の、文字種別が異なり字形が類似する他の文字に誤認される可能性が高い文字は、紙面上では、該文字と、文字種別が異なり字形が類似する他の文字と、の見分けが比較的つく。しかしながら、文字種別が異なり字形が類似する他の文字に誤認される可能性が高い文字は、液晶画面で表示された場合には、解像度等により、文字種別が異なり字形が類似する他の文字との見分けがしづらくなる傾向がある。また、上記例のように、文字種別が異なり字形が類似する他の文字が存在する文字を含む、誤読の可能性の高い文章を読むことは、脳に混乱を招き、脳に負担をかけることになる。 Characters that are highly likely to be mistaken for other characters with different character types and similar character shapes in the character string as in the above example, on the paper, other characters with different character types and similar character shapes It is relatively easy to distinguish between characters. However, characters that are likely to be mistaken for other characters with different character types and similar character shapes, when displayed on a liquid crystal screen, differ from other characters with different character types and similar character shapes, depending on resolution, etc. Tend to be difficult to distinguish. In addition, as in the above example, reading a sentence with a high possibility of misreading that includes other characters with different character types and similar character shapes causes confusion and strains the brain. become.
異なる文字種別で字形が類似する文字を含む文章において、誤読を低減する技術として、文章データ中の全文字を対象に特定の文字種別の文字や特定の単語を一括して別の表示態様に置き換える技術がある。例えば、文章中の全てのカタカナの表示態様が斜体に変更されて、カタカナが強調表示される。 As a technique for reducing misreading in sentences containing similar characters with different character types, characters of specific character types and specific words are collectively replaced with another display mode for all characters in the sentence data. There is technology. For example, the display mode of all katakana in the text is changed to italic and katakana is highlighted.
しかしながら、従来の技術では、文章データ中の特定の文字種別の文字又は特定の単語の表示態様が一括で置換されるために、誤読の可能性の低い文字の組合せにおいても該当する文字の表示態様が変えられてしまうことがある。これによって、原文の体裁を大きく変える可能性がある。文章は作者の意図になるべく忠実に再現して表示されることが望ましいにもかかわらず、作者の意図に沿わない表示態様となる可能性がある。 However, in the conventional technology, since the display mode of characters or specific words of a specific character type in the text data is replaced at once, the display mode of the corresponding character even in a combination of characters with low possibility of misreading May be changed. This can significantly change the appearance of the original text. Even though it is desirable that the text be reproduced and displayed as faithfully as possible, the text may be in a display mode that does not conform to the author's intention.
本発明の一態様は、文章の原文からの表示態様の変更を局所的に抑え、誤読を低減可能な情報処理装置及び情報処理プログラムを提供することを目的とする。 An object of one embodiment of the present invention is to provide an information processing apparatus and an information processing program capable of locally suppressing a change in display mode from an original sentence of a sentence and reducing misreading.
本発明の態様の一つは、記憶部と制御部とを備える情報処理装置である。記憶部は、異なる文字種別に類似字形の文字が存在する複数の文字のそれぞれに関する情報を記憶する。制御部は、表示対象の文字列について、記憶部に含まれる情報に基づいて、文字種別の切り替わる部分にあり、且つ、異なる文字種別に類似字形の文字が存在する複数の文字に含まれる文字を検出した場合に、検出された文字の表示態様を変更する。 One aspect of the present invention is an information processing apparatus including a storage unit and a control unit. The storage unit stores information related to each of a plurality of characters having similar character shapes in different character types. The control unit is configured to display characters included in a plurality of characters that are in a portion where the character type is switched based on the information included in the storage unit and that have similar character-shaped characters in different character types. When detected, the display mode of the detected character is changed.
開示の情報処理装置及び情報処理プログラムによれば、文章の原文からの表示態様の変更を局所的に抑え、誤読を低減することができる。 According to the information processing apparatus and the information processing program of the disclosure, it is possible to locally suppress the change in the display mode from the original sentence of the sentence and reduce misreading.
以下、図面に基づいて、本発明の実施の形態を説明する。以下の実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The configuration of the following embodiment is an exemplification, and the present invention is not limited to the configuration of the embodiment.
<第1実施形態>
第1実施形態では、情報処理装置は、記憶部と、制御部と、を備える。記憶部は、異なる文字種別に類似字形の文字が存在する複数の文字のそれぞれに関する情報を記憶する。制御部は、表示対象の文字列について、記憶部に含まれる情報に基づいて、文字種別の切
り替わる部分にあり、且つ、異なる文字種別に類似字形が存在する複数の文字に含まれる文字を検出した場合に、該検出された文字の表示態様を変更する。
<First Embodiment>
In the first embodiment, the information processing apparatus includes a storage unit and a control unit. The storage unit stores information related to each of a plurality of characters having similar character shapes in different character types. The control unit has detected characters included in a plurality of characters that are in a character type switching portion and similar character types exist in different character types based on information included in the storage unit for the display target character string. In this case, the display mode of the detected character is changed.
文字種別には、例えば、ひらがな、カタカナ、漢字、英数字、記号等がある。文字に関する情報は、例えば、文字コードである。文字コードは、例えば、JIS(日本工業規格、Japanese Industrial Standards)等の規格によって定義されているものが用いられて
もよい。また、文字種別は、JIS等の規格によって定義されている文字種別と文字コードとの対応に基づいて判定されてもよい。
Examples of character types include hiragana, katakana, kanji, alphanumeric characters, and symbols. The information regarding characters is, for example, a character code. For example, a character code defined by a standard such as JIS (Japanese Industrial Standards) may be used. The character type may be determined based on the correspondence between the character type and the character code defined by a standard such as JIS.
異なる文字種別に類似字形の文字が存在する文字の一例には、漢字の「口」(くち)とカタカナの「ロ」と記号の「□」(四角)、漢字の「工」(こう)とカタカナの「エ」、漢字の「一」(いち)とひらがな又はカタカナの「ー」(長音)、等がある。 Examples of characters that have similar character shapes in different character types include the Kanji “mouth” (Kuchi), the Katakana “Ro”, the symbol “□” (square), and the Kanji “Kou” (this). There are katakana “e”, kanji “ichi” (ichi) and hiragana or katakana “ー” (long sound).
文字種別の切り替わる部分は、表示対象の文字列中の、例えば、互いに文字種別が異なる、隣接する2文字を含む部分である。文字の表示態様の変更には、書体、文字サイズ、及び、表示色の変更、下線の付与、斜体及び太字への変更、該文字の前又は後ろに区切りを示す記号の挿入、等が含まれる。 The part where the character type is switched is a part including, for example, two adjacent characters having different character types from each other in the character string to be displayed. Changing the display mode of characters includes changing the typeface, character size, and display color, adding underline, changing to italics and bold, inserting symbols that indicate delimiters before or after the character, etc. .
また、記憶部は、異なる文字種別に類似字形の文字が存在する複数の文字を、文字種別のそれぞれに対応する複数の文字群として記憶してもよい。各文字群は、対応する文字種別の文字と連なることによって誤読を招く可能性がある、該対応する文字種別とは異なる文字種別に存在する類似字形の文字を含む。制御部は、文字種別の切り替わる部分に含まれ、互いに文字種別が異なり、隣接する第1の文字と第2の文字とについて、第2の文字の文字種別に対応する文字群に、第1の文字が含まれている場合に、該第1の文字の表示態様を変更するようにしてもよい。 Further, the storage unit may store a plurality of characters having similar character-shaped characters in different character types as a plurality of character groups corresponding to the respective character types. Each character group includes similar character-shaped characters existing in a character type different from the corresponding character type, which may lead to misreading by linking with a character of the corresponding character type. The control unit includes the first character group corresponding to the character type of the second character for the first character and the second character that are included in the part where the character type is switched and the character types are different from each other. When a character is included, the display mode of the first character may be changed.
文字群は、例えば、ひらがな用の文字群、カタカナ用の文字群、漢字用の文字群、というように、文字種別ごとに記憶部に記憶される。例えば、カタカナ用の文字群には、漢字の「口」(くち)、漢字の「力」(ちから)、漢字の「タ」(ゆう)等が含まれる。これらは、カタカナの文字と連なることによってカタカナの文字に誤読されやすい文字であり、文字群の対象の文字種別であるカタカナとは異なる文字種別の文字である。 The character group is stored in the storage unit for each character type, for example, a hiragana character group, a katakana character group, and a kanji character group. For example, the katakana character group includes the kanji “mouth” (kuchi), the kanji “power” (chikara), the kanji “ta” (yu), and the like. These are characters that are easily misread by the katakana characters by being connected to the katakana characters, and are of a character type different from the katakana that is the target character type of the character group.
また、例えば、ひらがな用の文字群には、いずれのひらがなの文字の字形と類似していない文字である漢字の「夕」(ゆう)が含まれてもよい。漢字の「夕」(ゆう)は、例えば、ひらがなの「べ」と連なり「夕べ」という単語を形成する場合に、ひらがなの「べ」がカタカナの「ベ」と誤認されることによって、カタカナの「タ」に誤認される可能性が高い文字であるからである。すなわち、漢字の「夕」(ゆう)は、ひらがな用の文字群にとって、対応する文字種別(ひらがな)の文字と連なることによって誤読を招く可能性がある、該対応する文字種別(ひらがな)とは異なる文字種別(漢字)に存在する類似字形の文字に含まれる。これによって、「夕べ」という単語がある場合に、いずれかの文字の表示態様が変更され、誤読を低減させることができる。 In addition, for example, the hiragana character group may include a Chinese character “Yu” that is not similar to the character shape of any hiragana character. The Chinese character “Even” (Yu), for example, forms the word “Evening” in conjunction with Hiragana “Be”, and the Hiragana “Be” is misidentified as “Be” in Katakana. This is because the characters are highly likely to be mistaken for “ta”. In other words, the Chinese character “Even” (Yu), for the Hiragana character group, may lead to misreading by linking with the corresponding character type (Hiragana) character. What is the corresponding character type (Hiragana)? It is included in similar characters that exist in different character types (Kanji). As a result, when the word “evening” is present, the display mode of any character is changed, and misreading can be reduced.
また、制御部は、第2の文字は第1の文字の一つ前の文字であり、第1の文字が第2の文字の文字種別に対応する文字群に含まれている場合に、第1の文字の表示態様を変更するようにしてもよい。また、制御部は、第1の文字が第2の文字の文字種別に対応する文字群に含まれていない場合に、第2の文字が、第1の文字の文字種別に対応する文字群に含まれているか否かを判定するようにしてもよい。第2の文字が第1の文字の文字種別に対応する文字群に含まれている場合には、制御部は、第2の表示態様を変更するようにしてもよい。 In addition, when the second character is the character immediately before the first character and the first character is included in the character group corresponding to the character type of the second character, You may make it change the display mode of 1 character. In addition, when the first character is not included in the character group corresponding to the character type of the second character, the control unit converts the second character into the character group corresponding to the character type of the first character. You may make it determine whether it is contained. When the second character is included in the character group corresponding to the character type of the first character, the control unit may change the second display mode.
第2の文字が第1の文字の一つ前の文字である場合、例えば、「シュート力」という文字列において、第1の文字は漢字の「力」(ちから)であり、第2の文字はカタカナの「ト」である。カタカナ用の文字群には漢字の「力」(ちから)が含まれているので、「シュート力」という文字列において、漢字の「力」(ちから)の表示態様が変更される。 When the second character is the character immediately before the first character, for example, in the character string “shooting power”, the first character is the Chinese character “power” (chika), and the second character Is Katakana's “G”. Since the katakana character group includes the kanji character “power” (chika), the display mode of the kanji character “power” (chika) is changed in the character string “shooting power”.
また、第2の文字が第1の文字の一つ前の文字である場合、例えば、「夕べ」という文字列において、第1の文字はひらがなの「べ」であり、第2の文字は漢字の「夕」(ゆう)である。ひらがなの「べ」と誤読されやすい漢字は存在しないので、漢字用の文字群にひらがなの「べ」は含まれていないと判定される。一方、漢字の「夕」(ゆう)は、上述の通り、ひらがな用の文字群に含まれてよいので、「夕べ」という文字列においては、第2の文字である漢字の「夕」(ゆう)の表示態様が変更される。 Further, when the second character is the character immediately preceding the first character, for example, in the character string “Evening”, the first character is “be” in hiragana, and the second character is kanji. "Evening" (Yu). Since there is no kanji that is easy to misread as hiragana “be”, it is determined that the hiragana “be” is not included in the character group for kanji. On the other hand, as described above, the Chinese character “Even” (Yu) may be included in the hiragana character group, and therefore, in the character string “Evening”, the second character “Yu” (Yu) ) Is changed.
また、制御部は、フォントドライバの一部であってもよい。フォントドライバは、文字コードを画像化する処理を行う処理部である。制御部がフォントドライバの一部であることによって、アプリケーションの構成に対して変更を加えることなく、表示対象の文字列中の文字の表示態様を変更することができる。 The control unit may be a part of the font driver. The font driver is a processing unit that performs processing for imaging a character code. Since the control unit is a part of the font driver, it is possible to change the display mode of characters in the character string to be displayed without changing the configuration of the application.
図1は、第1実施形態に係る文字表示制御処理により処理された文章の携帯端末における表示の一例である。図1に示される文章において、異なる文字種別に類似字形の文字が存在する文字は、漢字の「力」(ちから)、カタカナの「ー」(長音)、漢字の「一」(いち)である。 FIG. 1 is an example of display on a portable terminal of a sentence processed by the character display control process according to the first embodiment. In the text shown in FIG. 1, characters having similar character shapes in different character types are kanji “power” (chikara), katakana “-” (long sound), and kanji “one” (one). .
これらの文字の中で、文字種別の切り替わる部分にあり、且つ、異なる文字種別に類似字形の文字が存在する文字に該当する文字は、「シュート力の差が」の部分の漢字の「力」(ちから)である。したがって、第1実施形態に係る文字表示制御処理によれば、「シュート力の差が」の部分の漢字の「力」(ちから)は、下線が付されることによって、他の文字と異なる表示態様になる。「シュート力の差が」の部分の漢字の「力」(ちから)以外の文字の表示態様は変更されないので、表示態様の変更を局所的に抑えることができる。 Among these characters, the character corresponding to the character in which the character type is switched and the character of the similar character shape exists in the different character type is the “kanji” of the kanji character in the “difference in shoot power” part. (From the power). Therefore, according to the character display control process according to the first embodiment, the “power” (chika) of the portion of “the difference in shoot power” is displayed differently from other characters by being underlined. It becomes an aspect. Since the display mode of characters other than the “power” (from the power) of the Chinese character in the “shooting power difference” portion is not changed, the change of the display mode can be locally suppressed.
<装置構成>
図2は、携帯端末1のハードウェア構成の一例を示す図である。携帯端末1は、例えば、スマートフォン、タブレット端末、携帯ゲーム機、音楽プレイヤ、カーナビ等のコンピュータである。図2では、携帯端末1の一例として、スマートフォンのハードウェア構成が示されている。携帯端末1は、CPU(Central Processing Unit)101、記憶部1
02、タッチパネル103、ディスプレイ104、無線部105、オーディオ入出力部106、スピーカー107、マイクロフォン108、アンテナ110を備える。携帯端末1は、「情報処理装置」の一例である。
<Device configuration>
FIG. 2 is a diagram illustrating an example of a hardware configuration of the
02, a
記憶部102は、ROM(Read Only Memory)102A、RAM(Random Access Memory)102B、不揮発性メモリ102Cを含む。RAM 102Bは、例えば、DRAM等の揮発性メモリであって、CPU 101に作業領域を提供する。不揮発性メモリ102Cは、例えば、フラッシュメモリであり、OS(Operating System)、フォントドライバ、ディスプレイドライバ、文字表示制御プログラム、各種プログラム、及びプログラムの実行に用いられるデータ等を格納する。文字表示制御プログラムは、表示対象の文字列中の、文字種別の切り替わる部分にあり、異なる文字種別に類似字形の文字が存在する文字の表示態様を変更する処理を行うためのプログラムである。文字表示制御プログラムは、「情報処理プログラム」の一例である。文字表示制御プログラムは、単体のソフトウェアであってもよいし、フォントドライバの一部であってもよい。RAM 102Bは、「記憶部」の一例である。
The
CPU 101は、ROM 102A又は不揮発性メモリ102Cに格納されるプログラムをRAM 102Bの作業領域に展開し、展開された命令を実行することによって、各ハードウェア構成を制御する。CPU 101は、「制御部」の一例である。
The
タッチパネル103は、位置入力装置の1つであって、ディスプレイ104の表面に配置されており、ディスプレイ104の画面に対応する指のタッチ位置の座標を入力する。タッチパネル103は、静電容量方式、抵抗膜方式,表面弾性波方式,赤外線方式,電磁誘導方式等のいずれであってもよい。
The
ディスプレイ104は、例えば、液晶ディスプレイ(Liquid Crystal Display,LCD)である。ディスプレイ104は、CPU 101から入力される信号に従って、画面データを表示する。
The
無線部105は、アンテナ110と接続しており、アンテナ110を通じて受信した無線信号を電気信号に変換してCPU 101に出力したり、CPU 101から入力される電気信号を無線信号に変換してアンテナ110を通じて送信したりする。無線部105は、例えば、第3世代移動通信システム,第2世代移動通信システム,LTE(Long Term Evolution)のうちのいずれか1つ又は複数に対応する電子回路である。
The
オーディオ入出力部106は、音声出力装置としてのスピーカー107と、音声入力装置としてのマイクロフォン108と、接続する。オーディオ入出力部106は、マイクロフォン108から入力された音声信号を電気信号に変換してCPU 101に出力したり、CPU 101から入力された電気信号を音声信号に変換してスピーカー107に出力したりする。
The audio input /
なお、携帯端末1のハードウェア構成は、図2に示されるものに限定されず、適宜、追加、置換、削除等の変更が可能である。例えば、携帯端末1は、図2に示される構成に加えて、赤外線通信部やICカード通信部等を備えてもよい。
Note that the hardware configuration of the
また、情報処理装置は、携帯端末1に限定されない。例えば、情報処理装置は、デスクトップ型のPC(Personal Computer)等の据え置き型のコンピュータであってもよい。
また、情報処理装置が据え置き型のコンピュータである場合は、ディスプレイは内蔵されていなくてもよく、所定の接続方式で接続されていればよい。
Further, the information processing apparatus is not limited to the
When the information processing apparatus is a stationary computer, the display does not have to be built in, and it is only necessary to be connected by a predetermined connection method.
図3は、携帯端末1の機能構成の一例を示す図である。携帯端末1は、機能構成として、アプリケーション11、OS 12、フォントドライバ13、表示態様制御部14、ディスプレイドライバ15、コンテンツファイル16、フォントファイル17、文字コード定義表18、類似字形辞書19を備える。
FIG. 3 is a diagram illustrating an example of a functional configuration of the
アプリケーション11は、CPU 101がROM 102A又は不揮発性メモリ102Cに格納されているアプリケーションプログラムを実行することによって達成される機能構成である。アプリケーション11は、例えば、ブラウザ、ワープロソフトウェア、表計算ソフトウェア、図面作成ソフトウェア等の文字の表示処理を伴うアプリケーションである。第1実施形態では、アプリケーション11は、ブラウザであることを想定して説明される。
The
アプリケーション11は、OS 12を通じて、利用者に指定されたコンテンツファイル16からデータを読み出す。アプリケーション11は、読み出したファイルの中から、書体、文字列等の分析を行い、画面に表示するための位置、大きさ等を決定する。アプリ
ケーション11は、OS 12に該データの表示依頼を出力する。表示依頼とともに、表示対象のデータの文字コード列、書体、サイズ等がOS 12に出力される。
The
OS 12は、CPU 101が不揮発性メモリ102Cに格納されているOSを実行することによって達成される機能構成である。OS 12は、アプリケーション11から表示依頼が入力されると、フォントドライバ13を呼び出す。OS 12は、フォントドライバ13に、文字コード列、書体、サイズ等を含む文字列データを渡す。OS 12がフォントドライバ13に渡す情報の詳細については、後述される。
The
OS 12は、フォントドライバ13から画像化された文字列データが入力されると、指定された位置に表示するようにディスプレイドライバ15に依頼する。
When the character string data imaged from the
フォントドライバ13は、CPU 101が不揮発性メモリ102Cに記憶されているフォントドライバを実行することによって達成される機能構成である。フォントドライバ13は、文字コード列、書体、サイズ等を含む文字列データから、文字列の画像を生成する。
The
フォントドライバ13は、OS 12から文字コード列、書体、サイズ等を含む文字列データが入力されると、表示態様制御部14を呼び出す。フォントドライバ13は、表示態様制御部14に、文字コード列、書体、サイズ等を含む文字列データを出力する。
The
フォントドライバ13は、表示態様制御部14から、所定の処理後の文字コード列、書体、サイズ等を含む文字列データが入力されると、該文字列データから文字コード列に対応する画像を生成し、該画像をOS 12に出力する。
When the character string data including a character code string, a typeface, and a size after a predetermined process is input from the display
表示態様制御部14は、CPU 101が不揮発性メモリ102Cに記憶される文字表示制御プログラムを実行することによって達成される機能構成である。表示態様制御部14は、フォントドライバ13から、文字コード列、書体、サイズ等を含む文字列データが入力されると、該文字列データを分析する。表示態様制御部14は、文字コード列中の、文字種別の切り替わる部分にあり、異なる文字種別に類似字形の文字が存在する文字の表示態様を変更する、文字表示制御処理を行う。表示態様制御部14は、文字表示制御処理によって処理された文字コード列、書体、サイズ等を含む文字列データをフォントドライバ13に出力する。表示態様制御部14の処理の詳細は、後述される。
The display
ディスプレイドライバ15は、CPU 101が不揮発性メモリ102Cに記憶されるディスプレイドライバを実行することによって達成される機能構成である。ディスプレイドライバ15は、OS 12からの表示依頼にしたがって、依頼されたデータの画像をディスプレイ104に出力する。
The
コンテンツファイル16は、不揮発性メモリ102Cに格納されている。コンテンツファイル16は、アプリケーション11が利用するコンテンツデータを記憶する。アプリケーション11がブラウザアプリケーションである場合には、該ブラウザアプリケーションによってネットワークから取得されたデータがコンテンツファイル16に格納される。
The
フォントファイル17は、ROM 102Aに格納されている。フォントファイル17は、文字コードに対応する文字の画像データを格納している。ファイルドライバ13は、フォントファイル17に記憶されている画像データを用いて、文字コード列を画像化する。
The
図4は、文字コード定義表18の一例である。文字コード定義表18は、文字表示制御
プログラムのインストールによって、不揮発性メモリ102Cに格納される。文字コード定義表18は、文字種別と該文字種別に該当する文字コードの開始コードと終了コードとの対応表である。
FIG. 4 is an example of the character code definition table 18. The character code definition table 18 is stored in the
図4に示される例では、文字種別として、数字、英字、カタカナ、ひらがな、漢字が定義されている。文字コードは、2バイトの値で、16進数で表記されている。表示態様制御部14は、文字コード定義表18を参照して、文字列内の文字の文字種別を判定し、文字種別の境界となる文字を検出する。以降の説明では、文字コードのサイズは、2バイトで固定されていることが想定される。
In the example shown in FIG. 4, numbers, English letters, katakana, hiragana, and kanji are defined as character types. The character code is a 2-byte value expressed in hexadecimal. The display
図5は、カタカナ用の類似字形辞書19の一例である。類似字形辞書19は、文字表示制御プログラムのインストールによって、不揮発性メモリ102Cに格納される。類似字形辞書19には、該類似字形辞書19が対象とする文字種別とは異なる文字種別の文字であって、該類似字形辞書19が対象とする文字種別に含まれる文字が連なることによって誤読を招く可能性の高い文字に関する情報が格納される。類似字形辞書19が対象とする文字種別に含まれる文字が連なることによって誤読を招く可能性の高い文字には、例えば、該対象とする文字種別に含まれる文字と類似する字形の文字がある。類似字形辞書19は、文字種別ごとに存在する。図5では、カタカナ用の類似字形辞書19が示されている。類似字形辞書19は、「文字群」の一例である。
FIG. 5 shows an example of a
図5に示される例では、カタカナ用の類似字形辞書19には、漢字の「力」(ちから)、漢字の「夕」(ゆう)、漢字の「一」(いち)、漢字の「口」(くち)の文字コードが格納されている。これらは、いずれもカタカナに含まれる文字と類似する字形の文字である。漢字の「力」(ちから)は、カタカナの「カ」と誤読されやすい。漢字の「夕」(ゆう)は、カタカナの「タ」と誤読されやすい。漢字の「一」(いち)は、カタカナの「ー」(長音)と誤読されやすい。漢字の「口」(くち)は、カタカナの「ロ」と誤読されやすい。なお、図5では、便宜上、文字コードの代わりに文字が示されている。
In the example shown in FIG. 5, the
類似字形辞書19には、各文字に、修飾方式が対応付けられている。修飾方式には、該文字の文字コードの前に修飾用のデータが付与される前修飾方式と、該文字の文字コードの後ろに修飾用のデータが付与される後修飾方式と、がある。前修飾方式の場合には、該文字の直前に修飾が挿入されるか、又は、該文字自体に修飾が施される表示態様となる。後修飾方式の場合には、該文字の直後に修飾が挿入される表示態様となる。
In the similar
例えば、修飾方式には、区切り、下線、斜体、サイズ変更、書体の変更、表示色の変更等がある。「区切り」の場合には、該当の文字の直前又は直後に区切りを示す記号が挿入される。区切りを示す記号としては、例えば、「/」(スラッシュ)、「v」(上付きのチェック)等があり、いずれが用いられるかは管理者によって定義される。「区切り」は、前修飾方式、後修飾方式のいずれにも用いられる。 For example, the modification method includes separation, underline, italic, size change, font change, display color change, and the like. In the case of “separator”, a symbol indicating a separator is inserted immediately before or after the corresponding character. Examples of the delimiter include “/” (slash), “ v ” (superscript check), and the like, which is used is defined by the administrator. “Delimiter” is used for both the pre-modification method and the post-modification method.
「下線」の場合には、該当の文字に下線が付与される。下線の種類は、一重線、二重線、波線、点線等のいずれであってもよく、いずれが用いられるかは管理者によって定義される。「斜体」の場合には、該当の文字は所定の傾斜角が与えられた表示態様となる。「サイズ変更」の場合には、該当の文字のサイズが所定のサイズに変更される。「書体変更」の場合には、該当の文字の書体が所定の書体に変更される。「下線」、「斜体」、「サイズ変更」、「書体変更」は、前修飾方式で用いられる。 In the case of “underline”, the corresponding character is underlined. The type of underline may be any of a single line, a double line, a wavy line, a dotted line, etc., and which one is used is defined by the administrator. In the case of “italic”, the corresponding character is displayed with a predetermined tilt angle. In the case of “size change”, the size of the corresponding character is changed to a predetermined size. In the case of “typeface change”, the typeface of the corresponding character is changed to a predetermined typeface. “Underline”, “italic”, “size change”, and “typeface change” are used in the pre-modification method.
図5に示される例では、例えば、前修飾方式として「下線」と指定されているが、どのような種類の下線が用いられるか、という更なる情報が類似字形辞書19において定義されていてもよい。例えば、前修飾方式として「サイズ変更」と指定される場合には、類似
字形辞書19において、変更後のサイズが定義されていてもよい。サイズの定義は、例えば、所定のサイズが設定されてもよいし、原文のサイズより2ポイント大きく、というように、原文のサイズとの差が設定されてもよい。例えば、前修飾方式として「書体変更」と指定される場合には、類似字形辞書19において、変更後の書体が定義されていてもよい。
In the example shown in FIG. 5, for example, “underline” is designated as the pre-modification method, but even if additional information such as what kind of underline is used is defined in the similar
なお、該当の文字の修飾方式には、該当の文字の誤読を招くような修飾方式は設定されない。例えば、漢字の「一」(いち)の場合には、修飾方式に「下線」が設定されると、漢字の「二」(に)やカタカナの「ニ」と誤読されやすくなる。そのため、図5に示される例では、漢字の「一」(いち)の前修飾方式には、誤読の可能性が低い、「区切り」が設定されている。 It should be noted that a modification method that causes misreading of the corresponding character is not set in the modification method of the corresponding character. For example, in the case of the Chinese character “1” (1), if “underline” is set as the modification method, the Chinese character “2” (ni) or katakana “ni” is likely to be misread. Therefore, in the example shown in FIG. 5, “separation”, which is less likely to be misread, is set in the pre-modification method of “one” (one) of kanji.
図6は、漢字用の類似字形辞書19の一例である。図6に示される例では、漢字用の類似字形辞書19には、カタカナの「カ」、カタカナの「ロ」、カタカナの「タ」、カタカナの「ー」(長音)の文字コードが格納されている。これらの文字はいずれも、漢字に含まれる文字に類似する字形の文字である。カタカナの「カ」は、漢字の「力」(ちから)と誤読されやすい。カタカナの「ロ」は、漢字の「口」(くち)と誤読されやすい。カタカナの「タ」は、漢字の「夕」(ゆう)と誤読されやすい。カタカナの「ー」(長音)は、漢字の「一」(いち)と誤読されやすい。なお、図6でも、便宜上、文字コードの代わりに文字が示されている。漢字用の類似字形辞書19は、漢字用の「文字群」の一例である。
FIG. 6 shows an example of the
なお、図5、図6に示される類似字形辞書19には、該類似字形辞書19が対象とする文字種別に含まれる文字と類似する字形の文字が含まれている。ただし、類似字形辞書19には、該類似字形辞書19が対象とする文字種別に含まれる文字が連なることで誤読を招く文字であれば、該類似字形辞書19が対象とする文字種別に含まれる文字と類似する字形の文字でなくとも、含まれてよい。
Note that the similar
例えば、文字列「コンサートの夕べ」において、漢字「夕」(ゆう)はカタカナの「タ」と誤読される可能性がある。これは、漢字の「夕」(ゆう)にひらがなの「べ」が連なっており、且つ、ひらがなの「べ」はカタカナの「ベ」に誤読されやすいからである。したがって、漢字の「夕」(ゆう)は、ひらがなに含まれる文字と類似の字形を有する文字ではないが、ひらがな用の類似字形辞書19に登録されてもよい。
For example, in the character string “Concert Evening”, the Chinese character “Yu” (Yu) may be misread as “Ta” in Katakana. This is because the Chinese character “Even” (Yu) is followed by Hiragana “be”, and Hiragana “be” is easily misread by katakana “be”. Accordingly, the Chinese character “Even” (Yu) is not a character having a character shape similar to that included in the hiragana character, but may be registered in the similar
各文字種別用の類似字形辞書19は、例えば、携帯端末1のユーザから収集された誤読を招く文字又は文字列によって、文字表示制御プログラムの開発元によって、定期的に更新されてもよい。類似字形辞書19が定期的に更新されることによって、より精度よく誤読の可能性のある文字の表示態様を変更することができる。
The similar
図7は、表示態様制御部14の文字種別判定処理の一例を示す図である。文字種別判定処理は、文字の文字種別を判定する処理である。OS 12からフォントドライバ13、フォントドライバ13から表示態様制御部14には、文字列バッファ単位で文字列コードが入力される。文字列バッファは、RAM 102B内の所定の領域に所定のサイズで作成される。図7では、文字列バッファ内の文字コードは、便宜上、文字で示されている。
FIG. 7 is a diagram illustrating an example of the character type determination process of the display
表示態様制御部14は、フォントドライバ13から呼び出されると、文字列バッファの先頭から文字種別境界検索ポインタをシフトしながら、文字コード定義表18を参照して、一文字ずつ文字種別を判定する。文字種別の判定は、文字種別境界検索ポインタの指す文字列バッファの位置に格納されている文字コードを範囲に含む文字種別が検出されることによって行われる。
When called from the
表示態様制御部14は、文字種別境界検索ポインタの指す位置に格納されている文字の文字種別を判定し、一つ前の文字と同じ文字種別である場合には、文字種別境界検索ポインタを文字列バッファの次の位置にシフトさせ、後続の文字の文字種別の判定を行う。文字種別境界検索ポインタの指す位置に格納されている文字の文字種別が一つ前の文字と異なる文字種別である場合には、表示態様制御部14は、後述の類似字形文字の判定処理を行う。
The display
図7に示される例では、文字種別境界検索ポインタが文字列バッファ内の「力」(文字種別:漢字)の格納位置を指す場合に、「カ」と一つ前の「ト」(文字種別:カタカナ)とでは文字種別が異なるので、類似字形文字の判定処理が開始される。 In the example shown in FIG. 7, when the character type boundary search pointer indicates the storage position of “force” (character type: kanji) in the character string buffer, “ka” and the previous “g” (character type) : Katakana), the character type is different, and the similar character-shaped character determination process is started.
図8は、表示態様制御部14の類似字形文字の判定処理の一例を示す図である。類似字形文字の判定処理は、文字種別が一つ前の文字と異なる文字が検出された場合に、該文字が一つ前の文字の文字種別において類似の字形を有する文字であるか否かを判定する処理である。
FIG. 8 is a diagram illustrating an example of the similar character-shaped character determination process of the display
表示態様制御部14は、文字種別境界検索ポインタが指す位置に格納されている文字を、該文字の一つ前の文字の文字種別用の類似字形辞書19に含まれる各文字と比較し、文字種別境界検索ポインタが指す位置に格納されている文字が該類似字形辞書19に含まれるか否かを判定する。文字種別境界検索ポインタが指す位置に格納されている文字が、該文字の一つ前の文字の文字種別用の該類似字形辞書19に含まれる場合には、該文字に対して、該類似字形辞書19で定義される前修飾方式または後修飾方式に従って、表示態様の変更が行われる。文字種別境界検索ポインタが指す位置に格納されている文字が、該文字の一つ前の文字の文字種別用の該類似字形辞書19に含まれていない場合には、文字種別境界検索ポインタの指す位置が文字列バッファ内の次の位置にシフトし、次の文字について、文字種別判定処理が行われる。
The display
図8に示される例では、文字種別境界検索ポインタが指す「力」(ちから)は、カタカナ用類似字形辞書19に含まれているので、「力」(ちから)に対して、所定の修飾を施すように、表示態様の変更が行われる。表示態様制御部14の処理のより詳細な説明は、図11A〜図11Cにおいて後述される。
In the example shown in FIG. 8, the “force” (chika) pointed to by the character type boundary search pointer is included in the katakana
図9は、OS 12からフォントドライバ13への入力データのフォーマットの一例を示す図である。まず、フォントドライバ13の呼び出し関数の一例は、以下の通りである。
・呼び出し形式
関数名(RAM 102B上の入力データのアドレス、出力画像格納先バッファのアドレス、処理結果)
・呼び出し関数
Xfnt_create_bitmap(&sString, &bImageBuf, &result)
FIG. 9 is a diagram illustrating an example of a format of input data from the
Call format Function name (address of input data on
Call function
Xfnt_create_bitmap (& sString, & bImageBuf, & result)
上記呼び出し関数によって、フォントドライバ13は呼び出され、図9に示される形式のデータが入力される。呼び出し関数内のRAM 102B上の入力データのアドレスは、文字列バッファの開始アドレスである。図9では、データの形式とともに、メモリ配置も示されている。フォントドライバ13に入力されるデータは、先頭に表示態様制御情報が格納されている。表示態様制御情報は、文字列の書体、サイズ等の表示態様を示す情報である。
The
図9に示される例では、表示態様制御情報は、それぞれ1バイトの「ES(Escape Seq
uence)書体」、「ゴシック」、「ESサイズ」、「12」である。「ES書体」は、後
続の1バイトが書体の制御情報であることを示すコードである。「ゴシック」は、文字列をゴシック体で表示することを指示する情報である。「ESサイズ」は、後続の1バイトのデータがサイズの制御情報であることを示すコードである。「12」は、文字列を12ポイントのサイズで表示することを指示する情報である。表示態様が変更される場合には、該変更の対象部分の先頭の文字の直前に表示態様制御情報が挿入される。
In the example shown in FIG. 9, the display mode control information is 1-byte “ES (Escape Seq
uence) typeface, “gothic”, “ES size”, “12”. “ES typeface” is a code indicating that the subsequent 1 byte is control information of the typeface. “Gothic” is information instructing to display a character string in a Gothic style. “ES size” is a code indicating that the subsequent 1-byte data is size control information. “12” is information instructing to display the character string in a size of 12 points. When the display mode is changed, the display mode control information is inserted immediately before the first character of the change target part.
フォントドライバ13への入力データには、表示態様制御情報に続いて、表示対象の文字コード列が格納されている。1文字分の文字コードのサイズは、JIS規格の場合には、2バイトである。
The input data to the
フォントドライバ13から表示態様制御部14へ入力されるデータも、図9に示されるデータと同様の形式である。
Data input from the
図10は、表示態様制御部14による文字表示制御処理によって、一部の文字の表示態様が変更されたデータの一例である。図10に示される例の文字列では、「力」(ちから)の表示態様が変更されることは、図8において説明された通りである。図10では、「力」(ちから)に下線が付与されるように表示態様が変更される。
FIG. 10 is an example of data in which the display mode of some characters is changed by the character display control process by the display
表示態様制御部14は、「力」(ちから)以降の文字コード列を2バイト後方にシフトさせて、空いた2バイトの領域に、表示態様制御情報である「ES修飾」、「下線」を格納する。「の」以降の文字の表示態様は原文のままであるので、表示態様制御部14は、「の」以降の表示態様を原文に戻すために、「力」(ちから)の直後に先頭の表示態様制御情報と同じ内容の表示態様制御情報を挿入する。
The display
より具体的には、表示態様制御部14は、「の」以降の文字コード列を4バイト後方にシフトさせて、空いた4バイトの領域に、先頭の表示態様制御情報である、「ES書体」、「ゴシック」、「ESサイズ」、「12」を格納する。
More specifically, the display
表示態様制御部14は、図10に示される例のような、一部が変更されたデータをフォントドライバ13に出力する。表示態様制御部14の処理によって、表示態様が変更された文字の、フォントドライバ13によって生成される画像が置換される。
The display
<処理の流れ>
図11A、図11B、図11Cは、表示態様制御部14の文字表示制御処理のフローチャートの一例である。図11Aに示される処理は、表示態様制御部14に文字列バッファ内の文字コード列が入力されると開始される。なお、図11A〜図11Cに示される文字表示制御処理の実行主体は、文字表示制御プログラムを実行するCPU 101であるが、図11A〜図11Cでは、便宜上、表示態様制御部14を実行主体として説明する。
<Process flow>
11A, 11B, and 11C are examples of a flowchart of the character display control process of the display
OP1では、表示態様制御部14は、文字種別境界検索ポインタを文字列バッファの先頭のRAM 102Bのアドレスに設定する。文字列バッファの先頭のRAM 102Bのアドレスは、フォントドライバの呼び出し関数の入力パラメータによって指定されている。以降、単に、「アドレス」と表記される場合には、RAM 102Bのアドレスを示していることとする。
In OP1, the display
OP2では、表示態様制御部14は、文字種別境界検索ポインタの参照先アドレスに格納されているデータが表示態様制御情報の制御コードであるか否かを判定する。文字種別境界検索ポインタの参照先アドレスに格納されているデータが表示態様制御情報の制御コードである場合には(OP2:YES)、処理がOP3に進む。文字種別境界検索ポイン
タの参照先アドレスに格納されているデータが表示態様制御情報の制御コードでない場合には(OP2:NO)、処理がOP4に進む。
In OP2, the display
OP3では、表示態様制御部14は、文字種別境界検索ポインタの参照先アドレスを2バイト進める。その後、処理がOP2に進む。
In OP3, the display
OP4では、表示態様制御部14は、文字種別境界検索ポインタの参照先アドレスに格納される1文字分の文字コードを参照する。OP5では、表示態様制御部14は、文字コード定義表18を参照し、文字種別境界検索ポインタの参照先アドレスに格納されている文字の文字種別を判定する。OP5の処理は、文字種別判定処理に相当する。
In OP4, the display
OP6では、表示態様制御部14は、現在の参照先アドレスに格納されている文字は文字列バッファ内の1文字目か否かを判定する。現在の参照先アドレスに格納されている文字が文字列バッファ内の1文字目である場合には(OP6:YES)、処理がOP8に進む。現在の参照先アドレスに格納されている文字が文字列バッファ内の1文字目でない場合には(OP6:NO)、処理がOP7に進む。
In OP6, the display
OP7では、表示態様制御部14は、現在の参照先アドレスに格納されている文字の文字種別と、1文字前の文字の文字種別とが一致するか否かを判定する。現在の参照先アドレスに格納されている文字の文字種別と、1文字前の文字の文字種別とが一致する場合には(OP7:YES)、処理がOP8に進む。現在の参照先アドレスに格納されている文字の文字種別と、1文字前の文字の文字種別とが異なる場合には(OP7:NO)、処理が図11BのOP21に進む。
In OP7, the display
OP8では、表示態様制御部14は、現在の参照先アドレスに格納されている文字の文字種別をRAM 102Bに保存する。この保存は、例えば、上書き保存である。
In OP8, the display
OP9では、表示態様制御部14は、文字種別境界検索ポインタの参照先アドレスを1文字分進める。第1実施形態では、JIS規格の文字コードが用いられることが想定されているので、1文字分のサイズは2バイトである。
In OP9, the display
OP10では、表示態様制御部14は、文字列バッファの最後まで処理が終了したか否かを判定する。文字列バッファの最後まで処理が終了した場合には(OP10:YES)、処理がOP11に進む。文字列バッファの最後まで処理が終了していない場合には(OP10:NO)、処理がOP2に進む。
In OP10, the display
OP11では、表示態様制御部14は、処理後の文字コード列をフォントドライバ13に出力する。その後、図11Aに示される処理が終了する。
In OP <b> 11, the display
図11BのOP21では、表示態様制御部14は、文字種別境界検索ポインタの現在の参照先アドレスを境界位置としてRAM 102Bに保存する。以降、境界位置の文字を境界文字と称する。
In OP21 of FIG. 11B, the display
OP22では、表示態様制御部14は、境界文字の直前の文字の文字種別用の類似字形辞書19のエントリを参照する。OP23では、境界文字が、直前の文字の文字種別用の類似字形辞書19の参照エントリに含まれる文字と一致するか否かを判定する。境界文字が、直前の文字の文字種別用の類似字形辞書19の参照エントリの文字と一致する場合には(OP23:YES)、処理がOP24に進む。境界文字が、直前の文字の文字種別用の類似字形辞書19の参照エントリの文字と一致しない場合には(OP23:NO)、処理が図11CのOP31に進む。OP22、OP23の処理は、類似字形文字の判定処理
に相当する。
In OP22, the display
OP24では、表示態様制御部14は、文字種別境界検索ポインタの現在の参照先アドレスに格納される文字(境界文字)の文字種別をRAM 102Bに保存する。
In OP24, the display
OP25では、表示態様制御部14は、文字種別境界検索ポインタの現在の参照先アドレス以降のデータを所定バイト後方にシフトする。どれだけシフトするのかは、参照中の文字種別用の類似字形辞書19に含まれる境界文字の前修飾方式の内容に依存する。例えば、前修飾方式の内容が「下線」である場合には、現在の参照先アドレス以降のデータは2バイト(=制御コード(1バイト)+下線の種類(1バイト))後方にシフトされる。
In OP25, the display
OP26では、表示態様制御部14は、文字列バッファの、シフトにより空いた領域に類似字形辞書19に含まれる境界文字の前修飾方式の内容に従って、データを書き込む。
In OP26, the display
OP27では、表示態様制御部14は、ポインタの参照先アドレスをOP27で書き込んだ修飾データのサイズと、1文字分のサイズと、の合計分シフトさせる。
In OP27, the display
OP28では、表示態様制御部14は、文字種別境界検索ポインタの現在の参照先アドレス以降のデータを、文字列バッファの先頭の表示態様制御情報のサイズ分後方にシフトさせる。
In OP28, the display
OP29では、表示態様制御部14は、文字列バッファの、シフトにより空いた領域に文字列バッファの先頭の表示態様制御情報と同じ内容のデータを書き込む。
In OP29, the display
OP30では、表示態様制御部14は、文字種別境界検索ポインタの現在の参照先アドレスを、文字列バッファの先頭の表示態様制御情報のサイズ分後方にシフトさせる。
In OP30, the display
図11CのOP31では、表示態様制御部14は、図11BのOP22で参照中の類似字形辞書19内の参照エントリを進める。OP32では、表示態様制御部14は、類似字形辞書19の参照エントリが該類似字形辞書19内の最後のエントリであるか否かを判定する。参照エントリが該類似字形辞書19内の最後のエントリである場合には(OP32:YES)、処理がOP33に進む。参照エントリが該類似字形辞書19内の最後のエントリでない場合には(OP32:NO)、処理が図11BのOP22に進む。
In OP31 of FIG. 11C, the display
OP33では、表示態様制御部14は、現在参照しているアドレスより2バイト前のアドレスを参照する。OP34では、表示態様制御部14は、OP33において参照したアドレスに制御コードが格納されているか否かを判定する。OP33において参照したアドレスに制御コードが格納されている場合には(OP34:YES)、処理がOP33に進む。OP33において参照したアドレスに制御コードが格納されていない、すなわち、文字コードが格納されている場合には(OP34:NO)、処理がOP35に進む。
In OP33, the display
OP35では、表示態様制御部14は、境界文字の文字種別用の類似字形辞書19のエントリを参照する。OP36では、表示態様制御部14は、境界文字の一つ前の文字が、境界文字の文字種別用の類似字形辞書19の参照エントリの文字と一致するか否かを判定する。境界文字の一つ前の文字とは、OP34の判定で検出された文字である。
In OP35, the display
表示態様制御部14は、境界文字の一つ前の文字が、境界文字の文字種別用の類似字形辞書19の参照エントリの文字と一致する場合には(OP36:YES)、処理がOP37に進む。表示態様制御部14は、境界文字の一つ前の文字が、境界文字の文字種別用の類似字形辞書19の参照エントリの文字と一致しない場合には(OP36:NO)、処理
がOP40に進む。
When the character preceding the boundary character matches the character of the reference entry in the similar
OP37では、表示態様制御部14は、図11BのOP21においてRAM 102Bに保存した現在の文字種別境界検索ポインタの参照先アドレス以降のデータを所定バイト後方にシフトさせる。どれだけシフトさせるのかは、参照中の文字種別用の類似字形辞書19に含まれる境界文字の一つ前の文字の後修飾方式の内容に依存する。例えば、後修飾方式の内容が「区切り」で、区切りを示す記号が挿入される場合には、現在の参照先アドレス以降のデータは、区切りを示す記号の文字コードの2バイト分後方にシフトされる。
In OP37, the display
OP38では、表示態様制御部14は、文字列バッファの、シフトにより空いた領域に、参照中の類似字形辞書19に含まれる境界文字の一つ前の文字の後修飾方式の内容に従って、データを書き込む。
In OP38, the display
OP39では、表示態様制御部14は、ポインタの参照先アドレスをOP38で書き込んだ修飾データのサイズ分シフトさせる。その後、処理が図11AのOP8に進む。
In OP39, the display
OP40では、表示態様制御部14は、参照中の類似字形辞書19内の参照エントリを進める。OP41では、表示態様制御部14は、参照中の類似字形辞書19の参照エントリが該類似字形辞書19内の最後のエントリであるか否かを判定する。参照エントリが該類似字形辞書19内の最後のエントリである場合には(OP41:YES)、処理が図11AのOP8に進む。参照エントリが該類似字形辞書19内の最後のエントリでない場合には(OP41:NO)、処理がOP35に進む。
In OP40, the display
<具体例>
図12は、第1実施形態の具体例の一つを示す図である。図12では、「爆発力パワーアップ」という表示対象の文字列について、表示態様制御部14の入力時の文字コード列と、出力時の文字コード列とが示されている。ただし、便宜上、文字コードではなく該当の文字が示されている。また、それぞれ、文字列バッファ内のメモリ配置も示されている。
<Specific example>
FIG. 12 is a diagram illustrating one specific example of the first embodiment. FIG. 12 shows a character code string at the time of input and a character code string at the time of output of the display target character string “explosive power up”. However, for convenience, not the character code but the corresponding character is shown. In addition, the memory arrangement in the character string buffer is also shown.
メモリ位置が0バイト目から3バイト目までは、表示態様制御情報なので、図11AのOP1の処理と、OP2及びOP3との処理が繰り返し実行される。メモリ位置4バイト目から8バイト目までは、同じ文字種別(漢字)の文字コードが続くので、図11AのOP4からOP10の処理が繰り返し実行される。 Since the memory position from the 0th byte to the 3rd byte is display mode control information, the processing of OP1 in FIG. 11A and the processing of OP2 and OP3 are repeatedly executed. Since the character codes of the same character type (Kanji) continue from the 4th byte to the 8th byte in the memory location, the processing from OP4 to OP10 in FIG. 11A is repeatedly executed.
メモリ位置10バイト目における「パ」の処理で、文字種別が漢字からカタカナに切り替る(図11A、OP7:NO)。したがって、「パ」が境界文字となる。以降、境界文字「パ」の文字種別用の類似字形辞書19として、カタカナ用の類似字形辞書19が用いられる。境界文字「パ」の一つ前の文字「力」(ちから)の文字種別用の類似字形辞書19として、漢字用の類似字形辞書19が用いられる。
The character type is switched from kanji to katakana in the “pa” process at the 10th byte of the memory location (FIG. 11A, OP7: NO). Therefore, “pa” is the boundary character. Thereafter, the similar
境界文字「パ」について、漢字用の類似字形辞書19が検索されるものの(図11B、OP22〜OP23)、「パ」の漢字の類似字形は存在しない(図11C、OP32:YES)。そのため、次に、「パ」の一つ前の文字である「力」(ちから)について、カタカナ用の類似字形辞書19が検索される(図11C、OP33〜OP36:NO、OP40、OP41)。
Although the similar
「力」(ちから)はカタカナの「カ」と類似する字形であるので、カタカナ用の類似字形辞書19には、「力」(ちから)が登録されている(図11C、OP36:YES)。また、カタカナ用の類似字形辞書19の「力」(ちから)のエントリの後修飾方式の内容
は、「区切り」であるとする。図12に示される例では、修飾方式が「区切り」の場合には、区切りを示す記号として「▼」(2バイト)が挿入されることとする。
Since “force” (chika) has a character shape similar to katakana “ka”, “force” (chika) is registered in the similar
メモリ位置10バイト目以降のデータは、区切りを示す記号を挿入するため、2バイト後方にシフトされる(図11C、OP37)。すなわち、「パ」は、メモリ位置12バイト目に移動させられる。データのシフトにより空いたメモリ位置10〜11バイト目に、区切りを示す記号「▼」が挿入される。 Data after the 10th byte of the memory position is shifted backward by 2 bytes in order to insert a symbol indicating a delimiter (FIG. 11C, OP37). That is, “pa” is moved to the 12th byte of the memory location. A symbol “▼” indicating a delimiter is inserted into the 10th to 11th bytes of the memory location that is vacated by the data shift.
次に、文字種別境界検索ポインタが、メモリ位置10バイト目から12バイト目(図11C、OP39)、さらに、メモリ位置12バイト目から14バイト目へと進められる(図11A、OP9)。 Next, the character type boundary search pointer is advanced from the 10th byte to the 12th byte at the memory location (FIG. 11C, OP39), and further from the 12th byte to the 14th byte at the memory location (FIG. 11A, OP9).
メモリ位置14バイト目以降は、「パ」と同じ文字種別(カタカナ)の文字が格納されているので、図11AのOP4〜OP10の処理が繰り返し実行される。表示態様制御部14による処理の結果、「爆発力▼パワーアップ」という表示態様となる。
Since the 14th byte of the memory location, characters of the same character type (Katakana) as “Pa” are stored, the processing of OP4 to OP10 in FIG. 11A is repeatedly executed. As a result of the processing by the display
<第1実施形態の作用効果>
第1実施形態によれば、類似字形辞書19に基づいて、文字種別の切り替わる部分にある文字が類似字形辞書19に登録されている場合に、該文字の表示態様を変更することによって、表示態様の変更を局所的に抑えつつ、誤読を抑制することができる。
<Operational effects of the first embodiment>
According to the first embodiment, based on the similar
また、類似字形辞書19は、文字種別ごとに用意される。これによって、文字種別の切り替わる部分にある文字の前後の文字の文字種別を考慮して、文字種別の切り替わる部分にある文字の表示態様の変更が行われることになる。そのため、文字種別ごとに類似字形辞書19が用意されることは、表示態様の変更となる文字をより局所的にし、原文の体裁をなるべく保つことに、寄与する。
Further, the similar
また、表示態様制御部14は、文字種別が切り替わる直後の境界文字が、一つ前の文字の文字種別用の類似字形辞書19に登録されている場合に、該境界文字の表示態様を変更する。これによって、例えば、「シュート力」の「力」(ちから)のように、特定の文字種別の文字に続くことによって誤読を招くような文字の表示態様を変更することで、誤読を低減することができる。
Further, when the boundary character immediately after the character type is switched is registered in the similar
また、表示態様制御部14は、文字種別が切り替わる直後の境界文字が、一つ前の文字の文字種別用の類似字形辞書19に登録されておらず、該境界文字の文字種別用の類似字形辞書19に該境界文字の一つ前の文字が登録されている場合に、該一つ前の文字の表示態様を変更する。これによって、例えば、「爆発力パワーアップ」の「力」(ちから)のように、特定の文字種別の文字が後続することによって誤読を招くような文字の表示態様を変更することで、誤読を低減することができる。
Further, the display
また、文字表示制御プログラムをフォントドライバの一部として実現することによって、個々のアプリケーションの構成を変えることなく、誤読を低減することができる。 Further, by realizing the character display control program as a part of the font driver, it is possible to reduce misreading without changing the configuration of each application.
<記録媒体>
コンピュータその他の機械、装置(以下、コンピュータ等)に上記いずれかの機能を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
<Recording medium>
A program for causing a computer or other machine or device (hereinafter, a computer or the like) to realize any of the above functions can be recorded on a recording medium that can be read by the computer or the like. The function can be provided by causing a computer or the like to read and execute the program of the recording medium.
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報
を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる非一時的な記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD−ROM、CD−R/W、DVD、ブルーレイディスク、DAT、8mmテープ、フラッシュメモリなどのメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスク、ROM(リードオンリーメモリ)等がある。さらに、SSD(Solid State Drive)は、コンピュータ等から取り外し可能な記録媒体としても、コ
ンピュータ等に固定された記録媒体としても利用可能である。
Here, a computer-readable recording medium is a non-temporary recording medium in which information such as data and programs is accumulated by electrical, magnetic, optical, mechanical, or chemical action and can be read from a computer or the like. A typical recording medium. Examples of such a recording medium that can be removed from a computer or the like include a flexible disk, a magneto-optical disk, a CD-ROM, a CD-R / W, a DVD, a Blu-ray disk, a DAT, an 8 mm tape, a flash memory, and the like. There are cards. In addition, as a recording medium fixed to a computer or the like, there are a hard disk, a ROM (read only memory), and the like. Further, an SSD (Solid State Drive) can be used as a recording medium removable from a computer or the like, or as a recording medium fixed to the computer or the like.
1 携帯端末
13 フォントドライバ
14 表示態様制御部
17 フォントファイル
18 文字コード定義表
19 類似字形辞書
101 CPU
102 記憶部
102A ROM
102B RAM
103 不揮発性メモリ
104 ディスプレイ
DESCRIPTION OF
102
102B RAM
103
Claims (6)
表示対象の文字列について、前記記憶部に含まれる情報に基づいて、文字種別の切り替わる部分にあり、且つ、前記複数の文字に含まれる文字を検出した場合に、前記検出された文字の表示態様を変更する制御部と、
を備える情報処理装置。 A storage unit for storing information on each of a plurality of characters having similar character shapes in different character types;
A display mode of the detected character when a character string to be displayed is in a portion where the character type is switched based on information included in the storage unit and is included in the plurality of characters. A control unit for changing
An information processing apparatus comprising:
前記制御部は、前記文字種別の切り替わる部分に含まれ、互いに文字種別が異なり、隣接する第1の文字と第2の文字について、前記第2の文字の文字種別に対応する文字群に、前記第1の文字が含まれている場合に、該第1の文字の表示態様を変更する、
請求項1に記載の情報処理装置。 The storage unit is a plurality of character groups corresponding to the plurality of characters corresponding to each of the character types, and each character group may lead to misreading by being linked to a character of the corresponding character type. Including similar character-shaped characters present in a character type different from the corresponding character type,
The control unit is included in the portion where the character type is switched, the character types are different from each other, and the first character and the second character adjacent to each other in the character group corresponding to the character type of the second character, When the first character is included, the display mode of the first character is changed.
The information processing apparatus according to claim 1.
請求項2に記載の情報処理装置。 In the case where the control unit is configured such that the second character is a character preceding the first character, and the first character is included in a character group corresponding to a character type of the second character. To change the display mode of the first character,
The information processing apparatus according to claim 2.
請求項3に記載の情報処理装置。 When the first character is not included in the character group corresponding to the character type of the second character, the control unit corresponds to the character type of the first character. It is determined whether or not it is included in a character group, and when the second character is included in a character group corresponding to the character type of the first character, the second display mode is changed. ,
The information processing apparatus according to claim 3.
請求項1から4のいずれか一項に記載の情報処理装置。 The control unit is a part of a font driver.
The information processing apparatus according to any one of claims 1 to 4.
異なる文字種別に類似字形の文字が存在する複数の文字のそれぞれに関する情報を記憶部に記憶させ、
表示対象の文字列について、前記記憶部に含まれる情報に基づいて、文字種別の切り替わる部分にあり、且つ、前記複数の文字に含まれる文字を検出した場合に、前記検出された文字の表示態様を変更させる、
情報処理プログラム。 On the computer,
Storing information on each of a plurality of characters having similar character-shaped characters in different character types in the storage unit;
A display mode of the detected character when a character string to be displayed is in a portion where the character type is switched based on information included in the storage unit and is included in the plurality of characters. Change
Information processing program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015163596A JP2017040857A (en) | 2015-08-21 | 2015-08-21 | Information processor and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015163596A JP2017040857A (en) | 2015-08-21 | 2015-08-21 | Information processor and information processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017040857A true JP2017040857A (en) | 2017-02-23 |
Family
ID=58206557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015163596A Pending JP2017040857A (en) | 2015-08-21 | 2015-08-21 | Information processor and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017040857A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020087313A (en) * | 2018-11-30 | 2020-06-04 | 株式会社リコー | Information processor, information processing system and information processing program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03156516A (en) * | 1989-11-15 | 1991-07-04 | Toshiba Corp | Data input system |
JPH06223221A (en) * | 1993-01-25 | 1994-08-12 | Toshiba Corp | Character recognizing device |
JPH09185673A (en) * | 1995-12-28 | 1997-07-15 | Hitachi Ltd | Character recognized result output method |
JPH11250040A (en) * | 1998-03-05 | 1999-09-17 | Just Syst Corp | Character recognition device and its method and computer readable recording medium storing program for computer execution of the program |
JP2002183132A (en) * | 2000-12-11 | 2002-06-28 | Hitachi Ltd | Information processor |
-
2015
- 2015-08-21 JP JP2015163596A patent/JP2017040857A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03156516A (en) * | 1989-11-15 | 1991-07-04 | Toshiba Corp | Data input system |
JPH06223221A (en) * | 1993-01-25 | 1994-08-12 | Toshiba Corp | Character recognizing device |
JPH09185673A (en) * | 1995-12-28 | 1997-07-15 | Hitachi Ltd | Character recognized result output method |
JPH11250040A (en) * | 1998-03-05 | 1999-09-17 | Just Syst Corp | Character recognition device and its method and computer readable recording medium storing program for computer execution of the program |
JP2002183132A (en) * | 2000-12-11 | 2002-06-28 | Hitachi Ltd | Information processor |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020087313A (en) * | 2018-11-30 | 2020-06-04 | 株式会社リコー | Information processor, information processing system and information processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4712947B2 (en) | Character input method, user interface and terminal | |
KR101149982B1 (en) | Asian language input using keyboard | |
US5784071A (en) | Context-based code convertor | |
EP2047381A2 (en) | Method and apparatus for font subsetting | |
KR101030831B1 (en) | Method and apparatus for providing foreign language text display when encoding is not available | |
KR102574306B1 (en) | dynamic typesetting | |
JP2010520532A (en) | Input stroke count | |
JP7481999B2 (en) | Dictionary editing device, dictionary editing method, and dictionary editing program | |
US20030014220A1 (en) | Bi-directional display | |
JP2017040857A (en) | Information processor and information processing program | |
CN105683891A (en) | Inputting tone and diacritic marks by gesture | |
JP7102710B2 (en) | Information generation program, word extraction program, information processing device, information generation method and word extraction method | |
JP2006163651A (en) | Display device, control method of display device, program and font data | |
JP5715172B2 (en) | Document display device, document display method, and document display program | |
JP6523345B2 (en) | Plain ASCII data stream encoding | |
JP6933395B2 (en) | Automatic translation device and automatic translation program | |
US20070033035A1 (en) | String display method and device compatible with the hindi language | |
KR101159323B1 (en) | Handwritten input for asian languages | |
JP6249760B2 (en) | Text-to-speech device | |
EP2894547B1 (en) | Character input device, character input method of character input device, and non-transitory computer-readable medium | |
JP2017091024A (en) | Input assistance device | |
KR20090000485A (en) | Method and system for providing font | |
CN111857362A (en) | Character input method and character input device | |
KR102556563B1 (en) | Font update method and device for text range | |
JPH10320399A (en) | Language identification device and method therefor and recording medium for recording program of language identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180514 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20180725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181019 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190507 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190917 |