JPWO2009028555A1 - 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム - Google Patents

電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム Download PDF

Info

Publication number
JPWO2009028555A1
JPWO2009028555A1 JP2009530151A JP2009530151A JPWO2009028555A1 JP WO2009028555 A1 JPWO2009028555 A1 JP WO2009028555A1 JP 2009530151 A JP2009530151 A JP 2009530151A JP 2009530151 A JP2009530151 A JP 2009530151A JP WO2009028555 A1 JPWO2009028555 A1 JP WO2009028555A1
Authority
JP
Japan
Prior art keywords
character
language
character string
specific
belongs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009530151A
Other languages
English (en)
Inventor
自彪 呉
自彪 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2009028555A1 publication Critical patent/JPWO2009028555A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Abstract

本発明は、ユニコードで表された文字列に言語ごとに異なる文字が含まれる場合においても正確に字形の表示および画数によるソートを行うことのできる電子機器を提供することを課題とする。そのために、本発明に係る電子機器(1)は、ユニコードによって記述された文字の複数の言語における字形情報を保存する字形保存手段(12)と、ユニコードによって記述された文字によって構成された文字列の中から1文字を抽出し、抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、抽出された1文字が言語独特文字であれば文字列の属する言語が言語独特文字の属する言語であると特定する判別手段(7)と、特定された言語における字形保存手段に保存されている字形情報によって文字列を表示する表示手段(6)とを有する。

Description

本発明は、携帯電子機器で文字を表示およびソートする方法に関し、特にユニコードにより記述された文字を携帯電話などの電子機器で表示およびソートする方法に関する。
世界各国で使われているさまざまな言語をコンピュータなどの電子機器によって処理する際、それぞれの言語に対して異なるエンコーディング方式(文字コード)が採用されている。たとえば日本語ではJIS(ISO−2022−JP)、Shift_JIS、EUC−JPなどの文字コードがある。中国語ではGB2312(簡体字)やBig5(繁体字)など、韓国語ではKSC5601などの文字コードが代表的である。コンピュータが多くの言語で使用されるようになったことにより、文字コードの種類は飛躍的に増大し、現在では代表的なものだけで100種類以上の文字コードが存在する。
異なる言語(文字コード)の間には互換性がないので、異なる地域間において電子メールなどの文字情報を送受信した場合、文字が正確に表示されないことがある。このため、米国マイクロソフト社のウィンドウズ(登録商標)シリーズなどのようなパーソナルコンピュータ(PC)用のオペレーティングシステム(OS)では、複数の言語に対応するためのモジュールが用意されており、これを利用することによって文字を正確に表示させることができる。しかし、携帯電話機、PDA、音楽プレーヤーなどのような小型電子機器は、記憶容量や演算能力に制約があるので、これと同じような方法で複数の言語に対応させることが困難である。
異なる言語(文字コード)の間の互換性を解決するため、多くの言語の文字を単一の文字コードで取り扱うことが可能なユニコード(Unicode、米国における商標)が考案された。現在では、ユニコードは世界共通のエンコーディング方式として、幅広く利用されるようになっている。ユニコードは、異なる複数の言語ごとに割り当てられる文字コードと、各言語に共通に割り当てられる文字コードからなる統合コードである。ユニコードを利用して文字情報をエンコーディングすることにより、異なる地域間であっても文字化けなどの不具合を生じることなく文字情報を表示させることができる。
しかしユニコードでは、言語間で重複する文字や、意味または構造が似通った文字同士に同一の文字コードが割り当てられている。このため、言語ごとに画数および字形が異なる文字であっても、類似した漢字には同一の文字コードが割り当てられるケースが生じている。
図5は、言語ごとに異なる文字に対してユニコードで同一の文字コードが割り当てられた文字の例を示すイメージ図である。たとえば、図5の(A)は、日本語の漢字「突」と、繁体字中国語および簡体字中国語においてそれに対応する漢字を示している。日本語、繁体字中国語、簡体字中国語で、これらの漢字は画数および字形がそれぞれ異なっている。より具体的には日本語の漢字「突」の画数は、簡体字中国語や繁体字中国語でそれに対応する漢字より1画少ない。しかしユニコードでは、これらの漢字に対してすべて同一の文字コード(U+0x7A81)が割り当てられている。
また、図5の(B)は、日本語の漢字「滑」と、繁体字中国語においてそれに対応する漢字を示している。日本語と繁体字中国語において、これらの漢字は画数および字形がそれぞれ異なっている。より具体的には日本語の漢字「滑」の画数は、簡体字中国語でそれに対応する漢字より1画多い。しかしユニコードでは、これらの漢字に対して同一の文字コード(U+0x6ED1)が割り当てられている。
言語ごとに異なる文字であるにもかかわらず同一の文字コードが割り当てられた場合、たとえばユニコードで表された中国語の電子メールやウェブサイトを表示する場合であっても、日本語のOSでは、前述の「突」や「滑」などのような文字は日本語の字形で表示されるので、中国語でそれらの電子メールやウェブサイトを書いた者の意図した通りの表示にはならないことがある。また、それらの文字を含む文字列を画数でソートした場合、日本語と中国語とでそれらの文字の画数が異なるので、ソートした結果が異なってしまうことがある。
この問題を解決する方法として、特許文献1には、文字列における各言語に特有の文字の出現頻度に基づいて、文字列に利用されている言語を判別する技術が開示されている。また、特許文献2には、字形(フォント)識別情報によって特定される字形によってユニコードで表示される文字列を表示する技術が開示されている。特許文献3には、字形(グリフ)切り替えデータによって特定される字形によってユニコードで表示される文字列を表示する技術が開示されている。
特開2006−92223号公報 特開2000−227790号公報 特開平11−232276号公報
しかし、上述の特許文献1の技術では、文字列を構成するすべての文字に対して各言語に特有の文字であるか否かを識別し、当該文字列における各言語の出現頻度を求める必要がある。字数が多くなると、この判別の処理に多くの計算量と時間がかかるという問題があった。特に前述のような小型電子機器で、このような処理を行うことが困難である。
一方、特許文献2および3の技術では、文字列データは字形識別情報(フォントタイプ)、もしくは字形(グリフ)切り替えデータなどといった追加情報を持ち、それらのデータによって文字列に利用されている言語を特定して、該言語に対応する字形で該文字列を表示する技術を開示している。この技術によれば、言語によって異なる字形の表示、および画数によるソートを正確に行うことができる。しかし、追加情報を持つことによって、電子メールやウェブサイトなどのデータの容量が増大することになる。
本発明の目的は、追加情報に頼ることなく、また小型電子機器で無理なく処理できる計算量で、ユニコードで表された文字列に言語ごとに異なる文字が含まれる場合においても字形の表示および画数によるソートを正確に行うことのできる電子機器、文字列の表示方法とソート方法、および文字列表示/ソートプログラムを提供することにある。
上記目的を達成するため、本発明に係る電子機器は、ユニコードによって記述された文字の複数の言語における字形情報を保存する字形保存手段と、ユニコードによって記述された文字によって構成された文字列の中から1文字を抽出し、抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、抽出された1文字が言語独特文字であれば文字列の属する言語が言語独特文字の属する言語であると特定する判別手段とを有することを特徴とする。
上記目的を達成するため、本発明に係る文字列の表示方法は、複数の言語における字形情報を保存する字形保存手段と、判別手段と、表示手段とを有する電子機器にあって、ユニコードによって記述された文字列を表示する方法であって、判別手段が文字列を提供し、
次に判別手段が文字列に含まれる任意の1文字を抽出し、次に判別手段が抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、抽出された1文字が言語独特文字である場合に、判別手段が文字列の属する言語が言語独特文字の属する言語であると特定し、次に表示手段が特定された言語の字形保存手段に保存されている字形によって文字列を表示することを特徴とする。
上記目的を達成するため、本発明に係る文字列のソート方法は、複数の言語における字形情報および画数情報を保存する字形保存手段と、判別手段と、ソート手段とを有する電子機器にあって、ユニコードによって記述された複数の文字列をソートする方法であって、判別手段が複数の文字列を提供し、次に判別手段が複数の文字列の中のいずれかの文字列に含まれる文字を1文字ずつ抽出し、次に判別手段が抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、抽出された1文字が言語独特文字である場合に判別手段が、文字列の属する言語が言語独特文字の属する言語であると特定し、次にソート手段が言語独特文字の属する言語における画数情報によって複数の文字列の画数を判別し、次にソート手段が画数に基づいて複数の文字列をソートすることを特徴とする。
上記目的を達成するため、本発明に係る文字列表示プログラムは、複数の言語における字形情報を保存する字形保存手段と、表示手段とを有する電子機器が備えているコンピュータに、ユニコードによって記述された文字列に含まれる任意の1文字を抽出する処理と、抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別する処理と、抽出された1文字が言語独特文字である場合に、文字列の属する言語が言語独特文字の属する言語であると特定する処理と、特定された言語の字形保存手段に保存されている字形によって表示手段に文字列を表示させる処理とを実行させることを特徴とする。
上記目的を達成するため、本発明に係る文字列ソートプログラムは、複数の言語における字形情報および画数情報を保存する字形保存手段を有する電子機器が備えているコンピュータに、ユニコードによって記述された複数の文字列の中のいずれかの文字列に含まれる文字を1文字ずつ抽出する処理と、抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別する処理と、抽出された1文字が言語独特文字である場合に、文字列の属する言語が言語独特文字の属する言語であると特定する処理と、言語独特文字の属する言語における画数情報によって複数の文字列の画数を判別する処理と、画数に基づいて複数の文字列をソートする処理とを実行させることを特徴とする。
本発明は、上記したようにユニコードによって記述された文字によって構成された文字列に含まれる文字を1文字ずつ言語独特文字であるか否かを判別し、言語独特文字を含む場合に該文字列の属する言語が言語独特文字の属する言語であると特定するように構成したので、追加情報に頼ることなく、また携帯電子機器で無理なく可能な計算量で、文字列の属する言語を判別することができる。これによって、ユニコードで表された文字列に対して小さい処理能力で有効に動作することのできる従来にない優れた電子機器、文字列の表示方法とソート方法、および文字列表示/ソートプログラムを提供することができる。
以下、本発明の実施形態を図に基づいて説明する。
図1は、本発明の実施の形態による小型電子機器の一構成例を示したブロック図である。本発明の実施形態における小型電子機器の一例である携帯電話端末1は、中央処理装置2と、メモリ部11、LCD13、無線モジュール14、操作部15からなる。中央処理装置2は、MPUおよびRAMからなる主制御部3が、無線通信部4、操作入力処理部5、言語判定処理部6、言語識別処理部7、文字情報保存処理部8、ユーザ指定保存処理部9、表示処理部10の各機能を実行する。
無線通信部4は無線モジュール14を制御し、地上局(図示せず)との間で無線による音声通信およびデータ通信を確立する。主制御部3は無線通信部4を制御してデータ通信を行い、インターネットなどを介して電子メールやウェブページなどのデータをダウンロードして、文字情報保存処理部8を介してメモリ部11に格納する。また主制御部3は、操作入力処理部5を介して、ユーザによる操作部15におけるキー入力を受け付け、上述の各処理部によって処理を行う。そして主制御部3は、各々の処理の結果を表示処理部10を介してLCD(Liquid Crystal Display、液晶ディスプレイ)13に表示する。
メモリ部11はユニコード変換テーブル12を含む。ユニコード変換テーブル12は、ユニコードで表示された文字を各言語に対応付けるためのコードアサインが格納されたデータベースである。より具体的にはユニコード変換テーブル12は、ユニコードで表示された日本語、繁体字中国語、簡体字中国語、韓国語、香港中国語などの文字の字形と画数、および各々の文字が後述する言語独特文字であるか否かについての情報を含む。
メモリ部11に記憶された電子メールやウェブページなどのデータは、操作部15および操作入力処理部5を通じたユーザからの操作入力により、文字情報保存処理部8によってメモリ部11を介して読み出される。その際、メールやウェブページに利用されている言語を言語識別処理部7が識別する。
言語判定処理部6は、言語識別処理部7の識別結果に基づいて、文字列に利用されている言語を判別する。また、言語判定処理部6は、該文字列の判別された言語の字形における画数を確定し、確定された画数に基づいてソートする処理も行う。そして、言語判定処理部6はその識別結果に対応した字形をユニコード変換テーブル12から読み出し、該字形によって該文字列およびソート処理結果を表示処理部10を介してLCD13上に表示する。
ユーザ指定保存処理部9は、ユーザにデフォルトの設定言語としてあらかじめ選択させた言語の種類をユーザ指定言語として保存するメモリである。言語識別処理部7が言語を識別できなかった場合、ユーザ指定保存処理部9に予め保存されているデフォルトの設定言語が判別結果として出力される。
本実施の形態では、ユニコードで表示される各言語の文字を、大きく「言語独特文字」と「共通文字」とに分ける。言語独特文字は、1種類の言語でしか使われない文字をいう。共通文字は、2種類以上の言語に共通して使われる文字をいう。各々の文字が言語独特文字であるか否かは、前述のようにユニコード変換テーブル12に保存されている。
たとえば、日本語のひらがなやカタカナ、韓国語のハングルなどは、典型的な言語独特文字である。漢字においては、中国語でしか使われない文字は言語独特文字であり、日本語や韓国語でも使われうる漢字は共通文字である。図5で例示した言語によって字形が異なる文字も、共通文字に含まれる。
図2は、図1内に開示した言語識別処理部7が行う、文字列に利用されている言語の識別の処理を表すフローチャートである。言語識別処理部7が処理を開始すると(S21)、まず変数I=1を定義する(ステップS22)。言語識別処理部7は判定対象文字列のI文字目を抜き出し、抜き出したI文字目が言語独特文字であるか否かを、ユニコード変換テーブル12のデータに基づいて識別する(ステップS23)。言語識別処理部7は、I文字目が言語独特文字であればステップS26に処理を進め、使用言語=該言語独特文字の属する言語との判定結果を言語判定処理部6に出力して、処理を終了する(ステップS28)。
言語識別処理部7は、ステップS23でI文字目が言語独特文字でなければ、変数Iが判定対象文字列の長さに等しいか否かを判別する(ステップS24)。言語識別処理部7は、等しくなければ、Iの値を1つ増やして(ステップS25)、ステップS23の処理を繰り返す。つまり、言語識別処理部7は図2に示すように、判定対象文字列の1文字目から順番に言語独特文字であるか否かを識別し、1文字でも言語独特文字に該当する文字があれば、該言語独特文字の属する言語が使用言語であると識別する。
言語識別処理部7は、ステップS24で変数Iが判定対象文字列の長さに等しい場合は、判定対象文字列の1文字目から順番に最後の文字までステップS23の処理を繰り返しても、言語独特文字に該当する文字が存在しなかったことを意味する。この場合は言語識別処理部7は、ステップS27に処理を進め、ユーザ指定保存処理部9に保存されているユーザ指定言語を読み出し、使用言語=ユーザ指定言語との判定結果を言語判定処理部6に出力して、処理を終了する(ステップS28)。
図3は、図1内に開示した言語判定処理部6が行う、文字列を表示する処理を表すフローチャートである。言語判定処理部6は、処理を開始して(S31)文字情報保存処理部8から表示対象文字列を得ると(ステップS32)、該文字列を言語識別処理部7によって言語の識別の処理を行う(ステップS33)。言語識別処理部7は、図2に示した処理で、使用言語を言語判定処理部6に出力する。言語判定処理部6は、判定された使用言語に基づいて該文字列をLCD13上に表示して終了する(ステップS34〜35)。
図4は、図1内に開示した言語判定処理部6が行う、複数の文字列をソートする処理を表すフローチャートである。言語判定処理部6は、処理を開始して(ステップS41)文字情報保存処理部8からk個のソート対象文字列(kは2以上の自然数)を得ると(ステップS42)、まず変数j=1を定義し(ステップS43)、j番目の文字列を言語識別処理部7によって言語の識別の処理を行う(ステップS44)。言語識別処理部7は、図2に示した処理で、使用言語を言語判定処理部6に出力する。言語判定処理部6は、j番目の文字列の画数を、判定された使用言語における字形に基づいて確定する(ステップS45)。
続いて言語判定処理部6は、変数jがソート対象文字列の個数kに等しいか否かを判別し(ステップS46)、等しくなければステップS47に処理を進めて、jの値を1つ増やして、ステップS44〜45の処理を繰り返す。つまり、言語判定処理部6は、用意されたk個のソート対象文字列の全てに対して使用言語を識別して画数を確定する。ステップS46で変数jがkに等しくなれば、全てのソート対象文字列の画数が確定されたのでステップS48に進み、確定された画数に基づいてソート対象文字列をソートして、ソートの結果をLCD13上に表示して終了する(ステップS49)。
なお、図2〜4で説明したフローチャートに係る各ステップの動作内容は、携帯電話端末1があらかじめ備えるコンピュータで動作するプログラムとして実行させるように構成することができる。また、図2〜4では対象文字列の1文字目から順番に言語独特文字であるか否かを識別しているが、これを対象文字列の最終文字から順番に識別するようにしてもよいし、対象文字列の中からアトランダムに抽出した文字について識別するようにしてもよい。なお、前記プログラムは、記録媒体に記録されて商取引の対象となる。
以上で述べたように、本実施の形態における使用言語の判別の処理は、上述の特許文献1のように表示対象文字列の全ての文字に対して言語独特文字であるか否かを識別して集計するのではない。1文字でも言語独特文字に該当する文字があれば、該言語独特文字の属する言語が使用言語であると識別するのである。従って、記憶容量や演算能力に制約がある携帯電子機器においても、無理のない計算量で使用言語の判別の処理を行うことができる。また、上述の特許文献2および3のように表示対象文字列とは別の追加情報を必要とはしないので、電子メールやウェブページなどのデータの容量を増大させることもない。
一方、図2に示した本実施の形態における使用言語の判別の処理では、1つの文字列の中に複数の言語における言語独特文字が含まれていると、誤った判別結果が出てしまう可能性を否定できない。小型電子機器で利用される電子メールやウェブページなどの文書容量は、PCなどで利用されるそれらと比べて一般的に小さいので、1つの文書の中に複数の言語における言語独特文字が含まれる可能性はPCの場合と比べて低い。従って、ほとんどの場合は、本実施の形態の判別処理で問題が生じることはない。
それでも誤った判別結果が出て誤った字形で文字が表示される場合には、前述のユーザ指定保存処理部9などを利用して、ユーザが任意に使用言語を切り替えて電子メールやウェブページを表示できるようにすることが望ましい。
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることは言うまでもないことである。
以上、実施形態(及び実施例)を参照して本願発明を説明したが、本願発明は上記実施形態(及び実施例)に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は2007年8月30日に出願された日本出願特願2007−224894を基礎とする優先権を主張し、その開示の全てをここに取り込む。
ユニコードにより記述された文字を表示する電子機器において利用可能である。特に、携帯電話機、PDA、音楽プレーヤーなどのような小型電子機器に適している。
本発明の実施の形態による小型電子機器の一構成例を示したブロック図である。 図1内に開示した言語識別処理部が行う、文字列に利用されている言語の識別の処理を表すフローチャートである。 図1内に開示した言語判定処理部が行う、文字列を表示する処理を表すフローチャートである。 図1内に開示した言語判定処理部が行う、複数の文字列をソートする処理を表すフローチャートである。 言語ごとに異なる文字に対してユニコードで同一の文字コードが割り当てられた文字の例を示すイメージ図である。
符号の説明
1 携帯電話端末
2 中央処理装置
3 主制御部
4 無線通信部
5 操作入力処理部
6 言語判定処理部(表示手段、ソート手段)
7 言語識別処理部(判別手段)
8 文字情報保存処理部
9 ユーザ指定保存処理部(言語保持手段)
10 表示処理部
11 メモリ部(記憶手段)
12 ユニコード変換テーブル(字形保存手段)
13 LCD
14 無線モジュール
15 操作部

Claims (12)

  1. ユニコードによって記述された文字の複数の言語における字形情報を保存する字形保存手段と、
    前記ユニコードによって記述された文字によって構成された文字列の中から1文字を抽出し、前記抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、前記抽出された1文字が前記言語独特文字であれば前記文字列の属する言語が前記言語独特文字の属する言語であると特定する判別手段とを有することを特徴とする電子機器。
  2. さらに、前記特定された言語における前記字形保存手段に保存されている字形情報によって前記文字列を表示する表示手段を有することを特徴とする請求項1に記載の電子機器。
  3. 前記判別手段は、前記抽出された1文字が前記言語独特文字でなければ、前記文字列から別の1文字を抽出して該文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別する動作を繰り返し、前記文字列に1文字でも前記言語独特文字が含まれていれば前記文字列の属する言語が前記言語独特文字の属する言語であると特定することを特徴とする請求項1に記載の電子機器。
  4. 前記判別手段は、前記文字列の最初の1文字目から順番に前記言語独特文字であるか否かの判別を行うことを特徴とする請求項3に記載の電子機器。
  5. 前記判別手段にユーザのあらかじめ指定した言語を保持する言語保持手段を有し、
    前記表示手段は、前記判別手段が前記文字列に前記言語独特文字が含まれないと判断した場合、言語保持手段に保持された言語における字形によって前記文字列を表示することを特徴とする請求項4に記載の電子機器。
  6. 前記字形情報は、ユニコードによって記述された文字の複数の言語における画数を含み、
    複数の文字列を、各々の前記文字列の属する言語における前記画数によってソートし、前記ソートの結果を前記表示手段に表示するソート手段を有する請求項1ないし5のいずれか1項に記載の電子機器。
  7. ユニコードによって記述された文字列を表示する方法であって、
    前記文字列に含まれる任意の1文字を抽出し
    前記抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、
    前記抽出された1文字が前記言語独特文字である場合に、前記文字列の属する言語が前記言語独特文字の属する言語であると特定することを特徴とする表示方法。
  8. 前記特定された言語の字形によって前記文字列を表示することを特徴とする請求項7に記載の表示方法。
  9. 前記抽出された1文字が前記言語独特文字でない場合に、前記文字列から別の1文字を抽出して該文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別する動作を繰り返し、
    前記文字列に1文字でも前記言語独特文字が含まれていれば前記文字列の属する言語が前記言語独特文字の属する言語であると特定することを特徴とする請求項8に記載の表示方法。
  10. ユニコードによって記述された複数の文字列をソートする方法であって、
    前記複数の文字列の中のいずれかの文字列に含まれる文字を1文字ずつ抽出し、
    前記抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別し、
    前記抽出された1文字が前記言語独特文字である場合に、前記文字列の属する言語が前記言語独特文字の属する言語であると特定、
    前記言語独特文字の属する言語における前記画数情報によって前記複数の文字列の画数を判別し、
    前記画数に基づいて前記複数の文字列をソートする
    ことを特徴とするソート方法。
  11. 電子機器が備えているコンピュータに、
    ユニコードによって記述された文字列に含まれる任意の1文字を抽出する処理と、
    前記抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別する処理と、
    前記抽出された1文字が前記言語独特文字である場合に、前記文字列の属する言語が前記言語独特文字の属する言語であると特定する処理と、
    前記特定された言語の前記字形保存手段に保存されている字形によって前記表示手段に前記文字列を表示させる処理と
    を実行させることを特徴とする文字列表示プログラム。
  12. 電子機器が備えているコンピュータに、
    ユニコードによって記述された複数の文字列の中のいずれかの文字列に含まれる文字を1文字ずつ抽出する処理と、
    前記抽出された1文字が特定の言語にのみ含まれる言語独特文字であるか否かを判別する処理と、
    前記抽出された1文字が前記言語独特文字である場合に、前記文字列の属する言語が前記言語独特文字の属する言語であると特定する処理と、
    前記言語独特文字の属する言語における前記画数情報によって前記複数の文字列の画数を判別する処理と、
    前記画数に基づいて前記複数の文字列をソートする処理と
    を実行させることを特徴とする文字列ソートプログラム。
JP2009530151A 2007-08-30 2008-08-27 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム Pending JPWO2009028555A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007224894 2007-08-30
JP2007224894 2007-08-30
PCT/JP2008/065302 WO2009028555A1 (ja) 2007-08-30 2008-08-27 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014049697A Division JP6122800B2 (ja) 2007-08-30 2014-03-13 電子機器、文字列表示方法、および文字列表示プログラム

Publications (1)

Publication Number Publication Date
JPWO2009028555A1 true JPWO2009028555A1 (ja) 2010-12-02

Family

ID=40387272

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009530151A Pending JPWO2009028555A1 (ja) 2007-08-30 2008-08-27 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム
JP2014049697A Active JP6122800B2 (ja) 2007-08-30 2014-03-13 電子機器、文字列表示方法、および文字列表示プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014049697A Active JP6122800B2 (ja) 2007-08-30 2014-03-13 電子機器、文字列表示方法、および文字列表示プログラム

Country Status (3)

Country Link
JP (2) JPWO2009028555A1 (ja)
CN (1) CN101796573B (ja)
WO (1) WO2009028555A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2372987B1 (en) * 2010-04-02 2013-07-17 Research In Motion Limited Solving character display ambiguities
EP2445181B1 (en) 2010-10-21 2015-07-01 BlackBerry Limited Displaying characters and images based on support
WO2014056165A1 (en) * 2012-10-10 2014-04-17 Motorola Solutions, Inc. Method and apparatus for identifying a language used in a document and performing ocr recognition based on the language identified
CN103810279B (zh) * 2014-02-18 2018-09-14 天津松下汽车电子开发有限公司 一种混合字段的排序方法及装置
JP6489810B2 (ja) * 2014-11-28 2019-03-27 キヤノン株式会社 画像形成装置及び画像形成装置の制御方法
JP6536828B2 (ja) * 2016-08-30 2019-07-03 京セラドキュメントソリューションズ株式会社 画像形成装置および文字描画プログラム
JP6536829B2 (ja) * 2016-08-30 2019-07-03 京セラドキュメントソリューションズ株式会社 画像形成装置および文字描画プログラム
JP6781905B1 (ja) * 2019-07-26 2020-11-11 株式会社Fronteo 情報処理装置、自然言語処理システム、制御方法、および制御プログラム
JP2021022386A (ja) * 2020-09-16 2021-02-18 株式会社Fronteo 情報処理装置、自然言語処理システム、制御方法、および制御プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08255159A (ja) * 1995-03-15 1996-10-01 Toshiba Corp 文字列予測方法,文字列予測装置,仮名漢字変換方法,仮名漢字変換装置及び文書作成装置
JPH11232276A (ja) * 1998-02-17 1999-08-27 Canon Inc 文字処理装置と文字データの処理方法、及び記憶媒体
JP2000227790A (ja) * 1999-02-04 2000-08-15 Digital Electronics Corp 表示装置、および、そのプログラムが記録された記録媒体
JP2005182772A (ja) * 2003-11-28 2005-07-07 Sharp Corp 文字認識装置、プログラムおよび記録媒体
JP2006092223A (ja) * 2004-09-24 2006-04-06 Sharp Corp 携帯通信端末及び多言語表示制御方法
JP2007172387A (ja) * 2005-12-22 2007-07-05 Olympus Imaging Corp 文字処理装置、文字処理プログラム、文字処理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233550A (ja) * 1988-03-15 1989-09-19 Fujitsu Ltd 中国語の表示方式
JP3732785B2 (ja) * 2002-01-31 2006-01-11 株式会社一穂社 漢字検索装置、漢字検索方法、そのプログラム、及びそのプログラムを記録した記録媒体
JP4104000B2 (ja) * 2003-05-20 2008-06-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、制御方法、プログラム、及びプログラム記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08255159A (ja) * 1995-03-15 1996-10-01 Toshiba Corp 文字列予測方法,文字列予測装置,仮名漢字変換方法,仮名漢字変換装置及び文書作成装置
JPH11232276A (ja) * 1998-02-17 1999-08-27 Canon Inc 文字処理装置と文字データの処理方法、及び記憶媒体
JP2000227790A (ja) * 1999-02-04 2000-08-15 Digital Electronics Corp 表示装置、および、そのプログラムが記録された記録媒体
JP2005182772A (ja) * 2003-11-28 2005-07-07 Sharp Corp 文字認識装置、プログラムおよび記録媒体
JP2006092223A (ja) * 2004-09-24 2006-04-06 Sharp Corp 携帯通信端末及び多言語表示制御方法
JP2007172387A (ja) * 2005-12-22 2007-07-05 Olympus Imaging Corp 文字処理装置、文字処理プログラム、文字処理方法

Also Published As

Publication number Publication date
JP2014160252A (ja) 2014-09-04
CN101796573A (zh) 2010-08-04
CN101796573B (zh) 2014-08-06
WO2009028555A1 (ja) 2009-03-05
JP6122800B2 (ja) 2017-04-26

Similar Documents

Publication Publication Date Title
JP6122800B2 (ja) 電子機器、文字列表示方法、および文字列表示プログラム
US9589200B2 (en) Handwriting input conversion apparatus, computer-readable medium, and conversion method
US9766778B2 (en) Method and apparatus for rapid access to a contact in a contact list
US20090187846A1 (en) Method, Apparatus and Computer Program product for Providing a Word Input Mechanism
US8384686B1 (en) Constrained keyboard organization
US20140184514A1 (en) Input processing method and apparatus
EP3037948A1 (en) Portable electronic device and method of controlling display of selectable elements
KR20130058053A (ko) 중첩된 수기의 획들을 하나 이상의 그룹으로 분할하는 방법 및 장치
CN108256523B (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
US20060033644A1 (en) System and method for filtering far east languages
CN101369209B (zh) 用于全混合输入的手写输入装置及其方法
CN111880668A (zh) 输入显示方法、装置及电子设备
US20100149190A1 (en) Method, apparatus and computer program product for providing an input order independent character input mechanism
US8850311B2 (en) Word input method
CN110377167B (zh) 字体产生方法和字体产生装置
CN105700704A (zh) 小尺寸屏幕下的文字输入方法和装置
CN109492228B (zh) 信息处理装置及其分词处理方法
JP2005228016A (ja) 文字表示方法
JP4487614B2 (ja) 情報表示制御装置、及びプログラム
EP2703958A1 (en) Method and apparatus for optimizing handwriting input method
CN103870822A (zh) 词语识别方法及装置
CN103491228A (zh) 一种处理通讯录的方法及装置
CN107870678A (zh) 一种手写输入方法及装置
KR20150088974A (ko) 키 사용 빈도에 따라 인식 정확도를 높이는 방법을 적용한 qwerty 키패드
CN1889018A (zh) 一种在手机中实现快速输入的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130321

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140313

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140320

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140530

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140919