JP2006092223A - 携帯通信端末及び多言語表示制御方法 - Google Patents
携帯通信端末及び多言語表示制御方法 Download PDFInfo
- Publication number
- JP2006092223A JP2006092223A JP2004276312A JP2004276312A JP2006092223A JP 2006092223 A JP2006092223 A JP 2006092223A JP 2004276312 A JP2004276312 A JP 2004276312A JP 2004276312 A JP2004276312 A JP 2004276312A JP 2006092223 A JP2006092223 A JP 2006092223A
- Authority
- JP
- Japan
- Prior art keywords
- language
- character
- code
- character string
- communication terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Digital Computer Display Output (AREA)
- Information Transfer Between Computers (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
【課題】 言語ごとに字形が異なる文字に同一の文字コードが割り当てられた文字が文字列に含まれる場合であっても、字形の表示を正しく行うことができる携帯通信端末を提供する。
【解決手段】 各言語に共通に割り当てられる文字コードであって異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードとし、特殊文字コードに対応付けて言語ごとに異なる字形を記憶する文字情報記憶部11と、統合コードを各言語に対応付けるコード変換テーブル9に基づいて文字列を構成する各統合コードに対応する言語を文字ごとに識別し、当該文字列における各言語の出現頻度を求める言語識別部10と、各言語の出現頻度に基づいて文字列に用いられている言語を判別する言語判定部8と、各統合コードのうち、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列を画面上に表示する表示制御部6により構成される。
【選択図】 図1
【解決手段】 各言語に共通に割り当てられる文字コードであって異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードとし、特殊文字コードに対応付けて言語ごとに異なる字形を記憶する文字情報記憶部11と、統合コードを各言語に対応付けるコード変換テーブル9に基づいて文字列を構成する各統合コードに対応する言語を文字ごとに識別し、当該文字列における各言語の出現頻度を求める言語識別部10と、各言語の出現頻度に基づいて文字列に用いられている言語を判別する言語判定部8と、各統合コードのうち、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列を画面上に表示する表示制御部6により構成される。
【選択図】 図1
Description
本発明は、携帯通信端末及び多言語表示制御方法に係り、さらに詳しくは、異なる複数の言語ごとに割り当てられる文字コード、及び、各言語に共通に割り当てられる文字コードからなる統合コードにより記述された文字列を表示可能な携帯電話機などの携帯通信端末の改良に関する。
世界各国で使われている言語には様々な種類があり、それらをコンピューターなどの電子機器によって処理する際、それぞれの言語に対して互いに異なるエンコーディング基準が採用されている。異なるエンコーディング基準間には互換性がないことから、異なる地域間において電子メールなどの文字情報を送受信した場合、文字が正しく表示されないことがあるという問題があった。異なるエンコーディング基準を全てカバーできれば、異なる地域間であっても常に文字を正しく表示させることができる。しかし、携帯電話機やPDA(Personal Digital Assistant)などの小型の携帯通信端末では、パーソナルコンピューターなどに比べて記憶容量が小さいので、全てのエンコーディング基準をカバーするのは困難であった。
従来から、異なる複数の言語ごとに割り当てられる文字コードと、各言語に共通に割り当てられる文字コードからなる統合コード、例えば、ユニコード(Unicode)が各国共通のエンコーディング基準として用いられている。そこで、この様な統合コードを用いて文字情報をエンコーディングすれば、異なる地域間であっても、「文字化け」などの不具合を生じることなく文字情報を表示させることができる。例えば、特許文献3には、漢字を使用する国(漢字圏の国)間で共通に用いられる文字コードを使って文字情報を送受信する通信端末が記載されている。
一般に、ユニコードなどの統合コードでは、言語間で重複する文字や、意味または構造が似通った文字同士に同一の文字コードが割り当てられる。この場合、言語ごとに異なる文字であっても同一の文字コードが割り当てられるケースが生じることになる。例えば、日本語における漢字の「骨」は、繁体字中国語や簡体字中国語における漢字とは字形(glyph:グリフ)が異なっているにもかかわらず、ユニコードでは、これらの漢字に対して同一の文字コード(0x9AA8)が割り当てられている。また、日本語の「海」も、簡体字中国語とは字形が異なっているにもかかわらず、ユニコードでは、これらの漢字に対して同一の文字コード(0x6D77)が割り当てられている。
図4(a)〜(c)は、各言語に共通に割り当てられる文字コードに対応する文字であって、異なる言語間で字形が異なる文字の一例を示した図であり、図4(a)には、日本語における漢字「骨」が示され、図4(b)には、日本語の「骨」に対応する繁体字中国語における漢字が示され、図4(c)には、簡体字中国語における漢字が示されている。また、図5(a)及び(b)は、各言語に共通に割り当てられる文字コードに対応する文字であって、異なる言語間で字形が異なる文字の他の例を示した図であり、図5(a)には、日本語における漢字「海」が示され、図5(b)には、日本語の「海」に対応する簡体字中国語における漢字が示されている。
この様な文字には言語ごとに異なる文字であるにもかかわらず同一の文字コードが割り当てられるので、当該文字を画面上に表示させようとすると、字形の表示が正しく行われない場合があるという問題があった。すなわち、上述した様な文字では、文字コードから適切な字形を判別することはできないので、言語ごとに異なる字形を表示可能な通信端末であっても、上記文字を含む文字列に用いられている言語に対応する適切な字形で当該文字を表示することができないという問題があった。
具体的には、繁体字中国語による文字表示がデフォルト設定として予め指定されている通信端末において、簡体字中国語を用いて表されたウェブ(Web)ページを閲覧する場合、言語ごとに割り当てられた文字コード、すなわち、繁体字中国語及び簡体字中国語間で重複しない文字コードに対応する文字は、適切に簡体字中国語の字形で表示される。これに対し、各言語に共通に割り当てられた文字コード、すなわち、繁体字中国語及び簡体字中国語間で重複する文字コードに対応する文字は、デフォルト設定によって繁体字中国語の字形で表示され、簡体字中国語で表されたウェブページであるにもかかわらず、繁体字が混在してしまう。
特開2003−330855号公報
特開平7−200589号公報
特開平6−243056号公報
上述した通り、従来の通信端末では、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字に関して字形が正しく表示されない場合があるという問題があった。
本発明は、上記事情に鑑みてなされたものであり、ユニコードなどの統合コードにより記述された文字列を表示する際、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字が文字列に含まれる場合であっても、字形の表示を正しく行うことができる携帯通信端末及び多言語表示制御方法を提供することを目的としている。特に、文字列に用いられている言語に対応する適切な字形で文字表示することができる携帯通信端末を提供することを目的としている。
本発明による携帯通信端末は、異なる2以上の言語ごとに割り当てられる文字コード、及び、各言語に共通に割り当てられる文字コードからなる統合コードにより記述された文字列を表示可能な携帯通信端末であって、各言語に共通に割り当てられる文字コードであって、異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードとし、この特殊文字コードに対応付けて言語ごとに異なる字形を記憶する字形記憶手段と、上記文字列を構成する各統合コードに基づいて、当該文字列に用いられている言語を判別する言語判定手段と、上記文字列を構成する各統合コードのうち、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列を画面上に表示する文字列表示制御手段とを備えて構成される。
この様な構成により、文字列を構成する各統合コードに基づいて当該文字列に用いられている言語が判別され、文字列の表示が行われる。その際、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列が表示されるので、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字が文字列に含まれる場合であっても、文字列に用いられている言語に対応する適切な字形で文字表示させることができる。
本発明による携帯通信端末は、上記構成に加え、上記統合コードを各言語に対応付けるコード変換テーブルと、上記コード変換テーブルに基づいて上記文字列を構成する統合コードに対応する言語を文字ごとに識別し、当該文字列における各言語の出現頻度を求める言語識別手段とを備え、上記言語判定手段が、上記出現頻度に基づいて文字列に用いられている言語を判別するように構成される。
特に、上記出現頻度を所定の閾値レベルと比較する文字列解析手段を備え、上記言語判定手段が、上記出現頻度の比較の結果、出現頻度が閾値レベルを超える言語が存在する場合、当該言語を判別結果として出力するように構成される。
また、本発明による携帯通信端末は、上記構成に加え、ユーザーに択一的に選択させた言語の種類をユーザー指定言語として記憶するユーザー指定記憶手段を備え、上記言語判定手段が、いずれの言語についてもその出現頻度が閾値レベルを超えない場合、上記ユーザー指定言語を判別結果として出力するように構成される。
本発明による携帯通信端末は、上記構成に加え、言語ごとに上記文字列について構文解析し、当該文字列から単語を抽出する文字列解析手段を備え、上記言語判定手段が、抽出された単語、及び、単語間の論理的接続関係に基づいて文字列に用いられている言語を判別するように構成される。
本発明による多言語表示制御方法は、異なる2以上の言語ごとに割り当てられる文字コード、及び、各言語に共通に割り当てられる文字コードからなる統合コードにより記述された文字列を表示させる多言語表示制御方法であって、各言語に共通に割り当てられる文字コードであって、異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードとし、この特殊文字コードに対応付けて言語ごとに異なる字形を記憶する字形記憶ステップと、上記統合コードを各言語に対応付けるコード変換テーブルに基づいて上記文字列を構成する各統合コードに対応する言語を文字ごとに識別し、当該文字列における各言語の出現頻度を求める言語識別ステップと、求められた各言語の出現頻度に基づいて文字列に用いられている言語を判別する言語判定ステップと、上記文字列を構成する各統合コードのうち、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列を画面上に表示する文字列表示調整ステップとからなる。
本発明による携帯通信端末及び多言語表示制御方法によれば、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字表示が行われるので、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字が文字列に含まれる場合であっても、文字列に用いられている言語に対応する適切な字形で文字表示させることができる。従って、ユニコードなどの統合コードにより記述された文字列を表示させる場合に、常に字形の表示を正しく行わせることができる。
実施の形態1.
図1は、本発明の実施の形態1による携帯通信端末の一構成例を示したブロック図である。本実施の形態による携帯通信端末1は、携帯電話機やPDA(Personal Digital Assistant)などの小型の電子機器であり、ユニコード(Unicode)などの統合コードにより記述された文字情報の表示を行っている。
図1は、本発明の実施の形態1による携帯通信端末の一構成例を示したブロック図である。本実施の形態による携帯通信端末1は、携帯電話機やPDA(Personal Digital Assistant)などの小型の電子機器であり、ユニコード(Unicode)などの統合コードにより記述された文字情報の表示を行っている。
この携帯通信端末1は、無線通信部2、主制御部3、操作入力制御部4、LCD5、表示制御部6、文字列解析部7、言語判定部8、コード変換テーブル9、言語識別部10、文字情報記憶部11及びユーザー指定記憶部12からなる。
無線通信部2は、電子メールやウェブ(Web)ページなどの文字情報の送受信処理を行っている。アンテナを介して受信した電子メールや、インターネットなどの通信ネットワーク上のサーバーからダウンロードしたウェブページは、文字情報記憶部11に格納される。
操作入力制御部4は、オンフックキーやオフフックキー、テンキーなどの各種操作キーによる操作入力に関する制御を行っている。表示制御部6は、LCD(Liquid Crystal Display:液晶ディスプレイ)5における文字情報の表示に関する制御を行っている。受信した電子メールやダウンロードしたウェブページは、ユーザーの操作入力により、必要に応じてLCD5上に表示させることができる。その際、電子メールやウェブページに用いられている言語に応じて字形を異ならせて文字表示が行われる。
ここでは、日本語、繁体字中国語、簡体字中国語、韓国語及び英語の5つの言語による文字情報が表示可能であるものとする。また、電子メールやウェブページなどの文字情報が統合コードによりエンコーディングされ、統合コードによって記述された文字列が文字情報として文字情報記憶部11に記憶されるものとする。統合コードは、異なる2以上の言語ごとに割り当てられる文字コード(以下、個別コードという)と、各言語に共通に割り当てられる文字コード(以下、共通コードという)からなるコード体系であり、ユニコードはその一例である。
ユニコードは、各言語において用いられる全ての文字を32ビット(4バイト)のデジタルデータによりコード化させる文字コード規格である。このユニコードでは、異なる言語間で重複する文字や、意味または構造、語源が同一であるか、或いは、似通った文字同士に同一の文字コードが割り当てられている。
例えば、日本語における漢字の「骨」は、繁体字中国語(Traditional Chinese)や簡体字中国語(Simplified Chinese)における漢字とは字形(glyph:グリフ)が異なっているにもかかわらず、これらの漢字に対して共通コード(0x9AA8(16進数による表記))が割り当てられている。また、日本語の「海」も、簡体字中国語とは字形が異なっているにもかかわらず、これらの漢字に対して共通コード(0x6D77)が割り当てられている。
ここで、共通コードのうち、異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードと呼んで、異なる言語間であっても字形が異ならない文字を表す文字コードと区別すると、上記共通コード(0x9AA8及び0x6D77)はいずれも特殊文字コードである。文字情報記憶部11には、この様な特殊文字コードに対応付けて言語ごとに異なる字形が記憶されている。
具体的には、「骨」の場合、日本語、繁体字中国語及び簡体字中国語間で互いに字形が異なり、日本語及び韓国語間で字形が同一となっている。また、「海」の場合には、日本語及び簡体字中国語間で字形が異なり、繁体字中国語、簡体字中国語及び韓国語間で字形が同一となっている。ここで、字形は、文字を画面上に表示する際の文字の形状、すなわち、フォントである。また、繁体字中国語は、主に台湾や香港で使用されている言語であり、簡体字中国語は、主に中国本土で使用されている言語である。
コード変換テーブル9は、統合コードを各言語に対応付けるためのコード割り当てが格納されたデータベースである。すなわち、各文字コードは、このコード変換テーブル9によってそれぞれ所定の言語における所定の文字に対応付けられる。
言語識別部10は、文字情報記憶部11から文字列を読み出して画面表示する際、当該文字列を構成する統合コードに対応する言語を識別し、文字列における各言語の出現頻度を出力する動作を行っている。
各統合コードに対応する言語の識別は、コード変換テーブル9に基づいて文字ごとに行われ、識別結果に基づいて出現頻度が生成される。
具体的には、言語の識別数をカウントし、着目する統合コードが個別コードであれば、その個別コードが属する言語であるとみなして、当該言語のカウント数を1だけ増加させる。一方、着目する統合コードが共通コードであれば、文字が共通する各言語に対してそれぞれカウント数を1だけ増加させる。文字列を構成する全ての統合コードについて、この様なカウント動作を実行し、全カウント数に対する言語ごとのカウント数の比から出現頻度(出現率)が求められる。
文字列解析部7は、上記出現頻度を所定の閾値レベルと比較することによって、文字列を解析する動作を行っている。すなわち、言語識別部10によって求められた各言語の出現頻度が言語ごとに閾値レベルと比較される。ここでは、文字情報記憶部11から読み出された文字列に前述した特殊文字コードが含まれる場合に、文字列の解析が行われるものとする。つまり、文字列中に特殊文字コードが含まれ、従って、文字の字形を言語に応じて指示する必要が生じた場合にだけ、文字列の解析が行われ、文字列中に特殊文字コードが含まれない場合には、文字列解析を行わない。
言語判定部8は、出現頻度に基づいて文字列に用いられている言語を判別する動作を行っている。具体的には、文字列解析部7による出現頻度の比較の結果、出現頻度が閾値レベルを超える言語が存在する場合、当該言語が判別結果として出力される。例えば、繁体字中国語の出現頻度が80%を超えていれば、読み出した文字列に使用されている言語は繁体字中国語であるとみなされ、当該文字列を構成する各統合コードのうち、特殊文字コードについては判別された言語に対応する字形、すなわち、繁体字中国語の字形に変換して文字列が画面表示される。
ユーザー指定記憶部12は、ユーザーに択一的に選択させた言語の種類をユーザー指定言語として記憶するメモリである。すなわち、ユーザーの操作入力によりデフォルトの設定言語を必要に応じて変更することができる。
文字列解析部7による出現頻度の比較の結果、いずれの言語についてもその出現頻度が閾値レベルを超えない場合には、ユーザー指定記憶部12に予め記憶されているユーザー指定言語が判別結果として出力される。つまり、この場合には、特殊文字コードにより表された文字はデフォルトの設定言語による字形で画面表示される。
これにより、文字列における各言語の出現頻度から当該文字列に用いられている言語が判別され、文字列が画面上に表示される。その際、共通コードについては判別された言語に対応する字形によって文字表示が行われるので、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字が文字列に含まれる場合であっても、文字列に用いられている言語に対応する適切な字形で文字表示させることができる。
図2のステップS101〜S107は、図1の携帯通信端末における文字列表示の動作例を示したフローチャートである。まず、ユーザーにより文字情報の閲覧操作が行われると、言語識別部10は、この操作入力に基づいて文字情報記憶部11から文字列を読み出し、当該文字列を構成する各統合コードに対応する言語を識別する処理を開始する(ステップS101,S102)。
次に、コード変換テーブル9に基づいて、言語の識別結果から文字列における各言語の出現頻度が算出される(ステップS103)。文字列解析部7は、算出された各言語の出現頻度を所定の閾値レベルと比較し、文字列の解析処理を行う。
言語判定部8は、この文字列の解析処理の結果に基づいて文字列に使用されている言語を判別する(ステップS104)。このとき、出現頻度が閾値レベルを超える言語が存在すれば、当該言語が判別結果として出力され、その言語に対応する字形により文字列が画面表示される(ステップS105,S106)。
一方、出現頻度が閾値レベルを超える言語が存在しなかった場合には、ユーザー指定言語が判別結果として出力され、ユーザー指定言語に対応する字形で文字列が画面表示される(ステップS107)。
本実施の形態によれば、共通コードについては判別された言語に対応する字形によって文字表示が行われるので、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字が文字列に含まれる場合であっても、文字列に用いられている言語に対応する適切な字形で文字表示させることができる。従って、ユニコードなどの統合コードにより記述された文字列を表示させる場合に、常に字形の表示を正しく行わせることができる。
なお、本実施の形態では、文字列における各言語の出現頻度に基づいて当該文字列に使用されている言語が判別される場合の例について説明したが、本発明はこれに限られるものではない。例えば、文字列に含まれる特定の個別コードに着目し、この個別コードに基づいて当該文字列に用いられている言語を判別しても良い。
実施の形態2.
実施の形態1では、文字列における各言語の出現頻度に基づいて当該文字列に使用されている言語が判別される場合の例について説明した。これに対し、本実施の形態では、文字列について言語ごとに構文解析を行い、文字列に含まれる単語と、その論理的接続関係から当該文字列に使用されている言語を判別する場合について説明する。
実施の形態1では、文字列における各言語の出現頻度に基づいて当該文字列に使用されている言語が判別される場合の例について説明した。これに対し、本実施の形態では、文字列について言語ごとに構文解析を行い、文字列に含まれる単語と、その論理的接続関係から当該文字列に使用されている言語を判別する場合について説明する。
図3のステップS201〜S205は、本発明の実施の形態2による携帯通信端末における文字列表示の動作例を示したフローチャートである。本実施の形態による携帯通信端末は、日本語、繁体字中国語、簡体字中国語及び英語の4つの言語による文字情報を表示可能となっている。
まず、文字情報記憶部11から文字列が読み出され、当該文字列について言語ごとに構文解析が行われる(ステップS201,S202)。この構文解析によって文字列から単語が抽出され(ステップS203)、抽出された単語と、単語間の論理的接続関係に基づいて文字列に用いられている言語が判別される(ステップS204)。
文字列から抽出される各単語は、着目する言語において文章構造上の意味に基づいて区分される文字の集合体である。例えば、各単語は、名詞や動詞、助詞、副詞、形容詞のいずれかに分類される。
ここでは、抽出された単語、及び、その論理的接続関係から信頼度(尤度)が言語ごとに算出されるものとする。この信頼度は、文字列を構成する全単語について、文章構造上の意味が妥当であるか否かに応じて定められる。つまり、文章構造上の意味が不明である単語や接続関係が文字列中に多く含まれる場合には、着目する言語が当該文字列に使用されているとする上で、信頼度は低いとみなされる。
具体的に、日本語における文章「私は日本人です」という文字列を例として信頼度の求め方について説明する。上記文章を日本語として構文解析した場合と、繁体字中国語として構文解析した場合とを比較すると、前者の場合、「私」(名詞)、「は」(助詞)、「日本人」(名詞)、「です」(助詞)となるのに対し、後者の場合には、「私は」(不明)、「日本人」(名詞)、「です」(不明)となる。このとき、前者に比べて後者の場合は、文章構造上の意味が不明となる単語が多く、信頼度は低いとみなされる。
この様にして求められた信頼度に基づいて文字列に使用されている言語が判別され、当該文字列が画面表示される(ステップS205)。すなわち、信頼度が最も高い言語が使用言語であるとみなされ、当該言語に対応する字形による文字列の表示が行われる。
本実施の形態によれば、共通コードについては判別された言語に対応する字形によって文字表示が行われるので、言語ごとに字形が異なる文字に同一の文字コードが割り当てられる文字が文字列に含まれる場合であっても、文字列に用いられている言語に対応する適切な字形で文字表示させることができる。
1 携帯通信端末
2 無線通信部
3 主制御部
4 操作入力制御部
5 LCD
6 表示制御部
7 文字列解析部
8 言語判定部
9 コード変換テーブル
10 言語識別部
11 文字情報記憶部
12 ユーザー指定記憶部
2 無線通信部
3 主制御部
4 操作入力制御部
5 LCD
6 表示制御部
7 文字列解析部
8 言語判定部
9 コード変換テーブル
10 言語識別部
11 文字情報記憶部
12 ユーザー指定記憶部
Claims (6)
- 異なる2以上の言語ごとに割り当てられる文字コード、及び、各言語に共通に割り当てられる文字コードからなる統合コードにより記述された文字列を表示可能な携帯通信端末において、
各言語に共通に割り当てられる文字コードであって、異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードとし、この特殊文字コードに対応付けて言語ごとに異なる字形を記憶する字形記憶手段と、
上記文字列を構成する各統合コードに基づいて、当該文字列に用いられている言語を判別する言語判定手段と、
上記文字列を構成する各統合コードのうち、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列を画面上に表示する文字列表示制御手段とを備えたことを特徴とする携帯通信端末。 - 上記統合コードを各言語に対応付けるコード変換テーブルと、
上記コード変換テーブルに基づいて、上記文字列を構成する統合コードに対応する言語を文字ごとに識別し、当該文字列における各言語の出現頻度を求める言語識別手段とを備え、
上記言語判定手段は、上記出現頻度に基づいて、文字列に用いられている言語を判別することを特徴とする請求項1に記載の携帯通信端末。 - 上記出現頻度を所定の閾値レベルと比較する文字列解析手段を備え、
上記言語判定手段は、上記出現頻度の比較の結果、出現頻度が閾値レベルを超える言語が存在する場合、当該言語を判別結果として出力することを特徴とする請求項2に記載の携帯通信端末。 - ユーザーに択一的に選択させた言語の種類をユーザー指定言語として記憶するユーザー指定記憶手段を備え、
上記言語判定手段は、いずれの言語についてもその出現頻度が閾値レベルを超えない場合、上記ユーザー指定言語を判別結果として出力することを特徴とする請求項3に記載の携帯通信端末。 - 言語ごとに上記文字列について構文解析し、当該文字列から単語を抽出する文字列解析手段を備え、
上記言語判定手段は、抽出された単語、及び、単語間の論理的接続関係に基づいて、文字列に用いられている言語を判別することを特徴とする請求項1に記載の携帯通信端末。 - 異なる2以上の言語ごとに割り当てられる文字コード、及び、各言語に共通に割り当てられる文字コードからなる統合コードにより記述された文字列を表示させる多言語表示制御方法において、
各言語に共通に割り当てられる文字コードであって、異なる言語間で字形が異なる文字を表す文字コードを特殊文字コードとし、この特殊文字コードに対応付けて言語ごとに異なる字形を記憶する字形記憶ステップと、
上記統合コードを各言語に対応付けるコード変換テーブルに基づいて、上記文字列を構成する各統合コードに対応する言語を文字ごとに識別し、当該文字列における各言語の出現頻度を求める言語識別ステップと、
求められた各言語の出現頻度に基づいて、文字列に用いられている言語を判別する言語判定ステップと、
上記文字列を構成する各統合コードのうち、各言語に共通に割り当てられた文字コードについては判別された言語に対応する字形に変換して文字列を画面上に表示する文字列表示調整ステップとからなることを特徴とする多言語表示制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004276312A JP2006092223A (ja) | 2004-09-24 | 2004-09-24 | 携帯通信端末及び多言語表示制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004276312A JP2006092223A (ja) | 2004-09-24 | 2004-09-24 | 携帯通信端末及び多言語表示制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006092223A true JP2006092223A (ja) | 2006-04-06 |
Family
ID=36233125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004276312A Pending JP2006092223A (ja) | 2004-09-24 | 2004-09-24 | 携帯通信端末及び多言語表示制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006092223A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009028555A1 (ja) * | 2007-08-30 | 2009-03-05 | Nec Corporation | 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム |
JP2018034347A (ja) * | 2016-08-30 | 2018-03-08 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置および文字描画プログラム |
JP2018034348A (ja) * | 2016-08-30 | 2018-03-08 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置および文字描画プログラム |
JP2020086405A (ja) * | 2018-11-30 | 2020-06-04 | 株式会社リコー | 情報処理装置、情報処理システム及び情報処理プログラム |
JP2021022386A (ja) * | 2020-09-16 | 2021-02-18 | 株式会社Fronteo | 情報処理装置、自然言語処理システム、制御方法、および制御プログラム |
-
2004
- 2004-09-24 JP JP2004276312A patent/JP2006092223A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009028555A1 (ja) * | 2007-08-30 | 2009-03-05 | Nec Corporation | 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム |
JPWO2009028555A1 (ja) * | 2007-08-30 | 2010-12-02 | 日本電気株式会社 | 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム |
JP2014160252A (ja) * | 2007-08-30 | 2014-09-04 | Nec Corp | 電子機器、文字列表示方法、および文字列表示プログラム |
JP2018034347A (ja) * | 2016-08-30 | 2018-03-08 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置および文字描画プログラム |
JP2018034348A (ja) * | 2016-08-30 | 2018-03-08 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置および文字描画プログラム |
JP2020086405A (ja) * | 2018-11-30 | 2020-06-04 | 株式会社リコー | 情報処理装置、情報処理システム及び情報処理プログラム |
JP2021022386A (ja) * | 2020-09-16 | 2021-02-18 | 株式会社Fronteo | 情報処理装置、自然言語処理システム、制御方法、および制御プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11909902B2 (en) | Communication terminal and method of providing unified interface to the same | |
JP6122800B2 (ja) | 電子機器、文字列表示方法、および文字列表示プログラム | |
EP1679614B1 (en) | Method and apparatus for providing foreign language text display when encoding is not available | |
JP4891438B2 (ja) | キーパッドテキスト入力の多義性解消 | |
US7366984B2 (en) | Phonetic searching using multiple readings | |
CN102577334A (zh) | 用于自动预测性选择网络浏览器的输入法的方法和装置 | |
US8271263B2 (en) | Multi-language text fragment transcoding and featurization | |
JP2006092223A (ja) | 携帯通信端末及び多言語表示制御方法 | |
US20060066618A1 (en) | ZhuYin symbol and tone mark input method, and electronic device | |
US20060022029A1 (en) | Keyboard with special symbol key and code exchange method for such key | |
US20110131488A1 (en) | Word input method | |
JP4221132B2 (ja) | 情報処理装置及び方法並びにこれに利用される記憶媒体 | |
EP1621973A2 (en) | Keyboard with special symbol key and code exchange method for such key | |
JP4999014B2 (ja) | 拡大縮小可能フォントをサポートするテキストエディタを用いたオブジェクトの挿入 | |
US20080189327A1 (en) | Handheld Electronic Device and Associated Method for Obtaining New Language Objects for Use by a Disambiguation Routine on the Device | |
JP5261133B2 (ja) | 辞書検索機能付き文字列変換装置 | |
JP2011034441A (ja) | 表記変換装置、表記変換方法およびプログラム | |
CA2619423C (en) | Handheld electronic device and associated method for obtaining new language objects for use by a disambiguation routine on the device | |
JP2006079507A (ja) | 電子メール装置 | |
JP3843010B2 (ja) | かな漢字変換装置 | |
US7599829B2 (en) | Phonetic searching using partial characters | |
JP2004362496A (ja) | 単語登録装置、単語登録方法及び単語登録プログラム | |
JP2004070749A (ja) | 情報検索装置 | |
JPH10254864A (ja) | 文書変換装置および文書変換方法 | |
JP2002082944A (ja) | 形態素解析装置、形態素解析方法、ならびに、記録媒体 |