JP2004334630A - 情報処理装置および方法、並びにプログラム - Google Patents
情報処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP2004334630A JP2004334630A JP2003131120A JP2003131120A JP2004334630A JP 2004334630 A JP2004334630 A JP 2004334630A JP 2003131120 A JP2003131120 A JP 2003131120A JP 2003131120 A JP2003131120 A JP 2003131120A JP 2004334630 A JP2004334630 A JP 2004334630A
- Authority
- JP
- Japan
- Prior art keywords
- word
- data
- server
- dictionary
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】ユーザの意図的な操作を必要とすることなく、辞書データを更新する。
【解決手段】ステップS1で、受信されて記憶された各種のデータからテキストデータを抽出する。ステップS3で、抽出した日本語のテキストデータを解析して、当該テキストデータから全ての単語を抽出する。ステップS7で、注目した単語の単語データを辞書サーバに要求する。ステップS9で、取得した単語データを辞書データに登録する。これにより、辞書データは、登録された1単語分だけ学習されたことになる。本発明は、日本語入力機能を有する携帯電話機等に適用することができる。
【選択図】 図3
【解決手段】ステップS1で、受信されて記憶された各種のデータからテキストデータを抽出する。ステップS3で、抽出した日本語のテキストデータを解析して、当該テキストデータから全ての単語を抽出する。ステップS7で、注目した単語の単語データを辞書サーバに要求する。ステップS9で、取得した単語データを辞書データに登録する。これにより、辞書データは、登録された1単語分だけ学習されたことになる。本発明は、日本語入力機能を有する携帯電話機等に適用することができる。
【選択図】 図3
Description
【0001】
【発明の属する技術分野】
本発明は、情報処理装置および方法、並びにプログラムに関し、特に、日本語入力プログラムによる仮名漢字変換処理において参照される辞書データを、通信されたデータに含まれる単語に基づいて更新するようにした情報処理装置および方法、並びにプログラムに関する。
【0002】
【従来の技術】
例えば、IME(Input Method Editor)等の日本語入力プログラムでは、読み仮名と漢字との対応関係が記録されている辞書データを参照することにより、ユーザによって入力される読み仮名を漢字に変換するようにしている。
【0003】
したがって、仮名漢字変換の変換効率を向上させるためには、より多くの単語データ(読み仮名と対応する漢字の情報)を辞書データに登録しておく必要がある。
【0004】
ところで、例えば、電子メール送受信機能等を有する携帯電話機やPHS(Personal Handyphone System)電話機等の携帯端末装置には日本語入力プログラムが搭載されているが、携帯端末装置に内蔵されている記録媒体の容量が比較的小さいので、予め辞書データに登録されている単語データの数は限られている。
【0005】
したがって、携帯端末装置の日本語入力プログラムにおいて仮名漢字変換の変換効率を向上させるためには、何らかの方法によって辞書データを学習させること、具体的には、辞書データに登録されている単語データの数を増やすことが重要となる。
【0006】
辞書データを学習させる方法としては、ユーザによって入力された単語の読み仮名と対応する漢字とを辞書に登録する方法(以下、単語登録による方法と記述する)、ユーザによって入力された文書から単語を抽出して、その読み仮名と対応する漢字とを辞書に登録する方法(以下、単語抽出による方法と記述する)等が挙げられる。
【0007】
その他、インタネットを介して辞書データを丸ごと更新する方法、ユーザの発声を音声認識して読み仮名を入力する方法、ラジオの文字放送や音声放送から単語情報を抽出する方法等も存在する(例えば、特許文献1参照)。
【0008】
【特許文献1】
特開2002−99531号公報
【0009】
【発明が解決しようとする課題】
しかしながら、携帯電話機等の携帯端末装置では、文字入力のためのインプットデバイスとしてテンキーを用いていることから、パーソナルコンピュータのキーボードなどに比較して、ユーザの操作性が悪く、ユーザの文字入力操作や単語の登録操作が面倒であるので、実際には、単語登録による方法で辞書データが学習される頻度は低い。
【0010】
また、変換効率が向上する程度に単語抽出による方法によって辞書データを学習させるには、長い期間、携帯端末装置を使い込む必要がある。
【0011】
したがって、現実的には、携帯端末装置の辞書データが効果的に学習されることは少なく、流行語や特定分野の用語等の変換効率が依然として劣っている課題があった。
【0012】
本発明はこのような状況に鑑みてなされたものであり、ユーザの意図的な操作を必要とすることなく、辞書データを更新できるようにすることを目的とする。
【0013】
【課題を解決するための手段】
本発明の第1の情報処理装置は、ネットワークを介してサーバに接続する接続手段と、サーバから供給されるデータを受信する受信手段と、受信手段によって受信されたデータからテキスト部分を検出する検出手段と、検出手段によって検出されたテキスト部分から単語を抽出する抽出手段と、抽出手段によって抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得手段と、取得手段によって取得された単語データを辞書データに登録する登録手段とを含むことを特徴とする。
【0014】
前記接続手段は、インタネットを介してサーバに接続するようにすることができる。
【0015】
前記受信手段は、サーバから供給されるホームページの画面を表示するためのデータを受信するようにすることができる。
【0016】
前記抽出手段は、検出手段によって検出された日本語のテキスト部分から単語を抽出するようにすることができる。
【0017】
前記単語データは、単語の読み仮名および漢字を含むようにすることができる。
【0018】
本発明の第1の情報処理装置は、入力された読み仮名の文字列を、辞書データを参照することによって、対応する漢字に変換する変換手段をさらに含むことができる。
【0019】
本発明の第1の情報処理装置は、受信手段によって受信されたデータに対応する画像の表示を制御する表示制御手段をさらに含むことができる。
【0020】
前記検出手段、前記抽出手段、前記取得手段、および前記登録手段は、表示手段による処理のバックグランド処理として動作するようにすることができる。
【0021】
本発明の情報処理方法は、ネットワークを介してサーバに接続する接続ステップと、サーバから供給されるデータを受信する受信ステップと、受信ステップの処理で受信されたデータからテキスト部分を検出する検出ステップと、検出ステップの処理で検出されたテキスト部分から単語を抽出する抽出ステップと、抽出ステップの処理で抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得ステップと、取得ステップの処理で取得された単語データを辞書データに登録する登録ステップとを含むことを特徴とする。
【0022】
本発明のプログラムは、ネットワークを介してサーバに接続する接続ステップと、サーバから供給されるデータを受信する受信ステップと、受信ステップの処理で受信されたデータからテキスト部分を検出する検出ステップと、検出ステップの処理で検出されたテキスト部分から単語を抽出する抽出ステップと、抽出ステップの処理で抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得ステップと、取得ステップの処理で取得された単語データを辞書データに登録する登録ステップとを含む処理をコンピュータに実行させることを特徴とする。
【0023】
本発明の第2の情報処理装置は、端末装置からの要求に対応して、端末装置の辞書データに未登録の単語の単語データを、ネットワークを介して端末装置に供給する供給手段を含むことを特徴とする。
【0024】
本発明の第1の情報処理装置および方法、並びにプログラムにおいては、サーバから供給されるデータが受信され、受信されたデータからテキスト部分が検出され、検出されたテキスト部分から単語が抽出される。さらに、抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データがサーバから取得されて、辞書データに登録される。
【0025】
本発明の第2の情報処理装置においては、端末装置からの要求に対応して、端末装置の辞書データに未登録の単語の単語データが、ネットワークを介して端末装置に供給される。
【0026】
【発明の実施の形態】
以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【0027】
さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。
【0028】
すなわち、本発明の第1の情報処理装置(例えば、図1の携帯通信端末装置1)は、ネットワークを介してサーバに接続する接続手段(例えば、図2の通信部14)と、サーバから供給されるデータを受信する受信手段(例えば、図2の制御部11によって実行されるブラウザプログラム22)と、受信手段によって受信されたデータからテキスト部分を検出する検出手段(図2の単語登録プログラム25による図3のステップS1の処理)と、検出手段によって検出されたテキスト部分から単語を抽出する抽出手段(図2の単語登録プログラム25による図3のステップS3の処理)と、抽出手段によって抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得手段(図2の単語登録プログラム25による図3のステップS7の処理)と、取得手段によって取得された単語データを辞書データに登録する登録手段(図2の単語登録プログラム25による図3のステップS9の処理)とを含むことを特徴とする。
【0029】
本発明の第1の情報処理装置は、入力された読み仮名の文字列を、辞書データを参照することによって、対応する漢字に変換する変換手段(例えば、図2の制御部11によって実行される日本語入力プログラム24)をさらに含むことができる。
【0030】
本発明の第1の情報処理装置は、受信手段によって受信されたデータに対応する画像の表示を制御する表示制御手段(例えば、図2の表示部15)をさらに含むことができる。
【0031】
図1は、本発明を適用した情報通信システムの構成例を示している。
【0032】
携帯通信端末装置1は、例えば、携帯電話機、PHS電話機等からなり、通常の通話機能の他、電子メールを送受信する機能(以下、メール機能と記述する)、通信相手の電話番号や電子メールのアドレス等を管理する機能(以下、アドレス帳機能と記述する)、インタネット上のサーバにアクセスしてホームページ等を閲覧する機能(以下、インタネットアクセス機能と記述する)、メール機能やアドレス帳機能によって利用される仮名漢字変換機能を有している。
【0033】
通話機能が利用されるときにおいて、携帯通信端末装置1は、基地局2を介して通信回線網3に接続し、所望の通信先と音声データを通信する。
【0034】
メール機能が利用されるときにおいて、携帯通信端末装置1は、基地局2、通信回線網3、およびインタネット4を介し、メールサーバ6に接続して電子メールを通信する。インタネットアクセス機能が利用されるときにおいて、携帯通信端末装置1は、基地局2、通信回線網3、およびインタネット4を介し、コンテンツサーバ5に接続して、コンテンツデータ(例えば、携帯通信端末装置1においてホームページを表示するためのHTML(Hyper Text Markup Language)データ)を取得する。
【0035】
仮名漢字変換機能によって参照される、内蔵する辞書データに含まれる単語データ(単語の読み仮名、漢字、品詞等の対応関係を示すデータ)を更新するときにおいて、携帯通信端末装置1は、基地局2、通信回線網3、およびインタネット4を介し、辞書サーバ7に接続して、所望のデータ(例えば、携帯通信端末装置1においてホームページを表示するためのHTML(Hyper Text Markup Language)データ)を取得する。
【0036】
コンテンツサーバ5は、インタネット4等を介して接続された携帯通信端末装置1からの要求に対応して、コンテンツデータを携帯通信端末装置1に供給する。メールサーバ6は、インタネット4等を介して接続された携帯通信端末装置1からの要求に対応して、保管していた携帯通信端末装置1のユーザ宛の電子メールを携帯通信端末装置1に送信するとともに、携帯通信端末装置1から送信される電子メールを、送信先のメールサーバに送信する。
【0037】
辞書サーバ7は、インタネット4等を介して接続された携帯通信端末装置1からの要求に対応して、要求された単語の単語データを携帯通信端末装置1に供給する。なお、辞書サーバ7には、逐次、様々な分野の単語や新語の単語データが追加されるようになされているものとする。
【0038】
なお、図1において、コンテンツサーバ5、メールサーバ6、および辞書サーバ7は、インタネット4を介して通信回線網3に接続されているが、インタネット4を介することなく、直接的に通信回線網3に接続されているようにしてもよい。
【0039】
次に、図2は、図1の携帯通信端末装置1の構成例を示している。制御部11は、記憶部13に記憶されているプログラムに従って、バス12を介して接続されている携帯通信端末装置1の各部を制御することにより、上述した様々な機能を実現する。
【0040】
記憶部13は、例えば半導体メモリから成り、携帯通信端末装置1の各部を制御するための制御プログラム21、インタネットアクセス機能を実現するブラウザプログラム22、メール機能を実現する電子メールプログラム23、メール機能やアドレス帳機能に利用される仮名漢字変換処理等を実行する日本語入力プログラム24、日本語入力プログラム24によって参照される辞書データ26を学習させる処理を実行する単語登録プログラム25、および辞書データ26等を記憶している。
【0041】
なお、記憶部13には、例えば、通信部14によって受信される任意のプログラムや任意のデータ(HTMLデータ、電子メールのデータ等)も記憶させることができる。記憶部13は、携帯通信端末装置1に対して脱着可能であってもよい。
【0042】
通信部14は、制御部11からの制御に従い、基地局2との間における無線通信を行う。表示部15は、液晶パネル等から成り、制御部11からの制御に従い、ユーザの操作に対応する画面を表示する。操作入力部16は、数字ボタン等から成り、ユーザの操作を受け付ける。
【0043】
例えば、制御部11は、ユーザの操作に対応し、記憶部13に記憶されているブラウザプログラム22を実行することにより、通信部14を制御して、基地局2、通信回線網3、およびインタネット4を介し、コンテンツサーバ5に接続させてコンテンツデータを取得させ、表示部15を制御して、通信部14に取得させたコンテンツデータに対応する画像を表示させる。
【0044】
また例えば、制御部11は、ユーザの操作に対応し、記憶部13に記憶されている電子メールプログラム23を実行することにより、通信部14を制御して、基地局2、通信回線網3、およびインタネット4を介し、メールサーバ6に接続させて、電子メールを送受信させる。
【0045】
さらに例えば、制御部11は、所定のタイミングで記憶部13に記憶されている単語登録プログラム25を実行することにより、通信部14を制御して、基地局2、通信回線網3、およびインタネット4を介し、辞書サーバ7に接続させて単語データを取得させ、取得させた単語データを用いて辞書データ26を学習させる。
【0046】
単語登録プログラム25による処理の詳細について、図3のフローチャートを参照して説明する。
【0047】
この辞書データ学習処理は、例えば、インタネットアクセス機能よって受信されたHTMLデータやメール機能によって受信された電子メールのデータ等が記憶部13に記憶されたときに、ホームページの閲覧等のバックグランド処理として実行される。
【0048】
ステップS1において、単語登録プログラム25は、通信部14によって受信されて、記憶部13に記憶された各種のデータ(HTMLデータ、電子メールのデータ等)から、文字を表示するためのテキスト部分(以下、テキストデータと記述する)を抽出する。ステップS2において、単語登録プログラム25は、抽出したテキストデータが日本語であるか否かを判定する。抽出したテキストデータが日本語ではないと判定された場合、この辞書データ学習処理は終了される。
【0049】
ステップS2において、抽出したテキストデータが日本語であると判定された場合、処理はステップS3に進む。ステップS3において、単語登録プログラム25は、抽出した日本語のテキストデータを解析して、当該テキストデータから全ての単語を抽出する。
【0050】
ステップS4において、単語登録プログラム25は、抽出した全ての単語に注目したか否かを判定し、注目していない単語がまだ残っていると判定した場合、処理はステップS5に進む。ステップS5において、単語登録プログラム25は、抽出した単語のうち、まだ注目していない単語を、順次、1語ずつ注目する。
【0051】
ステップS6において、単語登録プログラム25は、注目した単語の単語データが、記憶部13の辞書データ26に既に登録されているか否かを判定する。注目した単語の単語データが辞書データ26に既に登録されていないと判定された場合、処理はステップS7に進む。
【0052】
ステップS7において、単語登録プログラム25は、注目した単語の単語データを辞書サーバ7に要求する。この要求に対して辞書サーバ7に、要求された単語の単語データが保持されている場合、当該単語データが携帯通信端末装置1に供給されることになる。
【0053】
ステップS8において、単語登録プログラム25は、注目した単語の単語データを辞書サーバ7から取得できたか否かを判定する。単語データを取得できたと判定された場合、処理はステップS9に進む。ステップS9において、単語登録プログラム25は、取得した単語データを、記憶部13の辞書データ26に追加登録する。これにより、辞書データ26は、登録された1単語分だけ学習されたことになる。この後、処理はステップS4に戻り、抽出した全ての単語を注目したと判定されるまで、それ以降の処理が繰り返される。
【0054】
なお、ステップS6において、注目した単語の単語データが記憶部13の辞書データ26に既に登録されていると判定された場合にも、処理はステップS4に戻ることになる。
【0055】
また、ステップS8において、注目した単語の単語データが辞書サーバ7から取得できなかったと判定された場合にも、処理はステップS4に戻ることになる。
【0056】
そして、ステップS4において、抽出した全ての単語を注目したと判定された場合、この辞書データ学習処理は終了される。
【0057】
以上説明したように、辞書データ学習処理によれば、ユーザが意図的に単語登録の操作をすることなく、ユーザがホームページを閲覧しているバックグラン処理として、ユーザが閲覧したホームページに記載されている単語や、受信した電子メールに含まれる単語の単語データが追加登録されて、辞書データ26が学習される。
【0058】
したがって、辞書データ26には、ユーザの興味のある分野の単語の単語データが追加されることになるので、ユーザが携帯通信端末装置1のメール機能等を用いて文書を作成するときの仮名漢字変換の変化能率が効果的に向上することが期待できる。
【0059】
なお、本発明は、携帯電話機等の携帯通信端末装置1だけでなく、日本語入力プログラム23に相当する、入力された仮名を漢字に変換する機能と、辞書サーバ7に相当する所定のサーバにアクセスする機能を有するあらゆる電子機器に適用することが可能である。
【0060】
また、本発明は、読み仮名と漢字の対応関係を示す辞書データを学習させる場合だけでなく、例えば、和英辞書、英和辞書などを学習させる場合にも適用することができる。
【0061】
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0062】
本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0063】
本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0064】
【発明の効果】
以上のように、本発明によれば、ユーザの意図的な操作を必要とすることなく、辞書データを更新することが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した情報通信システムの構成例を示すブロック図である。
【図2】図1の携帯通信端末装置の構成例を示すブロック図である。
【図3】携帯通信端末装置の辞書データ学習処理を説明するフローチャートである。
【符号の説明】
1 携帯通信端末装置, 3 通信回線網, 4 インタネット, 5 コンテンツサーバ, 6 メールサーバ, 7 辞書サーバ,11 制御部, 13記憶部, 14 通信部, 25 単語登録プログラム, 26 辞書データ
【発明の属する技術分野】
本発明は、情報処理装置および方法、並びにプログラムに関し、特に、日本語入力プログラムによる仮名漢字変換処理において参照される辞書データを、通信されたデータに含まれる単語に基づいて更新するようにした情報処理装置および方法、並びにプログラムに関する。
【0002】
【従来の技術】
例えば、IME(Input Method Editor)等の日本語入力プログラムでは、読み仮名と漢字との対応関係が記録されている辞書データを参照することにより、ユーザによって入力される読み仮名を漢字に変換するようにしている。
【0003】
したがって、仮名漢字変換の変換効率を向上させるためには、より多くの単語データ(読み仮名と対応する漢字の情報)を辞書データに登録しておく必要がある。
【0004】
ところで、例えば、電子メール送受信機能等を有する携帯電話機やPHS(Personal Handyphone System)電話機等の携帯端末装置には日本語入力プログラムが搭載されているが、携帯端末装置に内蔵されている記録媒体の容量が比較的小さいので、予め辞書データに登録されている単語データの数は限られている。
【0005】
したがって、携帯端末装置の日本語入力プログラムにおいて仮名漢字変換の変換効率を向上させるためには、何らかの方法によって辞書データを学習させること、具体的には、辞書データに登録されている単語データの数を増やすことが重要となる。
【0006】
辞書データを学習させる方法としては、ユーザによって入力された単語の読み仮名と対応する漢字とを辞書に登録する方法(以下、単語登録による方法と記述する)、ユーザによって入力された文書から単語を抽出して、その読み仮名と対応する漢字とを辞書に登録する方法(以下、単語抽出による方法と記述する)等が挙げられる。
【0007】
その他、インタネットを介して辞書データを丸ごと更新する方法、ユーザの発声を音声認識して読み仮名を入力する方法、ラジオの文字放送や音声放送から単語情報を抽出する方法等も存在する(例えば、特許文献1参照)。
【0008】
【特許文献1】
特開2002−99531号公報
【0009】
【発明が解決しようとする課題】
しかしながら、携帯電話機等の携帯端末装置では、文字入力のためのインプットデバイスとしてテンキーを用いていることから、パーソナルコンピュータのキーボードなどに比較して、ユーザの操作性が悪く、ユーザの文字入力操作や単語の登録操作が面倒であるので、実際には、単語登録による方法で辞書データが学習される頻度は低い。
【0010】
また、変換効率が向上する程度に単語抽出による方法によって辞書データを学習させるには、長い期間、携帯端末装置を使い込む必要がある。
【0011】
したがって、現実的には、携帯端末装置の辞書データが効果的に学習されることは少なく、流行語や特定分野の用語等の変換効率が依然として劣っている課題があった。
【0012】
本発明はこのような状況に鑑みてなされたものであり、ユーザの意図的な操作を必要とすることなく、辞書データを更新できるようにすることを目的とする。
【0013】
【課題を解決するための手段】
本発明の第1の情報処理装置は、ネットワークを介してサーバに接続する接続手段と、サーバから供給されるデータを受信する受信手段と、受信手段によって受信されたデータからテキスト部分を検出する検出手段と、検出手段によって検出されたテキスト部分から単語を抽出する抽出手段と、抽出手段によって抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得手段と、取得手段によって取得された単語データを辞書データに登録する登録手段とを含むことを特徴とする。
【0014】
前記接続手段は、インタネットを介してサーバに接続するようにすることができる。
【0015】
前記受信手段は、サーバから供給されるホームページの画面を表示するためのデータを受信するようにすることができる。
【0016】
前記抽出手段は、検出手段によって検出された日本語のテキスト部分から単語を抽出するようにすることができる。
【0017】
前記単語データは、単語の読み仮名および漢字を含むようにすることができる。
【0018】
本発明の第1の情報処理装置は、入力された読み仮名の文字列を、辞書データを参照することによって、対応する漢字に変換する変換手段をさらに含むことができる。
【0019】
本発明の第1の情報処理装置は、受信手段によって受信されたデータに対応する画像の表示を制御する表示制御手段をさらに含むことができる。
【0020】
前記検出手段、前記抽出手段、前記取得手段、および前記登録手段は、表示手段による処理のバックグランド処理として動作するようにすることができる。
【0021】
本発明の情報処理方法は、ネットワークを介してサーバに接続する接続ステップと、サーバから供給されるデータを受信する受信ステップと、受信ステップの処理で受信されたデータからテキスト部分を検出する検出ステップと、検出ステップの処理で検出されたテキスト部分から単語を抽出する抽出ステップと、抽出ステップの処理で抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得ステップと、取得ステップの処理で取得された単語データを辞書データに登録する登録ステップとを含むことを特徴とする。
【0022】
本発明のプログラムは、ネットワークを介してサーバに接続する接続ステップと、サーバから供給されるデータを受信する受信ステップと、受信ステップの処理で受信されたデータからテキスト部分を検出する検出ステップと、検出ステップの処理で検出されたテキスト部分から単語を抽出する抽出ステップと、抽出ステップの処理で抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得ステップと、取得ステップの処理で取得された単語データを辞書データに登録する登録ステップとを含む処理をコンピュータに実行させることを特徴とする。
【0023】
本発明の第2の情報処理装置は、端末装置からの要求に対応して、端末装置の辞書データに未登録の単語の単語データを、ネットワークを介して端末装置に供給する供給手段を含むことを特徴とする。
【0024】
本発明の第1の情報処理装置および方法、並びにプログラムにおいては、サーバから供給されるデータが受信され、受信されたデータからテキスト部分が検出され、検出されたテキスト部分から単語が抽出される。さらに、抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データがサーバから取得されて、辞書データに登録される。
【0025】
本発明の第2の情報処理装置においては、端末装置からの要求に対応して、端末装置の辞書データに未登録の単語の単語データが、ネットワークを介して端末装置に供給される。
【0026】
【発明の実施の形態】
以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【0027】
さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。
【0028】
すなわち、本発明の第1の情報処理装置(例えば、図1の携帯通信端末装置1)は、ネットワークを介してサーバに接続する接続手段(例えば、図2の通信部14)と、サーバから供給されるデータを受信する受信手段(例えば、図2の制御部11によって実行されるブラウザプログラム22)と、受信手段によって受信されたデータからテキスト部分を検出する検出手段(図2の単語登録プログラム25による図3のステップS1の処理)と、検出手段によって検出されたテキスト部分から単語を抽出する抽出手段(図2の単語登録プログラム25による図3のステップS3の処理)と、抽出手段によって抽出された単語に関する単語データが辞書データに未登録である場合、単語に関する単語データを、サーバから取得する取得手段(図2の単語登録プログラム25による図3のステップS7の処理)と、取得手段によって取得された単語データを辞書データに登録する登録手段(図2の単語登録プログラム25による図3のステップS9の処理)とを含むことを特徴とする。
【0029】
本発明の第1の情報処理装置は、入力された読み仮名の文字列を、辞書データを参照することによって、対応する漢字に変換する変換手段(例えば、図2の制御部11によって実行される日本語入力プログラム24)をさらに含むことができる。
【0030】
本発明の第1の情報処理装置は、受信手段によって受信されたデータに対応する画像の表示を制御する表示制御手段(例えば、図2の表示部15)をさらに含むことができる。
【0031】
図1は、本発明を適用した情報通信システムの構成例を示している。
【0032】
携帯通信端末装置1は、例えば、携帯電話機、PHS電話機等からなり、通常の通話機能の他、電子メールを送受信する機能(以下、メール機能と記述する)、通信相手の電話番号や電子メールのアドレス等を管理する機能(以下、アドレス帳機能と記述する)、インタネット上のサーバにアクセスしてホームページ等を閲覧する機能(以下、インタネットアクセス機能と記述する)、メール機能やアドレス帳機能によって利用される仮名漢字変換機能を有している。
【0033】
通話機能が利用されるときにおいて、携帯通信端末装置1は、基地局2を介して通信回線網3に接続し、所望の通信先と音声データを通信する。
【0034】
メール機能が利用されるときにおいて、携帯通信端末装置1は、基地局2、通信回線網3、およびインタネット4を介し、メールサーバ6に接続して電子メールを通信する。インタネットアクセス機能が利用されるときにおいて、携帯通信端末装置1は、基地局2、通信回線網3、およびインタネット4を介し、コンテンツサーバ5に接続して、コンテンツデータ(例えば、携帯通信端末装置1においてホームページを表示するためのHTML(Hyper Text Markup Language)データ)を取得する。
【0035】
仮名漢字変換機能によって参照される、内蔵する辞書データに含まれる単語データ(単語の読み仮名、漢字、品詞等の対応関係を示すデータ)を更新するときにおいて、携帯通信端末装置1は、基地局2、通信回線網3、およびインタネット4を介し、辞書サーバ7に接続して、所望のデータ(例えば、携帯通信端末装置1においてホームページを表示するためのHTML(Hyper Text Markup Language)データ)を取得する。
【0036】
コンテンツサーバ5は、インタネット4等を介して接続された携帯通信端末装置1からの要求に対応して、コンテンツデータを携帯通信端末装置1に供給する。メールサーバ6は、インタネット4等を介して接続された携帯通信端末装置1からの要求に対応して、保管していた携帯通信端末装置1のユーザ宛の電子メールを携帯通信端末装置1に送信するとともに、携帯通信端末装置1から送信される電子メールを、送信先のメールサーバに送信する。
【0037】
辞書サーバ7は、インタネット4等を介して接続された携帯通信端末装置1からの要求に対応して、要求された単語の単語データを携帯通信端末装置1に供給する。なお、辞書サーバ7には、逐次、様々な分野の単語や新語の単語データが追加されるようになされているものとする。
【0038】
なお、図1において、コンテンツサーバ5、メールサーバ6、および辞書サーバ7は、インタネット4を介して通信回線網3に接続されているが、インタネット4を介することなく、直接的に通信回線網3に接続されているようにしてもよい。
【0039】
次に、図2は、図1の携帯通信端末装置1の構成例を示している。制御部11は、記憶部13に記憶されているプログラムに従って、バス12を介して接続されている携帯通信端末装置1の各部を制御することにより、上述した様々な機能を実現する。
【0040】
記憶部13は、例えば半導体メモリから成り、携帯通信端末装置1の各部を制御するための制御プログラム21、インタネットアクセス機能を実現するブラウザプログラム22、メール機能を実現する電子メールプログラム23、メール機能やアドレス帳機能に利用される仮名漢字変換処理等を実行する日本語入力プログラム24、日本語入力プログラム24によって参照される辞書データ26を学習させる処理を実行する単語登録プログラム25、および辞書データ26等を記憶している。
【0041】
なお、記憶部13には、例えば、通信部14によって受信される任意のプログラムや任意のデータ(HTMLデータ、電子メールのデータ等)も記憶させることができる。記憶部13は、携帯通信端末装置1に対して脱着可能であってもよい。
【0042】
通信部14は、制御部11からの制御に従い、基地局2との間における無線通信を行う。表示部15は、液晶パネル等から成り、制御部11からの制御に従い、ユーザの操作に対応する画面を表示する。操作入力部16は、数字ボタン等から成り、ユーザの操作を受け付ける。
【0043】
例えば、制御部11は、ユーザの操作に対応し、記憶部13に記憶されているブラウザプログラム22を実行することにより、通信部14を制御して、基地局2、通信回線網3、およびインタネット4を介し、コンテンツサーバ5に接続させてコンテンツデータを取得させ、表示部15を制御して、通信部14に取得させたコンテンツデータに対応する画像を表示させる。
【0044】
また例えば、制御部11は、ユーザの操作に対応し、記憶部13に記憶されている電子メールプログラム23を実行することにより、通信部14を制御して、基地局2、通信回線網3、およびインタネット4を介し、メールサーバ6に接続させて、電子メールを送受信させる。
【0045】
さらに例えば、制御部11は、所定のタイミングで記憶部13に記憶されている単語登録プログラム25を実行することにより、通信部14を制御して、基地局2、通信回線網3、およびインタネット4を介し、辞書サーバ7に接続させて単語データを取得させ、取得させた単語データを用いて辞書データ26を学習させる。
【0046】
単語登録プログラム25による処理の詳細について、図3のフローチャートを参照して説明する。
【0047】
この辞書データ学習処理は、例えば、インタネットアクセス機能よって受信されたHTMLデータやメール機能によって受信された電子メールのデータ等が記憶部13に記憶されたときに、ホームページの閲覧等のバックグランド処理として実行される。
【0048】
ステップS1において、単語登録プログラム25は、通信部14によって受信されて、記憶部13に記憶された各種のデータ(HTMLデータ、電子メールのデータ等)から、文字を表示するためのテキスト部分(以下、テキストデータと記述する)を抽出する。ステップS2において、単語登録プログラム25は、抽出したテキストデータが日本語であるか否かを判定する。抽出したテキストデータが日本語ではないと判定された場合、この辞書データ学習処理は終了される。
【0049】
ステップS2において、抽出したテキストデータが日本語であると判定された場合、処理はステップS3に進む。ステップS3において、単語登録プログラム25は、抽出した日本語のテキストデータを解析して、当該テキストデータから全ての単語を抽出する。
【0050】
ステップS4において、単語登録プログラム25は、抽出した全ての単語に注目したか否かを判定し、注目していない単語がまだ残っていると判定した場合、処理はステップS5に進む。ステップS5において、単語登録プログラム25は、抽出した単語のうち、まだ注目していない単語を、順次、1語ずつ注目する。
【0051】
ステップS6において、単語登録プログラム25は、注目した単語の単語データが、記憶部13の辞書データ26に既に登録されているか否かを判定する。注目した単語の単語データが辞書データ26に既に登録されていないと判定された場合、処理はステップS7に進む。
【0052】
ステップS7において、単語登録プログラム25は、注目した単語の単語データを辞書サーバ7に要求する。この要求に対して辞書サーバ7に、要求された単語の単語データが保持されている場合、当該単語データが携帯通信端末装置1に供給されることになる。
【0053】
ステップS8において、単語登録プログラム25は、注目した単語の単語データを辞書サーバ7から取得できたか否かを判定する。単語データを取得できたと判定された場合、処理はステップS9に進む。ステップS9において、単語登録プログラム25は、取得した単語データを、記憶部13の辞書データ26に追加登録する。これにより、辞書データ26は、登録された1単語分だけ学習されたことになる。この後、処理はステップS4に戻り、抽出した全ての単語を注目したと判定されるまで、それ以降の処理が繰り返される。
【0054】
なお、ステップS6において、注目した単語の単語データが記憶部13の辞書データ26に既に登録されていると判定された場合にも、処理はステップS4に戻ることになる。
【0055】
また、ステップS8において、注目した単語の単語データが辞書サーバ7から取得できなかったと判定された場合にも、処理はステップS4に戻ることになる。
【0056】
そして、ステップS4において、抽出した全ての単語を注目したと判定された場合、この辞書データ学習処理は終了される。
【0057】
以上説明したように、辞書データ学習処理によれば、ユーザが意図的に単語登録の操作をすることなく、ユーザがホームページを閲覧しているバックグラン処理として、ユーザが閲覧したホームページに記載されている単語や、受信した電子メールに含まれる単語の単語データが追加登録されて、辞書データ26が学習される。
【0058】
したがって、辞書データ26には、ユーザの興味のある分野の単語の単語データが追加されることになるので、ユーザが携帯通信端末装置1のメール機能等を用いて文書を作成するときの仮名漢字変換の変化能率が効果的に向上することが期待できる。
【0059】
なお、本発明は、携帯電話機等の携帯通信端末装置1だけでなく、日本語入力プログラム23に相当する、入力された仮名を漢字に変換する機能と、辞書サーバ7に相当する所定のサーバにアクセスする機能を有するあらゆる電子機器に適用することが可能である。
【0060】
また、本発明は、読み仮名と漢字の対応関係を示す辞書データを学習させる場合だけでなく、例えば、和英辞書、英和辞書などを学習させる場合にも適用することができる。
【0061】
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0062】
本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0063】
本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0064】
【発明の効果】
以上のように、本発明によれば、ユーザの意図的な操作を必要とすることなく、辞書データを更新することが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した情報通信システムの構成例を示すブロック図である。
【図2】図1の携帯通信端末装置の構成例を示すブロック図である。
【図3】携帯通信端末装置の辞書データ学習処理を説明するフローチャートである。
【符号の説明】
1 携帯通信端末装置, 3 通信回線網, 4 インタネット, 5 コンテンツサーバ, 6 メールサーバ, 7 辞書サーバ,11 制御部, 13記憶部, 14 通信部, 25 単語登録プログラム, 26 辞書データ
Claims (11)
- 単語に関する単語データが登録されている辞書データを参照することによって、文字列を他の文字列に変換する情報処理装置において、
ネットワークを介してサーバに接続する接続手段と、
前記サーバから供給されるデータを受信する受信手段と、
前記受信手段によって受信された前記データからテキスト部分を検出する検出手段と、
前記検出手段によって検出された前記テキスト部分から単語を抽出する抽出手段と、
前記抽出手段によって抽出された前記単語に関する単語データが前記辞書データに未登録である場合、前記単語に関する前記単語データを、前記サーバから取得する取得手段と、
前記取得手段によって取得された前記単語データを前記辞書データに登録する登録手段と
を含むことを特徴とする情報処理装置。 - 前記接続手段は、インタネットを介して前記サーバに接続する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記受信手段は、前記サーバから供給されるホームページの画面を表示するためのデータを受信する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記抽出手段は、前記検出手段によって検出された日本語の前記テキスト部分から単語を抽出する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記単語データは、単語の読み仮名および漢字を含む
ことを特徴とする請求項4に記載の情報処理装置。 - 入力された読み仮名の文字列を、前記辞書データを参照することによって、対応する漢字に変換する変換手段を
さらに含むことを特徴とする請求項4に記載の情報処理装置。 - 前記受信手段によって受信された前記データに対応する画像の表示を制御する表示制御手段を
さらに含むことを特徴とする請求項1に記載の情報処理装置。 - 前記検出手段、前記抽出手段、前記取得手段、および前記登録手段は、前記表示手段による処理のバックグランド処理として動作する
ことを特徴とする請求項7に記載の情報処理装置。 - 単語に関する単語データが登録されている辞書データを参照することによって、文字列を他の文字列に変換する情報処理方法において、
ネットワークを介してサーバに接続する接続ステップと、
前記サーバから供給されるデータを受信する受信ステップと、
前記受信ステップの処理で受信された前記データからテキスト部分を検出する検出ステップと、
前記検出ステップの処理で検出された前記テキスト部分から単語を抽出する抽出ステップと、
前記抽出ステップの処理で抽出された前記単語に関する単語データが前記辞書データに未登録である場合、前記単語に関する前記単語データを、前記サーバから取得する取得ステップと、
前記取得ステップの処理で取得された前記単語データを前記辞書データに登録する登録ステップと
を含むことを特徴とする情報処理方法。 - 単語に関する単語データが登録されている辞書データを参照することによって、文字列を他の文字列に変換するためのプログラムであって、
ネットワークを介してサーバに接続する接続ステップと、
前記サーバから供給されるデータを受信する受信ステップと、
前記受信ステップの処理で受信された前記データからテキスト部分を検出する検出ステップと、
前記検出ステップの処理で検出された前記テキスト部分から単語を抽出する抽出ステップと、
前記抽出ステップの処理で抽出された前記単語に関する単語データが前記辞書データに未登録である場合、前記単語に関する前記単語データを、前記サーバから取得する取得ステップと、
前記取得ステップの処理で取得された前記単語データを前記辞書データに登録する登録ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。 - 単語に関する単語データが登録されている辞書データを参照することによって、文字列を他の文字列に変換する端末装置からネットワークを介してアクセスされる情報処理装置において、
前記端末装置からの要求に対応して、前記端末装置の前記辞書データに未登録の単語の単語データを、前記ネットワークを介して前記端末装置に供給する供給手段を
含むことを特徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003131120A JP2004334630A (ja) | 2003-05-09 | 2003-05-09 | 情報処理装置および方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003131120A JP2004334630A (ja) | 2003-05-09 | 2003-05-09 | 情報処理装置および方法、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004334630A true JP2004334630A (ja) | 2004-11-25 |
Family
ID=33506388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003131120A Pending JP2004334630A (ja) | 2003-05-09 | 2003-05-09 | 情報処理装置および方法、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004334630A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007213109A (ja) * | 2006-02-07 | 2007-08-23 | Nec Corp | 辞書作成システム、辞書サーバ、携帯端末、辞書作成方法、および、辞書作成プログラム |
JP2007310825A (ja) * | 2006-05-22 | 2007-11-29 | Microsoft Corp | 文字処理装置、その読みおよび表記の取得方法およびプログラムならびに文字処理装置を使用する情報処理システム |
US7899664B2 (en) | 2006-05-22 | 2011-03-01 | Sharp Kabushiki Kaisha | Information processing apparatus, computer, information processing system, information processing method, and program for receiving a character string and returning conversion candidates |
-
2003
- 2003-05-09 JP JP2003131120A patent/JP2004334630A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007213109A (ja) * | 2006-02-07 | 2007-08-23 | Nec Corp | 辞書作成システム、辞書サーバ、携帯端末、辞書作成方法、および、辞書作成プログラム |
JP2007310825A (ja) * | 2006-05-22 | 2007-11-29 | Microsoft Corp | 文字処理装置、その読みおよび表記の取得方法およびプログラムならびに文字処理装置を使用する情報処理システム |
US7899664B2 (en) | 2006-05-22 | 2011-03-01 | Sharp Kabushiki Kaisha | Information processing apparatus, computer, information processing system, information processing method, and program for receiving a character string and returning conversion candidates |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6974152B2 (ja) | 情報処理装置及び情報処理方法 | |
US20080109483A1 (en) | Mash-up service system | |
US20120163664A1 (en) | Method and system for inputting contact information | |
US20070162562A1 (en) | Method and system for supporting information access and record media therefor | |
US20040199871A1 (en) | Mobile communication terminal and method for displaying an HTML document thereon | |
MXPA04010107A (es) | Entrada multimodal secuencial. | |
US20090063129A1 (en) | Method and system for instantly translating text within image | |
JP2011070481A (ja) | ウェブ・ブラウザ送信サーバおよびその動作制御方法 | |
CN100430919C (zh) | 用于使用书签访问因特网的方法和装置以及书签产生方法 | |
CN106936727A (zh) | 一种网页显示方法及装置 | |
KR20010039743A (ko) | 흐름을 디스플레이들 내로 분할하기 위한 방법 및 장치 | |
JP2002215490A (ja) | アドレス変換システムおよびアドレス変換方法 | |
US20040085970A1 (en) | System and method for accessing wireless internet | |
WO2014046382A1 (ko) | 마크업 언어 기반의 문맥 인식 사용자 인터페이스 제공 시스템 및 방법 | |
JP2004334630A (ja) | 情報処理装置および方法、並びにプログラム | |
US20120256887A1 (en) | Information Procession Apparatus, Information Processing Method, Program, History Management Server, History Management Method, and Information Processing System | |
JP2000076285A (ja) | 情報処理装置および方法、並びに提供媒体 | |
CN102279860B (zh) | 手机网络资讯导航系统及其实现方法 | |
CN100490453C (zh) | 在无线应用协议-无线标识语言浏览器电话中显示动画的方法和系统 | |
JP2006155275A (ja) | 情報抽出方法及び情報抽出装置 | |
CN108292379A (zh) | 预约处理装置、预约处理方法以及预约处理程序 | |
KR100851303B1 (ko) | 이동 통신 단말기의 북마크 저장 및 표시 방법 | |
JP5391788B2 (ja) | 電子書籍表示装置、電子書籍表示方法および電子書籍表示プログラム | |
KR100671697B1 (ko) | 이동 통신 단말기에서 북마크 사용 방법 및 그 이동 통신단말기 | |
US20080270568A1 (en) | Method, portable apparatus and server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060413 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070904 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071226 |