JP2004070547A - 辞書作成方法および装置ならびに辞書作成システム - Google Patents

辞書作成方法および装置ならびに辞書作成システム Download PDF

Info

Publication number
JP2004070547A
JP2004070547A JP2002226983A JP2002226983A JP2004070547A JP 2004070547 A JP2004070547 A JP 2004070547A JP 2002226983 A JP2002226983 A JP 2002226983A JP 2002226983 A JP2002226983 A JP 2002226983A JP 2004070547 A JP2004070547 A JP 2004070547A
Authority
JP
Japan
Prior art keywords
dictionary
keyword
network
server
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002226983A
Other languages
English (en)
Inventor
Hiroshi Saito
斉藤 寛
Takamoto Tsuda
津田 崇基
Masayuki Ebisawa
海老澤 雅之
Naoto Watanabe
渡辺 直人
Toshio Sato
佐藤 寿雄
Bungetsu Watanabe
渡辺 文月
Hideaki Nishino
西野 秀明
Shigeko Kuramochi
倉持 重子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Ericsson Mobile Communications Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications Japan Inc filed Critical Sony Ericsson Mobile Communications Japan Inc
Priority to JP2002226983A priority Critical patent/JP2004070547A/ja
Publication of JP2004070547A publication Critical patent/JP2004070547A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】ネットワーク上で入力されたキーワードを利用することにより、標準辞書には存在しないような語句群を含む辞書を作成する。
【解決手段】ネットワーク11を介して一般ユーザが検索エンジンサーバ13を利用するときに入力されたキーワード群を辞書コンテンツサーバ17において収集し、各キーワードとその読みとの対を辞書データとして含む辞書を作成する。辞書コンテンツサーバ17は、この作成された辞書をネットワーク12経由で端末10にダウンロード可能に提供する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成方法および装置ならびに辞書作成システムに関する。
【0002】
【従来の技術】
昨今、携帯電話や携帯情報端末(PDA:Personal Digital Assistant)だけでなく、カムコーダ等の組み込み機器でもインターネットのようなネットワークへのアクセスが可能になり、電子メールを作成して送信する機能を具備するようになっている。それらの機器ではサイズや形状の制約からパーソナルコンピュータ(PC)のようなフルキーボードを搭載することは困難である。そのため、比較的多数の文字の入力を行う電子メールなどの用途では、仮名漢字変換を行なう場合にはより変換効率の高い辞書を具備する必要がある。
【0003】
【発明が解決しようとする課題】
一方、時事用語など移り変わりの激しい言葉はダイナミックに辞書データとして追加する必要がある。標準的な辞書データは予め組み込み機器の出荷前に固定されたデータとして用意されるものであり、時事用語等のようにダイナミックな要素をもつデータには対応できない。
【0004】
これに対して、近年、ネット接続可能な機器ではそれらのデータをネットワークからダウンロードして辞書データを更新する機能を具備する必要性が高まっている。
【0005】
しかし、ダウンロード辞書の作成についても、それを提供するコンテンツプロバイダ側の手作業で各種データを収集する必要があり、維持管理を含めてコストがかかる。
【0006】
本発明はこのような背景においてなされたものであり、その目的は、情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書として、ネットワーク上で入力されたキーワードを利用することにより、標準辞書には存在しないような語句群を含む辞書を作成することができる辞書作成方法および装置ならびに辞書作成システムを提供することにある。
【0007】
【課題を解決するための手段】
本発明による辞書作成方法は、情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成方法であって、ネットワーク上でユーザが入力したキーワードを収集するステップと、収集されたキーワードに読みを対応付けて辞書データを作成するステップとを備えたことを特徴とする。
【0008】
前記キーワードは、ネットワーク上で入力される任意の語句でありうるが、例えば、WEBサイト上で入力された文字列である。より具体的には、前記キーワードはネットワーク上の検索エンジンに対して入力された文字列である。
【0009】
前記辞書に登録する対象となるキーワードは、所定の規則に従って抽出することができる。例えば、所定の規則として、(1)入力頻度が所定のレベル以上のキーワードを抽出する、(2)カテゴリが同一であるキーワードを抽出する、(3)特定のユーザがネットワーク上で入力したキーワードを抽出する、(4)所定の規則として、予め定めた禁止語に該当するキーワードを除外する、等がありうる。
【0010】
このようにして作成された辞書は、ネットワーク上で一般に不特定多数のユーザが入力したキーワードに基づくものなので、比較的新しい、標準辞書には含まれてない用語等が多く含まれることが期待される。
【0011】
作成された辞書は、好ましくは、ユーザがダウンロード可能にネットワーク上のサーバに格納する。
【0012】
本発明による辞書作成装置は、情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成装置であって、ネットワーク上でユーザが入力したキーワードを収集する手段と、収集されたキーワードに読みを対応付けて辞書データを作成する手段とを備えたことを特徴とする。
【0013】
本発明による辞書作成システムは、情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成システムであって、ネットワークを介してユーザからキーワードの入力を受け付ける少なくとも1つの第1のサーバと、この第1のサーバから前記キーワードの収集を行い、収集されたキーワードに読みを対応付けて辞書データを作成する第2のサーバとを備え、第2のサーバは作成された辞書データをネットワークを介してユーザに提供することを特徴とする。
【0014】
前記第2のサーバは各キーワードの入力される頻度情報を更新、保持し、この頻度情報に基づいて、辞書データとすべきキーワードを抽出することを特徴とする。
【0015】
あるいは、前記第1のサーバ側で各キーワードの入力される頻度情報を更新、保持してもよく、この場合、好ましくは定期的にキーワードおよびその頻度情報を前記2のサーバに送信し、前記第2のサーバは前記頻度情報に基づいて、辞書データとすべきキーワードを抽出する。
【0016】
本発明による辞書作成システムは、ネットワークを介して前記第2のサーバに接続される端末装置をさらに備える。これにより、この端末装置は前記作成された辞書データをダウンロードして自装置内に記憶し、オフラインで前記辞書データを使用することができる。端末装置としては、典型的には携帯電話機等の携帯端末装置に利用して好適であるが、本発明により得られる辞書をパーソナルコンピュータ等において利用することも可能である。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
【0018】
図1は、本発明の辞書作成システムの概略の全体構成を示すブロック図である。
【0019】
このシステムは、インターネットのような第1のネットワーク11と、これに接続された検索エンジンサーバ13と、携帯電話などの携帯端末が接続される電話網、通信網のような第2のネットワーク12と、これに接続される辞書コンテンツサーバ17とからなる。検索エンジンサーバ13は、ネットワーク11を介してユーザに対して例えばWWW上の情報の検索機能を提供するものである。すなわち、検索エンジンは、インターネットで公開されているWEBページの情報をデータベース化し、ユーザの入力したキーワード(語句等)に基づいて関連するWEBページを検索し、その結果をユーザに提示する。ユーザの端末上に表示された結果から直接希望のWEBページに移動することができるように、いわゆるリンクが設定されている。一方、辞書コンテンツサーバ17はネットワーク12を介して携帯端末10に仮名漢字変換用の辞書をダウンロード可能に提供するものである。特に、本実施の形態では辞書コンテンツサーバ17が、検索エンジンサーバ13での検索結果に応じて新たな辞書を作成する機能を有する。検索エンジンサーバ13と辞書コンテンツサーバ17との間は通信ライン15により接続される。通信ライン15は専用線であっても、あるいは、ネットワーク11,12の一方を兼用するようにしてもよい。さらに、ネットワーク11とネットワーク12とをゲートウェイ(図示せず)により接続し、ネットワーク12に接続された携帯端末10からネットワーク11を経由して検索サーバ13を利用できるようにしてもよい。また逆に、ネットワーク11に接続されたPC等の端末からネットワーク12を経由して辞書コンテンツサーバ17にアクセスできるようにしてもよい。さらには、検索エンジンサーバ13と辞書コンテンツサーバ17は離れた位置にある場合を想定したが、同じ場所にあってもよい。あるいは、単一のコンピュータ装置が両サーバの機能を兼ね備えてもよい。
【0020】
なお、本明細書における「仮名漢字変換」には、単にひらがなを漢字に変換するだけでなく、ひらがなをカタカナに変換したり数字や記号に変換したりする場合も含む。その意味でこの変換処理を「入力文字変換」ともいう。
【0021】
図2は、本発明の辞書作成システムの別の態様を示している。この態様では、複数の検索エンジンサーバ13a,…13nを備え、これら複数の検索エンジンサーバが1つの辞書コンテンツサーバ17に接続されている。他の構成は図1に示した場合と同様である。検索エンジンサーバ13a,…13nと辞書コンテンツサーバ17との間の通信ライン15a,…15nについては、図1の通信ライン15と同様である。
【0022】
図3に携帯端末10の概略構成を示す。この携帯端末10は、CPU111、ROM112、RAM116、表示部121、入力部122、無線通信部123を有する。ROM112には、この端末を制御するための種々の制御プログラムやデータを不揮発的に格納しており、CPU111がこれらのプログラムを実行する。図では本実施の形態に関係するものとして、ブラウザ113、メーラー114および仮名漢字変換プログラム115を示してある。RAM116は、データの一時記憶領域やCPU111の作業領域を提供する他、本実施の形態では、ダウンロードされた仮名漢字変換用の辞書117を格納する領域を提供する。初期的に、標準的な辞書はROM112内にあってもよい。表示部121は端末がユーザに対して情報を提示するための部位であり、例えば液晶表示装置のようなディスプレイを有する。入力部112はユーザが端末に対して情報や指示を入力するための部位であり、テンキーや各種操作ボタン、ジョグダイヤル等を有する。無線通信部123は、図示しない基地局等を介してネットワーク12と無線通信を行う部位である。
【0023】
図4は、検索エンジンサーバ13の構成例を示すブロック図である。検索エンジンサーバ13は、大略、制御部130と、検索用データベース(DB)136と、検索サイトのWEBページを構成するデータを記憶するWEBデータ記憶部137を有する。制御部130は、逐次、DB136の作成および更新を行うデータベース処理部131と、DB136の検索処理を行う検索処理部132と、WEBデータ記憶部137のWEBデータを用いて検索サイトのWEBページのリクエスト受付および応答を行うWEB処理部133、ならびに、ネットワーク11との接続および辞書コンテンツサーバ17との接続を行う通信部135を有する。
【0024】
図5は、辞書コンテンツサーバ17の構成例を示すブロック図である。辞書コンテンツサーバ17は、大略、制御部170と、WEBデータ記憶部181、ダウンロード用辞書記憶部182、禁止語記憶部183、内蔵辞書記憶部185およびキーワード情報記憶部187を備える。制御部170は、WEB処理部171、辞書作成部173、データ収集編集部175、および通信部177を有する。WEBデータ記憶部181は、辞書コンテンツサーバ17自体のWEBページを構成するデータを格納しており、WEB処理部171がそのWEBページのリクエストの受付および応答を行う。ダウンロード用辞書記憶部182は、辞書作成部173により作成されたダウンロード用辞書を記憶しておく部位である。禁止語記憶部183は、ダウンロード辞書に登録することができない不適切な語句を記憶する部位であり、辞書作成部173が辞書作成時にこれを参照する。内蔵辞書記憶部185は、辞書コンテンツサーバ17に予め用意された広範な語句とその読み(およびカテゴリ)を登録した内蔵辞書を記憶する部位である。この内蔵辞書は本発明において必須のものではないが、後述するように、キーワードの読みやカテゴリや不明の場合に参照するためのものであり、逐次、更新されることが望ましい。キーワード情報記憶部187は、検索エンジンでの検索結果に基づいてデータ収集編集部175が収集したキーワードを記憶しておく部位である。通信部177は、第2のネットワーク12および検索エンジンサーバ13との通信を行うための部位である。
【0025】
以下、本実施の形態の具体的な動作例について説明する。
【0026】
図6は、本実施の形態における辞書コンテンツサーバ17でのデータ収集編集処理の概略の処理手順を示すフローチャートである。まず、データ収集編集部175が通信部177を介して検索エンジンサーバ13からキーワードを取得する(S11)。この実施の形態では、検索エンジンに対してユーザからのキーワードの入力がある度に、通信ライン15(図2のシステムでは15a,…15nのいずれか)を介してキーワード取得を行う。ここで、「キーワードの入力」とは、ユーザが検索サイトのWEBページ上で文字列をキー入力する場合に限らない。例えば、いわゆるカテゴリ型の検索エンジンでは、公開されているWEBページを予めカテゴリに分類してデータベース化しており、ユーザは階層的なツリー構造の中から最終的なキーワードを選択する場合がある。本実施の形態では、このようなキーワードの選択も「キーワードの入力」に含むものとする。収集されたキーワードはキーワード情報記憶部187に格納される。さらに、データ収集編集部175は後述するような所定のデータ編集処理を行う(S12)。この編集結果はキーワード情報記憶部187に記憶される(S13)。
【0027】
図7に、図6のステップS11で取得されるキーワード情報の形態の例(a)(b)(c)を示す。図7(a)のキーワード情報60aは、インデックス(Index)61、キーワード62、その読み63およびカテゴリ64からなる。インデックス61は、検索エンジンにおいて付与される所定のデータであり、例えば各検索エンジンの識別情報等のデータである。このインデックスは本発明において必須の要素ではない。読み63はユーザがキーワードとして漢字を入力したような場合は存在しない。キーワードとして仮名文字が入力された場合には、それが読みとなる。漢字が入力された場合であっても検索エンジンで、対応する読みが得られる場合には、その読みが利用される。カテゴリ64は上述したカテゴリ型の検索エンジンでは得られるが、必ずしもすべての検索エンジンで得られるとは限らない。図7(b)のキーワード情報b0bは図7(a)のキーワード情報60aにユーザ識別情報(ユーザID)65を追加したものである。これは、会員制の検索サイトなどでユーザを特定できるユーザ識別情報が得られる場合に、後述するユーザ対応辞書を作成するためのものである。図7(c)のキーワード情報60cは、図7(a)のキーワード情報60aに当該キーワードの入力頻度を表す頻度情報66を追加したものである。これは、検索エンジンサーバ側で各キーワードの頻度情報を管理している場合に採りうる形態である。
【0028】
図8にキーワード情報記憶部187に記憶されるキーワード情報80a、80bの構成例(a)(b)を示す。キーワード情報80aは、各キーワードについて、1レコードを有する。各レコードは、カテゴリ、キーワード、読み、頻度の各項目を有する。レコードは新たなキーワードが出現する度に作成され、既に作成されているキーワードについては頻度の値が更新(インクリメント)される。頻度はある時点からのキーワードの入力回数を継続的に累積したものである。頻度の更新は必ずしも必要ではないが、一定の期間毎に初期値にリセットしてもよい。
【0029】
キーワード情報80bは、キーワード情報80aに対してユーザIDの項目を追加したものである。これは、図7(b)に示したキーワード情報60bに対応する。同じキーワードであっても、ユーザが異なれば異なるレコードとして記憶される。
【0030】
図9は、図6のステップS12のデータ編集処理の詳細フローを示す。ステップS11で取得されたキーワード情報に対して、既存キーワードをリードし(S21)、一致するキーワードがあるか否かをチェックする(S22)。既にあれば、そのキーワードの「頻度」をインクリメントする(S34)。なければ、そのキーワードの「読み」があるかどうかをチェックする(S23)。あれば、ステップS28へ移行する。なければ、内蔵辞書185(図5)をリードし(S24)、該当するキーワードが内蔵辞書内に存在するか否かを調べる(S25)。存在すれば、その「読み」を当該キーワード情報に追加する(S26)。存在しなければ、データ編集担当者に「読み」を手入力させる(S27)。
【0031】
ついで、当該キーワード情報に「カテゴリ」があるかどうかをチェックする(S28)。あれば、ステップS33へ移行する。なければ、再度、内蔵辞書をリードし(S29)。当該キーワードがあれば(S30,Yes)、その「カテゴリ」をキーワード情報に追加する(S31)。なければ、データ編集担当者に「カテゴリ」を入力させる(S32)。
【0032】
そこで、当該キーワード情報をキーワード情報記憶部187に記憶する(S33)。ついで、当該キーワードの頻度をインクリメントする(S34)。
【0033】
ついで、種々の辞書の作成処理の詳細について説明する。辞書の作成は、ユーザからの要求のあったとき等の必要時、あるいは、定期的に行うことができる。
【0034】
図10は、カテゴリ毎の辞書であるカテゴリ辞書の作成の手順を示す。まず、キーワード情報記憶部187をリードする(S41)。ついで、全キーワードをカテゴリでソートする(S42)。これにより、カテゴリ別のキーワード群が得られる。そこで、一つのカテゴリを選択する(S43)。この選択はユーザが指定したものでも、あるいは、システムが指定したものであってもよい。ついで、選択されたカテゴリについて所定数以上のキーワードが存在するか否かを調べる(S44)。存在しなければ、ステップS47へ進む。存在すれば、当該カテゴリのキーワードと読みを抜粋する(S45)。そこで、このカテゴリについてのキーワード群により辞書を作成する(S46)。ステップS43〜S46の処理は、必要なカテゴリについて繰り返して実行される(S47)。
【0035】
図11は、入力頻度が所定レベル以上のキーワードについての頻度辞書の作成の手順を示す。まず、キーワード情報記憶部187をリードする(S51)。ついで、全キーワードを頻度でソートする(S52)。これにより、頻度レベル別のキーワード群が得られる。そこで、上位所定数のキーワードを抽出する(S53)。さらに、当該キーワードと読みを抜粋する(S54)。この抜粋されたキーワードと読みの対により辞書を作成する(S55)。
【0036】
図12は、特定のユーザ専用のユーザ対応辞書の作成の手順を示す。この処理はユーザの要求に基づいて実行される。この処理では、まず、図7(b)に示したキーワード情報60bから、当該ユーザのユーザIDを取得する(S61)。そこで、キーワード情報記録部をリードする(S62)。読み出されたキーワードのうち、当該ユーザIDに対応するキーワードがあるか否かをチェックする(S63)。存在しなければ、該当するキーワードなしの返信をユーザに返す(S67)。存在すれば、ユーザIDでキーワード情報記憶部187内のキーワード情報をソートする(S64)。そこで、当該ユーザIDのキーワードと読みを抜粋する(S65)。この抜粋されたキーワードと読みの対を基に、辞書を作成する(S66)。
【0037】
図13は、図10のステップS46,図11のステップS54,図12のステップS66の辞書作成処理の詳細フローを示す。まず、抜粋されたキーワードを取得する(S71)。ついで、禁止語記憶部183から禁止語データをリードする(S72)。そこで、禁止語に一致するキーワードが存在するかどうかを確認する(S73)。存在しなければ、ステップS75へ移行する。存在すれば、当該キーワード情報を、抜粋されたキーワード情報から(またはキーワード情報記憶部187から)削除する(S74)。このようにして禁止語に該当しないキーワードおよびその読みを辞書データとして記憶する(S75)。なお、この辞書作成処理では、禁止語以外にも、標準的な辞書に載っているキーワードを削除するようにしてもよい。
【0038】
以上のようにして作成された辞書は、辞書コンテンツサーバ17のWEBサイトにおいて、携帯端末10のユーザに対して、ネットワーク12経由でダウンロード可能に提示される。
【0039】
図14は、他の検索エンジンサーバ13aの構成例を示す。この構成では、図4に示した検索エンジンサーバ13の構成に加えて、キーワード情報記憶部138とデータ収集部133とを設けている。キーワード情報記憶部138およびデータ収集部133は、図5に示した辞書コンテンツサーバ17のキーワード情報記憶部187およびデータ収集編集部176の収集機能部分に相当するものである。この構成ではキーワードの収集を所定期間、検索エンジンサーバ13a側で行い、その結果を定期的に辞書コンテンツサーバ17へ送信するものである。他の構成は図4に示した検索エンジンサーバ13と同じである。
【0040】
以上、本発明の好適な実施の形態について説明したが、種々の変形、変更が可能である。例えば、データの収集期間(週、月等)を変えることによって、より時節の流れに合致した辞書データを構成することが可能である。また、検索が行なわれた時間帯(例えば夜間、昼間等)によってキーワードを選別することによって、当該時間帯に対応したユーザ層を分類することが可能である。辞書作成は辞書コンテンツサーバ17において行うようにしたが、他の場所または装置で辞書作成を行い、その結果を辞書コンテンツサーバ17にアップロードするようにしてもよい。キーワードの収集はWEBサイト上で行う場合のみを説明したが、複数(好ましくは多数)のユーザがキーワードを入力できる環境であれば任意のネットワーク環境で行うことが可能である。
【0041】
【発明の効果】
本発明によれば、通常、多数のユーザからネットワーク上に入力されるキーワードを収集、編集することにより、標準辞書には存在しないような語句群を自動的に収集することができ、比較的容易に辞書を作成することが可能となる。
【図面の簡単な説明】
【図1】本発明の辞書作成システムの概略の全体構成を示すブロック図である。
【図2】本発明の辞書作成システムの別の態様を示すブロック図である。
【図3】図1、図2内の携帯端末の概略構成を示すブロック図である。
【図4】図1,図2内の検索エンジンサーバの構成例を示すブロック図である。
【図5】図1,図2内の辞書コンテンツサーバの構成例を示すブロック図である。
【図6】本発明の実施の形態における辞書コンテンツサーバでのデータ収集編集処理の概略の処理手順を示すフローチャートである。
【図7】図6のステップS11で取得されるキーワード情報の形態の例(a)(b)(c)を示す図である。
【図8】図5内のキーワード情報記憶部に記憶されるキーワード情報の構成例(a)(b)を示す図である。
【図9】図6のステップS12のデータ編集処理の詳細フローを示すフローチャートである。
【図10】本発明の実施の形態におけるカテゴリ辞書の作成の手順を示すフローチャートである。
【図11】本発明の実施の形態における頻度辞書の作成の手順を示すフローチャートである。
【図12】本発明の実施の形態におけるユーザ対応辞書の作成の手順を示すフローチャートである。
【図13】図10のステップS46,図11のステップS54,図12のステップS66の辞書作成処理の詳細フローを示すフローチャートである。
【図14】本発明の実施の形態における他の検索エンジンサーバの構成例を示すブロック図である。
【符号の説明】
10…携帯端末、11…第1のネットワーク、12…第2のネットワーク、13…検索エンジンサーバ、17…辞書コンテンツサーバ、80a,80b…キーワード情報

Claims (17)

  1. 情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成方法であって、
    ネットワーク上でユーザが入力したキーワードを収集するステップと、
    収集されたキーワードに読みを対応付けて辞書データを作成するステップと
    を備えたことを特徴とする辞書作成方法。
  2. 前記キーワードはWEBサイト上で入力された文字列である請求項1記載の辞書作成方法。
  3. 前記キーワードはネットワーク上の検索エンジンに対して入力された文字列である請求項2記載の辞書作成方法。
  4. 前記辞書に登録する対象となるキーワードを所定の規則に従って抽出するステップを備える請求項1記載の辞書作成方法。
  5. 前記所定の規則として、入力頻度が所定のレベル以上のキーワードを抽出することを特徴とする請求項4記載の辞書作成方法。
  6. 前記所定の規則として、カテゴリが同一であるキーワードを抽出することを特徴とする請求項4記載の辞書作成方法。
  7. 前記所定の規則として、特定のユーザがネットワーク上で入力したキーワードを抽出することを特徴とする請求項4記載の辞書作成方法。
  8. 前記所定の規則として、予め定めた禁止語に該当するキーワードを除外することを特徴とする請求項4記載の辞書作成方法。
  9. 前記作成された辞書をユーザがダウンロード可能にネットワーク上のサーバに格納するステップをさらに含むことを特徴とする請求項1記載の辞書作成方法。
  10. 情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成装置であって、
    ネットワーク上でユーザが入力したキーワードを収集する手段と、
    収集されたキーワードに読みを対応付けて辞書データを作成する手段と
    を備えたことを特徴とする辞書作成装置。
  11. 前記キーワードはWEBサイト上で入力された文字列である請求項10記載の辞書作成装置。
  12. 前記キーワードはネットワーク上の検索エンジンに対して入力された文字列である請求項11記載の辞書作成装置。
  13. 前記辞書に登録する対象となるキーワードを所定の規則に従って抽出する手段を備える請求項10記載の辞書作成装置。
  14. 情報処理装置における入力文字変換に用いられる、読みに対応した語句を登録する辞書を作成する辞書作成システムであって、
    ネットワークを介してユーザからキーワードの入力を受け付ける少なくとも1つの第1のサーバと、
    この第1のサーバから前記キーワードの収集を行い、収集されたキーワードに読みを対応付けて辞書データを作成する第2のサーバとを備え、
    第2のサーバは作成された辞書データをネットワークを介してユーザに提供することを特徴とする辞書作成システム。
  15. 前記第2のサーバは各キーワードの入力される頻度情報を更新、保持し、この頻度情報に基づいて、辞書データとすべきキーワードを抽出することを特徴とする請求項14記載の辞書作成システム。
  16. 前記第1のサーバは各キーワードの入力される頻度情報を更新、保持し、定期的にキーワードおよびその頻度情報を前記2のサーバに送信し、前記第2のサーバは前記頻度情報に基づいて、辞書データとすべきキーワードを抽出することを特徴とする請求項14記載の辞書作成システム。
  17. ネットワークを介して前記第2のサーバに接続される端末装置を備え、この端末装置は前記作成された辞書データをダウンロードして自装置内に記憶し、オフラインで前記辞書データを使用することを特徴とする請求項14記載の辞書作成システム。
JP2002226983A 2002-08-05 2002-08-05 辞書作成方法および装置ならびに辞書作成システム Pending JP2004070547A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002226983A JP2004070547A (ja) 2002-08-05 2002-08-05 辞書作成方法および装置ならびに辞書作成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002226983A JP2004070547A (ja) 2002-08-05 2002-08-05 辞書作成方法および装置ならびに辞書作成システム

Publications (1)

Publication Number Publication Date
JP2004070547A true JP2004070547A (ja) 2004-03-04

Family

ID=32014142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002226983A Pending JP2004070547A (ja) 2002-08-05 2002-08-05 辞書作成方法および装置ならびに辞書作成システム

Country Status (1)

Country Link
JP (1) JP2004070547A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047859A (ja) * 2005-08-05 2007-02-22 Nissan Motor Co Ltd 文章解析方法、文章解析プログラム、文章解析装置、および文章解析システム
JP2008268995A (ja) * 2007-04-16 2008-11-06 Sony Corp 辞書データ生成装置、文字入力装置、辞書データ生成方法、文字入力方法
JP2013535729A (ja) * 2010-07-22 2013-09-12 グーグル・インコーポレーテッド 予測的なクエリ提案のキャッシュ
JP2014194827A (ja) * 2005-06-30 2014-10-09 Google Inc 非標準位置ベーステキスト入力

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US10534802B2 (en) 2004-06-25 2020-01-14 Google Llc Nonstandard locality-based text entry
JP2014194827A (ja) * 2005-06-30 2014-10-09 Google Inc 非標準位置ベーステキスト入力
JP2007047859A (ja) * 2005-08-05 2007-02-22 Nissan Motor Co Ltd 文章解析方法、文章解析プログラム、文章解析装置、および文章解析システム
JP2008268995A (ja) * 2007-04-16 2008-11-06 Sony Corp 辞書データ生成装置、文字入力装置、辞書データ生成方法、文字入力方法
JP2013535729A (ja) * 2010-07-22 2013-09-12 グーグル・インコーポレーテッド 予測的なクエリ提案のキャッシュ
US9323808B1 (en) 2010-07-22 2016-04-26 Google Inc. Predictive query suggestion caching

Similar Documents

Publication Publication Date Title
CN101971172B (zh) 移动站点地图
CN101636935B (zh) 搜索查询中的位置
EP2557511B1 (en) Information processing device, information processing method, information processing programme, and recording medium
JP2004126840A (ja) 文書検索方法、プログラムおよびシステム
EP2817738B1 (en) Predictive service access
JP4950508B2 (ja) 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム
CN102624756B (zh) 数据下载终端以及数据下载方法
CN104133877A (zh) 软件标签的生成方法和装置
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
US7089233B2 (en) Method and system for searching for web content
US20040006460A1 (en) System and method for problem solution support, and medium storing a program therefor
KR101508583B1 (ko) 스마트 기기 내 시맨틱 검색 시스템 및 검색방법
JP4661159B2 (ja) 情報提供システム,メタデータ収集解析サーバ,およびコンピュータプログラム
JP4362311B2 (ja) 電子メール装置および情報付加プログラム
JP2008282322A (ja) 情報処理装置及び情報処理方法
JP2009026249A (ja) 閲覧履歴編集端末及びプログラムおよびその方法
KR20110024170A (ko) 키워드 추천 장치와 방법 및 키워드 지식베이스 구축 방법
CN108681571A (zh) 基于Word2Vec的主题爬虫系统和方法
JP2007108971A (ja) 携帯端末における検索方法および検索装置
CN101266615A (zh) 用于浏览数据通信网络的方法
JP2004070547A (ja) 辞書作成方法および装置ならびに辞書作成システム
JP2010224667A (ja) 文字入力支援装置及び文字入力支援方法
CN105740290A (zh) 移动设备自适应网络搜索的系统和方法
JP2007323554A (ja) ネットワーク検索方法,クライアント,サーバ,システム
JP4350428B2 (ja) 問題解決支援用のサーバ装置及び問題解決支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050607

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070417