JP2002229999A - データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2002229999A
JP2002229999A JP2001245895A JP2001245895A JP2002229999A JP 2002229999 A JP2002229999 A JP 2002229999A JP 2001245895 A JP2001245895 A JP 2001245895A JP 2001245895 A JP2001245895 A JP 2001245895A JP 2002229999 A JP2002229999 A JP 2002229999A
Authority
JP
Japan
Prior art keywords
database
information
database construction
word information
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001245895A
Other languages
English (en)
Other versions
JP3669627B2 (ja
Inventor
Hidenao Umagoe
英尚 馬越
Nobuo Sasaki
伸夫 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc filed Critical Sony Computer Entertainment Inc
Priority to JP2001245895A priority Critical patent/JP3669627B2/ja
Priority to EP01308590A priority patent/EP1211615A3/en
Priority to KR1020010063047A priority patent/KR20020043158A/ko
Priority to US10/039,546 priority patent/US6961464B2/en
Priority to CN01142478A priority patent/CN1356652A/zh
Publication of JP2002229999A publication Critical patent/JP2002229999A/ja
Application granted granted Critical
Publication of JP3669627B2 publication Critical patent/JP3669627B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 漢字変換システムの辞書データベースに対す
る新たな単語の追加及び更新や変換優先順位の設定を、
ユーザによる複雑な操作を必要とせず、簡単且つ容易に
実現可能とする。 【解決手段】 例えばユーザがインターネット上で検
索,閲覧しているページやユーザがやりとりしている電
子メール情報等をソース情報として取り込み(ステップ
S1)、そのソース情報から文字情報を抽出(ステップ
S2)し、その文字情報から単語情報を抽出(ステップ
S5)し、その単語情報を用いて辞書データベースを構
築(ステップS6〜ステップS10,S15)する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば仮名漢字、
ローマ字漢字変換システムに使用される辞書等のデータ
ベースを構築する場合に好適なデータベース構築方法及
び装置、コンピュータに実行させるためのデータベース
構築処理プログラム及びコンピュータに実行させるため
のデータベース構築処理プログラムを記録したコンピュ
ータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】従来より、例えばパーソナルコンピュー
タや文書作成装置(いわゆるワードプロセッサ)を用い
た仮名漢字,ローマ字漢字変換システム(以下、適宜、
漢字変換システムと呼ぶ)では、例えばキーボード等か
らの入力信号を仮名或いはローマ字コードに変換し、そ
れらのコードに対応する仮名或いはローマ字の文字画像
を表示装置の画面上に表示したり、さらに一又は複数の
連続した仮名或いはローマ字コード列を漢字コードに変
換し、それら漢字コードに対応する漢字文字画像を表示
するようなことが行われている。なお、仮名漢字変換と
は仮名コードを漢字コードに変換することであり、ロー
マ字漢字変換とはローマ字コードを漢字コードに変換す
ることである。
【0003】また、上記漢字変換システムは、一般に、
仮名と単語との対応表を蓄積している辞書データベース
を備えており、自動的若しくはユーザの指示に応じて、
一又は複数の連続した仮名から単語への変換を行うよう
にもなされている。なお、上記単語とは、複数の漢字の
組み合わせや、漢字と仮名の組み合わせ、複数のカタカ
ナ等からなるものである。
【0004】
【発明が解決しようとする課題】ところで、上記漢字変
換システムに予め用意されているオリジナルの辞書デー
タベースは、例えば仮名漢字、ローマ字漢字変換ソフト
ウェアベンダ等が作成及び構築したものである。また、
当該辞書データベースは、例えばユーザの使用効率等を
考慮して、新たな単語の追加及び更新や、単語の使用頻
度に応じた変換優先順位の自動設定などが可能となされ
ていることが多い。
【0005】しかしながら、上記辞書データベースに意
図的に新たな単語を追加するためには、例えばユーザ自
らが辞書データベース内から所望の漢字や仮名を探し出
し、それらを組み合わせて単語を生成し、さらにその単
語を辞書データベースへ追加登録する指示、或いは辞書
データベースの更新指示を与えるような作業が必要にな
る。
【0006】また、上記変換優先順位を意図的に変更す
るためには、ユーザ自らが上記仮名から単語への変換の
ための入力操作を例えば複数回繰り返す等の作業を行わ
なければならない。
【0007】以上のように、従来の漢字変換システムに
おいて、新たな単語の追加及び更新や変換優先順位の意
図的な設定を行うためには、ユーザの手作業による幾つ
もの煩雑な操作が必要となり、非常に効率が悪い。
【0008】そこで、本発明は、このような課題に鑑み
てなされたものであり、例えば、漢字変換システムの辞
書データベースに対する新たな単語の追加及び更新や変
換優先順位の設定を、ユーザによる複雑な操作を必要と
せず、簡単且つ容易に実現可能とする、データベース構
築方法及びデータベース構築装置、コンピュータに実行
させるためのデータベース構築処理プログラム及びコン
ピュータに実行させるためのデータベース構築処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明では、ソース情報
から文字情報を抽出し、その文字情報から単語情報を抽
出し、単語情報によりデータベースを構築する。上記ソ
ース情報は、所定の通信ネットワーク上で検索されたペ
ージまたは閲覧されたページや、電子メール情報、画像
信号などである。
【0010】さらに、本発明では、ソース情報から抽出
した各文字情報に順次個別にフラグを設定し、既に設定
された上記フラグに応じて、ソース情報からの文字情報
の抽出の要否を判定する。また、抽出した単語情報を、
既存のデータベース内の単語情報と照合し、既存のデー
タベース内に存在しないときには、当該抽出した単語情
報を上記既存のデータベースに追加登録し、一方、既存
のデータベース内に存在するときには、上記抽出した単
語情報が上記既存のデータベース上で最高優先順位の単
語情報と同一でないときにのみその抽出した単語情報に
よって既存のデータベースを更新する。
【0011】すなわち、本発明によれば、ソース情報
は、例えば使用者が所定の通信ネットワーク上で検索さ
れたページまたは閲覧しているページや使用者がやりと
りしている電子メール情報等であり、そのソース情報か
ら文字情報及び単語情報を抽出し、その抽出した単語情
報によりデータベースを構築するようにしている。この
ため、当該構築されたデータベースは使用者の専門分野
或いは興味のある分野に適合したものとなる。また、デ
ータベースの構築は自動的或いは半自動的に行われるた
め、使用者は当該データベースの構築のために、手作業
による単語の追加や登録などの作業を行う必要はない。
【0012】
【発明の実施の形態】[本発明の実施の形態の概要]本
発明実施の形態の辞書データベース構築装置は、例えば
仮名漢字,ローマ字漢字変換システムなどで使用される
辞書データベースを構築するための装置であり、例えば
外部より取り込んだソース情報から文字情報を抽出し、
さらにその文字情報から単語を抽出し、それら抽出した
単語を用いて辞書データベースの更新、追加登録などを
行うことにより、使い易い辞書データベースを簡単且つ
容易に構築可能とするものである。
【0013】ここで、例えばユーザ自らがインターネッ
ト検索、閲覧や電子メールのやりとりを行って得られた
文字情報や、テレビジョン信号やビデオ信号などの画像
信号、或いは本や雑誌などをスキャニングして取り込ま
れた画像信号から文字認識等の手法により得られた文字
情報、CD−ROMやDVD−ROM等の各種の記録媒
体から得られた文字情報などには、ユーザにとって興味
のある分野、或いはユーザの専門分野に関する単語が多
数含まれていると考えられる。また、ユーザが仮名漢
字,ローマ字漢字変換システムを用いて例えば文書等を
作成する際には、それら興味のある分野、或いは専門分
野に関する単語を使用する可能性が高い(又は使用頻度
が高い)と考えられる。
【0014】このようなことから、本発明の実施の形態
の辞書データベース構築装置では、上記インターネット
検索,閲覧,電子メールによる文字情報や、テレビジョ
ン信号等やスキャニングによる画像信号から得られた文
字情報、上記CD−ROM等から得られた文字情報など
から単語を抽出し、例えば仮名漢字,ローマ字漢字変換
システムに予め用意されていたオリジナルの辞書データ
ベースに、上記抽出した単語を追加登録及び更新し、ま
た、当該抽出した単語についての変換優先順位を上げる
などの処理を行うようにしている。
【0015】すなわち、本発明実施の形態によれば、上
記抽出した単語を辞書データベースに追加登録及び更新
したり、上記抽出した単語について変換優先順位の設定
を行うことにより、従来のようなユーザの手作業による
複雑な操作を必要とせず、簡単且つ容易に、使い易い辞
書データベースを構築可能としている。また、本発明実
施の形態によれば、特に、最近のカタカナ表記による外
来語を含んだ辞書データベースの構築の際に大変有効で
あると考えられる。なお、本実施の形態の辞書データベ
ース構築装置は、既存の辞書データベースに単語を追加
登録及び更新する場合に限らず、新規に辞書データベー
スを構築する場合にも適用可能であることは言うまでも
ない。
【0016】[本実施の形態の概略ブロック構成]図1
には、本発明の一実施の形態として、辞書データベース
構築のための処理プログラム(以下、辞書データベース
構築プログラムと呼ぶ)を実行する装置の概略的なブロ
ック構成を示す。なお、この図1には、本実施の形態の
辞書データベース構築プログラムを例えばパーソナルコ
ンピュータにより実行することにした場合の主要部の構
成のみを示している。
【0017】図1において、記憶部15は、例えばハー
ドディスク及びそのドライブからなる。上記ハードディ
スク内には、オペレーティングシステムプログラムの
他、本実施の形態の辞書データベース構築処理を実現す
るための後述する辞書データベース構築プログラムや、
例えば仮名漢字,ローマ字漢字変換システムを実現する
ための仮名漢字,ローマ字漢字変換プログラム、いわゆ
るインターネットに接続及び閲覧するためのブラウザプ
ログラム、電子メールの作成や送受信を行うためのメー
ルプログラム、ビデオ信号やテレビジョン信号など各種
の画像信号を取り込むキャプチャプログラム、例えばフ
ラットヘッドスキャナ等により読み取られた画像データ
や上記キャプチャされた画像信号などから文字認識を行
って文字データへの変換等を行う文字認識プログラム
や、CD−ROMやDVD−ROM等の各種の記録媒体
からデータを取り込むプログラムなどを含む各種のプロ
グラム16と、その他の各種データ17が記憶されてい
る。また、上記各種データ17には、本実施の形態の辞
書データベース18も含まれている。なお、本実施の形
態の辞書データベース構築プログラムは、例えば上記仮
名漢字,ローマ字漢字変換プログラムなど、他のプログ
ラム内に含まれるものであっても良い。
【0018】上記辞書データベース18のオリジナル
(初期辞書データベース)は、例えば、仮名漢字,ロー
マ字漢字変換ソフトウェアを作成したベンダ等により提
供されたものであり、上述のように新たな単語の追加及
び更新や、単語の使用頻度に応じた変換優先順位の自動
設定などが可能となされている。なお、上記辞書データ
ベース18は、上記仮名漢字、ローマ字漢字変換ソフト
ウェアを作成したベンダにより提供されるもの以外に、
他の仮名漢字、ローマ字漢字変換ソフトウェアから取り
込んだものであっても良く、また、本実施の形態の辞書
データベース構築プログラムに付属して提供されたもの
でも、或いは、辞書データベースのみが単独で提供され
たものであっても良い。
【0019】通信部10は、例えば、アナログ公衆電話
回線に接続するためのモデム、ケーブルテレビジョン網
に接続するためのケーブルモデム、ISDN(総合ディ
ジタル通信網)に接続するためのターミナルアダプタ
(Terminal Adaptor:TA)などのよ
うに、外部とデータ通信を行うための通信デバイスであ
る。通信I/F部11は、上記通信部10と内部バス
(BUS)との間でデータのやりとりを可能とするため
のプロトコル変換等を行うインターフェイスデバイスで
ある。本実施の形態では、上記通信部10及び通信I/
F部11により、例えばいわゆるインターネットへの接
続,検索,閲覧、電子メールの送受信等が可能となされ
ている。
【0020】外部機器25は、例えばフラットヘッドス
キャナや、TVチューナ、ビデオテープレコーダ、ビデ
オディスクプレーヤ、ディジタルカメラ、ビデオカメ
ラ、衛星放送受信用のBSチューナ、通信衛星回線接続
用のCSチューナなどの機器である。外部機器I/F部
26は、上記外部機器25から供給された信号を内部に
取り込むためのインターフェイスデバイスである。
【0021】入力部20は、例えばキーボードやマウ
ス、タッチパッドなどの入力装置であり、ユーザI/F
部19は、上記入力部20からの信号を内部に供給する
ためのインターフェイスデバイスである。
【0022】ドライブ部22は、例えばCD−ROMや
DVD−ROM、フロッピィディスク等のディスク媒体
や、カード状等の半導体メモリなどから、少なくともデ
ータを読み出し可能なドライブ装置である。ドライブI
/F部21は、上記ドライブ部22からの信号を内部に
供給するためのインターフェイスデバイスである。
【0023】表示部24は、例えばCRT(陰極線管)
や液晶等の表示デバイスであり、表示ドライブ部23は
上記表示部24を表示駆動させるドライブデバイスであ
る。
【0024】CPU12は、上記記憶部15に記憶され
ているオペレーティングシステムプログラムや上記プロ
グラム16に基づいて、図1のパーソナルコンピュータ
の全動作を制御する。
【0025】ROM13は、例えばフラッシュメモリ等
の書き換え可能な不揮発性メモリからなり、図1のパー
ソナルコンピュータのBIOS(Basic Inpu
t/Output System)や各種の初期設定値
を記憶している。RAM14は、記憶部15のハードデ
ィスクから読み出されたアプリケーションプログラムな
どがロードされ、また、CPU12のワークRAMとし
て用いられる。
【0026】この図1に示す構成において、CPU12
は、上記記憶部15のハードディスクから読み出されて
RAM14にロードされたアプリケーションプログラム
の一つである、以下の本実施の形態の辞書データベース
構築プログラムを実行することにより、辞書データベー
スの構築、若しくは、辞書データベースへ新たな単語の
追加登録及び更新、変換優先順位の設定などの処理を行
う。
【0027】[本実施の形態の辞書データベース構築プ
ログラムの概略的な構成] [辞書データベース構築プログラムの基本構成]次に、
本実施の形態のCPU12が辞書データベース構築処理
を実行するためのアプリケーションプログラム(辞書デ
ータベース構築プログラム)の構成を説明する。
【0028】本実施の形態の辞書データベース構築プロ
グラムは、例えばDVD−ROMやCD−ROMのよう
な光ディスクや半導体メモリ等の記録媒体に記録された
り、通信回線を介してダウンロード可能なものであり、
例えば図2に示すようなデータ構成を有している。な
お、この図2に示すデータ構成は、本実施の形態の辞書
データベース構築プログラムの基本構成を概念的に表す
ものであり、実際のプログラム構成を表しているもので
はない。
【0029】この図2に示すように、本実施の形態の辞
書データベース構築プログラム30は、図1のCPU1
2が実行するプログラム部31として、文字情報処理プ
ログラム32と、フラグ管理プログラム33と、辞書管
理プログラム34と、ユーザ入力情報管理プログラム3
5とを少なくとも備えている。
【0030】上記文字情報処理プログラム32は、上記
インターネット検索、閲覧ページや電子メールから文字
情報を抽出したり、テレビジョン信号等やスキャニング
による画像信号に含まれる文字を文字認識等の手法によ
り抽出したり、上記CD−ROM等から得られたデータ
に含まれる文字情報を抽出し、さらに、それらの文字情
報から単語を抽出するためのプログラムである。
【0031】上記フラグ管理プログラム33は、上記抽
出された各文字情報に順次個別のフラグを付加すること
で、例えば重複した文字情報の抽出が行われないように
したり、或いは、逆に同一の文字情報の重複数を計測し
て出現頻度を求めるなどのフラグ管理を行うためのプロ
グラムである。なお、本実施の形態では、当該フラグを
用いることにより、重複した文字情報の抽出が行われな
いようにしている。
【0032】上記辞書管理プログラム34は、辞書デー
タベースへの追加登録、更新、単語の使用頻度に応じた
変換優先順位の設定などの辞書管理を行うためのプログ
ラムである。
【0033】上記ユーザ入力情報管理プログラム35
は、例えば辞書データベースへの追加登録や更新を行う
か否かの指示や、変換優先順位の自動設定或いは手動設
定の指示がユーザによりなされたとき、その入力情報を
管理したり、単語の読みがユーザにより入力されたとき
に、その読みの情報と単語とを対応付ける等のユーザ入
力情報を管理するためのプログラムである。
【0034】[仮名漢字,ローマ字漢字変換プログラム
への適用例]図2の例は、辞書データベース構築プログ
ラム単体の基本構成を示したが、本実施の形態の辞書デ
ータベース構築プログラムが例えば仮名漢字,ローマ字
漢字変換プログラムに含まれている場合は、例えば図3
に示すようなデータ構成となる。なお、この図3に示す
データ構成も図2の例と同様に、アプリケーションプロ
グラムを概念的に表すものであり、実際のプログラム構
成を表しているものではない。
【0035】この図3に示す仮名漢字,ローマ字漢字変
換アプリケーションプログラム40は、大別して、漢字
変換プログラム部41と、図2に示したプログラム部3
1と同様の本実施の形態の辞書データベース構築プログ
ラム部42と、仮名漢字,ローマ字漢字変換に使用され
るデータ部43とを有している。なお、辞書データベー
ス構築プログラム部42については図2のプログラム部
31と同様であるため、ここではその説明を省略する。
また、上記漢字変換プログラム部41は、いわゆるワー
プロソフトと呼ばれるような文書作成ソフトウェアと略
々同じものである。
【0036】上記データ部43は、仮名漢字,ローマ字
漢字変換に使用される仮名コード、ローマ字コード、漢
字コード、その他の記号コードからなるコードデータ4
4と、仮名と単語の対応表を表す辞書データベース用の
辞書データ45とからなる。ここで、例えば上記CD−
ROMやDVD−ROM等により提供される辞書データ
45、すなわち本実施の形態のパーソナルコンピュータ
に当該仮名漢字,ローマ字漢字変換アプリケーションプ
ログラム40がインストールされた直後の辞書データ4
5は、オリジナルの初期辞書データベースとして予め用
意されたものである。
【0037】[本実施の形態の辞書データベース構築プ
ログラム実行時の流れ]以下、上述の図2及び図3に示
した本実施の形態の辞書データベース構築プログラム3
0又は辞書データベース構築プログラム部42における
処理の流れを、図4に示すフローチャートを用いて説明
する。なお、以下に説明する流れは、本実施の形態の辞
書データベース構築プログラムを構成する各プログラム
部分が、図1に示したパーソナルコンピュータのCPU
12上で動作することにより実現されるものである。
【0038】この図4に示す本実施の形態の辞書データ
ベース構築プログラムにおいて、先ず、文書情報処理プ
ログラム32は、ステップS1の処理として、インター
ネット検索、閲覧ページや電子メール、テレビジョン信
号やスキャニングによる画像信号、ハードディスクドラ
イブやCD−ROM,DVD−ROMドライブ、半導体
メモリ装置などの各種の記憶装置(或いはそれらに内蔵
或いは装填された記憶媒体)に保存されているデータフ
ァイル等をソース情報として取り込み、次いで、ステッ
プS2として、それら取り込んだ情報から文字情報を抽
出する。なお、例えばインターネット検索、閲覧ページ
の場合は、HTML(Hyper Text Mark
up Language)ファイルのテキスト領域から
文字情報を抽出し、例えば画像信号の場合は、例えば文
字認識処理等によって文字情報を抽出する。また、上記
記憶装置或いは記憶媒体に保存されているデータファイ
ルは、ユーザが明示して指定しても、或いはしなくても
(すなわち任意に検索)良い。
【0039】次に、ステップS3として、フラグ管理プ
ログラム33は、上記抽出した各文字情報にフラグを付
加する。次に、フラグ管理プログラム33は、ステップ
S4として、上記各文字情報について上記フラグに
「1」が立てられているか否か判定し、フラグに「1」
が立てられている文字情報についてはステップS14と
して破棄する。なお、本実施の形態において、このよう
に重複した文字情報を破棄するようにしたのは、後のス
テップS5以降の処理を軽減するためである。
【0040】一方、フラグに「1」が立てられていない
(フラグが「0」)文字情報列について、文字情報処理
プログラム32は、ステップS5として、その文字情報
列を単語毎に分解し、各単語を抽出する。
【0041】次に、辞書管理プログラム34は、ステッ
プS6として、上記抽出した単語が、既存の辞書データ
ベース上に存在しているか否か照合する。このステップ
S6において、上記単語が既存の辞書データベース上に
存在していないと判定した場合、辞書管理プログラム3
4は、ステップS7として、当該単語を辞書データベー
スに追加登録する単語に設定する。一方、上記既存の辞
書データベース上に存在している単語の場合、辞書管理
プログラム34は、ステップS8として、既存の辞書デ
ータベース内で変換最高優先順位となっていない単語の
み残し、その単語で既存の辞書データベースを更新す
る。なお、このように変換最高優先順位でない単語のみ
を残すようにするのは、既にユーザの使用によって変換
最高優先順位となっている単語が、上記抽出された単語
により変更されてしまうことを防止するためである。
【0042】その後、ステップS9として、辞書管理プ
ログラム34は、ユーザ入力情報管理プログラム35が
管理しているユーザ入力情報を元に、ユーザが辞書デー
タベースの変更を包括的に許可しているか否かの判定を
行う。ここで、許可していると判定された場合はステッ
プS10の処理に進み、許可していないと判定された場
合はステップS11の処理に進む。
【0043】ステップS10の処理に進むと、辞書管理
プログラム34は、上記単語を用いて辞書データベース
を更新する。
【0044】これに対し、ステップS11の処理に進ん
だ場合、ユーザ入力情報管理プログラム35は、例えば
上記表示部24上に更新の許可を求める確認メッセージ
を表示させるような処理を行い、その後、ステップS1
2として、ユーザから更新許可がなされたか否か判定す
る。ステップS12において、更新許可がユーザにより
なされた場合はステップS13の処理に進み、許可がな
されない場合はステップS14にて当該単語を破棄す
る。
【0045】上記ステップS13に進むと、ユーザ入力
情報管理プログラム35は、例えば当該単語の「読み」
などの入力がユーザによりなされたか否かの判定を行
う。このステップS13において、ユーザ入力がなされ
ていない場合はステップS10に進み、ユーザ入力がな
された場合はステップS15に進む。
【0046】ステップS13からステップS10に進ん
だ場合、辞書管理プログラム34はその単語を用いて辞
書データベースを更新する。
【0047】また、ステップS15に進んだ場合、辞書
管理プログラム34は、上記ユーザ入力情報管理プログ
ラム35から渡された「読み」等の入力データと上記単
語とを関連付けて、辞書データベースの更新を行う。
【0048】[実施の形態のまとめ]以上のように、本
実施の形態によれば、ユーザにとって興味のある分野、
或いはユーザの専門分野に関する単語を含む辞書データ
ベースを、簡単且つ容易に生成することができる。また
例えば本実施の形態を仮名漢字、ローマ字漢字変換シス
テムに適用すれば、非常に使い易いシステムを実現でき
る。
【0049】なお、本発明は例えばパーソナルコンピュ
ータに適用した例を挙げているが、例えば文書作成機能
を備えた携帯電話機などの携帯型情報端末や、通信或い
は情報入力機能を備えた文書作成装置(いわゆるワード
プロセッサ)、通信或いは情報入力機能と文書作成機能
を備えた家庭用ゲーム機などにも適用可能である。ま
た、上述の説明では、主に仮名漢字、ローマ字漢字変換
システムに本発明を適用した例を挙げているが、本発明
は、漢字変換システムそのものではなく、辞書データベ
ースの構築のみ行うシステムであっても良いことは言う
までもない。
【0050】さらに上記実施の形態では、日本語の仮名
漢字、ローマ字から漢字へのローマ字漢字変換を例に挙
げているが、本発明は他の言語、例えば中国語における
ローマ字漢字変換システムや、ローマ字ハングル文字変
換システム、ローマ字アラビア文字変換システムなどに
も適用可能である。また、本発明は、英語、フランス
語、ドイツ語等の単語辞書データベースの構築やスペル
チェック用辞書データベースの構築の際にも適用可能で
ある。特に、本発明を上記スペルチェック用辞書データ
ベースに適用した場合は、当該スペルチェック用辞書デ
ータベースにおいて正しいスペル候補に変換する際の変
更優先順位の更新などに使用可能である。
【0051】
【発明の効果】本発明においては、所定の通信ネットワ
ーク上で検索されたページまたは閲覧されたページや、
電子メール情報、画像信号などのソース情報から文字情
報を抽出し、その文字情報から単語情報を抽出し、当該
単語情報によりデータベースを構築することにより、例
えば、漢字変換システムの辞書データベースに対する新
たな単語の追加及び更新や変換優先順位の設定を、ユー
ザによる複雑な操作を必要とせず、簡単且つ容易に実現
可能である。
【図面の簡単な説明】
【図1】本発明実施の形態の辞書データベース構築プロ
グラムを実行するパーソナルコンピュータの主要部の構
成を示すブロック回路図である。
【図2】本実施の形態の辞書データベース構築プログラ
ムの基本構成を概念的に表す図である。
【図3】本実施の形態の辞書データベース構築プログラ
ムを含む仮名漢字,ローマ字漢字変換アプリケーション
プログラムの構成を概念的に表す図である。
【図4】本実施の形態の辞書データベース構築プログラ
ムにおける処理の流れを示すフローチャートである。
【符号の説明】
10…通信部、11…通信I/F部、12…CPU、1
3…ROM、14…RAM、15…記憶部、16…プロ
グラム、17…データ蓄積部、18…辞書データベー
ス、19…ユーザI/F部、20…入力部、21…ドラ
イブI/F部、22…ドライブ部、23…表示ドライブ
部、24…表示部、25…外部機器、26…外部機器I
/F部、30,42…辞書データベース構築プログラム
部、32…文字情報処理プログラム、33…フラグ管理
プログラム、34…辞書管理プログラム、35…ユーザ
入力情報管理プログラム、44…コードデータ、45…
辞書データ
フロントページの続き (72)発明者 佐々木 伸夫 東京都港区赤坂7丁目1番1号 株式会社 ソニー・コンピュータエンタテインメント 内 Fターム(参考) 5B009 ME13 MF03 5B075 ND04 ND23 UU01 5B082 GA07 (54)【発明の名称】 データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログ ラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュ ータ読み取り可能な記録媒体

Claims (48)

    【特許請求の範囲】
  1. 【請求項1】 ソース情報から文字情報を抽出し、 上記文字情報から単語情報を抽出し、 上記単語情報によりデータベースを構築することを特徴
    とするデータベース構築方法。
  2. 【請求項2】 請求項1記載のデータベース構築方法で
    あって、 所定の通信ネットワーク上で検索されたページと閲覧さ
    れたページの少なくとも何れかを上記ソース情報として
    取り込むことを特徴とするデータベース構築方法。
  3. 【請求項3】 請求項1記載のデータベース構築方法で
    あって、 電子メール情報を上記ソース情報として取り込むことを
    特徴とするデータベース構築方法。
  4. 【請求項4】 請求項1記載のデータベース構築方法で
    あって、 画像信号を上記ソース情報として取り込み、 上記画像信号から文字認識により上記文字情報を抽出す
    ることを特徴とするデータベース構築方法。
  5. 【請求項5】 請求項1記載のデータベース構築方法で
    あって、 記憶装置或いは記憶媒体内に保存されているデータファ
    イルを上記ソース情報として取り込むことを特徴とする
    データベース構築方法。
  6. 【請求項6】 請求項1から請求項5のうち、いずれか
    一項記載のデータベース構築方法であって、 上記ソース情報から抽出した各文字情報に順次個別にフ
    ラグを設定することを特徴とするデータベース構築方
    法。
  7. 【請求項7】 請求項6記載のデータベース構築方法で
    あって、 既に設定された上記フラグに応じて、ソース情報からの
    文字情報の抽出の要否を判定することを特徴とするデー
    タベース構築方法。
  8. 【請求項8】 請求項1から請求項7のうち、何れか一
    項記載のデータベース構築方法であって、 上記抽出した単語情報を、既存のデータベース内の単語
    情報と照合し、 上記抽出した単語情報が上記既存のデータベース内に存
    在しないとき、当該抽出した単語情報を上記既存のデー
    タベースに追加登録することを特徴とするデータベース
    構築方法。
  9. 【請求項9】 請求項8記載のデータベース構築方法で
    あって、 上記抽出した単語情報が上記既存のデータベース内に存
    在するとき、さらに上記既存のデータベース上で最高優
    先順位が設定された単語情報と同一であるか判定し、 上記抽出した単語情報が上記最高優先順位の単語情報と
    同一でないとき、上記既存のデータベースを上記抽出し
    た単語情報により更新することを特徴とするデータベー
    ス構築方法。
  10. 【請求項10】 請求項8又は請求項9記載のデータベ
    ース構築方法であって、 既存のデータベースの変更の可否を判定し、 上記既存のデータベースの変更が許可されているときに
    のみ当該既存のデータベースの変更を行うことを特徴と
    するデータベース構築方法。
  11. 【請求項11】 請求項10記載のデータベース構築方
    法であって、 上記既存のデータベースの変更の際に、変更確認の設定
    の有無を判定し、 上記変更確認の設定がなされているときには所定の確認
    メッセージを発生することを特徴とするデータベース構
    築方法。
  12. 【請求項12】 請求項1から請求項11のうち、いず
    れか一項記載のデータベース構築方法であって、 上記抽出した単語情報の読みと当該単語情報とを対応付
    けて上記データベースを構築することを特徴とするデー
    タベース構築方法。
  13. 【請求項13】 ソース情報から文字情報を抽出する文
    字情報抽出部と、 上記文字情報から単語情報を抽出する単語情報抽出部
    と、 上記単語情報によりデータベースを構築する構築部とを
    有することを特徴とするデータベース構築装置。
  14. 【請求項14】 請求項13記載のデータベース構築装
    置であって、 所定の通信ネットワークと接続する接続部と、 上記所定の通信ネットワーク上で検索されたページと閲
    覧されたページの少なくとも何れかを上記ソース情報と
    して取り込むソース情報取り込み部とを有することを特
    徴とするデータベース構築装置。
  15. 【請求項15】 請求項13記載のデータベース構築装
    置であって、 電子メール情報を上記ソース情報として取り込むソース
    情報取り込み部を有することを特徴とするデータベース
    構築装置。
  16. 【請求項16】 請求項13記載のデータベース構築装
    置であって、 画像信号を上記ソース情報として取り込むソース情報取
    り込み部を有し、 上記文字情報抽出部は、上記画像信号から文字認識によ
    り上記文字情報を抽出することを特徴とするデータベー
    ス構築装置。
  17. 【請求項17】 請求項13記載のデータベース構築装
    置であって、 記憶装置或いは記憶媒体内に保存されているデータファ
    イルを上記ソース情報として取り込むソース情報取り込
    み部を有することを特徴とするデータベース構築装置。
  18. 【請求項18】 請求項13から請求項17のうち、い
    ずれか一項記載のデータベース構築装置であって、 上記ソース情報から抽出した各文字情報に順次個別にフ
    ラグを設定するフラグ設定部を有することを特徴とする
    データベース構築装置。
  19. 【請求項19】 請求項18記載のデータベース構築装
    置であって、 既に設定された上記フラグに応じて、ソース情報からの
    文字情報の抽出の要否を判定する判定部を有することを
    特徴とするデータベース構築装置。
  20. 【請求項20】 請求項13から請求項19のうち、何
    れか一項記載のデータベース構築装置であって、 上記構築部は、上記抽出した単語情報を、既存のデータ
    ベース内の単語情報と照合し、上記抽出した単語情報が
    上記既存のデータベース内に存在しないとき、当該抽出
    した単語情報を上記既存のデータベースに追加登録する
    ことを特徴とするデータベース構築装置。
  21. 【請求項21】 請求項20記載のデータベース構築装
    置であって、 上記構築部は、上記抽出した単語情報が上記既存のデー
    タベース内に存在するとき、さらに上記既存のデータベ
    ース上で最高優先順位が設定された単語情報と同一であ
    るか判定し、上記抽出した単語情報が上記最高優先順位
    の単語情報と同一でないとき、上記既存のデータベース
    を上記抽出した単語情報により更新することを特徴とす
    るデータベース構築装置。
  22. 【請求項22】 請求項20又は請求項21記載のデー
    タベース構築装置であって、 上記構築部は、既存のデータベースの変更の可否を判定
    し、上記既存のデータベースの変更が許可されていると
    きにのみ当該既存のデータベースの変更を行うことを特
    徴とするデータベース構築装置。
  23. 【請求項23】 請求項22記載のデータベース構築装
    置であって、 上記既存のデータベースの変更の際に、変更確認の設定
    の有無を判定し、上記変更確認の設定がなされていると
    きには所定の確認メッセージを発生する変更確認部を有
    することを特徴とするデータベース構築装置。
  24. 【請求項24】 請求項13から請求項23のうち、い
    ずれか一項記載のデータベース構築装置であって、 上記構築部は、上記抽出した単語情報の読みと当該単語
    情報とを対応付けて上記データベースを構築することを
    特徴とするデータベース構築装置。
  25. 【請求項25】 ソース情報から文字情報を抽出するス
    テップと、 上記文字情報から単語情報を抽出するステップと、 上記単語情報によりデータベースを構築するステップと
    を含むことを特徴するコンピュータに実行させるための
    データベース構築処理プログラムを記録したコンピュー
    タ読み取り可能な記録媒体。
  26. 【請求項26】 請求項25記載の記録媒体であって、 所定の通信ネットワーク上で検索されたページと閲覧さ
    れたページの少なくとも何れかを上記ソース情報として
    取り込むステップを含むことを特徴とするコンピュータ
    に実行させるためのデータベース構築処理プログラムを
    記録したコンピュータ読み取り可能な記録媒体。
  27. 【請求項27】 請求項25記載の記録媒体であって、 電子メール情報を上記ソース情報として取り込むステッ
    プを含むことを特徴とするコンピュータに実行させるた
    めのデータベース構築処理プログラムを記録したコンピ
    ュータ読み取り可能な記録媒体。
  28. 【請求項28】 請求項25記載の記録媒体であって、 画像信号を上記ソース情報として取り込むステップと、 上記画像信号から文字認識により上記文字情報を抽出す
    るステップとを含むことを特徴とするコンピュータに実
    行させるためのデータベース構築処理プログラムを記録
    したコンピュータ読み取り可能な記録媒体。
  29. 【請求項29】 請求項25記載の記録媒体であって、 記憶装置或いは記憶媒体内に保存されているデータファ
    イルを上記ソース情報として取り込むステップを含むこ
    とを特徴とするコンピュータに実行させるためのデータ
    ベース構築処理プログラムを記録したコンピュータ読み
    取り可能な記録媒体。
  30. 【請求項30】 請求項25から請求項29のうち、い
    ずれか一項記載の記録媒体であって、 上記ソース情報から抽出した各文字情報に順次個別にフ
    ラグを設定するステップを含むことを特徴とするコンピ
    ュータに実行させるためのデータベース構築処理プログ
    ラムを記録したコンピュータ読み取り可能な記録媒体。
  31. 【請求項31】 請求項30記載の記録媒体であって、 既に設定された上記フラグに応じて、ソース情報からの
    文字情報の抽出の要否を判定するステップを含むことを
    特徴とするコンピュータに実行させるためのデータベー
    ス構築処理プログラムを記録したコンピュータ読み取り
    可能な記録媒体。
  32. 【請求項32】 請求項25から請求項31のうち、何
    れか一項記載の記録媒体であって、 上記抽出した単語情報を、既存のデータベース内の単語
    情報と照合するステップと、 上記抽出した単語情報が上記既存のデータベース内に存
    在しないとき、当該抽出した単語情報を上記既存のデー
    タベースに追加登録するステップとを含むことを特徴と
    するコンピュータに実行させるためのデータベース構築
    処理プログラムを記録したコンピュータ読み取り可能な
    記録媒体。
  33. 【請求項33】 請求項32記載の記録媒体であって、 上記抽出した単語情報が上記既存のデータベース内に存
    在するとき、さらに上記既存のデータベース上で最高優
    先順位が設定された単語情報と同一であるか判定するス
    テップと、 上記抽出した単語情報が上記最高優先順位の単語情報と
    同一でないとき、上記既存のデータベースを上記抽出し
    た単語情報により更新するステップとを含むことを特徴
    とするコンピュータに実行させるためのデータベース構
    築処理プログラムを記録したコンピュータ読み取り可能
    な記録媒体。
  34. 【請求項34】 請求項32又は請求項33記載の記録
    媒体であって、 既存のデータベースの変更の可否を判定するステップ
    と、 上記既存のデータベースの変更が許可されているときに
    のみ当該既存のデータベースの変更を行うステップとを
    含むことを特徴とするコンピュータに実行させるための
    データベース構築処理プログラムを記録したコンピュー
    タ読み取り可能な記録媒体。
  35. 【請求項35】 請求項34記載の記録媒体であって、 上記既存のデータベースの変更の際に、変更確認の設定
    の有無を判定するステップと、 上記変更確認の設定がなされているときには所定の確認
    メッセージを発生するステップとを含むことを特徴とす
    るコンピュータに実行させるためのデータベース構築処
    理プログラムを記録したコンピュータ読み取り可能な記
    録媒体。
  36. 【請求項36】 請求項25から請求項35のうち、い
    ずれか一項記載の記録媒体であって、 上記抽出した単語情報の読みと当該単語情報とを対応付
    けて上記データベースを構築するステップを含むことを
    特徴とするコンピュータに実行させるためのデータベー
    ス構築処理プログラムを記録したコンピュータ読み取り
    可能な記録媒体。
  37. 【請求項37】 ソース情報から文字情報を抽出するス
    テップと、 上記文字情報から単語情報を抽出するステップと、 上記単語情報によりデータベースを構築するステップと
    を含むことを特徴とするコンピュータに実行させるため
    のデータベース構築処理プログラム。
  38. 【請求項38】 請求項37記載のデータベース構築処
    理プログラムであって、 所定の通信ネットワーク上で検索されたページと閲覧さ
    れたページの少なくとも何れかを上記ソース情報として
    取り込むステップを含むことを特徴とするコンピュータ
    に実行させるためのデータベース構築処理プログラム。
  39. 【請求項39】 請求項37記載のデータベース構築処
    理プログラムであって、 電子メール情報を上記ソース情報として取り込むステッ
    プを含むことを特徴とするコンピュータに実行させるた
    めのデータベース構築処理プログラム。
  40. 【請求項40】 請求項37記載のデータベース構築処
    理プログラムであって、 画像信号を上記ソース情報として取り込むステップと、 上記画像信号から文字認識により上記文字情報を抽出す
    るステップとを含むことを特徴とするコンピュータに実
    行させるためのデータベース構築処理プログラム。
  41. 【請求項41】 請求項37記載のデータベース構築処
    理プログラムであって、 記憶装置或いは記憶媒体内に保存されているデータファ
    イルを上記ソース情報として取り込むステップを含むこ
    とを特徴とするコンピュータに実行させるためのデータ
    ベース構築処理プログラム。
  42. 【請求項42】 請求項37から請求項41のうち、い
    ずれか一項記載のデータベースの構築処理プログラムで
    あって、 上記ソース情報から抽出した各文字情報に順次個別にフ
    ラグを設定するステップを含むことを特徴とするコンピ
    ュータに実行させるためのデータベース構築処理プログ
    ラム。
  43. 【請求項43】 請求項42記載のデータベース構築処
    理プログラムであって、 既に設定された上記フラグに応じて、ソース情報からの
    文字情報の抽出の要否を判定するステップを含むことを
    特徴とするコンピュータに実行させるためのデータベー
    ス構築処理プログラム。
  44. 【請求項44】 請求項37から請求項43のうち、何
    れか一項記載のデータベースであって、 上記抽出した単語情報を、既存のデータベース内の単語
    情報と照合するステップと、 上記抽出した単語情報が上記既存のデータベース内に存
    在しないとき、当該抽出した単語情報を上記既存のデー
    タベースに追加登録するステップとを含むことを特徴と
    するコンピュータに実行させるためのデータベース構築
    処理プログラム。
  45. 【請求項45】 請求項44記載のデータベース構築処
    理プログラムであって、 上記抽出した単語情報が上記既存のデータベース内に存
    在するとき、さらに上記既存のデータベース上で最高優
    先順位が設定された単語情報と同一であるか判定するス
    テップと、 上記抽出した単語情報が上記最高優先順位の単語情報と
    同一でないとき、上記既存のデータベースを上記抽出し
    た単語情報により更新するステップとを含むことを特徴
    とするコンピュータに実行させるためのデータベース構
    築処理プログラム。
  46. 【請求項46】 請求項44又は請求項45記載のデー
    タベース構築処理プログラムであって、 既存のデータベースの変更の可否を判定するステップ
    と、 上記既存のデータベースの変更が許可されているときに
    のみ当該既存のデータベースの変更を行うステップとを
    含むことを特徴とするコンピュータに実行させるための
    データベース構築処理プログラム。
  47. 【請求項47】 請求項46記載のデータベース構築処
    理プログラムであって、 上記既存のデータベースの変更の際に、変更確認の設定
    の有無を判定するステップと、 上記変更確認の設定がなされているときには所定の確認
    メッセージを発生するステップとを含むことを特徴とす
    るコンピュータに実行させるためのデータベース構築処
    理プログラム。
  48. 【請求項48】 請求項37から請求項47のうち、い
    ずれか一項記載のデータベース構築処理プログラムであ
    って、 上記抽出した単語情報の読みと当該単語情報とを対応付
    けて上記データベースを構築するステップを含むことを
    特徴とするコンピュータに実行させるためのデータベー
    ス構築処理プログラム。
JP2001245895A 2000-12-01 2001-08-14 データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3669627B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2001245895A JP3669627B2 (ja) 2000-12-01 2001-08-14 データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体
EP01308590A EP1211615A3 (en) 2000-12-01 2001-10-08 A method for composing a database
KR1020010063047A KR20020043158A (ko) 2000-12-01 2001-10-12 단어 전환 시스템에 사용되는 사전과 같은 데이터베이스구축 방법
US10/039,546 US6961464B2 (en) 2000-12-01 2001-10-22 Method for creating a database such as a dictionary used for a word conversion system
CN01142478A CN1356652A (zh) 2000-12-01 2001-11-30 用于诸如作为词转换系统的字典的数据库编制方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-366729 2000-12-01
JP2000366729 2000-12-01
JP2001245895A JP3669627B2 (ja) 2000-12-01 2001-08-14 データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002229999A true JP2002229999A (ja) 2002-08-16
JP3669627B2 JP3669627B2 (ja) 2005-07-13

Family

ID=26605057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001245895A Expired - Fee Related JP3669627B2 (ja) 2000-12-01 2001-08-14 データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (5)

Country Link
US (1) US6961464B2 (ja)
EP (1) EP1211615A3 (ja)
JP (1) JP3669627B2 (ja)
KR (1) KR20020043158A (ja)
CN (1) CN1356652A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355003A (ja) * 2003-05-27 2004-12-16 Microsoft Corp 名前付きエンティティ認識を機能強化するユーザモデル化のシステムおよび方法。

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100687734B1 (ko) * 2004-12-14 2007-02-27 한국전자통신연구원 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치및 그 방법
JP2007193438A (ja) * 2006-01-17 2007-08-02 Casio Comput Co Ltd 電子辞書装置及び検索制御プログラム
JP2009099056A (ja) * 2007-10-18 2009-05-07 Panasonic Corp 文字列受信装置、文字列転送装置、文字列送受信システム、コンテンツ受信端末向けシステムlsi、名簿共有システム、名簿共有方法およびコンテンツ推薦方法
KR101100848B1 (ko) * 2010-04-30 2012-01-02 정규홍 어휘 데이터베이스를 생성하는 방법 및 그 어휘 데이터베이스를 저장하는 컴퓨터 판독가능 매체
US9852124B2 (en) 2015-09-02 2017-12-26 International Business Machines Corporation Dynamic portmanteau word semantic identification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269224A (ja) * 1997-03-27 1998-10-09 Sumitomo Metal Ind Ltd 電子辞書作成支援システム及び電子辞書作成支援方法
JPH1196177A (ja) * 1997-09-22 1999-04-09 Nippon Telegr & Teleph Corp <Ntt> 用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03268062A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd 機械翻訳電子メール装置における私用単語の登録装置
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5799268A (en) * 1994-09-28 1998-08-25 Apple Computer, Inc. Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
JP2000148748A (ja) 1998-11-13 2000-05-30 Nec Corp 仮名漢字変換及び画像検索表示システム
JP2000227923A (ja) 1999-02-08 2000-08-15 Mitsubishi Electric Corp 情報検索システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269224A (ja) * 1997-03-27 1998-10-09 Sumitomo Metal Ind Ltd 電子辞書作成支援システム及び電子辞書作成支援方法
JPH1196177A (ja) * 1997-09-22 1999-04-09 Nippon Telegr & Teleph Corp <Ntt> 用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355003A (ja) * 2003-05-27 2004-12-16 Microsoft Corp 名前付きエンティティ認識を機能強化するユーザモデル化のシステムおよび方法。

Also Published As

Publication number Publication date
CN1356652A (zh) 2002-07-03
US6961464B2 (en) 2005-11-01
US20020118876A1 (en) 2002-08-29
EP1211615A2 (en) 2002-06-05
EP1211615A3 (en) 2004-03-31
JP3669627B2 (ja) 2005-07-13
KR20020043158A (ko) 2002-06-08

Similar Documents

Publication Publication Date Title
US10750044B2 (en) Information processing system, information processing apparatus, and method for processing information
US10356266B2 (en) Information processing system, information processing apparatus, and method for processing information
US7386576B2 (en) Data file storage device with automatic filename creation function, data file storage program and data file storage method
US7623514B2 (en) Data transmission device capable of transmitting data to a plurality of addresses by simple method
JPH10257401A (ja) インターネットテレビ装置およびurl情報取得方法
JP2008192055A (ja) コンテンツ検索方法、およびコンテンツ検索装置
JP2005174320A (ja) ディスプレイキャプチャシステム
JP3669627B2 (ja) データベース構築方法及び装置、コンピュータに実行させるためのデータベース構築処理プログラム及びコンピュータに実行させるためのデータベース構築処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JP2007334832A (ja) 情報処理装置、会議システム、情報処理方法、及び情報処理プログラム
US6947926B2 (en) Data processing method and apparatus and storage medium
JPWO2012053509A1 (ja) 入力支援プログラム、入力支援装置、及び入力支援方法
US20070245226A1 (en) Data processing apparatus and method
JP2008225676A (ja) 辞書検索装置及びその制御プログラム
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JP2001249943A (ja) 文書検索システム、文書検索方法およびその方法を実施するためのプログラムを記憶した記憶媒体
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP6874988B2 (ja) リンク情報提供方法
JP2003131991A (ja) アドレスデータ蓄積・更新システム、アドレスデータ蓄積・更新方法、アドレスデータ蓄積・更新に供するウェブサーバ及びアドレス情報利用システム、並びにアドレス情報利用に供するウェブサーバ
JP2009110204A (ja) 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム
JP2005044071A (ja) 電子辞書
JPS62109127A (ja) 表示画面の出力制御方式
JPH08263512A (ja) 文書検索装置
JPH11328200A (ja) 画像検索装置および方法ならびに情報記録媒体
JP2005293189A (ja) 情報表示制御装置、電子辞書プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050408

R150 Certificate of patent or registration of utility model

Ref document number: 3669627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees