JP4294386B2 - 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体 - Google Patents

異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP4294386B2
JP4294386B2 JP2003169484A JP2003169484A JP4294386B2 JP 4294386 B2 JP4294386 B2 JP 4294386B2 JP 2003169484 A JP2003169484 A JP 2003169484A JP 2003169484 A JP2003169484 A JP 2003169484A JP 4294386 B2 JP4294386 B2 JP 4294386B2
Authority
JP
Japan
Prior art keywords
normalization
language
different notation
different
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003169484A
Other languages
English (en)
Other versions
JP2005004626A (ja
Inventor
裕子 井田
裕一 小島
雅之 亀田
泰嗣 小川
優希子 平岡
研策 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003169484A priority Critical patent/JP4294386B2/ja
Publication of JP2005004626A publication Critical patent/JP2005004626A/ja
Application granted granted Critical
Publication of JP4294386B2 publication Critical patent/JP4294386B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、異表記正規化処理装置、異表記正規化処理プログラム、これを記憶する記憶媒体に関する。
【0002】
【従来の技術】
中国において一般に用いられる漢字は簡体字と呼ばれ、台湾において一般に用いられる漢字は繁体字と呼ばれており、同じ意味を表すのに異なる漢字が用いられる場合がある。例えば、繁体字では「印刷機械」と表すものが、簡体字では「印刷机械」として表される。
【0003】
そこで、簡体字で記載された文書と繁体字で記載された文書を変換する装置が研究、開発されている(例えば、特許文献1参照)。
【0004】
【特許文献1】
特開平8−263478号公報
【0005】
【発明が解決しようとする課題】
ところで、漢字を使用する言語としては、上述した中国語における簡体字や繁体字の他に、日本語、韓国語、ベトナム語等も挙げられる。これらの言語においては、漢字の発音は異なるが同じ意味で使用されることもあり、簡単な文章であれば理解することができる。また、言語が同一であっても、各言語においては旧字新字や異体字などがあり、同じ意味を表すのに異なる漢字が用いられる場合がある。
【0006】
このように同じ意味を表すのに異なる漢字が用いられている文書について文書検索処理を行った場合には、漢字表記が異なるために検索漏れが発生するという問題がある。
【0007】
そのため、近年においては、簡体字と繁体字との間のみならず、各種の言語間における多様な表記のゆれを吸収することが望まれている。
【0008】
本発明の目的は、漢字表記が異なる各種の言語間における多様な表記のゆれを吸収することができる異表記正規化処理装置、異表記正規化処理プログラム、これを記憶する記憶媒体を提供することである。
【0010】
【課題を解決するための手段】
この発明は、上記の目的を達成するため、入力テキスト及び前記入力テキストの言語を表す言語情報を受け付ける文書入力手段と、この文書入力手段により受け付けた前記入力テキストから漢字表記を抽出する漢字相当切出手段と、漢字表記が異なる正規化対象の言語と正規化言語との文字対応を記述した異表記正規化規則を格納する正規化規則格納手段と、前記文書入力手段により受け付けた前記言語情報の言語を正規化対象の言語として含む異表記正規化規則を前記正規化規則格納手段から選択する異表記正規化規則選択手段と、この異表記正規化規則選択手段により選択された前記異表記正規化規則に応じて前記漢字相当切出手段により抽出した正規化対象言語の漢字表記を正規化言語の漢字表記に正規化する正規化処理手段とを備えたものである。
【0013】
また、入力テキスト及び前記入力テキストの言語を表す言語情報を受け付ける文書入力機能と、この文書入力機能により受け付けた前記入力テキストから漢字表記を抽出する漢字相当切出機能と、漢字表記が異なる正規化対象の言語と正規化言語との文字対応を記述した異表記正規化規則を格納する正規化規則格納機能と、前記文書入力機能により受け付けた前記言語情報の言語を正規化対象の言語として含む異表記正規化規則を前記正規化規則格納機能から選択する異表記正規化規則選択機能と、この異表記正規化規則選択機能により選択された前記異表記正規化規則に応じて前記漢字相当切出機能により抽出した正規化対象言語の漢字表記を正規化言語の漢字表記に正規化する正規化処理機能と、をコンピュータにて実現させることを特徴とする異表記正規化処理プログラムも提供する。
また、この異機種正規化処理プログラムを格納した記憶媒体も提供する。
【0042】
【発明の実施の形態】
本発明の第一の実施の形態を図1ないし図6に基づいて説明する。
【0043】
図1は、本発明が適用される異表記正規化処理装置1のハードウェア構成を概略的に示すブロック図である。図1に示すように、異表記正規化処理装置1は、例えばパーソナルコンピュータやワークステーションであり、コンピュータの主要部であって各部を集中的に制御するCPU(Central Processing Unit)2を備えている。このCPU2には、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)3と、各種データを書換え可能に記憶するRAM(Random Access Memory)4とがバス5で接続されている。
【0044】
さらにバス5には、各種のプログラム等を格納するHDD(Hard Disk Drive)6と、配布されたプログラムであるコンピュータソフトウェアを読み取るための機構としてCD(Compact Disc)−ROM7を読み取るCD−ROMドライブ8と、異表記正規化処理装置1とネットワーク9との通信を司る通信制御装置10と、キーボードやマウスなどの入力装置11と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)などの表示装置12とが、図示しないI/Oを介して接続されている。
【0045】
RAM4は、各種データを書換え可能に記憶する性質を有していることから、CPU2の作業エリアとして機能し、例えば後述する文書バッファ等の役割を果たす。
【0046】
図1に示すCD−ROM7は、この発明の記憶媒体を実施するものであり、OS(Operating System)や各種のプログラムが記憶されている。CPU2は、CD−ROM7に記憶されているプログラムをCD−ROMドライブ8で読み取り、HDD6にインストールする。
【0047】
なお、記憶媒体としては、CD−ROM7のみならず、DVDなどの各種の光ディスク、各種光磁気ディスク、フレキシブル・ディスクなどの各種磁気ディスク等、半導体メモリ等の各種方式のメディアを用いることができる。また、通信制御装置10を介してインターネットなどのネットワーク9からプログラムをダウンロードし、HDD6にインストールするようにしてもよい。この場合に、送信側のサーバでプログラムを記憶している記憶装置も、この発明の記憶媒体である。なお、プログラムは、所定のOS(Operating System)上で動作するものであってもよいし、その場合に後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
【0048】
このシステム全体の動作を制御するCPU2は、このシステムの主記憶として使用されるHDD6上にロードされたプログラムに基づいて各種処理を実行する。
【0049】
次に、異表記正規化処理装置1のCPU2がプログラムに基づいて実行する各種処理の内容について説明する。図2は、異表記正規化処理装置1を示す機能ブロック図である。図2に示すように、当該異表記正規化処理装置1においては、入力装置11から入力された文書データや検索語等のテキスト(入力テキスト)を受け付ける文書入力手段101、入力テキストに対して正規化処理を施す異表記正規化手段102、異表記正規化手段102から出力された正規化表記に関する情報等の処理結果を表示装置12に対して出力する出力手段103の各機能が、CPU2がコンピュータソフトウェアに従って動作することにより実現される。なお、文書検索の用途などに用いる場合は、異表記正規化手段102における処理結果を、出力手段103を介することなく、そのまま直接インデキシング処理や検索処理に出力することも可能である。また、文書データや検索語等のテキストの入力は、入力装置11からの入力に限るものではなく、OCR(Optical Character Reader)等による入力であっても良い。
【0050】
ここで、異表記正規化手段102について詳細に説明する。図2に示すように、異表記正規化手段102は、漢字相当切出手段102aと、正規化処理手段102bと、少なくとも2種以上の異表記正規化規則102cを格納する正規化規則格納手段102eと、異表記正規化規則選択手段102dとを有している。
【0051】
漢字相当切出手段102aは、文書入力手段101を介して入力されたテキスト(入力テキスト)から漢字表記の文字を一文字ずつ抽出して、正規化処理手段102bに出力する。
【0052】
正規化規則格納手段102eに格納される異表記正規化規則102cは、概略的には、所定の言語間の文字対応を記述したものである。図3は異表記正規化規則102cの一例を示す説明図である。図3に示す異表記正規化規則102cは、中国語繁体字と中国語簡体字との間の変換についての異表記正規化規則である。図3に示すように、異表記正規化規則102cには、中国語繁体字の表記及び文字コード(ユニコード)と、中国語簡体字の表記及び文字コード(ユニコード)とが対応付けられている。なお、異表記正規化規則102cは、図4に示すように、複数言語間の異表記正規化規則が記述されていても良く、文字コードもユニコード以外の文字コード、例えばJIS0208やUTF-8など複数種類の文字コードが記述されていても良い。これにより、所定の言語の漢字表記と他の言語の漢字表記との間における表記のゆれを吸収することが可能になる。また、異表記正規化規則102cとしては、図5に示すように、言語異体字と繁体字との間の変換についての異表記正規化規則であっても良い。これにより、所定の言語の漢字表記とその異体字との間における表記のゆれを吸収することが可能になる。このような異表記正規化規則102cは、異表記正規化規則選択手段102dにより選択される。
【0053】
異表記正規化規則選択手段102dは、入力装置11から入力されて文書入力手段101で受け付けた文書(入力テキスト)の言語情報を解析し、解析された言語情報に基づいて異表記正規化規則102cを正規化規則格納手段102eから抽出する。文書の言語情報は、入力装置11から文書とは別に文書の言語情報を明示的に入力された情報もしくは、予め入力文書中に記載される言語情報が使用される。例えば、XML文書では、lang属性を用いて言語情報が記述されている。このような言語情報の判別方法としては、既存の言語識別方法(例えば、特開平10-320399号公報に示されている方法等)を用いることができる。したがって、どの言語で入力するかを意識せずとも、漢字の入力テキストに対して適切な異表記正規化処理を施すことが可能になる。なお、複数の異表記正規化規則102cが抽出された場合には、表示装置12に抽出された異表記正規化規則102cのリストを一覧表示し、このリストの中から適当な異表記正規化規則102cを入力装置11で選択するようにしても良い。これにより、漢字の入力テキストに対して最も適切な異表記正規化処理を施すことが可能になる。
【0054】
正規化処理手段102bは、漢字相当切出手段102aから出力された一文字の漢字に対し、異表記正規化規則選択手段102dにより選択された異表記正規化規則102cに基づいて、正規化表記を生成する。
【0055】
次に、異表記正規化処理装置1における異表記正規化処理の全体的な流れについて図6を参照して説明する。図6は、異表記正規化規則102cとして中国語繁体字−中国語簡体字変換(図3参照)を異表記正規化規則選択手段102dにより選択し、入力テキストとして中国語繁体字で「印刷機械」と入力した場合を例として示している。
【0056】
図6に示すように、まず、文書入力手段101を介して入力されたテキストを文書入力手段101で受付け(ステップS1のY)、漢字相当切出手段102aにおいて入力されたテキスト中に含まれている漢字一文字を検出して切り出す(ステップS2)。ここでは、まず最初に、漢字「印」が切り出される。
【0057】
切り出された漢字「印」は正規化処理手段102bに入力され、異表記正規化規則102cに基づいて正規化処理を実施する(ステップS3)。正規化処理は、切り出された漢字について異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に適合するか否かを確認し、異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に適合する場合には異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に従って正規化を実施するものである。ここで、切り出された漢字「印」は、図3に示す異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に該当する規則が存在しないため、そのままステップS4に進む。
【0058】
入力されたテキスト中に含まれている全ての漢字の切り出しが終わっていないので(ステップS4のN)、ステップS2に戻り、次の文字「刷」を漢字相当切出手段102aにより切り出す。
【0059】
次に切り出された漢字「刷」も、図3に示す異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に該当する規則が存在しないため、正規化を実施せずに(ステップS3)、そのままステップS4に進む。そして、入力されたテキスト中に含まれている全ての漢字の切り出しが終わっていないので(ステップS4のN)、ステップS2に戻り、次の文字「機」を漢字相当切出手段102aにより切り出す。
【0060】
次に切り出された漢字「機」は、図3に示す異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に該当する規則が存在するため、正規化処理手段102bにより中国語繁体字「機」を中国語簡体字「机」に正規化し(ステップS3)。ステップS4に進む。そして、入力されたテキスト中に含まれている全ての漢字の切り出しが終わっていないので(ステップS4のN)、ステップS2に戻り、次の文字「械」を漢字相当切出手段102aにより切り出す。
【0061】
次に切り出された漢字「械」は、図3に示す異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に該当する規則が存在しないため、正規化を実施せずに(ステップS3)、そのままステップS4に進む。そして、入力されたテキスト中に含まれている全ての漢字の切り出しが終わったので(ステップS4のY)、ステップS5に進む。
【0062】
したがって、元のテキストの文字列にある中国語繁体字である漢字文字列「印刷機械」が異表記正規化規則102c(中国語繁体字−中国語簡体字変換)に従って中国語簡体字「印刷机械」に変換される。このようにして正規化が実施された文字列「印刷机械」は、正規化処理手段102bの処理結果として表示装置12に出力される(ステップS5)。
【0063】
このように本実施の形態によれば、入力テキストから漢字表記が抽出され、漢字表記が異なる言語間の文字対応を記述した少なくとも2種以上の異表記正規化規則102cから入力テキストに適した異表記正規化規則102cが選択され、この選択された異表記正規化規則102cに基づいて抽出された漢字表記が正規化される。これにより、漢字表記が異なる各種の言語間における多様な表記のゆれを吸収することが可能になる。
【0064】
なお、本実施の形態においては、正規化対象の文字列を中国語繁体字と中国語簡体字との変換を例として説明したが、これに限るものではなく、日本語漢字と中国語繁体字の場合、あるいは、ベトナム漢字と中国語簡体字の場合等、漢字使用国間における同様の異表記正規化処理を行う場合に適応することができる。
【0065】
また、異表記正規化規則選択手段102dにより異表記正規化規則102cとして中国語繁体字−中国語簡体字変換(図3参照)と言語異体字−中国繁体字変換(図5参照)との両方を選択し、例えば入力された漢字が言語異体字「国」である場合、言語異体字−中国繁体字変換(図5参照)に従って中国繁体字「國」に正規化し、さらに、中国語繁体字−中国語簡体字変換(図3参照)に従って中国繁体字「國」を中国語簡体字「国」に正規化するようにしても良い。
【0066】
次に、本発明の第二の実施の形態を図7及び図8に基づいて説明する。なお、本発明の第一の実施の形態において説明した部分と同一部分については同一符号を用い、説明も省略する。本実施の形態は、第一の実施の形態の異表記正規化処理装置1を備えた文書検索装置に関するものである。
【0067】
図7は本実施の形態の文書検索装置50の概略構成を示す機能ブロック図、図8は文書検索装置50における処理の流れを示し、(a)は文書に含まれる文字列からインデックス情報を抽出して登録するインデックス情報登録処理の流れを示すフローチャート、(b)は検索語により文書を検索する文書検索処理の流れの概略を示すフローチャートである。
【0068】
本実施の形態の文書検索装置50は、第一の実施の形態で説明した異表記正規化処理装置1と同様のパーソナルコンピュータやワークステーションであって、そのハードウェア構成は異表記正規化処理装置1と同一である。すなわち、文書検索装置50のHDD6上には、文書検索用のプログラムがロードされている点で、異表記正規化処理装置1とは異なっている。
【0069】
以下においては、CPU2が文書検索用のプログラムに基づいて実行する処理について、図7に示す機能ブロック図及び図8の処理の流れに沿って説明する。
【0070】
まず、インデックス情報登録処理の流れについて説明する。キーボードやマウスなどの入力装置11,OCR等からなる入力装置51から入力された文書を文書入力手段52を介して文書格納手段53が読み取り、読み取った文書を文書データベース54に逐次登録していく(ステップS11)。
【0071】
次いで、インデックス登録手段55は、登録されている文書のうち、まだインデックス情報を抽出していない文書があれば、文書データベース54より読み出し(ステップS12)、該文書を異表記正規化処理装置1に引き継いで、該文書から文字列を抽出して抽出文字列毎の異表記正規化処理を行う(ステップS13)。なお、異表記正規化処理については、第一の実施の形態で説明したので、ここでの説明は省略する。
【0072】
ステップS13において異表記正規化された正規化表記情報は、インデックス登録手段55に返送されてくるので、文書との対応をつけた形式(インデックス情報)でインデックス情報格納部56に格納保存される(ステップS14)。
【0073】
次に、文書検索処理の流れについて説明する。入力装置51から入力された検索語は、文書入力手段52を介して検索条件作成手段57に読み取られ、検索条件作成手段57は、該検索語を異表記正規化処理装置1に送出して該検索語から文字列を抽出して、異表記正規化処理を行う(ステップS21)。なお、異表記正規化処理については、第一の実施の形態で説明したので、ここでの説明は省略する。
【0074】
続いて、検索条件作成手段57は、異表記正規化処理された正規化表記情報に基づいて検索条件を作成し、検索処理手段58において、インデックス情報格納部56に格納保存されているインデックス情報との照合を行い、文書検索処理を行う(ステップS22)。
【0075】
文書検索された結果は、必要であれば、検索された文書が文書データベース54から読み出されて、表示装置12あるいはかかる処理結果を出力保存するHDD6等からなる出力装置59において表示される(ステップS23:結果出力手段)。
【0076】
このように本実施の形態によれば、異表記正規化処理が施されたインデックス情報及び検索条件が生成されるので、漢字使用圏の言語(中国語(簡体字や繁体字)、日本語、韓国語、ベトナム語等)で記述された文書についての文書検索処理における検索漏れの発生を防止することが可能になるので、最も適切な文書を検索することが可能になる。
【0077】
【発明の効果】
本願発明によれば、入力テキストから漢字表記を抽出し、漢字表記が異なる言語間の文字対応を記述した異表記正規化規則から入力テキストに適した異表記正規化規則を選択し、この選択された異表記正規化規則に基づいて抽出された漢字表記を正規化することにより、漢字表記が異なる各種の言語間における多様な表記のゆれを吸収することができる。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態の異表記正規化処理装置のハードウェア構成を概略的に示すブロック図である。
【図2】異表記正規化処理装置を示す機能ブロック図である。
【図3】異表記正規化規則の一例を示す説明図である。
【図4】異表記正規化規則の一例を示す説明図である。
【図5】異表記正規化規則の一例を示す説明図である。
【図6】異表記正規化処理装置における異表記正規化処理の全体的な流れを示すフローチャートである。
【図7】本発明の第二の実施の形態の文書検索装置の概略構成を示す機能ブロック図である。
【図8】文書検索装置における処理の流れを示し、(a)は文書に含まれる文字列からインデックス情報を抽出して登録するインデックス情報登録処理の流れを示すフローチャート、(b)は検索語により文書を検索する文書検索処理の流れの概略を示すフローチャートである。
【符号の説明】
1 異表記正規化処理装置
7 記憶媒体
50 文書検索装置
52 文書入力手段
53 文書格納手段
54 文書データベース
55 インデックス登録手段
56 インデックス情報格納部
57 検索条件作成手段
58 検索処理手段
101 文書入力手段
102a 漢字相当切出手段
102b 正規化処理手段
102c 異表記正規化規則
102d 異表記正規化規則選択手段
102e 正規化規則格納手段

Claims (3)

  1. 入力テキスト及び前記入力テキストの言語を表す言語情報を受け付ける文書入力手段と、
    この文書入力手段により受け付けた前記入力テキストから漢字表記を抽出する漢字相当切出手段と、
    漢字表記が異なる正規化対象の言語と正規化言語との文字対応を記述した異表記正規化規則を格納する正規化規則格納手段と、
    前記文書入力手段により受け付けた前記言語情報の言語を正規化対象の言語として含む異表記正規化規則を前記正規化規則格納手段から選択する異表記正規化規則選択手段と、
    この異表記正規化規則選択手段により選択された前記異表記正規化規則に応じて前記漢字相当切出手段により抽出した正規化対象言語の漢字表記を正規化言語の漢字表記に正規化する正規化処理手段と、を備える異表記正規化処理装置。
  2. 入力テキスト及び前記入力テキストの言語を表す言語情報を受け付ける文書入力機能と、
    この文書入力機能により受け付けた前記入力テキストから漢字表記を抽出する漢字相当切出機能と、
    漢字表記が異なる正規化対象の言語と正規化言語との文字対応を記述した異表記正規化規則を格納する正規化規則格納機能と、
    前記文書入力機能により受け付けた前記言語情報の言語を正規化対象の言語として含む異表記正規化規則を前記正規化規則格納機能から選択する異表記正規化規則選択機能と、
    この異表記正規化規則選択機能により選択された前記異表記正規化規則に応じて前記漢字相当切出機能により抽出した正規化対象言語の漢字表記を正規化言語の漢字表記に正規化する正規化処理機能と、
    をコンピュータにて実現させることを特徴とする異表記正規化処理プログラム。
  3. 請求項2に記載の異表記正規化処理プログラムを記憶するコンピュータにて読取可能な記憶媒体。
JP2003169484A 2003-06-13 2003-06-13 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体 Expired - Fee Related JP4294386B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003169484A JP4294386B2 (ja) 2003-06-13 2003-06-13 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003169484A JP4294386B2 (ja) 2003-06-13 2003-06-13 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2005004626A JP2005004626A (ja) 2005-01-06
JP4294386B2 true JP4294386B2 (ja) 2009-07-08

Family

ID=34094609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003169484A Expired - Fee Related JP4294386B2 (ja) 2003-06-13 2003-06-13 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP4294386B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131690B (zh) * 2006-08-21 2012-07-25 富士施乐株式会社 简体汉字和繁体汉字相互转换方法及其系统
US8577891B2 (en) 2010-10-27 2013-11-05 Apple Inc. Methods for indexing and searching based on language locale

Also Published As

Publication number Publication date
JP2005004626A (ja) 2005-01-06

Similar Documents

Publication Publication Date Title
US5303150A (en) Wild-card word replacement system using a word dictionary
US7478092B2 (en) Key term extraction
US20090106018A1 (en) Word translation device, translation method, and computer readable medium
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP5315368B2 (ja) 文書処理装置
JPH07282063A (ja) 機械翻訳装置
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
US20050004902A1 (en) Information retrieving system, information retrieving method, and information retrieving program
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
CN113419721B (zh) 基于web的表达式编辑方法、装置、设备和存储介质
JP3784060B2 (ja) データベース検索システム、その検索方法及びプログラム
JP4294386B2 (ja) 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体
JP4734400B2 (ja) 文書検索装置およびプログラム
JP6056489B2 (ja) 翻訳支援プログラム、方法、および装置
JP3937741B2 (ja) 文書の標準化
JP5285491B2 (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
US7962849B2 (en) Processing of user character inputs having whitespace
JPH1153396A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPH11272671A (ja) 機械翻訳装置及び機械翻訳方法
JP4283038B2 (ja) 文書登録装置、文書検索装置、プログラム及び記憶媒体
JP7116940B2 (ja) オープンデータを効率的に構造化し補正する方法及びプログラム
JP2001034630A (ja) 文書ベース検索システム、およびその方法
JP4139805B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPH08115330A (ja) 類似文書検索方法および装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041012

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050705

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050707

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20060922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090131

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees