JPH1091627A - 漢字よみがな自動変換方法およびシステム - Google Patents

漢字よみがな自動変換方法およびシステム

Info

Publication number
JPH1091627A
JPH1091627A JP8247604A JP24760496A JPH1091627A JP H1091627 A JPH1091627 A JP H1091627A JP 8247604 A JP8247604 A JP 8247604A JP 24760496 A JP24760496 A JP 24760496A JP H1091627 A JPH1091627 A JP H1091627A
Authority
JP
Japan
Prior art keywords
character string
kanji
word
input
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8247604A
Other languages
English (en)
Inventor
Hayato Moriya
隼人 森谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Information Service Co Ltd
Original Assignee
NEC Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Information Service Co Ltd filed Critical NEC Information Service Co Ltd
Priority to JP8247604A priority Critical patent/JPH1091627A/ja
Publication of JPH1091627A publication Critical patent/JPH1091627A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 キーボード入力はもとより、特に外部情報デ
ータベースを用いて変換する場合にも、漢字よみがな変
換が簡易かつ効率的に行えるようにする。 【解決手段】 データ処理装置2の一次検索手段21
は、一次検索過程として、入力装置1からの入力文字列
に対応する単語や熟語について漢字よみがな辞書記憶部
31を検索する。一次検索手段21による検索が成功し
たとき、検索文字列判断手段23は当初の入力文字列か
ら一次検索に成功した文字列を削除し、残りの文字列を
算出する。一次検索手段21による当初の入力文字列に
対する検索を失敗したとき、当初の入力文字列から1文
字縮めた残りの文字列を算出し、それを二次検索手段2
2に与える。二次検索過程に移り、二次検索手段22
は、与えられた前記残り文字列に対応する単語や熟語に
ついて検索する。検索が繰り返されて検索文字列が皆無
になると、よみがな一時記憶部32に保存されているそ
れまでの検索成功したよみがなを出力装置4に表示し、
印刷する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、漢字よみがな自動
変換方法およびシステムに関する。
【0002】
【従来の技術】ワードプロセッサやパーソナルコンピュ
ータ等の日本語文書作成装置のように、漢字等による日
本語文字とそのよみがなの両方を必要とするシステムで
は、両方を登録する作業が付帯する。例えば、図書館に
おける資料データベースシステムの場合、文献等の書名
を表記するのに日本語文字の名称を用い、検索用にその
日本語書名の登録されたよみがなを用いている。従来よ
り、よみがなをデータとして先に与え、漢字等による日
本語文字の入力作業を簡易化し、能率アップさせるため
の多くの技術が提案されている。
【0003】例えば、特開平4−96858号公報に記
載された姓名漢字変換装置では、姓名等のよみがなを漢
字に迅速に変換するようになっている。また、特開平3
−58273号公報に記載された医療事務システムにお
ける氏名変換方式では、患者氏名の読みを入力して、当
該氏名に対応した漢字に変換する際のヒット率を向上さ
せるようにしている。
【0004】
【発明が解決しようとする課題】しかしながら、各公報
に記載された装置を含むその種従来例にあっては、次の
問題を共通として残している。すなわち、よみがなのデ
ータを先に与えてからそれに対応する漢字等の日本語文
字に変換しており、キーボードによる入力を前提として
いることである。そのため、キーボードによる入力方式
に代えて、CD−ROM等の外部データベースからレコ
ード情報として読み出すような場合、レコード情報は概
ね漢字等による日本語文字で格納されているから、それ
に対応するよみがなを検索し、かつ出力して取得するま
でをシステム化することは、非常に困難を伴う不具合が
ある。
【0005】したがって、本発明の目的は、キーボード
入力はもとより、特に外部情報データベースを用いて変
換する場合にも、漢字よみがな変換が簡易かつ効率的に
行える漢字よみがな自動変換方法およびシステムを提供
することにある。
【0006】
【課題を解決するための手段】本発明の漢字よみがな自
動変換システムは、文字列が入力される入力装置、漢字
よみがな辞書記憶部とよみがな一時記憶部からなる記憶
装置、プログラム制御によって動作し、前記入力装置か
らの入力文字列中の漢字による単語または複合語に該当
するよみがなの有無を前記漢字よみがな辞書記憶部を参
照して検索し、存在した該当よみがなを前記よみがな一
時記憶部に一時保存する処理を行うデータ処理装置、前
記よみがな一時記憶部に一時保存された前記入力文字列
に対応するすべてのよみがなを表示し、印刷可能なる出
力装置等からなっている。
【0007】したがって、当初の入力文字列の全体を漢
字よみがな辞書記憶部を参照して、その入力文字列の中
の漢字による単語または複合語に該当するよみがながあ
れば、対応する文字列を当初の入力文字列から削除して
分割する。分割後の残り文字列を検索して該当するよみ
がながあれば、その対応する文字列を残り文字列からさ
らに削除して分割し、これを繰り返して、該当よみがな
のすべてをよみがな一時記憶部に一時的に保存する。こ
のようにして、漢字よみがなを自動的に判断するため、
変換作業が簡易化され、何ら面倒な操作を要しない。
【0008】
【発明の実施の形態】以下、本発明による実施の形態の
漢字よみがな自動変換方法およびシステムについて、図
面を参照して詳細に説明する。
【0009】図1は、実施の形態のシステム構成を示す
ブロック図である。システムは、文字列のキーボードに
よる入力が可能であり、またCD−ROM等の外部情報
レコードの読み出しが可能な入力装置1を備えている。
また、プログラム制御により動作して入力装置1からの
入力データを処理するデータ処理装置2、処理された情
報を記憶する記憶装置3、そしてディスプレイ装置やプ
リンタ等からなる出力装置4を備えて構成されている。
【0010】データ処理装置2は、一次検索手段21お
よび二次検索手段22と、検索文字列判断手段23等か
らなっている。
【0011】一次検索手段21は、入力装置1から入力
された文字列をキーにして、次に説明する記憶装置3の
漢字よみがな辞書記憶部31に記憶されている単語や熟
語を検索する装置である。
【0012】二次検索手段22は、検索文字列判断手段
23から与えられた文字列をキーにして、漢字よみがな
辞書記憶部31に記憶されている単語や熟語を検索する
装置である。
【0013】検索文字列判断手段23は、入力装置1か
ら与えられた入力文字列のうち、一次および二次の各検
索手段21、22による検索が成功した文字列を順次削
除してゆき、当初の入力文字列から残った残り文字列を
算出する装置である。また、この検索文字列判断手段2
2においては、当初の入力文字列に対して一次検索手段
21による初期の検索が失敗したとき、すなわち該当文
字列を見い出せなかったときは、当初の入力文字列から
1文字だけ縮めた残り文字列を算出する。その縮めた残
り文字列を二次検索手段22に与えて検索を実行させる
ようになっている。
【0014】一方、記憶装置3に備わる漢字よみがな辞
書記憶部31においては、日本語漢字等による文字列を
単語または熟語の見出し語にして、その単語や熟語に対
応する日本語よみがなを予めデータとして記憶してい
る。また、よみがな一時保存記憶部32を有しており、
前述のデータ処理装置2において検索に成功したよみが
なを一時的に記憶し、結果を出力するまで保存してい
る。すなわち、入力文字列に対して一次検索手段21と
二次検索手段22による繰り返しの検索が成功し、検索
文字列判断手段23により算出される文字列がもはや存
在しなくなった場合、よみがな一時保存記憶部32に一
時保存されているよみがなの内容を出力し、ディスプレ
イ装置等からなる出力装置4にて表示するようになって
いる。
【0015】次に、以上の構成による実施の形態の動作
について、変換文字例を示す図2を参照して説明する。
【0016】記憶装置3の漢字よみがな辞書記憶部31
には、例えば「日本」とか「歴史」といった日本語の漢
字をキーにして、対応するよみがなの「にほん」と「れ
きし」が漢字よみがな辞書として登録されている。
【0017】いま、入力装置1によって例えば「日本の
歴史」という文字列が入力されたとする。この場合、ま
ず一次検索過程として、一次検索手段21はその入力文
字列「日本の歴史」を見出し語にし、記憶装置3の漢字
よみがな辞書記憶部31を参照して検索を開始する。し
かし、漢字よみがな辞書記憶部31には、もちろん「日
本の歴史」といった文字列は登録されていない。したが
って、一次検索過程から二次検索過程に移行する。
【0018】二次検索過程に移ると、検索文字列判断手
段23は「日本の歴史」という当初の入力文字列から1
文字を削除して縮める。すなわち、「日本の歴」という
文字列に縮める制御を行い、その縮められた残り文字列
を二次検索手段22に与える。二次検索手段22は、検
索文字列判断手段23から与えられた残り文字列「日本
の歴」をキーにして漢字よみがな辞書記憶部31を検索
する。この検索は、漢字よみがな辞書記憶部31におい
て成功するまで繰り返し行われる。二次検索手段22に
よって「日本」という単語漢字の検索に成功すると、そ
の「日本」に対応するよみがな、「にほん」がよみがな
一時記憶部32において一時格納される。
【0019】次に、同じく二次検索過程が続行され、検
索文字列判断手段23は、二次検索手段22によって検
索に成功した「日本」という単語漢字を削除し、「の歴
史」という残りの文字列を算出する。二次検索手段22
は、続けてその「の歴史」という残り文字列に対して漢
字よみがな辞書記憶部31を検索する。これを成功する
まで繰り返し行う。
【0020】検索文字判断手段23から与えられた「の
歴史」について、二次検索手段22が「の」の検索を失
敗した場合、この「の」という文字をよみがなと見な
し、「の」をよみがな一時記憶部32に一時格納する。
【0021】このようにして、検索すべき文字列が皆無
になったと判断した時点で、データ処理装置2から出力
装置4に対して「にほん の れきし」というよみがな
が出力される。
【0022】図2は、以上のような「日本の歴史」とい
う当初の入力文字列について、検索の成功と不成功をイ
メージ的に示している。すなわち、 ・「日本の歴史」という入力文字列全体に対する検索 →不成功 ・「日本の歴」という縮めた残り文字列に対する検索 →不成功 ・「日本」という漢字文字列に対する検索 →成功 ・「の歴史」という残り文字列に対する検索 →不成功 ・「の」というひらがな文字に対する検索 →不成功 ・「歴史」という漢字文字列に対する検索 →成功 を繰り返し、「にほん の れきし」というよみがなを
取得することができる。
【0023】
【発明の効果】以上説明したように、本発明による漢字
よみがな自動変換システムは、日本語の文字入力によっ
てよみがなを自動出力するから、キーボード入力はもと
より、日本語文字データベースであればCD−ROMと
いった外部情報レコードからでも、与えられた日本語入
力文字列に対して自動的によみがなを取得でき、漢字よ
みがな変換作業の簡易化と能率アップを実現できる。ま
た、漢字よみがな辞書を用いて単語または熟語を判定す
るシステムであるから、よみがな表示する場合、単語ご
とに、あるいは熟語ごとに区切って表示できるといった
利点もある。
【図面の簡単な説明】
【図1】本発明による実施の形態の漢字よみがな自動変
換システムの構成を示すブロック図である。
【図2】実施の形態による入力文字列に対する検索例を
示すイメージ図である。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】漢字よみがな辞書を参照して、入力文字列
    中の漢字による単語または複合語に該当するよみがなが
    存在するとき、その単語または複合語の文字列を当初の
    前記入力文字列から削除し、該当よみがなを一時保存す
    る一次検索過程と、 漢字よみがな辞書を参照して、前記入力文字列中の漢字
    による単語または複合語に該当するよみがなが存在しな
    いとき、前記入力文字列から1文字を削除して残り文字
    列を算出すると共に、その残り文字列を検索して該当す
    るよみがなが存在したとき、その単語または複合語の文
    字列を削除して再び残り文字列を算出して、該当よみが
    なを一時保存し、これを繰り返して残り文字列が皆無に
    なった時点でよみがな変換を終了し、一次保存された漢
    字よみがなのすべてを出力する二次検索過程と、を含む
    ことを特徴とする漢字よみがな自動変換方法。
  2. 【請求項2】前記入力文字列は、キーボードによって入
    力されるか、または外部情報データベースに記録された
    データを読み出して入力されることを特徴とする請求項
    1に記載の漢字よみがな自動変換方法。
  3. 【請求項3】文字列が入力される入力装置と、 漢字よみがな辞書記憶部とよみがな一時記憶部からなる
    記憶装置と、 プログラム制御によって動作し、前記入力装置からの入
    力文字列中の漢字による単語または複合語に該当するよ
    みがなの有無を前記漢字よみがな辞書記憶部を参照して
    検索し、存在した該当よみがなを前記よみがな一時記憶
    部に一時保存する処理を行うデータ処理装置と、 前記よみがな一時記憶部に一時保存された前記入力文字
    列に対応するすべてのよみがなを表示し、印刷可能なる
    出力装置と、を備えたことを特徴とする漢字よみがな自
    動変換システム。
  4. 【請求項4】前記データ処理装置は、 前記漢字よみがな辞書記憶部を参照して、前記入力文字
    列中の漢字による単語または複合語に該当するよみがな
    を検索する一次検索手段と、 前記漢字よみがな辞書記憶部を参照して、前記入力文字
    列中の漢字による単語または複合語に該当するよみがな
    が見い出せないとき、当初の前記入力文字列から1文字
    を削除した残り文字列を算出する検索文字列判断手段
    と、 この検索文字列判断手段から与えられた前記残り文字列
    中の漢字による単語または複合語に該当するよみがなを
    検索し、該当よみがなが所在した場合は対応する文字列
    分を削除して前記検索文字列判断手段によって算出され
    た残り文字列に対して再び検索することを繰り返し行う
    二次検索手段と、を含むことを特徴とする請求項3に記
    載の漢字よみがな自動変換システム。
  5. 【請求項5】前記二次検索手段は、前記漢字よみがな辞
    書記憶部を参照して、前記検索文字列判断手段から与え
    られた算出後の残り文字列中の漢字による単語または複
    合語に該当するふりがなが皆無となるまで検索を繰り返
    すことを特徴とする請求項4に記載の漢字よみがな自動
    変換システム。
JP8247604A 1996-09-19 1996-09-19 漢字よみがな自動変換方法およびシステム Pending JPH1091627A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8247604A JPH1091627A (ja) 1996-09-19 1996-09-19 漢字よみがな自動変換方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8247604A JPH1091627A (ja) 1996-09-19 1996-09-19 漢字よみがな自動変換方法およびシステム

Publications (1)

Publication Number Publication Date
JPH1091627A true JPH1091627A (ja) 1998-04-10

Family

ID=17165988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8247604A Pending JPH1091627A (ja) 1996-09-19 1996-09-19 漢字よみがな自動変換方法およびシステム

Country Status (1)

Country Link
JP (1) JPH1091627A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064383A (ja) * 2007-09-10 2009-03-26 Advanced Telecommunication Research Institute International 読み付与装置、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064383A (ja) * 2007-09-10 2009-03-26 Advanced Telecommunication Research Institute International 読み付与装置、およびプログラム

Similar Documents

Publication Publication Date Title
JP2595934B2 (ja) 仮名漢字変換処理装置
JPH1091627A (ja) 漢字よみがな自動変換方法およびシステム
JP2621999B2 (ja) 文書処理装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP4136055B2 (ja) 類似文字列検索システムおよび記録媒体
JPS59100941A (ja) 仮名漢字変換装置
JPS6172361A (ja) かな漢字変換装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2695772B2 (ja) 仮名漢字変換装置
JP2537991B2 (ja) 文字入力装置および方法
JPH08190565A (ja) データベース検索方式
JPH06290219A (ja) 文字検索機能付き文書処理装置
JPH04243477A (ja) 自然言語処理システムによる索引語抽出方法
JPH0131229B2 (ja)
JPS6198475A (ja) 日本語文章入力装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPS60207948A (ja) カナ漢字変換処理装置
JPH05151199A (ja) 文書作成装置
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPH06266765A (ja) 文章検索装置
JPH0727526B2 (ja) かな漢字変換装置
JPH05250351A (ja) 人名漢字検索装置
JPS61156465A (ja) 文書作成方式
JPH0341551A (ja) 文字入力装置