JP2892613B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JP2892613B2
JP2892613B2 JP8082212A JP8221296A JP2892613B2 JP 2892613 B2 JP2892613 B2 JP 2892613B2 JP 8082212 A JP8082212 A JP 8082212A JP 8221296 A JP8221296 A JP 8221296A JP 2892613 B2 JP2892613 B2 JP 2892613B2
Authority
JP
Japan
Prior art keywords
word
reading
onomatopoeia
words
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP8082212A
Other languages
English (en)
Other versions
JPH08249322A (ja
Inventor
明 濱田
保司 小渕
秀夫 三▲吉▼
稔幸 奥西
広勝 秋山
ひろみ 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP8082212A priority Critical patent/JP2892613B2/ja
Publication of JPH08249322A publication Critical patent/JPH08249322A/ja
Application granted granted Critical
Publication of JP2892613B2 publication Critical patent/JP2892613B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、日本語ワードプ
ロセッサ、仮名漢字変換辞書を備えたオフィスコンピュ
ータ等の文字処理装置に関する。
【0002】
【従来の技術】従来、この種の文字処理装置に用いられ
る仮名漢字変換辞書は基本的には、単語の読みと、単語
の表記とからなる一対の情報のあつまりから構成されて
おり、単語の読みから単語の表記を検索できるような構
造となっている。そしてこのような構造において、例え
ば単語の読みについては同音語の読みを省略することに
より、辞書容量の圧縮が行われていた。
【0003】
【発明が解決しようとする課題】また、辞書には各種品
詞からなる自立語が格納されており、一般的には擬音語
や擬態語については主要なもののみ格納されている。こ
れらの擬音語、擬態語については“A”と“B”を1モ
ーラの読みとして“ABっ”、“ABん”、“AB
り”、“AっBり”、“AんBり”、“ABAB”等の
パターンがあると言われている。モーラ(mora)とは音
の区切りとしての時間区分単位−詳細は東京大学出版社
発行の「音声科学」に記載−であり、仮名は原則として
1字1モーラを表す(ただし“キャ”や“シュ”等の拗
音の場合を除く。)しかし、話し言葉としては、上記し
たパターンから以下のような様々な派生語が生じる。
【0004】例えば基本形“ABん”からの第1の派生
語“AっBん”としては具体的には「どかん」から「ど
っかん」があり、同じく第2の派生語“AっBーん”と
しては具体的には「どっかーん」があり、同じく第3の
派生語“AーっBーん”としては具体的には「どーっか
ーん」がある。また別の基本形“ABAB”の第1の派
生語“AっBAB”としては具体的にはには「ぐしゃぐ
しゃ」から「ぐっしゃぐしゃ」があり、同じく第2の派
生語“AーBAB”としては具体的には「ぐーしゃぐし
ゃ」がある。
【0005】このような話し言葉にも対応した十分な数
の擬音語、擬態語を自立語辞書として用意することが変
換の効率を高める上で望ましいが、これら擬音語、擬態
語の派生語まですべて変換辞書に記憶させるとすればそ
の記憶容量を大幅に増加させることが必要であり、従来
の圧縮方法を用いても辞書容量の増加は免れない。した
がって擬音語または擬態語の派生語を含む単語の読みは
変換することができないため、そのような派生語はその
都度手作業でひらがな入力またはカタカナ入力してい
た。
【0006】この発明は以上の事情を考慮してなされた
もので、様々な派生語を含む上記のような擬音語、擬態
語を変換辞書から分離して設け、辞書容量を増加させる
ことなく様々な擬音語、擬態語およびその派生語を表記
に変換することのできる文字処理装置を提供することを
目的とする。
【0007】
【課題を解決するための手段】図1はこの発明の基本構
成を明示するブロック図である。同図においてこの発明
は、入力手段1から入力された単語の読みを、変換辞書
3を検索することにより、かなを含む漢字等からなる単
語の表記に変換して出力手段2に出力する文字処理装置
において、擬音語及び擬態語における音の並びから畳語
を表現してなる読みパターンと、該読みパターン中の2
つの音の読みの組み合わせからなる読みデータテーブル
を記憶する擬音語・擬態語辞書と、入力手段1から単語
の読みが入力された際に、該単語の読みを擬音語・擬態
語辞書の読みパターン及び読みデータテーブルと照合す
る照合手段4と、照合手段4が一致すると判断した単語
の読みを、擬音語または擬態語からの派生語として全部
平仮名または全部片仮名に変換し出力手段2に出力する
変換手段5とを備えてなる文字処理装置である。
【0008】以上のような構成によって、入力手段から
擬音語または擬態語の派生語を含む単語の読みを入力す
ると、入力された単語の読みは、照合手段により、各派
生パターン毎に分類されている。擬音語および擬態語か
らの派生語における変化部分の読みと照合され、さらに
擬音語及び擬態語の主要な読みを記憶している辞書手段
と照合され、照合の結果が一致するとその一致した単語
の読みを擬音語または擬態語として認識し、例えばカタ
カナ等の所定の文字表記に変換して出力手段に出力する
ように作用する。
【0009】
【発明の実施の形態】以下図に示す実施例に基づいてこ
の発明を詳述する。なお、これによってこの発明は限定
されるものではない。図2はこの発明の一実施例の構成
を示すブロック図である。10は変換手段としてのマイ
クロプロセッサからなる制御部で、仮名漢字変換のため
のプログラムやテーブル・バッファを含んでいる。20
は出力手段としてのCRTまたLCD等のドットマトリ
クスタイプの表示装置からなる表示部である。30は入
力手段としてのキーボードやポインティングデバイスか
らなる入力部、40は読み仮名と表記を対応させた従来
の構造の自立語辞書であり、擬音語・擬態語辞書(後述
する)に登録されている以外の単語を持っている。
【0010】50は特定の読みパターンの擬音語や擬態
語を変換する際に使用される辞書手段としての擬音語・
擬態語辞書であり、擬音語、擬態語の読みデータのテー
ブル51と、入力部30から入力される非変換文字列中
の擬音語または擬態語を認識するための照合手段として
のマッチング部52とからなる。テーブル51は、前記
した擬音語、擬態語の読みパターンの“A”“B”にな
り得る読みの組み合わせを持っている。テーブルの構造
としては、図3(a)のような“A”“B”の組み合わ
せの単純な集合でもよいし、“A”“B”の一方をイン
デックスとした図3(b)のような構造でもよい。
【0011】使用者は、表示部20で確認しつつ、入力
部30から入力した仮名列を漢字交じりの文字列に変換
する。仮名漢字変換の際に、制御部10は非変換仮名列
中の自立語を認識するために、自立語辞書40、擬音語
・擬態語辞書50に登録された単語の読みと非変換仮名
列とのマッチングをとる。
【0012】従来の構造の自立語辞書40では、単に登
録されている単語の読み仮名と非変換仮名列のマッチン
グを取るだけであるが、擬音語・擬態語辞書50は前述
した1モーラの読み2個の組み合わせを読みデータとし
て持つのみであるので、以下のような手順で擬音語や擬
態語を認識することになる。
【0013】図4にマッチング部52の処理手順のフロ
ー図を示す。以下、この図に従って説明する。また、制
御部10から渡される辞書とマッチングを取るべき文字
列を「M123456……」として表すものとす
る。擬態語「にょっろーん……」を例に取る場合“M1
→に”“M2→ょ”“M3→っ”“M4→ろ”“M5→ー”
“M6→ん”となる。
【0014】まず、文字“M2”の内容を調べ(ステッ
プ100)、“M2”が小文字の「ゃ」「ゅ」「ょ」な
らステップ101へ、また“M2”が「ゃ」「ゅ」
「ょ」以外ならステップ102へ移る。ステップ101
では“A”の読みを“M12”すなわち“にょ”とする
とともに“i”を3にセットし、ステップ103へ移
る。また、ステップ102では“A”の読みを“M1
とするとともに“i”を2にセットし、ステップ103
へ移る。
【0015】次いでステップ103では文字“Mi”の
内容を調べる。Miが「ー」ならステップ104へ、ま
た“Mi”が「っ」「ん」ならステップ106へ、また
“Mi”が「ー」「っ」「ん」以外ならステップ107
へ移る。ステップ104では、“Mi+1”の内容を調
べ、“Mi+1”が「っ」「ん」ならステップ105へ、
また“Mi+1”が「っ」「ん」以外ならステップ106
へ移る。
【0016】ステップ105では、“j”を“i+1”
とするとともに“k”を“i+2”とし、ステップ10
8へ移る。ステップ106では“j”を“i”とすると
ともに、“k”を“i+1”とし、ステップ108へ移
る。ステップ107では、“j”を0とするとともに、
“k”を“i”とし、ステップ108へ移る。
【0017】この場合の擬態語例では“M3”は“っ”
であるためステップ106においてjが3にセットさ
れ、kが4にセットされる。
【0018】次いでステップ108では、“Mi+1”の
内容が調べられ、“Mi+1”が小文字の「ゃ」「ゅ」
「ょ」ならステップ109へ、また“Mi+1”が「ゃ」
「ゅ」「ょ」以外ならステップ110へ移る。ステップ
109では、“B”の読みを“Mkk+1”とするととも
に、“n”を“k+2”とし、ステップ111へ移る。
ステップ110では、“B”の読みを“Mk”とすると
ともに、“n”を“k+1”とし、ステップ111へ移
る。
【0019】この場合の擬態語例ではステップ108に
おいて“その他”と判断されるため、ステップ110に
おいてBに“ろ”がセットされ、“n”に“5”がセッ
トされ、ステップ111に移る。
【0020】次いでステップ111では、読み“A”
“B”すなわち“にょ”“ろ”を用いてテーブル51を
検索する。ステップ112で“A”“B”がテーブル5
1に有るかどうかを判断して、無ければステップ113
へ、また“A”“B”がテーブル51に有れば、ステッ
プ114へ移る。
【0021】ステップ113では、“i”が0でなく、
“Mj”が「ん」ならステップ107へ移り、それ以外
は、“Mj”以下の文字列は、辞書50に登録された擬
音語・擬態語とマッチしなかったことになる。ステップ
114では、このステップまでで、擬音語、擬態語のパ
ターンの1個目の“B”までのチェックが成功したこと
になる。
【0022】上記の手順と同様の処理手順により、1個
目の“B”から後のパターン(例えば“っ”、“ん”、
“り”、畳語を作る“AB”の繰り返しなど)と
“Mn”以降のマッチングを取る。マッチすれば、
“M1”以下の文字列は、擬音語・擬態語辞書50に登
録された擬音語または擬態語とマッチしたことになる。
マッチしなければ、“M1”以下の文字列は擬音語・擬
態語辞書50に登録された擬音語または擬態語とマッチ
しなかったことになる。
【0023】なお、擬音語または擬態語と認識した部分
の表記への変換についてはマッチした読みを全部平仮名
又は全部片仮名として出力すればよいため、擬音語・擬
態語辞書50には表記のデータは不要である。
【0024】また、「グワッチャーン」「ヴィローン」
などの読みを処理できるように、「ぐゎ」「ふぉ」など
の読みを処理できるように、「ぐゎ」「ふぉ」などを含
む読みの組み合わせをテーブル51に用意し、ステップ
100、ステップ108で「ぁ」「ぃ」「ぅ」「ぇ」
「ぉ」「ゎ」などを「ゃ」「ゅ」「ょ」と同様に扱うよ
うにしてもよい。
【0025】また、擬音語・擬態語辞書50には上記し
た読みパターンに合う擬音語、擬態語しか記憶されてい
ないので、辞書検索の際には自立語辞書40と擬音語・
擬態語辞書50の双方を検索させるように構成すること
が好ましい。すなわち、「ギーッ」「ひっそりかん」の
ように上記した読みパターンに合わない擬音語または擬
態語は、従来と同様に、読みと表記との組み合わせとし
て自立語辞書40に登録しておけばよい。
【0026】
【発明の効果】この発明によれば、辞書の容量を増加さ
せることなく複数の読みパターンの擬音語および擬態語
を自立語辞書に追加したのと同様の効果をえることがで
きる。したがって様々な擬音語、擬態語を仮名漠字変換
させることができ、変換効率を大幅に向上させることが
できる。また、音の組み合わせにより擬音語、擬態語を
表現することにより、擬音語、擬態語に多く見られる繰
り返しによる畳語に関してさらに辞書圧縮の効果が得ら
れる。
【0027】さらに、擬音語または擬態語と認識した部
分の表記への変換についてはマッチした読みを全部平仮
名又は全部片仮名として出力すればよいため、擬音語・
擬態語辞書には表記のデータが不要である。
【図面の簡単な説明】
【図1】本発明の基本構成を示すブロック図である。
【図2】本発明における一実施の形態である文字処理装
置の構成を示すブロック図である。
【図3】本発明における一実施の形態における読みデー
タのテーブル構造を示す図である。
【図4】本発明における一実施の形態における擬音語、
擬態語を認識するための処理手順を示すフローチャート
である。
【符号の説明】
1 入力手段 2 出力手段 3 辞書手段 4 照合手段 5 変換手段
フロントページの続き (72)発明者 三▲吉▼ 秀夫 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 奥西 稔幸 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 秋山 広勝 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 阿部 ひろみ 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 特開 昭58−115529(JP,A) 特開 昭60−207948(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力手段から入力した単語の読みを、変
    換辞書を検索することにより、かなを含む漢字などから
    なる単語の表記に変換して出力手段に出力する文字処理
    装置において、 擬音語及び擬態語における音の並びから畳語を表現して
    なる読みパターンと、該読みパターン中の2つの音の読
    みの組み合わせからなる読みデータテーブルを記憶する
    擬音語・擬態語辞書と、 入力手段から単語の読みが入力された際に、該単語の読
    みを擬音語・擬態語辞書の読みパターン及び読みデータ
    テーブルと照合する照合手段と、 照合手段が一致すると判断した単語の読みを、擬音語ま
    たは擬態語からの派生語として全部平仮名または全部片
    仮名に変換し出力手段に出力する変換手段とを備えてな
    る文字処理装置。
JP8082212A 1996-04-04 1996-04-04 文字処理装置 Expired - Lifetime JP2892613B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8082212A JP2892613B2 (ja) 1996-04-04 1996-04-04 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8082212A JP2892613B2 (ja) 1996-04-04 1996-04-04 文字処理装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP1302950A Division JPH0731681B2 (ja) 1989-11-20 1989-11-20 文字処理装置

Publications (2)

Publication Number Publication Date
JPH08249322A JPH08249322A (ja) 1996-09-27
JP2892613B2 true JP2892613B2 (ja) 1999-05-17

Family

ID=13768125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8082212A Expired - Lifetime JP2892613B2 (ja) 1996-04-04 1996-04-04 文字処理装置

Country Status (1)

Country Link
JP (1) JP2892613B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58115529A (ja) * 1981-12-29 1983-07-09 Fujitsu Ltd 辞書検索方式
JPS60207948A (ja) * 1984-03-31 1985-10-19 Ricoh Co Ltd カナ漢字変換処理装置

Also Published As

Publication number Publication date
JPH08249322A (ja) 1996-09-27

Similar Documents

Publication Publication Date Title
US4903206A (en) Spelling error correcting system
JP4676181B2 (ja) タグ付きデータを有する完全形式レキシコンおよびタグ付きデータを構成し使用する方法
US7831911B2 (en) Spell checking system including a phonetic speller
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
JP2892613B2 (ja) 文字処理装置
JP2004326367A (ja) テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置
JPS634206B2 (ja)
JPS607514A (ja) ワ−ドプロセツサ
JPH0731681B2 (ja) 文字処理装置
JPS59103136A (ja) カナ漢字変換処理装置
JP4177195B2 (ja) 認識文法作成システム
JP3048793B2 (ja) 文字変換装置
JPS6389976A (ja) 言語解析装置
JPS60122429A (ja) 単音節音声入力方式
JPH0414168A (ja) 文書作成装置
JPH09120296A (ja) 音声認識装置および方法、辞書作成装置および方法、情報記憶媒体
JP2744241B2 (ja) 文字処理装置
JPS60140460A (ja) カナ漢字変換装置における短縮変換方式
KR20030080155A (ko) 발음 제약 사전을 이용한 음성 인식기
JPH04156668A (ja) 形態素解析装置
JPS61177573A (ja) 日本語文章作成装置
JPS62117064A (ja) 漢字かな変換装置
JPH08314915A (ja) 情報の表現態様変換装置
JPH10154141A (ja) かな漢字変換装置
JPH02292662A (ja) 固有名詞変換機能付き文書処理装置