JPH0146894B2 - - Google Patents

Info

Publication number
JPH0146894B2
JPH0146894B2 JP58244011A JP24401183A JPH0146894B2 JP H0146894 B2 JPH0146894 B2 JP H0146894B2 JP 58244011 A JP58244011 A JP 58244011A JP 24401183 A JP24401183 A JP 24401183A JP H0146894 B2 JPH0146894 B2 JP H0146894B2
Authority
JP
Japan
Prior art keywords
memory
character
dictionary
character string
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58244011A
Other languages
English (en)
Other versions
JPS60136862A (ja
Inventor
Kunio Nakanishi
Yasunori Katayama
Yoshinari Hiraoka
Yutaka Yoshiura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58244011A priority Critical patent/JPS60136862A/ja
Priority to US06/685,993 priority patent/US4736296A/en
Priority to KR1019840008374A priority patent/KR900000602B1/ko
Priority to CA000471032A priority patent/CA1216364A/en
Priority to GB08432689A priority patent/GB2153560B/en
Publication of JPS60136862A publication Critical patent/JPS60136862A/ja
Publication of JPH0146894B2 publication Critical patent/JPH0146894B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9017Indexing; Data structures therefor; Storage structures using directory or table look-up
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0489Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は文字列処理装置に係り、特に、カナ漢
字変換装置、自然な日本語によるデータベース検
索装置、知的ガイダンス装置、質問応答装置、情
報抽出装置において、連続的な文字列を意味のあ
る単位毎に分割する形態素解析装置に関する。
〔発明の背景〕
文字列処理装置としては現在、第1図に示すワ
ープロ(ワードプロセツサ)1が代表的である。
ワープロ1の入力方式としては漢字タイプ、音
声・文字認識などがあるが、最も広く普及してい
るのはカナ漢字変換方式である。これは、入力文
字列2をカナ文字列とするものである。簡単な装
置では単語単位に区切り信号を入力するが、より
高度なものでは文節単位あるいは通常の句読点ご
とに区切り記号を入力する。
このような、いわゆる非分かち書きのカナ文字
列を入力文字列2とすると、それに含まれる単語
を決定する必要がある。その処理を行なうのが形
態素解析装置3であり、漢字かな混り文字列4と
して出力する。
編集装置5は、前記漢字かな混り文字列4を、
入力された編集コマンド6により指定された書式
に基づいて編集し、デイスプレイ、プリンタなど
にその結果得られた文書7を出力する。
従来の形態素解析装置は、入力文字列の指定さ
れた位置より始まる最長の単語を二分探索により
辞書から選択することをその位置を変えること
で、入力文字列に含まれるすべての単語を決定し
ていた。ここで、辞書とは、意味をもつ最小の単
位である単語を記憶したメモリであり、その単語
の配列順序はいわゆる辞書順に従つている。文字
の優先順位としては五十音順、アルフアベツト順
が代表的である。
二分探索により、ある文字列が単語として辞書
に含まれているか否かを決定できる。そのために
は、辞書の配列の中央の単語と入力された文字列
とを比較し、一致しない場合にも、比較の順序関
係から探索する範囲の単語の個数を2分の1に絞
ることを繰り返す。もし、所望の単語が存在すれ
ば、繰り返しの過程に得られ、存在しなければ、
探索範囲が無くなることで判明する。この方法に
よれば、N個の単語に対してほぼlog2N回の比較
をすれば結果が得られる。
この二分探索を形態素解析装置に適用する場合
に、文字列の長さがあらかじめわからない点に難
がある。そのため、第2図にフローチヤートによ
り探索が行なわれる。
すなわち、ステツプ13においては探索すべき文
字列の長さKを固定して二分探索を行ない、所望
の単語が存在しなければ(ステツプ14)、Kの値
を1だけ減らし(ステツプ17)、再度短い文字列
の二分探索を行なう。
しかしながら、この方式によれば、最後の文字
を削除した文字列の探索において、これまでの探
索の過程が全く生かされていない。すなわち、再
度、辞書の全単語から探索している。そのため
に、探索に多くの時間を要していた。
また、最長の長さまで一致する単語だけでな
く、二番目以降の長さの単語をも必要となれば、
さらに多くの時間が要求されていた。
最長一致法による形態素解析では、入力文字列
のある位置から始まる単語が複数個存在する場合
には最長の単語を選択する。しかしながら、以降
の文字列のなかに接続する単語がないことがあ
る。この場合には、その単語は実際には入力文字
列に含まれなかつた単語であり、別の単語を選択
しなければならない。その時に二番目以降の長さ
をもつ単語が必要となるのである。
〔発明の目的〕
本発明の目的は、上記の従来方式の欠点を解決
し、入力文字列の指定位置から始まる文字列と一
致する単語を得る手段において、存在するあらゆ
る長さの単語を効率的に探索することにより、入
力文字列を単語の単位に分割する処理を高速に行
なう形態素解析装置を提供することにある。
〔発明の概要〕
入力文字列の指定位置から始まるK−1字と、
辞書内の単語のK−1字が一致するような単語の
アドレスの範囲内で、K字目まで一致する単語の
アドレスの範囲を求め、K字からなる単語で一致
する単語を出力する。この処理をKの値を順次増
加させて繰り返すことで、あらゆる長さの単語を
効率的に選び出すことが達成される。
〔発明の実施例〕
以下、本発明の一実施例を第3図により説明す
る。
第3図は、入力された入力文字列に対して、そ
れを単語単位に分割して、各単語の辞書データを
出力する形態素解析装置の構成図である。
形態素解析制御回路31は、単語の接続関係の
決定を制御する回路であり、いわゆる最長一致法
による方式を採用している。最長一致法とは、あ
る位置から始まる単語が複数個存在すれば、最長
の単語を選択するという方式である。
制御回路32は、転語の辞書からの選択を制御
する回路であり、辞書のアドレスの値を順次算出
する。
以下、第3図に基づき、各部の処理を詳細に述
べる。
入力装置33は、入力された文字列を入力文字
列データ34として入力文字列メモリ35に出力
するとともに、形態素解析の開始を指令する開始
制御信号36を形態素解析回路31に出力する。
入力装置33は、英字、カナ字、漢字のタイプラ
イタ、あるいは、音声、文字認識装置などの文字
入力装置よりなる。
入力文字列メモリ35は、入力装置33からの
入力文字列データ34を記憶し、形態素解析制御
回路31、入力文字切出回路37に、入力文字列
データ38として出力する。
入力文字切出回路37は、入力文字列データ3
8の文字の並びにおいてその先頭から順次数え
て、開始位置データ40と文字位置データ42の
和に相当する位置に存在する一文字のみを取り出
し、入力文字切出データ43として出力する。
開始位置メモリ39は、探索すべき単語の一文
字目が入力文字列データ38で占める位置を記憶
する。その値は、形態素解析制御回路31により
設定され、開始位置データ40として出力され
る。
文字位置メモリ41は、カウンタメモリであ
り、制御回路32からの文字位置設定信号44に
より、1ずつ加算あるいは0にリセツトされ、文
字位置データ42として出力する。
辞書文字切出回路45は、辞書データ48の単
語の文字列から、文字位置データ42に相当する
文字数目の文字を取り出し、辞書文字切出データ
49として出力する。
文字比較回路50は、入力文字切出データ43
と辞書文字切出データ49とを比較して、例えば
“−1”、“0”、“+1”のいずれかを文字比較信
号51として出力する。文字の比較は、文字に対
してあらかじめ定義された順序関係に基づいて決
定される。文字比較信号51は、入力文字切出デ
ータ43が辞書文字切出データ49よりも文字の
順序が後ろであれば“−1”であり、等しければ
“0”、さもなければ“+1”である。この順序関
係としては、英字に対するアルフアベツト順、カ
ナ字に対する五十音順が良く知られている。辞書
メモリ46で使用された文字列の順序関係と同じ
関係に基づいている。
アドレスゲート回路52、ゲート回路47は、
制御回路32からのゲート制御信号53により連
動して起動される。ゲート制御信号53が“0”
であれば、アドレスゲート回路52は二分点デー
タ54をアドレス55として出力し、ゲート回路
47は辞書メモリ46より読出された辞書データ
56を辞書データ48に出力する。ゲート制御信
号53が“1”であれば、上限データ57がアド
レスゲート回路52を介して辞書メモリ46に入
力され、読み出された辞書データ56はゲート回
路47により辞書データ58として出力される。
辞書二文字切出回路59は、辞書データ58の
単語を構成する文字列に対して、その先頭から文
字位置データ42に相当する文字数目の文字と、
その次の文字の二文字を辞書二文字切出データ6
0として出力する。
判定回路61は、辞書二文字切出データ60の
一文字目と入力文字切出データ43が不一致なら
ば−1を、前記が一致し、前者の次文字が空白で
あれば1を、それ以外の時には0を、各々判定信
号62として出力する。
出力制御回路63は、判定信号62の入力によ
り起動される。判定信号62をそのまま探索制御
信号64として出力するとともに、判定信号62
が1のときのみ、辞書データ58を探索結果メモ
リ65に出力する。
探索結果メモリ65は、出力制御回路63より
入力された辞書データ66を次々に記憶する。記
憶された内容は探索結果データ67として形態素
解析制御回路31に参照される。
形態素解析制御回路31は、開始制御信号36
または後述の探索終了信号68により起動され
る。開始制御信号36が入力装置33より入力さ
れれば、開始位置メモリ39に1を出力し、単語
の探索の開始を示す制御信号69を制御回路32
に出力する。探索終了信号68が制御回路32よ
り入力されれば、入力文字列データ38、探索結
果データ67から、最長一致法などのアルゴリズ
ムにより新たな単語を決定し、そのデータを出力
結果メモリ70に出力し、前記単語の長さを開始
位置メモリ39の内容に加算し、制御信号69を
出力する。ここで、前記単語が入力文字列データ
38の末尾となつていれば、終了制御信号71を
出力する。
出力装置72は、終了制御信号71の入力によ
り起動され、出力結果メモリ70の内容を読み出
し出力する。出力装置72は、たとえば、プリン
タ、デイスプレイからなる。
辞書メモリ46は、単語情報が記憶されたメモ
リであり、入力されたアドレス55に対する単語
の辞書データ56が出力される。辞書メモリ46
に含まれている単語の個数をNとし、各単語のア
ドレスを1からNまでの整数とする。アドレスの
順序は、辞書順として知られている順序規則に従
つて付けられている。
制御回路32はマイコンにより実現されるが、
その処理を第4図により説明する。
処理101で動作が開始し、形態素解析制御回
路31からの制御信号69の入力の待機状態10
2となる。入力が得られれば、処理103でメモ
リに初期値データを出力する。すなわち、上限メ
モリ73に“1”を、下限メモリ74に“N”
を、文字位置メモリ41に“0”を各々出力す
る。ここで、Nは辞書メモリ46に含まれている
単語の総数である。
メモリの初期化後、上限更新処理104、下限
更新処理105を行なう。これらの処理により、
辞書メモリ46のアドレスが上限データと下限デ
ータの範囲内の単語で、文字位置データ42で示
された次の文字を参照し、入力文字列データ34
の該当文字と一致するアドレスの範囲が求められ
る。104,105については後に詳細に説明す
る。
処理106は、ゲート制御信号53として
“1”を出力する。アドレスゲート回路52、ゲ
ート回路47を制御することにより、探索制御信
号64の待機状態107となる。
探索制御信号64が0または+1であれば文字
位置メモリ41に1を加算(108)し、上限更
新処理104を再実行する。前記信号が−1であ
れば探索終了信号68を出力(109)し、制御
信号69の待状態102となる。
次に、前記上限更新処理104について第5図
で説明する。
上限データは、文字位置メモリ41の値の文字
数まで入力文字列データ38と一致する辞書メモ
リ46内の単語で最も小さなアドレス(すなわ
ち、単語を順番に並べた場合に最も上の単語のア
ドレス)であり、上限更新処理104は、さらに
次の文字まで一致する範囲の単語で最も小さなア
ドレスに、上限データを二分探索より更新する処
理であり、以下に示すように、求めるべき上限デ
ータの探索範囲(上端データと下端データの間)
を二分の一に挟める手続きを繰り返すことにより
決定する。
始めに、処理121にて、二分探索の範囲を表
わすために上端メモリ75と下端メモリ76を各
各、上限データと下限データにより初期化する。
次に、上限データと下限データとを参照(12
2)し、差が1であれば、処理123により上限
メモリ73に下端データを出力し、上限更新処理
104を終了する。他方、前記条件が満足されな
ければ、以下の処理により探索を行なう。
処理124は、上端データと下端データの平均
値を求め、二分点メモリ77に出力する。つい
で、ゲート制御信号53として“0”を出力(1
25)し、文字比較信号51の待状態126とな
る。
前記文字比較信号51の入力後、その値を判定
する。その値が“+1”または“0”の時には、
下端メモリ76に二分点データを出力127,1
28し、 “−1”の時には、上端メモリ75に出力12
9する。そして、再度処理122を行なう。
また、下限更新処理105は、文字位置メモリ
41の値の文字数まで入力文字列データ38と一
致する辞書メモリ46内の単語で、最も大きなア
ドレスである下限データを、次の文字まで一致す
る範囲の単語で最も大きなアドレスに、下限デー
タを二分探索より更新する処理であり、次の2点
を除いて上限更新処理104と同じである。
(1) 処理123の代わりに、下限メモリ74に上
端データを出力する。
(2) 処理128において、上端メモリ76に出力
する。
以上のように、上限更新処理104と下限更新
処理105を用いて、文字位置メモリ41の値の
文字数まで一致する辞書メモリ46内の単語の範
囲を示す上限データと下限データを、さらに次の
文字までが一致する範囲に、各々二分探索より更
新することができる。
次に、具体的な例を用いて本実施例の動作を説
明する。第6図の辞書メモリ46を使つて、入力
文字列「ヤマオクニオニガシマウ」のかな漢字混
りの出力を得ることを考える。
形態素解析制御回路31は開始制御信号36の
入力を受け、開始位置メモリ39に1を出力し、
制御信号69を出力する。
前記制御信号の入力を検知し、制御回路32
は、上限メモリ73、下限メモリ74の初期値と
して各々1,36を、文字位置メモリ41に0を出
力103する。
以下、前述のように処理121,122,12
4が実行され、二分点メモリ77には18が記憶さ
れる。次に、ゲート制御信号53として“0”が
出力される。
前記ゲード制御信号を受けたアドレスゲート回
路52は二分点データ54として18を入力し、辞
書メモリ46にアドレス55として出力する。ゲ
ート回路47は前記辞書メモリから読み出された
辞書データ56である「ガイコク 外国」を辞書
文字切出回路45に出力する。
辞書データの入力により辞書文字切出回路45
は文字位置メモリ41の内容“0”を読み出し、
0+1文字目の文字として「ガ」を切出す。この
辞書文字切出データ49は文字比較回路50に入
力され、入力文字切出回路37から入力された入
力文字切出データ43の「ヤ」と比較される。
「ヤ」は「ガ」より後順であるので文字比較信
号51は“−1”である。
この文字比較信号の評価126の結果、処理1
29により二分点データの値18を上端メモリ75
に出力する。
以下同様にして、上端が29、下端が30の時に処
理123に進み、上限メモリ73に30が出力され
る。従つて、初期値として1を保持していた上限
メモリ73はその保持内容を30に更新され、、上
限更新処理は終了する。尚、この時点では下限メ
モリ74は初期値として与えられた36を保持して
いる。
続いて下限更新処理105に移行する。下限更
新処理105では、上端メモリ75に30、下端メ
モリ76に36を出力する。前述の上限更新処理1
04とほぼ同様にして、二分点メモリ77には33
が記憶される。次にゲート制御信号53として
“0”が出力される。前記ゲート制御信号を受け
たアドレスゲート回路52は二分点データ54と
して33を入力し、辞書メモリ46にアドレス55
として出力する。ゲート回路47は前記辞書メモ
リから読み出された辞書データ56である「ヤマ
オク 山奥」を辞書文字切出回路45に出力す
る。辞書データの入力により辞書文字切出回路4
5は文字位置メモリ41の内容“0”を読み出
し、0+1文字目の文字として「ヤ」を切り出
す。この辞書文字切出データ49は文字比較回路
50に入力され、入力文字切出回路37から入力
された入力文字切出データ43の「ヤ」と比較さ
れる。「ヤ」と「ヤ」で文字の順序が等しいので
文字比較信号51は“0”である。この文字比較
信号の値の結果、二分点データの値33を上端メモ
リ75に出力する。以下同様にして、上端が33、
下端が34のとき下限メモリ74に33が出力され
る。この結果、30から33までの4つの単語の一文
字目が「ヤ」であり入力文字列の一文字目と一致
している。
次に、上限データ57の値30をアドレスとする
辞書データ「ヤ や(助詞)」が辞書二文字切出
回路59に入力される。その結果は「ヤ□」であ
る。これが判定回路61に入力されると、判定信
号62として“1”を出力し、出力制御回路63
により、その辞書データが探索結果メモリ65に
記憶される。
このようにして、長さの異なる三つの単語
「や」、「山」、「山奥」が得られ、探索結果データ
67として形態素解析制御回路31に入力され
る。この中から最長の「山奥」を選択し、次に、
開始位置メモリ39に5を出力し、「山奥」に接
続する単語を探索する。
最終的には「山奥に鬼が仕舞う」というかな漢
字混り文が出力装置72から出力される(第7図
を参照)。
本実施例によれば、辞書探索が高速化し、か
つ、多様な長さの単語が洩れることなく得られる
効果がある。特に、処理107において探索制御
信号64の内容が−1であることを検知すれば、
文字位置メモリ41の値に相当する長さの文字数
をもち、かつ、入力文字列に含まれることがない
ことを決定できる。そのため、探索を終了させる
べき条件が明快であり、洩れがない。
〔発明の効果〕 本発明によれば、辞書メモリを探索する範囲の
アドレスを上限メモリと下限メモリとに収納し、
参照文字数の増加とともにその範囲を徐々に絞る
ことができる。この過程でその範囲が単調に狭く
なるため、存在する全ての長さの単語を高速に探
索できる。このため、入力文字列を単語単位に分
割する形態素解析の効率化が達成される。
一回の探索の過程での辞書の参照回数を見積る
と、約6万語の辞書に対して、従来例では約130
回、本発明では約60回となる。また文字の比較回
数は、従来例では単語単位の比較であるので文字
毎に計数すると約500回となる。一方、本発明の
文字の比較は一文字単位の比較であるので、約60
回である。以上からわかるように、辞書の参照回
数で約2分の1、文字単位の比較回数で約8分の
1であり、高速化が達成されている。
【図面の簡単な説明】
第1図はワープロの構成図、第2図は従来例に
よるフローチヤート、第3図は形態素解析装置の
構成図、第4図は第3図の制御回路の動作を説明
するフローチヤート、第5図は第4図の上限更新
処理を詳細に説明するフローチヤート、第6図は
第3図の辞書メモリの一例を示す図、および、第
7図は形態素解析の具体例を示す図である。 31……形態素解析制御回路、32……制御回
路、37……入力文字切出回路、41……文字位
置メモリ、45……辞書文字切出回路、46……
辞書メモリ、50……文字比較回路、61……判
定回路、73……上限メモリ、74……下限メモ
リ。

Claims (1)

  1. 【特許請求の範囲】 1 文字列を入力する入力文字列メモリと、ソー
    トされた単語の見出し語とそれに付随する情報を
    記憶する辞書メモリと、当該入力文字列において
    単語に切分ける操作が格納されている場所を示す
    開始位置を記憶する開始位置メモリと、前記辞書
    メモリの内容と入力文字列の開始位置より後の文
    字列とを比較する文字列比較部及び上記メモリの
    内容を制御する制御部より成り、非分かち書きの
    入力文字列を単語単位に分割する形態素解析装置
    において、 前記開始位置よりn文字目の文字に着目して辞
    書と比較するかを決定する文字位置メモリと、辞
    書の見出し語中で最初からn−1文字目までと入
    力文字列の開始位置よりn−1文字とが等しいも
    ののうち最初のアドレスを示す上限メモリと最終
    アドレスを示す下限メモリ及び前記文字位置メモ
    リの示す入力文字と等しい文字を探索する範囲を
    前記上限メモリと下限メモリとに設置して単語を
    区切る手段とを有することを特徴とする形態素解
    析装置。 2 特許請求の範囲第1項において、前記上限メ
    モリと前記下限メモリの内容が一致した時に単語
    の切り出しが終了したと判断し、前記開始位置メ
    モリを更新することを特徴とする形態素解析装
    置。 3 特許請求の範囲第1項において、前記上限メ
    モリの示す単語で、前記文字位置メモリに相当す
    る次の文字が無い場合、上記の単語を出力する事
    を特徴とする形態素解析装置。 4 特許請求の範囲第1項において、前記探索ア
    ルゴリズムを二分探索法とすることを特徴とする
    形態素解析装置。
JP58244011A 1983-12-26 1983-12-26 形態素解析装置 Granted JPS60136862A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP58244011A JPS60136862A (ja) 1983-12-26 1983-12-26 形態素解析装置
US06/685,993 US4736296A (en) 1983-12-26 1984-12-24 Method and apparatus of intelligent guidance in natural language
KR1019840008374A KR900000602B1 (ko) 1983-12-26 1984-12-26 자연어(自然語)에 의한 지적가이던스방법(知的 guidence 方法) 및 그 장치
CA000471032A CA1216364A (en) 1983-12-26 1984-12-27 Method and apparatus of intelligent guidance in natural language
GB08432689A GB2153560B (en) 1983-12-26 1984-12-27 Method and apparatus of intelligent guidance in natural language

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58244011A JPS60136862A (ja) 1983-12-26 1983-12-26 形態素解析装置

Publications (2)

Publication Number Publication Date
JPS60136862A JPS60136862A (ja) 1985-07-20
JPH0146894B2 true JPH0146894B2 (ja) 1989-10-11

Family

ID=17112382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58244011A Granted JPS60136862A (ja) 1983-12-26 1983-12-26 形態素解析装置

Country Status (1)

Country Link
JP (1) JPS60136862A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5794883A (en) * 1981-09-28 1982-06-12 Hitachi Ltd Word processor
JPS5884363A (ja) * 1981-11-13 1983-05-20 Matsushita Electric Ind Co Ltd カナ漢字変換装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5794883A (en) * 1981-09-28 1982-06-12 Hitachi Ltd Word processor
JPS5884363A (ja) * 1981-11-13 1983-05-20 Matsushita Electric Ind Co Ltd カナ漢字変換装置

Also Published As

Publication number Publication date
JPS60136862A (ja) 1985-07-20

Similar Documents

Publication Publication Date Title
US5649023A (en) Method and apparatus for indexing a plurality of handwritten objects
US5655129A (en) Character-string retrieval system and method
US5680630A (en) Computer-aided data input system
JP2633824B2 (ja) 仮名漢字変換装置
JPH0315980A (ja) 文字列検索装置
JPS6033665A (ja) キ−ワ−ド自動抽出方式
JPH0146894B2 (ja)
JPH056398A (ja) 文書登録装置及び文書検索装置
EP1076305A1 (en) A phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JP3470930B2 (ja) 自然語解析方法及び装置
JPH0227423A (ja) 日本語文字データの並び換え方法
JP2766084B2 (ja) 仮名漢字変換方法
JP3466761B2 (ja) 文書処理装置及びその制御方法
JPH06161995A (ja) 氏名データ整形方法および装置
JPH02136970A (ja) 英単語検索装置
CA1257705A (en) Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
JPH0773279A (ja) 文字変換装置
JPH07319892A (ja) 文字列照合装置
JPS607582A (ja) 文字読取り装置
JPH0695330B2 (ja) 文書作成装置
JPH0128977B2 (ja)
JPH0546612A (ja) 文章誤り検出装置
JPH05181899A (ja) 電子辞書
JPS62287337A (ja) 検索装置