JPH0668128A - 形態素解析処理方法 - Google Patents

形態素解析処理方法

Info

Publication number
JPH0668128A
JPH0668128A JP4219506A JP21950692A JPH0668128A JP H0668128 A JPH0668128 A JP H0668128A JP 4219506 A JP4219506 A JP 4219506A JP 21950692 A JP21950692 A JP 21950692A JP H0668128 A JPH0668128 A JP H0668128A
Authority
JP
Japan
Prior art keywords
sentence
processing
sub
morpheme analysis
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4219506A
Other languages
English (en)
Inventor
Okihiro Kimura
興弘 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP4219506A priority Critical patent/JPH0668128A/ja
Publication of JPH0668128A publication Critical patent/JPH0668128A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文章の形態素解析処理を高速にする。 【構成】 入力文書の先頭から順に形態素解析処理単位
の文章を取出し、この単位毎の文章を複数のサブプロセ
スに順に渡して形態素解析処理を並列的に実行させ、各
サブプロセスの解析結果を1つのデータとしてまとめ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コンピュータを利用し
た自然言語解析システムにおける形態素解析処理方法に
関する。
【0002】
【従来の技術】現在、コンピュータを利用した自然言語
解析処理は、文章校正支援をはじめ、音声合成、音声認
識、文字認識など幅広い分野に適用されている。
【0003】この自然言語処理では、まず解析対象とな
る文章を形態素単位(語構成の最小単位)に区切り、そ
れぞれの単位の持つ性質を明らかにする形態素解析を行
う。この語、自然言語の統語規則から解析する構文解
析、続いて曖昧性や漠然性を取除く意味解析、文脈解析
を行う。
【0004】ここで、自然言語処理のはじめの処理とな
る形態素解析では、入力データ(処理の対象となる文
書)を与えられると、この入力データを形態素単位に分
割し、かつ、各形態素ごとに品詞情報などのデータを作
成し、このデータを基にその語の処理が行われている。
【0005】
【発明が解決しようとする課題】従来の形態素解析処理
は、図3に示すように、入力文書の先頭から一文書を取
出し、この文章について形態素解析を行い、解析終了語
に次の文章を取出すという処理を文章の終わりまで繰返
し、全文章の形態素解析の終了で解析結果データを作成
する。
【0006】このため、解析対象となる文章が大量にな
る場合には文章全体の解析が終了するのに長い時間を必
要とし、自然言語解析の処理遅れの要因となっている。
【0007】本発明の目的は、形態素解析処理を高速に
する方法を提供することにある。
【0008】
【課題を解決するための手段】本発明は、前記課題の解
決を図るため、コンピュータを利用した自然言語解析シ
ステムにおいて、入力文書の先頭から順に形態素解析処
理単位の文章を取出し、この取出した文章を並列分散処
理を行う複数の形態素解析サブプロセスに渡して形態素
解析処理を実行させ、前記文章の取出しとサブプロセス
への文章渡しを文章の終わりまで繰返した後に前記各サ
ブプロセスが実行した形態素解析結果データを1つにま
とめることを特徴とする。
【0009】
【作用】形態素解析の実行を複数の並列分散処理サブプ
ロセスによって並列的に分散処理させる。
【0010】
【実施例】図1は本発明の一実施例に示す処理手順図で
ある。形態素解析対象となる文章は処理本体になるプロ
グラムによって形態素解析の処理単位となる文章が先頭
から取出され、この取出された文章はサブプロセスに渡
して形態素解析を実行させる。このサブプロセスは、並
列分散処理オペレーティングシステムによって処理本体
のプロセスとは独立して形態素解析を実行し、また互い
に独立した複数のサブプロセス構成にされて並列的に形
態素解析を実行する。
【0011】形態素解析処理本体は、ある1つの文章を
ある1つのサブプロセスに渡した後に入力文章が終わり
でない限り次の文章を取出し、この文章を形態素解析を
終了したサブプロセスに渡してその実行を行わせる。
【0012】ここで、各文章をどのサブプロセスが解析
しているかを知るため、処理本体はあるサブプロセスを
起動したときにそのプロセスIDを取得し、文章番号と
そのプロセスIDを関連づけておくことで管理し、この
関連づけによって各サブプロセスの解析結果を1つにま
とめるときの文章の順番を狂わすことなく解析結果をデ
ータとしてまとめる。
【0013】従って、形態素解析には、入力文章から処
理単位となる文章の取出しと、各サブプロセスの解析終
了結果を1つにまとめるだけで済む。
【0014】この処理手順の様子は、図2に従来方法と
対比して示すように、従来方法では文章取出しと形態素
解析を直列的に繰返すのに対し、本実施例では文章取出
しと形態素解析が処理本体と各サブプロセスで夫々並列
的に繰返され、サブプロセス数を増すことにより処理時
間が大幅に短縮される。
【0015】
【発明の効果】以上のとおり、本発明によれば、形態素
解析及び文章取出しを夫々並列分散処理するようにした
ため、形態素解析処理の処理時間を大幅に短縮すること
ができる。
【0016】特に、解析対象となる文書が多くの文章か
ら構成される場合に処理時間の短縮に一層効果的にな
る。
【図面の簡単な説明】
【図1】実施例の形態素解析処理手順図。
【図2】従来と実施例の処理タイムチャート。
【図3】従来の形態素解析処理手順図。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータを利用した自然言語解析シ
    ステムにおいて、入力文書の先頭から順に形態素解析処
    理単位の文章を取出し、この取出した文章を並列分散処
    理を行う複数の形態素解析サブプロセスに渡して形態素
    解析処理を実行させ、前記文章の取出しとサブプロセス
    への文章渡しを文章の終わりまで繰返した後に前記各サ
    ブプロセスが実行した形態素解析結果データを1つにま
    とめることを特徴とする形態素解析処理方法。
JP4219506A 1992-08-19 1992-08-19 形態素解析処理方法 Pending JPH0668128A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4219506A JPH0668128A (ja) 1992-08-19 1992-08-19 形態素解析処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4219506A JPH0668128A (ja) 1992-08-19 1992-08-19 形態素解析処理方法

Publications (1)

Publication Number Publication Date
JPH0668128A true JPH0668128A (ja) 1994-03-11

Family

ID=16736527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4219506A Pending JPH0668128A (ja) 1992-08-19 1992-08-19 形態素解析処理方法

Country Status (1)

Country Link
JP (1) JPH0668128A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282347A (ja) * 2009-06-03 2010-12-16 Nec Corp 構文解析装置、構文解析方法、及びプログラム
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282347A (ja) * 2009-06-03 2010-12-16 Nec Corp 構文解析装置、構文解析方法、及びプログラム
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法
JP2017102771A (ja) * 2015-12-03 2017-06-08 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法

Similar Documents

Publication Publication Date Title
EP0691023B1 (en) Text-to-waveform conversion
WO2000063783A1 (en) Method and system for generating structured data from semi-structured data sources
Kumaran et al. Intelligent personal assistant-implementing voice commands enabling speech recognition
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
DE102012202391A1 (de) Verfahren und Einrichtung zur Phonetisierung von textenthaltenden Datensätzen
JPH0668128A (ja) 形態素解析処理方法
JP6998017B2 (ja) 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム
KR0123238B1 (ko) 어절구조 특성을 이용한 형태소 분석 시스팀 및 분석 방법
JP6665029B2 (ja) 言語解析装置、言語解析方法、及びプログラム
JPS63221475A (ja) 構文解析方法
JP2000029894A (ja) 主題文抽出方式
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JPH04253098A (ja) 音声合成に用いる数字及び特殊記号の言語処理方法
KR19980036108A (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JPH04112269A (ja) 認識候補間類似度の差を利用したラティス探索方式
JPH03116272A (ja) 文パターン辞書を有する機械翻訳システム
Messerschmidt Graph transductions in the field of automatic translation of natural languages
JPH01287771A (ja) 形態素解析装置
JPH0628393A (ja) 自然言語解析の形態素解析処理方式
JPH04299449A (ja) 文章入力装置
JPH0511998A (ja) 変数伝播の解析方式
JPS62124600A (ja) 音声認識装置
JPH0367364A (ja) 音声認識用/文字認識用の候補探索方式
JPH02176862A (ja) 対話型文解析装置
JPH05281985A (ja) 音声合成方法および装置