JPH0215904B2 - - Google Patents

Info

Publication number
JPH0215904B2
JPH0215904B2 JP56154502A JP15450281A JPH0215904B2 JP H0215904 B2 JPH0215904 B2 JP H0215904B2 JP 56154502 A JP56154502 A JP 56154502A JP 15450281 A JP15450281 A JP 15450281A JP H0215904 B2 JPH0215904 B2 JP H0215904B2
Authority
JP
Japan
Prior art keywords
search
word
semantic
dependency
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56154502A
Other languages
English (en)
Other versions
JPS5856071A (ja
Inventor
Juji Uchida
Kenji Sugyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56154502A priority Critical patent/JPS5856071A/ja
Publication of JPS5856071A publication Critical patent/JPS5856071A/ja
Publication of JPH0215904B2 publication Critical patent/JPH0215904B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 本発明は、日本語による検索システム、特に例
えば複数のプログラム・モジユール(ソフトウエ
ア部品と考える)を格納している部品データ・ベ
ースを、日本語入力によつて検索すべく、入力さ
れた日本語の問い合わせ情報を、自立語相互間の
係り受け関係を明確にするよう処理し、問い合わ
せ情報における表現上の差異を吸収するようにし
た日本語による検索システムに関するものであ
る。
例えば「ルンゲ・クツタ法による積分」と名付
けられたプログラム・モジユール、「オイラ法に
よる積分」と名付けられたプログラム・モジユー
ル、「ホイン法による積分」と名付けられたプロ
グラム・モジユールなどが格納されているデー
タ・ベースをアクセスして、所望のプログラム・
モジユールを抽出する如き検索システムを想定し
たとする。この場合における検索システムは、第
1図図示の如きものとなろう。第1図において、
1は問い合わせ情報バツフア、2は検索装置、3
はデータ・ベース、4はシソーラス格納バツフア
を表わしている。
簡単なシステムにおいては、シソーラス格納バ
ツフア4が存在せず、問い合わせ情報バツフア1
の内容そのものと全く一致する名称をもつプログ
ラム・モジユールaを検索すべく検索装置2が動
作する。また更に進んだシステムにおいては、シ
ソーラス格納バツフア4をもうけて、例えば「簡
易ルンゲ・クツク法による積分」と「ホイン法に
よる積分」とは実質上同じである旨を関連づけて
おき、「簡易ルンゲ・クツク法による積分」なる
問い合わせ情報が与えられた場合にも、検索装置
2がシソーラス格納バツフア4を調べてデータ・
ベース3中の「ホイン法による積分」を抽出する
ようにされる。
しかし、日本語をもつて問い合わせる検索シス
テムにおいては、問い合わせ情報の表現上の差
異、例えば「ルンゲ・クツタ法による積分」と
「簡易ルンゲ・クツク法によつて積分」となどの
表現上の差異を吸収することが望まれる。
本発明は上記の点を解決することを目的として
おり、本発明の日本語による検索システムは、複
数の名詞または名詞句相互間の係り受け関係を附
加された形で名称が与えられている複数個の検索
対象物を格納してなる検索対象物データ・ベース
をそなえると共に、該検索対象物データ・ベース
をアクセスする検索装置をそなえ、該検索装置に
対して上記検索対象物名称を指示して検索を行な
う検索システムにおいて、日本語にて与えられた
問い合わせ情報にもとづいて当該問い合わせ情報
を日本語辞書索引して単語単位に分割すると共に
単語接続検定を行なう単語分割装置、該単語分割
装置によつて分割された単語中の自立語を選択し
当該自立語に対して附属語を附加した文節を認定
する文節認定装置、単語または文節の文法的な接
続関係の可否を表わすテーブルを有する文法的接
続検定装置、単一の単語または文節に関して意味
上から複数の接続関係が存在する場合に当該意味
上の接続の可否を表わすテーブルを有する意味的
接続検定装置、上記文節認定装置によつて得られ
た各文節相互に対して上記文法的接続検定装置と
上記意味的接続検定装置とを用いて係り受け関係
を解析して係り受け先文節情報を附与する係り受
け解析装置、および該係り受け解析装置によつて
得られた文節相互間の係り受け情報を参照しつつ
文節中の自立語に対応する意味記号を文節にまた
がつて関係づける意味記号抽出装置をそなえ、上
記与えられた問い合わせ情報を、自立語相互間の
係り受け関係を明確にし検索対象物の名称に変換
した上で、検索を行なうようにしたことを特徴と
している。以下図面を参照しつつ説明する。
第2図は本発明による検索システムの概念説明
図、第3図は本発明の一実施例構成、第4図は第
3図図示の場合と異なつた形の問い合わせ情報が
与えられたときの説明図を示している。
第2図において、1―1,1―2は夫々問い合
わせ情報、2は検索装置、5は検索名作成装置、
6は検索名情報(又はバツフア)を表わしてい
る。
本発明の場合、第2図図示の問い合わせ情報1
―1が入力された場合にも問い合わせ情報1―2
が入力された場合にも、検索名作成装置5が、問
い合わせ情報中の自立語に注目しかつ自立語相互
間の係り受け関係に注目して、同じ検索名情報6
をつくり出すようにする。そして、該検索名情報
6をもつて検索装置2に通知するようにする。
第3図は本発明の一実施例構成を示す。図中の
符号1,2,3,5,6は第1図または第2図に
対応している。また7は単語分割装置であつて、
日本語辞書8や単語間接続検定装置9を用いて、
問い合わせ情報バツフア1の内容を単語に分割
し、単語バツフア10に格納する。なお単語バツ
フア10には、問い合わせ情報を分割した単語の
単語コードと当該単語の意味記号と当該単語の文
法情報と当該単語の意味情報などが一語として格
納される。
11は文節認定装置であつて、単語バツフア1
0上の各単語の自立語とその発生順序とに注目
し、1つの自立語に附属語(助動詞や助詞)を附
加した文節を抽出し、各文節にiDナンバを附与
するようにするものである。その結果は図示文節
バツフア12に格納される。図示の場合、「ルン
ゲ・クツタ―法―によつて」なるiDナンバ「1」
文節と、「積分―す―る」なるiDナンバ「2」文
節とが抽出されている。
13は係り受け解析装置であつて、上記文節バ
ツフア12の内容にもとづいて、図示文法的接続
検定装置14や意味的接続検定装置15を利用
し、文節(iDナンバ「1」)と文節(iDナンバ
「2」)との間の係り受け関係を解析する。そして
その結果は文節係り受け表バツフア16にセツト
され、係り受け先文節情報iD′が附与される。
17は意味記号抽出装置であつて、文節係り受
け表バツフア16にセツトされた各文節につい
て、当該文節内の単語であつて意味情報をもつも
のを抽出すると共に、上記係り受け先文節情報
iD′を利用して、検索名情報6を抽出する。
以下各装置について更に具体的に説明してゆ
く。
単語分割装置7は、問い合わせ情報バツフア1
の内容を例えば「読み」に分解する。即ち漢字コ
ードが含まれていても、日本語辞書8を漢字コー
ドにて索引した上で仮名コードに分解する。そし
て、日本語辞書8にもとづいて最尤度評価法を用
いて単語にまとめ、問い合わせ情報を単語単位に
分割する。また得られた単語間の接続検定を、単
語間接続検定装置9を用いて検定する。
なお、上記日本語辞書8やその索引態様に関し
ては、本出願人に出願した特願昭54−172472号
「読みおよび書きによる単語検定方式」や、特願
昭54−172474号「漢字仮名変換装置」に開示され
るものを利用できる。また上記最尤度評価法に関
しては、特願昭54−92271号「カナ漢字変換装置」
に開示されたものを利用でき、更に単語間接続検
定に関しては、特願昭54−92270号「単語間接続
検定装置」に開示されるものを利用できる。
上述の如くして、単語分割装置7は、単語バツ
フア10上に、問い合わせ情報を分割した単語を
セツトする。なお、当該単語についての文法情報
や意味情報は、日本語辞書8内に単語と一緒に格
納されていると考えてよく、文法情報は図示の文
法的接続検定装置14において利用し、意味情報
は図示の意味的接続検定装置15において利用す
る。更に言えば図示「法」については単独で
METHODを意味する「法」と例えば「ルンゲ・
クツタ法」としての用法の如く他の名詞と一体と
なつて意味をもつ「法」とが存在するが、上記意
味情報はこれらの間を区別するものと考えてよ
い。
文節認定装置11は、上述如く自立語を含む文
節にまとめかつiDナンバを附与するものであり、
単語バツフア10上の単語と単語の発生順とにも
とづいて、文法情報を利用して文節にまとめ上げ
る。
係り受け解析装置13は、文節バツフア12内
の各単語について、文法的接続検定装置14と意
味的接続検定装置15とを利用する。文法的接続
検定装置14は文法的な接続関係の可否を表わす
テーブルそなえている。例えば図示の如く名詞は
格助詞によつて後続されることが許され、サ変名
詞はサ変語尾によつて後続されることが許され、
格助詞はサ変名詞によつて後続することが許され
るなどがテーブル上に記述されている。このこと
から、iDナンバ「1」の文節の末尾「によつて」
(格助詞)は、iDナンバ「2」の文節の先頭「積
分」(サ変名詞))によつて後続することが許され
ていることが判る。また意味的接続検定装置15
は、上述の「ルンゲ・クツタ」と「法」との接続
関係を検定するものである。文法的接続検定装置
14と同様に意味的接続の可否を示すテーブルを
そなえている。図示の場合、「ルンゲ・クツク」
(意味情報「100」)は、METHODの意味をもつ
「法」(意味情報「300」)によつて後続されること
が禁止されており、上記「法」は意味情報「200」
をもつ「法」であつて、「ルンゲ・クツタ法」と
してまとまることをチエツクする。
なお、意味的接続検定に関しては、本出願人が
先に出願した特願昭56−102636号「意味関係格納
方式」に開示されるものを利用でき、また係り受
け解析装置に関しては特願昭56−102634号「日本
語解析システム」に開示されるものを利用でき
る。
係り受け解析装置13は、上記の如くして、文
節相互間の係り受けを調べ、文節係り受け表バツ
フア16に係り受け関係をセツトする。次いで意
味記号抽出装置17は、バツフア16内のiDナ
ンバ「1」をもつ文節中の単語であつて意味情報
をもつものについての意味情報 RUNGE KUTTA <BY MEANS OF> と、iDナンバ「2」をもつ文節中のそれ 「iNTEGRAL」 とを抽出し、日本語の配列関係を予め定めた形の
配列関係に変換して、検索名情報6を得る。
以上の如く処理されるので、第2図図示の問い
合わせ情報1―2が入力されたとしても、検索名
情報6の段階においては、全く同じものとなる。
第4図は、問い合わせ情報として例えば「昇順
にリストをソートする」の如き情報が入力された
場合の態様を説明する説明図を示している。
図中の符号1,2,3,6,16,17は第3
図に対応しており、鎖線で囲つた範囲のものは第
3図図示の符号7ないし15の部分に対応してい
る。
上記問い合わせ情報1―3の場合には、自立語
が3個存在する。そして、iDナンバ「1」と
「2」とをもつ文節は夫々情報iD′として示す如く
iDナンバ「3」をもつ文節に係ることが判る。
意味記号抽出装置17は、これにもとづいて、 「SORTiNG<BY>iNCREASiNG ORDER」 と 「SORTiNG<OBTECT>LiST」 との2つの情報を抽出し、両者をアンドで結合し
た形で検索装置2に通知する。
以上説明した如く、本発明によれば、問い合わ
せ情報における表現上の差異は吸収されてしま
い、検索装置に対して、所望の検索名情報を供給
することができる。
【図面の簡単な説明】
第1図は検索システムの一般的な態様を説明す
る説明図、第2図は本発明による検索システムの
概念説明図、第3図は本発明の一実施例構成、第
4図は第3図図示の場合と異なつた形の問い合わ
せ情報が与えられたときの説明図を示している。 図中、1は問い合わせ情報、2は検索装置、3
はデータ・ベース、5は検索名作成装置、6は検
索名情報、7は単語分割装置、8は日本語辞書、
9は単語間接続検定装置、10は単語バツフア、
11は文節認定装置、12は文節バツフア、13
は係り受け解析装置、14は文法的接続検定装
置、15は意味的接続検定装置、16は文節係り
受け表バツフア、17は意味記号抽出装置を表わ
す。

Claims (1)

    【特許請求の範囲】
  1. 1 複数の名詞または名詞句相互間の係り受け関
    係を附加された形で名称が与えられている複数個
    の検索対象物を格納してなる検索対象物データ・
    ベースをそなえると共に、該検索対象物データ・
    ベースをアクセスする検索装置をそなえ、該検索
    装置に対して上記検索対象物の名称を指示して検
    索を行なう検索システムにおいて、日本語にて与
    えられた問い合わせ情報にもとづいて当該問い合
    わせ情報を日本語辞書を索引して単語単位に分割
    すると共に単語接続検定を行なう単語分割装置、
    該単語分割装置によつて分割された単語中の自立
    語を選択し当該自立語に対して附属語を附加した
    文節を認定する文節認定装置、単語または文節の
    文法的な接続関係の可否を表わすテーブルを有す
    る文法的接続検定装置、単一の単語または文節に
    関して意味上から複数の接続関係が存在する場合
    に当該意味上の接続の可否を表わすテーブルを有
    する意味的接続検定装置、上記文節認定装置によ
    つて得られた各文節相互に対して上記文法的接続
    検定装置と上記意味的接続検定装置とを用いて係
    り受け関係を解析して係り受け先文節情報を附与
    する係り受け解析装置、および該係り受け解析装
    置によつて得られた文節相互間の係り受け情報を
    参照しつつ文節中の自立語に対応する意味記号を
    文節にまたがつて関係づける意味記号抽出装置を
    そなえ、上記与えられた問い合わせ情報を、自立
    語相互間の係り受け関係を明確にした検索対象物
    の名称に変換した上で、検索を行なうようにした
    ことを特徴とする日本語による検索システム。
JP56154502A 1981-09-29 1981-09-29 日本語による検索システム Granted JPS5856071A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56154502A JPS5856071A (ja) 1981-09-29 1981-09-29 日本語による検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56154502A JPS5856071A (ja) 1981-09-29 1981-09-29 日本語による検索システム

Publications (2)

Publication Number Publication Date
JPS5856071A JPS5856071A (ja) 1983-04-02
JPH0215904B2 true JPH0215904B2 (ja) 1990-04-13

Family

ID=15585638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56154502A Granted JPS5856071A (ja) 1981-09-29 1981-09-29 日本語による検索システム

Country Status (1)

Country Link
JP (1) JPS5856071A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07244673A (ja) * 1994-03-04 1995-09-19 Fujitsu Ltd 文書索引作成システム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59223853A (ja) * 1983-06-03 1984-12-15 Hitachi Ltd コマンド情報抽出装置
JPS60181923A (ja) * 1984-02-29 1985-09-17 Fujitsu Ltd デ−タベ−ス検索方式
JPS60247756A (ja) * 1984-05-23 1985-12-07 Matsushita Electric Ind Co Ltd デ−タベ−ス装置
JP2997469B2 (ja) * 1988-01-11 2000-01-11 株式会社日立製作所 自然言語理解方法および情報検索装置
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07244673A (ja) * 1994-03-04 1995-09-19 Fujitsu Ltd 文書索引作成システム

Also Published As

Publication number Publication date
JPS5856071A (ja) 1983-04-02

Similar Documents

Publication Publication Date Title
US5680628A (en) Method and apparatus for automated search and retrieval process
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US7970600B2 (en) Using a first natural language parser to train a second parser
EP0992919B1 (en) Apparatus and method for processing natural language
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US20060031207A1 (en) Content search in complex language, such as Japanese
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPS63231674A (ja) コンピュータによる形態論的テキスト解析方法
EP1145141A2 (en) Spelling and grammar checking system
JP2000507008A (ja) テキスト・ベース型情報ソースのコレクションの中の情報を捜し出すためのシステム、ソフトウエア及び方法
US20040128292A1 (en) Search data management
JPH0215904B2 (ja)
Jaruskulchai An automatic indexing for Thai text retrieval
JP2632806B2 (ja) 言語解析装置
Besançon et al. The LIC2M's CLEF 2003 System.
JPH07244669A (ja) 文書検索方式
Galicia-Haro Using electronic texts for an annotated corpus building
JPH1074207A (ja) 情報検索装置及び情報検索方法
KR102338949B1 (ko) 기술문서 번역 지원 시스템
Müller NooJ as a concordancer in computer-assisted textual analysis. The case of the German module
Vydiswaran et al. Finding related entities by retrieving relations: UIUC at TREC 2009 entity track
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
Semmar et al. Using a stemmer in a natural language processing system to treat Arabic for cross-language information retrieval
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JP3093759B2 (ja) 日本語解析装置