JPWO2008029881A1 - 自然言語処理システムおよび辞書登録システム - Google Patents
自然言語処理システムおよび辞書登録システム Download PDFInfo
- Publication number
- JPWO2008029881A1 JPWO2008029881A1 JP2008533198A JP2008533198A JPWO2008029881A1 JP WO2008029881 A1 JPWO2008029881 A1 JP WO2008029881A1 JP 2008533198 A JP2008533198 A JP 2008533198A JP 2008533198 A JP2008533198 A JP 2008533198A JP WO2008029881 A1 JPWO2008029881 A1 JP WO2008029881A1
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- data
- input
- dictionary data
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003058 natural language processing Methods 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 84
- 238000012545 processing Methods 0.000 claims abstract description 57
- 230000008569 process Effects 0.000 claims abstract description 50
- 230000006870 function Effects 0.000 claims description 27
- 238000013519 translation Methods 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 14
- 235000016496 Panda oleosa Nutrition 0.000 claims description 9
- 240000000220 Panda oleosa Species 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 9
- 108090000623 proteins and genes Proteins 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/49—Data-driven translation using very large corpora, e.g. the web
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
例えば非特許文献1には最新の辞書や個々のユーザが作成したユーザ辞書を専用のウェブページ上で公開し、各ユーザにこれを活用させる方法が記載されている。ただしこの方法では、個々のユーザは該ホームページを常に監視していない限り、自分にとって有用な辞書が公開されているかどうかを即座に知ることができないという問題があった。
また第2の問題点は、従来の方法においては個々のユーザに随時、登録すべき辞書データを通知して利用するかどうかを問い合わせるが、これがユーザの行動を阻害することである。その理由は、従来の方法における通知、問い合わせが、それを受ける側のユーザの都合を考慮せずに行なわれているためである。
本発明の他の目的は、ユーザの行動を阻害せずに辞書データの要不要を通知、問い合わせすることができる自然言語処理システムを提供することにある。
図1を参照すると、自然言語処理システム10は、キーボードやマイク等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ディスプレイ装置や印刷装置、スピーカ等の出力装置4とを含む。
自然言語処理手段21は、ユーザからの入力を受け付け、その入力データに対して辞書記憶部31に格納されているそのユーザの辞書を利用して自然言語処理を施し、処理の結果を出力する。ここで自然言語処理手段21の行なう自然言語処理は例えば、機械翻訳処理や音声合成処理である。ここで機械翻訳処理は入力された第一の言語の文字列を第二の言語の文字列に変換する処理であり、音声合成処理は入力された文字列を音声信号に変換する処理である。また自然言語処理手段21は入力データに対して自然言語処理を施す前に、その入力データを判定手段22に出力する。なお自然言語処理手段21が未知語検出機能を備えるようにし、入力データを常に判定手段22に出力するのではなく、入力データ内に未知語が発見された場合に限って判定手段22に入力データが出力され、判定手段22が動作する形態を取っても良い。
まず自然言語処理手段21は入力装置1から入力を受け付けると、自然言語処理を実行する前に入力された入力データを判定手段22に出力する。判定手段22は、自然言語処理手段21から入力データを受け付けると、登録候補記憶部32から登録候補辞書データを取り出す(図2のステップA1)。
本実施の形態では、ユーザが自然言語処理手段21に入力した入力データに登録すべき辞書データに対応する単語が含まれる場合に限って、その辞書データに関する通知、問い合わせを行なうように構成されている。
このため、ユーザは利用が見込まれる辞書データに対してのみ自分の入力した入力データの文脈に沿って有用性を判断することができ、その要不要の判断を容易に下せるようになる。またユーザは自分が入力した入力データに対して自然言語処理を施す一連の作業の中でその辞書データの要不要を判断することができ、行動を阻害されずに辞書データの要不要を判断することができるようになる。
入力装置1から入力される入力データは、自然言語処理の対象となるデータではなく、辞書登録処理のために予め用意された文章等のデータである。
また、出力装置4は、対応辞書データの登録可否問い合わせとそれに対する応答の入力にのみ用いられる。
図4を参照すると、コンピュータシステム12は、本発明の第1の実施の形態と同様に、入力装置1、データ処理装置6、記憶装置3、出力装置4を備える。
自然言語処理用プログラム5は、データ処理装置6に読み込まれデータ処理装置6の動作を制御し、記憶装置3に辞書記憶部31と登録候補記憶部32を生成する。データ処理装置6は自然言語処理用検索プログラム5の制御により第1の実施の形態におけるデータ処理装置2による処理と同一の処理を実行する。
また、自然言語登録処理プログラム5の代わりに辞書登録処理プログラム7をデータ処理装置6に読み込み、第2の実施形態におけるデータ処理装置2による処理と同一の処理を実行するようにしてもよい。
本実施例は、入力装置1としてキーボードを、データ処理装置2としてパーソナルコンピュータを、データ記憶装置3として磁気ディスク記録装置を、出力装置4としてディスプレイを備えている。
中央演算装置は、入力データに対して機械翻訳処理を施す前に、登録候補記憶部32から登録候補となる辞書データを取り出し、その内容を検査する。例えば図5で示される登録候補記憶部32から辞書データを取り出し、登録対象外の欄を検査することで「遺伝子診断」の辞書データは登録対象外であり、「ジーン」と「トランスポゾン」の辞書データが未検査の登録候補であることを確認する。
そのため、ユーザが個々の辞書データに対する要不要の判断を容易に下すことができる。
また、ユーザは自分が入力した入力データに対して自然言語処理を施す一連の作業の中でその辞書データの要不要を判断することができるようになるから、ユーザの行動を阻害せずに辞書データの要不要を通知、問い合わせすることができる。
上記の実施形態例の自然言語処理システムによれば、入力データに未知語が存在するという致命的な場合に限って、その入力データに存在する対応する単語に関する通知、問い合わせを行なうため、ユーザはより少ない問い合わせに応じるだけで未知語に対する辞書登録の効果を最大限に得ることができる。
そのため、ユーザが個々の辞書データに対する要不要の判断を容易に下すことができる。
上記の辞書登録システムによれば、入力データに未知語が存在するという致命的な場合に限って、その入力データに存在する対応する単語に関する通知、問い合わせを行なうため、ユーザはより少ない問い合わせに応じるだけで未知語に対する辞書登録の効果を最大限に得ることができる。
そのため、ユーザが個々の辞書データに対する要不要の判断を容易に下すことができる。
また、ユーザは自分が入力した入力データに対して自然言語処理を施す一連の作業の中でその辞書データの要不要を判断することができるようになるから、ユーザの行動を阻害せずに辞書データの要不要を通知、問い合わせすることができる。
上記の実施形態例の自然言語処理方法によれば、入力データに未知語が存在するという致命的な場合に限って、その入力データに存在する対応する単語に関する通知、問い合わせを行なうため、ユーザはより少ない問い合わせに応じるだけで未知語に対する辞書登録の効果を最大限に得ることができる。
そのため、ユーザが個々の辞書データに対する要不要の判断を容易に下すことができる。
上記の実施形態例の辞書登録方法によれば、入力データに未知語が存在するという致命的な場合に限って、その入力データに存在する対応する単語に関する通知、問い合わせを行なうため、ユーザはより少ない問い合わせに応じるだけで未知語に対する辞書登録の効果を最大限に得ることができる。
そのため、ユーザが個々の辞書データに対する要不要の判断を容易に下すことができる。
また、ユーザは自分が入力した入力データに対して自然言語処理を施す一連の作業の中でその辞書データの要不要を判断することができるようになるから、ユーザの行動を阻害せずに辞書データの要不要を通知、問い合わせすることができる。
上記の実施形態例の自然言語処理プログラムを記録した媒体によれば、入力データに未知語が存在するという致命的な場合に限って、その入力データに存在する対応する単語に関する通知、問い合わせを行なうため、ユーザはより少ない問い合わせに応じるだけで未知語に対する辞書登録の効果を最大限に得ることができる。
そのため、ユーザが個々の辞書データに対する要不要の判断を容易に下すことができる。
上記の実施形態例の辞書登録プログラムを記録した媒体によれば、入力データに未知語が存在するという致命的な場合に限って、その入力データに存在する対応する単語に関する通知、問い合わせを行なうため、ユーザはより少ない問い合わせに応じるだけで未知語に対する辞書登録の効果を最大限に得ることができる。
また、第2の効果は、ユーザの行動を阻害せずに辞書データの要不要を通知、問い合わせすることができることにある。その理由は、ユーザが自然言語処理手段に入力した入力データに登録すべき辞書データが含まれる場合に限って通知、問い合わせを行なうためである。これにより、ユーザは自分が入力した入力データに対して自然言語処理を施す一連の作業の中でその辞書データの要不要を判断することができるようになるためである。
なお、実施例ではユーザが自然言語処理の対象とするデータを入力することで動作を開始する例を示したが、例えば将来的に自然言語処理の対象とする可能性がある文書のように、直接自然言語処理の対象としないデータの入力によって動作を開始する構成を取ることで、自然言語処理で用いる辞書の作成を支援する辞書作成支援装置をコンピュータに実現するためのプログラムといった用途にも適用できる。さらには例えば、将来的に自然言語処理の結果として得られるべき文書を入力することによって動作を開始し、この入力データと辞書データに自然言語処理の結果として格納された文字列とを比較して前記入力データに含まれる辞書データが存在するかどうかを判定する構成を取ることで、例えば機械翻訳処理や仮名漢字変換処理や音声認識処理といった自然言語処理で用いる辞書の作成を支援する辞書作成支援装置をコンピュータに実現するためのプログラムといった用途にも適用できる。
Claims (30)
- 入力データに自然言語処理を施す自然言語処理システムにおいて、
登録候補辞書データを記憶する登録候補記憶部(32)と、
前記入力データと前記登録候補辞書データとを比較し、前記入力データに前記登録候補辞書データに対応する単語が存在するかどうかを判定する判定手段(22)と、
前記判定手段で前記対応する単語が存在すると判定された場合に前記登録候補辞書データを辞書記憶部(31)に登録するかどうかをユーザに問い合わせて前記ユーザの指示を受け付ける問い合わせ手段(23)と、
前記問い合わせ手段へ入力された指示に従って前記登録候補辞書データを前記辞書記憶部に登録する辞書登録手段(24)と、
前記辞書記憶部に登録された辞書データを用いて前記入力データに自然言語処理を施す自然言語処理手段(21)とを備えることを特徴とする自然言語処理システム。 - 前記自然言語処理手段(21)が前記入力データに含まれている未知語を検出する未知語検出機能を備え、
前記自然言語処理手段が前記入力データに含まれている未知語を検出した場合に、前記判定手段(22)が作動することを特徴とする請求項1に記載の自然言語処理システム。 - 前記自然言語処理手段(21)が前記入力データに含まれている未知語を検出した場合に、前記判定手段(22)が前記入力データの未知語を含む部分と前記登録候補辞書データとを比較し、前記未知語を含む部分に前記対応する単語が存在するかどうかを判定することを特徴とする請求項2に記載の自然言語処理システム。
- 前記自然言語処理手段(21)は、前記辞書記憶部(31)に登録された辞書データのみを用いて前記入力データに自然言語処理を施すことを特徴とする請求項1ないし請求項3のいずれかひとつに記載の自然言語処理システム。
- 前記自然言語処理手段(21)が、第一の言語の文字列を第二の言語の文字列に変換する機械翻訳手段、および/または、入力された文字列を音声信号に変換する音声合成手段を含むことを特徴とする請求項1ないし請求項4のいずれかひとつに記載の自然言語処理システム。
- 登録候補辞書データを記憶する登録候補記憶部(32)と、
入力データと前記登録候補辞書データとを比較し、前記入力データに前記登録候補辞書データに対応する単語が存在するかどうかを判定する判定手段(22)と、
前記判定手段で前記対応する単語が存在すると判定された場合に前記登録候補辞書データを辞書記憶部(31)に登録するかどうかをユーザに問い合わせて前記ユーザの指示を受け付ける問い合わせ手段(23)と、
前記問い合わせ手段へ入力された指示に従って前記登録候補辞書データを前記辞書記憶部に登録する辞書登録手段(24)とを備えることを特徴とする辞書登録システム。 - 前記入力データに含まれている未知語を検出する未知語検出手段(25)を更に備え、
前記未知語検出手段が前記入力データに含まれている未知語を検出した場合に、前記判定手段(22)が作動することを特徴とする請求項6記載の辞書登録システム。 - 前記未知語検出手段(25)が前記入力データに含まれている未知語を検出した場合に、前記判定手段(22)が前記入力データの未知語を含む部分と前記登録候補辞書データとを比較し、前記未知語を含む部分に前記対応する単語が存在するかどうかを判定することを特徴とする請求項7に記載の辞書登録システム。
- 前記辞書データが、入力された第一の言語の文字列を第二の言語の文字列に変換する機械翻訳処理で利用される辞書データ、および/または、入力された文字列を音声信号に変換する音声合成処理で利用される辞書データを含むことを特徴とする請求項6ないし請求項8のいずれかひとつに記載の辞書登録システム。
- 前記辞書データが、入力された第一の言語の文字列を第二の言語の文字列に変換する機械翻訳処理で利用される辞書データ、入力された仮名文字列を漢字仮名混じり文字列に変換する仮名漢字変換処理で利用される辞書データ、および/または、入力された音声信号を文字列に変換する音声認識処理で利用される辞書データを含み、
前記判定手段(22)が前記入力データと前記登録候補辞書データとを比較する際には、前記入力データと前記登録候補記憶部(31)に変換結果として格納された登録候補データの文字列とを比較し、前記対応する単語が存在するかどうかを判定することを特徴とする請求項6ないし請求項8のいずれかひとつに記載の辞書登録システム。 - 入力データと記憶装置に記憶されている登録候補辞書データとを比較し、前記入力データに前記登録候補辞書データに対応する単語が存在するかどうかを判定し、
前記対応する単語が存在すると判定された場合に前記登録候補辞書データを辞書に登録するかどうかをユーザに問い合わせて前記ユーザの指示を受け付け、
入力された指示に従って前記登録候補辞書データを前記辞書に登録し、
前記辞書に登録された辞書データを用いて前記入力データに自然言語処理を施すことを特徴とする自然言語処理方法。 - 前記入力データに未知語が含まれているかどうかを判定し、
前記入力データに未知語が含まれていると判定した場合に、前記入力データと前記登録候補辞書データとを比較し、前記入力データに前記対応する単語が存在するかどうかを判定することを特徴とする請求項11記載の自然言語処理方法。 - 前記入力データに未知語が含まれていると判定した場合に、前記入力データの未知語を含む部分と前記登録候補辞書データとを比較し、前記未知語を含む部分に前記対応する単語が存在するかどうかを判定することを特徴とする請求項12記載の自然言語処理方法。
- 前記自然言語処理では、前記辞書に登録された辞書データのみを用いることを特徴とする請求項11ないし請求項13のいずれかひとつに記載の自然言語処理方法。
- 前記自然言語処理が、第一の言語の文字列を第二の言語の文字列に変換する機械翻訳処理、および/または、入力された文字列を音声信号に変換する音声合成処理を含むことを特徴とする請求項11ないし請求項14のいずれかひとつに記載の自然言語処理方法。
- 入力データと記憶装置に記憶されている登録候補辞書データとを比較し、前記入力データに前記登録候補辞書データに対応する単語が存在するかどうかを判定し、
前記対応する単語が存在すると判定された場合に前記登録候補辞書データ対応辞書データを辞書に登録するかどうかをユーザに問い合わせて前記ユーザの指示を受け付け、
入力された指示に従って前記登録候補辞書データを前記辞書に登録することを特徴とする辞書登録方法。 - 前記入力データに未知語が含まれているかどうかを判定し、
前記入力データに未知語が含まれていると判定した場合に、前記入力データと前記登録候補辞書データとを比較し、前記入力データに前記対応する単語が存在するかどうかを判定することを特徴とする請求項16記載の辞書登録方法。 - 前記入力データに未知語が含まれていると判定した場合に、前記入力データの未知語を含む部分と前記登録候補辞書データとを比較し、前記未知語を含む部分に前記対応する単語が存在するかどうかを判定することを特徴とする請求項17記載の辞書登録方法。
- 前記辞書データが、入力された第一の言語の文字列を第二の言語の文字列に変換する機械翻訳処理で利用される辞書データ、および/または、入力された文字列を音声信号に変換する音声合成処理で利用される辞書データを含むことを特徴とする請求項16ないし請求項18のいずれかひとつに記載の辞書登録方法。
- 前記辞書データが、入力された第一の言語の文字列を第二の言語の文字列に変換する機械翻訳処理で利用される辞書データ、入力された仮名文字列を漢字仮名混じり文字列に変換する仮名漢字変換処理で利用される辞書データで、および/または、入力された音声信号を文字列に変換する音声認識処理で利用される辞書データを含み、
前記入力データと前記登録候補辞書データとを比較する際には、前記入力データと前記登録候補辞書データに変換結果として格納された文字列とを比較し、前記対応する単語が存在するかどうかを判定することを特徴とする請求項16ないし請求項18のいずれかひとつに記載の辞書登録方法。 - 制御演算装置(CPU)を作動させる、コンピュータ読込み可能なコンピュータ・プログラムで符号化された記録媒体であって、前記CPUに、
登録候補辞書データを記憶装置に記憶する処理と、
前記入力データと前記登録候補辞書データとを比較し、前記入力データに前記登録候補辞書データに対応する単語が存在するかどうかを判定する処理と、
前記判定処理で前記対応する単語が存在すると判定された場合に前記登録候補辞書データを辞書に登録するかどうかをユーザに問い合わせて前記ユーザの指示を受け付ける処理と、
前記問い合わせ手段処理で入力された指示に従って前記登録候補辞書データを前記辞書に登録する処理と、
前記辞書に登録された辞書データを用いて前記入力データに自然言語処理を施す処理とを実行させることを特徴とする媒体。 - 前記自然言語処理が、前記入力データに未知語が含まれているかどうかを判定する処理を含み、
前記自然言語処理が前記入力データに未知語が含まれていると判定した場合に、前記判定処理を前記コンピュータに実行させることを特徴とする請求項21記載の媒体。 - 前記自然言語処理が前記入力データに前記未知語が含まれていると判定した場合に、前記判定処理が前記入力データの未知語を含む部分と前記登録候補辞書データとを比較し、前記未知語を含む部分に前記対応する単語が存在するかどうかを判定することを特徴とする請求項22に記載の媒体。
- 前記自然言語処理は、前記辞書に登録された辞書データのみを用いて前記入力データに自然言語処理を施すことを特徴とする請求項21ないし請求項23のいずれかひとつに記載の媒体。
- 前記自然言語処理が、第一の言語の文字列を第二の言語の文字列に変換する機械翻訳機能、および/または、入力された文字列を音声信号に変換する音声合成機能を含むことを特徴とする請求項21ないし請求項24のいずれかひとつに記載の媒体。
- 制御演算装置(CPU)を作動させる、コンピュータ読込み可能なコンピュータ・プログラムで符号化された記録媒体であって、前記CPUに、
登録候補辞書データを記憶する処理と、
入力データと前記登録候補辞書データとを比較し、前記入力データに前記登録候補辞書データに対応する単語が存在するかどうかを判定する処理と、
前記判定処理で、前記対応する単語が存在すると判定された場合に前記登録候補辞書データを辞書に登録するかどうかをユーザに問い合わせて前記ユーザの指示を受け付ける処理と、
前記問い合わせ処理で入力された指示に従って前記登録候補辞書データを前記辞書に登録する処理とを実行させることを特徴とする媒体。 - 前記コンピュータに、前記入力データに未知語が含まれているかどうかを判定する処理を更に実行させ、
前記未知語検出処理が前記入力データに含まれている未知語を検出した場合に、前記判定処理を前記コンピュータに実行させることを特徴とする請求項26に記載の媒体。 - 前記未知語検出処理が前記入力データに含まれている未知語を検出した場合に、前記判定処理が前記入力データの未知語を含む部分と前記登録候補辞書データとを比較し、前記未知語を含む部分に前記対応する単語が存在するかどうかを判定することを特徴とする請求項27に記載の媒体。
- 前記辞書データが、入力された第一の言語の文字列を第二の言語の文字列に変換する機械翻訳機能で利用される辞書データ、および/または、入力された文字列を音声信号に変換する音声合成機能で利用される辞書データを含むことを特徴とする請求項26ないし請求項28のいずれかひとつに記載の媒体。
- 前記辞書データが、入力された第一の言語の文字列を第二の言語の文字列に変換する機械翻訳機能で利用される辞書データ、入力された仮名文字列を漢字仮名混じり文字列に変換する仮名漢字変換機能で利用される辞書データ、および/または、入力された音声信号を文字列に変換する音声認識機能で利用される辞書データを含み、
前記判定処理が前記入力データと前記登録候補辞書データとを比較する際には、前記入力データと前記登録候補辞書データに変換結果として格納された文字列とを比較し、前記対応する単語が存在するかどうかを判定することを特徴とする請求項26ないし請求項28のいずれかひとつに記載の媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008533198A JP5239863B2 (ja) | 2006-09-07 | 2007-09-06 | 自然言語処理システムおよび辞書登録システム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006242519 | 2006-09-07 | ||
JP2006242519 | 2006-09-07 | ||
PCT/JP2007/067416 WO2008029881A1 (fr) | 2006-09-07 | 2007-09-06 | Système de traitement du langage naturel et système d'enregistrement de dictionnaire |
JP2008533198A JP5239863B2 (ja) | 2006-09-07 | 2007-09-06 | 自然言語処理システムおよび辞書登録システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008029881A1 true JPWO2008029881A1 (ja) | 2010-01-21 |
JP5239863B2 JP5239863B2 (ja) | 2013-07-17 |
Family
ID=39157306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008533198A Active JP5239863B2 (ja) | 2006-09-07 | 2007-09-06 | 自然言語処理システムおよび辞書登録システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9575953B2 (ja) |
JP (1) | JP5239863B2 (ja) |
CN (1) | CN101512518B (ja) |
WO (1) | WO2008029881A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9575953B2 (en) * | 2006-09-07 | 2017-02-21 | Nec Corporation | Natural-language processing system and dictionary registration system |
JP2009099056A (ja) * | 2007-10-18 | 2009-05-07 | Panasonic Corp | 文字列受信装置、文字列転送装置、文字列送受信システム、コンテンツ受信端末向けシステムlsi、名簿共有システム、名簿共有方法およびコンテンツ推薦方法 |
JP5335227B2 (ja) * | 2007-12-10 | 2013-11-06 | 京セラ株式会社 | 情報端末装置 |
KR101711941B1 (ko) * | 2012-12-14 | 2017-03-03 | 한국전자통신연구원 | 음성인식 시스템에서 유사도를 기반으로 한 비인식 대상 단어 생성 방법 |
JP2015060095A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
JP6447068B2 (ja) * | 2014-12-05 | 2019-01-09 | カシオ計算機株式会社 | 情報処理装置、情報表示方法及びプログラム |
KR102117082B1 (ko) | 2014-12-29 | 2020-05-29 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
KR102166446B1 (ko) * | 2018-09-28 | 2020-10-15 | 우석대학교 산학협력단 | 음성을 이용한 키워드 추출 방법 및 서버 |
US11250872B2 (en) * | 2019-12-14 | 2022-02-15 | International Business Machines Corporation | Using closed captions as parallel training data for customization of closed captioning systems |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5840684A (ja) * | 1981-09-04 | 1983-03-09 | Hitachi Ltd | 自然言語間の自動翻訳方式 |
GB2199170A (en) * | 1986-11-28 | 1988-06-29 | Sharp Kk | Translation apparatus |
JPH01234975A (ja) * | 1988-03-11 | 1989-09-20 | Internatl Business Mach Corp <Ibm> | 日本語文章分割装置 |
JP2836159B2 (ja) * | 1990-01-30 | 1998-12-14 | 株式会社日立製作所 | 同時通訳向き音声認識システムおよびその音声認識方法 |
JPH03268062A (ja) * | 1990-03-19 | 1991-11-28 | Fujitsu Ltd | 機械翻訳電子メール装置における私用単語の登録装置 |
JPH0594436A (ja) * | 1990-10-10 | 1993-04-16 | Fuji Xerox Co Ltd | 文書処理装置 |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
US5742834A (en) * | 1992-06-24 | 1998-04-21 | Canon Kabushiki Kaisha | Document processing apparatus using a synonym dictionary |
US5867812A (en) * | 1992-08-14 | 1999-02-02 | Fujitsu Limited | Registration apparatus for compound-word dictionary |
JPH06314274A (ja) * | 1993-04-28 | 1994-11-08 | Toshiba Corp | 文書作成装置及び文書情報入力方法 |
JP3408291B2 (ja) * | 1993-09-20 | 2003-05-19 | 株式会社東芝 | 辞書作成支援装置 |
JPH07175813A (ja) * | 1993-10-27 | 1995-07-14 | Ricoh Co Ltd | 複合通信処理装置 |
JPH07182465A (ja) * | 1993-12-22 | 1995-07-21 | Hitachi Ltd | 文字認識方法 |
TW274135B (ja) * | 1994-09-14 | 1996-04-11 | Hitachi Seisakusyo Kk | |
KR970701886A (ko) * | 1994-11-21 | 1997-04-12 | 다떼이시 요시오 | 복수의 클라이언트 장치에 공유되는 데이터베이스 시스템, 데이터 갱신방법 및 문자 처리장치에의 응용(Data base system shared by a plurality of client apparatuses, data updating method and application to character processor) |
JPH08167006A (ja) * | 1994-12-13 | 1996-06-25 | Canon Inc | 自然言語処理装置及びその方法 |
US5649221A (en) * | 1995-09-14 | 1997-07-15 | Crawford; H. Vance | Reverse electronic dictionary using synonyms to expand search capabilities |
JPH09114828A (ja) * | 1995-10-20 | 1997-05-02 | Sanyo Electric Co Ltd | 変換候補の優先順位情報の更新方法 |
JPH09161014A (ja) * | 1995-12-13 | 1997-06-20 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP3254642B2 (ja) * | 1996-01-11 | 2002-02-12 | 株式会社日立製作所 | 索引の表示方法 |
US6085162A (en) * | 1996-10-18 | 2000-07-04 | Gedanken Corporation | Translation system and method in which words are translated by a specialized dictionary and then a general dictionary |
JPH10198680A (ja) * | 1997-01-07 | 1998-07-31 | Hitachi Ltd | 分散辞書管理方法及びそれを用いた機械翻訳方法 |
US5924068A (en) * | 1997-02-04 | 1999-07-13 | Matsushita Electric Industrial Co. Ltd. | Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion |
JPH10260984A (ja) * | 1997-03-19 | 1998-09-29 | Toshiba Corp | 辞書管理方法および辞書管理装置および辞書利用システム |
JP3464881B2 (ja) | 1997-03-25 | 2003-11-10 | 株式会社東芝 | 辞書構築装置および方法 |
US6081774A (en) * | 1997-08-22 | 2000-06-27 | Novell, Inc. | Natural language information retrieval system and method |
US6507678B2 (en) * | 1998-06-19 | 2003-01-14 | Fujitsu Limited | Apparatus and method for retrieving character string based on classification of character |
US6401060B1 (en) * | 1998-06-25 | 2002-06-04 | Microsoft Corporation | Method for typographical detection and replacement in Japanese text |
US7254531B2 (en) * | 2000-09-05 | 2007-08-07 | Nir Einat H | In-context analysis and automatic translation |
JP2002108858A (ja) * | 2000-09-20 | 2002-04-12 | Internatl Business Mach Corp <Ibm> | 機械翻訳方法、機械翻訳装置および記録媒体 |
US6973427B2 (en) * | 2000-12-26 | 2005-12-06 | Microsoft Corporation | Method for adding phonetic descriptions to a speech recognition lexicon |
US7254530B2 (en) * | 2001-09-26 | 2007-08-07 | The Trustees Of Columbia University In The City Of New York | System and method of generating dictionary entries |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
JP3838904B2 (ja) | 2001-11-22 | 2006-10-25 | 沖電気工業株式会社 | 辞書装置及び自然言語処理システム |
JP4650920B2 (ja) * | 2002-04-16 | 2011-03-16 | 富士通株式会社 | 情報処理装置及び情報処理プログラム |
KR100530154B1 (ko) * | 2002-06-07 | 2005-11-21 | 인터내셔널 비지네스 머신즈 코포레이션 | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 |
US7016895B2 (en) * | 2002-07-05 | 2006-03-21 | Word Data Corp. | Text-classification system and method |
US7548863B2 (en) * | 2002-08-06 | 2009-06-16 | Apple Inc. | Adaptive context sensitive analysis |
JP4355138B2 (ja) * | 2002-12-13 | 2009-10-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 翻訳サーバ、コラボレーションサーバ及びプログラム |
US7437296B2 (en) * | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
US20070174041A1 (en) * | 2003-05-01 | 2007-07-26 | Ryan Yeske | Method and system for concept generation and management |
CN100429648C (zh) * | 2003-05-28 | 2008-10-29 | 洛昆多股份公司 | 一种文本自动分块的方法、分块器和文本到语言合成系统 |
JP4652737B2 (ja) * | 2004-07-14 | 2011-03-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、 |
CN100568230C (zh) * | 2004-07-30 | 2009-12-09 | 国际商业机器公司 | 基于超文本的多语言网络信息搜索方法和系统 |
JP4570509B2 (ja) * | 2005-04-22 | 2010-10-27 | 富士通株式会社 | 読み生成装置、読み生成方法及びコンピュータプログラム |
JP2007033901A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
JP2007058509A (ja) * | 2005-08-24 | 2007-03-08 | Toshiba Corp | 言語処理システム |
JP2007206975A (ja) * | 2006-02-01 | 2007-08-16 | Toshiba Corp | 言語情報変換装置及びその方法 |
US7899664B2 (en) * | 2006-05-22 | 2011-03-01 | Sharp Kabushiki Kaisha | Information processing apparatus, computer, information processing system, information processing method, and program for receiving a character string and returning conversion candidates |
US9575953B2 (en) * | 2006-09-07 | 2017-02-21 | Nec Corporation | Natural-language processing system and dictionary registration system |
-
2007
- 2007-09-06 US US12/310,773 patent/US9575953B2/en active Active
- 2007-09-06 CN CN200780033343.6A patent/CN101512518B/zh active Active
- 2007-09-06 JP JP2008533198A patent/JP5239863B2/ja active Active
- 2007-09-06 WO PCT/JP2007/067416 patent/WO2008029881A1/ja active Search and Examination
Also Published As
Publication number | Publication date |
---|---|
US20090281786A1 (en) | 2009-11-12 |
CN101512518B (zh) | 2015-06-24 |
US9575953B2 (en) | 2017-02-21 |
JP5239863B2 (ja) | 2013-07-17 |
WO2008029881A1 (fr) | 2008-03-13 |
CN101512518A (zh) | 2009-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5239863B2 (ja) | 自然言語処理システムおよび辞書登録システム | |
JP4559946B2 (ja) | 入力装置、入力方法および入力プログラム | |
JP4058071B2 (ja) | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム | |
JP4416643B2 (ja) | マルチモーダル入力方法 | |
JP4050755B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム | |
JP2014010623A (ja) | 音声翻訳装置、方法およびプログラム | |
WO2019123854A1 (ja) | 翻訳装置、翻訳方法、及びプログラム | |
JP3689954B2 (ja) | 異種コード文字列転記装置および電子辞書 | |
JP2003271389A (ja) | 自然言語によるソフトウェア・オブジェクトの操作方法及びそのためのプログラム | |
JP2006065651A (ja) | 商標称呼検索プログラム、商標称呼検索装置及び商標称呼検索方法 | |
JP5169602B2 (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム | |
JP2010066365A (ja) | 音声認識装置、方法、及びプログラム | |
JP4643183B2 (ja) | 翻訳装置および翻訳プログラム | |
JP2000285112A (ja) | 予測入力装置及び予測入力方法並びに記録媒体 | |
JP4192142B2 (ja) | 辞書登録装置、辞書登録方法および辞書登録プログラム | |
JP2000242642A (ja) | 翻訳処理方法及び翻訳処理装置 | |
JP4300056B2 (ja) | 概念表現生成方法、プログラム、記憶媒体及び概念表現生成装置 | |
JP2015072701A (ja) | 翻訳装置、方法およびプログラム | |
JP2001014304A (ja) | 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体 | |
JP2010055506A (ja) | 音声翻訳装置および方法 | |
JP5298520B2 (ja) | 文字入力支援装置、文書作成プログラム及び文字入力支援方法 | |
JP2014110026A (ja) | 言語処理装置、言語処理方法、及びプログラム | |
JPH04116763A (ja) | 漢字読み変換方式 | |
JPH0981555A (ja) | 文書処理装置及びその方法 | |
JPS5840650A (ja) | 日本文入力方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100223 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5239863 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |