JP2002366543A - Document generation system - Google Patents

Document generation system

Info

Publication number
JP2002366543A
JP2002366543A JP2001170586A JP2001170586A JP2002366543A JP 2002366543 A JP2002366543 A JP 2002366543A JP 2001170586 A JP2001170586 A JP 2001170586A JP 2001170586 A JP2001170586 A JP 2001170586A JP 2002366543 A JP2002366543 A JP 2002366543A
Authority
JP
Japan
Prior art keywords
sentence
creation system
document creation
similar
important
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001170586A
Other languages
Japanese (ja)
Inventor
Yumi Wakita
由実 脇田
Hidetsugu Maekawa
英嗣 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001170586A priority Critical patent/JP2002366543A/en
Publication of JP2002366543A publication Critical patent/JP2002366543A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document generation system to enable generation of a document without taking much trouble and time in correction of erroneous recognition by voice input even without using a keyboard. SOLUTION: Important words are extracted from a sentence inputted by voice and an erroneously recognized important word is estimated from the relation between the important words. A standard sentence most similar to the inputted sentence is selected among previously prepared standard sentences by using the remaining important words except the estimated erroneously recognized important word and used by changing part of it, if necessary. When a plurality of standard sentences are selected, a user selects and uses the most proper sentence.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書作成システム
に関するものである。
[0001] The present invention relates to a document creation system.

【0002】[0002]

【従来の技術】以下、従来の文書作成システムを例にし
て説明する。
2. Description of the Related Art A conventional document creation system will be described below as an example.

【0003】近年、携帯機器や携帯電話にて文書を作成
する機能が頻繁に使用されている。多くの機器が小型の
キーボードやボタンを用いて文書を作成する仕様のもの
が多いが、キーボートが小さすぎたり、数少ないボタン
入力によるため、文書作成に非常な手間と時間がかかる
ことが問題となっている。
In recent years, a function for creating a document on a portable device or a portable telephone has been frequently used. Many devices are designed to create documents using small keyboards and buttons, but the keyboard is too small or only a few buttons need to be entered, which creates a problem in that it takes a lot of time and effort to create documents. ing.

【0004】この問題を緩和するために、予め準備して
いる定型文をボタンや十字キーにて検索し、キーボード
なしで文書を作成する機能が提案されている(特開平6
−216936号公報)。これは、予め頻繁に使用され
ると思われる文表現を準備しておき、ユーザは使用した
い文表現を選択する。たとえば、「1.○○に電話下さ
い」、「2.電話番号は ○○」、のような文表現が登
録されており、電話番号を知らせる文書を作成するとき
は「2.」の文表現を選択する。次に、選択された文の
一部を追加または修正して文書を作成する。例えば、
「電話番号は 012−3456」のように実際の電話
番号のみを入力して文を完成する。この機能によりボタ
ンや十字キーのみの入力手段で構成されている携帯機器
や携帯電話における文書作成の手間と時間が軽減され
た。
In order to alleviate this problem, there has been proposed a function of retrieving a prepared sentence using a button or a cross key, and creating a document without a keyboard (Japanese Patent Application Laid-Open No. Hei 6 (1999)).
-216936). In this method, a sentence expression that is considered to be frequently used is prepared in advance, and the user selects a sentence expression to be used. For example, sentence expressions such as “1. Please call XX” and “2. Phone number is XX” are registered, and when creating a document informing the telephone number, the sentence expression of “2.” is registered. Select Next, a document is created by adding or modifying a part of the selected sentence. For example,
Complete the sentence by entering only the actual phone number, such as "Phone number is 012-3456". This function has reduced the time and effort required to create a document in a mobile device or mobile phone that is composed of input means including only buttons and cross keys.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、頻繁に
使用される定型文が数多い場合には、定型文の選択自身
に手間がかかる。準備されている定型文が多い場合に
は、通常、「あいさつ文」、「ビジネス文」などのジャ
ンルに分けることにより、定型文を選択しやすい工夫が
なされてはいるが、入力したい文書のジャンルが一意的
に決められない場合などは、複数のジャンルに跨って文
表現を選択しなければならない場合も多い。
However, when there are many fixed phrases frequently used, it takes time to select the fixed phrases themselves. When there are many prepared sentences, it is usually divided into genres such as "greeting sentences" and "business sentences" to make it easier to select the fixed sentences. Is not uniquely determined, it is often necessary to select a sentence expression across a plurality of genres.

【0006】また、定型文の検索が容易に手早くできる
ように定型文数を限った場合には、所望の定型文が準備
されていない場合が多い、という問題を有している。
In addition, when the number of fixed phrases is limited so that a fixed phrase can be easily and quickly searched, a desired fixed phrase is often not prepared.

【0007】一方、キーボードで入力する手間を軽減す
るために、音声入力による文書作成法がパソコン用に提
案・実用化されているが、誤認識した場合のエディタ修
正に手間と時間がかかり、さらに手間がかかる携帯端末
でこれを用いるのは実用的ではない、という問題を有し
ている。
On the other hand, a method of creating a document by voice input has been proposed and put into practical use for a personal computer in order to reduce the trouble of inputting with a keyboard, but it takes time and effort to correct an editor when a recognition error occurs. There is a problem that it is not practical to use this in a mobile terminal that takes time.

【0008】本発明の目的は、以上の課題を解決し、作
成したい文に含まれる重要語を用いて、作成したい文と
同じまたは類似した文意を表す文章を検索し、検索され
た文または検索された文の一部を変更した文を出力する
ことにより、キーボードを用いなくても手間と時間をか
けずに文書作成を可能とする文書作成システムを提供す
るものである。また、重要語間の共起関係や依存関係を
用いて認識誤りを起こした単語を推定し、認識誤り部分
を除去してから文検索を行うことにより、音声入力によ
る誤認識修正に手間と時間を多くかけることなく、文書
作成を可能とする文書作成システムを提供するものであ
る。
SUMMARY OF THE INVENTION An object of the present invention is to solve the above problems and to search for a sentence having the same or similar meaning as a sentence to be created by using an important word included in a sentence to be created. It is an object of the present invention to provide a document creation system that can output a sentence in which a part of a searched sentence is changed, thereby making it possible to create a document without using a keyboard and without taking time and effort. In addition, by using co-occurrence relationships and dependencies between key words to estimate the word that caused a recognition error, and removing the recognition error part and then performing sentence search, it takes time and effort to correct erroneous recognition by voice input. The present invention provides a document creation system that enables a document to be created without using a large amount of data.

【0009】[0009]

【課題を解決するための手段】上述した課題を解決する
ために、第一の手段としての文書作成システムは、文か
ら重要語を抽出する重要語抽出部と、抽出された重要語
を用いて類似文を選択する類似用例選択部とから構成さ
れる。
Means for Solving the Problems In order to solve the above-mentioned problems, a document creation system as a first means uses an important word extracting section for extracting an important word from a sentence, and using the extracted important words. And a similar example selection unit for selecting a similar sentence.

【0010】上述した課題を解決するために、第二の手
段としての文書作成システムは、発声された文をテキス
ト化する音声認識部と、テキスト化された文から重要語
を抽出する重要語抽出部と、抽出された重要語を用いて
類似文を選択する類似用例選択部とから構成される。
[0010] In order to solve the above-mentioned problems, a document creation system as a second means includes a voice recognition unit for converting an uttered sentence into a text, and an important word extraction for extracting an important word from the converted text. And a similar example selection unit for selecting a similar sentence using the extracted important words.

【0011】上述した課題を解決するために、第三の手
段としての文書作成システムは、発声された文をテキス
ト化する音声認識部と、テキスト化された文から重要語
を抽出する重要語抽出部と、抽出された重要語の中から
誤認識した単語を推定する誤認識単語推定部と、推定さ
れた重要語以外の重要語のみを用いて類似した文意を表
す文を選択する類似用例選択部とから構成される。
[0011] In order to solve the above-mentioned problem, a document creation system as a third means includes a voice recognition unit for converting an uttered sentence into a text, and an important word extraction for extracting an important word from the textized sentence. Part, a misrecognized word estimator that estimates misrecognized words from the extracted important words, and a similarity example that selects a sentence that expresses similar sentence using only important words other than the estimated important words And a selection unit.

【0012】上述した課題を解決するために、第四の手
段としての文書作成システムは、発声された文をテキス
ト化する音声認識部と、テキスト化された文から重要語
を抽出する重要語抽出部と、抽出された重要語の依存関
係または共起関係を用いて誤認識した単語を推定する誤
認識単語推定部と、推定された重要語以外の重要語のみ
を用いて類似した文意を表す文を選択する類似用例選択
部とから構成される。
[0012] In order to solve the above-mentioned problems, a document creation system as a fourth means includes a voice recognition unit for converting an uttered sentence into a text, and an important word extraction for extracting an important word from the textized sentence. And a misrecognized word estimation unit that estimates misrecognized words using the dependencies or co-occurrence relationships of the extracted important words, and a similar sentence using only important words other than the estimated important words. And a similar example selecting unit for selecting a sentence to be represented.

【0013】上述した課題を解決するために、第五、第
六の手段としての文書作成システムは、類似文選択結果
を表示するためのディスプレーと、選択された類似文確
認修正するまたは複数個類似文が選択された際に最適な
類似文を選択するための、ボタンまたは数字キーまたは
十字キーとから構成される。
In order to solve the above-mentioned problems, a document creation system as a fifth and a sixth means includes a display for displaying a similar sentence selection result, and a display for confirming and correcting the selected similar sentence or a plurality of similar sentence selections. It is composed of buttons, numeric keys, or cross keys for selecting an optimal similar sentence when a sentence is selected.

【0014】上述した課題を解決するために、第七の手
段としての文書作成システムは、発声された文をテキス
ト化する音声認識部と、テキスト化された文から選択さ
れた単数または複数の類似文を表示するためのディスプ
レーと、選択された類似文確認修正するまたは複数個類
似文が選択された際に最適な類似文を選択するための、
ボタンまたは数字キーまたは十字キーとから構成され
る。
[0014] In order to solve the above-mentioned problem, a document creation system as a seventh means comprises a speech recognition unit for converting a spoken sentence into a text, and a singular or plural similarities selected from the text-formed sentence. A display for displaying a sentence, and a selected similar sentence for confirming and correcting the selected similar sentence or selecting an optimal similar sentence when a plurality of similar sentences are selected.
It consists of buttons, numeric keys, or cross keys.

【0015】上述した課題を解決するために、第八の手
段としての文書作成システムは、入力文から重要語を抽
出する重要語抽出部と、既に入力された重要語を保存し
ておく重要語用バッファと、重要語バッファに保持され
た重要語を用いて次に入力される文の分野を予測する次
発話予測部と、予測された分野にふさわしい類似文を選
択する分野選択部とから構成される。
In order to solve the above-described problem, a document creation system as an eighth means includes an important word extracting unit for extracting an important word from an input sentence, and an important word for storing an already input important word. Utterance buffer, a next utterance prediction unit for predicting the field of a sentence to be input next using the key words held in the key word buffer, and a field selection unit for selecting a similar sentence suitable for the predicted field. Is done.

【0016】次に、上記した各手段の動作を説明する。Next, the operation of each means described above will be described.

【0017】第一の手段としての文書作成システムにお
いては、作成したい文に含まれる重要語を用いて、作成
したい文と同じまたは類似した文意を表す文を検索し、
検索された文または検索された文の一部を変更した文を
出力することにより、重要語のみを入力することで作成
したい文を作成することが可能となるため、手間と時間
を多くかけることなく文書作成が可能となる。
In a document creation system as a first means, a sentence having the same or similar meaning as the sentence to be created is searched for using an important word included in the sentence to be created.
By outputting the searched sentence or a sentence in which a part of the searched sentence has been changed, it is possible to create the sentence you want to create by inputting only the important words. And a document can be created.

【0018】第二の手段としての文書作成システムは、
第一の手段としての文書作成システムの動作に加えて、
さらに、発声された文を音声認識にてテキスト化し、テ
キスト化された文を対象に類似文を検索することによ
り、重要語以外の部分が認識誤りを起こしたとしても、
所望の文書作成が可能となるために、さらに誤認識を修
正する手間と時間をかけることなく所望の文書作成が可
能となる。
A document creation system as a second means is as follows.
In addition to the operation of the document creation system as the first means,
Furthermore, by converting the spoken sentence into text by speech recognition and searching for a similar sentence from the text-sentence, even if a part other than the important word causes a recognition error,
Since a desired document can be created, the desired document can be created without taking the trouble and time required to correct erroneous recognition.

【0019】第三の手段としての文書作成システムは、
第二の手段としての文書作成システムの動作に加えて、
さらに、音声認識された文の中に含まれる重要語から、
誤認識されている重要語を推定し、推定された重要語以
外の重要語のみを用いて類似した文意を表す文を検索す
ることにより、重要語以外の部分及び一部の重要語が誤
認識を起こしても、さらに誤認識を修正する手間と時間
をかけることなく所望の文書作成が可能となる。
A document creation system as a third means is as follows.
In addition to the operation of the document creation system as a second means,
Furthermore, from the key words included in the speech-recognized sentences,
By estimating important words that have been misrecognized and searching for sentences that have similar meanings using only the important words other than the estimated important words, the parts other than the important words and some important words are mistaken. Even if recognition occurs, a desired document can be created without the trouble and time required to correct the misrecognition.

【0020】第四の手段としての文書作成システムは、
第三の手段としての誤認識単語推定動作において、音声
認識された文の中に含まれる重要語間の依存関係または
共起関係を用い、同じ文に含まれる他の重要語と左記の
関係が認められない重要語を誤認識単語であると推定す
ることにより、重要語以外の部分及び一部の重要語が誤
認識を起こしても、さらに誤認識を修正する手間と時間
をかけることなく所望の文書作成が可能となる。
A document creation system as a fourth means is as follows.
In the misrecognized word estimation operation as the third means, the relationship between other important words included in the same sentence and the left By estimating an unrecognized important word as a misrecognized word, even if a part other than the important word and some important words cause misrecognition, it can be performed without taking the time and effort to correct the misrecognition further. Documents can be created.

【0021】第五の手段としての文書作成システムは、
第一の手段としての動作において、類似文選択結果をデ
ィスプレーに表示し、ボタンまたは数字キーまたは十字
キーで選択された類似文を確認修正することにより、重
要語のみを入力することで作成したい文を作成すること
が可能となるため、手間と時間を多くかけることなく文
書作成が可能となる。
The document creation system as the fifth means is as follows.
In the first operation, the similar sentence selection result is displayed on the display, and the similar sentence selected with the button, the numeric keypad, or the cross key is checked and corrected, and the sentence to be created by inputting only the important words is displayed. , It is possible to create a document without taking much time and effort.

【0022】第六の手段としての文書作成システムは、
第一の手段としての動作において、類似文が複数個検索
された場合に、ボタンまたは数字キーまたは十字キーで
ユーザが最適な候補を選択することにより、重要語のみ
を入力することで作成したい文を作成することが可能と
なるため、手間と時間を多くかけることなく文書作成が
可能となる。
A document creation system as a sixth means is as follows.
In the operation as the first means, when a plurality of similar sentences are searched, a sentence that the user wants to create by inputting only the important words by selecting an optimal candidate with a button, a numeric key, or a cross key. , It is possible to create a document without taking much time and effort.

【0023】第七の手段としての文書作成システムは、
第二の手段としての動作において、音声入力で作成した
い文を入力し、類似文選択結果をディスプレーに表示
し、選択された類似文をボタンまたは数字キーまたは十
字キーで確認修正することにより、重要語以外の部分が
認識誤りを起こしたとしても、所望の文書作成が可能と
なるために、さらに誤認識を修正する手間と時間をかけ
ることなく所望の文書作成が可能となる。
A document creation system as a seventh means is as follows.
In the operation as the second means, by inputting the sentence to be created by voice input, displaying the similar sentence selection result on the display, confirming and correcting the selected similar sentence with the button, numeric key or cross key, it is important Even if a recognition error occurs in a part other than a word, a desired document can be created. Therefore, a desired document can be created without additional trouble and time for correcting the erroneous recognition.

【0024】第八の手段としての文書作成システムは、
第一の手段としての動作において、既に文書化処理され
た発声に含まれる入力された重要語を用いて、次に入力
される文の分野を予測し、予測された分野にふさわしい
類似文を優先的に提示することにより、認識誤りなどの
誤りの少ない入力と可能とし、さらに最適文を確度よく
提示することが可能となることで、手間と時間をかける
ことなく所望の文書作成が可能となる。
The document creation system as the eighth means is as follows.
In the operation as the first means, the input key words included in the already processed utterance are used to predict the field of the next input sentence, and priority is given to similar sentences suitable for the predicted field. By making the presentation, it is possible to input with less errors such as recognition errors, and moreover, it is possible to present the optimum sentence accurately, thereby making it possible to create a desired document without taking time and effort. .

【0025】[0025]

【発明の実施の形態】以下、図面を参照して本発明の実
施例を説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0026】(実施例1)図1は本発明の一実施例であ
る文書作成システムのブロック図であり、上述した第一
の手段から第七の手段に関するものである。また、図2
は文書作成システム図である。
(Embodiment 1) FIG. 1 is a block diagram of a document creation system according to an embodiment of the present invention, and relates to the above-described first to seventh means. FIG.
Is a document creation system diagram.

【0027】まず文書作成をする前に、予めコーパスの
依存構造を解析し、依存関係にある重要語対を抽出し、
重要語依存関係表に記載しておく。依存構造の解析は解
析ツールを用いても良いし、人手で解析したものでもよ
い。たとえば、図4(a)に示したコーパスからは、図
4(b)のような関係表が記載される。この際、重要語
そのものではなく、重要語と同じ概念を持つものを同じ
クラスし、クラス間の依存関係として表に記載しても良
い。たとえば、図4(b)の「明日」と「開催」との間
の依存関係は、「明日」を「日にち」という概念に含ま
れる語彙である、ということが分類語彙表から明らかに
なるので、図4(c)のように、「日にちクラス」「開
催」という依存関係で記述されても良い。このように概
念クラスで記述することにより、「明日」だけではな
く、「日にち」に含まれる他の語彙(今日、明後日な
ど)の取り扱いも可能になるので、幅広い入力に対応で
きる利点がある。
First, before creating a document, the dependency structure of the corpus is analyzed in advance, and key word pairs having a dependency are extracted.
It is described in the Keyword Dependency Table. The analysis of the dependency structure may be performed using an analysis tool or may be performed manually. For example, from the corpus shown in FIG. 4A, a relation table as shown in FIG. 4B is described. In this case, instead of the important words themselves, those having the same concept as the important words may be classified into the same class, and described in the table as dependencies between the classes. For example, the dependency relationship between “tomorrow” and “holding” in FIG. 4B becomes clear from the classification vocabulary table that “tomorrow” is a vocabulary included in the concept of “date”. As shown in FIG. 4C, the information may be described in a dependency relationship of “date class” and “holding”. By describing in the concept class in this way, not only “tomorrow” but also other vocabulary (today, tomorrow, etc.) included in “date” can be handled, and thus there is an advantage that a wide range of input can be handled.

【0028】次に、コーパスに含まれる文について、各
文に含まれる重要語と文との対応関係を明らかにして例
文DBに記述しておく。図4(d)に例文DBの例を示
す。
Next, for the sentences included in the corpus, the correspondence between the important words included in each sentence and the sentences is clarified and described in the example sentence DB. FIG. 4D shows an example of the example sentence DB.

【0029】次に文書を作成する際に、音声入力キー2
2を押して、作成したい文を発声した音声をマイク24
から入力し、音声認識部1で内容をテキストに変換す
る。次に重要語抽出部2で変換されたテキストから重要
語を抽出する。この際の重要語は予め辞書から選出して
おいてもよいし、名詞や動詞などの内容語を重要語とし
てもよい。次に誤認識推定部3で、予め抽出された重要
語間依存関係表6と入力テキストから抽出された重要語
を比較して、入力テキスト内に依存関係表に記述してい
る重要語ペアーが存在するかどうかを調べる。その結
果、入力テキストに存在する重要語が同じ入力テキスト
に存在する他のどの重要語とも依存関係を認められなか
った場合、その重要語を誤認識単語であると推定する。
たとえば依存関係表に(りんご、食べる)、(席、すわ
る)の重要語ペアーが依存関係として記述されており、
「席にりんごを食べる。」というテキストが認識結果と
して出力された場合、重要語である「席」「りんご」
「食べる」と依存関係表を比較すると、「席」が「りん
ご」とも「食べる」とも依存関係が見出されない。この
際に「席」を誤認識単語であると推定する。
Next, when creating a document, the voice input key 2
Press 2 and the voice of the sentence you want to create
, And the contents are converted into text by the speech recognition unit 1. Next, an important word is extracted from the text converted by the important word extracting unit 2. The important words at this time may be selected in advance from the dictionary, or content words such as nouns and verbs may be used as important words. Next, the misrecognition estimating unit 3 compares the key word dependency relation table 6 extracted in advance with the key words extracted from the input text, and determines the key word pairs described in the dependency relation table in the input text. Check if it exists. As a result, when the important word present in the input text does not have a dependency with any other important word existing in the same input text, the important word is estimated to be a misrecognized word.
For example, in the dependency table, the key word pairs (apple, eat) and (seat, sit) are described as dependencies.
When the text "Eat an apple at a seat" is output as a recognition result, the important words "seat" and "apple" are output.
When comparing “eating” and the dependency table, no dependency is found for “apple” or “eat” for “seat”. At this time, it is estimated that “seat” is a misrecognized word.

【0030】次に用例選択部4で、誤認識であると推定
された重要語を除いた残りの重要語を用いて、同じ依存
関係にある重要語ペアーを最も多く待つ例文を、入力文
と同じ意図をもつ例文とみなして抽出し、ディスプレー
21に例文を出力する。例文が複数個選択されれば、複
数個抽出する。次にユーザはディスプレー21に出力さ
れた例文を確認し、自分が作成したい文書として受理で
きると判断した場合には、十字キー23を押す。複数個
の例文が出力されている場合には、十字キー23でカー
ソルを最適な例文まで移動し、キー23を押す。適切な
例文が表示されていない場合には、最も近い例文にカー
ソルを移動し、数字キー25で修正した後に、確認ボタ
ンを押す。たとえば、「お体を御自愛下さい」の語尾に
単語を追加して「どうぞお体を御自愛下さいね。」など
に修正しても良い。最も近い例文が1つも出力されてい
ない場合には、音声入力キー22を押して再度音声入力
を行う。キー23が押された文書は確定された文書とし
て保持され、ユーザは次の文書入力を行うことを繰り返
す。
Next, the example selecting unit 4 uses the remaining important words except for the important word that is presumed to be misrecognized, and sets the example sentence that waits for the most important keyword pair having the same dependency as the input sentence. The sentence is extracted as being regarded as an example sentence having the same intention, and the example sentence is output to the display 21. If a plurality of example sentences are selected, a plurality of example sentences are extracted. Next, the user checks the example sentence output on the display 21, and presses the cross key 23 when determining that the sentence can be accepted as a document to be created by the user. When a plurality of example sentences are output, the cursor is moved to the optimal example sentence with the cross key 23 and the key 23 is pressed. If an appropriate example sentence is not displayed, move the cursor to the closest example sentence, correct it with the numeric keys 25, and press the confirmation button. For example, a word may be added to the end of "Please love your body" and modified to "Please love your body." If no closest example sentence has been output, the voice input key 22 is pressed to perform voice input again. The document for which the key 23 is pressed is held as a confirmed document, and the user repeats inputting the next document.

【0031】なお、何度音声入力を行っても所望の文書
が選択できない場合には、数字キーを駆使して、従来の
ように文書を入力しても良い。
If a desired document cannot be selected even if the voice is input many times, the document may be input using the numeric keys as in the related art.

【0032】以上の実施例では、作成したい文を音声で
入力し、入力文に含まれる重要語を用いて同じまたは類
似した文意を表す文を用例DBから選択し、選択された
文または選択された文の一部のみを変更した文を出力す
ることにより、キーボードを用いない携帯機器などでの
文書作成が手間と時間多くかけることなく可能となる。
In the above embodiment, a sentence to be created is input by voice, and a sentence expressing the same or similar sentence is selected from the example DB using the important words included in the input sentence, and the selected sentence or the selected sentence is selected. By outputting a sentence in which only a part of the sentence is changed, it is possible to create a document on a portable device or the like that does not use a keyboard without taking much time and effort.

【0033】(実施例2)次に、他の実施例である文書
作成システムについて説明する。図3は上記した第八の
手段の一実施例である文書作成システムのブロック図で
ある。
(Embodiment 2) Next, a document creation system according to another embodiment will be described. FIG. 3 is a block diagram of a document creation system according to an embodiment of the eighth means.

【0034】まず文書作成をする前に、先の実施例と同
じように重要語依存関係表と例文DBとを作成するが、
この際、もとのコーパスを分野別に分類しておき、抽出
された各々の依存関係や例文DBに、抽出に使用した文
が含まれるコーパスの分野情報をともに記載しておく。
たとえば、あいさつ文書コーパスから抽出されたDBに
は「あいさつ」、お知らせ文書から抽出されたDBには
「お知らせ」などの分野情報を依存関係表や例文DBに
追加しておく(図5(a)、図5(b))。
First, before creating a document, an important word dependency relationship table and an example sentence DB are created as in the previous embodiment.
At this time, the original corpus is classified according to the field, and field information of the corpus including the sentence used for the extraction is described in each of the extracted dependencies and the example sentence DB.
For example, field information such as "greeting" is added to the DB extracted from the greeting document corpus, and field information such as "notification" is added to the DB extracted from the notice document to the dependency relationship table and the example sentence DB (FIG. 5A). 5 (b)).

【0035】次に文書を作成する際に、まず1つ目の文
書は、先の実施例と同じ処理を行うことで文書を作成す
る。ただし、最終的にユーザに選択された例文DBの分
野を分野履歴表に記憶しておく。2つ目の文書を入力
し、例文選択を行う際には、分野予測部で前の分野の情
報を履歴表から入力し、例文選択の際には相当する分野
に属する例文を優先的に選択する。たとえば、1つ目の
文書入力の際に選ばれた例文DBが「お知らせ」分野に
属していた場合、2つ目の文入力に含まれる重要語を、
「お知らせ」分野に属する重要語ペアーとまず比較し、
分野名とともに例文をディスプレーに表示する。所望の
例文が存在した場合には、1つ目の発声どおり、カーソ
ルを動かして十字キーを押すが、比較した結果相当する
重要語ペアーがなかった場合に、カーソルを分野名に移
動して十字キーを押すと、分野をまたがった依存関係表
から再度選択結果が表示される。また例文DBを選択す
る際にも同様に、まず同分野の例文DBを検索し、適切
なDBが選択されなかった場合に、分野をまたがった例
文DBを探索する。ユーザが最適例文を選択した後は、
先の実施例同様、必要に応じて一部を修正し文書を確定
する。
Next, when creating a document, the first document is created by performing the same processing as in the previous embodiment. However, the field of the example sentence DB finally selected by the user is stored in the field history table. When inputting a second document and selecting an example sentence, the field prediction unit inputs information on the previous field from the history table, and when selecting an example sentence, preferentially selects an example sentence belonging to the corresponding field. I do. For example, if the example sentence DB selected at the time of the first document input belongs to the “information” field, the important words included in the second sentence input are:
First, compare it with the key word pair in the "Notice" field,
Example sentences are displayed on the display along with the field name. If the desired example exists, move the cursor and press the cross key as in the first utterance. However, if there is no key word pair corresponding to the comparison, move the cursor to the field name and When the key is pressed, the result of the selection is displayed again from the dependency table across fields. Similarly, when selecting an example sentence DB, first, the example sentence DB in the same field is searched, and if an appropriate DB is not selected, an example sentence DB across fields is searched. After the user selects the best example sentence,
As in the previous embodiment, the document is fixed by partially modifying it as necessary.

【0036】なお、以上の実施例では、重要語ペアーと
の比較と例文DB選択において分野を絞って検索した
が、例文DB選択の場合のみ分野を絞ってもよい。ま
た、以上の実施例では、まず分野を絞って選択し、適切
な重要語ペアーや用例が選択されない場合のみ分野をま
たがった選択を行っているが、まず分野を絞らず選択
し、選ばれた類似用例文が一定数を超えた場合のみ分野
で絞ってもよい。
In the above embodiment, the search was performed by narrowing down the field in comparison with the important word pair and selecting the example sentence DB. However, the field may be narrowed down only in the case of selecting the example sentence DB. Further, in the above embodiment, first, the fields are narrowly selected, and the selection across fields is performed only when an appropriate important word pair or example is not selected. The field may be narrowed down only when the number of similar example sentences exceeds a certain number.

【0037】[0037]

【発明の効果】以上詳述したように、本発明に係る第一
の文書作成システムは、作成したい文に含まれる重要語
を用いて、作成したい文と同じまたは類似した文意を表
す文を検索し、検索された文または検索された文の一部
を変更した文を出力することにより、重要語のみを入力
することで作成したい文を作成することが可能となるた
め、手間と時間を多くかけることなく文書作成が可能と
なる。
As described above in detail, the first document creation system according to the present invention uses a keyword included in a sentence to be created to generate a sentence representing the same or similar sentence as the sentence to be created. By searching and outputting a searched sentence or a sentence in which a part of the searched sentence has been changed, it becomes possible to create the sentence you want to create by inputting only the important words. It is possible to create a document without spending much time.

【0038】また、本発明に係る第二の文書作成システ
ムは、第一の文書作成システムに記載の動作に加えて、
さらに、発声された文を音声認識にてテキスト化し、テ
キスト化された文を対象に類似文を検索することによ
り、重要語以外の部分が認識誤りを起こしたとしても、
所望の文書作成が可能となるために、さらに誤認識を修
正する手間と時間をかけることなく所望の文書作成が可
能となる。
Further, the second document creation system according to the present invention, in addition to the operations described in the first document creation system,
Furthermore, by converting the spoken sentence into text by speech recognition and searching for a similar sentence from the text-sentence, even if a part other than the important word causes a recognition error,
Since a desired document can be created, the desired document can be created without taking the trouble and time required to correct erroneous recognition.

【0039】また、本発明に係る第三の文書作成システ
ムは、第二の文書作成システムの動作に加えて、さら
に、音声認識された文の中に含まれる重要語から、誤認
識されている重要語を推定し、推定された重要語以外の
重要語のみを用いて類似した文意を表す文を検索するこ
とにより、重要語以外の部分及び一部の重要語が誤認識
を起こしても、さらに誤認識を修正する手間と時間をか
けることなく所望の文書作成が可能となる。
Further, in the third document creation system according to the present invention, in addition to the operation of the second document creation system, the third document creation system is erroneously recognized from the key words included in the speech-recognized sentence. By estimating important words and searching for sentences that have similar meanings using only the important words other than the estimated important words, even if parts other than the important words and some important words cause misrecognition, In addition, a desired document can be created without the trouble and time required to correct erroneous recognition.

【0040】また、本発明に係る第四の文書作成システ
ムは、第三の文書作成システムの誤認識単語推定動作に
おいて、音声認識された文の中に含まれる重要語間の依
存関係または共起関係を用い、同じ文に含まれる他の重
要語と左記の関係が認められない重要語を誤認識単語で
あると推定することにより、重要語以外の部分及び一部
の重要語が誤認識を起こしても、さらに誤認識を修正す
る手間と時間をかけることなく所望の文書作成が可能と
なる。
Further, the fourth document creation system according to the present invention is characterized in that, in the misrecognized word estimation operation of the third document creation system, the dependency or the co-occurrence between important words included in the speech-recognized sentence. By presuming that important words in the same sentence that do not have the same relationship as the left are recognized as misrecognized words, the non-important words and some important words may be misrecognized. Even if it occurs, a desired document can be created without the trouble and time required to correct erroneous recognition.

【0041】また、本発明に係る第五の文書作成システ
ムは、第一の文書作成システムの動作において、類似文
選択結果をディスプレーに表示し、ボタンまたは数字キ
ーまたは十字キーで選択された類似文を確認修正するこ
とにより、重要語のみを入力することで作成したい文を
作成することが可能となるため、手間と時間を多くかけ
ることなく文書作成が可能となる。
In the fifth document creation system according to the present invention, in the operation of the first document creation system, a similar sentence selection result is displayed on a display, and a similar sentence selected by a button, a numeric key, or a cross key is displayed. By confirming and correcting, it is possible to create a sentence to be created by inputting only important words, so that a document can be created without taking much time and effort.

【0042】また、本発明に係る第六の文書作成システ
ムは、第一の文書作成システムの動作において、類似文
が複数個検索された場合に、ボタンまたは数字キーまた
は十字キーでユーザが最適な候補を選択することによ
り、重要語のみを入力することで作成したい文を作成す
ることが可能となるため、手間と時間を多くかけること
なく文書作成が可能となる。
Further, in the sixth document creation system according to the present invention, in the operation of the first document creation system, when a plurality of similar sentences are searched, the user can use a button, a number key, or a cross key to select an optimum one. By selecting a candidate, it is possible to create a sentence to be created by inputting only important words, so that a document can be created without taking much time and effort.

【0043】また、本発明に係る第七の文書作成システ
ムは、第二の文書作成システムの動作において、音声入
力で作成したい文を入力し、類似文選択結果をディスプ
レーに表示し、選択された類似文をボタンまたは数字キ
ーまたは十字キーで確認修正することにより、重要語以
外の部分が認識誤りを起こしたとしても、所望の文書作
成が可能となるために、さらに誤認識を修正する手間と
時間をかけることなく所望の文書作成が可能となる。
Also, in the seventh document creation system according to the present invention, in the operation of the second document creation system, a sentence to be created by voice input is inputted, a similar sentence selection result is displayed on a display, and the selected sentence is selected. By confirming and correcting similar sentences with buttons, numeric keys, or cross keys, it is possible to create a desired document even if a part other than an important word has a recognition error. A desired document can be created without spending time.

【0044】また、本発明に係る第八の文書作成システ
ムは、第一の文書作成システムの動作において、既に文
書化処理された発声に含まれる入力された重要語を用い
て、次に入力される文の分野を予測し、予測された分野
にふさわしい類似文を優先的に提示することにより、認
識誤りなどの誤りの少ない入力と可能とし、さらに最適
文を確度よく提示することが可能となることで、手間と
時間をかけることなく所望の文書作成が可能となる。
Further, in the eighth document creation system according to the present invention, in the operation of the first document creation system, the next input word is input using the input important word included in the already processed utterance. By predicting the field of the sentence to be given and preferentially presenting similar sentences suitable for the predicted field, it is possible to input with less errors such as recognition errors, and it is possible to accurately present the optimal sentence As a result, a desired document can be created without taking time and effort.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例である文書作成システムのブ
ロック図
FIG. 1 is a block diagram of a document creation system according to an embodiment of the present invention;

【図2】本発明の実施例である文書作成システム図FIG. 2 is a diagram of a document creation system according to an embodiment of the present invention.

【図3】本発明の他の実施例である文書作成システムの
ブロック図
FIG. 3 is a block diagram of a document creation system according to another embodiment of the present invention;

【図4】依存構造の解析を説明するための図FIG. 4 is a diagram for explaining analysis of a dependency structure.

【図5】依存構造の解析を説明するための図FIG. 5 is a diagram for explaining analysis of a dependency structure.

【符号の説明】[Explanation of symbols]

1 音声認識 2 重要語抽出 3 誤認識推定 4,12 例文検索 5 出力文作成 6,10 重要語間依存関係表 7,11 例文DB 8 分野予測 9 分野履歴表 1 Speech Recognition 2 Key Word Extraction 3 False Recognition Estimation 4,12 Example Sentence Search 5 Output Sentence Creation 6,10 Key Word Dependency Relationship Table 7,11 Example Sentence DB 8 Field Prediction 9 Field History Table

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 561C 15/18 537C 15/22 551B Fターム(参考) 5B009 KB00 ND04 VA02 5B075 ND03 PP07 PQ02 PR06 QM08 QM10 QP01 UU40 5D015 HH00 KK02 LL04 LL08 ──────────────────────────────────────────────────の Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G10L 15/00 G10L 3/00 561C 15/18 537C 15/22 551B F-term (Reference) 5B009 KB00 ND04 VA02 5B075 ND03 PP07 PQ02 PR06 QM08 QM10 QP01 UU40 5D015 HH00 KK02 LL04 LL08

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 作成したい文に含まれる意味を理解する
のに必要最小限の単語(以下、「重要語」という。)を
用いて、作成したい文と同じまたは類似した文意を表す
文を検索し、検索された文または検索された文の一部を
変更した文を出力することを特徴とする文書作成システ
ム。
1. A sentence expressing the same or similar sentence as a sentence to be created by using a minimum number of words (hereinafter, referred to as an “important word”) necessary for understanding the meaning included in the sentence to be created. A document creation system for searching and outputting a searched sentence or a sentence obtained by changing a part of the searched sentence.
【請求項2】 発声された文を音声認識にてテキスト化
し、テキスト化された文を対象に類似文を検索すること
を特徴とする請求項1に記載の文書作成システム。
2. The document creation system according to claim 1, wherein the uttered sentence is converted into a text by voice recognition, and a similar sentence is searched for the transcribed sentence.
【請求項3】 音声認識された文の中に含まれる重要語
から、誤認識されている重要語を推定し、推定された重
要語以外の重要語のみを用いて類似した文意を表す文を
検索することを特徴とする請求項2に記載の文書作成シ
ステム。
3. A sentence representing a similar sentence by estimating an erroneously recognized important word from important words contained in a speech-recognized sentence and using only important words other than the estimated important word. 3. The document creation system according to claim 2, wherein
【請求項4】 音声認識された文の中に含まれる重要語
間の依存関係または共起関係を用い、同じ文に含まれる
他の重要語と前記依存関係または共起関係が認められな
い重要語を誤認識単語であると推定することを特徴とす
る請求項3に記載の文書作成システム。
4. A method in which a dependency or a co-occurrence relationship between important words included in a sentence recognized in a sentence is used and the dependency or a co-occurrence relationship with another important word included in the same sentence is not recognized. The document creation system according to claim 3, wherein the word is estimated to be a misrecognized word.
【請求項5】 ディスプレーに類似文選択結果を表示
し、ボタンまたは数字キーまたは十字キーで検索された
類似文を確認修正することを特徴とする請求項1に記載
の文書作成システム。
5. The document creation system according to claim 1, wherein a similar sentence selection result is displayed on a display, and the similar sentence searched by a button, a numeric key, or a cross key is confirmed and corrected.
【請求項6】 類似文が複数個検索された場合に、ボタ
ンまたは数字キーまたは十字キーでユーザが最適な候補
を選択することを特徴とする請求項5に記載の文書作成
システム。
6. The document creation system according to claim 5, wherein, when a plurality of similar sentences are searched, a user selects an optimum candidate using a button, a numeric key, or a cross key.
【請求項7】 音声入力で作成したい文を入力し、ディ
スプレーに類似文選択結果を表示し、ボタンまたは数字
キーまたは十字キーで検索された類似文を確認修正する
ことを特徴とする請求項2に記載の文書作成システム。
7. A sentence to be created by voice input, a similar sentence selection result is displayed on a display, and a similar sentence searched by a button, a numeric key, or a cross key is confirmed and corrected. Document creation system described in.
【請求項8】 既に入力された重要語を用いて、次に入
力される文の分野を予測し、予測された分野にふさわし
い類似文を優先的に提示することを特徴とする請求項1
に記載の文書作成システム。
8. The method according to claim 1, wherein a field of a sentence to be input next is predicted by using an already input important word, and a similar sentence suitable for the predicted field is preferentially presented.
Document creation system described in.
JP2001170586A 2001-06-06 2001-06-06 Document generation system Pending JP2002366543A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001170586A JP2002366543A (en) 2001-06-06 2001-06-06 Document generation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001170586A JP2002366543A (en) 2001-06-06 2001-06-06 Document generation system

Publications (1)

Publication Number Publication Date
JP2002366543A true JP2002366543A (en) 2002-12-20

Family

ID=19012482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001170586A Pending JP2002366543A (en) 2001-06-06 2001-06-06 Document generation system

Country Status (1)

Country Link
JP (1) JP2002366543A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208483A (en) * 2004-01-26 2005-08-04 Neikusu:Kk Device and program for speech recognition, and method and device for language model generation
JP2006209022A (en) * 2005-01-31 2006-08-10 Toshiba Corp Information retrieval system, its method and program
JP2007094086A (en) * 2005-09-29 2007-04-12 Toshiba Corp Input device, input method, and input program
JP2008180801A (en) * 2007-01-23 2008-08-07 Kyushu Institute Of Technology Automatic answering apparatus and method
JP2010134074A (en) * 2008-12-03 2010-06-17 Toshiba Corp Voice recognition device, method and program
JP2014056492A (en) * 2012-09-13 2014-03-27 Nec Corp Translation support device, translation support method, and translation support program
JP2015162135A (en) * 2014-02-27 2015-09-07 株式会社ナカヨ information retrieval device, program, and information retrieval method

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208483A (en) * 2004-01-26 2005-08-04 Neikusu:Kk Device and program for speech recognition, and method and device for language model generation
JP2006209022A (en) * 2005-01-31 2006-08-10 Toshiba Corp Information retrieval system, its method and program
JP2007094086A (en) * 2005-09-29 2007-04-12 Toshiba Corp Input device, input method, and input program
JP4559946B2 (en) * 2005-09-29 2010-10-13 株式会社東芝 Input device, input method, and input program
US8346537B2 (en) 2005-09-29 2013-01-01 Kabushiki Kaisha Toshiba Input apparatus, input method and input program
JP2008180801A (en) * 2007-01-23 2008-08-07 Kyushu Institute Of Technology Automatic answering apparatus and method
JP2010134074A (en) * 2008-12-03 2010-06-17 Toshiba Corp Voice recognition device, method and program
JP2014056492A (en) * 2012-09-13 2014-03-27 Nec Corp Translation support device, translation support method, and translation support program
JP2015162135A (en) * 2014-02-27 2015-09-07 株式会社ナカヨ information retrieval device, program, and information retrieval method

Similar Documents

Publication Publication Date Title
RU2377664C2 (en) Text input method
JP3962763B2 (en) Dialogue support device
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
KR101312849B1 (en) Combined speech and alternate input modality to a mobile device
EP2572355B1 (en) Voice stream augmented note taking
US8612212B2 (en) Method and system for automatically detecting morphemes in a task classification system using lattices
JP4829901B2 (en) Method and apparatus for confirming manually entered indeterminate text input using speech input
CN110765244A (en) Method and device for acquiring answering, computer equipment and storage medium
US20160328377A1 (en) System and method for inputting text into electronic devices
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
EP1089193A2 (en) Translating apparatus and method, and recording medium used therewith
JP2011254553A (en) Japanese language input mechanism for small keypad
JP4930379B2 (en) Similar sentence search method, similar sentence search system, and similar sentence search program
TW200538969A (en) Handwriting and voice input with automatic correction
JP2007041319A (en) Speech recognition device and speech recognition method
US20200110805A1 (en) Identifying Relational Segments
Kryvonos et al. Predictive text typing system for the Ukrainian language
US8463609B2 (en) Voice input system and voice input method
JP2002366543A (en) Document generation system
JP4622861B2 (en) Voice input system, voice input method, and voice input program
JP2002297592A (en) Apparatus, method and program of matching for natural text
Kim et al. Language models and dialogue strategy for a voice QA system
JP2018005368A (en) Output mode determination system
KR20090000858A (en) Apparatus and method for searching information based on multimodal
KR102498839B1 (en) Apparatus and method for detection of sentence boundary