JP2005258597A - Interaction apparatus and language data conversion method - Google Patents
Interaction apparatus and language data conversion method Download PDFInfo
- Publication number
- JP2005258597A JP2005258597A JP2004066384A JP2004066384A JP2005258597A JP 2005258597 A JP2005258597 A JP 2005258597A JP 2004066384 A JP2004066384 A JP 2004066384A JP 2004066384 A JP2004066384 A JP 2004066384A JP 2005258597 A JP2005258597 A JP 2005258597A
- Authority
- JP
- Japan
- Prior art keywords
- data
- attribute
- information
- phrase
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims description 9
- 230000003993 interaction Effects 0.000 title abstract 6
- 238000004891 communication Methods 0.000 claims abstract description 28
- 238000007405 data analysis Methods 0.000 claims abstract description 23
- 230000002452 interceptive effect Effects 0.000 claims description 60
- 238000004458 analytical method Methods 0.000 claims description 35
- 230000005540 biological transmission Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、受信側の対話装置にネットワークを介して接続された対話装置に関し、送信するデータの変換を行うことにより、受信側の対話装置の利用者が、送信されたデータから送信元の利用者の素性を推定することを防ぎ、送信元の利用者の秘匿性保護を可能とした対話装置に関する。 The present invention relates to an interactive apparatus connected to a receiving-side interactive apparatus via a network, and by converting data to be transmitted, a user of the receiving-side interactive apparatus can use the transmission source from the transmitted data. The present invention relates to an interactive apparatus that prevents estimation of a user's identity and enables confidentiality protection of a transmission source user.
ネットワークを介して接続され、言語データや映像データといった多重媒体データを利用し、データ通信を行う対話装置として、テレビ電話や電子掲示板が知られている。上記のような対話装置において、テキストデータを音声データに変換する場合、韻律情報を利用している。この韻律情報は、テキストデータのみから推定される韻律情報であり、その韻律情報による音声データへの変換では、自然性の高い音声データの合成はできなかった。 Video telephones and electronic bulletin boards are known as interactive devices that are connected via a network and use multi-media data such as language data and video data to perform data communication. In the interactive apparatus as described above, prosodic information is used when text data is converted into speech data. This prosodic information is prosodic information estimated only from text data, and speech data with high naturalness cannot be synthesized by conversion to speech data using the prosodic information.
そこで、上記の問題の対応策として、特許文献1に記載されている対話装置では、テキストデータから推定される韻律情報に加え、実際の音声データを分析して推定された個人性情報及び韻律情報を付加的韻律情報とし、それらを音声データの合成の際に利用することで、より自然性の高い音声データ合成を実現していた。
ところで、上記のような対話装置には、次のような解決すべき課題があった。即ち、一方の対話装置からネットワークを介して言語データ及び自己の映像データを他方の対話装置に出力した場合、受信側の対話装置では、送信元の対話装置から送信された言語データがそのまま出力され、また、自己の映像データは、送信元の対話装置から送信された映像データがそのまま再生されてしまう。このため、受信側の対話装置の利用者は、送信元の対話装置から送信されたデータから性別、年代、地方性といった送信元の対話装置の利用者の素性を容易に推定することが可能であった。従って、受信側の対話装置の利用者が悪意を持った者であった場合には、受信データから推定される女性や子供のような利用者に対して、中傷を行ったり、または、それらの利用者のデマ情報を流したりといった悪質な行為がなされてしまう虞れがあった。そのため、利用者の秘匿性保護を行うことができる対話装置の開発が要望されていた。 By the way, the dialogue apparatus as described above has the following problems to be solved. That is, when language data and own video data are output from one interactive device to the other interactive device via the network, the language data transmitted from the transmitting interactive device is output as it is in the receiving interactive device. In addition, as the self video data, the video data transmitted from the transmission source interactive device is reproduced as it is. For this reason, the user of the dialog device on the receiving side can easily estimate the identity of the user of the dialog device of the transmission source such as gender, age, and locality from the data transmitted from the dialog device of the transmission source. there were. Therefore, if the user of the dialog device on the receiving side is a malicious person, the user who is presumed from the received data will be slandered, or their There was a risk that malicious acts such as streaming hoax information of users would be done. Therefore, there has been a demand for the development of an interactive device that can protect the confidentiality of users.
従って、本発明は、ネットワークを介して接続された対話装置において、データ送信を行う場合に、言語データ及び映像データの変換を行うことにより、送信元の利用者の素性を隠蔽し、利用者の秘匿性保護の向上を図ることができる対話装置を提供することを目的とする。 Therefore, the present invention conceals the identity of the user of the transmission source by converting the language data and the video data when performing data transmission in the interactive apparatus connected via the network. An object of the present invention is to provide an interactive apparatus capable of improving confidentiality protection.
本発明は、以上の点を解決するために、次の構成を採用する。
<構成1>
The present invention adopts the following configuration in order to solve the above points.
<Configuration 1>
本発明は、ネットワークを介して接続された対話装置において、語句を分類するための属性情報別に共通語情報と対応づけされた属性語句データ群を保持した属性語句データ保持部と、共通語情報別に保持し得る属性情報が対応付けされている共通語・属性対応テーブルと、送信すべき言語データと変換指示する属性情報とを入力するための入力手段と、前記入力された言語データを解析して複数の解析語句データに区分すると共に前記属性語句データ保持部を参照して前記各解析語句データに対応する共通語情報を検索するデータ解析部と、前記共通語・属性対応テーブルを参照して前記各共通語情報が前記変換指示属性情報と同一の属性情報を保持していると、該属性情報に基づいて、前記属性語句データ保持部を検索して前記各共通語情報と同義の属性語句データを取り込み、前記各解析語句データを該各属性語句データに変換して変換言語データを生成するデータ変換部と、該変換言語データを前記ネットワークを介して相対側の対話装置へ送信するデータ通信部と、を含むことを特徴とする。 The present invention relates to an attribute word / phrase data holding unit that holds attribute word / phrase data groups associated with common word information for each attribute information for classifying words in an interactive device connected via a network, and for each common word information. A common word / attribute correspondence table in which attribute information that can be held is associated; input means for inputting language data to be transmitted and attribute information for instructing conversion; and analyzing the input language data A data analysis unit that divides into a plurality of analysis word / phrase data and refers to the attribute word / phrase data holding unit to search for common word information corresponding to each analysis word / phrase data, and refers to the common word / attribute correspondence table When each common word information holds the same attribute information as the conversion instruction attribute information, the attribute word / phrase data holding unit is searched based on the attribute information, and each common word is searched. A data conversion unit that takes in attribute phrase data synonymous with the information and converts each of the analysis phrase data into the attribute phrase data to generate conversion language data; and a dialog on the relative side of the conversion language data via the network And a data communication unit for transmitting to the apparatus.
<構成2>
構成1における対話装置であって、属性情報と対応づけされた映像データを保持する映像データ保持部と、前記映像データ保持部から変換指示属性情報に基づいて、対応する映像データを選択し、自己映像データを該映像データに変換する映像データ変換手段と、
を備えることを特徴とする。
<
The interactive apparatus according to Configuration 1, wherein a video data holding unit that holds video data associated with attribute information, and corresponding video data is selected from the video data holding unit based on conversion instruction attribute information, Video data conversion means for converting video data into the video data;
It is characterized by providing.
<構成3>
対話装置の言語データ変換方法であって、ネットワークを介して接続された対話装置に、語句を分類するため属性情報別に共通語情報と対応づけられた属性語句データ群を保持する属性語句データ保持部と、前記各共通語情報に保持し得る属性情報が対応付けられた共通語・属性対応テーブルを設け、入力手段により送信すべき言語データと変換指示する属性情報とを入力する工程と、入力された言語データを解析して複数の解析語句データに区分する工程と、前記属性語句データ保持部を参照して、前記各解析語句データに対応する共通語情報を検索する工程と、前記共通語・属性対応テーブルを参照して、前記各共通語情報が前記変換指示属性情報と同一の属性情報を保持しているか否かを判定する工程と、前記共通語情報が前記同一の属性情報を保持していると、該属性情報に基づいて、前記属性語句データ保持部を検索して、前記共通語情報と同義の属性語句データを取り込む工程と、前記解析語句データを前記属性語句データに変換して、変換言語データを生成する工程と、該変換言語データを前記ネットワークを介して相手側の対話装置へ送信する工程とを含むことを特徴とする対話装置の言語データ変換方法。
<
A method for converting language data of an interactive device, an attribute word / phrase data holding unit for holding an attribute word / phrase data group associated with common word information for each attribute information for classifying words / phrases in an interactive device connected via a network A common word / attribute correspondence table in which attribute information that can be held in each of the common word information is associated, and a step of inputting language data to be transmitted by the input means and attribute information for instructing conversion, Analyzing the linguistic data and dividing it into a plurality of pieces of analysis word / phrase data, searching the common word information corresponding to each piece of analysis word / phrase data with reference to the attribute word / phrase data holding unit, Referring to the attribute correspondence table, determining whether each of the common word information holds the same attribute information as the conversion instruction attribute information, and the common word information is the same Holding sex information, searching the attribute phrase data holding unit based on the attribute information, capturing attribute phrase data synonymous with the common word information, and analyzing the phrase data as the attribute phrase A language data conversion method for an interactive device, comprising: converting the data into data to generate converted language data; and transmitting the converted language data to the other interactive device via the network.
本発明によれば、属性情報別に共通語情報と対応づけされた属性語句データ群を保持した属性語句データ保持部と、共通語情報別に自己の備える属性情報群が対応付けられている共通語・属性対応テーブルとを設け、入力端末から言語データとその属性情報とを受け付けると、受け付けた言語データを変換したテキストデータと属性情報とを転送して、入力されたテキストデータをテキストデータの属性情報に基づいて、属性語句データ保持部から属性語句データ群を参照し、解析語句データに構文解析を行うと共に該解析語句データに対応する共通語情報を取り込み、得られた解析語句データを該解析語句データと対応付けられた共通語情報及び変換指示属性情報に基づいて、変換テキストデータを生成し、該変換テキストデータをネットワークを介して接続された他の対話装置に送信し、該変換テキストデータを言語データに変換し出力することにより、例えば、女性が入力した言語データを、男性が入力したと同一の言語データに変換することができるので、受信側の対話装置が受け付ける言語データから推定される送信元の利用者の素性を隠蔽し、利用者の秘匿性保護の向上を図ることができる。 According to the present invention, the attribute word / phrase data holding unit holding the attribute word / phrase data group associated with the common word information for each attribute information, and the common word When an attribute correspondence table is provided and language data and its attribute information are received from the input terminal, text data converted from the received language data and attribute information are transferred, and the input text data is converted to text data attribute information. Based on the attribute word / phrase data holding unit, the analysis word / phrase data group is referred to, the analysis word / phrase data is parsed, and the common word information corresponding to the analysis word / phrase data is taken in. Conversion text data is generated based on the common word information and conversion instruction attribute information associated with the data, and the conversion text data is By transmitting the converted text data to language data and outputting the language data, for example, the language data input by the woman is the same language data input by the man. Therefore, it is possible to conceal the identity of the user at the transmission source estimated from the language data received by the interactive apparatus on the receiving side, and to improve the confidentiality protection of the user.
以下、本発明の実施の形態を図1〜9を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to FIGS.
図1は、本発明の一実施形態が適用された対話装置のブロック構成図である。この対話装置2は、通信ネットワーク9を介して、他の対話装置10と接続されている。この対話装置2は、キーボード等の入力端末及びモニタ等の出力端末を備えている。また、対話装置2は、更に入出力制御部1、データ解析部3、データ変換部4、言語情報保持部5、及びデータ通信部8とを備えている。
FIG. 1 is a block diagram of an interactive apparatus to which an embodiment of the present invention is applied. This
入出力制御部1は、キーボード等の入力端末より、テキストデータを入力すると、該データをデータ解析部3に転送する入力制御部1Aと、ネットワークを経由して受信したテキストデータ等をモニタ等の出力端末に出力する出力制御部1Bとを有している。出力制御部1Bは、テキストデータの入力が終了すると、出力端末を制御して該データの属性情報を入力する画面及び変換すべき属性情報を指示する画面を表示させる。
The input / output control unit 1 receives the text data from an input terminal such as a keyboard and transfers the data to the
図2は、属性情報の例である。即ち、属性情報としては、「東京弁」及び「関西弁」等の方言を示す属性情報、「若者」及び「老人」等の年齢を示す属性情報、「男性」及び「女性」等の性別を示す属性情報などが選択可能に表示される。 FIG. 2 is an example of attribute information. That is, the attribute information includes attribute information indicating dialects such as “Tokyo dialect” and “Kansai dialect”, attribute information indicating age such as “young” and “old man”, and sex such as “male” and “female”. The attribute information to be displayed is displayed so as to be selectable.
言語情報保持部5は、属性語句データ保持部6及び共通語情報と属性情報とを対応付けた共通語・属性対応テーブル7から構成されている。属性語句データ保持部6は、属性情報別に共通語情報と対応付けされた属性語句データ群を保持している。図3は、属性語句データ群のうち「関西弁」の属性を持つ属性語句データの例である。「関西弁」の属性語句データ「どないです」、「ええ」という表現に対して、それぞれ「どうですか」、「よい」といった共通語情報が対応付けられている。
The language information holding unit 5 includes an attribute word / phrase
また、共通語・属性対応テーブル7は、共通語情報別に自己の備える属性情報群が対応付けられている。図4は、「良い」という共通語情報に対する属性情報の例であり、各属性情報である「東京弁」、「関西弁」及び「老人」に対応する「良い」と同義な属性語句データを属性語句データ保持部6が保持していることを表している。
Further, the common word / attribute correspondence table 7 is associated with attribute information groups provided for each common word information. FIG. 4 is an example of attribute information for the common word information “good”, and attribute phrase data synonymous with “good” corresponding to each attribute information “Tokyo dialect”, “Kansai dialect”, and “old man”. This indicates that the attribute word / phrase
データ解析部3は、入出力制御部1からテキストデータを受け付けると、利用者が選択入力した属性情報に基づいて、属性語句データ保持部6の属性語句データ情報群を参照し、該テキストデータの解析を行い、解析結果で得られた各語句データ及び対応する共通語情報をデータ変換部4に転送する。例えば、語句データ「ええ」及び共通語情報「よい」を転送する。
When the
データ変換部4は、データ解析部3から得られる語句データ毎に対応する共通語情報を検索子として共通語・属性対応テーブル7を検索し、共通語情報の保持する属性情報を取り込み、変換指定の属性情報が取り込んだ属性情報中に存在するか否かを判定し、存在する場合、属性語句データ保持部6において変換指示の属性情報に区分された属性語句データ群の中から共通語情報に対応する属性語句データを抽出し、抽出した属性語句データから変換テキストデータを生成し、変換テキストデータをデータ通信部8に転送する。また、変換指定の属性情報が取り込んだ属性情報中に存在しない場合、語句データは変換されることなく、そのまま変換テキストデータ生成に利用され、データ通信部8に転送される。尚、名詞等の属性語句データに含まれていないものも、そのまま変換することなく変換テキストデータ生成に利用するものとする。
The data conversion unit 4 searches the common word / attribute correspondence table 7 using the common word information corresponding to each phrase data obtained from the
データ通信部8は、データ変換部4から変換テキストデータを受け付けると、ネットワークを介して相手側の対話装置10に対して、変換テキストデータを送信し及び相手側の対話装置10からテキストデータを受信すると、該受信データを前記入出力制御部1に転送する。
When the
次に、上記構成の対話装置2の動作について以下に説明する。
図5は、実施例1の対話装置2の動作のフローチャートである。
Next, the operation of the
FIG. 5 is a flowchart of the operation of the
実施例1では、入力されるテキストデータは、「今日はいい天気だわ」とし、テキストデータの属性情報としては、「東京弁」、「女性」、及び「若者」が選択入力され、変換指示すべき属性情報としては、「東京弁」、「男性」、及び「若者」が入力されるものとし、従って、「女性」が入力したテキストデータは、「男性」が入力したと同一のテキストデータに変換される。 In the first embodiment, the text data to be input is “Today's good weather”, and “Tokyo dialect”, “female”, and “young” are selected and input as attribute information of the text data, and conversion instructions are given. As attribute information to be entered, “Tokyo dialect”, “male”, and “young” are entered. Therefore, the text data entered by “female” is the same text data entered by “male”. Is converted to
まず、入出力制御部1は、キーボード等の入力端末からテキストデータが入力され、かつ出力端末を介して、テキストデータの属性情報、及び変換指示の属性情報が入力されると、受け付けたデータをデータ解析部3に転送する(ステップS1)。 First, when text data is input from an input terminal such as a keyboard and the text data attribute information and conversion instruction attribute information are input via the output terminal, the input / output control unit 1 receives the received data. The data is transferred to the data analysis unit 3 (step S1).
図6は、対話装置2のデータ解析の動作図である。
データ解析部3は、入出力制御部1より転送された「今日はいい天気だわ」といったテキストデータと該テキストデータの属性情報を受け付けると、該属性情報に基づいて、言語情報保持部5の属性語句データ保持部6から対応する「東京弁」、「女性」、及び「若者」といった各属性情報の属性語句データ群をそれぞれ参照し、テキストの各語句と一致する語句データを検索することで、上記のテキストデータを「今日」「は」「いい」「天気」「だわ」のように解析し、解析語句データ「今日」「は」「いい」「天気」「だわ」及び「いい」、「だわ」にそれぞれ対応する共通語情報「良い」、「です」を取得し、取得した解析語句データ及び該共通語情報をデータ変換部4に転送する(ステップS2)。尚、名詞及び助詞等の属性語句データに対応していないものは、そのまま名詞または助詞としてテキスト解析される。
FIG. 6 is an operation diagram of data analysis of the
When the
図7は、対話装置2のデータ変換の動作図である。
実施例1では、解析語句データ「だわ」の変換処理について説明を行うこととする。
データ変換部4は、データ解析部3から転送された解析語句データである「今日」「は」「いい」「天気」「だわ」と共通語情報「です」及び、変換指示属性情報を受け付けると、解析語句データ毎に変換処理を行う。具体的には、データ変換部4は、データ解析部3にて取り込んだ、解析語句データ「だわ」に対応付けられた共通語情報「です」を検索子として、共通語・属性対応テーブル7を検索し、共通語情報「です」の保持する属性情報「関西弁」、「老人」、「男性」を取り込む。
FIG. 7 is an operation diagram of data conversion of the
In the first embodiment, the conversion process of the analysis phrase data “daiwa” will be described.
The data conversion unit 4 accepts “today”, “ha”, “good”, “weather”, “dawa”, common word information “I”, and conversion instruction attribute information, which are analysis phrase data transferred from the
そして、変換指定の属性情報「東京弁」、「若者」、「男性」が取り込んだ属性情報中に存在するか否かを判定する。本実施例1では変換指定の属性情報「男性」が取り込んだ属性情報中に存在するので、データ変換部4は、属性語句データ保持部6において変換指示の属性情報「男性」に区分の属性語句データ群の中から共通語情報「です」に対応する属性語句データ「だな」を抽出し、抽出した属性語句データ「だな」に「だわ」を変換する(ステップS3)。尚、変換指定の属性情報が、共通語情報に基づいて、共通語・属性対応テーブル7を検索し、取り込んだ属性情報中に存在しなかった場合、データ変換部4は、該解析語句データの変換は行われない。
Then, it is determined whether or not the attribute information “Tokyo dialect”, “young”, and “male” of the conversion designation exists in the captured attribute information. In the first embodiment, since the attribute information “male” of conversion designation is present in the acquired attribute information, the data conversion unit 4 uses the attribute word / phrase
すべての変換すべき解析語句データの変換を行った後、データ変換部4は、変換テキストデータ「今日はいい天気だな」を生成し、データ通信部8に出力する(ステップS4)。 After the conversion of all the analysis phrase data to be converted, the data conversion unit 4 generates the converted text data “Today is good weather” and outputs it to the data communication unit 8 (step S4).
データ通信部8は、データ変換部4から変換テキストデータ「今日はいい天気だな」を受け付けると、ネットワークを介して接続されている他の対話装置10の入出力制御部に該変換テキストデータを送信する(ステップS5)。
When the
他の対話装置10の入出力制御部は、データ通信部8から送信された変換テキストデータ「今日はいい天気だな」を自らが備えている出力端末を介して画面に表示する(ステップS6)。
The input / output control unit of the other
上記の実施例1に説明したように、属性情報別に共通語情報と対応づけされた属性語句データ群を保持した属性語句データ保持部と、共通語情報別に自己の備える属性情報群が対応付けられている共通語・属性対応テーブルとを設け、入力端末からテキストデータとその属性情報とを受け付けると、受け付けたテキストデータと属性情報とを転送する。そして、入力されたテキストデータをテキストデータの属性情報に基づいて、属性語句データ保持部から属性語句データ群を参照し、解析語句データに構文解析を行うと共に該解析語句データに対応する共通語情報を取り込み、得られた解析語句データを該解析語句データと対応付けられた共通語情報及び変換指示属性情報に基づいて、変換テキストデータを生成し、該変換テキストデータをネットワークを介して接続された他の対話装置に送信することにより、例えば、女性が入力したテキストデータを、男性が入力したと同一のテキストデータに変換することができるので、受信側の対話装置が受け付けるテキストデータから推定される送信元の利用者の素性を隠蔽し、利用者の秘匿性保護の向上を図ることができる。 As described in the first embodiment, the attribute word / phrase data holding unit that holds the attribute word / phrase data group associated with the common word information for each attribute information and the attribute information group that the user owns for each common word information are associated with each other. When the text data and its attribute information are received from the input terminal, the received text data and attribute information are transferred. Then, based on the attribute information of the text data, the input text data is referred to the attribute word / phrase data group from the attribute word / phrase data holding unit, parsed into the analysis word / phrase data, and common word information corresponding to the analysis word / phrase data The converted text data is generated based on the common word information and the conversion instruction attribute information associated with the analyzed phrase data, and the converted text data is connected via the network. By transmitting to another interactive device, for example, text data input by a woman can be converted into the same text data input by a male, and therefore estimated from the text data received by the receiving interactive device It is possible to conceal the identity of the user at the transmission source and to improve the confidentiality protection of the user.
図8は、実施例2における対話装置のブロック構成図である。
実施例2の対話装置2には、図1に示した実施例1の対話装置の入出力制御部1に、マイクロフォン等の入力端末から音声データを受け付けると、該音声データをテキストデータに変換し、データ解析部3に転送する音声認識部1Cと、ネットワークを経由して受信した変換テキストデータを音声データに変換し、スピーカ等の出力端末に転送する音声変換部1Dと、また、入出力制御部1は、出力端末画面より選択入力された変換指定の属性情報を、ネットワークを介して接続された他の対話装置10が、受信した変換テキストデータの音声変換時に利用する韻律情報群を特定するための変換韻律特定情報としてデータ通信部8に転送する。
FIG. 8 is a block diagram of the interactive apparatus according to the second embodiment.
When the speech data is received by the input / output control unit 1 of the interactive device of the first embodiment shown in FIG. 1 from the input terminal such as a microphone, the
ネットワークを介した他の対話装置10は、対話装置2から送信される変換韻律特定情報を保持する変換韻律特定情報保持部10Aと、変換テキストデータを受け付けると、該変換テキストデータを韻律情報に基づく音声データに変換するための、方言を示す属性情報別に各属性語句データと対応付けされた発音の高低や強弱を示した韻律情報群を保持する韻律情報保持部10Bを備えている。上記の韻律情報保持部10Bが保持する韻律情報群としては、「東京弁韻律情報群」や「九州弁韻律情報群」等が考えられる。これにより、変換テキストデータを受け付けると、例えば、変換韻律特定情報が「九州弁」である場合には、九州弁の特徴に基づいて韻律調整された音声データに変換することが可能となる。
When another
尚、対話装置2も同様に、入出力制御部1は、データ通信部8より転送された変換韻律特定情報を保持する変換韻律特定情報保持部1Eを備えている。また、上記の韻律情報保持部10Bが保持するような韻律情報群を言語情報保持部5に保持しており、入出力制御部1は、変換テキストデータを受け付けると、予め転送かつ保持されていた変換韻律特定情報に基づいて、該言語情報保持部5から韻律情報群を参照し、利用する韻律情報群を特定し、該変換テキストデータを特定された韻律情報に基づく音声データに変換し、変換した音声データを自らが備えている出力端末を介して出力する。
Similarly, the input / output control unit 1 also includes a conversion prosody specifying
データ通信部8は、データ変換部4から変換テキストデータまたは入出力制御部1から変換韻律特定情報を受信すると、ネットワークを介した相手側の対話装置10に対して、該受信データを送信し及び相手側の対話装置10から変換テキストデータまたは変換韻律特定情報を受信すると、該受信データを前記入出力制御部1に転送する。その他のデータ解析部3、データ変換部4は、実施例1の動作と同様である。
When the
次に、上記構成の対話装置の動作について以下に説明する。
図9は、実施例2の対話装置の動作のフローチャートである。
Next, the operation of the interactive apparatus having the above configuration will be described below.
FIG. 9 is a flowchart of the operation of the interactive apparatus according to the second embodiment.
実施例2では、入力される音声データは、「今日はいい天気だわ」とし、音声データの属性情報としては、「東京弁」、「女性」、及び「若者」が選択入力され、変換指示すべき属性情報としては、「東京弁」、「男性」、及び「若者」が入力されるものとし、従って、「女性」が入力した音声データは、「男性」が入力したと同一の音声データに変換される。 In the second embodiment, the voice data to be input is “Today is good weather”, and “Tokyo dialect”, “female”, and “young” are selected and input as attribute information of the voice data, and conversion instructions are given. As attribute information to be input, “Tokyo dialect”, “male”, and “young” are input. Therefore, the audio data input by “female” is the same audio data input by “male”. Is converted to
まず、入出力制御部1は、マイクロフォン等の入力端末から、音声データが入力され、かつ出力端末を介して音声データの属性情報、及び変換指示の属性情報が入力されると、音声認識1Cにより音声データをテキストデータに変換し、変換されたテキストデータをデータ解析部3に転送する(ステップS1及びS2)。また、この際に受け付けた変換指定の属性情報は、変換韻律特定情報として,データ通信部8にも転送され、ネットワークを介して他の対話装置10のデータ通信部に送信しておく。対話装置10のデータ通信部は、該変換韻律特定情報を自らが備える入出力制御部に転送し、該入出力制御部は、受信した変換テキストの音声データ変換時の韻律調整処理に利用するため、該変換韻律特定情報を保持する。
First, when voice data is input from an input terminal such as a microphone and the attribute information of the voice data and the attribute information of the conversion instruction are input via the output terminal, the input / output control unit 1 performs voice recognition 1C. The voice data is converted into text data, and the converted text data is transferred to the data analysis unit 3 (steps S1 and S2). Also, the conversion designation attribute information received at this time is also transferred to the
データ解析部3は、入出力制御部1より転送されたテキストデータ「今日はいい天気だわ」とテキストデータの属性情報を受け付けると、属性情報に基づいて、言語情報保持部5の属性語句データ保持部6から対応する「東京弁」、「女性」、及び「若者」といった各属性情報の属性語句データ群をそれぞれ参照し、テキストの各語句と一致する語句データを検索することで、上記のテキストデータを「今日」「は」「いい」「天気」「だわ」のように解析し、解析語句データ及び対応する共通語情報「良い」、「です」を取得する。そして、得られた解析語句データをデータ変換部4に転送する(ステップS3)。尚、実施例1と同様に名詞及び助詞等の属性語句データに含まれていないものは、そのまま名詞または助詞としてテキスト解析される。
When the
データ変換部4は、データ解析部3から転送された解析語句データ「今日」「は」「いい」「天気」「だわ」と共通語情報「です」及び、変換指示属性情報を受け付けると、解析語句データ毎に変換処理を行う。実施例2は、解析語句データ「だわ」の変換処理について説明を行うこととする。
When the data conversion unit 4 receives the analysis word / phrase data “today”, “ha”, “good”, “weather”, “dawa” and the common word information “I” and the conversion instruction attribute information transferred from the
データ変換部4は、データ解析部3にて取り込んだ、解析語句データ「だわ」に対応付けられた共通語情報「です」を検索子として、共通語・属性対応テーブル7を検索し、共通語情報「です」の保持する属性情報「関西弁」、「老人」、「男性」を取り込む。
The data conversion unit 4 searches the common word / attribute correspondence table 7 using the common language information “D” associated with the analysis phrase data “Da” taken in by the
そして、変換指定の属性情報「東京弁」、「若者」、「男性」が取り込んだ属性情報中に存在するか否かを判定する。今回は変換指定の属性情報「男性」が取り込んだ属性情報中に存在するので、引き続きデータ変換部4は、属性語句データ保持部6において変換指示の属性情報「男性」に区分の属性語句データ群の中から共通語情報「です」に対応する属性語句データ「だな」を抽出し、抽出した属性語句データ「だな」と「だわ」を変換する(ステップS4)。尚、変換指定の属性情報が、共通語情報に基づいて、共通語・属性対応テーブル7を検索し、取り込んだ属性情報中に存在しなかった場合、データ変換部4は、該解析語句データの変換は行われない。
Then, it is determined whether or not the attribute information “Tokyo dialect”, “young”, and “male” of the conversion designation exists in the captured attribute information. Since the attribute information “male” of the conversion designation is present in the attribute information acquired this time, the data conversion unit 4 continues the attribute word / phrase data group classified into the attribute information “male” of the conversion instruction in the attribute word / phrase
すべての変換すべき解析語句データの変換を行った後、データ変換部4は、変換テキストデータ「今日はいい天気だな」を生成し、データ通信部8に出力する(ステップS5)。 After the conversion of all the analysis phrase data to be converted, the data conversion unit 4 generates the converted text data “Today's good weather” and outputs it to the data communication unit 8 (step S5).
データ通信部8は、データ変換部4から変換テキストデータ「今日はいい天気だな」を受け付けると、ネットワークを介して接続されている他の対話装置10のデータ通信部に該変換テキストデータ「今日はいい天気だな」を送信する(ステップS6)。
When the
対話装置10のデータ通信部は、受信した変換テキストデータ「今日はいい天気だな」を自らが備える入出力制御部に転送し、該入出力制御部は、変換テキストデータ「今日はいい天気だな」を受け付けると、対話装置2から予め送信され、保持していた変換韻律特定情報を参照し、該変換韻律特定情報「東京弁」、「若者」、「男性」のうち方言を示す変換韻律特定情報「東京弁」を取り込む。
The data communication unit of the
そして、該入出力制御部は、取り込んだ変換韻律特定情報「東京弁」に基づいて、韻律情報保持部10Bから対応する方言の韻律情報を示す「東京弁韻律情報群」を参照し、参照された「東京弁韻律情報群」から変換テキストデータ「今日はいい天気だな」のテキストの各語句と一致する語句データに対応付けられた発音及び強弱等の韻律情報を特定し、テキストの各語句の方言に特有の発音及び強弱等の韻律情報を取得する。引き続き、入出力制御部は、取得した「東京弁」の各語句データと対応した発音及び強弱等の韻律情報に基づいて、変換テキストデータの各語句を東京弁に韻律調整し音声データに変換する。そして、変換された音声データをスピーカ等の自らが備える出力端末を介して出力する。(ステップS7及びS8)。
Then, the input / output control unit refers to the “Tokyo dialect prosody information group” indicating the prosody information of the corresponding dialect from the prosody
上記の実施例2に説明したように、属性情報別に共通語情報と対応づけされた属性語句データ群を保持した属性語句データ保持部と、共通語情報別に自己の備える属性情報群が対応付けられている共通語・属性対応テーブルとを設け、さらに、ネットワークを介して接続された他の対話装置に方言を示す属性情報別に各属性語句データと対応付けされた発音の高低や強弱を示した韻律情報群を備え、入力端末から言語データとその属性情報とを受け付けると、受け付けた言語データをテキスト変換し、得られた該テキストデータとその属性情報との転送をする。 As described in the second embodiment, the attribute word / phrase data holding unit that holds the attribute word / phrase data group associated with the common word information for each attribute information and the attribute information group that the self has for each common word information are associated with each other. A common word / attribute correspondence table, and the prosody that shows the level of pronunciation and strength associated with each attribute word / phrase data according to the attribute information indicating the dialect to other interactive devices connected via the network When the language data and its attribute information are received from the input terminal, the received language data is converted to text, and the obtained text data and its attribute information are transferred.
そして、入力かつテキスト変換により得られたテキストデータをテキストデータの属性情報に基づいて、属性語句データ保持部から属性語句データ群を参照し、解析語句データに構文解析を行うと共に該解析語句データに対応付けられた共通語情報を取り込み、得られた解析語句データを該解析語句データに対応付けられた共通語情報及び変換指示属性情報に基づいて、変換テキストデータを生成し、該変換テキストデータをネットワークを介して接続された他の対話装置に送信し、他の対話装置が変換テキストデータを受け付けると、変換韻律特定情報に基づく韻律情報群を韻律情報保持部を参照し、特定された韻律情報に基づく音声データに変換することにより、例えば、女性が入力した音声データを、男性が入力すると同一の音声データに変換することができるので、受信側の対話装置が受け付ける言語データから推定される送信元の利用者の素性を隠蔽し、利用者の秘匿性保護の向上を図ることができる。 Then, based on the attribute information of the text data, the text data obtained by input and text conversion is referred to the attribute phrase data group from the attribute phrase data holding unit, parsed into the analysis phrase data, and the analysis phrase data Based on the common word information and the conversion instruction attribute information associated with the analysis word / phrase data, the conversion text data is generated, and the conversion text data is obtained. When transmitted to another interactive device connected via the network and the other interactive device accepts the converted text data, the prosodic information group based on the converted prosodic information is referred to the prosodic information holding unit, and the specified prosodic information For example, audio data input by a woman is converted to audio data based on It is possible to convert, to hide the source of the user's identity the recipient of the interactive device is estimated from the language data that accepts, it is possible to improve the user's confidentiality protection.
本発明は、以上の実施例に限定されない。上記の実施例1及び2は言語データの変換を行う対話装置の例で説明したが、例えば、対話装置に、新たに性別を示す属性情報と対応づけた映像データを保持する映像データ保持部と、該映像データ保持部から変換指示属性情報に基づく映像データを選択し、該映像データを自己映像データから変換する映像データ変換手段とを設けることで、言語データだけではなく、映像データの変換も行うことが可能となり、これによって、言語データ及び映像データから推定される利用者の素性を隠蔽し、利用者の秘匿性保護の向上を図ることもできるようになる。 The present invention is not limited to the above embodiments. The first and second embodiments have been described with reference to the example of the interactive device that converts language data. For example, the interactive device has a video data holding unit that holds video data newly associated with attribute information indicating sex. By selecting video data based on the conversion instruction attribute information from the video data holding unit and providing video data conversion means for converting the video data from self-video data, conversion of not only language data but also video data is possible. This makes it possible to conceal the user's identity estimated from the language data and the video data, and to improve the confidentiality protection of the user.
また、上記の実施例1及び2の対話装置におけるデータ解析及び変換のために参照される言語情報保持部5は、RDFやオントロジー等の表現形式を使用して実現することも可能である。 In addition, the language information holding unit 5 referred to for data analysis and conversion in the interactive devices of the first and second embodiments can be realized by using an expression format such as RDF or ontology.
また、上記実施例1及び2の対話装置では、名詞等の属性語句データに含まれていないものは、そのまま変換することなく変換テキストデータ生成に利用するものとしているが、例えば、属性情報「老人」における属性語句データ「アルバイト」が属性情報「若者」においては、属性語句データ「バイト」と対応付けられるように同義の属性語句データが属性情報によって異なる言い方をする場合があることを考慮し、名詞も変換対象とできるように言語情報保持部5に名詞等の属性語句データを含めた構成として実現することも可能である。 Further, in the interactive devices of the first and second embodiments, what is not included in the attribute word / phrase data such as nouns is used for generating converted text data without being converted as it is. In the attribute information “young people” in the attribute phrase data “part-time”, the synonymous attribute phrase data may be different depending on the attribute information so as to be associated with the attribute phrase data “byte”. It is also possible to realize a configuration in which attribute word / phrase data such as nouns is included in the language information holding unit 5 so that nouns can be converted.
1 入出力制御部
1A 入力制御部
1B 出力制御部
1C 音声認識部
1D 音声変換部
1E 変換韻律特定情報保持部
2 対話装置
3 データ解析部
4 データ変換部
5 言語情報保持部
6 属性語句データ保持部
7 共通語・属性対応テーブル
8 データ通信部
9 通信ネットワーク
10 対話装置
10A 変換韻律特定情報保持部
10B 韻律情報保持部
DESCRIPTION OF SYMBOLS 1 Input /
Claims (3)
語句を分類するための属性情報別に共通語情報と対応づけされた属性語句データ群を保持した属性語句データ保持部と、
共通語情報別に保持し得る属性情報が対応付けされている共通語・属性対応テーブルと、
送信すべき言語データと変換指示する属性情報とを入力するための入力手段と、
前記入力された言語データを解析して複数の解析語句データに区分すると共に前記属性語句データ保持部を参照して前記各解析語句データに対応する共通語情報を検索するデータ解析部と、
前記共通語・属性対応テーブルを参照して前記各共通語情報が前記変換指示属性情報と同一の属性情報を保持していると、該属性情報に基づいて、前記属性語句データ保持部を検索して前記各共通語情報と同義の属性語句データを取り込み、前記各解析語句データを該各属性語句データに変換して変換言語データを生成するデータ変換部と、
該変換言語データを前記ネットワークを介して相対側の対話装置へ送信するデータ通信部と、
を含むことを特徴とする対話装置。 In an interactive device connected via a network,
An attribute word / phrase data holding unit holding an attribute word / phrase data group associated with common word information according to attribute information for classifying words;
A common word / attribute correspondence table in which attribute information that can be held for each common word information is associated;
Input means for inputting language data to be transmitted and attribute information for instructing conversion;
A data analysis unit that analyzes the input language data and divides it into a plurality of analysis word / phrase data and searches for common word information corresponding to each analysis word / phrase data with reference to the attribute word / phrase data holding unit;
If the common word information holds the same attribute information as the conversion instruction attribute information with reference to the common word / attribute correspondence table, the attribute word / phrase data holding unit is searched based on the attribute information. A data conversion unit that captures attribute phrase data having the same meaning as each of the common word information, converts each analysis phrase data into the attribute phrase data, and generates conversion language data;
A data communication unit for transmitting the converted language data to the interactive apparatus on the opposite side via the network;
An interactive apparatus characterized by including:
属性情報と対応づけされた映像データを保持する映像データ保持部と、
前記映像データ保持部から変換指示属性情報に基づいて、対応する映像データを選択し、自己映像データを該映像データに変換する映像データ変換手段と、
を備えることを特徴とする対話装置。 The interactive apparatus according to claim 1,
A video data holding unit that holds video data associated with the attribute information;
Video data conversion means for selecting the corresponding video data based on the conversion instruction attribute information from the video data holding unit and converting the self-video data into the video data;
An interactive apparatus comprising:
入力手段により送信すべき言語データと変換指示する属性情報とを入力する工程と、
入力された言語データを解析して複数の解析語句データに区分する工程と、
前記属性語句データ保持部を参照して、前記各解析語句データに対応する共通語情報を検索する工程と、
前記共通語・属性対応テーブルを参照して、前記各共通語情報が前記変換指示属性情報と同一の属性情報を保持しているか否かを判定する工程と、
前記共通語情報が前記同一の属性情報を保持していると、該属性情報に基づいて、前記属性語句データ保持部を検索して、前記共通語情報と同義の属性語句データを取り込む工程と、
前記解析語句データを前記属性語句データに変換して、変換言語データを生成する工程と、
該変換言語データを前記ネットワークを介して相手側の対話装置へ送信する工程とを含むことを特徴とする対話装置の言語データ変換方法。
An attribute word / phrase data holding unit that holds attribute word / phrase data groups associated with common word information for each attribute information to classify words / phrases in an interactive device connected via a network, and can be held in each common word information A common word / attribute correspondence table with attribute information is provided,
A step of inputting language data to be transmitted by the input means and attribute information for instructing conversion;
Analyzing input language data and dividing it into a plurality of analysis phrase data;
Referring to the attribute phrase data holding unit, searching for common word information corresponding to each analysis phrase data;
Determining whether each of the common word information holds the same attribute information as the conversion instruction attribute information with reference to the common word / attribute correspondence table;
When the common word information holds the same attribute information, the attribute word phrase data holding unit is searched based on the attribute information, and the attribute word phrase data having the same meaning as the common word information is acquired.
Converting the analysis phrase data into the attribute phrase data to generate conversion language data;
Transmitting the converted language data to the other dialog device via the network. A method for converting language data of the dialog device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004066384A JP2005258597A (en) | 2004-03-09 | 2004-03-09 | Interaction apparatus and language data conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004066384A JP2005258597A (en) | 2004-03-09 | 2004-03-09 | Interaction apparatus and language data conversion method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005258597A true JP2005258597A (en) | 2005-09-22 |
Family
ID=35084274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004066384A Pending JP2005258597A (en) | 2004-03-09 | 2004-03-09 | Interaction apparatus and language data conversion method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005258597A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019144884A (en) * | 2018-02-21 | 2019-08-29 | 沖電気工業株式会社 | Information processing device, information processing method, and program |
-
2004
- 2004-03-09 JP JP2004066384A patent/JP2005258597A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019144884A (en) * | 2018-02-21 | 2019-08-29 | 沖電気工業株式会社 | Information processing device, information processing method, and program |
JP6992584B2 (en) | 2018-02-21 | 2022-01-13 | 沖電気工業株式会社 | Information processing equipment, information processing methods, and programs |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11049493B2 (en) | Spoken dialog device, spoken dialog method, and recording medium | |
KR102361389B1 (en) | Method and apparatus to synthesize voice based on facial structures | |
JP4271224B2 (en) | Speech translation apparatus, speech translation method, speech translation program and system | |
CN106486121B (en) | Voice optimization method and device applied to intelligent robot | |
US20040243392A1 (en) | Communication support apparatus, method and program | |
US20100042410A1 (en) | Training And Applying Prosody Models | |
TW200416567A (en) | Multimodal speech-to-speech language translation and display | |
KR20190002067A (en) | Method and system for human-machine emotional communication | |
KR20100111164A (en) | Spoken dialogue processing apparatus and method for understanding personalized speech intention | |
US20140019137A1 (en) | Method, system and server for speech synthesis | |
CN112654991A (en) | Information processing apparatus, information processing method, and program | |
US20060093098A1 (en) | System and method for communicating instant messages from one type to another | |
KR101959439B1 (en) | Method for interpreting | |
JP2005283972A (en) | Speech recognition method, and information presentation method and information presentation device using the speech recognition method | |
CN111415662A (en) | Method, apparatus, device and medium for generating video | |
JPH08190518A (en) | Electronic community system | |
JP2005258597A (en) | Interaction apparatus and language data conversion method | |
KR20220154655A (en) | Device, method and computer program for generating voice data based on family relationship | |
Neog et al. | Speech/Text To Indian Sign Language Using Natural Language Processing | |
JP2005062420A (en) | System, method, and program for content generation | |
KR20220034396A (en) | Device, method and computer program for generating face video | |
KR20200028158A (en) | Media play device, method and computer program for providing multi language voice command service | |
KR20020036280A (en) | Method of and apparatus for transferring finger language on wire or wireless network | |
JP2020204683A (en) | Electronic publication audio-visual system, audio-visual electronic publication creation program, and program for user terminal | |
KR20200085433A (en) | Voice synthesis system with detachable speaker and method using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061030 |