JP2006011592A - 情報処理装置および情報処理方法、プログラム、並びに記録媒体 - Google Patents
情報処理装置および情報処理方法、プログラム、並びに記録媒体 Download PDFInfo
- Publication number
- JP2006011592A JP2006011592A JP2004184680A JP2004184680A JP2006011592A JP 2006011592 A JP2006011592 A JP 2006011592A JP 2004184680 A JP2004184680 A JP 2004184680A JP 2004184680 A JP2004184680 A JP 2004184680A JP 2006011592 A JP2006011592 A JP 2006011592A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- prohibited
- words
- word
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
【課題】禁止用語を含む文を出力することを防止する。
【解決手段】 分割部81は、入力された文を単語に分割する。単語リスト記憶部83は、文中での使用を許可する単語を記憶する。文削除部82は、分割部81から供給される文のすべての単語が、単語リスト記憶部83に記憶される文中での使用を許可する単語である場合、その文を出力する。本発明は、例えば、対話を行うロボット装置の対話の応答文の作成に利用される入出力ペア(の出力例)の取捨選択に適用することができる。
【選択図】図3
【解決手段】 分割部81は、入力された文を単語に分割する。単語リスト記憶部83は、文中での使用を許可する単語を記憶する。文削除部82は、分割部81から供給される文のすべての単語が、単語リスト記憶部83に記憶される文中での使用を許可する単語である場合、その文を出力する。本発明は、例えば、対話を行うロボット装置の対話の応答文の作成に利用される入出力ペア(の出力例)の取捨選択に適用することができる。
【選択図】図3
Description
本発明は、情報処理装置および情報処理方法、プログラム、並びに記録媒体に関し、特に、禁止用語を含む文を出力することを防止することができるようにする情報処理装置および情報処理方法、プログラム、並びに記録媒体に関する。
音声で対話を行う音声対話システムでは、WEB(World Wide Web)上に存在するチャットの対話ログのデータなどを利用して、入力文に応答する応答文を作成することが可能である。例えば、音声対話システムは、チャットの対話ログの1番目の文をユーザからの発話のマッチングの対象となる入力例とし、2番目の文をその入力例に対する出力例として、入力例と出力例の入出力ペアを作成する。そして、ユーザからの発話が入力された場合、音声対話システムは、その発話に対して音声認識処理を行った結果の文字列を入力文として、その入力文と入力例とのマッチングを行い、最も類似する入力例と入出力ペアとなっている出力例を、ユーザからの発話に対する応答文として、合成音などにより出力する。
しかしながら、チャットの対話ログのデータには、応答文として好ましくない単語である禁止用語が含まれている可能性がある。従って、上述したように、チャットの対話ログのデータをそのまま用いて作成された入出力ペアの出力例を応答文として出力するのでは、応答文に禁止用語が含まれる危険性がある。禁止用語を含む応答文をする可能性がある音声対話システムが、例えば、親善大使として接客を行うQRIO(商標)などのロボットの音声対話システムとして採用された場合、禁止用語を含む応答文によって、相手の機嫌を損ねてしまい、親善大使としての役割を果たすことができなくなる可能性がある。
ここで、禁止用語とは、矯激、卑猥、差別的もしくは、他人に不快な印象を与えるような、公の秩序または善良の風俗を害するおそれがある単語である。
また、例えば、不特定のユーザによる書き込みが可能であり、その書き込んだ内容を誰でも閲覧することができる電子掲示板システムにおいて、禁止用語を含む文を掲示することを避けたいと考えるシステム管理者も存在する。
そこで、禁止用語を含む文の出力を防止する方法として、音声対話システムについては、入出力ペアをすべて人手で作成する方法があり、電子掲示板システムについては、他者が作成した文から禁止用語を含む文を、システム管理者が選択して除外する方法などがある。
しかしながら、例えば、広範囲で多種多様な対話を行う音声対話システムでは、膨大な数の入力文と出力文の入出力ペアを必要とするので、そのような膨大な数の入出力ペアをすべて人手で作成するには、莫大な時間と労力が必要となる。また、電子掲示板システムにおいて、他者が作成した文から禁止用語を含む文を、システム管理者が選択するのも、大変な時間と労力を必要とする。
そこで、禁止用語のリストを予め記憶し、そのリストに記憶された禁止用語(と同一の単語)を含む文以外の文を出力する電子掲示板システムがある(例えば、特許文献1参照)。
特開2002−183033号公報
しかしながら、禁止用語は多種多様であり、漏れなくリストに含めることは困難である。従って、上述した電子掲示板システムでは、禁止用語を含む文を出力する可能性がある。
本発明は、このような状況に鑑みてなされたものであり、禁止用語を含む文を出力することを防止することができるようにするものである。
本発明の情報処理装置は、文中での使用を許可する単語を記憶する単語記憶手段と、文のすべての単語が、単語記憶手段に記憶される単語である場合、その文を出力する出力手段とを備えることを特徴とする。
この情報処理装置には、文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段と、文の単語のうち、単語記憶手段と禁止用語記憶手段のいずれにも記憶されていない単語を、単語記憶手段または禁止用語記憶手段に新たに記憶させる記憶制御手段とをさらに設けることができる。
情報処理装置には、文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段と、文が、単語記憶手段と禁止用語記憶手段のいずれにも記憶されていない単語を含む場合、その文を記憶する文記憶手段とをさらに設けることができる。
本発明の情報処理方法は、文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段に記憶される単語である場合、その文を出力する出力ステップを含むことを特徴とする。
本発明のプログラムは、文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段に記憶される単語である場合、その文を出力する出力ステップを含むことを特徴とする。
本発明の記録媒体に記録されているプログラムは、文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段に記憶される単語である場合、その文を出力する出力ステップを含むことを特徴とする。
本発明においては、文中での使用を許可する単語を記憶し、文のすべての単語が、記憶されている単語である場合、その文を出力する。
本発明によれば、禁止用語を含む文を出力することを防止することができる。
以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。
請求項1に記載の情報処理装置は、
入力された文を出力する情報処理装置(例えば、図3の禁止文削除部71)において、
文中での使用を許可する単語を記憶する単語記憶手段(例えば、図3の単語リスト記憶部83)と、
前記文のすべての単語が、前記単語記憶手段に記憶される前記単語である場合、その文を出力する出力手段(例えば、図3の文削除部82)と
を備えることを特徴とする。
入力された文を出力する情報処理装置(例えば、図3の禁止文削除部71)において、
文中での使用を許可する単語を記憶する単語記憶手段(例えば、図3の単語リスト記憶部83)と、
前記文のすべての単語が、前記単語記憶手段に記憶される前記単語である場合、その文を出力する出力手段(例えば、図3の文削除部82)と
を備えることを特徴とする。
請求項2に記載の情報処理装置は、
文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段(例えば、図6の禁止用語リスト記憶部93)と、
前記文の単語のうち、前記単語記憶手段と前記禁止用語記憶手段のいずれにも記憶されていない前記単語を、前記単語記憶手段または前記禁止用語記憶手段に新たに記憶させる記憶制御手段(例えば、図6の文削除部91)と
をさらに備える
ことを特徴とする。
文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段(例えば、図6の禁止用語リスト記憶部93)と、
前記文の単語のうち、前記単語記憶手段と前記禁止用語記憶手段のいずれにも記憶されていない前記単語を、前記単語記憶手段または前記禁止用語記憶手段に新たに記憶させる記憶制御手段(例えば、図6の文削除部91)と
をさらに備える
ことを特徴とする。
請求項3に記載の情報処理装置は、
文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段(例えば、図8の禁止用語リスト記憶部93)と、
前記文が、前記単語記憶手段と前記禁止用語記憶手段のいずれにも記憶されていない単語を含む場合、その文を記憶する文記憶手段(例えば、図8の自動判定不可能文リスト記憶部103)と
をさらに備える
ことを特徴とする。
文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段(例えば、図8の禁止用語リスト記憶部93)と、
前記文が、前記単語記憶手段と前記禁止用語記憶手段のいずれにも記憶されていない単語を含む場合、その文を記憶する文記憶手段(例えば、図8の自動判定不可能文リスト記憶部103)と
をさらに備える
ことを特徴とする。
請求項4に記載の情報処理方法は、
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段(例えば、図3の単語リスト記憶部83)に記憶される前記単語である場合、その文を出力する出力ステップ(例えば、図5のステップS14)
を含むことを特徴とする。
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段(例えば、図3の単語リスト記憶部83)に記憶される前記単語である場合、その文を出力する出力ステップ(例えば、図5のステップS14)
を含むことを特徴とする。
請求項5に記載のプログラムおよび請求項6に記載の記録媒体に記録されているプログラムは、
入力された文を出力する出力処理を、コンピュータに行わせるプログラムにおいて、
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段(例えば、図3の単語リスト記憶部83)に記憶される前記単語である場合、その文を出力する出力ステップ(例えば、図5のステップS14)
を含むことを特徴とする。
入力された文を出力する出力処理を、コンピュータに行わせるプログラムにおいて、
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段(例えば、図3の単語リスト記憶部83)に記憶される前記単語である場合、その文を出力する出力ステップ(例えば、図5のステップS14)
を含むことを特徴とする。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
図1は、本発明を適用したロボット制御システムを備えた2足歩行型のロボットの外観構成例を示している。
ロボット11は、胴体部ユニット23の上部に頭部ユニット21が配設されるとともに、胴体部ユニット23の上部左右に同じ構成の腕部ユニット22Aと22Bがそれぞれ配設され、かつ胴体部ユニット23の下部左右に同じ構成の脚部ユニット24Aと24Bがそれぞれ所定位置に取り付けられことにより構成されている。
また、頭部ユニット21には、ロボット11の「目」として機能するCCD(Charge Coupled Device)カメラ31Aと31B、「耳」として機能するマイクロホン32Aと32B、および「口」として機能するスピーカ33がそれぞれ所定位置に配置されている。
図2は、図1のロボット11の電気的構成例を示している。
ロボット制御システム51の指令により、ユニット制御システム61および対話制御システム62は、ロボット11の動作を制御する。即ち、ユニット制御システム61は、ロボット11の頭部ユニット21、腕部ユニット22Aと22B、胴体部ユニット23、および脚部ユニット24Bと24Bのそれぞれを必要に応じて制御し、ロボット11に所定の動作をさせる。また、対話制御システム62は、ロボット11の発話を制御し、必要に応じて、スピーカ33から、所定の発話をさせる。
ここで、対話制御システム62には、禁止文削除部71が設けられている。禁止文削除部71には、例えば、WEB上のチャットの対話ログのデータの中から、ユーザからの発話のマッチングの対象となる入力例に対する出力例が入力される。禁止文削除部71は、入力された出力例のうち、禁止用語を含まない出力例のみを出力する。対話制御システム62は、禁止文削除部71から出力される出力例とそれに対応する入力例の入出力ペアを用いて、ユーザからの発話に対する応答文を生成し、対応する合成音を、スピーカ33から出力させる。
図3は、図2の禁止文削除部71の詳細構成例を示すブロック図である。
図3の禁止文削除部71は、分割部81、文削除部82、および単語リスト記憶部83から構成される。
分割部81には、例えば、出力例である文が入力される。分割部81は、文を単語単位に分割し、その結果得られる単語単位に分割された文を、文削除部82に供給する。
文削除部82は、単語リスト記憶部83に記憶されている単語リストを読み出し、その単語リストに基づいて、分割部81から供給される文から、出力を許可する文を選択して出力する。
単語リスト記憶部83は、文中での使用を許可する単語、即ち、禁止用語以外の単語のリストである単語リストを記憶している。なお、単語リスト記憶部83の単語リストには、禁止用語以外の単語のすべてが登録されている必要はない。また、単語リストに登録される単語の区切り方は、分割部81が分割する単語の区切り方と同一である。
以上のように構成される禁止文削除部71では、分割部81が、入力された文を単語に分割して、文削除部82に供給する。そして、文削除部82が、単語リスト記憶部83に記憶された単語リストに基づいて、分割部81からの文から、出力を許可する文を選択して出力する。
図4は、図3の単語リスト記憶部83に記憶されている単語リストの例を示している。
図4の単語リストには、文中での使用を許可する単語、即ち、禁止用語以外の単語である「また」、「そして」、「昨日」、「今日」、「明日」、「は」、「が」、「晴れ」、「曇り」、「雨」、「です」、「だ」、「、」、「。」、・・・が登録されている。
図3の文削除部82は、図4の単語リストに登録されている単語「また」、「そして」、「昨日」、「今日」、「明日」、「は」、「が」、「晴れ」、「曇り」、「雨」、「です」、「だ」、「、」、「。」、・・・のみから構成される文を、出力を許可する文として、分割部81からの文の中から選択して出力する。
図5は、図3の禁止文削除部71が行う禁止文削除処理を説明するフローチャートである。この禁止文削除処理は、分割部81に文が入力されたとき開始される。
ステップS11において、分割部81は、入力された文を単語単位に分割する。例えば、「昨日は晴れです。」という文が、分割部81に入力された場合、分割部81は、例えば、「昨日 は 晴れ です 。」のように単語単位に分割する。このように、文を単語に分割するプログラムは既にいくつか存在している。分割部81は、以上のようにして単語単位に分割された文を文削除部82に供給し、ステップS12に進む。
ステップS12において、文削除部82は、分割部81から供給される文の単語の1番目から順に、処理対象の処理単語とする。そして、文削除部82は、処理単語が、単語リスト記憶部83に記憶された単語リストに登録されているかどうかを判定する。
ステップS12において、処理単語が単語リストに登録されていないと判定された場合、即ち、文が禁止用語以外の単語ではない単語、つまり、禁止用語であるかもしれない単語を含んでいる場合、文削除部82は、ステップS15に進み、その文を破棄して、処理を終了する。
例えば、単語リスト記憶部83が図4の単語リストを記憶しており、「今日 は ×× です 。」という単語単位に分割された文が分割部81から文削除部82に供給された場合には、文を構成する単語のうち「今日」、「は」、「です」、「。」は、単語リストにあるが、「××」は、単語リストにないので、文削除部82は、文「今日 は ×× です 。」を破棄し、出力しない。
以上のように、禁止用語以外の単語のリストである単語リストに登録されていない単語を含む文は破棄されるので、禁止用語、さらには、禁止用語かもしれない単語を含む文を出力することを防止することができる。
一方、ステップS12において、処理単語が単語リストに登録されていると判定された場合、ステップS13に進み、文削除部82は、文のすべての単語を処理単語にしたかどうかを判定する。
ステップS13において、文のすべての単語を、まだ処理単語にしていないと判定された場合、ステップS12に戻り、文削除部82は、文の単語のうち、まだ処理単語にしていない単語を、新たに処理単語として、上述した処理を繰り返す。
また、ステップS13において、文のすべての単語を処理単語にしたと判定された場合、即ち、文のすべての単語が、禁止用語以外の単語である場合、ステップS14に進み、文削除部82は、その文を出力を許可する文として選択して出力し、処理を終了する。これにより、禁止用語以外の単語のみを含む文を出力することができる。
例えば、単語リスト記憶部83が図4の単語リストを記憶しており、「昨日 は 晴れ です 。」という単語単位に分割された文が分割部81から文削除部82に供給された場合には、文を構成するすべての単語「昨日」、「は」、「晴れ」、「です」、「。」は、単語リストにあるので、文削除部82は、文「昨日 は 晴れ です 。」を出力する。
また、単語リスト記憶部83が図4の単語リストを記憶しており、「明日 は 曇り です 。」という単語単位に分割された文が分割部81から文削除部82に供給された場合には、文を構成するすべての単語「明日」、「は」、「曇り」、「です」、「。」は、単語リストにあるので、文削除部82は、文「明日 は 曇り です 。」を出力する。
以上のように、単語リストに登録されている、禁止用語以外の単語のみを含む文を出力するようにしたので、禁止用語、さらには禁止用語かもしれない単語を含む文が出力されることを、容易に防止することができる。
即ち、禁止用語を登録し、禁止用語を含む文を破棄(削除)する場合、禁止用語を含む文の出力を確実に防止するには、禁止用語のすべてを登録する必要があるが、禁止用語のすべてを漏れなく登録するのは、容易ではない。
これに対して、禁止用語以外の単語のみを単語リストに登録し、禁止用語以外の単語のみを含む文を出力する場合には、禁止用語以外の単語ではない単語、即ち、禁止用語や禁止用語かもしれない単語を含む文の出力を、確実に防止することができる。
さらに、禁止用語以外の単語を登録する単語リストは、例えば、一般の新聞の電子データ、国語辞書や英和辞書等の電子データ、音声認識や機械翻訳用の辞書データなどの、禁止用語以外の単語だけの既存のデータから、容易に作成することができる。
なお、図2のロボット11では、対話制御システム62において、例えば、web上のチャットや電子掲示板などの対話ログから、入力例と出力例とからなる入出力ペアが作成され、その入出力ペアの出力例が、文として、禁止文削除部71に入力される。そして、禁止削除部71で破棄されずに出力された出力例と、対応する入力例との入出力ペアが対話に利用される。
即ち、対話制御システム62では、ユーザによる発話が音声認識され、その音声認識結果としての文字列と、多数の入出力ペアの入力例それぞれとのマッチングが行われる。そして、例えば、音声認識結果としての文字列に最も類似する入力例と入出力ペアとなっている出力例に基づき、音声合成が行われ、その出力例に対応する合成音が、ユーザによる発話に対する応答として、スピーカ33から出力される。
従って、ロボット11の応答としての合成音に、禁止用語や禁止用語かもしれない単語が含まれることを、確実に防止することができる。
図6は、図2のロボット11の禁止文削除部71の他の構成例を示すブロック図である。
図6の禁止文削除部71は、分割部81、文削除部91、単語リスト記憶部83、禁止用語リスト記憶部93、および禁止用語候補リスト記憶部94から構成される。なお、図3の禁止文削除部71と同一のものは、同一の符号を付してあり、繰り返しになるので説明は省略する。
文削除部91は、図3の文削除部82と同様に、単語リスト記憶部83に記憶されている単語リストを読み出し、その単語リストに基づいて、分割部81から供給される文から、出力を許可する文を選択して出力する。また、文削除部91は、分割部81から供給される文に基づいて、禁止用語候補リスト記憶部94に記憶されている禁止用語候補リストに、禁止用語の候補となる禁止用語候補を登録する。ここで、文削除部91は、図4の単語リストの単語と同様に、禁止用語候補リストに禁止用語候補を並べていく。さらに、文削除部91は、禁止用語候補リスト記憶部94から禁止用語候補を読み出し、単語リスト記憶部83または禁止用語リスト記憶部93に供給して記憶させる。
禁止用語リスト記憶部93は、禁止用語のリストである禁止用語リストを記憶している。禁止用語リストには、図4の単語リストの単語と同様に、禁止用語が並べられている。また、禁止用語リスト記憶部93は、文削除部91から供給される禁止用語候補を、記憶している禁止用語リストに新たに登録(記憶)する。なお、禁止用語リストに登録される禁止用語である単語の区切り方は、分割部81が分割する単語の区切り方と同一である。
禁止用語候補リスト記憶部94は、文削除部91から供給される禁止用語候補を、禁止用語候補のリストである禁止用語候補リストに登録(記憶)する。
図7は、図6の禁止文削除部71が行う禁止文削除処理を説明するフローチャートである。この文削除処理は、分割部81に文が入力されたとき開始される。
ステップS31乃至S33の処理は、図5のステップS11乃至S13と同様の処理であるので、説明は省略する。なお、ステップS32において、文削除部91が、処理単語が単語リストに登録されていないと判定した場合、ステップS34に進む。
ステップS34において、文削除部91は、禁止用語リスト記憶部93に記憶された処理単語が禁止用語リストに登録されているかどうかを判定する。ステップS34において、処理単語が禁止用語リストに登録されていると判定された場合、ステップS33に進む。
また、ステップS34において、処理単語が禁止用語リストに登録されていないと判定された場合、即ち、処理単語が単語リストにも禁止用語リストにも登録されていない場合、文削除部91は、ステップS35に進み、処理単語を、禁止用語の候補である禁止用語候補として、禁止用語候補リスト記憶部94に供給する。そして、禁止用語候補リスト記憶部94は、文削除部91からの処理単語を、禁止用語候補として、禁止用語候補リストに登録して、ステップS33に進む。
ステップS33では、図5のステップS13と同様に、文のすべての単語を、処理単語にしたかどうかが判定され、文のすべての単語を、処理単語にしたと判定された場合、ステップS36に進み、文削除部91は、禁止用語候補リスト記憶部94から禁止用語候補リストを読み出し、例えばユーザからの指示に基づいて、その禁止用語候補リストに登録されている禁止用語候補を、単語リスト記憶部83または禁止用語リスト記憶部93に供給する。ここで、ユーザは、禁止用語候補リストの禁止用語候補が、禁止用語であるかどうかを判断し、禁止用語であると判断した場合、禁止用語リスト記憶部93にその禁止用語候補を供給するように指示を行い、禁止用語ではないと判断した場合、単語リスト記憶部83にその禁止用語候補を供給するように指示を行う。
単語リスト記憶部83は、文削除部91から禁止用語候補が供給された場合、その禁止用語候補を、禁止用語でない単語として単語リストに新たに登録する。また、禁止用語リスト記憶部93は、文削除部91から禁止用語候補が供給された場合、その禁止用語候補を、禁止用語として、禁止用語リストに新たに登録する。
なお、禁止用語候補リストの禁止用語候補は、例えば、合成音によって、あるいは図示せぬディスプレイによって、ユーザに提示される。そして、ユーザは、例えば、音声によって、あるいは図示せぬキーボードを操作することによって、禁止用語候補を、単語リスト記憶部83または禁止用語リスト記憶部93のいずれに供給するかを指示する。
その後、ステップS36からステップS37に進み、文削除部91は、文のすべての単語が単語リストに登録されていたかどうか、即ちすべての処理単語において、ステップS32とS33の処理が行われたかどうかを判定する。
ステップS37において、文のすべての単語が単語リストに登録されていたと判定された場合、即ち、文のすべての単語が禁止用語以外の単語である場合、文削除部91は、ステップS38に進み、その文を出力を許可する文として選択して出力し、処理を終了する。
一方、ステップS37において、文のすべての単語が単語リストに登録されていたのではないと判定された場合、即ち、文が禁止用語以外の単語ではない単語、つまり、禁止用語であるかもしれない単語を含んでいる場合、文削除部91は、ステップS39に進み、その文を破棄して、処理を終了する。
以上のように、禁止文削除部71は、分割部81から供給される文から、出力を許可する文を選択しつつ、単語リスト記憶部83の単語リストまたは禁止用語リスト記憶部93の禁止用語リストに、新たな単語を登録することができる。従って、禁止文削除部71は、その単語リストに基づいて、出力を許可する文を選択することにより、図3の禁止文削除部71に比べて、より多くの単語リストに登録されている単語のみを含む文、即ち禁止用語を含まない文を出力することができる。
なお、図7のステップS37において、文削除部91は、文のすべての単語が単語リストに登録されているかどうかではなく、文のすべての単語が禁止用語リストに登録されているかどうかを判定し、禁止用語リストに登録されていない場合、ステップS38に進み、禁止用語リストに登録されている場合、ステップS39に進むようにすることもできる。
例えば、文削除部91が、単語リスト記憶部83の単語リストに基づいて出力を許可する文を選択する場合、単語リストに登録されている単語のみから構成される文が、出力を許可する文として選択されるので、基本的に、禁止用語リスト記憶部93の禁止用語リストに基づいて出力を許可する文を選択する場合に比べて、条件が厳しくなる。従って、禁止用語を含む文の出力を確実に防止したい場合、文削除部91においては、単語リストに基づいて、出力を許可する文を選択するようにすればよい。
一方、文削除部91が、禁止用語リストに基づいて出力を許可する文を選択する場合、禁止用語リストに登録されている単語を含まない文が、出力を許可する文として選択されるので、基本的に、単語リストに基づいて出力を許可する文を選択する場合に比べて、条件が緩くなる。従って、最低限の禁止用語を含む文の出力を防止しつつ、より多くの文を出力したい場合、文削除部91では、禁止用語リストに基づいて、出力を許可する文を選択するようにすればよい。
なお、例えば、ユーザの指示により、単語リストと禁止用語リストのいずれに基づいて、文削除部91に出力を許可する文を選択させるかを設定することができる。
図8は、図2のロボット11の禁止文削除部71のさらに他の構成例を示すブロック図である。
図8の禁止文削除部71は、分割部81、単語リスト記憶部83、文削除部101、禁止用語リスト記憶部93、および自動判定不可能文リスト記憶部103から構成される。なお、図3または図6の禁止文削除部71と同一のものは、同一の符号を付してあり、繰り返しになるので説明は省略する。
文削除部101は、単語リスト記憶部83に記憶されている単語リストと、禁止用語リスト記憶部93に記憶されている禁止用語リストを読み出し、その単語リストと禁止用語リストに基づいて、分割部81から供給される文から、出力を許可する文を選択し、出力する。また、文削除部101は、分割部81から供給される文のうち、単語リストに登録されている単語以外の単語を含み、かつ禁止用語リストに登録されている単語以外の単語を含む文を、出力を許可する文として選択するかどうかの自動判定が不可能な文である自動判定不可能文として、自動判定不可能文リスト記憶部103に供給する。
自動判定不可能文リスト記憶部103は、文削除部101から供給される自動判定不可能文を、自動判定不可能文のリストである自動判定不可能文リストに登録(記憶)する。ここで、自動判定不可能文リスト記憶部103は、図4の単語リストの単語と同様に、自動判定不可能文リストに自動判定不可能文を並べていく。
図9は、図8の禁止文削除部71が行う禁止文削除処理を説明するフローチャートである。この禁止文削除処理は、分割部81に文が入力されたとき開始される。
ステップS51乃至S54の処理は、図5のステップS11乃至S14と同様の処理であるので、説明は省略する。なお、図9のステップS52では、文削除部101が、処理単語が単語リストに登録されていないと判定した場合、ステップS55に進む。
ステップS55において、文削除部101は、処理単語が禁止用語リスト記憶部93に記憶された禁止用語リストに登録されているかどうかを判定し、処理単語が禁止用語リストに登録されていないと判定した場合、即ち、文が単語リストにも禁止用語リストにも登録されていない単語を含んでいる場合、ステップ56に進み、文削除部101は、その文を、出力を許可する文として選択するかどうかの自動判定が不可能な文である自動判定不可能文として、自動判定不可能文リスト記憶部103に供給する。そして、自動判定不可能文リスト記憶部103は、文削除部101からの自動判定不可能文を、自動判定不可能文リストに登録し、処理を終了する。
また、ステップS55において、処理単語が禁止用語リストに登録されていると判定された場合、即ち文が禁止用語を含んでいる場合、文削除部101は、ステップS57に進み、その文を破棄し、処理を終了する。
図9の禁止文削除処理が行われた後、例えば、ユーザは、自動判定不可能文リスト記憶部103に記憶されている自動判定不可能文が、禁止用語を含んでいるかどうかを判断し、禁止用語を含んでいないと判断した場合、文削除部101にその自動判定不可能文を出力するように指示する。文削除部101は、ユーザの指示にしたがって、自動判定不可能文リスト記憶部103に記憶されている自動判定不可能文のうち、禁止用語を含んでいない自動判定不可能文を出力する。
図9の禁止文削除処理を行うことにより、ユーザは、単語リストおよび禁止用語リストのいずれにも登録されていない単語を含む文のみについて、禁止用語を含んでいるかどうか判断し、出力の有無を指示すればよいので、すべての文を判断する場合に比べて、ユーザの労力を軽減することができる。
なお、自動判定不可能文リストの自動判定不可能文は、例えば、合成音によって、あるいは図示せぬディスプレイによって、ユーザに提示される。そして、ユーザは、例えば、音声によって、あるいは図示せぬキーボードを操作することによって、自動判定不可能文を、出力するかどうかを指示する。
図10は、図2のロボット11の禁止文削除部71のさらに他の構成例を示すブロック図である。
図10の禁止文削除部71は、分割部81、単語リスト記憶部83、禁止用語リスト記憶部93、禁止用語候補記憶部94、および自動判定不可能文リスト記憶部103から構成される。なお、図6の禁止文削除部71や図8の禁止文削除部71と同一のものは、同一の符号を付してあり、繰り返しになるので説明は省略する。
文削除部121は、図6の文削除部91と同様に、分割部81から供給される文に基づいて、禁止用語候補リスト記憶部94に記憶されている禁止用語候補リストに、禁止用語の候補となる禁止用語候補を登録する。また、文削除部121は、図8の文削除部101と同様に、単語リスト記憶部83に記憶されている単語リストと、禁止用語リスト記憶部93に記憶されている禁止用語リストとを読み出し、その単語リストと禁止用語リストに基づいて、分割部81から供給される文から、出力を許可する文を選択し、出力する。さらに、文削除部121は、分割部81から供給される文のうち、単語リストに登録されている単語以外の単語を含み、かつ禁止用語リストに登録されている単語以外の単語を含む文を、自動判定不可能文として、自動判定不可能文リスト記憶部103に供給する。
図11は、図10の禁止文削除部71が行う禁止文削除処理を説明するフローチャートである。この禁止文削除処理は、分割部81に文が入力されたとき開始される。
ステップS61乃至S65,S69の処理は、図9のステップS51乃至S55,S57の処理と同一であるので、説明は省略する。なお、ステップS65では、文削除部121が、処理単語が禁止用語リストに登録されていないと判定した場合、ステップS66に進む。
ステップS66において、文削除部121は、処理単語が、禁止用語候補リスト記憶部94に記憶された禁止用語候補リストに登録されているかどうかを判定する。
ステップS66において、処理単語が、禁止用語候補リストに登録されていないと判定された場合、ステップS67に進み、文削除部121は、処理単語を、禁止用語候補として、禁止用語候補リスト記憶部94に供給する。そして、禁止用語候補リスト記憶部94は、文削除部121からの禁止用語候補を、禁止用語候補リストに登録し、ステップS68に進む。
一方、ステップS66において、処理単語が、禁止用語候補リストに登録されていると判定された場合、ステップS68に進む。ステップS68において、文が単語リストにも禁止用語リストにも登録されていない単語を含んでいるので、文削除部121は、その文を、自動判定が不可能な文である自動判定不可能文として、自動判定不可能文リスト記憶部103に供給する。そして、自動判定不可能文リスト記憶部103は、文削除部121からの自動判定不可能文を、自動判定不可能文リストに登録し、処理を終了する。
図11の禁止文削除処理が行われた後、文削除部121は、図6の文削除部91と同様に、例えば、ユーザの指示により、禁止用語候補リスト記憶部94に記憶されている禁止用語候補を、単語リスト記憶部83の単語リストまたは禁止用語リスト記憶部93の禁止用語リストに新たに登録させる。
また、文削除部121は、図8の文削除部101と同様に、例えば、ユーザの指示により、自動判定不可能文リスト記憶部103に記憶されている自動判定不可能文のうち、禁止用語を含んでいない自動判定不可能文を出力する。
図12は、図10の禁止文削除部71が行う禁止文削除処理を説明する他のフローチャートである。この禁止文削除処理は、分割部81に文が入力されたとき開始される。
なお、図12では、処理単語が単語リストに登録されていない単語であると判定された場合においても、文のすべての単語を処理単語として処理が行われる。
ステップS71乃至S77の処理は、図11のステップS61,S62,S65乃至S68と同様の処理であるので、説明は省略する。
ステップS72、ステップS73またはステップS76の処理後は、ステップS77に進み、文のすべての単語を処理単語にしたかどうかを判定し、文のすべての単語を、まだ処理単語にしていないと判定された場合、ステップS72に戻り、文削除部121は、文の単語のうち、まだ処理単語とされていない単語を、新たに処理単語とし、上述した処理を繰り返す。
このように、処理単語がどのような単語であっても、すべての単語を処理単語とするまで、ステップS72乃至S76の処理を行うので、処理単語が単語リストに登録されている単語以外の単語である場合に、処理を終了する図11の禁止文削除処理に比べて、禁止用語候補リストに登録される単語を増加させることができる。従って、図12の禁止文削除処理が行われた後、図11の禁止文削除処理の場合と同様に、例えば、ユーザの指示にしたがい、文削除部121が、禁止用語候補リストの禁止用語候補を単語リスト記憶部83の単語リストまたは禁止用語リスト記憶部93の禁止用語リストに登録させることにより、単語リストまたは禁止用語リストに登録される単語を増加させることができる。これにより、単語リストと禁止用語リストに登録されていない単語を含む文である自動判定不可能文が軽減するので、ユーザの労力を軽減することができる。
一方、ステップS77において、すべての単語を処理単語にしたと判定された場合、文削除部121は、ステップS78に進み、すべての単語が単語リストに登録されていたかどうか、即ち、すべての処理単語においてステップS72とS77の処理が行われたかどうかを判定する。
ステップS78において、すべての単語が単語リストに登録されていたと判定された場合、即ち、文が単語リストに登録されている単語のみから構成される場合、ステップS79に進み、文削除部121は、その文を、出力を許可する文として選択して出力する。
また、ステップS78において、すべての単語が単語リストに登録されていないと判定された場合、即ち、文が単語リストに登録されている単語以外の単語を含んでいる場合、ステップS80に進み、文削除部121は、その文を破棄して、処理を終了する。
図12の禁止文削除処理が行われた後、文削除部121は、図11の禁止文削除処理が行われた後と同様に、禁止用語候補リスト記憶部94に記憶されている禁止用語候補を、単語リスト記憶部83の単語リストまたは禁止用語リスト記憶部93の禁止用語リストに登録させる。また、文削除部121は、自動判定不可能文リスト記憶部103に記憶されている自動判定不可能文のうち、禁止用語を含んでいない自動判定不可能文を出力する。
なお、上述の説明において、文とは一文に限定されるものではない。例えば、茶筅などの単語分割のソフトウェアが分割部81の単語分割処理を実行する場合、複数の文を同時に単語に分割することができる。また、文が一文ではない場合、分割部81は、例えば文を、句点「。」の前後で区切ることにより、一文ごとに分割して単語分割を行うようにすることもできる。
また、上述の説明において、単語とは、上述した処理において、1つのまとまりとして扱った方がよい単位のことであり、言語学的な単語とは必ずしも一致しない。
さらに、図2の禁止文削除部71は、ロボット11とは別の装置とし、その別の装置である禁止文削除部71が出力する文である出力例と、対応する入力例との入出力ペアを、対話制御システム62に登録して、応答文の作成に利用することができる。
また、禁止文削除部71は、インターネット上のチャットや掲示板の対話ログを、適宜、無線または有線での通信によって収集して、入出力ペアを更新することができる。
さらに、本発明は、対話の応答文の作成に利用される入出力ペア(の出力例)の取捨選択の他、掲示板に投稿されたメッセージの取捨選択などに適用可能である。
また、文や単語の言語は、日本語に限定されない。
さらに、図6、図8、および図10の単語リスト記憶部83の単語リストには、文中での使用を許可する単語が、禁止用語リスト記憶部93の禁止用語リストには禁止用語が、予め登録されているようにしたが、単語リストや禁止用語リストには、予め何も記憶しないようにする(空にしておく)こともできる。また、単語リストには、文中での使用を許可する単語のうちの一部を、禁止用語リストには、禁止用語のうちの一部を予め登録するようにすることもできる。
また、単語リストや禁止用語リストに単語が十分に登録された場合、図6(図8、図10)の文削除部91(101、121)は、単語リストや禁止用語リストに単語を登録しないようにすることもできる。この場合、文削除部91(101、121)は、既に単語リストや禁止用語リストに登録されている単語に基づいて、文を出力を許可する文として選択するかどうかを判定する。
次に、上述した一連の処理は、専用のハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図13は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク205やROM203に予め記録しておくことができる。
あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体211に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体211は、いわゆるパッケージソフトウエアとして提供することができる。
なお、プログラムは、上述したようなリムーバブル記録媒体211からコンピュータにインストールする他、ダウンロードサイトから、デジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部208で受信し、内蔵するハードディスク205にインストールすることができる。
コンピュータは、CPU(Central Processing Unit)202を内蔵している。CPU202には、バス201を介して、入出力インタフェース210が接続されており、CPU202は、入出力インタフェース210を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部207が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)203に格納されているプログラムを実行する。あるいは、また、CPU202は、ハードディスク205に格納されているプログラム、衛星若しくはネットワークから転送され、通信部208で受信されてハードディスク205にインストールされたプログラム、またはドライブ209に装着されたリムーバブル記録媒体211から読み出されてハードディスク205にインストールされたプログラムを、RAM(Random Access Memory)204にロードして実行する。これにより、CPU202は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU202は、その処理結果を、必要に応じて、例えば、入出力インタフェース210を介して、CRT(Cathode Ray Tube),LCD(Liquid Crystal Display)、スピーカ等で構成される出力部206から出力、あるいは、通信部208から送信、さらには、ハードディスク205やリムーバブル記録媒体211に記録等させる。
ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
62 対話制御システム, 71 禁止文削除部, 81 分割部, 82 文削除部, 83 単語リスト記憶部, 91 文削除部, 93 禁止用語リスト記憶部, 94 禁止用語候補リスト記憶部, 101 文削除部, 103 自動判定不可能文リスト記憶部, 121 文削除部,201 バス, 202 CPU, 203 ROM, 204 RAM, 205 ハードディスク, 206 出力部, 207 入力部, 208 通信部, 209 ドライブ, 210 入出力インタフェース, 211 リムーバブル記録媒体
Claims (6)
- 入力された文を出力する情報処理装置において、
文中での使用を許可する単語を記憶する単語記憶手段と、
前記文のすべての単語が、前記単語記憶手段に記憶される前記単語である場合、その文を出力する出力手段と
を備えることを特徴とする情報処理装置。 - 文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段と、
前記文の単語のうち、前記単語記憶手段と前記禁止用語記憶手段のいずれにも記憶されていない前記単語を、前記単語記憶手段または前記禁止用語記憶手段に新たに記憶させる記憶制御手段と
をさらに備える
ことを特徴とする請求項1に記載の情報処理装置。 - 文中での使用を許可しない単語である禁止用語を記憶する禁止用語記憶手段と、
前記文が、前記単語記憶手段と前記禁止用語記憶手段のいずれにも記憶されていない単語を含む場合、その文を記憶する文記憶手段と
をさらに備える
ことを特徴とする請求項1に記載の情報処理装置。 - 入力された文を出力する情報処理装置の情報処理方法において、
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段に記憶される前記単語である場合、その文を出力する出力ステップ
を含むことを特徴とする情報処理方法。 - 入力された文を出力する出力処理を、コンピュータに行わせるプログラムにおいて、
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段に記憶される前記単語である場合、その文を出力する出力ステップ
を含むことを特徴とするプログラム。 - 入力された文を出力する出力処理を、コンピュータに行わせるプログラムが記録されている記録媒体において、
前記文のすべての単語が、文中での使用を許可する単語を記憶する単語記憶手段に記憶される前記単語である場合、その文を出力する出力ステップ
を含むことを特徴とするプログラムが記録されている記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004184680A JP2006011592A (ja) | 2004-06-23 | 2004-06-23 | 情報処理装置および情報処理方法、プログラム、並びに記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004184680A JP2006011592A (ja) | 2004-06-23 | 2004-06-23 | 情報処理装置および情報処理方法、プログラム、並びに記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006011592A true JP2006011592A (ja) | 2006-01-12 |
Family
ID=35778817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004184680A Withdrawn JP2006011592A (ja) | 2004-06-23 | 2004-06-23 | 情報処理装置および情報処理方法、プログラム、並びに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006011592A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014157580A1 (ja) * | 2013-03-28 | 2014-10-02 | 株式会社コナミデジタルエンタテインメント | 管理装置、管理方法、端末装置、制御方法、及びプログラム |
WO2014208238A1 (ja) * | 2013-06-28 | 2014-12-31 | 株式会社コナミデジタルエンタテインメント | 管理装置、管理方法、端末装置、制御方法、及びプログラム |
JP2015118689A (ja) * | 2013-06-28 | 2015-06-25 | 株式会社コナミデジタルエンタテインメント | 端末装置、制御方法、及びプログラム |
US11049131B2 (en) | 2013-06-28 | 2021-06-29 | Konami Digital Entertainment Co., Ltd. | Management device, management method, terminal device, control method, and program |
US11475472B2 (en) | 2013-03-28 | 2022-10-18 | Konami Digital Entertainment Co., Ltd. | Management device, management method, terminal device, control method, and program |
-
2004
- 2004-06-23 JP JP2004184680A patent/JP2006011592A/ja not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014157580A1 (ja) * | 2013-03-28 | 2014-10-02 | 株式会社コナミデジタルエンタテインメント | 管理装置、管理方法、端末装置、制御方法、及びプログラム |
US11475472B2 (en) | 2013-03-28 | 2022-10-18 | Konami Digital Entertainment Co., Ltd. | Management device, management method, terminal device, control method, and program |
WO2014208238A1 (ja) * | 2013-06-28 | 2014-12-31 | 株式会社コナミデジタルエンタテインメント | 管理装置、管理方法、端末装置、制御方法、及びプログラム |
JP2015118689A (ja) * | 2013-06-28 | 2015-06-25 | 株式会社コナミデジタルエンタテインメント | 端末装置、制御方法、及びプログラム |
US11049131B2 (en) | 2013-06-28 | 2021-06-29 | Konami Digital Entertainment Co., Ltd. | Management device, management method, terminal device, control method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5172682B2 (ja) | 音素のnグラムを使用した単語および名前の生成 | |
US6366882B1 (en) | Apparatus for converting speech to text | |
US7277851B1 (en) | Automated creation of phonemic variations | |
US8862478B2 (en) | Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server | |
US8954335B2 (en) | Speech translation system, control device, and control method | |
US6587822B2 (en) | Web-based platform for interactive voice response (IVR) | |
US20110224972A1 (en) | Localization for Interactive Voice Response Systems | |
US20040120472A1 (en) | Voice response system | |
US9442920B2 (en) | Speech translation system, dictionary server, and program | |
CN109817210B (zh) | 语音写作方法、装置、终端和存储介质 | |
JP2006146182A (ja) | 音声コマンドを明瞭化する集中化された方法およびシステム | |
US8204738B2 (en) | Removing bias from features containing overlapping embedded grammars in a natural language understanding system | |
GB2323694A (en) | Adaptation in speech to text conversion | |
US7881932B2 (en) | VoiceXML language extension for natively supporting voice enrolled grammars | |
JP2006011592A (ja) | 情報処理装置および情報処理方法、プログラム、並びに記録媒体 | |
JP2009211629A (ja) | 対話装置、重み情報学習装置、対話方法、重み情報学習方法、およびプログラム | |
CN110956020B (zh) | 呈现校正候选的方法、存储介质和信息处理设备 | |
JP4881903B2 (ja) | 自然言語対話エージェントのためのスクリプト作成支援方法及びプログラム | |
JP2003162293A (ja) | 音声認識装置及び方法 | |
US7206738B2 (en) | Hybrid baseform generation | |
CN110955401B (zh) | 声音回放区间控制方法、计算机可读存储介质和信息处理装置 | |
JP2001013992A (ja) | 音声理解装置 | |
JP2003208192A (ja) | 文書処理装置、文書読み上げ速度制御方法、記憶媒体、及びプログラム | |
US20150142442A1 (en) | Identifying a contact | |
JP2004287756A (ja) | 電子メール作成装置及び電子メール作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070904 |