JP2018077698A - 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム - Google Patents

発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム Download PDF

Info

Publication number
JP2018077698A
JP2018077698A JP2016219483A JP2016219483A JP2018077698A JP 2018077698 A JP2018077698 A JP 2018077698A JP 2016219483 A JP2016219483 A JP 2016219483A JP 2016219483 A JP2016219483 A JP 2016219483A JP 2018077698 A JP2018077698 A JP 2018077698A
Authority
JP
Japan
Prior art keywords
inappropriate
topic word
utterance
score
text analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016219483A
Other languages
English (en)
Inventor
のぞみ 小林
Nozomi Kobayashi
のぞみ 小林
齋藤 邦子
Kuniko Saito
邦子 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016219483A priority Critical patent/JP2018077698A/ja
Publication of JP2018077698A publication Critical patent/JP2018077698A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】システムの発話として不適切な話題の発話文を抽出することができる。【解決手段】発話文抽出装置10は、ユーザ発話を受け付ける入力部10と、ユーザ発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するテキスト解析部22と、不適切話題語とユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、ユーザ発話が不適切発話か否かを判定する不適切発話検出部24と、不適切発話検出部24の判定結果と前記ユーザ発話とを対応付けてデータベースに登録するデータベース登録部26と、を備える。【選択図】図1

Description

本発明は、発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラムに関し、特に、物議を醸す可能性のある話題を含む発話文を抽出するための発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラムに関するものである。
大量のユーザの発話文から自動的に発話候補文を獲得する方法として、たとえば特許文献1や非特許文献1に開示された方法がある。これらは発話が日本語として正しいかどうかを判定することで、質の良い発話文を抽出する方法である。
特許第5676683号公報
稲葉通将,神園彩香,高橋健一,Twitterを用いた非タスク指向型対話システムのための発話候補文獲得,人工知能学会論文誌 Vol.29 No.1 2014. (https://www.jstage.jst.go.jp/article/tjsai/29/1/29_C-DSD48/_pdf)
上記の従来の手法は、上述したように日本語としての正しさを判定するものであり、システムの発話として不適切な発話をフィルタリングすることができない。例えば、「北方領土は日本のものだ」という発話は日本語として問題のない文であるが、聞く人によっては問題と感じる可能性があるためシステムの発話として適切ではない。
本発明は、上記従来技術の問題点に鑑みて成されたものであり、システムの発話として不適切な話題の発話文を抽出することができる発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る発話文抽出装置は、ユーザ発話を受け付ける入力部と、前記ユーザ発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するテキスト解析部と、不適切話題語と前記ユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、前記テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、前記ユーザ発話が不適切発話か否かを判定する不適切発話検出部と、前記不適切発話検出部の判定結果と前記ユーザ発話とを対応付けてデータベースに登録するデータベース登録部と、を有する。
本発明に係る不適切話題語リスト生成装置は、テキスト集合を受け付ける入力部と、前記テキスト集合を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するテキスト解析部と、前記テキスト解析情報に基づいて、不適切話題語候補を抽出するための予め定められた用語を伴う前記不適切話題語候補を抽出して、前記用語を伴って前記不適切話題語候補が出現する第1の頻度を算出すると共に、前記不適切話題語候補が出現する第2の頻度を算出する頻度算出部と、前記第1の頻度及び前記第2の頻度に基づいて、前記不適切話題語候補の不適切度合いを表すスコアを算出するスコア算出部と、前記スコアが予め定めた閾値以上の場合に、前記スコアに対応する前記不適切話題語候補を不適切話題語として不適切話題語リストデータベースに登録するデータベース登録部と、を有する。
本発明に係る発話文抽出方法は、入力部が、ユーザ発話を受け付け、テキスト解析部が、前記ユーザ発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成し、不適切発話検出部が、不適切話題語と前記ユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、前記テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、前記ユーザ発話が不適切発話か否かを判定し、データベース登録部が、前記不適切発話検出部の判定結果と前記ユーザ発話とを対応付けてデータベースに登録する。
本発明に係る不適切話題語リスト生成方法は、入力部が、テキスト集合を受け付け、テキスト解析部が、前記テキスト集合を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成し、頻度算出部が、前記テキスト解析情報に基づいて、不適切話題語候補を抽出するための予め定められた用語を伴う前記不適切話題語候補を抽出して、前記用語を伴って前記不適切話題語候補が出現する第1の頻度を算出すると共に、前記不適切話題語候補が出現する第2の頻度を算出し、スコア算出部が、前記第1の頻度及び前記第2の頻度に基づいて、前記不適切話題語候補の不適切度合いを表すスコアを算出し、データベース登録部が、前記スコアが予め定めた閾値以上の場合に、前記スコアに対応する前記不適切話題語候補を不適切話題語として不適切話題語リストデータベースに登録する。
本発明に係るプログラムは、コンピュータを、請求項1に記載の発話文抽出装置、又は請求項2に記載の不適切話題語リスト生成装置の各部として機能させるためのプログラムである。
以上説明したように、本発明の発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラムによれば、システムの発話として不適切な話題の発話文を抽出することができる、という効果が得られる。
本発明の実施形態に係る発話文抽出装置分類器学習装置の機能的構成を示すブロック図である。 本発明の実施形態に係るテキスト解析情報の一例を示す図である。 本発明の実施形態に係る不適切話題語リストの一例を示す図である。 本発明の実施形態に係る不適切話題語リスト生成装置の機能的構成を示すブロック図である。 本発明の実施形態に係る発話文抽出装置における発話文抽出処理ルーチンのフローチャート図である。 本発明の実施形態に係る発話文抽出装置における不適切話題語リスト生成処理ルーチンのフローチャート図である。
以下、図面を参照して本発明の実施形態を詳細に説明する。
<本発明の実施の形態に係る発話文抽出装置の構成>
本発明の実施の形態に係る発話文抽出装置の構成について説明する。図1に示すように、本実施の形態に係る発話文抽出装置100は、CPUと、RAMと、後述する発話文抽出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この発話文抽出装置100は、機能的には図1に示すように入力部10と、演算部20と、発話文データベース30と、不適切話題語リストデータベース40を含んで構成されている。
入力部10は、ユーザ発話の集合を受け付ける。
演算部20は、図1に示すように、テキスト解析部22、不適切発話検出部24、及びデータベース登録部26を備えて構成されている。
テキスト解析部22は、入力部10が受け付けたユーザ発話の集合のユーザ発話の各々について、ユーザ発話を文単位に分割し、分割された文を既知の技術である形態素解析により分割することにより、文を形態素単位に分割し、出現表記、品詞、及び標準表記の情報を含むテキスト解析情報を生成する。
図2には、一例として「北方領土は日本のものだ」というユーザ発話を受け付けた場合にテキスト解析部22が生成するテキスト解析情報50を示した。図2に示すように、受け付けたユーザ発話を形態素単位に分割し、出現表記、品詞、及び標準表記を含むテキスト解析情報50が生成される。
不適切発話検出部24は、不適切話題語とユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、ユーザ発話が不適切発話か否かを判定する。
具体的には、テキスト解析部22で解析したユーザ発話のテキスト解析情報を入力とし、予め不適切話題語リストデータベース40に記憶された不適切話題語リストを用いて、ユーザ発話の不適切度合を表すスコアを求め、データベース登録部26に出力する。
不適切話題語リストは、図3に示すように、不適切話題語とスコアとの対応関係を表すテーブルデータである。不適切話題語リストはユーザが作成したものを用いても良いが、後述する不適切話題語リスト生成装置150により自動で生成されたものを用いても良い。
不適切発話検出部24は、まず、入力されたユーザ発話から焦点となっている話題語を検出する。話題語の検出は、助詞を手がかりに行うことができる。例えば助詞「は」「が」「って」「なんて」を伴う名詞句相当を抽出することで実現できる。受け付けたユーザ発話が、図2に示した「北方領土は日本のものだ」の場合、連用助詞「は」を伴う名詞である「北方領土」が話題語として抽出される。なお、ここでは規則による話題語抽出について述べたが、一般的な固有表現抽出手法(例えば下記非特許文献2)で用いられるようなチャンキングの手法(CRFなど)を用いて実現してもよい。
[非特許文献2] 笹野遼平、黒橋禎夫、大域的情報を用いた日本語固有表現認識、情報処理学会論文誌Vol.49 No.11, 2008.
次に、不適切発話検出部24は、抽出された話題語が不適切話題語リストに存在するか否かを判定する。抽出された話題語が不適切話題語リストに存在した場合、存在した不適切話題語に対応するスコアが予め設定した閾値よりも大きければ不適切発話フラグを「1」、閾値以下であれば不適切発話フラグを「0」とする。また、抽出された話題語が不適切話題語リストに存在しなければ不適切発話フラグを「−1」とする。
なお、本実施形態では、抽出された話題語が不適切話題語リストに存在した場合、不適切発話フラグが取り得る値を「1」か「0」の2値としているが、スコアの高さに応じて不適切発話フラグが取り得る値として「3」、「2」などを加えてもよい。すなわち、抽出された話題語が不適切話題語リストに存在した場合に不適切発話フラグが取り得る値を3値以上としてもよい。
そして、不適切発話検出部24は、ユーザ発話と不適切発話フラグとを対としてデータベース登録部26に出力する。
データベース登録部26は、不適切発話検出部24の判定結果とユーザ発話とを対応付けて発話文データベース30に登録する。すなわち、不適切発話検出部24から出力された不適切発話フラグとユーザ発話とを対として発話文データベース30に出力し、登録する。
<本発明の実施の形態に係る不適切話題語リスト生成装置の構成>
次に、本発明の実施の形態に係る不適切話題語リスト生成装置の構成について説明する。図4に示すように、本実施の形態に係る不適切話題語リスト生成装置150は、CPUと、RAMと、後述する不適切話題語リスト生成処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この不適切話題語リスト生成装置150は、機能的には図4に示すように入力部60と、演算部70と、不適切話題語リストデータベース80とを含んで構成されている
入力部60は、インターネット上の新聞記事やブログ記事などのテキスト集合を受け付ける。
演算部20は、図4に示すように、テキスト解析部72、頻度算出部74、スコア算出部76、データベース登録部78を備えて構成されている。
テキスト解析部72は、入力部60が受け付けたテキスト集合のテキストの各々について、テキストを文単位に分割を文単位に分割し、分割された文を既知の技術である形態素解析により分割することにより、文を形態素単位に分割し、出現表記、品詞、及び標準表記の情報が付与されたテキスト解析情報を生成する。
頻度算出部74は、テキスト解析情報に基づいて、不適切話題語候補を抽出するための予め定められた用語を伴う不適切話題語候補を抽出して、予め定められた用語を伴って不適切話題語候補が出現する第1の頻度を算出すると共に、不適切話題語候補が出現する第2の頻度を算出する。
具体的には、頻度算出部74は、テキスト解析部72により生成されたテキスト解析情報の出現表記から、不適切話題語を抽出するための予め定められた用語として、「問題」という用語を伴う名詞句相当表現を抽出し、その頻度(第1の頻度)をカウントする。例えば、受け付けたテキストが「北方領土問題についての政府の見解は・・・」というテキストであった場合、「問題」という用語を伴う「北方領土」を抽出し、1とカウントする。この処理により、不適切話題語候補を抽出するための用語として例えば「問題」という用語を伴う名詞句相当表現(以下、不適切話題語候補と称する)と頻度とを対応付けた不適切話題語候補リストが作成される。
次に、頻度算出部74は、テキスト解析情報に基づいて、テキスト中における予め定められた用語を伴わずに不適切話題語候補が出現する頻度(第2の頻度)をカウントする。例えば「ここから北方領土を見ることができます」というテキストがあった場合、「北方領土」を1とカウントする。これにより、不適切話題語候補の頻度が算出される。
スコア算出部76は、第1の頻度及び第2の頻度に基づいて、不適切話題語の不適切度合いを表すスコアを算出する。
具体的には、頻度算出部74は、不適切話題語候補の各々に対し、「問題」という用語を伴って出現した不適切話題語候補の第1の頻度を、「問題」という用語を伴わずに不適切話題語候補が出現した第2の頻度で除算した値に、「問題」という用語を伴って出現した不適切話題語候補の第1の頻度を乗算した値をスコアとする。以下にスコアscore(c)の計算式を示す。
score(C)=freq(C問題)*(freq(C問題)/freq(C))
ここで、Cは不適切話題語候補、freq(X)はXの頻度、C問題は「問題」という不適切話題語候補を抽出するための用語を伴ってCという不適切話題語候補が出現したことを表す。
データベース登録部78は、スコア算出部76が算出したスコアが予め定めた閾値以上の場合に、そのスコアに対応する不適切話題語候補を不適切話題語として、スコアと共に不適切話題語リストデータベース80に出力し、登録する。
<本発明の実施形態に係る発話文抽出装置の作用>
次に、本発明の実施形態に係る発話文抽出装置100の作用について説明する。発話文抽出装置100は、入力部10によって、ユーザ発話の集合を受け付けると、発話文抽出装置100によって、図5に示す発話文抽出処理ルーチンが実行される。
まず、ステップS100で、テキスト解析部22が、入力部10が受け付けたユーザ発話の集合のユーザ発話の各々について、ユーザ発話を文単位に分割を文単位に分割し、分割された文を既知の技術である形態素解析により分割することにより、文を形態素単位に分割し、出現表記、品詞、及び標準表記の情報が付与されたテキスト解析情報を生成する。
ステップS102では、不適切発話検出部24が、不適切話題語とユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、ユーザ発話が不適切発話か否かを判定し、ユーザ発話と不適切発話フラグとを対としてデータベース登録部26に出力する。
ステップS104では、データベース登録部26が、ステップS102の判定結果とユーザ発話とを対応付けて発話文データベース30に登録する。
<本発明の実施形態に係る不適切話題語リスト生成装置の作用>
次に、本発明の実施形態に係る不適切話題語リスト生成装置150の作用について説明する。不適切話題語リスト生成装置150は、入力部60によって、テキスト集合を受け付けると、不適切話題語リスト生成装置150によって、図6に示す発話文抽出処理ルーチンが実行される。
まず、ステップS150で、テキスト解析部72が、入力部60が受け付けたテキスト集合のテキストの各々について、テキストを文単位に分割を文単位に分割し、分割された文を既知の技術である形態素解析により分割することにより、文を形態素単位に分割し、出現表記、品詞、及び標準表記の情報が付与されたテキスト解析情報を生成する。
ステップS150では、頻度算出部74が、テキスト解析情報に基づいて、不適切話題語候補を抽出するための予め定められた用語を伴う不適切話題語候補を抽出して、予め定められた用語を伴って不適切話題語候補が出現した第1の頻度を算出すると共に、予め定められた用語を伴わずに不適切話題語候補が出現した第2の頻度を算出する。
ステップS154では、スコア算出部76が、第1の頻度及び第2の頻度に基づいて、不適切話題語の不適切度合いを表すスコアを算出する。
ステップS156では、データベース登録部78が、スコア算出部76が算出したスコアが予め定めた閾値以上の場合に、そのスコアに対応する不適切話題語候補を不適切話題語として、スコアと共に不適切話題語リストデータベース80に出力し、登録する。
以上説明したように、本発明の実施の形態に係る発話文抽出装置によれば、ユーザ発話のテキスト解析情報を生成し、不適切話題語リストとテキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、ユーザ発話が不適切発話か否かを判定するので、システムの発話として不適切な話題の発話文を抽出することができる。また、ユーザ発話から問題のある話題を検出することができ、ユーザの親近感を高めることのできる対話装置を実現することが可能となる。
また、本発明の実施の形態に係る不適切話題語リスト生成装置によれば、テキスト集合のテキスト解析情報を生成し、テキスト解析情報に基づいて、不適切話題語候補を抽出するための用語を伴って不適切話題語候補が出現した第1の頻度及び不適切話題語候補を抽出するための用語を伴わずに不適切話題語候補が出現した第2の頻度を算出し、算出した第1の頻度及び第2の頻度に基づいて、不適切話題語の不適切度合いを表すスコアを算出し、スコアが予め定めた閾値以上の場合に、スコアに対応する不適切話題語を不適切話題語リストデータベースに登録するので、発話文抽出装置でユーザ発話が不適切発話か否かを判定する際に用いられる不適切話題語リストを自動で生成することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記の実施の形態では、発話文抽出装置と不適切話題語リスト生成装置とを別々に設ける場合を例に説明したが、発話文抽出装置と不適切話題語リスト生成装置とを、1つの装置で実現するようにしてもよい。
本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10、60 入力部
20、70 演算部
22、72 テキスト解析部
24 不適切発話検出部
26、78 データベース登録部
30 発話文データベース
40、80 不適切話題語リストデータベース
50 テキスト解析情報
74 頻度算出部
76 スコア算出部
100 発話文抽出装置
150 不適切話題語リスト生成装置

Claims (5)

  1. ユーザ発話を受け付ける入力部と、
    前記ユーザ発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するテキスト解析部と、
    不適切話題語と前記ユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、前記テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、前記ユーザ発話が不適切発話か否かを判定する不適切発話検出部と、
    前記不適切発話検出部の判定結果と前記ユーザ発話とを対応付けてデータベースに登録するデータベース登録部と、
    を有する発話文抽出装置。
  2. テキスト集合を受け付ける入力部と、
    前記テキスト集合を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するテキスト解析部と、
    前記テキスト解析情報に基づいて、不適切話題語候補を抽出するための予め定められた用語を伴う前記不適切話題語候補を抽出して、前記用語を伴って前記不適切話題語候補が出現する第1の頻度を算出すると共に、前記不適切話題語候補が出現する第2の頻度を算出する頻度算出部と、
    前記第1の頻度及び前記第2の頻度に基づいて、前記不適切話題語候補の不適切度合いを表すスコアを算出するスコア算出部と、
    前記スコアが予め定めた閾値以上の場合に、前記スコアに対応する前記不適切話題語候補を不適切話題語として不適切話題語リストデータベースに登録するデータベース登録部と、
    を有する不適切話題語リスト生成装置。
  3. 入力部が、ユーザ発話を受け付け、
    テキスト解析部が、前記ユーザ発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成し、
    不適切発話検出部が、不適切話題語と前記ユーザ発話の不適切度合いを表すスコアとの対応関係を表す不適切話題語リストと、前記テキスト解析情報とに基づいてスコアを求め、求めたスコアに基づいて、前記ユーザ発話が不適切発話か否かを判定し、
    データベース登録部が、前記不適切発話検出部の判定結果と前記ユーザ発話とを対応付けてデータベースに登録する
    発話文抽出方法。
  4. 入力部が、テキスト集合を受け付け、
    テキスト解析部が、前記テキスト集合を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成し、
    頻度算出部が、前記テキスト解析情報に基づいて、不適切話題語候補を抽出するための予め定められた用語を伴う前記不適切話題語候補を抽出して、前記用語を伴って前記不適切話題語候補が出現する第1の頻度を算出すると共に、前記不適切話題語候補が出現する第2の頻度を算出し、
    スコア算出部が、前記第1の頻度及び前記第2の頻度に基づいて、前記不適切話題語候補の不適切度合いを表すスコアを算出し、
    データベース登録部が、前記スコアが予め定めた閾値以上の場合に、前記スコアに対応する前記不適切話題語候補を不適切話題語として不適切話題語リストデータベースに登録する
    不適切話題語リスト生成方法。
  5. コンピュータを、請求項1に記載の発話文抽出装置、又は請求項2に記載の不適切話題語リスト生成装置の各部として機能させるためのプログラム。
JP2016219483A 2016-11-10 2016-11-10 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム Pending JP2018077698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016219483A JP2018077698A (ja) 2016-11-10 2016-11-10 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016219483A JP2018077698A (ja) 2016-11-10 2016-11-10 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2018077698A true JP2018077698A (ja) 2018-05-17

Family

ID=62150773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016219483A Pending JP2018077698A (ja) 2016-11-10 2016-11-10 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2018077698A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102229032B1 (ko) * 2020-06-23 2021-03-17 주식회사 우리홈쇼핑 방송 적합 여부에 대한 알림을 제공하는 장치 및 방법
JP7467444B2 (ja) 2018-11-02 2024-04-15 バルブ コーポレーション テキストの分類およびモデレーション

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7467444B2 (ja) 2018-11-02 2024-04-15 バルブ コーポレーション テキストの分類およびモデレーション
KR102229032B1 (ko) * 2020-06-23 2021-03-17 주식회사 우리홈쇼핑 방송 적합 여부에 대한 알림을 제공하는 장치 및 방법

Similar Documents

Publication Publication Date Title
US10460034B2 (en) Intention inference system and intention inference method
KR102413692B1 (ko) 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치
CN104166462B (zh) 一种文字的输入方法和系统
JP6312942B2 (ja) 言語モデル生成装置、言語モデル生成方法とそのプログラム
US8190628B1 (en) Phrase generation
JP6955963B2 (ja) 検索装置、類似度算出方法、およびプログラム
Thomas et al. Code-switching in Indic Speech Synthesisers.
JP6242963B2 (ja) 言語モデル改良装置及び方法、音声認識装置及び方法
WO2015043071A1 (zh) 一种译文检查方法及其系统
JP2018077698A (ja) 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム
JP2008276543A (ja) 対話処理装置、応答文生成方法、及び応答文生成処理プログラム
CN107507627B (zh) 语音数据热度分析方法及系统
JP5911931B2 (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体
JP5954836B2 (ja) 不理解文判定モデル学習方法、不理解文判定方法、装置、及びプログラム
Do et al. Improving translation of emphasis with pause prediction in speech-to-speech translation systems.
US20140278376A1 (en) Systems and Methods for Generating Recitation Items
JP2018160159A (ja) 発話文判定装置、方法、及びプログラム
JP2018077604A (ja) 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
JP2009163565A (ja) 文整形装置及び文整形プログラム
JP2009129405A (ja) 感情推定装置、事例感情情報生成装置、及び感情推定プログラム
JP2007264858A (ja) 人名性別判定プログラム、機械翻訳プログラム、人名性別判定装置、機械翻訳装置、人名性別判定処理方法および機械翻訳処理方法
KR101604553B1 (ko) 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법
US20230061505A1 (en) Method and apparatus for training data augmentation for end-to-end speech recognition
CN113077792B (zh) 佛学主题词识别方法、装置、设备及存储介质