JP6650901B2 - 発話文判定装置、方法、及びプログラム - Google Patents
発話文判定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6650901B2 JP6650901B2 JP2017057731A JP2017057731A JP6650901B2 JP 6650901 B2 JP6650901 B2 JP 6650901B2 JP 2017057731 A JP2017057731 A JP 2017057731A JP 2017057731 A JP2017057731 A JP 2017057731A JP 6650901 B2 JP6650901 B2 JP 6650901B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- label
- inappropriate
- predicate
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
入力:T島はK国が不法占拠します
出力:〈POLITICAL_ISSUE,NEG_ACT /NATION,〉
入力:年寄りが口出しするな
出力:〈PSET,/PSET,PROH/IMP〉
入力:あれはきちがいだ
出力:〈,SWD,NOT_POLITE〉
20 演算部
21 negative体言辞書
22 対象表現辞書
23 用言辞書
24 対象抽出規則
25 述語抽出規則
30 テキスト解析部
32 手がかり表現抽出部
34 文体ラベル決定部
36 不適切話題語ラベル決定部
40 不適切発話ラベル決定部
42 不適切述語ラベル決定部
44 対象ラベル決定部
46 不適切発話ラベル出力部
48 出力部
100 発話文判定装置
Claims (3)
- 所定の設定に応じ、適切ではない発話に不適切さの種別を表すラベルである、文体ラベル、不適切話題語ラベル、及び不適切発話ラベルを付与する発話文判定装置であって、
入力された発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するテキスト解析部と、
前記テキスト解析情報から不適切な表現となりうる表現を抽出し、かつ、不適切さの手がかりとなるクラスを付与するために予め作成された辞書類及び規則類に基づいて、不適切な表現となりうる表現である所定の表現と述語表現とを含む表現群、及び不適切さの手がかりとなる、該表現群に含まれる前記所定の表現及び前記述語表現のそれぞれに対応するクラスを手かがり表現情報として抽出する手がかり表現抽出部と、
前記テキスト解析情報に基づいて、前記発話の不適切な表現となりうる文体の種別を示す文体ラベルを決定する文体ラベル決定部と、
前記テキスト解析情報に基づいて、前記発話の話題となっている語である話題語を同定し、前記話題語が不適切な表現となりうる所定の表現として前記手がかり表現情報に含まれる場合に、前記話題語に対応する前記手がかり表現情報のクラスを表すラベルを、前記発話に含まれる不適切な話題の種別を示す不適切話題語ラベルとして決定する不適切話題語ラベル決定部と、
前記手がかり表現情報に前記述語表現を含む場合に、該述語表現について、前記テキスト解析情報と、前記手がかり表現情報とに基づいて、前記発話に含まれる不適切な述語表現の種別を示す不適切述語ラベル、及び前記述語表現に対応する対象の種別を示す対象ラベルを決定し、前記決定した前記不適切述語ラベルと、前記対象ラベルとを連結して不適切発話ラベルとして決定する不適切発話ラベル決定部と、を含み、
前記辞書類は、不適切な表現となりうる体言及び該体言のクラスの対からなるnegative体言辞書と、対象表現及び該対象表現のクラスの対からなる対象表現辞書とを含み、
前記規則類は、前記手かがり表現情報として、前記所定の表現として不適切な表現となりうる対象表現を抽出し、不適切さの手がかりとなるクラスを付与するための対象抽出規則を含み、
前記不適切発話ラベル決定部において、
前記手がかり表現情報に含まれる前記述語表現について、前記テキスト解析情報を元に該述語表現に係る表現を抽出することで該述語表現に係る格要素を得て、
前記不適切述語ラベルは、
前記手がかり表現情報に含まれる前記述語表現のクラスが、肯定評価を表す述語、何かをプラスする述語、賛同を表す述語、及び願望を表す述語のいずれかを示すものであるか否かと、前記格要素の表現が前記negative体言辞書に含まれていた前記手がかり表現情報の前記所定の表現であるか否かと、の組み合わせについて定められた条件に従って決定し、
前記対象ラベルは、
前記手がかり表現情報に含まれる前記述語表現に係る表現である前記格要素が複数存在する場合には、格要素が何格であるかに基づいた優先順位に従って、前記述語表現に対応する前記対象ラベルを決定する、
ことを特徴とする発話文判定装置。 - 所定の設定に応じ、適切ではない発話に不適切さの種別を表すラベルである、文体ラベル、不適切話題語ラベル、及び不適切発話ラベルを付与する発話文判定方法であって、
テキスト解析部が、入力された発話を文単位に分割し、分割された文を形態素単位に分割することによりテキスト解析情報を生成するステップと、
手がかり表現抽出部が、前記テキスト解析情報から不適切な表現となりうる表現を抽出し、かつ、不適切さの手がかりとなるクラスを付与するために予め作成された辞書類及び規則類に基づいて、不適切な表現となりうる表現である所定の表現と述語表現とを含む表現群、及び不適切さの手がかりとなる、該表現群に含まれる前記所定の表現及び前記述語表現のそれぞれに対応するクラスを手かがり表現情報として抽出するステップと、
文体ラベル決定部が、前記テキスト解析情報に基づいて、前記発話の不適切な表現となりうる文体の種別を示す文体ラベルを決定するステップと、
不適切話題語ラベル決定部が、前記テキスト解析情報に基づいて、前記発話の話題となっている語である話題語を同定し、前記話題語が不適切な表現となりうる所定の表現として前記手がかり表現情報に含まれる場合に、前記話題語に対応する前記手がかり表現情報のクラスを表すラベルを、前記発話に含まれる不適切な話題の種別を示す不適切話題語ラベルとして決定するステップと、
不適切発話ラベル決定部が、前記手がかり表現情報に前記述語表現を含む場合に、該述語表現について、前記テキスト解析情報と、前記手がかり表現情報とに基づいて、前記発話に含まれる不適切な述語表現の種別を示す不適切述語ラベル、及び前記述語表現に対応する対象の種別を示す対象ラベルを決定し、前記決定した前記不適切述語ラベルと、前記対象ラベルとを連結して不適切発話ラベルとして決定するステップと、を含み、
前記辞書類は、不適切な表現となりうる体言及び該体言のクラスの対からなるnegative体言辞書と、対象表現及び該対象表現のクラスの対からなる対象表現辞書とを含み、
前記規則類は、前記手かがり表現情報として、所定の表現として不適切な表現となりうる対象表現を抽出し、不適切さの手がかりとなるクラスを付与するための対象抽出規則を含み、
前記不適切発話ラベル決定部が処理するステップにおいて、
前記手がかり表現情報に含まれる前記述語表現について、前記テキスト解析情報を元に該述語表現に係る表現を抽出することで該述語表現に係る格要素を得て、
前記不適切述語ラベルは、
前記手がかり表現情報に含まれる前記述語表現のクラスが、肯定評価を表す述語、何かをプラスする述語、賛同を表す述語、及び願望を表す述語のいずれかを示すものであるか否かと、前記格要素の表現が前記negative体言辞書に含まれていた前記手がかり表現情報の前記所定の表現であるか否かと、の組み合わせについて定められた条件に従って決定し、
前記対象ラベルは、
前記手がかり表現情報に含まれる前記述語表現に係る表現である前記格要素が複数存在する場合には、格要素が何格であるかに基づいた優先順位に従って、前記述語表現に対応する前記対象ラベルを決定する、
ことを特徴とする
発話文判定方法。 - コンピュータを、請求項1に記載の発話文判定装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017057731A JP6650901B2 (ja) | 2017-03-23 | 2017-03-23 | 発話文判定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017057731A JP6650901B2 (ja) | 2017-03-23 | 2017-03-23 | 発話文判定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018160159A JP2018160159A (ja) | 2018-10-11 |
JP6650901B2 true JP6650901B2 (ja) | 2020-02-19 |
Family
ID=63796690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017057731A Active JP6650901B2 (ja) | 2017-03-23 | 2017-03-23 | 発話文判定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6650901B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102229032B1 (ko) * | 2020-06-23 | 2021-03-17 | 주식회사 우리홈쇼핑 | 방송 적합 여부에 대한 알림을 제공하는 장치 및 방법 |
JP2024011901A (ja) * | 2022-07-15 | 2024-01-25 | 国立研究開発法人情報通信研究機構 | 発話フィルタリング装置、対話システム、文脈モデルの学習データの生成装置及びコンピュータプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0477857A (ja) * | 1990-07-13 | 1992-03-11 | Nippon Telegr & Teleph Corp <Ntt> | 不適切表現検出装置 |
JP5683428B2 (ja) * | 2011-10-12 | 2015-03-11 | 株式会社野村総合研究所 | 文書管理装置 |
JP6533048B2 (ja) * | 2014-10-29 | 2019-06-19 | 株式会社野村総合研究所 | コンプライアンスチェックシステムおよびコンプライアンスチェックプログラム |
-
2017
- 2017-03-23 JP JP2017057731A patent/JP6650901B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018160159A (ja) | 2018-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rashel et al. | Building an Indonesian rule-based part-of-speech tagger | |
WO2016051551A1 (ja) | 文章生成システム | |
RU2601166C2 (ru) | Разрешение анафоры на основе технологии глубинного анализа | |
Sawalha | Open-source resources and standards for Arabic word structure analysis: Fine grained morphological analysis of Arabic text corpora | |
KR102188739B1 (ko) | 감정 온톨로지에 기반을 둔 이모티콘 추천 장치 및 방법 | |
Megyesi | Shallow Parsing with PoS Taggers and Linguistic Features. | |
Aqlan et al. | Arabic–Chinese neural machine translation: Romanized Arabic as subword unit for Arabic-sourced translation | |
Fashwan et al. | SHAKKIL: an automatic diacritization system for modern standard Arabic texts | |
Sibarani et al. | A study of parsing process on natural language processing in bahasa Indonesia | |
Mohamed et al. | Arabic Part of Speech Tagging. | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
JP6650901B2 (ja) | 発話文判定装置、方法、及びプログラム | |
CN110134766B (zh) | 一种面向中医古籍文献的分词方法和装置 | |
Arikan et al. | Detecting clitics related orthographic errors in Turkish | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
Kapočiūtė-Dzikienė et al. | Improving topic classification for highly inflective languages | |
Pal et al. | Anaphora resolution in Hindi: Issues and challenges | |
AU2019253839A1 (en) | Natural language processing based sign language generation | |
JP5882241B2 (ja) | 質問応答用検索キーワード生成方法、装置、及びプログラム | |
Behera | Odia parts of speech tagging corpora: suitability of statistical models | |
El-Taher et al. | An Arabic CCG approach for determining constituent types from Arabic Treebank | |
JP2003330926A (ja) | 翻訳方法、翻訳装置及び翻訳プログラム | |
KR20210012606A (ko) | 바이오 정보 분석 방법 및 이를 수행하기 위한 프로그램을 저장하는 저장 매체 | |
JP3752535B2 (ja) | 訳語選択装置、及び翻訳装置 | |
JP2006243976A (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190716 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6650901 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |