JP7229144B2 - 文章記号挿入装置及びその方法 - Google Patents
文章記号挿入装置及びその方法 Download PDFInfo
- Publication number
- JP7229144B2 JP7229144B2 JP2019187743A JP2019187743A JP7229144B2 JP 7229144 B2 JP7229144 B2 JP 7229144B2 JP 2019187743 A JP2019187743 A JP 2019187743A JP 2019187743 A JP2019187743 A JP 2019187743A JP 7229144 B2 JP7229144 B2 JP 7229144B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- data
- text
- symbols
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
音声認識装置 200
句点挿入装置 300
前処理部 310
形態素処理部 320
教師データ生成部 330
学習部 340
推定部 350
句点挿入部 360
Claims (5)
- 学習対象の文字列テキストデータ中、処理対象の形態素と当該処理対象形態素の次の形態素からなる着目形態素組の形態素及び文法情報を入力データとし、当該入力データと、着目形態素組の形態素間に文章記号が挿入されているかどうかを示す出力データとを教師データとして学習して学習モデルを形成する学習部と、
文字列テキストデータを形態素解析し、分割された形態素と当該形態素の文法情報とを出力する形態素処理部と、
推定対象の文字列テキストデータが前記形態素処理部で形態素解析されて得られた形態素と当該形態素の文法情報のうち、処理対象の形態素と当該処理対象形態素の次の形態素からなる着目形態素組の形態素及び文法情報を入力データとして前記学習モデルに入力し、出力された出力データに基づき着目形態素組の形態素間に文章記号を挿入すべきか否かを判断する推定部と、
前記推定部の推定結果に基づき推定対象の文字列テキストデータに文章記号を挿入する文章記号挿入部とからなり、
前記文字列テキストデータは発話主体別の識別情報が付与されており、
前記学習部は発話主体別の識別情報を用いて発話主体別に学習して学習モデルを形成し、
前記推定部は発話主体別の識別情報により発話主体別の学習モデルを用いて文章記号を挿入すべきか否かを判断し、前記学習モデルの出力データは、文章記号を挿入すべき程度を示す値、及び/又は、文章記号を挿入すべきではない程度を示す値であり、
前記文章記号挿入部は、前記推定部が出力データを所定閾値と比較した結果に基づき文章記号を挿入し、
前記文章記号挿入部により前記所定閾値を標準の所定閾値で文章記号を挿入した文字列テキストデータと、利用者の設定に応じて、前記文章記号挿入部により前記所定閾値を変更した所定閾値で文章記号を挿入した文字列テキストデータとを比較し、追加された文章記号及び削除された文章記号を顕示する文章記号挿入装置。 - 推定対象の文字列テキストデータから所定の文章記号を取り除く前処理部を含む
前記請求項1に記載の文章記号挿入装置。 - 前記前処理部が取り除く文章記号は、前記推定部が挿入すべきか否かを判断する文章記号である
前記請求項2に記載の文章記号挿入装置。 - ワイルドカード設定情報又は学習データの入力データのワイルドカード指定を参照し、推定対象の入力データをワイルドカード記号に置換するワイルドカード処理部を含み、
当該ワイルドカード処理部によりワイルドカードに置換された推定対象の入力データを用いて推定部で推定する
前記請求項1ないし3のいずれに記載の文章記号挿入装置。 - 学習対象の文字列テキストデータ中、処理対象の形態素と当該処理対象形態素の次の形態素からなる着目形態素組の形態素及び文法情報を入力データとし、当該入力データと、着目形態素組の形態素間に文章記号が挿入されているかどうかを示す出力データとを教師データとして学習して学習モデルを形成する学習ステップと、
文字列テキストデータを形態素解析し、分割された形態素と当該形態素の文法情報とを出力する形態素処理ステップと、
推定対象の文字列テキストデータが前記形態素処理ステップで形態素解析されて得られた形態素と当該形態素の文法情報のうち、処理対象の形態素と当該処理対象形態素の次の形態素からなる着目形態素組の形態素及び文法情報を入力データとして前記学習モデルに入力し、出力された出力データに基づき着目形態素組の形態素間に文章記号を挿入すべきか否かを判断する推定ステップと、
前記推定ステップの推定結果に基づき推定対象の文字列テキストデータに文章記号を挿入する文章記号挿入ステップとからなり、
前記文字列テキストデータは発話主体別の識別情報が付与されており、
前記学習ステップで、発話主体別の識別情報を用いて発話主体別に学習して学習モデルを形成し、
前記推定ステップで、発話主体別の識別情報により発話主体別の学習モデルを用いて文章記号を挿入すべきか否かを判断し、
前記学習モデルの出力データは、文章記号を挿入すべき程度を示す値、及び/又は、文章記号を挿入すべきではない程度を示す値であり、
前記文章記号挿入ステップは、前記推定ステップにおいて出力データを所定閾値と比較した結果に基づき文章記号を挿入し、
前記文章記号挿入ステップにより前記所定閾値を標準の所定閾値で文章記号を挿入した文字列テキストデータと、利用者の設定に応じて、前記文章記号挿入ステップにより前記所定閾値を変更した所定閾値で文章記号を挿入した文字列テキストデータとを比較し、追加された文章記号及び削除された文章記号を顕示する文章記号挿入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019187743A JP7229144B2 (ja) | 2019-10-11 | 2019-10-11 | 文章記号挿入装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019187743A JP7229144B2 (ja) | 2019-10-11 | 2019-10-11 | 文章記号挿入装置及びその方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018194615A Division JP6605105B1 (ja) | 2018-10-15 | 2018-10-15 | 文章記号挿入装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020064630A JP2020064630A (ja) | 2020-04-23 |
JP7229144B2 true JP7229144B2 (ja) | 2023-02-27 |
Family
ID=70388342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019187743A Active JP7229144B2 (ja) | 2019-10-11 | 2019-10-11 | 文章記号挿入装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7229144B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666749B (zh) * | 2020-06-03 | 2023-09-19 | 杭州凡闻科技有限公司 | 热点文章识别方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029496A (ja) | 1998-05-13 | 2000-01-28 | Internatl Business Mach Corp <Ibm> | 連続音声認識において句読点を自動的に生成する装置および方法 |
JP2001083987A (ja) | 1999-08-30 | 2001-03-30 | Internatl Business Mach Corp <Ibm> | 記号挿入装置およびその方法 |
JP2003263190A (ja) | 2002-03-07 | 2003-09-19 | Fujitsu Ltd | 音声自動質問応答装置 |
JP2005140988A (ja) | 2003-11-06 | 2005-06-02 | Canon Inc | 音声認識装置及び方法 |
JP2005174336A (ja) | 2003-12-11 | 2005-06-30 | Microsoft Corp | 情報抽出のための一般化文字列パターンの学習および使用 |
WO2009101837A1 (ja) | 2008-02-13 | 2009-08-20 | Nec Corporation | 記号挿入装置および記号挿入方法 |
JP2010092169A (ja) | 2008-10-06 | 2010-04-22 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム |
WO2014132402A1 (ja) | 2013-02-28 | 2014-09-04 | 株式会社東芝 | データ処理装置および物語モデル構築方法 |
JP2015219480A (ja) | 2014-05-21 | 2015-12-07 | 日本電信電話株式会社 | 対話状況特徴計算装置、文末記号推定装置、これらの方法及びプログラム |
-
2019
- 2019-10-11 JP JP2019187743A patent/JP7229144B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029496A (ja) | 1998-05-13 | 2000-01-28 | Internatl Business Mach Corp <Ibm> | 連続音声認識において句読点を自動的に生成する装置および方法 |
JP2001083987A (ja) | 1999-08-30 | 2001-03-30 | Internatl Business Mach Corp <Ibm> | 記号挿入装置およびその方法 |
JP2003263190A (ja) | 2002-03-07 | 2003-09-19 | Fujitsu Ltd | 音声自動質問応答装置 |
JP2005140988A (ja) | 2003-11-06 | 2005-06-02 | Canon Inc | 音声認識装置及び方法 |
JP2005174336A (ja) | 2003-12-11 | 2005-06-30 | Microsoft Corp | 情報抽出のための一般化文字列パターンの学習および使用 |
WO2009101837A1 (ja) | 2008-02-13 | 2009-08-20 | Nec Corporation | 記号挿入装置および記号挿入方法 |
JP2010092169A (ja) | 2008-10-06 | 2010-04-22 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム |
WO2014132402A1 (ja) | 2013-02-28 | 2014-09-04 | 株式会社東芝 | データ処理装置および物語モデル構築方法 |
JP2015219480A (ja) | 2014-05-21 | 2015-12-07 | 日本電信電話株式会社 | 対話状況特徴計算装置、文末記号推定装置、これらの方法及びプログラム |
Non-Patent Citations (2)
Title |
---|
中川 聖一 外2名,話者の同定を組み込んだニュース音声の認識,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1999年06月18日,第99巻 第121号,pp.49-56 |
廣瀬良文 外4名,テキスト音声合成のための意味情報の連鎖パタンによる複合語分割,日本音響学会研究発表会議講演論文集 秋I ,社団法人日本音響学会,2002年09月26日,p.399-400 |
Also Published As
Publication number | Publication date |
---|---|
JP2020064630A (ja) | 2020-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11037553B2 (en) | Learning-type interactive device | |
US10074363B2 (en) | Method and apparatus for keyword speech recognition | |
US9672825B2 (en) | Speech analytics system and methodology with accurate statistics | |
CN111241357A (zh) | 对话训练方法、装置、系统及存储介质 | |
CN107077843A (zh) | 对话控制装置和对话控制方法 | |
Kopparapu | Non-linguistic analysis of call center conversations | |
CN111833853A (zh) | 语音处理方法及装置、电子设备、计算机可读存储介质 | |
JP6605105B1 (ja) | 文章記号挿入装置及びその方法 | |
US8706487B2 (en) | Audio recognition apparatus and speech recognition method using acoustic models and language models | |
CN109300339A (zh) | 一种英语口语的练习方法及系统 | |
US8442831B2 (en) | Sound envelope deconstruction to identify words in continuous speech | |
CN110853669B (zh) | 音频识别方法、装置及设备 | |
Shahriar et al. | A communication platform between bangla and sign language | |
CN115132174A (zh) | 一种语音数据处理方法、装置、计算机设备及存储介质 | |
JP7229144B2 (ja) | 文章記号挿入装置及びその方法 | |
CN109074809A (zh) | 信息处理设备、信息处理方法和程序 | |
CN111798871B (zh) | 会话环节识别方法、装置及设备、存储介质 | |
KR102407055B1 (ko) | 음성인식 후 자연어 처리를 통한 대화 품질지수 측정장치 및 그 방법 | |
CN113763992A (zh) | 语音测评方法、装置、计算机设备和存储介质 | |
JP6594273B2 (ja) | 疑問発話判定装置、その方法、及びプログラム | |
Shukla | Keywords Extraction and Sentiment Analysis using Automatic Speech Recognition | |
Furui | Toward the ultimate synthesis/recognition system | |
KR20140121169A (ko) | 청각장애인용 상황대처 음성 자막 변환 방법 및 장치 | |
Furui | Toward the ultimate synthesis/recognition system. | |
Arendale et al. | Spoken language recognition on open-source datasets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20200511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230214 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7229144 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |