JP2022074852A - 辞書編集装置、辞書編集方法及び辞書編集プログラム - Google Patents
辞書編集装置、辞書編集方法及び辞書編集プログラム Download PDFInfo
- Publication number
- JP2022074852A JP2022074852A JP2020185249A JP2020185249A JP2022074852A JP 2022074852 A JP2022074852 A JP 2022074852A JP 2020185249 A JP2020185249 A JP 2020185249A JP 2020185249 A JP2020185249 A JP 2020185249A JP 2022074852 A JP2022074852 A JP 2022074852A
- Authority
- JP
- Japan
- Prior art keywords
- reliability
- word
- reading
- dictionary
- correction candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012937 correction Methods 0.000 claims abstract description 46
- 238000004364 calculation method Methods 0.000 claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 29
- 239000000284 extract Substances 0.000 claims abstract description 17
- 230000000877 morphologic effect Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000012790 confirmation Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
- G10L2015/0633—Creating reference templates; Clustering using lexical or orthographic knowledge sources
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (9)
- テキストデータから単語を抽出する単語抽出部と、
抽出された前記単語に対して読みを付与する読み付与部と、
抽出された前記単語の信頼度を表す第1の信頼度と付与された前記読みの信頼度を表す第2の信頼度との少なくとも何れかを計算する信頼度計算部と、
前記第1の信頼度に応じて修正候補とする単語を特定し、前記第2の信頼度に応じて修正候補とする読みを特定する修正候補特定部と、
を備える辞書編集装置。 - 前記信頼度計算部は、前記単語抽出部が前記テキストデータ上の改行前後の文字をつなげて、改行を含む文字列から単語の抽出を行ったかに応じて前記第1の信頼度を計算する請求項1に記載の辞書編集装置。
- 前記信頼度計算部は、前記テキストデータ上で、抽出された前記単語の周辺に存在する単語の情報を用いて前記第1の信頼度を計算する請求項1に記載の辞書編集装置。
- 前記信頼度計算部は、前記テキストデータ上で、抽出された前記単語の周辺に存在する単語を用いて形態素解析を行った結果に基づいて前記第1の信頼度を再計算する請求項3に記載の辞書編集装置。
- 前記信頼度計算部は、前記読みが読み付与を行うための辞書に登録されている単語に基づいて付与されているか、前記読みが前記辞書に登録されている複数の単語に基づいて付与されているか、前記読みが付与された単語が数字又はアルファベットを含むかの少なくとも何れかを用いて前記第2の信頼度を計算する請求項1に記載の辞書編集装置。
- 前記修正候補特定部で特定された修正候補の単語又は読みを強調表示する表示部をさらに備える請求項1乃至5の何れか1項に記載の辞書編集装置。
- 前記表示部は、前記修正候補とすべき単語又は読みが表示されるセルの背景色、前記セルの枠の太さ、前記セルの枠の大きさ、前記セルの枠の色、前記セルにおいて表示される文字の色、前記文字のフォント、前記文字の大きさの少なくとも何れかを変更することで前記強調表示をする請求項6に記載の辞書編集装置。
- テキストデータから単語を抽出することと、
抽出された前記単語に対して読みを付与することと、
抽出された前記単語の信頼度を表す第1の信頼度と付与された前記読みの信頼度を表す第2の信頼度との少なくとも何れかを計算することと、
前記第1の信頼度に応じて修正候補とする単語を特定し、前記第2の信頼度に応じて修正候補とする読みを特定することと、
を備える辞書編集方法。 - テキストデータから単語を抽出することと、
抽出された前記単語に対して読みを付与することと、
抽出された前記単語の信頼度を表す第1の信頼度と付与された前記読みの信頼度を表す第2の信頼度との少なくとも何れかを計算することと、
前記第1の信頼度に応じて修正候補とする単語を特定し、前記第2の信頼度に応じて修正候補とする読みを特定することと、
をプロセッサに実行させるための辞書編集プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020185249A JP7481999B2 (ja) | 2020-11-05 | 2020-11-05 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
US17/446,092 US11995398B2 (en) | 2020-11-05 | 2021-08-26 | Dictionary editing apparatus, dictionary editing method, and recording medium recording thereon dictionary editing program |
CN202111000960.4A CN114528826A (zh) | 2020-11-05 | 2021-08-30 | 词典编辑装置、词典编辑方法以及记录有词典编辑程序的记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020185249A JP7481999B2 (ja) | 2020-11-05 | 2020-11-05 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022074852A true JP2022074852A (ja) | 2022-05-18 |
JP7481999B2 JP7481999B2 (ja) | 2024-05-13 |
Family
ID=81380122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020185249A Active JP7481999B2 (ja) | 2020-11-05 | 2020-11-05 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11995398B2 (ja) |
JP (1) | JP7481999B2 (ja) |
CN (1) | CN114528826A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7481999B2 (ja) | 2020-11-05 | 2024-05-13 | 株式会社東芝 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
JP7467314B2 (ja) * | 2020-11-05 | 2024-04-15 | 株式会社東芝 | 辞書編集装置、辞書編集方法、及びプログラム |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE59700536D1 (de) | 1996-04-02 | 1999-11-11 | Siemens Ag | Anordnung zur erstellung eines digitalen wörterbuchs und verfahren zum aufbau eines digitalen wörterbuchs mit hilfe eines rechners |
AU2001259446A1 (en) | 2000-05-02 | 2001-11-12 | Dragon Systems, Inc. | Error correction in speech recognition |
US20040205671A1 (en) | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
JP4089861B2 (ja) | 2001-01-31 | 2008-05-28 | 三菱電機株式会社 | 音声認識文章入力装置 |
JP4048169B2 (ja) * | 2001-06-11 | 2008-02-13 | 博 石倉 | スペースの自動生成によって文章入力を支援するシステム |
WO2004044887A1 (ja) | 2002-11-11 | 2004-05-27 | Matsushita Electric Industrial Co., Ltd. | 音声認識用辞書作成装置および音声認識装置 |
US7437296B2 (en) | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
JP4559946B2 (ja) | 2005-09-29 | 2010-10-13 | 株式会社東芝 | 入力装置、入力方法および入力プログラム |
JP5040909B2 (ja) * | 2006-02-23 | 2012-10-03 | 日本電気株式会社 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
US20070239455A1 (en) | 2006-04-07 | 2007-10-11 | Motorola, Inc. | Method and system for managing pronunciation dictionaries in a speech application |
JP2009217611A (ja) | 2008-03-11 | 2009-09-24 | Toshiba Corp | 音声対話装置 |
JP4701292B2 (ja) | 2009-01-05 | 2011-06-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキスト・データに含まれる固有表現又は専門用語から用語辞書を作成するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
JP5646146B2 (ja) | 2009-03-18 | 2014-12-24 | 株式会社東芝 | 音声入力装置、音声認識システム及び音声認識方法 |
JP5838781B2 (ja) | 2011-12-20 | 2016-01-06 | 富士通株式会社 | 複合語読み表示方法及びプログラム,並びに読み生成装置 |
JP2015060095A (ja) | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
US9779722B2 (en) | 2013-11-05 | 2017-10-03 | GM Global Technology Operations LLC | System for adapting speech recognition vocabulary |
US9947313B2 (en) | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
US20160275942A1 (en) | 2015-01-26 | 2016-09-22 | William Drewes | Method for Substantial Ongoing Cumulative Voice Recognition Error Reduction |
JP6766384B2 (ja) | 2016-03-11 | 2020-10-14 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP6497372B2 (ja) | 2016-09-29 | 2019-04-10 | トヨタ自動車株式会社 | 音声対話装置および音声対話方法 |
US11043213B2 (en) * | 2018-12-07 | 2021-06-22 | Soundhound, Inc. | System and method for detection and correction of incorrectly pronounced words |
JP7481999B2 (ja) | 2020-11-05 | 2024-05-13 | 株式会社東芝 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
-
2020
- 2020-11-05 JP JP2020185249A patent/JP7481999B2/ja active Active
-
2021
- 2021-08-26 US US17/446,092 patent/US11995398B2/en active Active
- 2021-08-30 CN CN202111000960.4A patent/CN114528826A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114528826A (zh) | 2022-05-24 |
JP7481999B2 (ja) | 2024-05-13 |
US20220138416A1 (en) | 2022-05-05 |
US11995398B2 (en) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7783472B2 (en) | Document translation method and document translation device | |
US20060149557A1 (en) | Sentence displaying method, information processing system, and program product | |
TWI567569B (zh) | Natural language processing systems, natural language processing methods, and natural language processing programs | |
US11995398B2 (en) | Dictionary editing apparatus, dictionary editing method, and recording medium recording thereon dictionary editing program | |
JP2013097446A (ja) | 情報出力装置、情報出力方法、及びコンピュータプログラム | |
RU2665274C2 (ru) | Всплывающая панель верификации | |
JP7040155B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
EP2031490A2 (en) | Electronic dictionary, search method for and electronic dictionary, and search program for an alectronic dictionary | |
KR20110069488A (ko) | 입력 언어에 따른 전자사전의 자동검색 시스템 및 그 방법 | |
US20120230590A1 (en) | Image processing apparatus, non-transitory computer-readable medium, and image processing method | |
JP7102710B2 (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
JP2008027133A (ja) | 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体 | |
JP6933395B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
KR20130122437A (ko) | 영어의 한글 표기 방법 및 시스템 | |
CN107870905B (zh) | 一种特定词汇的识别方法 | |
JP2017091024A (ja) | 入力支援装置 | |
JP7467314B2 (ja) | 辞書編集装置、辞書編集方法、及びプログラム | |
JPS6118074A (ja) | プレ・エデイツト方式 | |
JP2008090247A (ja) | 和訳ローマ字略語を付加したゲルマン語群言語の辞書。 | |
JP7223450B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
JP7554531B1 (ja) | 新規呼出文字列登録プログラム、新規呼出文字列登録装置および新規呼出文字列登録方法 | |
JP7466326B2 (ja) | 表示装置、及びプログラム | |
CN113553832B (zh) | 文字处理方法和装置、电子设备以及计算机可读存储介质 | |
CN107679043A (zh) | 数据处理方法、装置及终端设备 | |
JP2007316834A (ja) | 日本語文章修正装置、日本語文章修正方法および日本語文章修正のためのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7481999 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |