KR101461062B1 - 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 - Google Patents
로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 Download PDFInfo
- Publication number
- KR101461062B1 KR101461062B1 KR1020110108839A KR20110108839A KR101461062B1 KR 101461062 B1 KR101461062 B1 KR 101461062B1 KR 1020110108839 A KR1020110108839 A KR 1020110108839A KR 20110108839 A KR20110108839 A KR 20110108839A KR 101461062 B1 KR101461062 B1 KR 101461062B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- similarity
- japanese
- hiragana
- similar
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000006243 chemical reaction Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 8
- 238000005192 partition Methods 0.000 description 4
- WZSDNEJJUSYNSG-UHFFFAOYSA-N azocan-1-yl-(3,4,5-trimethoxyphenyl)methanone Chemical compound COC1=C(OC)C(OC)=CC(C(=O)N2CCCCCCC2)=C1 WZSDNEJJUSYNSG-UHFFFAOYSA-N 0.000 description 3
- 230000002035 prolonged effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 235000002753 Erythrina rubrinervia Nutrition 0.000 description 1
- 244000088811 Erythrina rubrinervia Species 0.000 description 1
- 241001071795 Gentiana Species 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 따라 입력된 단어에 대해 로마자 변환을 통해 일본어를 자동으로 추천하는 과정을 도시한 도면이다.
도 3은 본 발명의 일실시예에 따라 한자로부터 히라가나로 변환하는 과정을 도시한 도면이다.
도 4는 본 발명의 일실시예에 따라 로마자로 변환하는 일례를 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 일본어 자동 추천 방법의 전체 과정을 도시한 플로우차트이다.
101: 오타 판단부
102: 한자-히라가나 변환부
103: 로마자 변환부
104: 유사어 검색부
105: 유사어 추천부
106: 정답 단어 선택부
Claims (8)
- 일본어의 히라가나 형태 또는 가타카나 형태로 표현된 단어를 분석하여 상기 단어가 오타인지 여부를 판단하는 오타 판단부;
상기 단어가 오타인 경우 상기 단어의 발음을 로마자(romaji)로 변환하는 로마자 변환부;
상기 변환된 로마자에 기초하여 상기 단어에 대한 유사어를 검색하는 유사어 검색부; 및
상기 검색된 유사어 중 상기 단어에 대한 정답 단어를 선택하여 제공하는 정답 단어 선택부
를 포함하고,
상기 유사어 검색부는,
상기 로마자로 변환된 단어의 유사도 점수를 고려하여 상기 단어에 대한 유사어를 검색하고,
상기 정답 단어 선택부는,
상기 검색된 유사어 중에서 유사도 점수 또는 단어의 입력 빈도에 따른 편집 거리를 고려하여 상기 정답 단어를 선택하는 것을 특징으로 하는 일본어 자동 추천 시스템. - 제1항에 있어서,
상기 오타 판단부는,
상기 단어가 미리 설정된 오타 데이터에 포함되는지 여부, 상기 단어의 입력 빈도 또는 문서 출현 빈도가 미리 설정된 기준 빈도보다 낮은지 여부, 또는 상기 단어가 형태소로 분리되는지 여부를 고려하여 상기 단어가 오타인지 여부를 판단하는 것을 특징으로 하는 일본어 자동 추천 시스템. - 제1항에 있어서,
상기 유사도 점수는,
상기 단어가 장음, 중점, 촉음 또는 탁음을 포함하는지 여부에 따라 변경되는 것을 특징으로 하는 일본어 자동 추천 시스템. - 제1항에 있어서,상기 유사도 점수는,
상기 단어의 길이에 따른 입력 빈도, 상기 단어가 장음, 중점, 촉음 또는 탁음의 포함 여부에 따른 편집 거리 또는 상기 단어의 원형 상태의 비교 정도 중 적어도 하나에 기초하여 결정되는 것을 특징으로 하는 일본어 자동 추천 시스템. - 제1항에 있어서,
상기 유사어 검색부는,
상기 단어가 한자인 경우, 로마자로 변환된 형태의 비교 결과, 히라가나로 변환된 형태의 비교 결과 및 한자 원래 형태의 비교 결과를 고려하여 유사도 점수를 결정하는 것을 특징으로 하는 일본어 자동 추천 시스템. - 제1항에 있어서,
상기 단어가 오타가 아닌 경우 상기 검색된 유사어를 상기 히라가나, 가타카나 또는 한자 중 어느 하나의 일본어 형태로 변환하여 추천하는 유사어 추천부
를 더 포함하는 일본어 자동 추천 시스템. - 제6항에 있어서,
상기 유사어 추천부는,
(1) 로마자로 변환된 상태의 유사도와 로마자로 변환되지 않은 상태의 유사도의 차이가 미리 설정한 기준을 초과하는 경우, 상기 유사어를 추천하지 않거나, 또는
(2) 상기 단어가 상기 추천된 유사어보다 더 많이 사용되는 경우 상기 유사어를 추천하지 않는 것을 특징으로 하는 일본어 자동 추천 시스템. - 제6항에 있어서,
상기 유사어 추천부는,
상기 검색된 유사어를 상기 단어의 일본어 형태와 다른 형태로 변환하여 추천하는 것을 특징으로 하는 일본어 자동 추천 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110108839A KR101461062B1 (ko) | 2011-10-24 | 2011-10-24 | 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110108839A KR101461062B1 (ko) | 2011-10-24 | 2011-10-24 | 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090056609A Division KR101086550B1 (ko) | 2009-06-24 | 2009-06-24 | 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110132295A KR20110132295A (ko) | 2011-12-07 |
KR101461062B1 true KR101461062B1 (ko) | 2014-11-17 |
Family
ID=45500464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110108839A KR101461062B1 (ko) | 2011-10-24 | 2011-10-24 | 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101461062B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080114764A (ko) * | 2006-02-28 | 2008-12-31 | 야후! 인크. | 다수의 기입 시스템을 가진 언어들에 대한 관련 쿼리들을 식별하기 위한 시스템 및 방법 |
-
2011
- 2011-10-24 KR KR1020110108839A patent/KR101461062B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080114764A (ko) * | 2006-02-28 | 2008-12-31 | 야후! 인크. | 다수의 기입 시스템을 가진 언어들에 대한 관련 쿼리들을 식별하기 위한 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20110132295A (ko) | 2011-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101083540B1 (ko) | 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법 | |
CN107305768B (zh) | 语音交互中的易错字校准方法 | |
KR101524740B1 (ko) | 입력 방법 편집기 | |
US9582489B2 (en) | Orthographic error correction using phonetic transcription | |
JP5997217B2 (ja) | 言語変換において複数の読み方の曖昧性を除去する方法 | |
US8881005B2 (en) | Methods and systems for large-scale statistical misspelling correction | |
JP4833476B2 (ja) | モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ | |
JP2013117978A (ja) | タイピング効率向上のためのタイピング候補の生成方法 | |
US20070100890A1 (en) | System and method of providing autocomplete recommended word which interoperate with plurality of languages | |
US20050044495A1 (en) | Language input architecture for converting one text form to another text form with tolerance to spelling typographical and conversion errors | |
KR20100029221A (ko) | 명칭 엔터티와 신규 단어를 검출하는 것 | |
US20070179779A1 (en) | Language information translating device and method | |
Atia et al. | Increasing the accuracy of opinion mining in Arabic | |
KR102552811B1 (ko) | 클라우드 기반 문법 교정 서비스 제공 시스템 | |
Zitouni et al. | Arabic diacritic restoration approach based on maximum entropy models | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
KR101841824B1 (ko) | 텍스트 분할 프로그램, 텍스트 분할 장치, 및 텍스트 분할 방법 | |
Zupan et al. | How to tag non-standard language: Normalisation versus domain adaptation for slovene historical and user-generated texts | |
Yu et al. | Identification of Code‐Switched Sentences and Words Using Language Modeling Approaches | |
Ghoshal et al. | Web-derived pronunciations | |
KR101461062B1 (ko) | 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 | |
de Mendonça Almeida et al. | Evaluating phonetic spellers for user-generated content in Brazilian Portuguese | |
JP3952964B2 (ja) | 読み情報決定方法及び装置及びプログラム | |
Qafmolla | Automatic language identification | |
JP2010039864A (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20111024 Patent event code: PA01071R01D |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20140514 Comment text: Request for Examination of Application Patent event code: PA02011R04I Patent event date: 20111024 Comment text: Divisional Application of Patent |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20140613 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20141030 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20141106 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20141107 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20171011 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20171011 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20181105 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20181105 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20201022 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20210929 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20230925 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |