JP2024017326A - 検索装置、検索方法およびプログラム - Google Patents
検索装置、検索方法およびプログラム Download PDFInfo
- Publication number
- JP2024017326A JP2024017326A JP2022119881A JP2022119881A JP2024017326A JP 2024017326 A JP2024017326 A JP 2024017326A JP 2022119881 A JP2022119881 A JP 2022119881A JP 2022119881 A JP2022119881 A JP 2022119881A JP 2024017326 A JP2024017326 A JP 2024017326A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- search
- tone
- character
- pinyin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 description 36
- 238000013500 data storage Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 10
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 6
- 239000000470 constituent Substances 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 2
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 230000002301 combined effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3337—Translation of the query language, e.g. Chinese to English
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
不明の文字を含む所定数の文字と声調記号とから構成される文字列を第1の検索対象文字列として取得し、
取得された前記第1の検索対象文字列から声調記号を除いた文字列に一致するものを変換候補として取得し、
前記変換候補について声調記号を付加し、所定の文字数からなる変換候補文字列を生成し、
前記第1の検索対象文字列の各文字のうち、少なくとも前記不明の文字の直後に不明の声調記号を示す文字を付加して、第2の検索対象文字列を生成し、
前記第2の検索対象文字列と前記変換候補文字列とを比較し、比較結果を出力する、
制御部を備えることを特徴とする。
図1は、本発明の検索装置、検索方法およびプログラムの実施形態に係る検索システム1の全体構成を示す図である。
外国語検索サーバ10は、少なくとも以下(a)(b)の機能を有する。
図2は、外国語検索サーバ10および通信端末20の機能的構成を示すブロック図である。
次に、実施形態の検索システム1の動作について説明する。
実施形態の検索システム1によれば、通信端末20から不明の読みの部分をワイルドカード[?]に代えた声調記号付きのピンイン検索文字列を入力すると、外国語検索サーバ10は、入力された声調記号付きのピンイン検索文字列から、声調記号の付加ルールに従い四声数字を付加した四声数字付きピンイン検索文字列(第1の検索対象文字列)をXML変換して生成する。
10 …外国語検索サーバ(検索装置)
11 …制御部(CPU)
12 …記憶部
12a…サーバ制御プログラム
12b…辞書データベース記憶領域
12c…四声数字無しピンイン検索テーブル記憶領域
12d…四声数字付きピンイン検索テーブル記憶領域
12e…ユーザ管理データ記憶領域
12f…検索文字データ記憶領域
12g…検索結果データ記憶領域
12h…作業データ記憶領域
13 …外部記録媒体
14 …記録媒体読取部
15 …通信部
20 …通信端末
21 …表示部(タッチパネル式)
G …外国語検索画面
Claims (10)
- 不明の文字を含む所定数の文字と声調記号とから構成される文字列を第1の検索対象文字列として取得し、
取得された前記第1の検索対象文字列から声調記号を除いた文字列に一致するものを変換候補として取得し、
前記変換候補について声調記号を付加し、所定の文字数からなる変換候補文字列を生成し、
前記第1の検索対象文字列の各文字のうち、少なくとも前記不明の文字の直後に不明の声調記号を示す文字を付加して、第2の検索対象文字列を生成し、
前記第2の検索対象文字列と前記変換候補文字列とを比較し、比較結果を出力する、
制御部を備えることを特徴とする検索装置。 - 前記制御部は、更に前記第1の検索対象文字列の各文字のうち、前記不明の文字以外の文字について、声調無しを意味する文字を付加して、第2の検索対象文字列を生成することを特徴とする請求項1に記載の検索装置。
- 前記制御部は、前記変換候補文字列に含まれる声調記号を、声調記号の存在位置に関する規則に基づいて並べ替えることを特徴とする請求項1又は2に記載の検索装置。
- 前記制御部は、入力した前記文字列を、声調記号の存在位置に関する規則に基づいたXML形式の記述言語に変換し前記第1の検索対象文字列として取得することを特徴とする請求項1に記載の検索装置。
- 前記制御部は、前記変換候補文字列を、各文字のうち前記声調記号が付加されていない文字については声調無しを意味する文字を付加した文字列として生成し、前記第2の検索対象文字列と比較することを特徴とする請求項1又は2に記載の検索装置。
- 前記制御部は、辞書の見出し語に対応する所定の発音表記体系に対応する文字列のテーブルから、前記第1の検索対象文字列から声調記号を除いた文字列に一致する文字列を前記変換候補として取得することを特徴とする請求項1に記載の検索装置。
- 前記制御部は、辞書の見出し語に対応する声調記号を付加した前記所定の発音表記体系に対応する文字列のテーブルに基づき、前記所定の文字数からなる変換候補文字列を生成することを特徴とする請求項1に記載の検索装置。
- 不明の文字を含む所定数の文字と声調記号とから構成される文字列を入力する際に、前記不明の文字の直後に不明の声調記号を示す文字を付加して入力することにより、検索対象文字列を生成することを特徴とする検索装置。
- 検索装置が実行する検索方法であって、
不明の文字を含む所定数の文字と声調記号とから構成される文字列を第1の検索対象文字列として取得し、
取得された前記第1の検索対象文字列から声調記号を除いた文字列に一致するものを変換候補として取得し、
前記変換候補について声調記号を付加し、所定の文字数からなる変換候補文字列を生成し、
前記第1の検索対象文字列の各文字のうち、少なくとも前記不明の文字の直後に不明の声調記号を示す文字を付加して、第2の検索対象文字列を生成し、
前記第2の検索対象文字列と前記変換候補文字列とを比較し、比較結果を出力する、
処理を実行することを特徴とする検索方法。 - 検索装置の制御部を、
不明の文字を含む所定数の文字と声調記号とから構成される文字列を第1の検索対象文字列として取得し、
取得された前記第1の検索対象文字列から声調記号を除いた文字列に一致するものを変換候補として取得し、
前記変換候補について声調記号を付加し、所定の文字数からなる変換候補文字列を生成し、
前記第1の検索対象文字列の各文字のうち、少なくとも前記不明の文字の直後に不明の声調記号を示す文字を付加して、第2の検索対象文字列を生成し、
前記第2の検索対象文字列と前記変換候補文字列とを比較し、比較結果を出力する、
処理を実行するように機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022119881A JP2024017326A (ja) | 2022-07-27 | 2022-07-27 | 検索装置、検索方法およびプログラム |
US18/218,627 US20240037129A1 (en) | 2022-07-27 | 2023-07-06 | Search device, search method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022119881A JP2024017326A (ja) | 2022-07-27 | 2022-07-27 | 検索装置、検索方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024017326A true JP2024017326A (ja) | 2024-02-08 |
Family
ID=89664351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022119881A Pending JP2024017326A (ja) | 2022-07-27 | 2022-07-27 | 検索装置、検索方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240037129A1 (ja) |
JP (1) | JP2024017326A (ja) |
-
2022
- 2022-07-27 JP JP2022119881A patent/JP2024017326A/ja active Pending
-
2023
- 2023-07-06 US US18/218,627 patent/US20240037129A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240037129A1 (en) | 2024-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5997217B2 (ja) | 言語変換において複数の読み方の曖昧性を除去する方法 | |
US8199112B2 (en) | Character input device | |
JP5513898B2 (ja) | 共有された言語モデル | |
JP2013117978A (ja) | タイピング効率向上のためのタイピング候補の生成方法 | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
Uthayamoorthy et al. | Ddspell-a data driven spell checker and suggestion generator for the tamil language | |
JP2000298667A (ja) | 構文情報による漢字変換装置 | |
JP2024017326A (ja) | 検索装置、検索方法およびプログラム | |
JP5024335B2 (ja) | 情報表示制御装置および情報表示制御プログラム | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP5487898B2 (ja) | 辞書機能を備えた電子機器およびプログラム | |
JP3803253B2 (ja) | 漢字入力のための方法および装置 | |
JP2007257188A (ja) | 辞書検索装置およびその制御プログラム | |
JP4492499B2 (ja) | 情報表示制御装置および情報表示制御プログラム | |
JPH07129572A (ja) | 漢字変換装置 | |
JPH1166061A (ja) | 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2008140074A (ja) | 例文検索装置および例文検索処理プログラム | |
JP7106479B2 (ja) | 電子機器、文字入力方法およびプログラム | |
JP4922030B2 (ja) | 文字列検索装置、方法及びプログラム | |
JP2012203728A (ja) | 情報検索装置およびプログラム | |
JP2008262248A (ja) | 文字検索方法 | |
JP2021128618A (ja) | 表示装置、及びプログラム | |
JP2019053464A (ja) | 変換補助装置 | |
JP2009098328A (ja) | 音声合成装置及び方法 | |
JPH10261049A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20220805 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230104 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240528 |