JP5248121B2 - 愛称を推定する装置、方法およびプログラム - Google Patents
愛称を推定する装置、方法およびプログラム Download PDFInfo
- Publication number
- JP5248121B2 JP5248121B2 JP2008004364A JP2008004364A JP5248121B2 JP 5248121 B2 JP5248121 B2 JP 5248121B2 JP 2008004364 A JP2008004364 A JP 2008004364A JP 2008004364 A JP2008004364 A JP 2008004364A JP 5248121 B2 JP5248121 B2 JP 5248121B2
- Authority
- JP
- Japan
- Prior art keywords
- nickname
- name
- character
- candidate
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
上述のように、従来は、愛称、略称、および別名等は、予め人手で作成してデータベースに登録していた。また、略称の場合は、所定の略称生成パターンによって、正式名称から略称を推定する方法が用いられていた。しかし、テレビ番組の番組表データ(EPG(Electronic Program Guide)データ)のような日々更新される情報では、例えば新しい芸能人が現れることによってデータの更新が頻繁に必要となる。このため、辞書に蓄えておくだけは充分に対応することが困難である。また、辞書の更新を人手で行うのはコストがかかる。
第2の実施の形態にかかる愛称推定装置は、Webなどから取得された文書を対象として、生成された愛称候補を検索し、当該文書に含まれる愛称候補を選択することにより、さらに適切な愛称候補を取得する。
第3の実施の形態にかかる愛称推定装置は、名称と、当該名称について事前に分かっている愛称との対を入力して愛称生成ルールを学習する。
第4の実施の形態にかかる愛称推定装置は、愛称生成ルールによる愛称候補の生成に加えて、Webなどの外部データから愛称候補を抽出し、生成および抽出した愛称候補から適切な愛称候補を選択する。
52 ROM
53 RAM
54 通信I/F
61 バス
100 愛称推定装置
101 名称入力部
102 候補生成部
103 出力部
121 ルール記憶部
201 愛称候補
301 人名
302 カタカナ表記
800 愛称推定装置
804 選択部
822 文書記憶部
1000 愛称推定装置
1005 学習データ入力部
1006 学習部
1201 正式名称
1202、1212 愛称
1203、1213、1223 愛称生成ルール
1211 ひらがな表記
1301 正式名称
1302 ひらがな表記
1303 カタカナ表記
1311〜1314 愛称候補
1400 愛称推定装置
1404 選択部
1407 候補抽出部
1701 文字列
1711〜1718 接尾辞
1801、1802 文字
Claims (12)
- 名称から前記名称の愛称を推定する愛称推定装置であって、
文字種と、前記文字種で表される前記名称に含まれる文字のうち、前記愛称の候補に含める文字の位置を表す位置情報と、予め定められた付加文字列とを含む前記愛称の候補の生成規則を記憶する規則記憶部と、
前記名称を入力する名称入力部と、
入力された前記名称に含まれる文字のうち、入力された前記名称と同一の前記文字種を含む前記生成規則の前記位置情報で表される位置の文字を取得し、取得した文字と前記生成規則の前記付加文字列とを結合した前記愛称の候補を生成する生成部と、
生成された前記愛称の候補を出力する出力部と、
を備えたことを特徴とする愛称推定装置。 - 前記名称と前記名称について既に分かっている愛称とを対応づけた学習データを入力する学習データ入力部と、
前記学習データの前記名称と前記学習データの前記愛称とに共通して含まれる共通文字を取得し、前記学習データの前記名称から前記共通文字の位置を表す位置情報を生成し、前記学習データの前記愛称から前記共通文字を削除した文字列を生成し、前記共通文字の文字種と生成した位置情報と生成した文字列とを前記愛称の候補の生成規則として学習する学習部と、をさらに備えたこと、
を特徴とする請求項1に記載の愛称推定装置。 - 前記名称を検索キーワードとして取得された第1文書に前記愛称の候補が含まれるか否かを判定し、前記第1文書に含まれる前記愛称の候補を選択する選択部をさらに備えたこと、
を特徴とする請求項1に記載の愛称推定装置。 - 前記選択部は、さらに、Web上に存在する第2文書のうち、選択された前記愛称の候補を含む前記第2文書を検索し、検索された前記第2文書の数が多い順に予め定められた個数の前記愛称の候補を選択すること、
を特徴とする請求項3に記載の愛称推定装置。 - 前記選択部は、選択された前記愛称の候補と前記名称とを含む連語を検索キーワードとして前記第2文書を検索し、検索された前記第2文書の数が多い順に予め定められた個数の前記愛称の候補を選択すること、
を特徴とする請求項4に記載の愛称推定装置。 - 前記選択部は、前記第1文書のうち、入力された前記名称を含む前記第1文書を対象として、前記愛称の候補が含まれるか否かを判定し、前記第1文書に含まれる前記愛称の候補を選択すること、
を特徴とする請求項3に記載の愛称推定装置。 - 前記選択部は、入力された前記名称を含む前記第1文書から、前記名称の前および後の少なくとも一方の予め定められた文字数の文字列を取得し、取得した文字列を対象として、前記愛称の候補が含まれるか否かを判定し、取得した文字列に含まれる前記愛称の候補を選択すること、
を特徴とする請求項6に記載の愛称推定装置。 - Web上に存在する第3文書のうち、入力された前記名称を含む前記第3文書を検索し、検索された前記第3文書の前記名称の前および後の少なくとも一方の予め定められた文字数の文字列を取得し、取得した文字列から前記愛称の候補を抽出する抽出部をさらに備えたこと、
を特徴とする請求項1に記載の愛称推定装置。 - 出力された前記愛称の候補のうち、利用者によって指定された前記愛称の候補を選択する選択部をさらに備えたこと、
を特徴とする請求項1に記載の愛称推定装置。 - 前記生成規則は、前記文字種および記位置情報を表す第1記号と、前記付加文字列と、を含み、
前記生成部は、入力された前記名称に含まれる文字それぞれを、前記文字の文字種および前記文字の位置を表す位置情報を表す第2記号に変換し、前記第2記号と同一の前記第1記号を含む前記生成規則に、前記第2記号に対応する文字を当てはめることによって前記愛称の候補を生成すること、
を特徴とする請求項1に記載の愛称推定装置。 - 名称から前記名称の愛称を推定する愛称推定装置で実行される愛称推定方法であって、
前記愛称推定装置は、文字種と、前記文字種で表される前記名称に含まれる文字のうち、前記愛称の候補に含める文字の位置を表す位置情報と、予め定められた付加文字列とを含む前記愛称の候補の生成規則を記憶する規則記憶部を備え、
名称入力部が、前記名称を入力する名称入力ステップと、
生成部が、入力された前記名称に含まれる文字のうち、入力された前記名称と同一の前記文字種を含む前記生成規則の前記位置情報で表される位置の文字を取得し、取得した文字と前記生成規則の前記付加文字列とを結合した前記愛称の候補を生成する生成ステップと、
出力部が、生成された前記愛称の候補を出力する出力ステップと、
を備えたことを特徴とする愛称推定方法。 - 名称から前記名称の愛称を推定する愛称推定装置で実行される愛称推定プログラムであって、
前記愛称推定装置は、文字種と、前記文字種で表される前記名称に含まれる文字のうち、前記愛称の候補に含める文字の位置を表す位置情報と、予め定められた付加文字列とを含む前記愛称の候補の生成規則を記憶する規則記憶部を備え、
前記名称を入力する名称入力手順と、
入力された前記名称に含まれる文字のうち、入力された前記名称と同一の前記文字種を含む前記生成規則の前記位置情報で表される位置の文字を取得し、取得した文字と前記生成規則の前記付加文字列とを結合した前記愛称の候補を生成する生成手順と、
生成された前記愛称の候補を出力する出力手順と、
を前記愛称推定装置に実行させる愛称推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008004364A JP5248121B2 (ja) | 2008-01-11 | 2008-01-11 | 愛称を推定する装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008004364A JP5248121B2 (ja) | 2008-01-11 | 2008-01-11 | 愛称を推定する装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009169513A JP2009169513A (ja) | 2009-07-30 |
JP5248121B2 true JP5248121B2 (ja) | 2013-07-31 |
Family
ID=40970637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008004364A Expired - Fee Related JP5248121B2 (ja) | 2008-01-11 | 2008-01-11 | 愛称を推定する装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5248121B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103146439A (zh) * | 2012-12-18 | 2013-06-12 | 柳州钢铁股份有限公司 | 焦炉煤气负压洗萘方法及设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7205173B2 (ja) * | 2018-11-08 | 2023-01-17 | カシオ計算機株式会社 | 情報処理装置、ロボット、情報処理方法及びプログラム |
CN111814470A (zh) * | 2020-07-14 | 2020-10-23 | 混沌时代(北京)教育科技有限公司 | 一种基于互联网昵称提取称呼方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11109991A (ja) * | 1997-10-08 | 1999-04-23 | Mitsubishi Electric Corp | マンマシンインターフェースシステム |
JP3898615B2 (ja) * | 2002-09-27 | 2007-03-28 | 株式会社東芝 | 短縮語作成支援装置および短縮語作成支援プログラム |
JP3724649B2 (ja) * | 2002-11-11 | 2005-12-07 | 松下電器産業株式会社 | 音声認識用辞書作成装置および音声認識装置 |
JP2006012000A (ja) * | 2004-06-29 | 2006-01-12 | Canon Sales Co Inc | 文書検索方法、文書検索装置、コンピュータプログラム及びコンピュータ読み取り可能な記録媒体 |
-
2008
- 2008-01-11 JP JP2008004364A patent/JP5248121B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103146439A (zh) * | 2012-12-18 | 2013-06-12 | 柳州钢铁股份有限公司 | 焦炉煤气负压洗萘方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2009169513A (ja) | 2009-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US11586689B2 (en) | Electronic apparatus and controlling method thereof | |
JP5426710B2 (ja) | 検索支援装置、検索支援方法およびプログラム | |
KR101797125B1 (ko) | 다국어 사업 표시 큐레이션 및 음역 합성 | |
JP6524008B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5221768B2 (ja) | 翻訳装置、及びプログラム | |
JP7031462B2 (ja) | 分類プログラム、分類方法、および情報処理装置 | |
JP5248121B2 (ja) | 愛称を推定する装置、方法およびプログラム | |
JP2015219582A (ja) | 対話方法、対話装置、対話プログラム及び記録媒体 | |
JP5342760B2 (ja) | 訳語学習のためのデータを作成する装置、方法、およびプログラム | |
JP6787755B2 (ja) | 文書検索装置 | |
CN110634480A (zh) | 语音对话系统与模型创建装置及其方法 | |
JP2007200252A (ja) | 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体 | |
JP2013069157A (ja) | 自然言語処理装置、自然言語処理方法および自然言語処理プログラム | |
JP6881077B2 (ja) | 判別プログラム、判別装置及び判別方法 | |
JP2005190100A (ja) | 質問応答システムおよび方法 | |
JP6309852B2 (ja) | 強調位置予測装置、強調位置予測方法及びプログラム | |
WO2023073886A1 (ja) | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 | |
JP5182960B2 (ja) | 店舗名曖昧性解消装置、その方法、プログラム及び記録媒体 | |
JP2019159118A (ja) | 出力プログラム、情報処理装置及び出力制御方法 | |
JP7200474B2 (ja) | 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム | |
JP2007171275A (ja) | 言語処理装置及び現後処理方法 | |
JP2017199139A (ja) | キーワード抽出装置、キーワード抽出方法及びキーワード抽出プログラム | |
JP2006018622A (ja) | 情報処理システム、情報処理装置および情報処理方法、プログラム、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130410 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5248121 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |