JP5355483B2 - 略語完全語復元装置とその方法と、プログラム - Google Patents
略語完全語復元装置とその方法と、プログラム Download PDFInfo
- Publication number
- JP5355483B2 JP5355483B2 JP2010097649A JP2010097649A JP5355483B2 JP 5355483 B2 JP5355483 B2 JP 5355483B2 JP 2010097649 A JP2010097649 A JP 2010097649A JP 2010097649 A JP2010097649 A JP 2010097649A JP 5355483 B2 JP5355483 B2 JP 5355483B2
- Authority
- JP
- Japan
- Prior art keywords
- complete word
- word
- abbreviation
- complete
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、各装置の機能構成部は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしても良い。
Claims (7)
- 略語を入力としてカッコ付き略語の表記でテキストデータベースを検索し、マッチする文書集合を得る検索部と、
上記文書集合の中の個々の文書から、略語の先頭文字から末尾文字までがマッチする複数の単語列を完全語候補として抽出する完全語候補抽出部と、
複数の上記完全語候補を入力として、上記完全語候補を意味ごとにまとめ上げた完全語集約候補を生成する完全語候補まとめ上げ部と、
上記文書集合と上記完全語集約候補と外部から入力される上記略語を含む文書とを入力として、上記完全語集約候補のそれぞれに対応する文書からその完全語集約候補のトピックベクトルと、上記外部から入力される上記略語を含む文書から略語の特徴ベクトルと、を生成するトピックベクトル生成部と、
上記トピックベクトルと上記略語の特徴ベクトルとの類似度によって、上記完全語集約候補の中の一つを完全語として選択する完全語復元部と、
を具備する略語完全語復元装置。 - 請求項1に記載した略語完全語復元装置において、
上記完全語候補まとめ上げ部は、
上記完全語候補の末尾単語ごとの意味クラスに分類する意味クラス分類手段と、
上記末尾単語が同じ完全語候補を、上記末尾の単語がルートである木構造として捉え、上記ルートから各単語に至るまでの単語列の出現頻度が、外部から入力されるパラメータの値よりも大きな出現頻度の上記完全語候補を完全語集約候補として集約するまとめ上げ手段と、
を備えることを特徴とする略語完全語復元装置。 - 請求項1又は2に記載した略語完全語復元装置において、
上記完全語復元部は、
上記トピックベクトルと上記略語の特徴ベクトルとの内積値を演算する内積演算手段と、
上記内積値が最大の上記完全語集約候補を完全語として選択する完全語集約候補選択手段と、
を備えることを特徴とする略語完全語復元装置。 - 検索部が、略語を入力としてカッコ付き略語の表記でテキストデータベースを検索し、マッチする単語列を得る検索過程と、
完全語候補抽出部が、上記略語の先頭文字から末尾文字までがマッチする単語列を完全語候補として抽出する完全語候補抽出過程と、
複数の上記完全語候補を入力として、上記完全語候補を意味ごとにまとめ上げた完全語集約候補を生成する完全語候補まとめ上げ過程と、
トピックベクトル生成部が、上記文書集合と上記完全語集約候補と外部から入力される上記略語を含む文書とを入力として、上記完全語集約候補のそれぞれに対応する文書からその完全語集約候補のトピックベクトルと、上記外部から入力される上記略語を含む文書から略語の特徴ベクトルとを生成するトピックベクトル生成過程と、
完全語復元部が、上記トピックベクトルと外部から入力される完全語特徴ベクトルとの類似度によって、上記完全語集約候補の中の一つを完全語として選択する完全語復元過程と、
を含む略語完全語復元方法。 - 請求項4に記載した略語完全語復元方法において、
上記完全語候補まとめ上げ過程は、
上記完全語候補の末尾単語ごとの意味クラスに分類する意味クラス分類ステップと、
上記末尾の単語が同じ上記完全語候補を、上記末尾単語がルートである木構造として捉え、上記ルートから各単語に至るまでの単語列の出現頻度が、外部から入力されるパラメータの値よりも大きな単語列を完全語集約候補として集約するまとめ上げステップと、
を含むことを特徴とする略語完全語復元方法。 - 請求項4又は5に記載した略語完全語復元方法において、
上記完全語復元過程は、
上記トピックベクトルと上記略語の特徴ベクトルとの内積値を演算する内積演算ステップと、
上記内積値が最大の上記完全語集約候補を完全語として選択する完全語集約候補選択ステップと、
を含むことを特徴とする略語完全語復元方法。 - 請求項1乃至3の何れかに記載した略語完全語復元装置の各部の機能を、コンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010097649A JP5355483B2 (ja) | 2010-04-21 | 2010-04-21 | 略語完全語復元装置とその方法と、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010097649A JP5355483B2 (ja) | 2010-04-21 | 2010-04-21 | 略語完全語復元装置とその方法と、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011227749A JP2011227749A (ja) | 2011-11-10 |
JP5355483B2 true JP5355483B2 (ja) | 2013-11-27 |
Family
ID=45043008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010097649A Active JP5355483B2 (ja) | 2010-04-21 | 2010-04-21 | 略語完全語復元装置とその方法と、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5355483B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5898153B2 (ja) | 2013-09-05 | 2016-04-06 | 京セラドキュメントソリューションズ株式会社 | 省略語管理プログラム、省略語管理装置、フルスペル表示プログラムおよびフルスペル表示装置 |
JP2017134693A (ja) | 2016-01-28 | 2017-08-03 | 富士通株式会社 | 意味情報登録支援プログラム、情報処理装置および意味情報登録支援方法 |
CN109543736B (zh) * | 2018-11-15 | 2020-11-27 | 新华三技术有限公司 | 一种特征对比方法及装置 |
CN109614493B (zh) * | 2018-12-29 | 2023-02-03 | 重庆邂智科技有限公司 | 一种基于监督词向量的文本缩写识别方法及系统 |
KR102500106B1 (ko) * | 2019-12-06 | 2023-02-16 | 주식회사 엘지유플러스 | 약어 사전 구축 장치 및 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04130578A (ja) * | 1990-09-20 | 1992-05-01 | Fujitsu Ltd | 未登録語検索方法および装置 |
JPH1166068A (ja) * | 1997-08-20 | 1999-03-09 | Matsushita Electric Ind Co Ltd | 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 |
JP2007200252A (ja) * | 2006-01-30 | 2007-08-09 | Ricoh Co Ltd | 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体 |
JP4900947B2 (ja) * | 2007-02-22 | 2012-03-21 | 日本電信電話株式会社 | 略語抽出方法、略語抽出装置およびプログラム |
-
2010
- 2010-04-21 JP JP2010097649A patent/JP5355483B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011227749A (ja) | 2011-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20150070171A (ko) | 스트링 변환의 귀납적 합성을 위한 랭킹 기법 | |
JP6955963B2 (ja) | 検索装置、類似度算出方法、およびプログラム | |
JP5355483B2 (ja) | 略語完全語復元装置とその方法と、プログラム | |
US11328006B2 (en) | Word semantic relation estimation device and word semantic relation estimation method | |
US20150205860A1 (en) | Information retrieval device, information retrieval method, and information retrieval program | |
KR102059743B1 (ko) | 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템 | |
JP2016164708A (ja) | 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム | |
JP6434162B2 (ja) | データ管理システム、データ管理方法およびプログラム | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
CN116932730B (zh) | 基于多叉树和大规模语言模型的文档问答方法及相关设备 | |
CN112559691B (zh) | 语义相似度的确定方法及确定装置、电子设备 | |
JP5542729B2 (ja) | 関連語抽出装置、関連語抽出方法、及び関連語抽出プログラム | |
CN111339778B (zh) | 文本处理方法、装置、存储介质和处理器 | |
US20190095525A1 (en) | Extraction of expression for natural language processing | |
JP5362807B2 (ja) | ドキュメントランク付け方法および装置 | |
JP2007334388A (ja) | クラスタリング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP5869948B2 (ja) | パッセージ分割方法、装置、及びプログラム | |
CN109902162B (zh) | 基于数字指纹的文本相似性的识别方法、存储介质及装置 | |
JP2017068742A (ja) | 関連文書検索装置、モデル作成装置、これらの方法及びプログラム | |
KR102519955B1 (ko) | 토픽 키워드의 추출 장치 및 방법 | |
JP7122773B2 (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
JP2009140411A (ja) | 文章要約装置および文章要約方法 | |
JP6805927B2 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
KR20220041336A (ko) | 중요 키워드 추천 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법 | |
JP5182960B2 (ja) | 店舗名曖昧性解消装置、その方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130814 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5355483 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |