JP5337705B2 - 中国語バナーの生成 - Google Patents
中国語バナーの生成 Download PDFInfo
- Publication number
- JP5337705B2 JP5337705B2 JP2009543241A JP2009543241A JP5337705B2 JP 5337705 B2 JP5337705 B2 JP 5337705B2 JP 2009543241 A JP2009543241 A JP 2009543241A JP 2009543241 A JP2009543241 A JP 2009543241A JP 5337705 B2 JP5337705 B2 JP 5337705B2
- Authority
- JP
- Japan
- Prior art keywords
- banner
- existing
- chinese
- banners
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
Claims (8)
- 中国語の入力対句に関連付けられた出力バナーを取得するためにコンピュータで実行される方法であって、
既存の中国語バナーのセットを取得するステップと、
前記既存の中国語バナーのセット内の各既存のバナーについて特徴ベクトルを作成するステップであって、各既存のバナーの特徴ベクトルは、各既存のバナーに関する検索結果に基づいて作成されるステップと、
前記既存の中国語バナーのセットおよび前記既存のバナーの特徴ベクトルに基づいて、バナー分類法を構築するステップと、
前記中国語の入力対句の特徴ベクトルを作成するステップと、
前記バナー分類法によって、前記中国語の入力対句を前記既存の中国語バナーのセットと比較するステップであって、当該比較は、前記中国語の入力対句の特徴ベクトルと前記既存のバナーの各特徴ベクトルとの間の距離を計算することを含む、ステップと、
前記比較に基づいて、前記セット内の前記既存のバナーの少なくとも1つを、該セット内の別の既存のバナーよりもより合致する候補バナーであると識別するステップと、
前記既存のバナーのうち前記少なくとも1つの既存のバナーがより合致する候補であることを示す出力を提供するステップと
を含むことを特徴とする、コンピュータで実行される方法。 - 前記バナー分類法を構築するステップは、前記セット内の各既存の中国語バナーを、複数のカテゴリの少なくとも1つに割り当てるステップを含むことを特徴とする請求項1に記載のコンピュータで実行される方法。
- 前記バナー分類法を構築するステップは、前記複数のカテゴリのうちの1つに割り当てられた既存の中国語バナーをサブカテゴリに分割するステップをさらに含むことを特徴とする請求項2に記載のコンピュータで実行される方法。
- 前記バナー分類法を構築するステップは、各サブカテゴリについて重心特徴ベクトルを作成するステップをさらに含むことを特徴とする、請求項3に記載のコンピュータで実行される方法。
- 前記比較するステップは、前記中国語の入力対句を前記複数のカテゴリの1つに割り当てるステップを含むことを特徴とする請求項1に記載のコンピュータで実行される方法。
- 中国語の入力対句に関連付けられた出力バナーを取得するためにコンピュータで実行される方法であって、前記方法は前記出力バナーを生成するステップを備え、前記出力バナーを生成するステップは、
前記中国語の入力対句に関連する、中国語の単語のセットを識別するステップと、
前記単語のセット内の各単語と前記中国語の入力対句との間の関連性の強度を計算するステップと、
前記単語のセット内の単語のうち、前記関連性の強度が閾値を超えている単語を組み合わせて、候補バナーのセットを作成するステップと、
前記候補バナーのセットに含まれる第1の候補バナーと、前記候補バナーのセットに含まれない第2の候補バナーとから、前記出力バナーを選択するステップであって、前記第2の候補バナーは、既存の中国語のバナーのセットから各既存のバナーの特徴ベクトルに少なくとも部分的に基づいて選択され、各既存のバナーの特徴ベクトルは、各既存のバナーに関する検索結果に少なくとも部分的に基づいて作成され、前記出力バナーは、前記第1の候補バナーと前記第2の候補バナーとを比較してランク付けすることによって選択されるステップと
前記出力バナーを示す出力を提供するステップと
を含むことを特徴とする方法。 - 前記単語のセットを識別するステップは、変換モデルに関連して行われる分析に基づいて識別することを含むことを特徴とする請求項6に記載の方法。
- 前記単語を組み合わせることは、4文字の候補バナーを形成するように単語を組み合わせることを含むことを特徴とする請求項6に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US87608506P | 2006-12-20 | 2006-12-20 | |
US60/876,085 | 2006-12-20 | ||
US11/788,448 US8000955B2 (en) | 2006-12-20 | 2007-04-20 | Generating Chinese language banners |
US11/788,448 | 2007-04-20 | ||
PCT/US2007/088466 WO2008077148A1 (en) | 2006-12-20 | 2007-12-20 | Generating chinese language banners |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010515123A JP2010515123A (ja) | 2010-05-06 |
JP5337705B2 true JP5337705B2 (ja) | 2013-11-06 |
Family
ID=39536757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009543241A Expired - Fee Related JP5337705B2 (ja) | 2006-12-20 | 2007-12-20 | 中国語バナーの生成 |
Country Status (5)
Country | Link |
---|---|
US (2) | US8000955B2 (ja) |
EP (1) | EP2122491A4 (ja) |
JP (1) | JP5337705B2 (ja) |
CA (1) | CA2669218A1 (ja) |
WO (1) | WO2008077148A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7962507B2 (en) | 2007-11-19 | 2011-06-14 | Microsoft Corporation | Web content mining of pair-based data |
TW200933391A (en) * | 2008-01-24 | 2009-08-01 | Delta Electronics Inc | Network information search method applying speech recognition and sysrem thereof |
CN111984783B (zh) * | 2020-08-28 | 2024-04-02 | 达闼机器人股份有限公司 | 文本生成模型的训练方法、文本生成方法及相关设备 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4712174A (en) * | 1984-04-24 | 1987-12-08 | Computer Poet Corporation | Method and apparatus for generating text |
JPH083815B2 (ja) * | 1985-10-25 | 1996-01-17 | 株式会社日立製作所 | 自然言語の共起関係辞書保守方法 |
SG49804A1 (en) | 1996-03-20 | 1998-06-15 | Government Of Singapore Repres | Parsing and translating natural language sentences automatically |
JPH10312382A (ja) * | 1997-05-13 | 1998-11-24 | Keiichi Shinoda | 類似用例翻訳システム |
US6299452B1 (en) * | 1999-07-09 | 2001-10-09 | Cognitive Concepts, Inc. | Diagnostic system and method for phonological awareness, phonological processing, and reading skill testing |
AU2621301A (en) * | 1999-11-01 | 2001-05-14 | Kurzweil Cyberart Technologies, Inc. | Computer generated poetry system |
US6941262B1 (en) * | 1999-11-01 | 2005-09-06 | Kurzweil Cyberart Technologies, Inc. | Poet assistant's graphical user interface (GUI) |
US7269802B1 (en) * | 1999-11-01 | 2007-09-11 | Kurzweil Cyberart Technologies, Inc. | Poetry screen saver |
US7475006B2 (en) | 2001-07-11 | 2009-01-06 | Microsoft Corporation, Inc. | Method and apparatus for parsing text using mutual information |
JP2003178057A (ja) * | 2001-12-13 | 2003-06-27 | Ntt Data Corp | フレーズ生成装置、フレーズ生成方法、及びプログラム |
AUPR958901A0 (en) * | 2001-12-18 | 2002-01-24 | Telstra New Wave Pty Ltd | Information resource taxonomy |
US20040122660A1 (en) * | 2002-12-20 | 2004-06-24 | International Business Machines Corporation | Creating taxonomies and training data in multiple languages |
US20040133558A1 (en) * | 2003-01-06 | 2004-07-08 | Masterwriter, Inc. | Information management system plus |
JP2005100335A (ja) * | 2003-09-01 | 2005-04-14 | Advanced Telecommunication Research Institute International | 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ |
US20050071148A1 (en) | 2003-09-15 | 2005-03-31 | Microsoft Corporation | Chinese word segmentation |
JP2005228016A (ja) * | 2004-02-13 | 2005-08-25 | Hitachi Ltd | 文字表示方法 |
US7810021B2 (en) * | 2006-02-24 | 2010-10-05 | Paxson Dana W | Apparatus and method for creating literary macramés |
US20070294223A1 (en) * | 2006-06-16 | 2007-12-20 | Technion Research And Development Foundation Ltd. | Text Categorization Using External Knowledge |
-
2007
- 2007-04-20 US US11/788,448 patent/US8000955B2/en active Active
- 2007-12-20 EP EP07865944.8A patent/EP2122491A4/en not_active Ceased
- 2007-12-20 CA CA002669218A patent/CA2669218A1/en not_active Abandoned
- 2007-12-20 WO PCT/US2007/088466 patent/WO2008077148A1/en active Application Filing
- 2007-12-20 JP JP2009543241A patent/JP5337705B2/ja not_active Expired - Fee Related
-
2011
- 2011-04-15 US US13/087,407 patent/US8862459B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2122491A1 (en) | 2009-11-25 |
US8000955B2 (en) | 2011-08-16 |
CA2669218A1 (en) | 2008-06-26 |
WO2008077148A1 (en) | 2008-06-26 |
US20110257959A1 (en) | 2011-10-20 |
EP2122491A4 (en) | 2017-11-29 |
JP2010515123A (ja) | 2010-05-06 |
US20080154580A1 (en) | 2008-06-26 |
US8862459B2 (en) | 2014-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Desagulier et al. | Corpus linguistics and statistics with R | |
CN106997382B (zh) | 基于大数据的创新创意标签自动标注方法及系统 | |
US10176804B2 (en) | Analyzing textual data | |
JP5825676B2 (ja) | ノン・ファクトイド型質問応答システム及びコンピュータプログラム | |
US20210142791A1 (en) | System and Method for Intent Discovery from Multimedia Conversation | |
CN111177365A (zh) | 一种基于图模型的无监督自动文摘提取方法 | |
US20160062985A1 (en) | Clustering Classes in Language Modeling | |
Biemann | Structure discovery in natural language | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
CN102314440B (zh) | 利用网络维护语言模型库的方法和系统 | |
CN108073565A (zh) | 词语规范化的方法和设备及机器翻译方法和设备 | |
Flati et al. | Multiwibi: The multilingual wikipedia bitaxonomy project | |
Malmasi et al. | Language transfer hypotheses with linear SVM weights | |
CN110119443B (zh) | 一种面向推荐服务的情感分析方法 | |
CN104750677A (zh) | 语音传译装置、语音传译方法及语音传译程序 | |
Neubig et al. | A summary of the first workshop on language technology for language documentation and revitalization | |
Zakharov | Corpora of the Russian language | |
Dowlagar et al. | A survey of recent neural network models on code-mixed indian hate speech data | |
JP5337705B2 (ja) | 中国語バナーの生成 | |
Arora et al. | Computational historical linguistics and language diversity in South Asia | |
Corrigan et al. | Feature-based versus aggregate analyses of the DECTE corpus: Phonological and morphological variability in Tyneside English | |
CN114722206A (zh) | 一种基于关键词筛选和注意力机制的极短文本分类方法 | |
Lamb et al. | Developing embedding models for Scottish Gaelic | |
JP2005202924A (ja) | 対訳判断装置、方法及びプログラム | |
CN113486155B (zh) | 一种融合固定短语信息的中文命名方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120810 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121112 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121119 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121210 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121217 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130110 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130805 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |