CN102411609A - 字典服务 - Google Patents

字典服务 Download PDF

Info

Publication number
CN102411609A
CN102411609A CN2011102911797A CN201110291179A CN102411609A CN 102411609 A CN102411609 A CN 102411609A CN 2011102911797 A CN2011102911797 A CN 2011102911797A CN 201110291179 A CN201110291179 A CN 201110291179A CN 102411609 A CN102411609 A CN 102411609A
Authority
CN
China
Prior art keywords
dictionary
phrase
dictionaries
word
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102911797A
Other languages
English (en)
Other versions
CN102411609B (zh
Inventor
A·V·门格尔
S·墨菲
J·T·皮尔斯
A·A·弗雷丁
A·J·纳托尔
M·M·瓦因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102411609A publication Critical patent/CN102411609A/zh
Application granted granted Critical
Publication of CN102411609B publication Critical patent/CN102411609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及字典服务。在线服务的用户使用诸如视频游戏控制台的游戏垫的文本受限设备来发送请求以书写对媒体内容项的评论。响应于该请求,使用与该请求相关联的元数据,诸如电影的名称或与电影相关联的类型,来请求一个或多个字典。接收并使用该字典以使用词语和短语来填充用户界面元素。每个用户界面元素对应于一句子成分,诸如动词、名词等。用户可使用游戏垫遍历每个用户界面元素中的词语和短语以生成句子。

Description

字典服务
相关申请的交叉引用
本申请要求2010年9月20日提交的美国临时专利申请第61/384,689号的权益。该临时专利申请通过援引全部内容而纳入于此。
技术领域
本发明涉及字典,尤其是字典服务。
背景技术
用户生成的文本内容是很多网站和其他在线服务上日益流行的特色。例如,用户可生成并提交对从在线商家可获得的一个或多个产品的评论,或者可响应于在线报纸上的文章生成并提交评述。用户生成的内容通常具有很高的质量,并已经成为很多网站和其他在线服务的必要部分。
但是,随着越来越多的用户使用除计算机以外的设备访问因特网,由于设备的固有限制,生成相同高质量的文本内容可能是困难的。这些设备可包括智能电话和视频游戏控制台,并且虽然这些设备具有允许用户轻松选择和查看因特网内容的复杂的浏览器,但它们通常不太适于生成原始的文本内容。例如,很多智能电话具有适于键入电子邮件的短文本的键盘,但可能使生成更长的高质量的评论变得困难。视频游戏控制台通常完全缺少键盘,迫使用户使用操纵杆或游戏垫每次选择一个字符。因此,这样的文本受限设备的用户可能生成更低质量的评论,或者减少他们生成的评论的总数,从而导致其自身以及可能依赖于这些用户所生成的内容的其他用户的减少的在线经历。
发明内容
在线服务的用户发送书写对媒体内容项(诸如电影)的评论的请求。用户可能使用诸如视频游戏控制台的游戏垫的文本受限设备在书写评论。响应于该请求,使用与该请求相关联的元数据(诸如电影的名称或与电影相关联的类型)来请求一个或多个字典。接收并使用一个或多个字典以使用来自该字典的词语和短语来填充用户界面元素。每个用户界面元素对应于句子成分,诸如动词、名词、形容词、或介词短语。例如,用户可使用游戏垫来遍历用户界面元素中的词语和短语以生成文本,诸如完整的句子或其他文本短语。字典可以是专用于被评论的媒体内容项的,以便用户可选择描述与该媒体内容项相关联的人物、情节元素、或甚至是演员姓名的词语或短语来构建评论。以此方式,用户可生成对媒体内容项的评论,而无需亲自键入该评论。此外,来自字典的词语和短语可被随机化和/或调整,使得相同的词语和短语在媒体内容项的多篇评论中不会过于频繁地出现。
在实现中,在字典服务器接收来自客户机设备的接收一个或多个字典的请求。请求包括元数据。响应于该请求,根据所包括的元数据检索一个或多个字典。字典包括多个词语和短语,并且词语和短语中的某些或全部具有相关联的频率。一个或多个字典被提供给客户机设备。客户机设备根据相关联的频率从一个或多个字典中选择词语和短语的子集。在某些实现中,词语之一可以是固定的或总是所选子集的部分。
在实现中,用户界面元素由客户机设备显示给用户。用户界面元素中的每一个对应于句子的成分,并且用户界面元素中的每一个根据相关联的频率包括来自一个或多个字典的词语和短语。接收对用户界面元素中的一个或多个中的词语和短语的多个选择。使用所选的词语和短语生成文本。
实现可包括以下特征中的某些或全部。生成文本的请求可包括书写媒体内容的评论的请求、发送消息的请求、和发起聊天会话的请求中的一个。元数据可包括用于评论的分数和与媒体内容相关联的标题。媒体内容可包括视频游戏内容、音频内容和音乐内容。元数据可包括标题,并且一个或多个字典可包括与标题相关联的人物的姓名。元数据可包括电影的名称,并且一个或多个字典可包括与电影相关联的人物的姓名。
提供本发明内容以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本发明内容并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。
附图说明
当结合附图进行阅读时,可以更好地理解以上概述以及以下对说明性实施例的详细说明。出于说明各实施例的目的,在附图中示出各实施例的示例性构造;然而,各实施例不局限于所公开的具体方法和手段。在附图中:
图1是用于创建并提供一个或多个字典的示例环境的图示;
图2是示例用户界面元素的图示;
图3是示例字典服务器的图示;
图4是用于提供一个或多个字典的方法的实现的操作流程;
图5是用于使用一个或多个字典来生成文本的方法的实现的操作流程;以及
图6示出了在其中可实现各示例实施例和各方面的示例性计算环境。
具体实施方式
图1是用于创建并提供一个或多个字典的示例环境100的图示。客户机设备110可通过网络120与字典服务器160通信。客户机设备110可被配置为与字典服务器160通信以访问、接收、或检索一个或多个字典。网络120可以是包括公共交换电话网络(PSTN)、蜂窝式电话网络和分组交换网络(例如,因特网)的各种网络类型。可使用诸如参考图6所示的计算系统600的一个或多个计算设备来实现字典服务器160。此外,可使用一个或多个基于云的计算系统来实现字典服务器160。
客户机设备110可执行一个或多个文本生成应用程序113。文本生成应用程序113可包括允许用户生成文本内容的各种软件应用程序,包括但不限于例如web浏览器、文字处理程序、小型消息收发服务应用程序、聊天应用程序、和视频游戏应用程序。
客户机设备110可以是此处被称为的“文本受限”设备。文本受限设备可包括当与常规的台式或膝上型计算机相比,文本输入可能是困难的、乏味的或以其他方式困难的任何计算设备。文本受限设备可包括视频游戏控制台、以及蜂窝电话和/或智能电话。例如,视频游戏控制台通常全部省略键盘,迫使用户通过使用游戏垫从屏幕上的键盘选择字符来生成文本。智能电话虽然通常具有物理或触摸屏键盘,但对用户生成长文本输入来说通常是不舒服的。但是,客户机设备110不限于文本受限设备,并可使用包括计算系统600的各种计算系统来实现。
为了方便在文本受限设备上的文本输入,客户机设备110还可包括字典客户机112。字典客户机112可通过在客户机设备110上显示一个或多个用户界面元素来方便文本输入。每个用户界面元素可对应于被此处称为的“句子成分”。句子成分可对应于句子的部分,包括但不限于名词、动词、形容词、副词、宾语、主语、谓词短语、介词短语、或其组合。每个用户界面元素可显示与句子成分相对应的来自字典的多个词语和短语。用户可随后通过从用户界面元素中的每一个选择词语或短语,使用句子成分来构建文本的句子。另选地或另外地,用户可构建多个句子、段落、或短语。例如,用户可使用游戏垫或在智能电话触摸屏上使用一个或多个手势,遍历每个用户界面元素中的各种词语和短语。
在实现中,用户界面元素可以是用户用来在词语和短语之间循环的“滚轮”。例如,用户可在特定的按钮上或游戏垫的垫上向上或向下按下,以遍历可供选择的词语和短语,并用于将要作为评论的部分或其他用户提供的内容而提供的文本。类似的,用户可使用由智能电话的触摸用户界面所支持的一个或多个手势来转动滚轮并遍历可用的词语和短语。已生成的文本可被提供给文本生成应用程序113。在某些实现中,字典客户机112可使用应用程序编程接口将一个或多个方法或函数展示给文本生成应用程序113。当用户通过文本生成应用程序113发起文本输入时,文本生成应用程序113可随后调用方法或函数中的一个或多个。
例如,图2是由字典客户机112向用户显示的示例用户界面元素201、203和205的图示。每个用户界面元素对应于句子成分,并且用户可通过从用户界面元素的每一个中选择词语或短语来构建完整的句子、短语或段落。如所示的,用户通过从用户界面元素201中选择短语“I was inspired by”、从用户界面元素203中选择短语“the FX”、并用户界面元素205中选择短语“until the finalscene”,已构建了句子“I was inspired by the FX until the final scene”。
在某些实现中,当向用户显示用户界面元素时,用户界面元素和与每个用户界面元素相关联的句子成分是固定的。例如,用户可从每个用户界面元素中选择词语和短语,但可以不改变用户界面元素的顺序。在其他实现中,用户可移动用户界面元素,并因此改变与每个用户界面元素相关联的句子成分在所构建的句子中可能出现的顺序。此外,在某些实现中,基于由用户选择的词语和短语、由其他用户选择的词语和短语和/或用户界面元素被用户选择的顺序,与每个用户界面元素相关联的词语或短语和/或句子成分可以动态地改变。在实现中,在用户从用户界面元素201中选择词语之后,用户界面元素203(以及可能205)中显示的词语或短语被动态地改变以反映所选的词语。通过动态地改变词语和短语和/或与每个用户界面元素相关联的句子成分,字典客户机112可确保用户创建语法上正确的句子、短语、或段落。
在某些实现中,字典客户机112可将来自一个或多个字典的词语和短语填充到每个用户界面元素中。可从字典服务器160向字典客户机112提供一个或多个字典。字典服务器160可在字典数据存储175中存储多个字典。
字典客户机112可向字典服务器160发送对一个或多个字典的请求。请求可包括与请求相关联的元数据。元数据可包括文本生成应用程序113的标识符。例如,如果文本生成应用程序113是聊天应用程序,则元数据可标识出字典客户机112将使用一个或多个字典以生成用于聊天应用程序的文本。
在某些实现中,文本生成应用程序113可用于生成对餐厅或其他服务提供方的评论或评述。在其他实现中,文本生成应用程序可生成对媒体内容项的评论或评述。媒体内容项可以是例如电影、视频、歌曲或专辑、或视频游戏。在这些实现中,元数据还可标识被评论的媒体内容项或服务的一个或多个特征。例如,当媒体内容项是电影或视频游戏时,元数据可包括诸如媒体内容项的标题或与媒体内容项相关联的类型的特征。此外,元数据可包括对媒体内容项的建议评论分数或评级。例如,在书写评论之前,用户可使用文本生成应用程序113来指示几颗星将与该评论相关联,或者可指示评论将是正面评论或负面评论(例如,赞成或反对)。对于餐厅的评论,元数据可包括餐厅的名称和/或由该餐厅提供的食物的类型。此外,在某些实现中,元数据可指示用户位于哪里,诸如国家或地区,或可指示用户所使用的语言。
在某些实现中,在字典存储175中存储的字典也可具有相关联的元数据。元数据可描述每个字典的预期使用和/或每个字典所适合的文本生成应用程序113。例如,字典的元数据可包括适于聊天应用程序的词语和短语。元数据可指示字典包括适于评论电影、视频游戏、餐厅或音乐的词语和短语。元数据可指示字典包括适于评论诸如科幻的特定类型的电影、或者诸如意大利的食物类型的词语和短语。元数据可指示字典包括可由在特定的国家、地区或语言的人使用的词语和短语。在实现中,例如,元数据可指示字典适于通过名称评论特定的电影,诸如“阿凡达”。
字典服务器160可响应于请求,通过将包括在所接收的请求中的元数据和与字典相关联的元数据进行匹配,从字典数据存储175中确定进行检索的一个或多个字典。在某些实现中,字典服务器160可从字典数据存储175中确定具有最多的关于与请求相关联的元数据的匹配元数据的一个或多个字典。在其他实现中,选择用于给定请求的元数据的字典的机制和元数据本身可由用户、或管理员、或编者180来配置。例如,如果请求具有指示该请求是用于科幻类型中的电影“阿凡达”的电影评论的元数据,并且存在与指示其用于电影评论的元数据相关联的字典、与指示其用于科幻类型的电影评论的元数据相关联的字典、以及与指示其用于科幻类型的电影“阿凡达”的电影评论的元数据相关联的字典,则字典服务器160可检索后面字典中的一个或多个,因为它们是请求可用的最具体的字典。但是,如果没有字典与名称“阿凡达”相关联,则字典服务器160可检索与指示其用于科幻类型的电影评论的元数据相关联的字典中的一个或多个。
在某些实现中,字典数据存储175中的字典可由一个或多个编者180来创建。编者180可以是与一个或多个媒体内容项相关联的编者(例如,媒体内容项的创建者、制作者或所有者)。例如,电影“阿凡达”的所有者可提供用于该电影的字典,该字典包括涉及电影的情节元素的名词、人物姓名、以及与电影相关联的个人(例如,演员、导演、制作者等)。编者180也可与字典服务器160相关联。例如,一个或多个编者可受雇于与字典服务器160相关联的组织以创建或维护专用于一个或多个媒体内容项类别或类型的字典。
在某些实现中,编者180可包括一个或多个感兴趣的参与方或志愿者。例如,特定餐厅的爱好者可生成适于评论该餐厅的字典。字典可包括与菜单上的菜品相对应的词语。为了避免显式的、冒犯性的或不准确的字典,由用户提交的字典可由额外的编者180来鉴别或评论以确保字典达到足够的质量以包括在字典数据存储175中。
字典服务器160可使用一个或多个外部源来补充一个或多个已检索到的字典。在某些实现中,外部源可以是搜索引擎140。字典服务器160可使用与请求相关联的元数据中的某些或全部来查询搜索引擎140。搜索引擎140可对该查询与搜索语料库145中存储的数据进行匹配,并可返回一组匹配结果。字典服务器160可处理该组匹配结果以标识一个或多个相关的词语或短语,并可将所标识的词语和短语添加到一个或多个已检索到的字典中。可使用各种外部数据源中的任一种。
例如,对一个或多个字典的请求可包括元数据,该元数据指示请求是要评论“摇滚”类型中“披头士(The Beatles)”的专辑“Revolver(转轮手枪)”。字典服务器160可检索用于评论“摇滚”类型的音乐的一个或多个字典。字典服务器160还可使用诸如“The Beatles”和“Revolver”的一个或多个搜索词来查询搜索引擎140。字典服务器160可从搜索引擎140接收一组结果,并处理该结果以确定“The Beatles”包括成员约翰·列侬(John Lennon)、保罗·麦卡尼(Paul McCartney)、林格·斯塔尔(Ringo Starr)和乔治·哈里森(GeorgeHarrison)。成员的姓名可随后被添加到一个或多个字典中,然后再提供给字典客户机112。
图3是示例字典服务器160的图示。字典服务器160可包括若干组件,包括但不限于字典服务310、使用服务315、字典编者引擎320和外部数据引擎330。此外,字典服务器160可从字典数据存储175中的一个或多个和/或使用数据存储345访问已存储的数据。虽然字典服务310、使用服务315和字典编者引擎320每个被示为字典服务器160的部分,但这仅是出于说明性目的,可使用诸如参考图6所示的计算系统600的一个或多个计算设备单独地或共同实现每一个。
字典服务310可从一个或多个字典客户机112接收对一个或多个字典的请求。请求可包括元数据。字典服务310可从字典数据存储175中确定,具有与请求中包括的元数据的某些或全部相匹配的元数据的一个或多个字典。若不存在具有与请求中包括的全部元数据相匹配的元数据的字典,则字典服务310可确定具有最多数量的相匹配的元数据的一个或多个字典。每个字典可包括一个或多个词语和短语。
在某些实现中,字典服务310可在已确定的一个或多个字典中选择词语和短语的子集,并可将所选子集提供给字典客户机112用于显示在用户界面元素中。另选地或另外地,一个或多个字典的全部内容可提供给字典客户机112,并且字典客户机112可选择要显示的一个或多个词语和短语。
使用服务315可为字典数据存储175中的一个或多个字典管理使用数据。使用数据可被存储在使用数据存储345中。使用数据存储345可包括用于字典中词语和短语中的一个或多个的频率,并且可在将字典提供给字典客户机112时控制来自字典的词语或短语出现在用户界面元素中的频率。使用数据还可指定总是在用户界面元素中显示词语或短语,或者可以指定在用户界面元素中显示词语或短语的顺序。
例如,字典中词语的频率为1可指示每次字典被提供给字典客户机112时该词都会出现在用户界面元素中。词语的频率为.1可指示该词出现在用户界面元素中的次数只有字典被提供给字典客户机112的次数的10%。在字典客户机112接收全部字典的实现中,字典客户机112可基于与词语和短语相关联的频率从字典中选择词语和短语。在字典客户机112仅从字典服务器160接收词语和短语的子集的实现中,字典服务310可根据相关联的频率来选择该子集。
如上所述,使用数据还可指定在用户界面元素中显示词语或短语的顺序。例如,最初可在每个用户界面元素中显示可视的一个或多个词语和短语和/或为用户预先选择的词语或短语。随着用户遍历可用的词语和短语,其他的词语或短语可以变为可视的。可以理解,最初可视的和/或预先选择的词语和短语更有可能被用户选择。这样,编者180或用户可在使用数据中指示在用户界面元素中哪些词语或短语可以被预先选择或是最初可视的。另选地或另外地,可根据词语或短语的相关联的频率对其的放置进行加权。这样,具有最高频率的词语或短语可在用户界面元素中被预先选择。
使用服务315可基于用户选择来维护和调整使用数据存储345中的频率。当用户通过选择字典的一个或多个词语和短语来生成文本时,字典客户机112可将对一个或多个词语和短语的选择的指示发送给使用服务315。使用服务315可随后基于所指示的使用调整一个或多个词语和短语中的每一个的频率。例如,使用服务315可降低或增加频率中的每一个。通过基于使用降低词语和短语的频率,由用户生成的句子可以避免变得过于相似或冗余,因为每个用户可接收字典的不同子集。此外,为了进一步避免相似的文本,每个用户界面元素中默认或最初选择的词语或短语可以是随机化的。在某些实现中,与词语或短语中的某些相关联的频率可以是固定的,以便无须考虑用户选择,频率不会被降低。此外,在某些实现中,一个或多个字典可具有最低或阈值频率。可将位于最低频率以下的词语或短语从一个或多个字典中移除。
字典编者引擎320可提供允许一个或多个编者180在字典数据存储175中创建或编辑字典的工具,诸如应用程序编程接口。编者180可使用工具来创建字典,并向已创建的或现有的字典中添加一个或多个短语。编者180还可指定与已创建的字典相关联的元数据,并且可以为一个或多个词语或短语中的每一个设置一个或多个频率。在某些实现中,字典编者引擎320可允许编者180选择现有的字典,并添加一个或多个词语和短语来创建新的字典。字典编者引擎320还可允许用户编辑或调整现有字典的词语和短语的频率,并响应于用户选择来指定使用服务315如何调整字典中词语和短语的频率。
外部数据引擎330可使用从一个或多个外部数据源检索的数据来补充字典的一个或多个中的词语和短语。外部数据源可包括搜索引擎140、诸如WIKIPEDIA或IMDB的一个或多个公共数据库、和/或诸如LEXIS NEXIS的一个或多个私有数据库。可以使用其他外部数据库,诸如与天空电视(SkyTV)、康卡斯特(Comcast)、时代华纳(Time Warner)等相关联的内容提供方相关联的外部数据库。
在某些实现中,外部数据引擎330可使用与字典或对字典的请求相关联的元数据来查询一个或多个外部数据库。例如,如果与字典或请求相关联的元数据指定电影“Big(大人物)”,则外部数据引擎330可在一个或多个外部数据源中查询电影“Big”。
外部数据引擎330可从外部数据源接收一组结果。若该组结果包括诸如URL的到其他源的链接,则外部数据引擎330可检索由链接引用的文档。例如,搜索引擎140可向外部数据引擎330返回一组URL,并且外部数据引擎330可检索由URL中的一个或多个所引用的网页。
外部数据引擎330可处理结果集合以确定可被添加至字典的一个或多个附加的词语和短语。例如,如果特定的词语或短语出现在结果集合中超过次数的阈值量,则外部数据引擎330可确定将该词语或短语添加至字典。可以使用诸如模式匹配或分类器的其他方法来确定被添加至字典的词语或短语。
继续以上示例,外部数据引擎330可确定词语和短语“汤姆·汉克斯(TomHanks)”、“彭妮·马歇尔(Penny Marshall)”和“佐尔坦(Zoltar)”出现在查询“Big”的结果集合的大部分文档中。外部数据引擎330可随后将已确定的词语和短语添加至被提供给字典客户机112的字典或字典子集中。另选地或另外地,外部数据引擎330可将词语和短语添加至字典数据存储175中存储的一个或多个字典。
图4是用于提供一个或多个字典的方法400的实现的操作流程。方法400可由例如字典服务器160来实现。
在401接收搜索一个或多个字典的请求。请求可由字典服务器160的字典服务310从字典客户机112接收。请求可包括元数据。元数据可指定与一个或多个字典一同使用的文本生成应用程序113。在使用一个或多个字典以查看媒体内容项的实现中,元数据可包括例如评论的建议分数、标题或与媒体内容项相关联的类型、与评论相关联的用户的位置、以及评论的语言。
在403根据与请求相关联的元数据检索一个或多个字典。可由字典服务310从字典数据存储175中检索一个或多个字典。在某些实现中,字典数据存储175中的字典可具有相关联的元数据,并且字典服务310可检索具有与某些或全部与请求相关联的元数据相匹配的元数据的一个或多个字典。
在405根据与请求相关联的元数据检索外部数据。可由外部数据引擎330从诸如搜索引擎140的一个或多个外部数据源中检索外部数据。例如,外部数据引擎330可使用与请求相关联的元数据中的某些或全部作为向搜索引擎140的查询。从搜索引擎140接收的结果集合可随后由外部数据引擎330处理以提取涉及请求的一个或多个词语和短语。
在407将外部数据添加至已检索到的字典中的一个或多个。外部数据可由外部数据引擎330添加至已检索的一个或多个字典。
在409提供一个或多个字典。字典可由字典服务310提供给字典客户机112。字典客户机112随后可在一个或多个用户界面元素中显示来自字典的词语和短语。客户机设备110的用户随后可通过从用户界面元素中的每一个选择词语或短语来构建句子(或其他文本、或短语)。
在411接收对与所提供的字典相关联的一个或多个词语和短语的选择的指示。对选择的指示可由字典服务器160的使用服务315接收。对选择的指示可以是对由字典客户机112的用户对在一个或多个用户界面元素中显示的词语和短语中的一个或多个所作出的选择的指示。
在413更新与所选的一个或多个词语和短语中的每一个相关联的频率。频率可由使用服务315或由一个或多个后台处理进程和/或后台处理器来更新。字典中的每个词语或短语可在使用数据存储345中具有相关联的频率,该频率指示字典客户机112在用户界面元素中显示词语或短语的可能性和/或顺序。例如可通过降低频率以预定的量或根据调度或公式来调整频率。
图5是用于使用一个或多个字典来生成文本的方法500的实现的操作流程。可使用字典服务器160和字典客户机112来实现方法500。
在501接收生成用户文本的请求。请求可由字典客户机112从文本生成应用程序113接收。文本生成应用程序可以是例如web浏览器、视频游戏控制台应用程序、智能电话应用程序、或其他应用程序。由于文本生成应用程序113可由文本受限计算设备执行,字典客户机112可用于协助用户生成句子、短语、段落、或其他文本。例如,视频游戏控制台的用户可能试图书写对喜欢的电影的评论。用户可能已经选择了评论的评级(例如,赞成),并且响应于评级选择,文本生成应用程序113可调用字典客户机112。
在503发送接收一个或多个字典的请求。请求可由字典客户机112发送到字典服务器160。请求可包括元数据。元数据可包括正在生成文本的文本生成应用程序113的类型。也可包括其他数据。继续以上描述的示例,元数据可包括正被评论的电影的建议评级和名称或类型。
在505接收一个或多个字典。字典可由字典客户机112从字典服务器160接收。一个或多个字典可具有与某些或全部与请求相关联的元数据相匹配的元数据。例如,字典可以是被创建用于对指定类型电影中的电影的正面评论的字典。
在507显示多个用户界面元素。用户界面元素可由字典客户机112显示。用户界面元素中的每一个可对应于句子成分,并可显示来自与句子成分相对应的一个或多个字典中的一个或多个词语和短语。例如,还参考图2示出示例用户界面元素。在某些实现中,响应于例如用户作出的指示,即当前所显示的字典不能令人满意并且用户希望呈现一组不同的词语和短语,字典客户机112可向字典服务器160发送新请求以接收字典。在此情形中,响应于在字典客户机112接收的用户的指示,处理例如可在503或401继续。
在509接收与多个用户界面元素的一个或多个词语和短语相对应的选择。选择可由字典客户机112接收。所选择的词语和短语可以形成例如完整的句子、短语、或段落。在实现中,用户可遍历每个用户界面元素中显示的词语或短语,并从词语或短语中构建完整的句子。
在511使用所选的一个或多个词语和短语来生成文本。可由字典客户机112从所选的词语和短语中来生成文本。可由字典客户机112将所生成的文本提供给文本生成客户机113。
图6示出了在其中可实现各示例实施例和各方面的示例性计算环境。计算系统环境只是合适的计算环境的一个示例,并非旨在对使用范围或功能提出任何限制。
可以使用多种其它通用或专用计算系统环境或配置。适合使用的公知的计算系统、环境和/或配置的示例包括但不限于个人计算机、服务器计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、网络PC、微型计算机、大型计算机、嵌入式系统、包括任何以上系统或设备的分布式计算环境等。
可以使用诸如程序模块等可由计算机执行的计算机可执行指令。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。也可使用其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境。在分布式计算环境中,程序模块和其他数据可以位于包括存储器存储设备的本地和远程计算机存储介质中。
参考图6,用于实现此处所描述的各方面的示例性系统包括计算设备,诸如计算设备600。在其最基本的配置中,计算系统600通常包括至少一个处理单元602和存储器604。取决于计算设备的确切配置和类型,存储器604可以是易失性的(如随机存取存储器(RAM))、非易失性的(诸如只读存储器(ROM)、闪存等)或两者的某种组合。该最基本配置在图6中由虚线606示出。
计算设备600也可具有附加特征/功能。例如,计算机系统600可包括附加存储(可移动和/或不可移动),包括但不限于磁盘、光盘或磁带。这样的附加存储在图6中由可移动存储608和不可移动存储610示出。
计算系统600通常包括各种计算机可读介质。计算机可读介质可以是可由计算系统600访问的任何可用介质,并且包括易失性和非易失性介质、可移动和不可移动介质。
计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据之类的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。存储器604、可移动存储608和不可移动存储610都是计算机存储介质的示例。计算机存储介质包括但不限于,RAM、ROM、电可擦除可编程只读存储器(EEPROM)、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或可用于存储所需信息且可以由计算系统600访问的任何其它介质。任何这样的计算机存储介质都可以是计算系统600的一部分。
计算系统600可包含允许该设备与其它设备通信的通信连接612。计算系统600还可具有输入设备614,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备等。也可包括输出设备616,如显示器、扬声器、打印机等。所有这些装置在本领域中都是众所周知的,因此不必在此详细讨论。
应该理解,此处所描述的各种技术可以结合硬件或软件或,在适当的情况下,结合两者的组合来实现。因此,当前公开的主题的方法和装置或其特定方面或部分可采取包含在诸如软盘、CD-ROM、硬盘驱动器或任何其它机器可读存储介质等有形介质中的程序代码(即,指令)的形式,其中当程序代码被加载到诸如计算机等机器内并由其执行时,该机器成为用于实现当前所公开的主题的装置。
尽管示例性实现可涉及在一个或多个独立计算机系统的上下文中利用当前所公开的主题的各方面,但本主题不受此限制,而是可以结合任何计算环境,诸如网络或分布式计算环境来实现。此外,当前所公开的主题的各方面可在多个处理芯片或设备中或跨多个处理芯片或设备实现,且存储可类似地跨多个设备来实现。这些设备可能包括例如个人计算机、网络服务器、以及手持式设备。
尽管用结构特征和/或方法动作专用的语言描述了本主题,但是可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。更确切而言,上述具体特征和动作是作为实现权利要求的示例形式公开的。

Claims (10)

1.一种方法,包括:
在字典服务器(160)接收来自客户机设备(110)的接收一个或多个字典的请求,其中所述请求包括元数据(401);
响应于所述请求,由所述字典服务器(160)根据所包括的元数据从多个字典(175)中检索一个或多个字典,其中每个字典包括多个词语和短语,并且所述多个词语和短语中的至少某些具有相关联的频率(403);以及
向客户机设备(110)提供所述一个或多个字典,用于根据所述相关联的频率,选择来自所述一个或多个字典的词语和短语(201、203、205)的子集(409)。
2.如权利要求1所述的方法,其特征在于,所述请求与评论媒体内容的请求相关联,并且所述元数据包括媒体内容的名称、评论分数、或媒体内容的类型中的一个或多个。
3.如权利要求2所述的方法,其特征在于,响应于所述请求检索所述一个或多个字典包括确定所述一个或多个字典是否与所述媒体内容的名称相关联,并且若是,则检索与所述媒体内容的名称相关联的所述一个或多个字典。
4.如权利要求3所述的方法,其特征在于,还包括如果没有字典与所述媒体内容的名称相关联,则确定是否有任何字典与所述媒体内容的类型相关联,并且若是,则检索与所述媒体内容的类型相关联的所述一个或多个字典。
5.如权利要求1所述的方法,其特征在于,还包括:
接收对所提供的字典的词语或短语的选择的指示;以及
响应于接收所述选择,更新与所述所提供的字典中所选的词语或短语相关联的频率。
6.如权利要求5所述的方法,其特征在于,更新所述频率包括降低所述频率。
7.如权利要求1所述的方法,其特征在于,所述元数据包括名称,并且还包括:
查询搜索引擎以确定与名称相关联的一个或多个词语和短语;以及
将与所述名称相关联的已确定的词语和短语添加至已检索到的一个或多个字典。
8.如权利要求7所述的方法,其特征在于,已确定的一个或多个短语包括与所述名称相关联的人物的姓名。
9.如权利要求7所述的方法,其特征在于,已确定的一个或多个短语包括与所述名称相关联的演员的姓名。
10.如权利要求1所述的方法,其特征在于,响应于所述请求,使用能够由用户或管理员配置的机制来检索所述一个或多个字典。
CN201110291179.7A 2010-09-20 2011-09-19 字典服务 Active CN102411609B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US38468910P 2010-09-20 2010-09-20
US61/384,689 2010-09-20
US12/943,943 US9213704B2 (en) 2010-09-20 2010-11-11 Dictionary service
US12/943,943 2010-11-11

Publications (2)

Publication Number Publication Date
CN102411609A true CN102411609A (zh) 2012-04-11
CN102411609B CN102411609B (zh) 2014-03-26

Family

ID=45818642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110291179.7A Active CN102411609B (zh) 2010-09-20 2011-09-19 字典服务

Country Status (2)

Country Link
US (1) US9213704B2 (zh)
CN (1) CN102411609B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488305A (zh) * 2013-08-13 2014-01-01 南阳师范学院 一种简繁对照中文输入法系统
CN106407235A (zh) * 2015-08-03 2017-02-15 北京众荟信息技术有限公司 一种基于点评数据的语义词典构建方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569770B1 (en) 2009-01-13 2017-02-14 Amazon Technologies, Inc. Generating constructed phrases
US8768852B2 (en) * 2009-01-13 2014-07-01 Amazon Technologies, Inc. Determining phrases related to other phrases
US9298700B1 (en) * 2009-07-28 2016-03-29 Amazon Technologies, Inc. Determining similar phrases
US10007712B1 (en) 2009-08-20 2018-06-26 Amazon Technologies, Inc. Enforcing user-specified rules
US8799658B1 (en) 2010-03-02 2014-08-05 Amazon Technologies, Inc. Sharing media items with pass phrases
US9713774B2 (en) 2010-08-30 2017-07-25 Disney Enterprises, Inc. Contextual chat message generation in online environments
US9213704B2 (en) * 2010-09-20 2015-12-15 Microsoft Technology Licensing, Llc Dictionary service
US9552353B2 (en) 2011-01-21 2017-01-24 Disney Enterprises, Inc. System and method for generating phrases
US9176947B2 (en) * 2011-08-19 2015-11-03 Disney Enterprises, Inc. Dynamically generated phrase-based assisted input
US9245253B2 (en) 2011-08-19 2016-01-26 Disney Enterprises, Inc. Soft-sending chat messages
US9785628B2 (en) * 2011-09-29 2017-10-10 Microsoft Technology Licensing, Llc System, method and computer-readable storage device for providing cloud-based shared vocabulary/typing history for efficient social communication
US9165329B2 (en) 2012-10-19 2015-10-20 Disney Enterprises, Inc. Multi layer chat detection and classification
US10742577B2 (en) 2013-03-15 2020-08-11 Disney Enterprises, Inc. Real-time search and validation of phrases using linguistic phrase components
US10303762B2 (en) 2013-03-15 2019-05-28 Disney Enterprises, Inc. Comprehensive safety schema for ensuring appropriateness of language in online chat
US20150088493A1 (en) * 2013-09-20 2015-03-26 Amazon Technologies, Inc. Providing descriptive information associated with objects
CN109165967A (zh) * 2018-07-19 2019-01-08 五八有限公司 评价方法、评价装置、终端、服务器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1581103A (zh) * 2003-08-11 2005-02-16 摩托罗拉公司 用于文本输入预测的存储器和用户词典
CN101350029A (zh) * 2007-07-18 2009-01-21 富士胶片株式会社 用于产生关联词字典的装置、方法和程序以及内容搜索装置
CN101501610A (zh) * 2005-06-30 2009-08-05 谷歌公司 非标准的基于位置的文本输入
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742834A (en) * 1992-06-24 1998-04-21 Canon Kabushiki Kaisha Document processing apparatus using a synonym dictionary
US7493322B2 (en) * 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
US7657423B1 (en) * 2003-10-31 2010-02-02 Google Inc. Automatic completion of fragments of text
US20050283724A1 (en) * 2004-06-18 2005-12-22 Research In Motion Limited Predictive text dictionary population
JP4653805B2 (ja) * 2005-04-12 2011-03-16 富士通株式会社 意味検索プログラム
US20100070921A1 (en) * 2007-03-29 2010-03-18 Nokia Corporation Dictionary categories
US8176062B2 (en) * 2008-04-28 2012-05-08 American Express Travel Related Services Company, Inc. Service provider framework
US8370396B2 (en) * 2008-06-11 2013-02-05 Comcast Cable Holdings, Llc. System and process for connecting media content
US20100319002A1 (en) * 2009-06-11 2010-12-16 Compiere, Inc. Systems and methods for metadata driven dynamic web services
US9213704B2 (en) * 2010-09-20 2015-12-15 Microsoft Technology Licensing, Llc Dictionary service

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1581103A (zh) * 2003-08-11 2005-02-16 摩托罗拉公司 用于文本输入预测的存储器和用户词典
CN101501610A (zh) * 2005-06-30 2009-08-05 谷歌公司 非标准的基于位置的文本输入
CN101350029A (zh) * 2007-07-18 2009-01-21 富士胶片株式会社 用于产生关联词字典的装置、方法和程序以及内容搜索装置
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488305A (zh) * 2013-08-13 2014-01-01 南阳师范学院 一种简繁对照中文输入法系统
CN106407235A (zh) * 2015-08-03 2017-02-15 北京众荟信息技术有限公司 一种基于点评数据的语义词典构建方法

Also Published As

Publication number Publication date
CN102411609B (zh) 2014-03-26
US9213704B2 (en) 2015-12-15
US20120072404A1 (en) 2012-03-22

Similar Documents

Publication Publication Date Title
CN102411609B (zh) 字典服务
CN107391523B (zh) 多用户消息交互话题中提供用于与自动化助理交互的建议
US9633653B1 (en) Context-based utterance recognition
Chyi et al. News on new devices: Is multi-platform news consumption a reality?
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
EP2740053B1 (en) Providing knowledge panels with search results
US11693863B1 (en) Query completions
US9965569B2 (en) Truncated autosuggest on a touchscreen computing device
US9477711B2 (en) Knowledge panel
US20130198268A1 (en) Generation of a music playlist based on text content accessed by a user
US9679027B1 (en) Generating related questions for search queries
TW201220098A (en) Presenting actions and providers associated with entities
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
CN110073349A (zh) 考虑频率和格式化信息的词序建议
US10902197B1 (en) Vocabulary determination and vocabulary-based content recommendations
KR20120053666A (ko) 휴대 단말기의 컨텐츠 제공 방법 및 장치
US20220067077A1 (en) Generating structured data for rich experiences from unstructured data streams
CN106462564A (zh) 在文档内提供实际建议
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
WO2017083205A1 (en) Provide interactive content generation for document
CN103119581A (zh) 基于上下文的项目加书签
EP2915067A1 (en) Text analysis
US9576077B2 (en) Generating and displaying media content search results on a computing device
CN107251020A (zh) 自适应媒体
Nichols et al. Machine-generated multimedia content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150429

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150429

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.