TW201942873A - 圖片處理方法和裝置 - Google Patents

圖片處理方法和裝置 Download PDF

Info

Publication number
TW201942873A
TW201942873A TW108101009A TW108101009A TW201942873A TW 201942873 A TW201942873 A TW 201942873A TW 108101009 A TW108101009 A TW 108101009A TW 108101009 A TW108101009 A TW 108101009A TW 201942873 A TW201942873 A TW 201942873A
Authority
TW
Taiwan
Prior art keywords
string
picture
item
user
added
Prior art date
Application number
TW108101009A
Other languages
English (en)
Other versions
TWI698835B (zh
Inventor
劉雙喜
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201942873A publication Critical patent/TW201942873A/zh
Application granted granted Critical
Publication of TWI698835B publication Critical patent/TWI698835B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本說明書實施例揭示了一種圖片處理方法和裝置,所述方法包括:在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;從所述語音識別出第一字串,作為添加項;以及在所述圖片上添加所述添加項。

Description

圖片處理方法和裝置
本說明書實施例有關圖像處理領域,更具體地,有關一種圖片處理方法和裝置。
隨著網際網路技術的發展,人們越來越多的在社交平台中發布圖片或者向好友發送圖片。例如,在朋友圈發布物品的圖片以推廣該物品。在該情況中,需要在圖片中標注物品的一些特徵,如尺寸、材料、細節、外觀等等。再例如,在朋友圈發布自己的照片。在該情況中,人們可能希望在圖片中標注出自己的心情、感受等。目前的方案是,透過一些圖片編輯軟體手工標注尺寸、材質、心情、感受等資訊。因此,需要一種更有效的圖片處理方法,以方便、快速地在圖片中進行標注打標籤。
本說明書實施例旨在提供一種更有效的,以解決現有技術中的不足。
為實現上述目的,本說明書一個態樣提供一種圖片處理方法,包括:在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;從所述語音識別出第一字串,作為添加項;以及在所述圖片上添加所述添加項。
本說明書另一態樣提供一種圖片處理方法,包括:在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;從所述語音識別出第一字串;根據預設的關鍵字串庫,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項;以及在所述圖片上分別添加所述至少一個添加項。
在一個實施例中,在上述圖片處理方法中,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項包括,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的字串,作為添加項。
在一個實施例中,在上述圖片處理方法中,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項包括,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的第三字串,其中,所述第三字串為表示量的單位的字串,並且在所述第一字串中,在所述第三字串之前為數字字串,以及,獲取順序包括所述數字字串和所述第三字串的字串作為添加項。
在一個實施例中,在上述圖片處理方法中,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項包括,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的第四字串作為添加項,其中,所述第四字串預設為對應於特定圖形,以及,獲取所述特定圖形作為添加項。
在一個實施例中,在上述圖片處理方法中,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項包括,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的第五字串,其中,所述第五字串預設為對應於特定圖形,以及,獲取所述特定圖形作為添加項。
在一個實施例中,上述圖片處理方法還包括,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與所述場景對應的至少一個圖形作為至少一個添加項,以及在所述圖片上分別添加根據所述場景獲取的至少一個添加項。
在一個實施例中,在上述圖片處理方法中,所述圖片應用場景為商品營銷場景,以及,其中,預設為與所述商品營銷場景對應的至少一個圖形包括:標尺、標籤、圖框和箭頭。
在一個實施例中,在上述圖片處理方法中,所述根據預設的關鍵字串庫包括,根據與用戶選擇的圖片應用場景對應的關鍵字串庫。
在一個實施例中,在上述圖片處理方法中,所述場景為商品營銷場景,以及,其中,與所述場景對應的關鍵字串庫包括關於以下屬性的關鍵字串:材質、尺寸、顏色、價格和外觀。
在一個實施例中,上述圖片處理方法還包括,在接收用戶的語音之前或之後,在螢幕上顯示與所述圖片應用場景對應的語音輸入內容提示。
在一個實施例中,上述圖片處理方法還包括,在圖片中添加所述添加項之後,根據用戶手勢或輸入進行以下至少一種修改:改變所述添加項的位置、改變所述添加項的尺寸、編輯所述添加項的內容、以及刪除所述添加項。
在一個實施例中,在上述圖片處理方法中,所述用戶打開圖片包括,用戶在其終端的相簿中打開圖片、用戶在社交APP中打開圖片、或者用戶在用於執行所述方法的APP中打開圖片。
本說明書另一態樣提供一種圖片處理裝置,包括:接收單元,配置為,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;識別單元,配置為,從所述語音識別出第一字串,作為添加項;以及添加單元,配置為,在所述圖片上添加所述添加項。
本說明書另一態樣提供一種圖片處理裝置,包括:接收單元,配置為,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;識別單元,配置為,從所述語音識別出第一字串;獲取單元,配置為,根據預設的關鍵字串庫,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項;以及添加單元,配置為,在所述圖片上分別添加所述至少一個添加項。
本說明書另一態樣提供一種電腦可讀的儲存媒體,其上儲存有指令碼,所述指令碼在電腦中執行時,令電腦上述圖像處理方法。
下面將結合圖式描述本說明書實施例。
圖1示意顯示根據本說明書實施例的系統100。如圖1所示,系統100包括顯示單元11、語音接收單元12、語音識別單元13、獲取單元14、關鍵字串庫15以及圖片編輯單元16。首先,用戶透過顯示單元11打開圖片。在打開圖片之後,用戶可透過語音接收單元12的介面觸發語音接收單元12。例如,透過長按螢幕上顯示的麥克風圖示,從而觸發語音接收單元12開始接收語音。在用戶斷開語音接收單元12的介面(例如,鬆開所述麥克風圖示)之後,語音接收單元12將接收到的語音發送給語音識別單元13。語音識別單元13透過語音識別功能將接收的語音識別為字串,該字串可包括文字、數字、字母、符號等。在一個實施例中,語音識別單元13將識別出的字串發送給圖片編輯單元16,從而圖片編輯單元16在圖片上添加所述字串。在另一個實施例中,語音識別單元將識別出的字串發送給獲取單元14,獲取單元14透過呼叫關鍵字串庫15,而將所述字串與所述詞庫中的關鍵字串進行匹配,從而獲取所述字串中的關鍵字串、或對應的字串組合、或對應的圖形作為添加項,並將該添加項發送給圖片編輯單元16。之後,圖片編輯單元16在圖片上添加所述添加項。
圖2顯示根據本說明書實施例的一種圖片處理方法的流程圖。所述方法包括:在步驟S21,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;在步驟S22,從所述語音識別出字串,作為添加項;以及在步驟S23,在所述圖片上添加所述添加項。
首先,在步驟S21,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音。這裡,不限定用戶打開圖片的設備,例如,用戶可在便攜式智能設備中打開圖片,或者,用戶可在電腦中打開圖片。當用戶在例如手機中打開圖片時,不限定用戶具體的打開位置。例如,用戶可在帶有根據本說明書實施例的圖片處理功能的手機相簿中打開圖片、可在帶有根據本說明書實施例的圖片處理功能的社交APP(例如朋友圈、生活圈等)中打開圖片,或者可在用於執行根據本說明書實施例的圖片處理方法的APP中打開圖片。
用戶在打開圖片之後,可進行用於打開語音接收的介面的操作。例如,在用戶透過電腦打開圖片的情況中,用戶可透過打開麥克風以開始電腦的語音接收。在用戶使用手機打開圖片的情況中,用戶可長按螢幕上的麥克風圖示,以開始手機的語音接收。在一個實施例中,用戶可單點螢幕上的麥克風圖示(該圖示位於圖片外部),然後長按圖片中的特定位置,進行語音輸入。從而可以在圖片中的特定位置插入透過語音識別獲得的標籤。
在步驟S22,從所述語音識別出字串,作為添加項。這裡,可透過已有的語音識別功能進行語音識別。從而從輸入的語音識別出對應的字串。所述對應的字串可包括漢子字元、數字字元、字母字元、或符合字元等。
在步驟S23,在所述圖片上添加所述添加項。即,將上述字串作為文字域添加到圖片中。在一個實施例中,用戶長按螢幕中的麥克風圖示進行語音輸入,在該情況中,系統將所述添加項隨機添加到圖片中的一個位置。在另一個實施例中,用戶在單點麥克風圖示之後,長按圖片中的特定位置進行語音輸入,在該情況中,系統將所述添加項添加到圖片中的特定位置。
在一個實施例中,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與所述場景對應的至少一個圖形作為至少一個添加項,以及在所述圖片上分別添加根據所述場景獲取的至少一個添加項。例如,當在根據本說明書實施例的圖片處理APP中進行所述圖片處理時,APP可提供多個場景的選擇按鈕。所述多個場景例如包括:商品營銷場景、自拍場景、教學場景、婚介場景等。在該APP中,用戶可在打開圖片之前預先選擇好場景,也可以在打開圖片之後選擇場景。在該APP中,對部分場景預設對應的圖形,例如,對於商品營銷場景,預設對應的圖形包括,標尺、標籤、圖片、箭頭等。從而,在用戶打開圖片之後,在用戶選擇了商品營銷場景的情況下,APP自動獲取對應的圖形標尺、標籤等,並在圖片上自動添加標尺和標籤。本發明所屬技術領域中具有通常知識者可以理解,這裡在APP中打開圖片只是為了示例說明,例如,用戶也可以在手機相簿中打開圖片,並在圖片打開之後選擇圖片應用場景。
在一個實施例中,在接收用戶的語音之前或之後,在螢幕上顯示與所述圖片應用場景對應的語音輸入內容提示。
在添加了所述添加項之後,用戶可對該添加項進行各種操作。例如,在用戶使用手機的情況中,用戶可以透過手勢,改變所述添加項的位置、改變所述添加項的尺寸,例如透過按著添加項在螢幕上滑動,以將添加項調整到新的位置,透過兩個手指對所述添加項進行旋轉,而調整添加項的角度,透過在添加項的對角線方向滑動兩個手指,從而調整添加項的大小等。另外,用戶可在所述添加項中輸入新的字元或刪除已有的字元,或者,用戶透過長按所述添加項,以顯示更多的操作按鈕,例如,刪除按鈕,從而進行更多的對該添加項的編輯操作。
圖3顯示根據本說明書實施例的一種圖片處理方法的流程圖。所述方法包括:在步驟S31,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;在步驟S32,從所述語音識別出第一字串;在步驟S33,根據預設的關鍵字串庫,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項;以及在步驟S34,在所述圖片上分別添加所述至少一個添加項。
該方法中的步驟S31和S32與圖2中的步驟S21和S22基本相同,在此不再贅述。
在步驟S33,根據預設的關鍵字串庫,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項。
在一個實施例中,所述第二字串為所述第一字串。
所述關鍵字串庫可透過人工整理、或機器學習獲得。其可以包括對應於各個具體場景的關鍵字串。例如,一個具體的場景為商品營銷場景,在該場景中,用戶為了推廣圖片中的物品,需要對物品的各種屬性打上標籤,例如,所述屬性包括材質、尺寸、顏色、價格、外觀等。因此,在對應於商品營銷場景的關鍵字串庫中,可包括關於上述各個屬性的關鍵字串。例如,在材質這類中,可包括“純銅”、“塑料”、“玻璃”等表示材料的關鍵字串,在尺寸這類中,可包括“cm”、“m”、“公分”等表示尺寸單位的關鍵字串,在顏色這類中,可包括“紅色”、“藕荷色”、“洋紅色”等表示顏色的關鍵字串,在價格這類中,可包括“元”、“美元”等表示貨幣單位的關鍵字串,以及,在外觀這類中,可包括“金屬拉絲”、“拋光”等表示外觀的關鍵字串。
再例如,所述場景為婚介場景,在該場景中,用戶為了介紹圖片中的人物,需要給人物打上各種人物屬性標籤。例如,所述屬性包括年齡、專業、工作單位等。則與婚介場景對應的關鍵字串庫中可包括與上述屬性對應的關鍵字串,如年齡單位(歲)、物理、生物、自動化、公司、事務所等等。
再例如,所述場景為自拍場景。在該場景中,用戶可以給自拍圖打上心情、感受標籤等。從而,與該場景對應的關鍵字串庫中可包括“開心、憤怒、焦慮”等關鍵字串。
在一個實施例中,用戶可選擇圖片應用場景。例如,在用戶打開圖片之後,可在螢幕上顯示場景選項按鈕,用戶可透過所述按鈕選擇希望的圖片應用場景,或者,用戶可在打開圖片之前預先選擇好圖片應用場景。在用戶選擇了場景之後,系統根據與該場景對應的預設關鍵字串庫,獲取所述添加項。例如,圖4顯示商品營銷場景的示例。用戶在打開如圖4所示的圖片之後,可選擇“商品營銷場景”。從而,系統在對用戶的語音輸入語音識別為字串之後,呼叫對應於商品營銷場景的關鍵字串庫與所述字串進行匹配。
在一個實施例中,系統在接收用戶選擇的圖片應用場景之後,在接收用戶的語音之前或之後,在螢幕上顯示與所述場景對應的語音輸入內容提示。圖5示意示出在商品營銷場景下,螢幕上的語音輸入內容提示,包括“長120裡面”(尺寸)、“金屬是拉絲拋光純銅材質”(材質)、“春季新款”、“50元拿貨價”(價格)等。可對應於特定的場景預先設定所述語音輸入內容提示。
在一個實施例中,例如用戶在如上所述選擇商品營銷場景之後,用戶透過長按螢幕上的麥克風輸入語音“高30cm,寬35cm,五金材質是純銅五金磨砂,裝飾物為圓頭釘打孔,價格120元”。系統在將該語音識別為字串之後,將該字串與對應於商品營銷場景的關鍵字串庫中的關鍵字串相匹配。在所述關鍵字串庫的關於材質的分類中包括關鍵字串“純銅五金磨砂”、在關於外觀的分類中包括關鍵字串“圓頭釘打孔”,因此,獲取“純銅五金磨砂”和“圓頭釘打孔”作為將要添加到圖片上的添加項。在一個實施例中,在關鍵字串庫中將關於材質和外觀的關鍵字串預設為對應於標籤圖形。從而在獲取添加項“純銅五金磨砂”和“圓頭釘打孔”之後,系統還自動獲取標籤圖形作為添加項。所述標籤圖形用於在圖片中標注出“純銅五金磨砂”材質對應的具體位置,以及“圓頭釘打孔”外觀對應的具體位置。
在一個實施例中,從上述字串可獲取,與所述關鍵字串庫的關於尺寸的分類中的關鍵字串“cm”匹配的“cm”,並且可判斷出在上述字串中,“cm”之前為數字字串,因此獲取字串中的“30cm”和“35cm”作為添加項分別添加到圖片上。在一個實施例中,在關鍵字串庫中將“cm”設定為對應於標尺圖形,從而在獲取添加項“30cm”和“35cm”之後,系統還自動獲取標尺圖形作為添加項。
在一個實施例中,在所述關鍵字串庫的關於價格的分類中包括關鍵字串“元”,從而可從上述字串中獲取關鍵字串“元”。並且可判斷,在上述字串中,“元”的之前為數字字串,因此獲取上述字串中的“120元”作為添加項添加到圖片上。
在一個實施例中,在所述關鍵字串中的關於尺寸的分類中包括關鍵字串“高”和“寬”,而在關鍵字串庫中將“高”設定為對應於標尺圖形。因此,在獲取字串中的關鍵字串“高”和“寬”之後,系統獲取標尺圖形作為添加項。
所述添加的圖形不限於上述標籤和標尺,還可以是箭頭、各種用於圈注的幾何形狀、圖框等等。例如,可將標籤設定為與關鍵字串庫中的顏色、材質等關鍵字串對應,將標尺設定為與關鍵字串中的表示長度或長度單位的字串對應。而在例如自拍場景中,還可以根據關鍵字串匹配,添加與對話內容對應的圖框,與心情對應的表情圖示等。
再回到圖3,在步驟S34,在所述圖片上分別添加所述至少一個添加項。圖6顯示在圖片上分別添加的文本添加項、標籤添加項、及標尺添加項的示意圖。在添加了所述添加項之後,用戶可根據手勢或輸入進行以下至少一種修改:改變所述添加項的位置、改變所述添加項的尺寸、編輯所述添加項的內容、以及刪除所述添加項。例如,如圖6所示,對於圖中的標尺,用戶可透過手勢移動標尺的兩端,改變標尺的長度,可透過手勢旋轉標尺,改變標尺的角度,透過手勢刪除所述標尺等。
在一個實施例中,如參考圖2中所述,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與所述場景對應的至少一個圖形作為至少一個添加項,以及在所述圖片上分別添加根據所述場景獲取的至少一個添加項。其具體實例如參考圖2所述,在此不再贅述。
另外,在完成上述編輯之後,用戶還可以透過例如螢幕上的添加二維碼的介面對圖片添加二維碼,從而可以保存圖片,並分享圖片。在該分享圖片中,透過圖中的標籤準確明瞭地展現了商品的各個屬性,便於購買者對該商品進行快速地瞭解,從而促進了對商品的營銷。
圖7顯示根據本說明書實施例的一種圖片處理裝置700,包括:接收單元71,配置為,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;識別單元72,配置為,從所述語音識別出第一字串,作為添加項;以及添加單元73,配置為,在所述圖片上添加所述添加項。
圖8顯示根據本說明書實施例的一種圖片處理裝置800,包括:接收單元81,配置為,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音;識別單元82,配置為,從所述語音識別出第一字串;第一獲取單元83,配置為,根據預設的關鍵字串庫,獲取與所述第一字串對應的至少一個第二字串、和/或與所述第一字串對應的至少一個圖形,作為至少一個添加項;以及第一添加單元84,配置為,在所述圖片上分別添加所述至少一個添加項。
在一個實施例中,在上述圖片處理裝置800中,所述第一獲取單元還配置為,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的字串,作為添加項。
在一個實施例中,在上述圖片處理裝置800中,所述第一獲取單元還配置為,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的第三字串,其中,所述第三字串為表示量的單位的字串,並且在所述第一字串中,在所述第三字串之前為數字字串,以及,獲取順序包括所述數字字串和所述第三字串的字串作為添加項。
在一個實施例中,在上述圖片處理裝置800中,所述第一獲取單元還配置為,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的第四字串作為添加項,其中,所述第四字串預設為對應於特定圖形,以及,獲取所述特定圖形作為添加項。
在一個實施例中,在上述圖片處理裝置800中,所述第一獲取單元還配置為,從所述第一字串中獲取與所述關鍵字串庫中的關鍵字串匹配的第五字串,其中,所述第五字串預設為對應於特定圖形,以及,獲取所述特定圖形作為添加項。
在一個實施例中,上述圖片處理裝置800還包括:第二獲取單元85,配置為,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與所述場景對應的至少一個圖形作為至少一個添加項,以及第二添加單元86,配置為,在所述圖片上分別添加根據所述場景獲取的至少一個添加項
在一個實施例中,上述圖片處理裝置800還包括,提示單元87,配置為,在接收用戶選擇的圖片應用場景之後,在螢幕上顯示與所述場景對應的語音輸入內容提示。
在一個實施例中,上述圖片處理裝置800還包括修改單元88,配置為,在圖片中添加所述添加項之後,根據用戶手勢或輸入進行以下至少一種修改:改變所述添加項的位置、改變所述添加項的尺寸、編輯所述添加項的內容、以及刪除所述添加項。
本說明書實施例還提供一種電腦可讀的儲存媒體,其上儲存有指令碼,所述指令碼在電腦中執行時,令電腦執行如上所述的圖片處理方法。
在根據本說明書實施例的圖片處理方法和裝置中,透過以語音輸入的方式對圖片打標籤,降低了圖片處理難度,大大提高了圖片處理效率,滿足了用戶的需求。
本發明所屬技術領域中具有通常知識者應該還可以進一步意識到,結合本文中所揭示的實施例描述的各示例的單元及演算法步驟,能夠以電子硬體、電腦軟體或者二者的結合來實現,為了清楚地說明硬體和軟體的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬體還是軟體方式來執軌道,取決於技術方案的特定應用和設計約束條件。本發明所屬技術領域中具有通常知識者可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不應認為超出本發明的範圍。
結合本文中所揭示的實施例描述的方法或演算法的步驟可以用硬體、處理器執軌道的軟體模組,或者二者的結合來實施。軟體模組可以置於隨機記憶體(RAM)、記憶體、唯讀記憶體(ROM)、電可編程ROM、電可抹除可編程ROM、暫存器、硬碟、可移動磁碟、CD-ROM、或技術領域內所公知的任意其它形式的儲存媒體中。
以上所述的具體實施方式,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式而已,並不用於限定本發明的保護範圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護範圍之內。
11‧‧‧顯示單元
12‧‧‧語音接收單元
13‧‧‧語音識別單元
14‧‧‧獲取單元
15‧‧‧關鍵字串庫
16‧‧‧圖片編輯單元
S21‧‧‧方法步驟
S22‧‧‧方法步驟
S23‧‧‧方法步驟
S31‧‧‧方法步驟
S32‧‧‧方法步驟
S33‧‧‧方法步驟
S34‧‧‧方法步驟
71‧‧‧接收單元
72‧‧‧識別單元
73‧‧‧添加單元
81‧‧‧接收單元
82‧‧‧識別單元
83‧‧‧第一獲取單元
84‧‧‧第一添加單元
85‧‧‧第二獲取單元
86‧‧‧第二添加單元
87‧‧‧提示單元
88‧‧‧修改單元
100‧‧‧系統
700‧‧‧圖片處理裝置
800‧‧‧圖片處理裝置
透過結合圖式描述本說明書實施例,可以使得本說明書實施例更加清楚:
圖1示意顯示根據本說明書實施例的系統;
圖2顯示根據本說明書實施例的一種圖片處理方法的流程圖;
圖3顯示根據本說明書實施例的一種圖片處理方法的流程圖;
圖4顯示商品營銷場景的示例;
圖5示意示出在商品營銷場景下,螢幕上的語音輸入內容提示;
圖6顯示在圖片上分別添加的文本添加項、標籤添加項、及標尺添加項的示意圖;
圖7顯示根據本說明書實施例的一種圖片處理裝置;以及
圖8顯示根據本說明書實施例的一種圖片處理裝置。

Claims (29)

  1. 一種圖片處理方法,包括: 在用戶打開圖片之後,回應於用戶操作,接收用戶的語音; 從該語音識別出第一字串,作為添加項;以及 在該圖片上添加該添加項。
  2. 一種圖片處理方法,包括: 在用戶打開圖片之後,回應於用戶操作,接收用戶的語音; 從該語音識別出第一字串; 根據預設的關鍵字串庫,獲取與該第一字串對應的至少一個第二字串、和/或與該第一字串對應的至少一個圖形,作為至少一個添加項;以及 在該圖片上分別添加該至少一個添加項。
  3. 根據申請專利範圍第2項所述的圖片處理方法,其中,獲取與該第一字串對應的至少一個第二字串、和/或與該第一字串對應的至少一個圖形,作為至少一個添加項包括,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的字串,作為該添加項。
  4. 根據申請專利範圍第2項所述的圖片處理方法,其中,獲取與該第一字串對應的至少一個第二字串、和/或與該第一字串對應的至少一個圖形,作為至少一個添加項包括,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的第三字串,其中,該第三字串為表示量的單位的字串,並且在該第一字串中,在該第三字串之前為數字字串,以及,獲取順序包括該數字字串和該第三字串的字串作為該添加項。
  5. 根據申請專利範圍第2項所述的圖片處理方法,其中,獲取與該第一字串對應的至少一個第二字串、和/或與該第一字串對應的至少一個圖形,作為至少一個添加項包括,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的第四字串作為添加項,其中,該第四字串預設為對應於特定圖形,以及,獲取該特定圖形作為添加項。
  6. 根據申請專利範圍第2項所述的圖片處理方法,其中,獲取與該第一字串對應的至少一個第二字串、和/或與該第一字串對應的至少一個圖形,作為至少一個添加項包括,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的第五字串,其中,該第五字串預設為對應於特定圖形,以及,獲取該特定圖形作為添加項。
  7. 根據申請專利範圍第1項所述的圖片處理方法,還包括,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與該場景對應的至少一個圖形作為至少一個添加項,以及在該圖片上分別添加根據該場景獲取的至少一個添加項。
  8. 根據申請專利範圍第2項所述的圖片處理方法,還包括,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與該場景對應的至少一個圖形作為至少一個添加項,以及在該圖片上分別添加根據該場景獲取的至少一個添加項。
  9. 根據申請專利範圍第7或8項所述的圖片處理方法,其中,該圖片應用場景為商品營銷場景,以及,其中,預設為與該商品營銷場景對應的至少一個圖形包括:標尺、標籤、圖框和箭頭。
  10. 根據申請專利範圍第2項所述的圖片處理方法,其中,該根據預設的關鍵字串庫包括,根據與用戶選擇的圖片應用場景對應的關鍵字串庫。
  11. 根據申請專利範圍第10項所述的圖片處理方法,其中,該場景為商品營銷場景,以及,其中,與該場景對應的關鍵字串庫包括關於以下屬性的關鍵字串:材質、尺寸、顏色、價格和外觀。
  12. 根據申請專利範圍第7、8及10項中任一項所述的圖片處理方法,還包括,在接收用戶的語音之前或之後,在螢幕上顯示與該圖片應用場景對應的語音輸入內容提示。
  13. 根據申請專利範圍第1、2、7及8項中任一項所述的圖片處理方法,還包括,在圖片中添加該添加項之後,根據用戶手勢或輸入進行以下至少一種修改:改變該添加項的位置、改變該添加項的尺寸、編輯該添加項的內容、以及刪除該添加項。
  14. 根據申請專利範圍第1或2項所述的圖片處理方法,其中,該用戶打開圖片包括,用戶在其終端的相簿中打開圖片、用戶在社交APP中打開圖片、或者用戶在用於執行該方法的APP中打開圖片。
  15. 一種圖片處理裝置,包括: 接收單元,配置為,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音; 識別單元,配置為,從該語音識別出第一字串,作為添加項;以及 添加單元,配置為,在該圖片上添加該添加項。
  16. 一種圖片處理裝置,包括: 接收單元,配置為,在用戶打開圖片之後,回應於用戶操作,接收用戶的語音; 識別單元,配置為,從該語音識別出第一字串; 第一獲取獲取單元,配置為,根據預設的關鍵字串庫,獲取與該第一字串對應的至少一個第二字串、和/或與該第一字串對應的至少一個圖形,作為至少一個添加項;以及 第一添加單元,配置為,在該圖片上分別添加該至少一個添加項。
  17. 根據申請專利範圍第16項所述的圖片處理裝置,其中,該第一獲取單元還配置為,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的字串,作為添加項。
  18. 根據申請專利範圍第16項所述的圖片處理裝置,其中,該第一獲取單元還配置為,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的第三字串,其中,該第三字串為表示量的單位的字串,並且在該第一字串中,在該第三字串之前為數字字串,以及,獲取順序包括該數字字串和該第三字串的字串作為添加項。
  19. 根據申請專利範圍第16項所述的圖片處理裝置,其中,該第一獲取單元還配置為,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的第四字串作為添加項,其中,該第四字串預設為對應於特定圖形,以及,獲取該特定圖形作為添加項。
  20. 根據申請專利範圍第16項所述的圖片處理裝置,其中,該第一獲取單元還配置為,從該第一字串中獲取與該關鍵字串庫中的關鍵字串匹配的第五字串,其中,該第五字串預設為對應於特定圖形,以及,獲取該特定圖形作為添加項。
  21. 根據申請專利範圍第15項所述的圖片處理裝置,還包括,第二獲取單元,配置為,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與該場景對應的至少一個圖形作為至少一個添加項,以及第二添加單元,配置為,在該圖片上分別添加根據該場景獲取的至少一個添加項。
  22. 根據申請專利範圍第16項所述的圖片處理裝置,還包括,第二獲取單元,配置為,在用戶打開圖片之後,根據用戶選擇的圖片應用場景,獲取預設為與該場景對應的至少一個圖形作為至少一個添加項,以及第二添加單元,配置為,在該圖片上分別添加根據該場景獲取的至少一個添加項。
  23. 根據申請專利範圍第21或22項所述的圖片處理裝置,其中,該圖片應用場景為商品營銷場景,以及,其中,預設為與該商品營銷場景對應的至少一個圖形包括:標尺、標籤、圖框和箭頭。
  24. 根據申請專利範圍第16項所述的圖片處理裝置,其中,該根據預設的關鍵字串庫包括,根據與用戶選擇的圖片應用場景對應的關鍵字串庫。
  25. 根據申請專利範圍第24項所述的圖片處理裝置,其中,該場景為商品營銷場景,以及,其中,與該場景對應的關鍵字串庫包括關於以下屬性的關鍵字串:材質、尺寸、顏色、價格和外觀。
  26. 根據申請專利範圍第21、22及24項中任一項所述的圖片處理裝置,還包括提示單元,配置為,在接收用戶的語音之前或之後,在螢幕上顯示與該圖片應用場景對應的語音輸入內容提示。
  27. 根據申請專利範圍第15、16、21及22項中任一項所述的圖片處理裝置,還包括,修改單元,配置為,在圖片中添加該添加項之後,根據用戶手勢或輸入進行以下至少一種修改:改變該添加項的位置、改變該添加項的尺寸、編輯該添加項的內容、以及刪除該添加項。
  28. 根據申請專利範圍第15或16項所述的圖片處理裝置,其中,該用戶打開圖片包括,用戶在其終端的相簿中打開圖片、用戶在社交APP中打開圖片、或者用戶在用於執行該方法的APP中打開圖片。
  29. 一種電腦可讀的儲存媒體,其上儲存有指令碼,該指令碼在電腦中執行時,令電腦執行申請專利範圍第1至14項中任一項所述的方法。
TW108101009A 2018-03-28 2019-01-10 圖片處理方法和裝置以及電腦可讀的儲存媒體 TWI698835B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201810266755.4 2018-03-28
CN201810266755.4 2018-03-28
CN201810266755.4A CN108805958A (zh) 2018-03-28 2018-03-28 一种图片处理方法和装置

Publications (2)

Publication Number Publication Date
TW201942873A true TW201942873A (zh) 2019-11-01
TWI698835B TWI698835B (zh) 2020-07-11

Family

ID=64095398

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108101009A TWI698835B (zh) 2018-03-28 2019-01-10 圖片處理方法和裝置以及電腦可讀的儲存媒體

Country Status (3)

Country Link
CN (1) CN108805958A (zh)
TW (1) TWI698835B (zh)
WO (1) WO2019184539A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805958A (zh) * 2018-03-28 2018-11-13 阿里巴巴集团控股有限公司 一种图片处理方法和装置
JP6807621B1 (ja) * 2020-08-05 2021-01-06 株式会社インタラクティブソリューションズ 音声に基づいて画像を変更するためのシステム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7921037B2 (en) * 2002-04-01 2011-04-05 Hewlett-Packard Development Company, L.P. Personalized messaging determined from detected content
GB2409365B (en) * 2003-12-19 2009-07-08 Nokia Corp Image handling
TWI402767B (zh) * 2008-11-28 2013-07-21 Hon Hai Prec Ind Co Ltd 具有圖片編輯功能的電子裝置及方法
CN103365970A (zh) * 2013-06-25 2013-10-23 广东小天才科技有限公司 自动获取学习资料信息的方法和装置
CN104766353B (zh) * 2015-04-25 2018-03-30 陈包容 背景中添加文字内容的方法及装置
TWI534647B (zh) * 2015-07-07 2016-05-21 中華電信股份有限公司 自訂圖片樣版系統
CN105302786B (zh) * 2015-11-10 2019-05-24 百度在线网络技术(北京)有限公司 数据的编辑方法和装置
CN107707836A (zh) * 2017-09-11 2018-02-16 广东欧珀移动通信有限公司 图像处理方法和装置、电子装置和计算机可读存储介质
CN108805958A (zh) * 2018-03-28 2018-11-13 阿里巴巴集团控股有限公司 一种图片处理方法和装置

Also Published As

Publication number Publication date
WO2019184539A1 (zh) 2019-10-03
TWI698835B (zh) 2020-07-11
CN108805958A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
US20210303140A1 (en) Combining first user interface content into second user interface
CN105830011B (zh) 用于交叠手写文本输入的用户界面
JP6577044B2 (ja) ユーザ構成可能グラフィック構造体の共有
CN108156503B (zh) 一种生成礼物的方法及装置
RU2488232C2 (ru) Сеть связи и устройства для преобразования текста в речь и текста в анимацию лица
US20150277686A1 (en) Systems and Methods for the Real-Time Modification of Videos and Images Within a Social Network Format
CN114787813A (zh) 上下文敏感化身字幕
KR20230026481A (ko) 메시징 시스템에서의 아바타 의류 업데이트
CN107077749A (zh) 优化媒体的视觉显示
TW201234213A (en) Multimedia input method
WO2016000536A1 (zh) 一种激活应用程序的方法、用户终端和服务器
CN112084756B (zh) 会议文件生成方法、装置及电子设备
CN107122113A (zh) 生成图片的方法及装置
KR102053196B1 (ko) 전자장치 및 전자 장치의 일정 자동 생성 방법
CN106448702A (zh) 一种录音数据处理装置、移动终端及方法
US10558745B2 (en) Information processing apparatus and non-transitory computer readable medium
TWI698835B (zh) 圖片處理方法和裝置以及電腦可讀的儲存媒體
CN106030578A (zh) 搜索系统、服务器系统以及搜索系统和服务器系统的控制方法
US20230091214A1 (en) Augmented reality items based on scan
CN106791091B (zh) 图像生成方法、装置和移动终端
CN105096477A (zh) 一种实现智能柜台的界面的方法及装置
TWI506569B (zh) 一種可辨識圖片中物件之位置範圍與行爲關係之圖片標記方法
US10268640B1 (en) System for communication of object-directed feelings
CN107563465A (zh) 一种获取礼品信息的系统和方法
US10776656B2 (en) Methods and systems for applying content aware stickers onto a layout