Google的日語機器學習API!!

GCP的機器學習API使用TensorFlow構建自己的機器學習模型“Cloud Machine Learning Engine”,“Cloud Speech API(語音識別)”已經通過谷歌的機器學習模型學習,以及“Cloud Vision API”這些包括API(圖像識別)和Cloud Video Intelligence API(視頻識別)。

與機器學習引擎不同,學習的API不需要由用戶學習,因此任何沒有機器學習知識的人都可以輕鬆使用它。此外,識別準確度非常高,並且將來會繼續改進。
但是,對於Vision API和Video Intelligence API,識別結果(標籤)以英語輸出,這可能是它們在日本使用的障礙。
我認為解決此問題的最佳解決方案之一是Translation API,它專門用於翻譯。這將解決語言障礙問題。
所以,這一次,作為在日本使用的一個例子,我試圖通過結合Video Intelligence API和Translation API來使它成為日語!!
另外,我想介紹一些減少Translation API費用的想法!

什麼是Cloud Video Intelligence API?

這是一個使用Google學習機器學習模型提取視頻中元數據的API。要分析的視頻必須存儲在Google Cloud Storage (GCS)中。功能包括檢測標籤和準確度的“標籤檢測”,例如“狗”,“花”,“汽車”,“鏡頭檢測”,可檢測電影中是否有場景變化,存在檢測適當對象的“安全搜索檢測”。
Video Intelligence API概述頁面

費用結構在前1000分鐘免費,如果您處理的費用超過此費用,將產生以下費用。

功能1001分鐘到100,000分鐘
標籤檢測0.10美元/分鐘
鏡頭檢測0.05美元/分鐘(如果使用標籤檢測則免費)
安全搜索檢測0.10美元/分鐘

費用頁面

對於配額,“視頻大小高達10GB”,“每個請求1個視頻”,“每100秒100個請求”,“後端時間每100秒最多300秒。” 
報價限制

什麼是Cloud Translation API?

這是另一種基於Google機器學習技術的翻譯API。我經常聽到最近,谷歌的翻譯變得更加準確,但它是機器學習。這些功能包括“高響應性”,可以快速,動態地翻譯源文本,以及“當源語言未知時檢測語言的功能”。
翻譯API概述頁面

作為費用,它成為每個字符數的費用。
它每月限制為10億個字符(包括空格)和每百萬字符20美元,因此翻譯500,000個字符將花費10美元,翻譯50,000個字符將花費1美元。
費用頁面

關於配額,翻譯是“2,000,000個字符/ 1day”,“100,000個字符/ 100min”,語言檢測是“1,000個請求/ 100min”。
報價限制

日語本地化配置

下圖是用於獲取視頻的分析結果為日語的配置。 流程為 [1]上傳到GCS的視頻的URL被引入Video Intelligence API [2] Cloud Video Intelligence API解析視頻,獲取標籤(英文),使用Translation API進行翻譯



我實際上是在狗免費視頻上嘗試過的。 這是一隻可愛的小狗的視頻,但我不知道貓的品種……我想知道金毛獵犬……? 通過使用上述配置將其轉換為翻譯成日語的Video Intelligence API,獲得了以下結果。(※1)


元信息(標籤)準確度[%]
獵犬100.0
99.7
動物98.2
黃金獵犬97.3
寵物93.8
拉布拉多犬79.4
小狗74.3

有很多像“獵犬”這樣的東西比“狗”更準確,但應該注意的是,它可以區分狗的品種!“黃金獵犬”是97.3%,“拉布拉多獵犬”是79.4%,並且能夠識別狗的品種是驚人的!!
(實際發布視頻的網站上有黃金獵犬的描述。)

我擔心黑色(·)在“金毛獵犬”和“拉布拉多獵犬”中的存在,所以我在轉換成日語之前看了看標籤。(摘自JSON的一部分)
“Golden Retriever” – >“golden retriever” 
“Labrador retriever” – >“labrador retriever” 
顯然這似乎是Translation API的一個問題。
畢竟,我能夠確認視頻智能API的準確性以及Tanslation API中日語本地化的實用性!!

※1 …關於精度在API中,以0-1的範圍內的小數來獲取。這次它的形狀很容易看到。

Datastore中的Word緩存!

翻譯API每百萬字符收費20美元。例如,如果每天分析1000個視頻,則每個視頻的分析結果為30,平均字符數為5個字符。如果你每天都這樣做,翻譯的字符數將是每月450萬。翻譯450萬個字符的價格約為90美元(約合10,000日元)。通過使用如下所示的數據存儲,每月使用費可以大大減少! 流程如下: [1]上傳到GCS的視頻的URL被引入視頻智能API [2]視頻智能API解析視頻並使用獲取的標籤(英語)作為關鍵字搜索數據存儲 [3]使用Translation API翻譯不在Datastore中的標籤 [4]將翻譯前標籤作為鍵,將翻譯後的標籤作為屬性寫入Datastore





下圖是在數據存儲區中完成緩存時每月費用的比較。(※2) 如果你看這個圖,當命中率是0%時,有一個緩存,但沒有緩存,它幾乎是相同的費用(事實上,有緩存,它大約是0.18美元,這相當於數據存儲的費用)。速率越高,比例越低,可以看出在100%的命中率下幾乎沒有電荷(* 2)。此外,由於從視頻中獲得的標籤基本上是名詞,因此它們可能會捕獲緩存的單詞,因此命中率會很高而且費用會很低。

※2 …數據存儲的免費費用是被忽略的費用。事實上,Datastore有一個免費套餐,因此根據檢測到的標籤數量,可以考慮每月0美元。

摘要

學習的API(如Video Intelligence API,Vision API和Speech API)的識別準確性非常高,我相信未來的準確性將繼續提高。但是,由於不支持用日語製作標籤,因此使用它可能是一個障礙,許多人將它與翻譯API結合使用。
在此範例中,我們以15000個字符/月的速率計算。但是,如果每日視頻分析的數量和標籤上的平均字符數增加,則Translation API費用也將增加。
但是,由於在開始時在數據存儲區中註冊的標籤數量很少,但此次引入的數據存儲區與此次引入的數據存儲區相結合可能會花費Translation API,但數據存儲區的內容已完成。你可以節省更多的價格!!

請在這樣的配置中利用GCP學到的API!!

Aaron Lee

超過7年的 Google Cloud 經驗,服務過上百家 Google Workspace 與 GCP 客戶,擔任多次研討會主講人與教育訓練講師,提供架構諮詢與技術支援,幫助各大企業上雲。

發佈留言