/ 最新消息
最新消息

為什麼手機能認出戴口罩的你?主要是「它」的功勞

2020.11.19|
Deep Learning

作者  | 發布日期 2020 年 11 月 18 日 8:45 

 

武漢肺炎(COVID-19、新冠肺炎)疫情讓臉部解鎖功能低下高貴的頭,當口罩成為出門必備品,解鎖手機時總要經歷「臉部辨識失敗→輸入密碼」的麻煩過程,不由得讓人懷念起指紋辨識。

 

為了優化臉部解鎖體驗,今年稍早創業者 Danielle Baskin 推出帶臉部資訊的口罩,透過擷取用戶臉部資訊,然後印在口罩外側,用戶就算戴口罩也可拼成完整的臉。

 

▲ 但有點驚悚。(Source:Danielle Baskin)

 

不過產品解鎖成功率不明確,且沒有大量樣本證明有用。那要如何讓臉部辨識不再被口罩困擾?

一些網友漸漸發現,隨著戴口罩時間越來越久,手機似乎由一次次解鎖失敗找到「經驗」,逐漸能辨識成功戴著口罩的主人。

靠這思路,一些科技網紅也分享更有效的教程,如戴口罩反覆解鎖,臉部辨識不成功就立即輸入密碼,循環這動作 30 分鐘左右,手機便能辨識戴口罩的自己了。

 

▲ 戴口罩成功臉部解鎖。(Source:Farhad Usmanoff)

不過網友表示,不同機型的「學習」速度不一,有人重複 20 分鐘便成功,但有人重複上千次,手機仍無法辨識戴口罩的人。

為什麼會出現這種情況?答案和手機 AI 學習能力有關。

深度學習利器──NPU

如果有關注近兩年的手機發表會,一定會發現手機廠商介紹 SoC 晶片時,都會重點提到 NPU 升級。

NPU 就是神經網路處理器。手機晶片一般分為幾個功能區,發表會常提到的有 3 個:一是擅長處理繁複工作和發號指令的 CPU,二是擅長圖形處理的 GPU,再來就是擅長處理人工智慧任務的 NPU。

雖然 NPU「占地」沒有 CPU 和 GPU 大,但能力卻不容忽視,手機的智慧程度就靠它了。

訓練手機辨識戴口罩的人,便主要歸功於 NPU 的能力。鏡頭捕捉到臉部後,CPU 和 GPU 會在極短時間前端處理圖片,然後 NPU、GPU 偵測擷取特徵,最後 CPU、GPU 和 NPU 共同完成臉部辨識分類。

得益於日益強大的運算力,整個過程能到「無感」程度。我們拿起手機的瞬間,上述流程便處理完畢。

NPU 的加入,讓手機認識不同狀態的你。早上剛起床時,即便浮腫,手機也知道這就是你,甚至被馬蜂蟄了、嘴巴腫成「香腸」,手機依然能辨識你。

所以經過定量訓練後,手機便可「無懼口罩」認出你了。

如果只靠演算法,CPU 和 GPU 也能配合學習,但缺點是效率低且功耗大。據《汽車電子與軟體》介紹,CPU 和 GPU 需使用數千條指令完成神經元處理,NPU 只需一條或幾條就能完成。

▲ NPU 學習效率頗高。(Source:Android Authority)

另外同等功耗下,NPU 效能是 GPU 的 18 倍,可看出 NPU 深度學習的處理效率方面有明顯優勢。

說到這不得不提 NPU 的工作原理。NPU 的學習效率高,不是因為喝了「紅牛」,而是在電路層模擬人類神經元和突觸,使用深度學習指令集,直接處理大規模的神經元和突觸。透過突出權重達成儲存和計算一體化,NPU 一條指令就能勝任以往 CPU 和 GPU 的上千條指令。

打個不準確的比喻,就像電商的倉儲、物流一體化,提高送貨效率,當天買當天就能拿到商品。

NPU 並不雞肋

中國最早研究 NPU 的企業當屬寒武紀。2017 年發表的麒麟 970 晶片,就採用寒武紀 NPU 架構,麒麟 970 也為世界首款行動端 AI 晶片。

華為表示整合 NPU 單元的麒麟 970,相較 4 個 Cortex-A73 核心處理同樣的 AI 任務時,擁有約 50 倍能效和 25 倍效能優勢。例如影像辨識速度可達約每分鐘 2 千張,遠高於業界水準。

11 天後,iPhone 8 / 8 Plus、iPhone X 帶著 A11 仿生晶片問世,蘋果表示這是有史以來最強大、最智慧的晶片。

A11 Bionic 是蘋果首款以「仿生」命名的處理器,也是蘋果第一款支援 AI 加速的處理器。比如臉部辨識,神經網路引擎讓 A11 支援速度高達每秒 6 千億次運算辨識。

也是從這年開始,越來越多廠商重視手機 AI 能力宣傳。如華為主打的 AI 攝影、超級夜景、隔空手勢等功能;iPhone 引以為傲的 Face ID、人像景深、Deep Fusion(深度融合)等功能,都依賴 NPU 的能力。

 

▲ 華為 AI 手勢操控。

原始文章: https://technews.tw/2020/11/18/why-does-the-phone-recognize-you-wearing-a-mask/