Google導入人工智慧,個資隱私全都罩!(下)

Google導入人工智慧,個資隱私全都罩!(下)
Google導入人工智慧,個資隱私全都罩!(下)

Google靠人工智慧新科技,保障每個使用者的隱私!(下)

目錄

1. Google棄Cookie改用機器學習追蹤!人工智慧能保護隱私嗎?

2. Cookie是什麼?

3. 機器學習或成壓垮「餅乾」的一大把稻草

4. 即使棄用Cookie Google還是能用FLoC賣廣告

5. Google不只將人工智慧用在投放廣告上

6. 機器學習取代「餅乾」的隱憂

 

本文為該系列的下篇,上篇(關於 Google 棄 Cookie 改用機器學習追蹤的新聞、Cookie 的解釋以及 AI 如何保護隱私)請點此連結

即使棄用Cookie Google還是能用FLoC賣廣告

所以 FLoC 要如何替廣告主鎖定特定客群、投放廣告呢?

透過機器學習 FLoC,Chrome 仍然可以追蹤用戶在網路上的瀏覽習慣,當使用者造訪不同網站時,瀏覽器將會根據使用者習慣與偏好將他們分組(cohort),放入「受眾群體」或稱「同類群組」中。廣告主再將他們的廣告直接投放給特定的群組。

與 Cookie 的個別追蹤不同,FLoC 採群體追蹤,「把一棵樹隱藏在一片森林中」,廣告商不會知道群組內的特定個別使用者是誰,因此 Google 將其稱為一項「隱私至上」、「興趣為主」的廣告透放技術。

圖片來源:Google Ads & Commerce Blog

至於群體追蹤如何才有效,就必須仰賴 FLoC 把用戶分類的精準度。對使用者來說,同一個群組中的使用者越多、隱私性就越高,儘管對廣告商來說,要投放個人化廣告的成效就會越差。

Google 聲稱,與原本的廣告技術相比,FLoC 現階段約具有 Cookie 追蹤 95% 的成效,同時 Google 也表示廣告商擁有和使用 Cookie 追蹤相同的投資報酬率。

 

Google不只將人工智慧用在投放廣告上

聯盟式學習不是一個全新的技術,他最早開始是在 2017 年在 Google AI Blog 中提出。除了應用在智慧型手機上、讓使用者獲得更優秀的手機客製化操作體驗外,注重病患個資隱私安全的醫療產業也能見到聯盟式學習的應用。

因為病人的資料隱私在醫療產業中極度重要,聯盟式學習可以使病人的影像照片、病歷等私人資料不需要被傳輸、轉移至其他醫療機構,就能參與人工智慧的運算。除了 Google,NVIDIA 近年來也投注了大量心力在醫療產業的聯盟式學習技術之中。

一方面保護個資,另一方面讓人工智慧的研究可以應用到實務的診斷上,藉此達到不錯的效果。

 

機器學習取代「餅乾」的隱憂

這樣聽起來 FLoC 似乎是取代 Cookie 的最佳方式,不僅能保護使用者隱私、還能讓廣告商繼續向特定族群投放廣告。但就目前而言,FLoC 技術尚未獲得一致認可。

有一派聲音擔心認為「將使用者分組」可能會加重偏見與歧視問題,也容易引發有心人士針對特定群組進行網路攻擊。

像是廣告技術公司 Criteo 的資深機器學習工程師 Basile Leparmentier 就表示:Google 提出的 FLoC 群集演算法是由他們自己開發處理,且對所有網路使用者通用的,因此,Google 有權在任何需要的時候修改演算法。更奇怪的是,如果其他瀏覽器開發商想要採用 FLoC 群集演算法,它們也能自行更改分組供自己使用。

亦有聲音擔心此舉是變相進一步鞏固 Google 的廣告科技龍頭的地位。以「維護用戶隱私」而聞名的搜尋引擎「DuckDuckGo」公關副總裁 Kamyl Bazbaz 表示:FLoC 是透過用戶的瀏覽歷史記錄,將用戶分類給基於相同興趣群組,而這樣分類機制最後會形成類似「超級追蹤器」的結果,這比許多網站都已使用的 Google Analytics 更為恐怖。

Google 最快會在 2021 年 3 月正式導入 FLoC 到 Chrome 上測試,而 FLoC 的實際運作的成效與後續產生的效應,或許一切都還要靜觀其變,才能知道未來走向會如何。

 

 

 

 

推薦閱讀:
零基礎考取 GoogleAds 認證只要 14 小時!5 種 GoogleAds 廣告攻略


網站核心指標5月將成SEO排名因素!LCP,FID,CLS詳解與優化方式


27歲MIT工程師用人工智慧,預測新冠疫情比專業準


2021最適合工作的IT公司top10:NVIDIA第一、Google第三,蘋果竟連前10名都沒有?


最新人工智慧”MuZero”誕生!除了下棋還能會玩遊戲!(上)


未來不用在驚惶!選對PYTHON課程讓你當上竹科工程師!


程式設計師專屬交友app,今年脫單不是夢!!(上)

Google導入人工智慧,個資隱私全都罩!(上)

Google導入人工智慧,個資隱私全都罩!(上)
Google導入人工智慧,個資隱私全都罩!(上)

Google靠人工智慧新科技,保障每個使用者的隱私!(上)

 

目錄

1. Google棄Cookie改用機器學習追蹤!人工智慧能保護隱私嗎?

2. Cookie是什麼?

3. 機器學習或成壓垮「餅乾」的一大把稻草

4. 即使棄用Cookie Google還是能用FLoC賣廣告

5. Google不只將人工智慧用在投放廣告上

6. 機器學習取代「餅乾」的隱憂

 

Google棄Cookie改用機器學習追蹤!人工智慧能保護隱私嗎?

Google 近日於在官方部落格中刊出一篇文章,表示旗下服務將會逐步汰除第三方「Cookie」技術。即將取而代之的是,Google 預計於 2021 年啟用被稱為「FLoC」的人工智慧技術。

文章內表示,此舉是因為使用者們不斷增加的隱私要求,以及迅速變化的政策監管機制,使得開發自家的 Cookie 平台不再值得長期投資的選擇。

Cookie 技術目前普遍應用於數位廣告,是當代數位網路必備的追蹤工具,但是 Google 旗下的 Chrome 瀏覽器有極重的市場占比,因此其淘汰 Cookie 的決定將對網路及數位廣告生態,造成巨大的影響。

 

Cookie是什麼?

圖片來自:internetcookies.org

 

你是否感到疑惑,為何我在電商平台搜尋「逗貓棒」、「貓砂」,接下來社群網站就出現一排寵物用品的廣告? 或是當再次打開訂房網站,發現網站保留了你前一次逛的飯店紀錄?這些都是「Cookie」的功用。

多數網站為了識別使用者,會產生一個小型文字檔案,記錄用戶的來源、身分、點閱足跡等資料,日後同一使用者再次造訪時,可以保持登入狀態、記住偏好設定和提供所在地相關內容等等,藉此提供更流暢、更方便的使用體驗,這個檔案就被稱為「Cookie」。

Cookie 可以分成「第一方 Cookie」以及「第三方 Cookie」兩種。第一方 Cookie 是由使用者存取網站隸屬的網域所發行,用於記錄限定於該網站的瀏覽紀錄等資訊;第三方 Cookie 則會跨網域獲取使用者的瀏覽紀錄等資訊,用來推送該使用者可能會關注的廣告。目前全球千千萬萬的大小型企業透過 Google 投放廣告,取得龐大的使用者數據,就是透過 Cookie 蒐集。

而「第三方 Cookie」常常造成網路隱私的爭議。許多證據都指出,Cookie 會在使用者不知情的情況下遭第三者利用,使用者不知不覺間被出售了個人資訊與網路足跡,隱私受到侵害。

接連爆出的隱私爭議,讓身為網路廣告巨頭的 Google 早就有移除第三方 Cookie 的想法。

2019年,Google 提出 Privacy Sandbox(隱私沙盒)實驗計畫,目的是在保護用戶隱私的前提下,持續為廣告商和企業提供個性化的網路廣告。這次的最新聲明則表示:確認不會研發這類用於標示用戶身份的工具,也不會在包括 Chrome 在內的所有自家產品提供類似服務 。

 

機器學習或成壓垮「餅乾」的一大把稻草

根據調查統計機構 Netmarketshare 最新調查表示,全球瀏覽器占比第一依舊是 Google Chrome,握有 69.18% 的市占率。而掌握快7成客戶的 Chrome 將淘汰第三方 Cookie,廣告業者未來如何因應呢?其實,Google 只是換一種方式繼續下廣告而已。

Google 將以人工智慧技術「FLoC」取代 Cookie。FLoC(Federated Learning of Cohorts)是一個基於聯盟式學習(Federated Learning)的架構,與傳統的機器學習不同,聯盟式學習的概念為:資料不需要離開設備,可以各自在自己的設備訓練,並透過通過加密機制,在雲端上建立一個共有的模型進行更新。

Google 介紹聯盟式學習(Federated Learning)之示意圖。

聯盟式學習的概念可分為四個步驟:

1. 每個機器學習設備各自使用自己收集的資料來訓練模型,不會和其他的設備共享、流通。結果會先經過加密,再上傳到中心模型。

2. 中心模型整合、更新各個設備上傳的結果。

3. 將中心模型更新後的結果回傳給各個設備。

4. 各設備更新各自的模型。

因此,FLoC 能在隱私性、實用性與資料安全性三個面向做到完美兼顧。

 

本文為該系列的上篇,下篇(關於 Google 如何將 FLoC 用於 GoogleAds 以及…..、造成那些隱私的隱憂?)請點此連結

 

 

 

 

 

推薦文章:
零基礎考取 GoogleAds 認證只要 14 小時!5 種 GoogleAds 廣告攻略


網站核心指標5月將成SEO排名因素!LCP,FID,CLS詳解與優化方式


27歲MIT工程師用人工智慧,預測新冠疫情比專業準


2021最適合工作的IT公司top10:NVIDIA第一、Google第三,蘋果竟連前10名都沒有?


思念去逝親人?人工智慧竟能”復活”他們與你聊天?!


人工智慧下棋不稀奇?最新版”MUZERO”還會打遊戲?!(上)


日文系也能無痛轉行工程師?!原來選對Python課程是訣竅!

掌握疫情走向就靠人工智慧!不僅快還準到爆?!(下)

掌握疫情走向就靠人工智慧!不僅快還準到爆?!(下)
掌握疫情走向就靠人工智慧!不僅快還準到爆?!(下)

人工智慧真的是人類的好幫手!不僅能快速預測疫情走向,結果還超精準?!(下)

 

本篇文章為下篇,想了解 Youyang Gu 這位年輕的人工智慧/機器學習專家的背景,以及他為何要使用人工智慧技術來預測 Covid-19 疫情,請點此連結了解事情始末!

不求複雜繁複,只要能做出精準預測的就是好模型

 

「covid19-projections.com」網站預測結果示意圖。

談到是如何建構預測模型時,Youyang Gu 表示他最一開始先考慮了Covid-19確診人數、住院人數等等許多因素之間的相互關係。但接著,他發現各州和聯邦政府的官方報告資料居然並不一致,其中較可信的資料是每日死亡人數。「其他機構的模型採用了很多種資料,但我決定用過去的死亡人數,來預測未來的死亡人數。」

這讓 Youyang Gu 的預測模型與其他預測系統相比之下十分單純,他表示這個決定是有原因的:「我把『死亡人數』作為唯一的輸入資料,有助於讓機器學習在雜訊中過濾出有用、可靠的資訊。」他表示,如果輸入的資料與事實不符,那麼資料越多,輸出的預測結果當然就越差。

從 2020 年 4 月開始,Youyang Gu 投入了幾千小時在這個工作中,人工智慧接連精準的預測結果也逐漸吸引到許多目光,其中不乏領域專家與權威人士。

準到美國疾管中心也採用

「covid19-projections.com」網站預測結果示意圖。

最早注意到 Youyang Gu 的專家是華盛頓大學生物學教授 Carl Bergstrom,他在個人 Twitter 上分享了 Youyang Gu 的模型。

接著,全球最大資料科學社群平台 Kaggle 與人工智慧教學網站 fast.ai 的創始人、在資料科學領域享有盛名的 Jeremy Howard 表示:「我看了 Youyang Gu 的網站和資料後覺得太神奇了。他是唯一一個真正去查看資料、並且做得最正確的人,這也是他為什麽他會成功的原因。他是目前為止唯一認真做這件事的人。」

最後,美國疾病管制與預防中心也也在其網站上發布了 Youyang Gu 的預測資料!這之後,他的網站達到了空前的瀏覽數,每天都有數百萬人的人造訪,來看他的預測。

疫情之下的另一種可能

儘管獲得了許多掌聲與讚美,但去年 11 月時,Youyang Gu 毅然決然決定要結束他現階段的任務。

但他不是要完全結束他用心經營的計畫,而是打算休息一段時間,邁向另一個新的階段。接下來,他打算將目標放在預測「美國有多少人口確診」、「疫苗推出的速度有多快」、「美國何時能達到群體免疫」等等。他預測今年 6 月,約有 61% 的美國人口會獲得一定程度的免疫力——無論是來自疫苗還是因為曾經感染。

Youyang Gu 表示,他過去一直希望他的工作能對社會產生巨大貢獻,並且能避開政治、偏見以及大型組織有時候不得已的負擔。他也表示,在疫情爆發的這個特殊情況下,有很多缺點可以透過和他一樣背景的人來改善。

Youyang Gu 的故事,打破了很多人對工程師或理工背景專業人士的既定印象,很多人沒有想到在對抗 COVID-19 疫情的全民戰爭中,還有這種善用人工智慧技術的方式貢獻一份力,成為了另類的抗疫英雄。

 

 

 

 

 

 

 

推薦文章:
【機器學習懶人包】 10種演算法圖解-從監督式到非監督式學習


人工智慧、機器人、Python、大數據⋯⋯到底有什麼關係?


人工智慧「聽咳嗽聲」就能驗出新冠「無症狀」患者!成功率 98.5%


疫情下的人工智慧-社交距離後,機器人如何維繫我們的心理連結?


最新人工智慧”MuZero”誕生!除了下棋還能會玩遊戲!(上)


人工智慧創新食譜!滿足每位吃貨的心!


Waymo槓上特斯拉,搶爭自駕行業第一把交椅!!(上)

掌握疫情走向就靠人工智慧!不僅快還準到爆?!(上)

掌握疫情走向就靠人工智慧!不僅快還準到爆?!(上)
掌握疫情走向就靠人工智慧!不僅快還準到爆?!(上)

人工智慧真的是人類的好幫手!不僅能快速預測疫情走向,結果還超精準?!(上)

用人工智慧預測疫情神準 華裔工程師獲美媒肯定

疫情大流行至今已經過了一年多,許多人都迫切的想知道,究竟要到何時疫情才能趨緩?什麼時候才能真正恢復正常生活呢?

在沒有絕對可信預測機制的當前,一位沒有醫學背景的 27 歲資料科學家「Youyang Gu」僅憑一己之力,做出了精準度遠超過專業機構的預測模型,更讓美國知名新聞機構彭博社(Bloomberg Businessweek)稱他為「COVID-19 資料的超級巨星」。

美媒《彭博商業周刊》譽27歲的Youyang Gu為「COVID-19 資料的超級巨星」

在介紹這位年少有為的 Youyang Gu 之前,先讓我們話說從頭、把時間倒回 2020 年年初。

英美兩大專業機構 預測新冠疫情失準

當時新冠疫情已然爆發,在各國之間大流行,每個人都想知道冠狀病毒接下來造成的影響會有多大。當時多數人都將期望放在兩家專業機構建立的預測系統:一是倫敦帝國理工學院(Imperial College London),二是位於西雅圖的健康指標與評估研究所(IHME)。

但這兩家備受期待的機構,卻產生了截然不同的預測結果。倫敦帝國理工學院警告說:「到夏季時,美國的死亡病例可能會達到 200 萬人」;相較之下,IHME 的預測則保守許多:他們估計到 8 月時,美國死亡人數約為 6 萬人。

但後來事實證明,兩者都離實際數字頗有差距──8 月初時,美國的死亡人數約為 16 萬人。

一般民眾可能感嘆個兩句「結果居然這麼差這麼多!」就置之腦後了,但對於有專業數據分析背景的 Youyang Gu 來說,這件事成為他展開未知旅途的契機。

以機器學習來理解資料

在看到專業機構的結果後,Youyang Gu 毅然決然地選擇自己打造出一個使用人工智慧來預測Covid-19疫情死亡人數的模型。2020 年 4 月中旬, Youyang Gu 僅僅耗費了一週的時間,就建構出預測模型,還架好了可以展示預測結果的網站,取名為「covid19-projections.com」。

預測Covid-19結果的網站:covid19-projections.com

即使他並沒有任何醫療或公共衛生的專業背景,但他認為用演算法進行的資料預測分析──正也是他的專業──可以在此時大展身手。「我就是單純地認為,數學和統計知識可以應用到生活中的任何方面,那當然也可以用在預測疫情。」Youyang Gu 表示。

Youyang Gu 大學和碩士皆畢業於 MIT,擁有電腦科學與數學雙學士學位、電腦科學的碩士學位,畢業後則進入遠近馳名的 MIT 電腦科學與人工智慧實驗室(CSAIL),在 NLP 小組中進行了一年的研究,並在 NLP 領域的頂尖會議「EMNLP」上發表論文。從此他開始接觸大數據,也開始累積建立統計模型、預測數據的能力。

隨後他離開校園,進入金融行業,為銀行的高頻交易(英語:high-frequency trading,HFT,指利用電腦以快於毫秒的速度快速押注買賣股票、期貨等,從那些人們無法利用、極為短暫的市場變化中尋求獲利的自動交易系統。)系統編寫演算法,而金融交易資料講求的精準與量化,使 Youyang Gu 建造模型的能力與對資料處理的理解又更上層樓。離開金融產業後,他進入了體育界,繼續進行大數據領域的研究,這讓他除了懂得更加精準地建模,也累積了能應對全新領域的跨學科經驗。

Youyang Gu 表示,他的專長是「使用機器學習來理解數據,將資訊與雜訊分離,並且做出準確的預測」。

準到怕!人工智慧預測死亡人數幾乎命中

▲ Youyang Gu 親自講解自己一手打造的 Covid-19 預測網站

重點來了,那 Youyang Gu 使用機器學習技術的預測結果如何呢?

在模型建立完成後,他預測了 5 月 9 日美國將有 8 萬人死亡──而當天的實際死亡人數總計為 79,926 人!這個極微小的誤差,與 IHME 預測的「2020 整年的死亡人數不超過 8 萬」相比,真可以說是神準至極了。

接著,他預測在 5 月 18 日死亡人數會達到 9 萬,而到5 月 27 日,人數將達到 10 萬。後來比對當天的實際人數,都相差不太大、十分精準。除了數據資料外,Youyang Gu 也把許多現實狀況納入考量,例如當時有許多州從封鎖狀態轉為開放,於是預測到將出現第二波大規模的感染和死亡案例。

 

Youyang Gu 是用了什麼特殊的方式,讓疫情預測如此神準?請見下篇!連結點此

 

 

 

推薦文章:
【機器學習懶人包】 10種演算法圖解-從監督式到非監督式學習


人工智慧、機器人、Python、大數據⋯⋯到底有什麼關係?


人工智慧「聽咳嗽聲」就能驗出新冠「無症狀」患者!成功率 98.5%


疫情下的人工智慧-社交距離後,機器人如何維繫我們的心理連結?


耍心機面試無效?!人工智慧面試官讓求職更公平!(上)


人工智慧創新食譜!滿足每位吃貨的心!


眼光高挑不到另一半?別怕,人工智慧幫你挑結婚對象!

榮登前十個神級好用的Python函式庫,你知道幾個?(2)

榮登前十個神級好用的Python函式庫,你知道幾個?(2)
榮登前十個神級好用的Python函式庫,你知道幾個?(2)

是哪10個Python函式庫榮登去年最好用?”這些”函式庫你都知道嗎?(2)

本系列文章為【2020年度十大Python函式庫-人工智慧 · 機器學習必備 】的第二篇。上一篇介紹了把單調的「命令列介面」變花俏的 Python 函式庫:Typer、Rich 與 PyGui,除了可把命令列/終端機介面變彩色外,還可以加入表情符號與特效等。請點此看上一篇閱讀了解 。

PrettyErrors:將 Python 醜陋的 bug 信息變漂亮

Python已經算是十分言簡意賅的程式語言了,但是當有 bug 時,它的錯誤信息輸出(參見下圖左側)也是一樣會讓你懷疑人生!密密麻麻的代碼,讓你必須在毫無頭緒之下進行地毯式搜索!

▲PrettyErrors 函式庫將原本混亂的 Python 錯誤信息(箭頭左邊所示)重新排版得井然有序、顏色與段落都很分明(箭頭右邊所示)

 

經過 PrettyErrors 的重新排版,所有醜陋的錯誤信息都能變的井然有序,最後你得到的是經過排版美化、整齊劃一的 bug 報告,如上圖的右側所示。

Diagrams:只用 Python 就能繪製雲系統架構

程式設計師除了 coding 與 debug 外,有時還必須和其他的同事解釋錯綜復雜的架構。傳統上,我們會使用圖像介面(GUI) 工具來處理圖表、將其可視化後放入簡報、文件等,但是這並非唯一的方法。

Diagrams 可以讓你在沒有任何設計工具的狀況下,僅僅使用 Python 程式碼就能夠繪製出雲系統架構!它有現成的圖標,讓你能馬上對應AWS、Azure、GCP 等多個不同的雲端供應商,使得繪製箭頭、創建群組等都輕而易舉!只需幾行代碼就可以辦到!

▲ Diagram 函式庫能讓工程師僅僅使用 Python 代碼
就能繪製雲系統架構圖

 

下篇,我們即將介紹 PyTorch 版的 Keras「PyTorch Lightening」讓你告別沒完沒了的 Debug!另外還有微軟出的 Hummingbird 讓你不用重新設計新模型;另外還有可以將高維度資料視覺化的「HiPlot」,點此看下一篇閱讀了解!

 

 

 

推薦文章:
用說的就能寫程式!人工智慧替手傷工程師開發語音程式工具


Google 正測試人工智慧系統,助盲人和視障人士獨立參加路跑


人工智慧能「聽咳嗽聲認出新冠患者」!成功率達 98.5%


Nature:語言天才比數學高手更適合學 Python!別在嘴文科生、女性不能寫程式了


科幻迷的最愛電影竟然和Python跟Java扯上關係?!(上)


蛋白質折疊背後的秘密竟被人工智慧輕易破解?!(上)


人工智慧面試官,打破求職歧視環境!!(上)

怪物不會畫免緊張!靠人工智慧幫你輕鬆塗鴉變大師級奇幻插畫!

怪物不會畫免緊張!靠人工智慧幫你輕鬆塗鴉變大師級奇幻插畫!
怪物不會畫免緊張!靠人工智慧幫你輕鬆塗鴉變大師級奇幻插畫!

原來人工智慧可以把塗鴉變成大師級的奇幻插畫,這樣再也不用擔心不會畫怪物了!


▲ Google 新推出的機器學習工具「Chimera Painter」,展現了人工智慧輔助繪圖能力(Image: Google)

 

 

Google CEO Sundar Pichai 曾經說過人工智慧人類的影響「比火、電更為深遠(AI is more profound than fire or electricity.)」。

這邊有個有力的證據,來支持上述的說法: Google 研發了一套人工智慧工具,可以將平常不過的塗鴉,變成詭異的怪物。還有什麼比這影響更深遠的?

 

 

▲ 使用粗略草圖即可生成奇幻生物的人工智慧工具:Google 的 Chimera Painter

 

 

無論如何,這聽起來就是很有趣。這套工具叫做「Chimera Painter」,它能根據用戶的粗略草圖,利用機器學習方式,生成進一步的精緻圖像。這樣的生態已逐漸成為機器學習界的常態:先前 Nvidia 推的 AI 工具「done it with landscapes」可以將線條草圖生成擬真背景、MIT 與 IBM 也合作過將粗略線條生成擬真建築物的「GANpaint」,而現在 Google 也出了類似的人工智慧工具用來生成 … 怪物。

Chimera Painter 背後的團隊在他們的部落格網站說明這套工具的概念是創建一支「不像工具、而更像助手的畫筆」。Chimera Painter 只能算是一個原型,但是如果類似的軟體普及化後,絕對可以大大地縮短創作高品質藝術作品所需的時間。


▲ Google 的人工智慧研究人員發想的奇幻遊戲卡原型(Image: Google)

 

Google 的人工智慧研究人員們給自己一個挑戰:發想奇幻風格的遊戲卡片,卡片玩家可結合不同的怪物卡來戰鬥,就像寶可夢的玩法一樣。研究團隊用來訓練機器學習模型的資料庫,擁有破萬隻怪獸的資料。這些怪獸本身是使用遊戲開發引擎「Unreal Engine」,一個部位接著一個部位地使用 3D 模型渲染生成。每一張圖像都匹配到一個「分割圖」 ──將怪物分為爪、口鼻、腿等身體部位的覆蓋圖。

訓練了這個機器學習模型以後,用戶就可以依照怪物的身體部位,繪製線條草圖。每一部位的線條草圖都被視為分割圖,然後用對應的逼真紋理進行渲染。如果你載入了 Chimera Painter,就會看到一些預設的怪物,並且牠們身體各個部位可以說是接合的天衣無縫。但是,當你自己繪製時,如果身體的部分沒有接合或匹配好,所生成的怪獸恐怕會是七零八落。以下的影片就是幾個失敗的範例:

▲ 使用 Chimera Painter 繪製怪物失敗的案例

 

 

 

 

 

推薦文章:
人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒


【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%


【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」


【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離


人工智慧臉部辨識已成熟?還有哪些看不見的隱憂?(上)


人工智慧貓咪庇護所,陪浪浪度過寒冬!(上)


人工智慧讓Google地圖升級了!連預測塞車也難不倒它?(上)

人工智慧結合貓門功能,有效阻止愛貓帶回獵物!

人工智慧結合貓門功能,有效阻止愛貓帶回獵物!
人工智慧結合貓門功能,有效阻止愛貓帶回獵物!

人工智慧結合貓門功能,再也不用擔心會被貓咪叼回的獵物嚇到囉!

 
人工智慧 AI 科技用於可愛的喵星人身上已經不是新聞,像是之前百度工程師為了拯救寒冬中的浪浪而開發的人工智慧貓屋,保護浪浪免於凍死與餓死;台灣也有從矽谷回台的工程師開發 AI 貓便盆,都是以保護愛貓為出發點。而這次又有新的人工智慧貓咪產品問世,只是這次的開發動機是:奴才被主子叼回的獵物嚇到,而且開發人員竟然不是工程師!

推薦閱讀:AI 保護流浪貓!百度工程師打造人工智慧貓窩

 

人工智慧貓門可偵測到附近出沒的貓 以及牠們口中是否叼著獵物

 

寵物貓半夜叼獵物回家 奴才嚇到研發AI產品應對

根據 the Verge報導:亞馬遜的產品經理 Ben Hamm 收養了一隻「甜蜜又致命的貓(sweet, murderous cat)」Metric 之後,半夜經常被吵醒。因為 Metric 這時總是會叼著「戰利品」回到家中。有時是垂死的小動物、有時甚至是屍體。Hamm 真的別無選擇,只能疲憊地將牠們安樂死後,再回去補眠。

Hamm 透過學習程式語言的方式終於解決了這個問題,並且在「點燃西雅圖(Ignite Seattle)」的演講中,幽默地分享這項人工智慧解決方案「貓・老鼠・A.I・我的媽啊!(Cats, Rats, A.I., Oh My!)」

▲貓奴PM分享他如何使用人工智慧 解決愛貓叼獵物回家的問題

首先,Hamm 先把家中的貓門「升級」為「守門員」來把關愛貓是否又帶獵物回家。安裝電子套件 Arduino 來鎖門很容易,但是要如何讓門鎖感應到Metric 的口中是否叼著獵物?

透過機器學習訓練人工智慧分辨貓與獵物

身為亞馬遜的資深產品經理,Hamm 想出了 ML 機器學習的解決方案。Hamm 在貓門上方安裝了自家的 AWS DeepLens。AWS DeepLens可讓程式開發人員在攝影機上執行DL深度學習模型,可以針對看到的內容進行分析和採取行動。

推薦閱讀:人工智慧,Python,機器學習,深度學習是什麼?AI專有名詞看這篇秒懂

 

人工智慧貓門偵測到叼著獵物的貓咪後,Arduino 系統就會自動將貓門上鎖

 

Hamm 親自訓練這套 AI 系統,而且使其能偵測愛貓的口中是否叼著獵物。如果有的話,Arduino 則會自動將貓門上鎖 15 分鐘,這段時間足以讓 Metric 考慮是否要放棄口中那不受歡迎的「禮物」,然後「乾乾淨淨」地回來。

 

▲Hamm 使用 23000 張愛貓回家的照片做機器學習>,訓練人工智慧分辨貓與獵物

 

Hamm 花了好幾個月蒐集 23000 張 Metric 回家時的照片並作標記,包含 Metric 口中有叼著獵物以及沒有叼著獵物的圖片。Hamm 使用線上的 ML 機器學習>服務 Sagemaker 訓練了三個階段的模型:

 

▲Hamm 使用線上的 ML 機器學習服務 Sagemaker 做三階段訓練模型,由左到右分別是辨識「這是貓嗎」、「牠要過來嗎?」、「牠口中是否已有食物?」

 

 

  • 第一階段的模型是辨識「這是貓嗎」?假如答案為「是」,就進入下一階段
  • 第二個階段的模型是「這貓是要過來還是過來?」假如答案為「故來」,就進入下一階段
  • 第三個階段的模型是「這貓是要回來吃東西,還是嘴裡已有食物?」

 

以上三段辨識跑完,所花時間竟然不到兩秒。

假如人工智慧偵測到 Metric 口中有小動物,Hamm 就會立即收到這只「連環殺手」的殺生證據,然後致力於野鳥與自然保育的團體 Audubon Society 就會收到來自 Hamm 的捐款(流程如下圖)。

 

▲當人工智慧偵測到 Metric 口中有獵物後的處理流程:貓門會先上鎖,接著拍下證據照片,此時自然保育團體也會收到善款

 

Hamm 說,這套人工智慧系統上線五個星期以內,Matric「未殺生」回家的次數達 180 次,幾乎每次都能順利過關,只有一次不小心被鎖在門外。而 Matric 口中有獵物的次數有 6 次,有5 次AI 都有成功地將這位「貓凶手」隔離在外 15 分鐘。

 

▲這套人工智慧偵測的良率高,誤把 Metric 偵測為「有獵物」的而鎖門機率只有 0.5%。而 Metric 6 次帶獵物回家的紀錄中,成功被鎖在門外有 5 次。

 

 

 

 

 

 

 

推薦文章:
硬體毛利太低?工程師進修 Java 課程順利轉職軟體工程師


品保人員進修 Python 課程 一年後成功轉職程式設計師


當了快八年的業務,因Java課程而成功轉職程式設計師


非資工系出身!產品工程師「Python 課程」結業後轉職大醫院的網站工程師


一次搞懂人工智慧.機器人.Python.大數據的關聯!


人工智慧化身釀酒師,釀造首支AI威士忌竟還勇奪金牌!(上)


人工智慧與汽車雷達攜手合作!開車安全又放心!

人工智慧再突破!輕鬆解碼馬賽克!

人工智慧再突破!輕鬆解碼馬賽克!
人工智慧再突破!輕鬆解碼馬賽克!

人工智慧再次大突破,輕鬆解碼還原高解析!

 


▲ AI 技術 「PULSE」 可將模糊的馬賽克照片轉換成看起來像真人的高解析度肖像。 該系統能自動將任何圖像解析度提高到64倍,並模擬毛孔、睫毛位置與形狀等在原圖無法辨識的細節。

 

人工智慧用於「有碼變無碼」方面已有相當多的研究成果,例如之前 Google Brain 發表了透過機器學習消除馬賽克、提高像素的技術。而最近,AI 在去除馬賽克的技術又有了新的突破!

近日杜克大學的研究人員開發了一種 AI 影像還原工具,可將模糊到無法辨識的人像轉化為令人信服的高清圖片,而解析度與細節的表現可說是史上最強!

以往的技術,可將圖像的解析度提高至八倍。但是杜克大學的研究團隊想出了一種人工智慧的解決方法:只需要少少像素的模糊照片,就能創造出解析度高達 64 倍逼真的高清肖像,原圖看不到的細紋、睫毛以及鬍渣等細節都能夠一覽無遺!

「過去從未能在這樣的解析度(指原圖的低解析度)上,生成如此高清、如此多細節的圖片!」此次研究團隊的領導人──杜克大學的電腦科學家 Cynthia Rudin 說。

不過這個系統仍然無法用做人物辨識,研究團隊說:它沒辦法將監視器拍到的失焦或是無法識別的照片變成真實、清晰的圖像。相反地,它可以生成不存在、卻看起來真實的新面孔。

「研究員們專注於將這些面孔作為新的概念,但理論上,該技術可在拍攝幾乎所有物體的低解析度照片後,製作出清晰逼真的圖像。應用範圍涵蓋醫學,顯微鏡,天文學和衛星圖像。」 研究團隊的 Sachit Menon 說。

▲ 人工智慧「PULSE」能還原眼、口、鼻等部位都難以辨識的馬賽克圖片,並將原圖的解析度拉高至 60 倍!

 

傳統的影像修復方式為擷取低解析度的圖像後,將它與電腦之前看到的高解析度圖像的對應像素,試著撮合、匹配、平均化,藉此來補足像素。

這種「平均化」的結果是,頭髮和皮膚中的紋理區域可能無法從一個像素到另一個像素完美對齊,最終看起來模糊且朦朧。

杜克大學的團隊就不使用這種「在低解析度的照片上慢慢加新的細節」的方式。他們研發的系統 「PULSE」 會在人工智慧生成的高解析度率臉孔範例中,盡可能找到最像的──在範例臉孔縮放到相同尺寸時,看起來像輸入的原圖的人臉。

團隊使用一種機器學習的工具「生成對抗網絡(英語:Generative Adversarial Network,簡稱GAN)」,方法是使用相同的照片組訓練兩條神經網路。其中一條神經網路產生了人工智慧創建的人臉──其外觀是模擬訓練照片上的臉孔;而另一條網絡則用於判斷第一條生成的結果,是真實的人像還是虛擬人物。第一條網路不斷生成人臉,直到越來越逼真,以至於第二條誤認成是真實的人像為止。

PULSE 可將模糊不清、充滿雜訊或是馬賽克化的圖片,生成高擬真的照片。從一張模糊的肖像中,它可以生成許多令人難以置信、栩栩如生的照片,每張照片都不一樣,都是 PULSE 判斷模糊照片中的人物可能的真實樣貌。

即使是給眼睛與嘴巴幾乎看不到的馬賽克照片,「我們的演算法仍然可以用它來生成一些照片,而這是傳統方法無法做到的。」團隊中的 Alex Damian 說。

▲ PULSE 的 5 位研發成員將自己的照片「馬賽克化」後,「餵」給 PULSE 來還原照片。雖然 PULSE 合成的高清肖像與原本的有點出路,但是相似度已比過往的解碼方法還高,解析度更是高出許多。

 

該系統能在短短幾秒內,將 16×16 像素的肖像轉換成 1024 x 1024 像素,增加了超過一百萬的像素,幾乎等同於 HD (High Definition) 高畫質的解析水準。諸如像是毛孔、皺紋、髮絲等低解析照片無法察覺的細節,都在人工智慧生成的照片中,變得銳利而清晰。

研究團隊還邀請了 40 個人,對經由 PULSE 以及其他四種方法 (LR、BICUBIC、FSRNET、FSRGAN) 生成的 1440 張圖像,進行 1 到 5 的評分。結果是由 PULSE 生成的照片分數最高,得到了「幾乎與真人的高解析度照片一樣」的評價。

你也可以上載你的圖像,看看會被 PULSE 生成哪些驚人的結果:http://pulse.cs.duke.edu/.

 

 

 

 

 

推薦文章:
六個月從工地工人轉職 Java 軟體工程師,全因半年做了「對的決定」


Python vs R語言:哪個比較適合人工智慧/機器學習?


台灣本土開發AI 發行首張音樂專輯<<武漢肺炎>>


線上職訓正夯 從零開始花半年錄取軟體工程師


連重機賽車手冠軍都佩服的存在!人工智慧做到了!


太難過!!人工智慧傳教士陳昇瑋英年早逝!


就算是夢也有機會成真?!人工智慧組隊打職棒再也不是夢?(上)

 

輕鬆搞定機器學習-非監督式學習篇(下)

輕鬆搞定機器學習-非監督式學習篇(下)
輕鬆搞定機器學習-非監督式學習篇(下)

搞定機器學習其實一點也不難,前提是要用對方法!(下)

 

本篇為下篇,上篇請點此連結

二、非監督式學習

1. 隨機森林(Random Forest)

隨機森林可以視為決策樹的延伸,可以把隨機森林當作是多個決策樹組合而成,並加入隨機分配的訓練資料,以大幅增進最終的運算結果。其想法就是結合多個「弱學習器」(即決策樹)來建構一個「強學習器」模型。這種方法被稱為「集成」(Ensemble Method)。同時也能降低單個決策樹出錯的風險。

▲ 決策樹演算法示意圖

 

如果創建一個隨機森林模型預測數值,只有第三個決策樹預測為 0,但是如果整合所有決策樹的結果,將會判斷出預測值是為 1。

隨機森林的優點為可以處理大量的輸入變數,同時可以計算各例中的親近度,對於資料探勘、偵測離群點和將資料視覺化非常有用。

2. 聚類分析(Cluster analysis)

聚類分析是統計資料分析的技術,後來在像是機器學習等領域受到廣泛應用。「聚類」是把相似的物件通過靜態分類,分成不同的組別或子集(subset)。聚類有很多種方法,常見的如 K-means、層次聚類(Hierarchical clustering)、譜聚類(Spectral Clustering)等等。

▲ 「聚類」是把相似的物件通過靜態分類,分成不同的組別或子集 (圖片來源: geeksforgeeks.org)

 

聚類時,把需要實現的目標只是要把相似的東西聚到一起,一個聚類算法只需要知道如何計算相似度就可以開始分類,因此聚類算法並不需要使用訓練資料進行學習。

3. 主成分分析(Principal Component Analysis,PCA)

主成分分析 PCA 是一個在機器學習與統計學領域中被廣泛用來分析資料、降低數據維度以及去關聯的線性降維方法。降維(Dimension reduction)是當資料維度數(變數)很多的時候,嘗試讓維度數(變數)少一點,但資料特性不會差太多的方法。

機器學習使用 PCA 達到降維的目的,主要是為了避免「維數災難」,或稱「維度詛咒」,指當維度增加時,分析和組織高維空間因體積指數增加而遇到各種問題:在機器學習問題中,模型預測能力會隨著維度的增加而減小。

4. 奇異值分解(Singular Value Decomposition,SVD)

奇異值分解 SVD 是線性代數中一種重要的矩陣分解,不僅可以用於降維演算法中的特徵分解,還可以用於推薦系統以及自然語言處理等領域。

▲ 實數 2×2 矩陣 M 的奇異值分解 UΣV * 的圖示。(圖片來源:圖片來自 Wikipedia)

 

SVD 矩陣是一個複雜的實復負數矩陣,給定一個 m 行、n 列的矩陣 M,則 M 矩陣可以分解為 M = UΣV。U 和 V 是么正矩陣(unitary matrix),Σ 為對角陣。

SVD 在某些時候可以做為簡化版的 PCA 利用。PCA 演算法可以不用做特徵分解,而是做 SVD 來完成,在樣本量很大的時候很有效。實際上 Python 的免費機器學習庫「scikit-learn」的 PCA 演算法的背後真正的實現就是用 SVD。

獨立成分分析(Independent components analysis,ICA)

ICA 是一種利用統計原理進行計算的方法。前面在主成分分析(PCA)時談到「降維」的方法,但對符合高斯分佈的樣本點比較有效,那麼對於其他分佈的樣本,則是適合用「主元分解」的 ICA。

ICA 會假設現有資料其實是多個彼此獨立的資料、透過混合後成為現有資料,因此期望能夠從手中的資料,回推出是哪些獨立的分配。例如 ICA 的經典問題「雞尾酒會問題」(cocktail party problem):描述給定混合信號,如何分離出雞尾酒會中同時說話的每個人的獨立信號。

▲ ICA 的經典問題「雞尾酒會問題」示意圖:目的是從混合信號 Mixture1 和 Mixture2 中恢復成每個人的獨立信號 Person1和Person2。(圖片來源:vocal.com)

 

ICA 是研究盲信號分離(blind signal separation)的一個重要方法,並且在實際中也有很多應用。

為何使用 Python 學機器學習、而不是 R 語言?

介紹完當今應用最廣泛、最熱門的幾大機器學習演算法,可以看出從數據分析、統計分析到模型驗證等等都應用在其中。

Python 可以說是簡單上手的程式語言,原本就適合作為第一個入門的程式語言,而透過如 scikit-learn 的 Python 機器學習套件,在 Python 中提供大量常見的機器學習演算法和許多實用的函式庫,亦能呈現該演算法資料輸出的型態,相當方便。

當然 Python 和 R 語言不是互斥,許多工程師也是在兩者之間切換,但是有鑑於 Python 是當今的通用語言,除了AI人工智慧領域外也可以廣泛應用在各種領域,其免費及開源的特性, 有許多支持 Python 的輔助工具、大型模組與函式庫,可以簡單上手數據分析或複雜的程式計算,以及能與幾乎所有現代作業系統兼容等的特點,讓它脫穎而出。

以投資報酬率而言,如果是要從頭開始選擇一種程式語言學習,Python 肯定是最佳的選擇。

推薦閱讀:Python vs R語言:哪個比較適合人工智慧/機器學習?

 

 

 

 

 

推薦文章:
如何使用人工智慧工具,活用 Python 簡化繁瑣的行銷工作?

Python vs R語言:哪個比較適合人工智慧/機器學習?

六個月從工地工人轉職 Java 軟體工程師,全因半年做了「對的決定」

台灣本土開發AI 發行首張音樂專輯<<武漢肺炎>>

穿戴裝置潮流正夯,人工智慧眼鏡如何改造你我世界?!(上)

拯救地球靠AI?!保護環境還比人類快?!(上)

學Python到底有什麼好?三大好處報你災!
 

輕鬆搞定機器學習-監督式學習篇(上)

輕鬆搞定機器學習-監督式學習篇(上)
輕鬆搞定機器學習-監督式學習篇(上)

搞定機器學習其實一點也不難,前提是要用對方法!(上)

隨著人工智慧的深入發展,沒有學習能力的 AI 侷限性越發明顯,為了突破這個瓶頸,「機器學習」逐漸成為 AI 領域的研究核心之一,也發展出各種機器學習的演算法。

現在有哪些熱門的算法?各有什麼特點?本次就要來盤點幾個常用的機器學習演算法,並告訴你為何機器學習語言要首選 Python

機器學習演算法大致上可以分為三類:監督式學習(Supervised learning)、非監督式學習(Unsupervised learning)與強化式學習(Reinforcement learning)。

本次將會著重介紹「監督式學習」與「非監督式學習」的演算法。

一、監督式學習

監督學習算法可以分成兩個大方向:分類和迴歸。

1. 線性迴歸(Linear Regression)

▲ 線性回歸的視覺化,平面內有一系列點,尋找出一條最能擬合資料趨勢分布的線用來預測新的資料出現的位置

 

線性回歸源自於統計學的方法,透過一個或多個自變量與因變量進行建模的回歸分析。視覺化後如上圖,平面內有一系列點,尋找出一條最能擬合資料趨勢分布的線,也可以用來預測新的資料出現的位置,就叫線性回歸。

在線性回歸中,數據使用線性預測函數來建模,並且未知的模型參數也是通過數據來估計,簡單的線性回歸公式為:

▲ 簡單的線性回歸公式

 

y 是因變量(y)對自變量(x)任何給定值的預測值;B0 是截距,即 x 為 0 時 y 的預測值;B1 是回歸係數–表示期望 y 隨著 x 的增加而改變多少;x 是自變量(期望的變量影響 y);e 是估計值的誤差,或表示回歸係數估計值有多少變化。

2. 邏輯回歸(Logistic Regression)

邏輯回歸延伸自線性回歸,是一個二元分類算法,透過選取不同的特徵與權重來對樣本進行機率分類。

邏輯回歸會使用某種函數將機率值壓縮到某一特定範圍,如 Sigmoid 函數。S 函數是一種具有 S 形曲線、用於二分類的函數。

▲ 邏輯分布函數圖像(圖片來源:Wikipedia)

 

邏輯回歸的輸出變量是離散型(Discrete),而「回歸」輸出變量為連續值。所以實際上雖然叫「邏輯回歸」,但它屬於「分類型」算法,而非「回歸型」算法。

3. 支援向量機(Support Vector Machine,SVM)

支援向量機 SVM 同樣是一個二元分類算法,它可以在 N 維空間找到一個 (N-1) 維的超平面,以使兩類數據之間的餘量最大化。這個超平面可以使兩個類別之間的邊距或距離最大化,平面內如果存在線性可分的兩類點,SVM 可以找到一條最適直線將這些點分開。

除了進行線性分類之外,SVM 還可以使用核技巧(kernal trick)進行非線性分類,將其輸入隱式對映到高維特徵空間中。

▲ 散點圖展示了線性支援向量機核函式的決策邊界(虛線)(圖片來源:Wikipedia)

 

SVM 的應用範圍很廣,如文字和超文字的分類、大規模圖像識別與分類、手寫字型的辨識等等。

4. 樸素貝葉斯分類器(Naive Bayes classifier)

「貝葉斯推斷」延伸自貝葉斯理論,是描述在擁有部分已知條件下,某事件的發生機率。

而在機器學習中,樸素貝葉斯分類器是以假設「特徵之間是獨立的、不相互影響的」的簡單機率分類器,可以直接利用條件機率相乘的方法,計算出聯合機率分布。

貝葉斯公式為:

▲ 貝葉斯公式

 

也可以表示為:

▲ 貝葉斯公式

 

posterior:通過樣本 X 得到參數 θ 的機率,稱為後驗機率。
likehood:通過參數 θ 得到樣本 X 的機率,即似然函數。通常為數據集的表現。
prior:該樣本 θ 機率,稱為先驗機率。
evidence:樣本 X 發生的機率,即為要預測的值。

即使一般現實世界的資料通常無法滿足貝葉斯理論的假設,但樸素貝葉斯分類器卻是相當實用,因其簡單高效,而辨識效能也不輸許多算法繁複的分類器。貝葉斯模型的應用範圍非常廣泛,大數據、機器學習、資料採擷、Python資料分析等領域都會見到。

5. 決策樹(Decision Tree)

決策樹最一開始是作為決策分析中的方法,指的是每個決策都可能引出複數的事件,最後通向不同結果,視覺化後的圖形很像樹的枝幹,故稱決策樹。

而在機器學習中,決策樹是一種用來處理分類問題的樹狀結構,每個內部節點表示一個評估欄位,而每個分枝代表一個可能的欄位輸出結果,每個則葉節點代表不同分類的類別標記。

▲ 決策樹演算法示意圖

 

ID3、C4.5 、C5.0、CHAID 及 CART 都是決策樹演算法的代表。

決策樹的最主要功能,是藉由分類已知的實例來建立一個樹狀結構,並從中歸納出實例裡、類別欄位與其它欄位間的隱藏規則,通常也能利用來做樣本的預測,同時決策樹產生的模型也具有易於解釋的優點哦。

本篇為上篇,下篇請點此連結

 

 

 

 

 

推薦文章:
台灣本土開發AI 發行首張音樂專輯<<武漢肺炎>>

Python vs R語言:哪個比較適合人工智慧/機器學習?

六個月從工地工人轉職 Java 軟體工程師,全因半年做了「對的決定」

如何使用人工智慧工具,活用 Python 簡化繁瑣的行銷工作?

最夯程式語言Python,你夠了解它嗎?!

為何人人都想學Python?看完這三大理由我服了!

地球的救星是AI?!保護環境效率竟比人類強!?(上)