2018-06-11

從大數據看社會影響力 - AVPN會議分享

English | 正體中文

⚠️ 警示:文章內容僅為筆者個人觀點,歡迎交流,但請勿有惡意攻擊的言論與行為.

從大學畢業後到工作,一直有在想該如何做一些對永續世界有貢獻的事情,而不是每月定期捐款、捐年菜...總覺得幫助有限,甚至不確定這些錢投入是不是真的有預期的效果...常常在思考一個切入點,如何能善用自己的工作經驗/技能,能夠帶來社會本質上的改變⁉️

因緣際會,在我思考的過程遇到了活水社投 (B Current Impact Investment)的總經理Ray,很大方的介紹我AVPN (Asian Venture Philanthropy Network)這個會議、還願意贊助我一張票讓我去新加坡參加,覺得備受命運之神眷顧 😚~ 也讓我能先到新加坡考察一下,為之後的學生生活做準備‼️

今年AVPN會議為期4天,每天都是sessions滿滿,加上身為在社企投資/影響力投資的新進者,這些議題內容實在沒辦法聽聽就消化完畢...😓 所以會議結束後,想了又想,決定來當個部落客,將這些收穫文字化,除了幫助自己內化外、也希望能和大家分享,讓這些知識散布到台灣


首先,從第一個會議主題開始:Big Data for Social Impacts⟫ 大數據看社會影響力
這算是我看到會議主題就很感興趣的一個,畢竟之前工作就是和資料分析相關,並且是從資料分析結果 來看客戶對服務/產品體驗,也是服務/產品影響力衡量的一環;這個主題,也許能幫助思考,如何將我在資料分析這塊的經驗、應用在社會影響力的領域🙂

這個會議我想可以分成兩部份分享:實際案例&應用上挑戰
實際案例分享3個我印象特別深刻的,而這3個我自己認為 各自和大數據分析過程中,數據搜集、數據遷移、與數據挖掘有關,以下就一個個說明,希望能簡單明瞭,到每個人都能了解他背後的運作方式...

Part I: 實際案例

 ➊ 中和農信在中國鄉村的應用 (數據搜集的應用):

                (picture downloaded from google)

中和農信 (CFPA Microfinance) 屬於中國扶貧基金會 (China Foundation for Poverty Alleviation, CFPA) 旗下專營微型信貸的子公司,簡單說,是中國政府支持的NGO。主要提供微型信貸給鄉村農民,因為這些鄉村農民一般來說識字率低、收入低、沒有抵押品,無法通過銀行信貸審核。中和農信透過這種做法,期望幫助農村脫離貧困,掌握經濟自主,進而讓整個經濟體能成長。

但其實這些做法和當今很夯的那些科技(行動支付、AL、ML...)並沒太大的關聯,反倒是很需要人力執行;因為鄉村農民多半是用現金、沒有複雜的金融交易,因此沒有信評歷史紀錄(簡單說,不像我們常常刷卡,透過網路就可以到聯合徵信中心上面,下載自己的信用報告,裡面就會有刷卡與還款紀錄~要是有貸款也會有紀錄喔!有興趣的人可以去下載看看😏) ,也就是說,中和農信需要設立分支駐點在不同區域,由駐點人員深入當地瞭解農民的經濟狀況,評估還款能力、或再發放信貸後,追蹤還款進度

這些做法開始科技化,是從2016年底 螞蟻金服 (Ant Financial)注資開始,而現在螞蟻金服也是中和農信的第二大股東。這一項注資行動,標示中和農信將進行轉型,透過螞蟻金服身為金融科技公司巨擘,導入其在科技基礎建設的經驗與技術,例如應用大數據分析螞蟻金服的信貸平台,預期將可使中和農信提升在農民信用評估的效率、以及結合螞蟻金服理財服務,可望將理財帶入農村 (ex: 增加農民投保率),提升農民金錢控管能力

而回到一開始提到,我認為這個case算是大數據分析中 數據搜集 (data collecting) 的應用,因為就這整個case來看,會和大數據分析有關主要是因為螞蟻金服的注資,使得螞蟻平台上大數據資料得以導入應用,但要與螞蟻數據串接,關鍵還是在農民載具使用➡︎簡單說,就是手機 (或者說行動支付 可能比較恰當)。一但行動支付能在鄉村普及,中和農信可以透過手機搜集農民貸款資訊 (貸款額度、還款記錄...),和螞蟻金服數據一起進行分析,不僅在數據搜集上比現在有效率好幾倍,在貸款信用評估過程也更精確、更能降低呆帳風險

但要做到這點想必要一番時間精力...因為就目前中國鄉村現況,多數農民對數位服務是陌生的。整體農民中僅有不到一半(記得會議好像是說40%)有手機,但有手機的這些人,活躍用戶 (active users) 也不多...上網找到2016/12月中國官方 網民比例數據,可以看出城鄉差距,而且2016較2015 城鄉差距是有些許擴大的狀況

                         (picture downloaded from CNNIC Report)

這個問題想必不易解決,因為涉及鄉村數位素養 (Digital Literacy)的普及,也就是農民能了解並使用網路資源的能力。因此,儘管有農民擁有手機,卻不是活躍用戶,因為他們不了解網路的強大、進而不會想理解如何操作。因此,在這個case中,我想大數據要進一步應用,光是在數據搜集階段,就需要投入資源,想辦法提升鄉村的數位素養

更多關於中國微型信貸發展,可參考亞洲發展銀行報告(請點我)
更多關於中國互聯網發展,可參考第39次《中国互联网络发展状况统计报告》(請點我)


➋ 肯亞Jaza Duka 微型信貸專案 (數據遷移的應用):


    (picture downloaded from google)

這個case我認為目的其實與上一個中和農信大同小異,都是透過提供微型信貸給社會弱勢,以期幫助他們經濟獨立,進而對社會經濟有貢獻。只是上個case的目標族群是中國鄉村農民,這個是針對肯亞當地商店自營者 (類似台灣早期的雜貨店),他們也是因為收入不高、沒有抵押品擔保,以致無法向銀行申請貸款;這些商店自營者,常常會有現金短缺問題 (ex:繳小孩學費),以致於沒辦法有多餘資金向製造商購買更多的商品來販售...🙁 為了幫助這些商店自營者,發揮他們應有的銷售能力,萬事達卡 (Mastercard) 聯合利華 (Unilever) 合作,試做這個專案,當地語言叫Jaza Duka,意思就是要填滿你的雜貨店~希望商店自營者們能有能力購買貨品、填滿自己的雜貨店😎

這個專案的兩大支柱是萬事達卡聯合利華萬事達卡是國際發卡組織,擁有海量刷卡資料,能夠進行信用評等分析與模型設計;聯合利華則是國際消費品公司、販賣貨品到世界各地,包括肯亞,因此擁有與肯亞這些商店自營商的進貨紀錄。這兩間公司合作,透過聯合利華的進貨資料,結合萬事達卡的信評分析,算出每位商店自營商的借貸能力、與建議的微型信貸額度,並將資料提供肯亞商業銀行 (Kenya Commercial Bank, KCB),由KCB依此核發信貸


在這個專案中,我會聚焦在大數據分析中 數據遷移的應用,主因為進貨資料和信評資料落在兩間公司各自資料庫,而這個案子聽起來是將聯合利華這邊的進貨資料拋到萬事達卡資料庫,進行資料串接,但從拋到另一個資料庫開始就會有資料傳輸安全性/隱私問題、拋過去後要怎麼串接也是問題 (i.e. 取哪個時間區間、和哪些變數一起分析...),而這些都關係到最後產出的借貸能力指數。簡單說,如果在一開始拋入資料本身就有偏差(ex: 資料都是常進貨的商家,但常進貨的在當地並不多,故資料不足以代表全體),那後端的分析結果是否可用就是問題...不過目前這個案子,網路上還沒找到後端方法論的討論,可能也是因爲還在試做階段吧...只能之後再觀察觀察了~

講到這個案子,我也想特別點出我認為和上一個case最大的不同點:數位化程度的差異
相較於前面提到,中國鄉村網路使用仍不普及,肯亞當地的數位化程度卻相對高很多‼️主要體現在行動支付的普及➡︎ M-PESA是當地常用的行動支付工具 (也是fintech常見的案例之一~可見非常成功),這是由電信商Safaricom和KCB共同發展的,當地人儘管只有低階手機,也能透過M-PESA進行查帳、匯款、繳貸款...並且從事這些金融行為時,也能累積點數使用電信服務,因此在當地已經成為人們生活的一部分

因此,以M-PESA在當地如此成功,也打下了當地資訊搜集的基礎。以目前來看,KCB在Jaza Duka中似乎僅是被動資訊接收角色,但若之後KCB能將M-PESA數據結合,感覺很有可看性🤔 (至少已經得到信貸的商店自營商會用M-PESA還款,這樣就有還款記錄可以作為信評參考)~不過,當然又回到資料要怎麼串接這個問題了...

☛ 想知道更多關於M-PESA怎麼用 請看這裡


菲律賓在天災預防/管理的方式 (數據挖掘的應用)


這個case是由菲律賓當地的發展基金會Gawad Kalinga (是”提供照護“的意思)和微軟科技合作的實例,主要防範颱風的災情。看這個案子特別有感,想到台灣也是一個天災多多的地方,而且也身受颱風侵略之苦...想到之前2009 莫XX颱風,我們全村都淹水,放眼望去一片汪洋...😰(但小林村更慘被滅村..) 2016 梅X颱風,風大到我家窗戶玻璃被震了一地,整張床上都是玻璃...😭 但在菲律賓,是整個村落都被輾過...地理位置位在熱帶環海、加上當地建設不比台灣先進,災情似乎比這裡嚴重好幾倍...

於是為了預防嚴重災情,Gawad Kalinga微軟合作,應用Microsoft Azure雲端計算平台,期望透過雲端計算,預測颱風路徑與規模,進而做到事前糧食配發、人員避難等措施,將傷害降到最低。但要做到這一點,需要當地村落的詳細資訊,包括村民戶數人數、可避難場所...,因此Gawad Kalinga志工深入當地社區進行田野考察,使用微軟APP進行資料登入,登入後資訊會上傳雲端,導入Microsoft Azure

這個case中,也有數據搜集的過程,但我會更著重他在數據挖掘的功夫上,因為就這個案子本身,重點是如何有效預測颱風路徑與規模、以及預測後快速有效的決策行動。颱風預測最困難點,在於每個颱風都不一樣,因此才會需要大數據分析;就這個case,是透過Microsoft Azure,因為累積夠多數據、透過機器學習 (Machine Learning) 技術,平台可以透過過去上千萬筆颱風路徑,找出相關性並作預測;我認為,在機器學習之前,數據挖掘決定機器學習的成果。數據挖掘是從海量資料中,挖出有相關的那個部分進行分析,簡言之,要是挖到不相關的、或沒挖到相關的,都會導致之後模型預測/演算法有偏誤 (ex: a+b+c=y, 但用a+b=y來解釋)。所以,儘管這個case本身較focus在執行面上,我會對他背後的資料處理邏輯更有興趣;另外,我想在做災害因應行動上,為了讓颱風對當地影響更貼近真實 (即讓模型更準確),當地資訊 (村落家戶分佈、家庭財產狀況...)是關鍵影響因子,故需要Gawad Kalinga深入當

最後,題外話提一下Microsoft Azure,目前微軟有在網路學習平台EdX上開相關免費課程,叫Introduction to Artificial Intelligence,裡面有介紹這個平台 (似乎含有實際操作,但我也還沒上到那邊..進度緩慢哈),以及機器學習的一些背後方法,有興趣的可以去上上看囉!

點我瞭解更多Microsoft Azure課程資訊


Part II: 應用上的挑戰
其實關於挑戰,是源自於會議中發問的問題:”隨著AI的發展,人類是否被機器人取代?“ 答案當然是NO啦~🤣 原因很簡單,而且其實前面也有多少提到➡︎如何確保搜集的資料是可用的?如何確保演算法沒有偏誤?當然都要透過人類囉‼️ 機器當然可以很快學習並應用,但若他沒有一個好的老師、好的教材,學到的東西也只是垃圾😅

就用個實例來向大家解釋,這是一個微軟和NGO寶貝回家 (Baby Come Home) 合作的案子,透過人臉辨識科技來協尋失蹤兒童

                 ⬇︎ 請看以下影片,瞭解這個案子進行方式 ⬇︎


這項人臉辨識技術在不同區域多次測試後,微軟發現測試結果存有偏差:機器對女孩臉孔的辨識能力不如男孩,並且機器辨識能力在不同區域的結果存在落差(ex: 美洲vs非洲),因此修正背後演算法勢在必行,但機器自己不會知道有這個問題存在,而是人類必須透過多次檢驗、發現問題、修正問題、重新教機器學習

因此,在這個會議的結論,是在未來機器不可能取代人類,相反的,更多的資料解讀者 (data translator) 是需要的。什麼是資料解讀者?簡單說,就是一個領域的專家、知道搜集哪些資料來用,舉例來說:在菲律賓防颱的案例中,Gawad Kalinga就是這樣角色,因為Gawad Kalinga瞭解當地社區的狀況,也有颱風防範的經驗,因此能知道若要有效防颱,哪些當地資料需要搜集,才能快速避難並進行物資分配


References:
CFPA Microfinance Received Strategic Investment from Three Investors to Help Accelerate Technology Adoption to Enhance Efficiency of Financial Inclusion and Fight Against Poverty
➤ Mastercard & Unilever launch Jaza Duka, inventory-backed loans to empower micro entrepreneurs in Africa
➤ Mastercard and Unilever Break Down Barriers to Growth for Micro Entrepreneurs with First-of-its-Kind Digital Lending Platform
➤ Mapping hope: how community data is driving cloud-based disaster management in the Philippines

No comments:

Post a Comment