李宗穎
民報2017年6月11日 上午 11:00
大數據和滷肉飯更多
最近很熱門的話題之一:中國在談大數據,台灣在談滷肉飯。大數據(Big Data)最近幾年開始在台灣流行,政論名嘴動不動就說根據大數據分析,如何如何;包括金融業在內的產業也號稱用大數據分析,結果如何如何。
實際上在歐美很早就應用大數據,歐美比較科學,講究實證主義,讓數據說話。
而近年來網路發達,網路上的數據也愈來愈多。
歐美重視名符其實的大數據
十幾年前在亞馬遜網站(Amazon.com)購物時,常常會在螢幕上跳出建議,其他買這本書的人也買這些書。國際大銀行如花旗(Citi)或大通(J.P. Morgan Chase)很早就充分使用客戶資料去分析、建置統計模型,並應用在實務上。這些大銀行在消費金融擁有大量客戶,約兩、三千萬人,名符其實的大數據(Big Data),仔細分析可以獲得非常寶貴的資訊。
歐美先進國家重視基礎建設,在使用資料前,會先做前置作業,設定標準,清理資料,確認、維持資料品質。就像煮菜前會先清洗乾淨一樣,再存放在資料倉儲(data warehouse),供未來提取、分析及應用。
中國是個歷史悠久的泱泱大國,和其他歷史悠久的泱泱大國(如伊朗、前波斯帝國,前鄂圖曼土耳其帝國,巴比倫帝國,羅馬帝國,波本王朝,哈伯斯堡王朝等)類似,背負著歷史的包袱,有點自卑和自大,領導人三不五時想要回復以往帝國榮耀。但是想要循著自由化、民主化的西方發展模式來超英趕美似乎遙不可及,於是抄襲、造假、吹噓、畫大餅的招式層出不窮。好大喜功的中國習近平自然不例外,他提出的一帶一路和亞投行,倡導自由貿易,也想在美國退出巴黎氣候協定後領導減碳。另外還不管國際秩序,在南中國海建立人造島軍事基地、霸佔公海航道。
中國問題,不在大小而在真假
中國不是一個可以說實話的國家,專制獨裁的結果,大部分人為了生存,會揣測上面要甚麼,而不是實際上是甚麼。因為沒有權力分立、相互制衡的概念,有權者不會受到約束,可以為所欲為,官大學問大的結果就是不尊重專業,一切政治掛帥。專制獨裁在決策過程會比較快,有的人喜歡這種效率,但是結果是很多面向沒有考慮到,整個計畫欠缺周詳,因為沒有人敢挑戰獨裁者的提案,也不敢逆向思考。造假不會被譴責,只要政治正確,其他都是次要。中國在美國掛牌上市的公司,包括阿里巴巴,無一例外都被爆料財報造假。中國提供的官方數據也備受國際質疑,購物網站賣的東西至少六、七成是膺品,也覺得理所當然。
批評台灣在談滷肉飯,中國在講大數據的人,可能也是出於善意。首先,台灣要承認自己不是歷史悠久的泱泱大國,也沒有類似中國的包袱。過去一二十年來的自由化、民主化,慢慢走向開放的市場經濟,離開政府主導的計劃經濟。中國雖然加入世界貿易組織(WTO)已經超過十五年,基本上還是計畫經濟,離自由的市場經濟還有一段距離,光看它管制外匯就知道。中國的問題不在大或小,而在真或假。虛假的數據只會誤導投資者、消費者大眾,數據愈大愈嚴重。
其實去年新政府上台後,討論開放美豬進口時,就有人提出數據說明台灣人食用豬肉數量遠大於牛肉,特別是滷肉飯,所以開放美豬後果比開放美牛嚴重,代表台灣已經在用大數據了。何況在台灣吃真實、香噴噴的滷肉飯,也遠比虛假的中國大數據幸福多了。
專欄屬作者個人意見,文責歸屬作者,本報提供意見交流平台,不代表本報立場。
歐美重視名符其實的大數據
十幾年前在亞馬遜網站(Amazon.com)購物時,常常會在螢幕上跳出建議,其他買這本書的人也買這些書。國際大銀行如花旗(Citi)或大通(J.P. Morgan Chase)很早就充分使用客戶資料去分析、建置統計模型,並應用在實務上。這些大銀行在消費金融擁有大量客戶,約兩、三千萬人,名符其實的大數據(Big Data),仔細分析可以獲得非常寶貴的資訊。
歐美先進國家重視基礎建設,在使用資料前,會先做前置作業,設定標準,清理資料,確認、維持資料品質。就像煮菜前會先清洗乾淨一樣,再存放在資料倉儲(data warehouse),供未來提取、分析及應用。
中國是個歷史悠久的泱泱大國,和其他歷史悠久的泱泱大國(如伊朗、前波斯帝國,前鄂圖曼土耳其帝國,巴比倫帝國,羅馬帝國,波本王朝,哈伯斯堡王朝等)類似,背負著歷史的包袱,有點自卑和自大,領導人三不五時想要回復以往帝國榮耀。但是想要循著自由化、民主化的西方發展模式來超英趕美似乎遙不可及,於是抄襲、造假、吹噓、畫大餅的招式層出不窮。好大喜功的中國習近平自然不例外,他提出的一帶一路和亞投行,倡導自由貿易,也想在美國退出巴黎氣候協定後領導減碳。另外還不管國際秩序,在南中國海建立人造島軍事基地、霸佔公海航道。
中國問題,不在大小而在真假
中國不是一個可以說實話的國家,專制獨裁的結果,大部分人為了生存,會揣測上面要甚麼,而不是實際上是甚麼。因為沒有權力分立、相互制衡的概念,有權者不會受到約束,可以為所欲為,官大學問大的結果就是不尊重專業,一切政治掛帥。專制獨裁在決策過程會比較快,有的人喜歡這種效率,但是結果是很多面向沒有考慮到,整個計畫欠缺周詳,因為沒有人敢挑戰獨裁者的提案,也不敢逆向思考。造假不會被譴責,只要政治正確,其他都是次要。中國在美國掛牌上市的公司,包括阿里巴巴,無一例外都被爆料財報造假。中國提供的官方數據也備受國際質疑,購物網站賣的東西至少六、七成是膺品,也覺得理所當然。
批評台灣在談滷肉飯,中國在講大數據的人,可能也是出於善意。首先,台灣要承認自己不是歷史悠久的泱泱大國,也沒有類似中國的包袱。過去一二十年來的自由化、民主化,慢慢走向開放的市場經濟,離開政府主導的計劃經濟。中國雖然加入世界貿易組織(WTO)已經超過十五年,基本上還是計畫經濟,離自由的市場經濟還有一段距離,光看它管制外匯就知道。中國的問題不在大或小,而在真或假。虛假的數據只會誤導投資者、消費者大眾,數據愈大愈嚴重。
其實去年新政府上台後,討論開放美豬進口時,就有人提出數據說明台灣人食用豬肉數量遠大於牛肉,特別是滷肉飯,所以開放美豬後果比開放美牛嚴重,代表台灣已經在用大數據了。何況在台灣吃真實、香噴噴的滷肉飯,也遠比虛假的中國大數據幸福多了。
專欄屬作者個人意見,文責歸屬作者,本報提供意見交流平台,不代表本報立場。
沒有留言:
張貼留言