複雜性


「低估」

好多人都低估咗數據分析嘅複雜性!複雜嘅原因未必係因為你有好多數據,而係究竟知唔知道點解要收集數據同收集返嚟之後究竟點樣去用。雖然話數據科學家係要係海量嘅數據入面搵一啲有用嘅訊息,但係決定性係在於當初啲數據係點樣收集返嚟。如果一開始啲數據就已經係錯甚至乎唔知點解要收集嘅話,其實都唔需要分析都知道最後都係會得個吉,浪費時間。

「決定」

好多人開口埋口都掛住大數據係嘴邊,但係實質上真係有幾多公司會投放資源同人材去做好件事?好多時佢哋所謂嘅大數據根本同就稱不上大數據,因為只係數據多咗少少同有好多唔同嘅系統收集不同嘅數據而已。到最後決定性其實係在於點樣用數據,整個過程唔係有數據就得,係要有一個周詳嘅計劃同設計。當然最大問題就係執行性,想做又唔去做,最終未又係一樣?

「源頭」

當你越做得耐數據分析嘅時候就會開始發現,重點未必係數據本身而係整個流程。唔係單單話有好過無,就算有又未必有用,所以而家反而著重整個流程多個分析出嚟嘅結果。數據嘅源頭好緊要,就好似一條河流咁,如果上游被污染嘅話,下游點樣搞都無用。所以有時都真係好怕啲報導話啲公司用大數據去搵商機,因為好多時都真係一知半解。


Also published on Medium.