【大數據的死角?】
聞說各方利用大數據去分析香港人大多數在區議會投票的取向和預測結果。我沒有什麼消息或數據在手,但簡單看到很多不確定的人為因素可能沒有計算在內而導致某些方面預測嚴重失準。
沒有準確的數據說明在各大社交網絡的水軍有多大,但不少是設定為香港為家,這些賬號可能有數十萬計並不斷在各大社交媒體支持政府和各大親政府的團體的行動和宣傳,他們愛國愛港行為不容置疑並得到一定人士的認同。不過他們在網絡的行為就有可能誤導了大數據的分析。這些賬號支持政府的一舉一動如分享支持政府警察等言論都可能被加入到大數據分析中,那麼這些賬號在社交網絡的一舉一動就可能視為香港一般市民的取向。出於愛國愛港的行為,但影響到數據的分析並達到事實期望的另一面就值得商榷。在這情況下分析人員就沒有可能掌握真實的數據而導致做出失誤的決定。這些賬號的言行在社交網絡可能有平行或制衡反政府的言論並有宣示立威的感覺,但這些言論應該沒有能力去改變有投票權的香港人的想法並有可能把對方推向更遠的方向。還有一些人是根本懶得和這些水軍賬號的人理論並沒有多發出言論。在這個社交網絡現象中如果沒有方法把這些賬號的數據分開,那麼在大數據分析時候就可能顯示有較多於真實數目的支持政府人士並預測對他們有利的政治取向。
很多社交網絡用戶是一些被動用戶,這些賬號的擁有人可能傾向旁觀並沒有多舉動連按贊也沒有,但這些賬號擁有人一直在觀看帖文等資訊並已經有其政治鮮明取向和想法,分析數據時候這些賬號也可能被忽略。另外不少人士不會或少有連線上網,這些人士的取向也不能在大數據中顯現和預測。沒有投票資格的 新移民和沒有登記做選民的社交網絡用戶支持政府的一舉一動也收錄在大數據中也會影響其分析。
各單位有其對香港的工作和功能,不同單位可能沒有全盤對社會情況的了解或一知半解,不同單位作出的行為亦可能另其它單位的工作事倍工半。
選舉完畢各方的角力進入另一新階段。期望和平理性能把事情解決並把應該受法律制裁的人制裁。
AY 20191126