一個公平公開的明星榜出爐,用維基百科數據解密最紅明星 theAnswr x Kollogy
老實說,我們研究數據這麼多年,一直都希望能夠建立一個透明度高,又有公信力的演算方法。即因如此,我們和車品覺一起嘗試一個新項目,嘗試利用維基百科的數據,建立一個華人名人排名的算法,希望可以研究出一個華人影響力的指數(Historical Popularity Index)。我們也是3月尾推出「擇星榜1.0」www.kollogy.com,很多數據和算法還在調整中,歡迎大家試用和討論,讓我們不斷改進,一起合力建立一些客觀的算法,把大數據更生活化。 用維基百科數據「摘星」 (車品覺) | StartUp Beat 原文:http://startupbeat.hkej.com/?p=101160 美國《時代》周刊每年公布世界上最具影響力的100名公眾人物「時代百大人物」(TIME 100)。 在互聯網數據產業並未發達的年代,評選模式多採用讀者投票方式進行,或者由幾個德高望重的評委決定一切。隨着技術不斷進步,通過數據採集來建立模型解決問題的方式逐漸被大眾認可,例如谷歌的成名作Page Rank、Netflix劇集的人氣排行榜,都已成為人們生活一部分。 筆者在2020年身處香港疫情期間,除了完成拙作《數循環》之外,因為受到巴拉巴西(Albert-László Barabási)著作《成功竟然有公式:大數據科學揭露成功的秘訣》(The Formula: The Universal Laws of Success)的啟發,一鼓作氣也完成了一個比較科學化的演算項目。 巴拉巴西認為人的能力雖是有限,但成功可以無限;成功的定義更多來自社會對你的認同,尤其是進入二十一世紀之後,網絡影響力已經成為了成功的重要因素。作為教授,他的學生身體力行,研究出利用維基百科的數據,建立一個為名人排名的算法。筆者受到以上的啟發,希望做一個更聚焦於華人影響力的指數(Historical Popularity Index)。