Re: [討論] 2023 NBA歷史百大球員排行 - 看板 NBA

看板NBA

作者Dickys200092 (Dickys)

標題Re: [討論] 2023 NBA歷史百大球員排行

時間2023-07-14 22:53:39

假設想要設計一個好的模型應該是：找到你的Y，Y應該是「球員排名」換言之沒有先透過一個大規模問卷或是多個問卷進行meta analysis的話很難有一個有統計意義的公式接下來要找到一堆x 這部分我覺得原PO的設計概念就會有很大幫助不過要靠觀球的經驗法則做一個Empirical model太難了我想用簡單的logit（實際分析可以order logit）下面用原本的公式當作X假想實驗 ※ 引述《kuiyy (kuiyy)》之銘言： : 請注意，本排名僅為實驗性質，嘗試以單一公式量化球員生涯成就，並不一定真實反應 : 球員歷史地位與排名。 : 本年度公式異動幅度較大，變更及說明部分以綠色標示。 : 主要變更： MVP直接設定成「有無MVP」為一個dummy variable 再設定一個「MVP數量」然後放一個交互項「有無MVP*MVP數量」如果這邊觀察不到顯著效果有可能是「有沒有連拿兩次」這個因子也可以設定為一個dummy variabe : 1.雙MVP積分降回前年標準：MVP調整至40，FMVP調整至28，去年調升主要是為提高 : 冠軍成就比例，但因比例問題同步提高MVP積分導致收效甚微，且冠軍成就過分獨尊 : FMVP之問題依然未解決，今年將雙MVP積分降回，改以其他方式(下列2)改善。數據部分我想拆分成季賽、季後賽兩項基本上就能觀測且解決原文的一些權重問題 : 2.新增主力冠軍貢獻積分：以奪冠隊伍整體季後賽Win Shares為基準， : 第一名10分、第二名6分、第三名3分，詳細積分列表中以W1、2、3標註。 : 變更後總冠軍成就除FMVP外增加第二切入點，冠軍賽季Win Shares排名，如為毫無 : 爭議的球隊第一人可獲得FMVP(28)+W1(10)合計38分，以常見爭議的2015賽季為例， : 原本只有小AI獲得FMVP(35)，新版小AI獲得FMVP(28)+W3(3)，Curry也得到W1(10)， : 一定程度修正FMVP如含金量不足所造成的積分不公平問題，對球隊奪冠有重大貢獻的 : 二、三號球員也能獲得更多積分，而非獨尊FMVP一人。 : 再舉例2008賽爾提克，原本除基本總冠軍積分之外，只有PP拿到FMVP(35)， : 而新制：PP FMVP(28)+W3(3)，KG W1(10)，雷槍W2(6)，應較舊制合理。 : 修正過後冠軍隊伍主力排名上升，只有年度MVP而無冠軍的球員積分下滑較為明顯。 : 新增主力冠軍貢獻積分後，FMVP比重稀釋，相對適合跨時代比較。 : 本年度排名漲跌是與2022年調整後數據相較，2022年新版排名附於文後。 : 排名積分分為三大部分：1.冠軍成就 2.賽季榮譽 3.生涯累積我覺得這部設計是我最看不太懂根據的透過回歸設計直接控制「冠軍有無」、「冠軍有無*季後賽數據」的交互項跑出來看共變量就一翻兩瞪眼知道哪些因子重要 : 1.冠軍成就： : 　　　總冠軍積分：該季季後賽PER*出賽時間/48*出賽比例 : 　　分區冠軍積分：該季季後賽PER*出賽時間/48*出賽比例/4 : 主力冠軍貢獻積分：該季季後賽WS 第一名：10 第二名：6 第三名3 (本年度新增) : 　　　　FMVP積分：28(年度MVP7成) (舊版35) : 　　CFMVP積分：7(FMVP 1/4) : 冠軍成就積分以年度MVP為比較基礎，以盡量符合多種主流價值觀的方式，為冠軍成就 : 積分提供一定程度的比較基礎。 : 率隊奪冠高於年度MVP：此處以相關冠軍積分加FMVP約60分的方式，高於年度MVP40分 : 年度MVP高於FMVP：年度MVP40分高於FMVP28分 : 冠軍為團隊榮譽：以效率值乘上上場時間及出賽比例，使所有有做出貢獻的球員 : 都能以相同標準獲取相對應的積分。 : 2.賽季榮譽： : 年度MVP積分 MVP：40 第二名：10 第三名：5 (舊版MVP50) : 年度最佳陣容積分一陣：10 二陣：6 三陣：3 : 　 DPOY積分：3 : 最佳防守陣容積分一陣：1 二陣：0.5 : 單項數據王積分得分：1 籃板：0.5 助攻：0.5 抄截：0.5 阻攻：0.5 : 明星賽積分：3 : 例行賽榮譽以MVP、年度陣容及明星賽為主，防守陣容及單項數據王僅為加分項目。 : 年度MVP前三名及年度陣容、明星賽皆為攻防兩端數據及戰績全面考量之榮譽，本身已 : 包含防守及單項表現，為避免防守陣容及單項數據王相對不合理的重複獎勵，是以整體 : 考量的榮譽為主，此舉並非認為防守成就或單項數據王不重要，請理解知悉。 : 3.生涯累積： : 例行賽PER積分：例行賽PER*出賽時間/48*出賽數/500 : 季後賽PER積分：季後賽PER*出賽時間/48*出賽數/250 : 例行賽WS積分：例行賽Win Shares/4 : 季後賽WS積分：季後賽Win Shares/2 : 生涯累積以Win Shares為基準，PER積分加權至與Win Shares積分相當。 : 設計方式以賽季榮譽為基礎，訂好各榮譽積分後，再調整冠軍成就及生涯累積之比例， : 使三項積分之間比例盡量趨於合理。 : 新版 : 冠軍成就賽季榮譽生涯累積總分 : 平均值：65.8(25.3%) 117.6(45.3%) 76.4(29.4%) 259.8 : 中位數：48.2 81.3 71.5 194.3 : 舊版 : 冠軍成就賽季榮譽生涯累積總分 : 平均值：56.6(22.0%) 123.5(48.1%) 76.2(29.7%) 256.9 : 中位數：37.9 83.3 71.5 192.2 : 聯盟早期無FMVP或年度陣容第三陣等榮譽，視作彌補早期規模較小，總冠軍及其他榮譽 : 取得較為容易之自然平衡機制，不強行做調整。 : 本表包含ABA數據，但以NBA為主，僅列生涯一半以上在NBA出賽之球員，考量規模，積分 : 折半計算，並以季後賽MVP代替FMVP，不計算分區冠軍積分(因比同期NBA少打一輪)。 : 極少數BAA(NBA前身)缺失數據以該球員生涯平均值代替，考量數據缺失時期多為球員巔 : 峰，以平均值代替僅為一定程度彌補，不至於虛高，雖有失真之慮，但仍較欠缺為佳。 : 本表包含MVP Shares排名前百大、年度陣容次數前百大、明星賽次數前百大、例行賽、 : 季後賽Win Shares前百大，3冠以上球員，扣除重複約270名球員加入評比。 : 除了數據面控制外，把薪資也納入控制因子應該也會更準確總而言之，先以投票結果導出一個模型爾後再進行微調，當然模型選擇也需要很多驗證以目前的資料量跟一堆不同人的百大排名應該有不少公司有一套機器學習下的模型 ESPN那套勝率預測應該也是這個設計脈絡（？所以說要直接捏出一個歷史排名公式幾乎辦不到提出一套研究設計分享一下最近沒空玩資料整理資料如果剛好手頭有資料整理好的人我試想可以用ologit(stata)跑跑看歷史排名每升一名那些因子會有什麼變化 -- ※ 發信站: 批踢踢實業坊(www.ptt-club.com.tw), 來自: 49.216.20.28 (臺灣) ※ 文章網址: https://www.ptt-club.com.tw/NBA/M.1689346421.A.512

→ cross980115 : MVP直接有無就是2019最初的版本… 07/14 23:00

→ cross980115 : 後續才追加第二第三的積分 07/14 23:00

推 alex8725 : 你要看歷史排名升一名對變量的影響不是order regr 07/14 23:01

→ alex8725 : ession…. 07/14 23:01

→ cross980115 : 薪資就更無關了直接受到簽約年份的上限影響 07/14 23:01

推 Merzario: 身邊有朋友被包養嗎 07/14 23:01

→ cross980115 : 除了MJ搞超越限制以外…07/14 23:01

推 alex8725 : 但其實我覺得這方法還是比原本那個好原本那個充滿07/14 23:03

→ alex8725 : 一堆主觀偏見當然你這樣做的問題是肯定還有其他你07/14 23:03

→ alex8725 : 沒分析到的因子會成為你的殘差07/14 23:03

→ cross980115 : 老巴就開玩笑過要跟自己老媽說為什麼不晚幾年生07/14 23:04

推 Muzaffer: 亞洲最大包養平台上線了07/14 23:04

→ cross980115 : 我，也說過羅素爺跟賈霸都比自己強但自己拿的薪資 07/14 23:04

→ cross980115 : 更多 07/14 23:04

推 f77928 : 數學本身是科學的但公式制定的權重就充滿私貨如果 07/14 23:12

→ f77928 : 你認為的歷史百大重視攻守俱佳只要把防守獎項相關 07/14 23:12

→ f77928 : 配比提高就能輕易得出賈霸才是歷史第二的結果 07/14 23:13

推 MIJice: 這個包養網正妹好多是真的嗎 07/14 23:13

推 emptie : 我覺得是這樣的，榮譽這東西讓人著迷，可是多得是在 07/14 23:14

→ emptie : 場貢獻不低但卻拿不到冠軍的球員 07/14 23:14

→ emptie : 所以我覺得明星賽、MVP、FMVP這些獎項第一名給的太 07/14 23:15

→ emptie : 多，二三名太少 07/14 23:15

推 cross980115 : 因為MVP就是個有跟沒有差很多的東西做為球員個人 07/14 23:19

推 SpyTime: 真的有這麼多人在找包養嗎 07/14 23:19

→ cross980115 : 的最大獎項/最高榮譽，它就值特別高分啊 07/14 23:19

→ cross980115 : 假設A只強一年拿了MVP，B只有多年MVP前五，有實際 07/14 23:19

→ cross980115 : 拿到大獎成就高分的當然還是前者，但B的強度會反映 07/14 23:19

→ cross980115 : 在其他一陣、明星賽上，這部分的積分也足以讓最終 07/14 23:19

→ cross980115 : 評價不輸A 07/14 23:19

推 Toth: 有人可以分析一下包養平台的差異嗎 07/14 23:19

推 axlu : 你的正確的Y在哪 07/14 23:31

→ Dickys200092: 球員排名啊，用其他排名來做模型再寫出關係式 07/14 23:36

→ Nuey : 每個人看法不同不要自己主觀假裝成大多數客觀就好 07/14 23:37

推 ruokcnn : 全部變數整一整丟xgboost就好了啦 07/15 00:15

推 a78998042a : 問卷定Y根本不可靠，當地人支持當地球星；外國人支 07/15 00:28

推 Asterix: 那個包養網人最多XD 07/15 00:28

→ a78998042a : 持大城市球星。何況大多數人10個就列不出來了，11~ 07/15 00:29

→ a78998042a : 100全是印象派，估計每次填出來答案都不同；有人 07/15 00:29

→ a78998042a : NBA只看10年，有的人10年前開始不看，這問卷做出來 07/15 00:30

→ a78998042a : 的結果一定要再戰一輪。 07/15 00:30

推 inuyaksa : 每年都在吵裁判吵投票吵對手強弱吵傷兵吵組大團，然 07/15 00:30

推 AdamShi: 我妹上包養網被我發現= = 07/15 00:30

→ inuyaksa : 後現在又要無視這些直接套公式排名，這麼多不公平不 07/15 00:30

→ inuyaksa : 客觀的因素在那邊還討論的跟真的一樣，我覺得隨便排 07/15 00:30

→ inuyaksa : 排自爽就好了啦 07/15 00:30

→ a78998042a : 何況每年的全明星結果，就可以當成問卷結果，倒不如 07/15 00:31

→ a78998042a : 研究怎樣做一個時間維度的meta-analysis 07/15 00:31

推 lezabo: 隔壁桌的人竟然在討論包養... 07/15 00:31

推 jay228 : 之前就說過年度隊跟MVP拿投票分數來分配還比較準 07/15 00:52

→ jay228 : 不過原PO大概是懶得弄也只有BR的免費數據不然什 07/15 00:52

→ jay228 : 麼年代了還在用PER 07/15 00:52

推 kaga1991 : 但mvp投票也是會有m.jackson亂投這種即便次數不 07/15 01:11

→ kaga1991 : 高但就還是略有影響 07/15 01:11

推 silberger: 樓上是不是被包養 07/15 01:11

→ kashi29 : garbage in garbage out 都知道獎項是人治比較多了 07/15 01:19

→ kashi29 : 那這樣再怎麼分析都很難球員真正的地位在哪 07/15 01:19

推 Childishan : 廢話真正的地位當然是在你心中 07/15 14:43

→ Childishan : 不然即時公信力足夠只 07/15 14:43

→ Childishan : 要不是你喜歡的名字你就 07/15 14:44

推 xayile: 未看先猜這包養網 07/15 14:44

→ Childishan : 是會為反而反阿 07/15 14:44

→ Childishan : *即使 07/15 14:44

→ LearnLong : 「大規模問卷」也會有一樣的問題，抽樣的州比例、 07/16 04:01

→ LearnLong : 年齡、人種、國籍……等等就變成循環論證了 07/16 04:02