Re: [討論] 2023 NBA歷史百大球員排行 - 看板 NBA

看板NBA

作者LearnLong (學長)

標題Re: [討論] 2023 NBA歷史百大球員排行

時間2023-07-16 19:28:30

我不是統計專業，好奇發問 : 假設想要設計一個好的模型應該是： : 找到你的Y，Y應該是「球員排名」 : 換言之沒有先透過一個大規模問卷 : 或是多個問卷進行meta analysis的話做統計問卷會遇到一樣的問題，你抽樣的群眾數量中太多X因數比方美國的州人數、年紀、種族、國籍……等等感覺又繞回到一樣的困境 : 很難有一個有統計意義的公式 : 接下來要找到一堆x : 這部分我覺得原PO的設計概念就會有很大幫助 : 不過要靠觀球的經驗法則做一個Empirical model太難了 : 我想用簡單的logit（實際分析可以order logit） : 下面用原本的公式當作X假想實驗所以我的想法是繞開這些問題如果我做一個網頁，在數據庫裡面先存放200個可能的歷史百大球員的數據 (透過累計權威媒體的名單，或是類似原原Po之類的公式，反正我只要大約的前200球員的名單，不必"正確") 每次點進去，就出現兩個人的比較數據重點是不亮名，即參與投票的使用者不知道這兩球員是誰 (個別巨星球員可能容易被猜出來，但是大多數一般用戶應該不會去記) -- 下面舉個栗子(因BBS不好排版我只放常規賽) A球員首發時間投籃命中出手三分命中 350 25.4 44.70% 4.3 9.7 36.90% 1.4 命中出手籃板前場後場 3.2 3.9 3.5 0.6 2.8 搶斷蓋帽失誤犯規得分勝負 1.3 0.3 2 2.1 13.3 762 295 特殊榮譽 4次總冠軍、2次全明星替補、1次最佳第6人、 1次最佳新秀第二隊、2次最佳陣容第三隊 B球員首發時間投籃命中出手三分命中 1150 35.6 45.20% 6.6 14.6 40.00% 2.3 罰球命中出手籃板前場後場 89.40% 3.4 3.8 4.1 0.9 3.1 搶斷蓋帽失誤犯規得分勝負 1.1 0.2 2.1 2.2 18.9 755 545 特殊榮譽 2次總冠軍、10次全明星替補、 1次最佳新秀第二隊、1次最佳陣容第二隊、1次最佳陣容第三隊 -- 使用者只要點選告訴我「你認為百大球星排名哪一位要更靠前」點選之後就跳出下一題(另外兩個隨機球星) 這樣經過大量的捉對比較，我想應該會有一種統計學方式可以排出百大球星 (如開頭，我不是統計學專業，但是我想應該會有) -- 技術上來說一點都不難，寫個爬蟲就可以解決大部份問題我上面只是臨時去阿陸仔網站複製一下而已如果真的要做，列出來的數據只要不會嚴重暴露球員身份的都會顯示(如單場最高) 使用者愛看就看，挑自己覺得重要的看也可以。而且排名也可以實時更動，只是版友們最關心的歷史前二可能還是沒辦法解決，因為那兩人的數據太顯眼了，可能在過程中很容易被看出來。不知道如果用這種方式做出來的排名，各位認為的可信度高不高。 P.S 栗子中，球員A是Manu Ginobili，球員B是Ray Allen P.S 再次強調，我栗子只是為了說明概念，沒有季後賽以及各式進階數據，勿責怪 -- ※ 發信站: 批踢踢實業坊(www.ptt-club.com.tw), 來自: 210.66.129.109 (臺灣) ※ 文章網址: https://www.ptt-club.com.tw/NBA/M.1689506915.A.71D

→ cross980115 : 有很大的可能會刻意被刷 07/16 19:34

→ cross980115 : 然後會出現除了特定支持的對象跟厭惡的對象以外 07/16 19:34

→ cross980115 : 其他被亂按的情況 07/16 19:34

推 crazykid : 中間段還可以前面的會被惡搞 07/16 19:35

推 Blackie9211 : 但如果有放累積數據其實很容易知道是誰吧？ 07/16 19:35

推 glenber: 亞洲最大包養網上線啦 07/16 19:35

→ Blackie9211 : 有些球星你一看數據就認得出來了 07/16 19:36

→ cross980115 : 除了特定好記的一些超級巨星以外其他能第一印象反 07/16 19:37

→ cross980115 : 應出來的可能不會那麼多，但出現刷分現象就會失真 07/16 19:38

→ cross980115 : ，還是必然出現刷分現象 07/16 19:38

→ VL1003 : 吵排名都是吵前面的，數據其實很好比出來。 07/16 19:38

推 Kimbel: 我哥上包養網被我抓包.. 07/16 19:38

→ bnn : 有些知名數據會被認出來而獲得"這我認得"投票 07/16 19:39

噓 timgjh : 搶斷蓋帽不能修一下嗎 07/16 19:44

推 e8e88 : 認真說，數據只能參考，仔細比賽才能看出真實實力 07/16 19:46

→ e8e88 : *仔細看 07/16 19:46

推 phoenix286 : 捉對比較的話要放多少數據？平均？累積？進階？ 07/16 19:48

推 tale1890: 有人包養過洋鬼子嗎 07/16 19:48

→ phoenix286 : 太難了數據面向太多很難概括球員不如給人名就好 07/16 19:48

推 youga : 沒有辦法放全部數據阿數據百百種是要放哪些 07/16 19:52

推 orthogonal : 如果要避開記數據還可以直接每個單項都只顯示兩個 07/16 19:57

→ orthogonal : 球員的數據差缺點是這樣資訊又更少一點 07/16 19:57

→ orthogonal : 這種可以用機器學習的方式解決先設定一個比較榮譽 07/16 19:58

推 waterway: 有錢人為啥都想包養 07/16 19:58

→ orthogonal : 的模型(簡單例：a*總冠軍+b*MVP+c*FMVP)，然後讓 07/16 19:59

→ orthogonal : 大家用這種方式去選，跑學習演算法去決定最切合大家 07/16 19:59

→ orthogonal : 選擇的係數(上例的a,b,c)，之後依照係數做排名 07/16 20:00

→ orthogonal : 剛又想到一個避免記數據的方式：各項數據的對比不顯 07/16 20:01

→ orthogonal : 示數字而是顯示兩者對比的長條圖(不給刻度) 07/16 20:02

推 mark1888: 有人被洋鬼子包養過嗎 07/16 20:02

→ orthogonal : 這樣避免記數據的同時還讓比較更加直觀 07/16 20:02

推 kuiyy : 這樣不同時代的資訊差怎麼辦？ A球員6冠 B球員11冠 07/16 20:04

→ kuiyy : 但是B球員的冠軍只要打兩輪 07/16 20:04

推 kalarotia : 然後就被機器人刷到爆開 07/16 20:09

推 Lebrono : 用虛構的球員數據跟榮譽去跑重要性好像不錯 07/16 20:12

推 Quaranta: 到底要多有錢才會想包養 07/16 20:12

→ asn789451 : 扣分有沒有考慮進去比如說高排名被低排名的長年奪 07/16 20:53

→ asn789451 : 冠 07/16 20:53

→ ISRC : 這樣龜龜會第幾名 07/16 22:41

推 kshs065 : 但每個時代的數據不是等值的 2000年初球隊總分才90 07/17 09:47