題:
為什麼FIDE仍然使用Elo?
Eve Freeman
2012-05-13 03:34:38 UTC
view on stackexchange narkive permalink

Glicko評分系統的工作方式給我留下了深刻的印象。特別是:

  • 最近玩的更多遊戲會導致您的評分穩定
  • 最近玩的遊戲較少會導致您的評分波動,直到您獲得了幾場最近的比賽

幾年前,USCF對其係統進行了修改,使其具有相似性(在這種情況下,可以通過滑動標度來放大或抑制給定比賽的收視率變化),現在Glickman(Glicko的發明者)在USCF的評級委員會上,我想他們最終會採用一個更加靈活的系統,就像他的系統一樣。

是有原因的(除了抗拒變化之外,或者他們只是沒有而已)尚未解決)FIDE是否未採用更準確的評分系統?

二 答案:
Tony Ennis
2012-05-13 05:41:39 UTC
view on stackexchange narkive permalink

尚未證明Glicko更準確。 Glicko只是以不同的方式,以不同的重點來解決問題。考慮所有這些系統將一個人的思想抽象為一個4位數的數字。

評級中有很多政治因素;這是一個敏感的話題。如果FIDE採納它,他們將產生一個新的前100名名單,許多總經理可能會感到不高興。

ELO系統非常易於理解;透明度很重要。更複雜的系統具有直接的缺點。

+1,儘管我不同意第一段,但其餘部分確實足夠。 1)事實證明,格里科(Glicko)平均更準確(根據能夠預測誰將贏得給定比賽的頻率來衡量)。 2)關於將人的思維抽象為數字,實際上並非如此。這是一項技能的度量,因此您可以在比較技能水平時計算出概率(贏/輸/輸)。這一切都得到了數學和統計學的支持。在Glicko-2中,對於那些玩法不一致的玩家(甚至讓他們的評分波動更大),甚至還有一個新的波動性因素。
有趣。但是,我肯定“平均水平更好”不一定是“更好”。如果時間不准確會造成實際傷害怎麼辦?不過,我會繼續閱讀。
HTTP://恩.Wikipedia.org/wiki/G立場KO_rating_system
這是有益的。 http://www.chess.com/article/view/chess-ratings---how-they-work
Ray
2012-05-14 22:29:44 UTC
view on stackexchange narkive permalink

據我了解,格里科(Glicko)評分系統將可靠性分數添加到評分數字中,這可能會為評分分數調整計算提供更高的公平性。顯然,這可能會導致錯誤的假設,即在玩已評級的遊戲與最終的玩法強度之間存在相關性(因為不玩會降低可靠性得分,從而以某種方式貶低您的評級數值)。儘管我必須承認我不是系統的精妙之處,但我還是看到許多與可靠性評分有關的問題。只需選擇三個即可:

  • 僅玩評級較低的遊戲的玩家可能再也不會收到邀請。假設您是一位邀請迷人球員的錦標賽總監。現在,您必須在10個播放器之間進行選擇,所有這些播放器均具有相同的等級編號,但可靠性數字不同。可能您會首先選擇可靠性最高的產品。隨著時間的流逝,擁有很多評級遊戲和更少評級遊戲的玩家之間的可靠性差距可能會擴大。
  • 操縱評級數字可能會變得更加容易。甚至ELO系統也不是騙子安全的,因為有些人通過在操縱的錦標賽中進行比賽獲得了等級或IM / GM規範。良好的可靠性得分可能會幫助沒有可靠性得分的球員變得非常便宜-好的球員會給得分點帶來很多損失。一旦涉及金錢,安全作弊就成為一個重要問題。我覺得Glicko評分系統更容易受到操縱。
  • 群眾對力量的溝通和理解可能會變得更加困難。在傳達排名列表時,您會遇到問題。評分為2000-50的玩家在1900和2100之間有一個“真實的演奏實力”。另一位玩家的1950-2000是1950-2000範圍內的數字。因此,玩家為1950-2000實際上可能是更好的玩家,但可能排名僅次於其他玩家,僅是因為他打的遊戲較少或對陣不太可靠的對手。在沒有真正保證更多公平性的情況下,您使人們難以解釋自己的排名系統。一位停止比賽的總經理可能會獲得“潛在實力”,並吹噓自己的世界冠軍潛力,因為他的可靠度數字增加了偏離的餘地(注意:雙向,不僅向下!)。

總而言之:您可能會得到比您討價還價更多的東西,因為整個軟件包不僅帶有改進。而且,當您在排名列表的頂端查看時,涉及大量的貨幣問題,因此我看不到更改現有系統的優點。

大多數排名列表都有可靠性得分(RD)的臨界值,而不是試圖用它來排名玩家。因此,始終將2000(50)排名高於1950(100)。根據它們的當前額定值,無論可靠性如何,它們的額定值都更高。如果1950(100)的玩家將擊敗2000(50),則其評分將比1950(50)時的評分提高更多。您能否詳細描述如何使用Glicko欺騙系統?如果您的RD高,您是在談論打敗您的評級嗎?
@West Freeman:我懷疑這是證明評級系統相對作弊傾向的理想之地,我只是在猜測,因為對我而言,操縱該系統看起來更便宜,因為當我使用時,我不會失去太多評級點故意對未評級的玩家輸球。我的回答更重要的一點是,在丟棄工作系統之前,您不僅應檢查系統的計算公平性,還應檢查作弊傾向,可通信性等。
但是,人為地提高某人的評分對他們有何幫助?通常,嘗試使用該系統的用戶會嘗試降低其評分,以便他們可以在較低的區域進行比賽並獲得一等獎。如果您避免長時間玩遊戲,然後輸掉一些本應該贏的遊戲,使用Glicko可能會更容易。但是,結合最低評級,以及由於RD需要花費一些時間來備份,因此只能每隔一段時間執行一次的事實。
您可能需要高分才能獲得頭銜,獲得邀請或被俱樂部付款以為他們效力或擔任教練。我說的是在這里以及真正的錢在哪裡的專業象棋,因為您質疑國際棋聯的行為。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...