如何自動評估玩家在遊戲中的表現？

題:

如何自動評估玩家在遊戲中的表現？

Dennis Golomazov

2013-11-22 23:38:08 UTC

view on stackexchange narkive permalink

假設我有一個完整的遊戲。我沒有球員的Elo評分。我的目的是僅根據玩家的舉動來評估其在遊戲中的表現。可以使用國際象棋程序自動完成此操作嗎？可以給出玩家遊戲的數據庫。再次，沒有Elo評分。

我的動機很簡單。我通過互聯網下國際象棋，並希望根據遊戲本身而不是網站評級來自動跟踪我的進度。我是初學者。

一個簡單的解決方案是使用任何計算機引擎並跟踪？！，？的數量來註釋遊戲。和??分數。但是，它不是很準確，我想獲得更多想法：）

任何基於單個遊戲的評估都會帶來巨大的錯誤餘量。您的“進度”會不斷地上下波動，我懷疑您是否可以通過這種方法跟踪除長期“進度”以外的任何內容（基本上可以歸結為遊戲的平均水平）。國際象棋等級（或幾乎所有其他運動中的等級）避免了這個問題，並且使用在線等級作為您的力量指標，我認為沒有任何問題。

五答案:

shivsky

2013-11-23 03:35:18 UTC

view on stackexchange narkive permalink

慢速控制 上的站點評級對於服務器（競爭激烈的參與者（ICC，FICS僅舉幾例））非常可靠，因為評級非常緊密地反映了您的如果您玩了足夠多的遊戲，則是真正的遊戲實力。對於USCF和FIDE / ELO等非常標準化的評分系統，您會注意到，不同的評分級別往往指向那些玩家仍在犯的錯誤類型。 NM Dan Heisman的國際象棋思想家的改進在討論玩家在評分等級中犯的錯誤的類型方面做得很好。

您是否嘗試過許多自測書籍？伊戈爾·赫梅利尼茨基（Igor Khmelnitsky）的國際象棋等級考試和丹尼·科佩克（Danny Kopec）的測試，評估和改進棋類都是極好的書，它們使您可以通過查看自己在分級測試位置上的表現來跟踪進度。 / p>

您的“與引擎進行比較”是另一種方法，但是還是?? /?。舉動實際上僅表示戰術錯誤，而不是您可能犯的戰略或位置錯誤，甚至是行為或時間管理錯誤。並讓他們受到強者的評論和批評是一種有效的改進方法。您在每個類別（策略，知識，思考過程，時間管理等）中的錯誤都會被突出顯示，您可以根據已停止犯的錯誤的術語來衡量進度。

儘管您可以在家裡試用一個有趣的變體引擎：為什麼不擴展您的引擎評估方法，以通過評估圖直觀地觀察玩家的質量/表現？換句話說，獲取引擎評估得分每步，然後將它們（某些免費軟件，例如SCID幫您完成）繪製在這些步上。

例如：兩個初學者會擁有看起來像這樣的遊戲：

enter image description here

注意這些鋸齒有多鋸齒。雙方都犯下許多可怕的錯誤（尖峰的斜率！），並且他們多久未能利用對方的可怕錯誤。

尖峰總是有趣的： enter image description here

兩個中級（USCF 1400-1600）玩家可能會玩類似以下游戲： enter image description here

它看上去確實參差不齊，但是請注意y軸（引擎）評估）要小得多……表明這些玩家比新手更有經驗，並且能玩更高質量的象棋。

為進行最終比較，1911年的Grandmaster遊戲將如下所示：

enter image description here

在這裡無需評論:)這些傢伙真的不會犯很多錯誤，是嗎？

如果您可以設計自己的啟發式方法來繪製坡度+評估圖對玩家技能/表現的縮放比例，也許這是一種方法？：）

請注意，我想提出一個警告，即引擎評估得分在某些細微差別的位置上並不是那麼可靠，並且某些需要大量材料的口味會認為Gambit類型的開啟方式與人類的開啟方式非常不同。在遊戲過程中，將引擎置於半移動位置的時間也將對事情產生一些影響。被警告！ :)

您使用什麼程序生成這些圖？我有scid +乾魚，我有這個選項嗎？

user1657

2013-12-09 23:44:01 UTC

view on stackexchange narkive permalink

要獲得非常準確的球員質量排名，可以使用www.chess-db.com提供的出色工具。它可以讓您上傳遊戲，幾分鐘後，它會以強力引擎的最佳舉動輸出兩位球員的素質（百分比）。

此頁面用於上傳PGN文件： http ：//chess-db.com/public/game_upload.jsp

這是結果示例： http://chess-db.com/public/game .jsp？id = Pablo％20Bento.Shredder％20Android.107755008

Rafiek

2013-11-23 04:17:59 UTC

view on stackexchange narkive permalink

據我所知，您所要問的不存在。但是，這是我的主意。

您將需要具有以下功能的示例：（1）下象棋位置，（2）在該位置進行的移動，（3）進行移動的玩家的等級

假設您有10億個樣本。您可以在這些樣本上訓練計算機算法，該算法可以針對位置中的每個移動預測相對於等級的移動質量。可以對所有動作的所有評分進行平均，以獲得玩家的大致評分，並有效地提高其遊戲質量。

這是一個粗略的想法，可以進一步完善。

這實際上是行不通的。在大多數遊戲中，您將很快處於數據庫中不存在的位置-是的，即使您以某種方式可以訪問十億個遊戲數據庫。如果對手的表現不佳，您將受到懲罰-在1.e4 e5 2.Qh5之後，無論Black玩什麼，它的平均評分都會很低，因為該級別的開局比更高級別的玩法更多。（哎呀，甚至1 ... e5本身的平均評分也可能很低。）在已知空缺之後*發生的事情更能說明玩家的實力，而不是他們遵循理論的時間。

我在AlphaZero推出5年之前就給出了這個答案。現在，我們所有人都可以要求AlphaZero為我們註釋遊戲並告訴我們我們做得如何。我們可能差不多要問為什麼這樣做是好是壞了。那就是您真正需要改進的地方。當前的人類評級被高估了。

JWILD

2018-09-28 18:17:54 UTC

view on stackexchange narkive permalink

chess.com CAPS。將來自Chess.com的CAPS得分（需要訂閱）與圖表中的表格進行比較： https://www.chess.com/article/view/better-than-ratings-chess-com-s- new-caps-system。另外有趣的是： https://www.chess.com/article/view/who-was-the-best-world-chess-champion-in-history

注意事項：任何特定遊戲的遊戲上限得分都是不穩定的；最好在一批遊戲中對CAPS得分進行平均。目前，據我所知，CAPS可以通過一系列動作來預測Elo等級。另一個注意事項：CAPS分數存在於真空中，不考慮時間控制。比起1分鐘的子彈遊戲，我在較慢的時間控制下下更好的棋。 CAPS將看到這種玩法強度上的差異，並因此將子彈遊戲的評級降低。這並不意味著我不是玩時間控制遊戲速度較慢的人！

Rauan Sagit

2013-11-30 23:30:37 UTC

view on stackexchange narkive permalink

以下是有關要測量哪些參數的一些想法。每場比賽的失誤數。 10個動作，15個動作，20個動作後，您獲得同等或更好位置的頻率。您多久成功使用一次對手的失誤。您多久抽獎或贏得客觀抽獎的殘局。您多久找到一次強製配對組合。您多久成功防禦一次客觀失利的殘局。您多久按時丟東西。

ⓘ

該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到，我們感謝它分發的cc by-sa 3.0許可。

关于 - 法律

Loading...