WN8 (deutsch)

From WN Efficiency Wiki
Revision as of 15:00, 15 February 2015 by Folterknecht (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Einleitung

WN8 ist die neueste Version des WNx-Projektes geleitet von Praetor77.

WN8 versucht den beobachtbaren Beitrag zu Gefechten über den gesamten Account zu messen, in der Hoffnung Auskunft über die latente Variable „Können“ (engl. - skill) eines Spielers zu geben.

WN8 sollte nicht als die perfekte und ausschließliche Zahl betrachtet werden, um das Können eines Spielers zu messen. Vielmehr sollten Dinge wie Siegrate, Gefechtsanzahl, durchschnittliches „Tier“ ebenfalls zu Rate gezogen werden, und WNx wird niemals Dinge wie eine gründliche Analyse von Replays oder des Wehrpasses (engl - Service Record) genauso wie gemeinsames Platoon fahren ersetzen. WN8 kann nicht Fähigkeiten wie gutes Timing, Ziel Priorisierung, Teamwork oder schnelle Entscheidungsfindung direkt erfassen.


WN8 – warum?

Wie alle anderen Rating hatte WN7 einige Schwächen und Grenzen. Einige waren vor der Veröffentlichung bekannt, andere wurden erst später entdeckt und veröffentlicht.

Eine kleine Liste der Schwächen von WN7 in gewichteter, absteigender Folge:

Schaden/Tier Skalierung – während das „Tier“ linear von 1-10 steigt, skaliert Schaden nicht linear mit steigendem „Tier“. Außerdem variiert die Fähigkeit Schaden zu versuchen, schon auf Panzern des gleichen „Tiers“ stark (T40 vs A-20 oder ARL V39 vs M18)

Kills/Tier Skalierung – Ungeübtere Spieler sind häufiger in niedrigeren „Tiers“ anzutreffen, weshalb es z.B. einfacher ist Abschüsse in t1-Gefechten zu erzielen als in t10-Gefechten, zumindest für Spieler mit einem gewissen Mindestmaß an Können.

Tier 1-10 Problem - auf Grund der beiden vorher genannten Probleme ergab sich nun das sogenannte „tier1-10 Problem“ mit WN7. „Precambrian“ [NA] hat das sehr gut in einem Post erklärt. Der Post im NA-Forum enthält zwar einige veraltete Informationen, beschreibt das Problem aber sehr gut auf einfache und verständliche Weise.

precambrian:

Kurz zusammen gefaßt: Wenn man den Durchschnitt der individuellen WN7 Werte bildet, erhält man ein WN7-Rating von 2578. Aber was tatsächlich geschieht, ist daß der Durchschnitt der individuellen Stats aller Spiele gebildet wird (Schaden, Kills, avg Tier …) und dann einen WN7-Wert 3260 entsteht!

Media:Precambrian_wn7_example.png

Die Gründe sind wie teilweise weiter oben schon beschrieben, die nicht lineare Skalierung von Trefferpunkten über die Tiers, einfacheres Erreichen von Kills in niedigen „Tiers“ was die Abschüsse pro Gefecht verzerrt. Schließlich und endlich wird dann das durchschn. „Tier“ in diesem Fall weit weniger verzerrt (nach unten), als das Kills pro Gefecht nach oben schnellen, während der durchschnittliche Schaden nur relativ leicht sinkt.

Wenn man sich dann noch vor Augen führt was passiert, wenn man nur die t8-Gefechte betrachtet, ohne das t1-Gefecht … das Resultat wäre ein WN7-Rating von 2960. Obwohl also das t1-Gefecht für sich betrachtet unter 1600 liegt, bläht es das Gesamtergebnis gewaltig auf.


Arti und Scouts (leichte Panzer) – Diese Fahrzeugklassen erreichen einfach nicht die Werte auf dem gleichen „Tier“ wie ihre Gegenstücke. Schwere Panzer, Mediums, Panzerjäger kann man grob vergleichen, jedoch kann man schwerlich erwarten, daß ein t8 Leichter Panzer genauso viel Schaden oder Kills verursacht wie eine ISU, IS-3,T69 oder ein AMX50 100.

Artis hingegen die scouten machen offensichtlich was falsch, weshalb ihre Scout-Werte niedriger sein sollten. Andererseits kann es passieren das ihre Schadenwerte sehr hoch sind, insbesondere bevor ihre Tier-Stufen angepaßt wurden in 0.8.6 (inzwischen sind sie aber geringer – Arti-Nerf).


WN8 – Was ist neu und anders?

Schaden/Gefecht vs Per-Tank Ratings

WN1-7, das alte und neue Eff-Rating waren alles Formeln die direkt auf die Stats angewendet wurden, die WG's web API ausgespuckt hat. Es wurden unterschiedliche Gewichtungen angewandt und in ein mehr oder minder aussagekräftiges Gesamt-Rating umgewandelt. Allerdings treffen die weiter oben für WN7 aufgelisteten Probleme auf jedes Rating zu, welches mit Schaden/Gefecht arbeitet. Es führt einfach kein Weg an der Tatsache vorbei, daß die Bedeutung der Schadenshöhe sich mit dem „Tier“ ändert (abhängig von der Menge an Hitpoints die „zur Verfügung stehen“), noch an dem Umstand, daß die Gewichtung von Kills je nach „Tier“ unterschiedlich ist.

Für WN8 haben wir also eine vollkommen andere Methode genutzt – Per-Tank rating. Wir sind nicht die ersten die diese Methode nutzen. Mr Noobmeter's Personal Rating nutze diese Herangehensweise von Anfang an, da sein Rating aber „closed source“ war, gab es jedoch viele skeptische Stimmen. Vor einigen Monaten hat sich dort aber was getan, und er hat seine Vorgehensweise bei seinem Rating öffentlich gemacht. Per-Tank Ratings sind wesentlich schwieriger zu entwickeln (man braucht gutes Datenmaterial) und an zu wenden (mehr Rechenpower), jedoch berücksichtigen sie die einzelnen gespielten Panzer, (incl. deren Resultate) des gesamten Accounts über dessen ganze Geschichte in einer Art und Weise, wie die Schaden/Gefecht Methode es niemals wird können.

WN8 ist also ein „Per-Tank“ Rating geworden anstelle eines „Schaden/“Tier“ Ratings, weshalb auch das durchschnitt. „Tier“ nicht mehr in der der finalen Formel auftaucht, obwohl diese Information welches „Tiers“/Panzer wie oft gespielt wurden, in den ersten Schritten mit einfließt.

Skala

Eines der erstes Dinge die Euch bei WN8 auffallen werden ist die Tatsache, daß sich die Skala welche vom Eff-Rating eingeführt wurde und auch bei WN1-7 Verwendung fand, geändert hat. Die „technischen Hintergründe“ und Ursachen dafür sind Entscheidungen aus der Entwicklung von WN8, welche im Abschnitt „WN8 – Die Eingeweide“ erläutert werden. Die einfachste Erklärung ist jedoch, daß die alte Skala die Unterscheidung der einzelnen Spieler und ihrer Fähigkeiten erschwerte, besonders das untere und obere Ende der Skala wurde stark komprimiert. Hier seht ihr die WN8 Skala überlagert mit WN7 und Noobmeters PR.

V8r6.jpg

Das Ergebnis dieser Änderung ist, daß der WN7 Wert nicht vergleichbar mit WN8 ist, obwohl es sich bei beidem im Regelfall um drei bis vierstellige Zahlen handelt. Uns ist bewußt, daß es sich dabei um ein Ungemach epischen Ausmaßes handelt, welches sogar die Einführung der 5-stelligen Postleitzahlen in Deutschland 1993 in den Schatten stellt (fragt mal Oma und Opa!), zumal sich auch die einzelnen Grenzen (z.B. Durschnitt – überdurschnittlich) verschoben haben. Wie auch immer - Skalen müssen manchmal verschoben, angepaßt oder neu ausgerichtet werden. Das hat es in der Geschichte selbst in der Physik schon gegeben, siehe die Temperaturskala (Fahrenheit, Celsius, Kelvin) um sie neuen Gegebenheiten an zu passen. Genauso wie bisher jedoch befinden sich relativ wenige Spieler an den Enden der Skala. Die Mehrheit der Spieler tummelt sich mehr um die Mitte, wo die Unterscheidung, wie oben ersichtlich, ebenfalls weiter aufgefächert wurde.


Grenzen und Ungenauigkeiten von WN8

(History)Geschichte – Sehr vieles hat sich seit dem Erscheinen von WoT im Frühjahr 2011 geändert, während sich die Stats eines jeden Accounts entwickelt haben. Panzer wurden in andere Tier-Stufen geschoben ( T30, T34, IS-4, Batchat 25t, AMX LTs, Arty, MT-25, VK2801, u.sw.), Änderungen der Balance, Änderungen in der Spielmechanik (Physics, Premium Granaten für Credits, 2 sigma Geschoßgenauigkeit, +/-2 Matchmaking) nur um einige Beispiele zu nennen. Das Spiel heute ist ein anderes als damals, und auch in der Zukunft wird es Veränderungen geben.

Das WN-Team ist sich dessen voll bewußt und erkennt an, daß diese Entwicklungen eine „Bedrohung“ für die Gültigkeit des Ratings darstellen. Wir können an diesen Dingen nichts ändern, und deshalb raten wir immer dazu auch den Wehrpass zu prüfen oder Fragen zu stellen, wenn es darum geht die Entwicklung eines Accounts nach zu vollziehen.

WG ist schlecht wenn es darum geht Buch zu führen. So zum Beispiel hätte man einfach die T50-2 Stats so belassen können und einfach den MT-25 hinzufügen können (neue Tank ID), statt dessen haben wir nun bei vielen Spielern einen Mix aus Ergebnissen vom T50-2 und MT-25. Tatsache ist nun, daß in diesem Fall die Stats der letzten Tage (60 Tage oder 1000 Gefechte) ausreichen müssen.


Reifeprozess – Spieler, sowohl individuell und als Gruppe, entwickeln sich, können mit der Zeit besser oder schlechter werden. Heute gibt es viel mehr Information im Web zum Spiel als noch 2011, so daß die Entwicklung eines Spieler heute schneller von statten gehen kann abhängig davon, wie intensiv man sich nebenher mit den Spielmechaniken und „Meta-Game“ beschäftigt. Außerdem, da Dossiers immer einen Zeitraum abbilden, sind größere Veränderungen im Können eines Spielers nicht immer sofort ersichtlich, abhängig von der Gesamtzahl seiner Gefecht kann dies länger dauern, besonders bei einer großen Zahl von Gefechten.


Spotting Damage (DUD – Damage Upon Detection) – WG hat angedeutet, daß dies auch irgendwann einmal gelistet wird, sowohl im Wehrpass als auch im Web (API – maßgeblich für WN8). Gegenwärtig ist dem allerdings noch nicht der Fall. Zwischenzeitlich könnt Ihr einen Blick auf „bjshnog’s VBE project“ werfen, welches DUD nutzen wird inklusive anderer Stats, die nur über Dossiers zugänglich sind und ein genaueres Rating ermöglichen. Folglich ist diese Rating in seiner Anwendung jedoch beschränkt.

Obwohl DUD einen wesentlichen Anteil am guten Gameplay ausmacht, besonders für Leichte Panzer, ist es uns gelungen ein wesentlich besseres Rating mit WN8 zu entwickeln – dies sogar ohne DUD – ein Hoch auf das Per-Tank Rating!


Sehr viele Gefechte mit nur einem Panzer – Dies hat einen negativen Einfluß auf die Genauigkeit von WN8, da einige Spieler so viele Gefechte mit nur einem Fahrzeug absolvieren haben, so daß ihr Rating für den gesamten Account dem des einzelnen Panzers sehr stark ähnelt bzw. sich diesem annähert. WN8 wurde mit der Annahme entwickelt, daß ein Spieler unterschiedliche Panzer fährt, nicht nur einen einzigen. Diese Annahme ist in WN8 vorhanden, allerdings schwächer ausgeprägt als in WN7 und vorherigen Rating.

Unter gewissen Umständen ist es möglich, dass ein Spieler genügend Gefechte in einem einzelnen Panzer spielt, um die statistischen Annahmen von WN8 zu umgehen. Wie viele Gefechte (%) dafür nötig sind? Eine genaue Analyse dessen haben wir nicht durchgeführt, aber schätzungsweise liegt der Anteil bei 50% und mehr Gefechten. Dies kann dazu führen das der WN8 Wert nicht korrekt ist.

Jedoch ist dies absolut in Ordnung, solange es Dir Spaß macht tausende Gefechte auf nur einem Panzer zu absolvieren. WN8 wird Dich dafür nicht „bestrafen“, es macht es nur sehr schwierig Deinen Account mit dem eines anderen Spielers zu vergleichen. Wir können halt nicht alle seltenen Sonderfälle im Rating berücksichtigen.


Streuung der Ergebnisse – Obwohl WN8 Per-Tank Statistiken und Werte nutzt, ist die Streuung dieser oft von Panzer zu Panzer unterschiedlich stark ausgeprägt. Ein Beispiel dafür stellt der Vergleich zwischen dem T49 und dem AT-2 dar, beides t5 Panzerjäger (TDs). Der AT2 mit schlechter Sichtweite, langsam, schwer gepanzert wird über alle Spieler hinweg betrachtet, einen kleineren Bereich möglicher Stats aufweisen (Streuung) als der T49, Meister der Tarnung, schnell aber leicht verwundbar. Diese genannten Eigenschaften des T49 führen im allgemeinen dazu, daß ein solcher Panzer einen viel weiteren Bereich an möglichen Stats aufweist, wenn man die möglichen Abweichungen zum Mittelwert vergleicht. Der AT-2 hat also eine geringere Abweichung zum Mittelwert als der T49. Obwohl wir also eine gute Datenlage für die Ermittlung eines Durchschnitts für beide Panzer haben, lassen sich für den T49 sehr viel mehr bessere und schlechtere Leistungen finden, als beim AT-2, wo sie in der Regel näher am Mittelwert liegen.

WN8 enthält keinen „Faktor“ der die mögliche Streuung der Stats einzelnen Panzer einbezieht. Wir waren der Ansicht, daß das vorhandene Datenmaterial dafür nicht ausreichend ist, zumal WN8 sowieso schon sehr viel komplizierter und rechenintensiver ist als WN7. Da das WN-Team nicht die Server betreibt, auf denen WN8 errechnet wird, haben wir uns dazu entschlossen diese mögliche Streuung und ihren Einfluß auf das Rating außer acht zu lassen, und dies vielleicht für WN9 oder später wieder aufzugreifen.

Ein Beispiel warum Panzer mit einer größeren Stat-Streuung das Rating stärker beeinflussen und es schneller nach oben treiben können (gute Ergebnisse voraus gesetzt) findet Ihr in WN8: Anhang A.

WN8 - Die „Eingeweide“

Die Grundlage von WN8

WN8 geht von einer Annahme aus, die keinem anderen Rating in dieser Form zu Grunde liegt. Wir setzten Standards für Durchschnittsspielers, basierend auf ihrer Fähigkeit den Ausgang des Gefechts zu beeinflussen.

Dies ist ein kniffliges Konzept, über das man durchaus diskutieren kann. Wir gehen von dem Umstand aus, daß es ein gewisses Mindestmaß gibt (Schaden, Kill, Spots, Def), welches den Ausgang eines Spiels beeinflußt. Wird dieses nun regelmäßig unterschritten, läßt sich kein signifikanter Beitrag zum Ausgang von Gefechten mehr fest stellen, die WR zum Beispiel unterscheidet sich nicht mehr von der eines Spielers der ständig AFK ist. Der Wert wurde errechnet und anschließend subtrahiert (der „rSTATSc Schritt“ – weiter unten), um alle Spieler mit dem theoretischen und teilweise leider auch realen Spielern zu vergleichen, die nicht genügend zu Wege bringen um ihre WR über das einfache erscheinen zum Match hinaus zu beeinflussen.

Der Vorteil dieser Herangehensweise ist, daß es das Rating aussagekräftiger macht, sowohl am unteren als auch oberen Ende der Skala. In der Vergangenheit gab es gratis Punkte in WN7 einfach dafür „Ins Gefecht!“ zu klicken (simple Anwesenheit), da selbst schlecht programmierte Bots und AFKler nicht in der Lage sind, Stats mit lauter Nullen zu produzieren. Die Anzahl der Accounts, die so niedrige Stats haben, daß sie ins keinster Weise ihre WinRate beeinflussen, ist groß. Durch das Einführen dieses Mindestmaßes erhalten wir ein bessere Differenzierung am Anfang der Skala als auch am oberen Ende, da „statistisches Grundrauschen“ entfernt wurde.

Wir postulieren also einen Nullpunkt für Stats (Schaden, Spots, Kills, Def), wird dieser unterschritten ist einfach kein Einfluß mehr auf die WR „meßbar“.

Dies hat auch den Effekt, daß die Intervallskala, welche vom Eff-Rating, PR und WN7 genutzt wurde, nun zu einer Verhältnis(Ratio)skala wird, was Vorteile mit sich bringt. Der wichtigste, abgesehen von verbesserter Genauigkeit, ist das durch Einführung der Baseline man nun sagen kann, daß z.B. ein 2400 WN8 Spieler doppelt so viel zum Sieg seines Teams beiträgt als ein 1200 WN8 Spieler. Dies war mit keinem Rating vor WN8 möglich.


Daten-Erhebung

Da es sich bei WN8 um ein per-Tank Rating handelt, brauchten wir nun auch die Daten für jeden einzelnen Panzer, was bekannter weise nicht mit WGs web API zu bewerkstelligen ist. Wir haben uns dazu an Phalynx von vBAddict.net gewandt, der uns seine Datenbank von 17.000 Dossiers zur Verfügung stellte. Aus dieser Datenbank wurden Spieler ausgesiebt, die weniger als 1000 Spiele absolviert hatten, und Panzer mit weniger als 50 Gefechten.

Mit dieser Datenbank, unter Verwendung linearer Regression, wurden nun die zu erwartenden Stats für jeden Panzer ermittelt, gefahren von einem durchschnittlich begabten Spieler. Für jede Fahrer/Panzer Kombination haben wir „player WN8alpha“ und „tank WN8alpha“ ermittelt. WN8alpha läßt sich in etwa mit WN7 gleichsetzen, es ging darum die Effektivität eines Panzer zu ermitteln (A. d. Ü. - WG sollte dort mal dringend Nachhilfe nehmen bei Praetor77 & Co.) Anschließend haben wir die Stats, der besten 50% der Spieler AUF DEM JEWEILIGEN PANZER (nicht gesamt), gefiltert. Diese enthalten eine gute Mischung aus Spielern mit hoher und niedriger WR. Unserer Ansicht nach ist das Heranziehen der besten 50% aller Spieler auf dem jeweiligen Panzer, eine gute Möglichkeit dessen wirkliche Fähigkeiten auf dem Schlachtfeld zu ermitteln. Würde man hingegen die untere Hälfte der Ergebnisse auf dem Panzer heran ziehen, würde man Panzer mit einander vergleichen, welche von Spielern bewegt wurden die entweder mit dem Panzer einfach nicht zurecht kommen oder die grundlegenden Spielmechaniken nicht verstanden haben. Wen man hingegen nur die besten Spieler auf dem Panzer (z.B. top 5%) heran ziehen würde, ließe sich das ganze nicht mehr auf die Allgemeinheit anwenden. Für die lineare Regression wurden also die top 50% heran gezogen.

To check tank balance amongst each other, we looked at the tankWN8/playerWN8 ratio. The top 10% players in this group was used to calculate an average tankWN8/playerWN8 ratio, and all tanks had the WN8 values that we were regressing to (with the top 50% of players) changed to the values that were necessary for the top 10% players in all tanks to average a ratio of 1.35. This took several iterations of recalculating tankWN8 and playerWN8 until a balance was reached. The purpose of this was to try to, controlling for player skill, determine inputs which would normalize the dmg/frag/spot/def outputs across tanks. To find out how much dmg the same player would do in the ARL v39 and M18 Hellcat, given all other things being equal.

Einige Panzer bedurften einer genaueren Untersuchung des tankWN8/playerWN8 Verhältnisses, auf Grund der abnormal geringen Anzahl von sehr guten Spielern die diese Panzer spielen (A-20) oder weil es sehr starken Nerfs/Buffs in der Vergangenheit gab (M41). Wir haben uns stets darum bemüht, einen Mittelweg zu finden bei Panzern die starken Veränderungen unterlagen wie z.B. M48A1, AMX50B oder dem T110E5, so das Ergebnisse von Spielern mit einfließen, die diese Panzer während unterschiedlicher Zeiträume gefahren haben. Ziel war es aus zu schließen, daß jemand unverdienter Weise z.B. für den VK3601 konisch in seiner alten OP-Phase einen Bonus erhält, weil er ihn nicht mehr seit den Nerfs angerührt hat.

Anmerkung: Dieser manuelle Prozess war der wissenschaftlich betrachtet schwächste Teil der WN8 Entwicklung. Persönliche Voreingenommenheit fand jedoch keinen Eingang während dieser Phase – dutzende Personen von verschiedenen Servern (NA, EU, RU + SEA) haben im WoTLabs-Forum an WN8 mitgearbeitet , sind durch die Tabellen „gegangen“ und haben nach Anomalien Ausschau gehalten bzw. haben verdächtige Werte zur Sprache gebracht, die dann in der Gruppe diskutiert wurden. Bei Panzern zu denen sich absolut keine vernünftigen Stats finden ließen (eine Hand voll – Bsp. A-20 niemand spielt den freiwillig oder gibt sich groß Mühe), wurden Werte anderer Panzer heran gezogen, welche diesem noch am ehesten ähneln. Um diesen manuellen Prozess für die Zukunft zu verringern, oder ganz aus zu schließen, kannst Du Dein Dossier auf http://www.vbaddict.net/wot.php hoch laden.

Außerdem haben wir unsere Tabelle der Panzerstats mit der von Noobmeter und einer Tabelle der besten 1% aller Spieler auf dem russischen Server verglichen, letztere wurde uns von Seriych [RU] zur Verfügung gestellt. Die Werte unsere Tabelle sind ziemlich nah bei denen von Noobmeter (von t3-8) und wenn man die Werte aus unserer Tabelle mit 1,5 multipliziert, um zu ermitteln was ein 2400 WN8 Spieler (Unicum) erreichen muss, so sind die Werte auch sehr nah an denen für die top 1% auf dem russischen Server. Ein Ergebnis dieser Herangehensweise ist, daß die erwarteten Werte für eine Reihe von Low-Tier Panzern relativ hoch ausfallen besonders für Newbies. Das stellt jedoch kein großes Problem dar, da der durchschnittliche Spieler nur rund 1% seiner gesamten Gefechte im Tier 1 verbringt.

Dadurch wird außerdem gewährleistet, daß man sich nicht mehr so einfach durch „seal-clubbing“ ein hohes Rating erspielen kann. Sicherlich kann man immer noch Newbies im t1 vermöbeln, nur muß man das noch auch gut können, um ein gutes Rating zu erhalten. 1,7 Kill/Spiel im Durchschnitt (ein guter Wert in t10) auf t1 reichen nun nicht mehr, um als vermeintlich guter Spieler da zu stehen. Das hat nichts damit zu tun, daß das WN-Team was gegen Leute hätte, die gerne Low-Tiers fahren, vielmehr geht es uns darum, Können unabhängig vom Tier zu ermitteln.

Hier nun die Tabelle mit den benötigten Werten für 1565/2400 WN8. Außerdem ist der erwartete Schaden von Noobmeters PR und ein Vergleich mit den top 1% des russischen Servers enthalten.

Expected Tank Values

Das wichtigste bei dieser Auflistung ist das Verhältnis der Werte zwischen den verschiedenen Panzern. Man könnte diese Werte durch 3 teilen, und es würde keinen Unterschied machen. Das Verhältnis zwischen den einzelnen Werten ist wichtig, nicht die Werte selbst. Wir haben sie absichtlich in der WoT-Schadens-Skala belassen, um die „Lesbarkeit“ und das Durchforsten zu erleichtern.

Gültigkeit der Daten

Ein Datensatz von Spielern mit mehr als 10000 Gefechten pro Spieler von verschiedenen Servers wurde uns freundlicher Weise von Mr. Noobmeter überlassen, über 4GB groß – was kaum von Excel geöffnet werden kann. Davon ausgehend haben wir eine Datenbank bestehend aus 115000 Spielern erstellt, welche die Fähigkeiten von Praetor77 lahmen PC auf eine harte Probe stellte. Anhand dieser Datenbank haben wir die erwarteten Stats („expected stats“), rSTATS und anschließend rSTATSc ermittelt. Die „rSTATSc“ Werte wurden mit Eureqa* verarbeitet um die optimale mathematische Formel zu finden, welche am besten die „rWINc“ der Spieler in der Datenbank erklärt.

  • Eureqa – Programm welches iterative genetische Algorithmen nutzt, um nach mathematischen Zusammenhängen zwischen verschiedenen Datensetzen zu suchen.

Durch die Datenanalyse fanden wir heraus, daß einige Spieler eindeutig „Ausreißer“ darstellten in einigen „rSTATSc“ (außer im Bereich Schaden - „Suicide Scouts“), was dazu führte, daß wir einige Maximalwerte („caps“) eingeführt haben, um den Nutzen von WN8 zu verbessern. Diese Stats (mit den „Caps“) schienen auch eine engere Beziehung mit „rWINc“ bis zu einem gewissen Punkt zu haben, nach dessen Überschreiten sie allerdings stark nach ließ.

Bei den Maximalwerten („cap“) handelt es sich um folgende Werte:

rFRAGcMAX = rDAMAGEc+0.2 
rSPOTcMAX = rDAMAGEc+0.1
rDEFcMAX = rDAMAGEc+0.1

Anschließend wurde Eureqa erneut gefüttert, diesmal jedoch mit den begrenzten Werten („caps“) was keinen großen Einfluß auf das Ergebnis hatte, jedoch nun besser in der Lage war Accounts, bei welchen es sich um Ausreißer handelte, besser zu verarbeiten bzw. zu bewerten.

Die finale von Formel sah dann wie folgt aus:

rWINc = 0.09 + 0.613*rDAMAGEc + 0.131*rFRAGc*rDAMAGEc + 0.097*rFRAGc*rSPOTc+0.047* rFRAGc*rDEFc

Anschließend haben wir jeden Term in der Formel mit 1600 multipliziert, was eine Mittelwert für alle Spieler in der Datenbank wie bei WN7 zur Folge hatte. Der serverweite Durchschnitt sollte damit wie bei WN7 zwischen 900 und 1000 Punkten liegen.

Expected Stats Matrix

Mr. Noobmeter hat freundlicherweise die erwarteten Werte neben denen seines PR-Ratings auf seiner Website zum Studium bereit gestellt. http://www.noobmeter.com/tankList


Die einzelnen Schritte der WN8-Berechnung

Schritt 1

rDAMAGE = avgDmg     / expDmg
rSPOT   = avgSpot    / expSpot 
rFRAG   = avgFrag    / expFrag 
rDEF    = avgDef     / expDef 
rWIN    = avgWinRate / expWinRate

Im 1. Schritt werden die Anzahl der Gefechte pro Panzer auf einem Account mit den erwarteten Stats („expected Stats“) multipliziert, um die „expected Stats“ für den gesamten Account zu ermitteln. Anschließend werden die einzelnen Stats des Accounts (dmg – Schaden, frags/kills – Abschüsse, Spots – aufgeklärte Panzer, def – Verteidigungspunkte, win-rate – Siegquote) durch die erwarteten Werte dividiert auf die entsprechende Verhältnisse zu ermitteln.

Schritt 2

rWINc    = max(0,                     (rWIN    - 0.71) / (1 - 0.71) )
rDAMAGEc = max(0,                     (rDAMAGE - 0.22) / (1 - 0.22) )
rFRAGc   = max(0, min(rDAMAGEc + 0.2, (rFRAG   - 0.12) / (1 - 0.12)))
rSPOTc   = max(0, min(rDAMAGEc + 0.1, (rSPOT   - 0.38) / (1 - 0.38)))
rDEFc    = max(0, min(rDAMAGEc + 0.1, (rDEF    - 0.10) / (1 - 0.10)))

Nun werden der Nullpunkt für die Verhältnisse (engl – ratios) eingeführt. Warum dies geschieht kann im Abschnitt WN8 – Die Eingeweide gleich im ersten Abschnitt nachgelesen werden. „min“ und „max“ sind Funktionen die sicher stellen, daß die Verhältnisse innerhalb der Grenzen bleiben. Die Konstanten liegen in folgendem Format vor:

(rSTAT – constant) / (1 – constant)

Ein Spieler der in allen „rSTATc“ Werten einen Wert von 1 aufweist, erhält damit ein 1565 WN8 Rating.

Schritt 3

WN8 = 980*rDAMAGEc + 210*rDAMAGEc*rFRAGc + 155*rFRAGc*rSPOTc + 75*rDEFc*rFRAGc + 145*MIN(1.8,rWINc)

Im 3. Schritt werden die gewichteten (Schritt 1) und normalisierten (Schritt 2) „Leistungs-Verhältnisse“ mit ihren Koeffizienten multipliziert. Dies führt zu einer Skala mit Werten zwischen 0 – 5000, gewichtet den Schaden und stellt die Interaktionen zwischen frags*spots, def*frags und dmg*frags dar.

Anmerkung zu den Interaktionen oder Verknüpfungen Wenn Du 5000 Spiele auf dem T50 absolviert hast, und die erwarteten Spots liegen bei 4 pro Spiel und Dein persönlicher Durchschnitt liegt ebenfalls bei 4, so liegt Dein rSPOT bei 1. Spielst Du nun nur den E100 bei welchem die erwarteten Spots bei 0,88 pro Spiel liegen, und Dein Durchschnitt liegt bei 0,88 pro Spiel, dann führt das genauso zu einem Wert von rSPOTc 1!!!

Also mißt rSPOTc nicht wie viel Du aufklärst, sondern wie viel Du aufklärst im Vergleich zum Durchschnittsspieler, wen dieser den gleichen Panzer fährt.

Auf diese Weise hat rSPOTc eine viel größere Korrelation mit der Winrate, als der einfache Durchschnitt für Spots:

O81p.png

Media:pw43.png

In der WN8 Formel werden außerdem rSPOTc und rDEFc mit rFRAGc multipliziert, was sehr gut mit der Winrate korreliert.

9fr2.jpg

Der Term „rSPOT*rFRAG“ mißt also eindeutig etwas wichtiges. Diese Interaktion der beiden Werte scheint Spieler hervor zu heben, welche verschiedene Dinge gleichzeitig umsetzen können, und das tun was notwendig ist um das Spiel zu gewinnen, im Gegensatz zu Spielern die einfach nur auf Nummer sicher gehen und Schaden austeilen.

Eine spezifische Analyse einzelner Spieler, Eureqa scheint dem zu zu stimmen, brachte ans Licht, daß Spieler mit einem hohen Wert bei rFRAGc*rSPOTc sehr oft gewinnen. Das WN8-Entwicklerteam ist der Auffassung, daß Aggressivität und die Bereitschaft Möglichkeiten für das Team zu schaffen, dafür verantwortlich sind. Wenn ein Spieler in der Lage ist durchgängig einen hohen rSPOTc Wert zu erreichen, geschieht das meist aus einer riskanteren Position heraus. Ist dieser Spieler nun obendrein auch noch in der Lage viel Abschüsse, Schaden, Verteidigungspunkte und eine hohe Winrate zu erreichen, so ist er unserer Ansicht nach der bessere Spieler im Vergleich zu jemandem, der die gleiche Menge an Schaden und Abschüssen schafft, dabei jedoch in der zweiten oder dritten Reihe sitzt, und sein Team für sich Spotten läßt. Einer der häufigsten erteilten Ratschläge in diesem Spiel lautet ungefähr wie folgt:

„Bring Deine Kanone ins Spiel und bleib am Leben, um Schaden zu verursachen.“

Die rSTATc Werte scheinen dies zu bestätigen.

FAQ & Antworten auf die ganz „speziellen“ Fragen

Sollten noch Fragen offen sein, die WN8: FAQ (deutsch) sollte diese Beantworten.

Seiten die WN8 einsetzen

Auflistung der Seiten und Applikationen die WN8 einsetzen


Credits

Praetor77, bjshnog, Crabeatoff, Mr. Noobmeter of NoobMeter.com, seriych, Phalynx of vBAddict.net, Orrie, Twistoon, NextToYou, Folterknecht, Precambrian, HibachiSniper, HubertGruber, juicebar, perpixel, sr360, jacg123 and anyone else we might have forgotten (sorry!).

Neverwish, Allurai, Mr. Noobmeter and stumpjumper8 also get shout outs for their websites, which let us carry on our work and implement it for the public to use.

Thanks everyone!


deutsche Übersetzung – Folterknecht [EU]