Hur bra är Expected Goals som modell?

Som ni säkert alla vet är Expected Goals en modell för att bedöma hur bra en målchans är, den utgår från var ifrån avslutet görs och hur ofta det blir mål i från den koordinaten utifrån en jättestor databas. Som alla modeller har den för och nackdelar, en nackdel är att den inte tar hänsyn till övriga spelares position. Men hur bra är då Expected Goals om vi tittar på lagen över en hel säsong? För att göra denna undersökning har jag utgått ifrån Wyscout och den xG statistik som finns samlad där mellan åren 2015 och 2021, totalt sju säsonger.

  • Antal mål genomsnitt per lag: 40,3
  • Summa xG genomsnitt per lag: 41,59
  • Standard avvikelse gjorda mål: 9,5
  • Standard avvikelse xG: 7,3

Jämför man medelvärden mellan Gjorda mål och xG så är det bara en skillnad på 1,3 mål, det tyder på att modellen stämmer ganska bra för Superettan, en skillnad på 1,3 mål på en säsong som varar 30 omgångar är en avvikelse på blott 0,043 xG per lag och match, det är inte mycket.

Om ni kommer ihåg lektionerna om standardavvikelse så ska medelvärdet +/- en (1) standardavvikelse innehålla 68% av datamängden. I detta fall är medelvärdet 41,59 mål för xG och har en standardavvikelse på 7,3, vilket säger att 68% av lagen hade en standardavvikelse som låg på plus minus 7,3 xG, dvs i spannet 34-48 xG. Slår man ut 7,3 xG per match är avvikelsen bara 0,24 xG för dessa lag. Återigen en väldigt liten skillnad mellan faktiskt gjorda mål och förväntade mål.

Tittar man på hur många lag som ligger innanför två (2) standardavvikelser så ska den innehålla 95% av en datamängd. För att förklara det kan man säga så här att bara (knappt) ett lag (5% av 16 lag) per säsong ska ha en större avvikelse än 14,6 xG mellan gjorda och förväntade mål.

Grafen ovan visar utfallet per år och hur stor avvikelse lagen har haft mellan Gjorda mål och Expected Grafen ovan visar utfallet per år och hur stor avvikelse lagen har haft mellan Gjorda mål och Expected Goals, och utifrån att dela upp de i en standardavvikelse från medelvärdet så kan vi se fördelningen tycks stämma. De flesta lagen är inom en standardavvikelse, dvs +/-7,3xG gentemot utfallet och några enstaka lag avviker i antingen positiv eller negativ riktning. Någon gång då och då (som förväntat) är det ett lag som avviker två standardavvikelser sett över en säsong.

Så vad säger då det här oss? För de allra flesta lagen, 68% eller runt 2/3 kommer avvikelsen gentemot gjorda mål vara mindre än 7,3 xG. Det tyder på att xG är en ganska bra trots att den är ganska enkel till sin natur. I analysen tidigare i veckan var det flera lag som hade en större avvikelse än förväntat, men det troliga är att i slutet av säsongen kommer de flesta lag inte ha en avvikelse +-7,3xG.

Avvikelse gentemot xG efter omgång 1-5 i Superettan 2022

Tar vi avvikelsen över en hel säsong där 68% av lagen kommer vara inom 7,3 xG och 95% av lagen vara inom 14,6 xG så motsvarar det efter fem omgångar 1,2 xG respektive 2,4 xG. Just nu är det ganska många lag som har en större avvikelse än så, men det kan också innebära att i slutändan kommer detta jämna ut sig.

//HL

Facebook Comments Box