17 Eylül 2017 Pazar

Golcü Şampiyon Yapıyor mu?

Gomis'in sezona muazzam başlaması üzerine Twitter'da bir tartışma gördüm. Tartışmanın temeli Gomis'in bu performansının Galatasaray'ı şampiyon yapıp yapmayacağıyla ilgiliydi. Şimdi bu cepte dursun.

Öte yandan yıllardır şunu duyarım, hatta o kadar hoşuma gider ki arada kendim de böyle düşünürüm: "Abi golcülerin 40 gol barajını aşarja seni şampiyon yapar" açıkçası bunu da bugüne kadar incelemedim.

Bu ikisini referans alarak 2010 yılına kadar gittim, 7 yıllık verileri çıkardım. Ligi ilk 3 sırada bitiren takımların golcülerini aldım, bir de gol kralı eğer başka bir takımdan çıktıysa bunu ekledim listeye. Böylece Fernandao, Aatıf ve Love da bir şekilde takımlarını listeye sokmuş oldu.

Açıkçası şampiyonluğun formülünü verecek bir analiz uzun boylu olurdu ve öte yandan amacından çıkardı, o yüzden daha basit ilerledim ve şampiyonluk ile golcülük, gol arasında bir korelasyon olup olmadığını inceledim.

İlkiyle başlayalım. Açık söylemeliyim ki; Lig sıralaması ile en golcünün gol sayısı arasında hiç ilişki yok.
Burada temel istatistik eğitimi vermeyeceğim, zaten ders verecek kadar bilgili değilim. Dileyen internetten araştırır, inceler. P-value değerinin oldukça düşük olmasını beklerim (bu ortaya attığımız hipotezde aldığımız riski gösterir) Yani ben golcünün gol sayısı ile lig sıralaması etkilidir dersem %58,4 risk almış olurum, yani kafadan atmış olurum. Bu değerin %5 civarında olmasını beklerim, biraz özgüvenli biriyseniz %10 civarındakini de kullanın. Diğer sayı (0,118) ise korelasyon katsayısını verir, eğer hipotezimiz tutarlı olsaydı onun oldukça büyük olmasını beklerdik.

Devam edelim.

En çok gol atan 3 oyuncunun toplam golüyle ligdeki durumun ilişkisi var mı? Yok. Var diyen adam %73 risk alıyor demektir. Kaba tabirle, sallama ihtimali %73.

Bir sonraki başlık lig durumu ile aldığı puan arasındaki ilişki. Mis gibi ilişki var. İçiniz rahat konuşabilirsiniz. Zaten en çok puan alan şampiyon olur. Bunu deneme amaçlı yazdım. "E abi ilişki mis gibi ama korelasyon katsayısı -0,831". Doğru, önce neden eksi olduğunu yazayım. Birinci, üçüncüden daha çok puan alıyor, birinin karşısında 1, diğerinde 3 yazıyor. Program diyor ki, daha çok puan alırsan, daha düşük sayıda olursun, yani 77 puan alırsan 1, 70 puan alırsan 3 olursun mesela. Eksi olma sebebi bu. -1 değil de, -0,831 olması da şundan kaynaklanıyor muhtemelen, mesela 2010 yılında Trabzon 82 puanla ikinci olmuş, ama iki yıl sonra Galatasaray 71 puanla şampiyon olmuş, ya da geçen sene Beşiktaş 77 puanla şampiyon olmuş.

Lig durumu ile takımın attığı gol arasında da ilişki var denebilir. P-Value 0,070 çıkmış, korelasyon katsayısı 0,376. Yani ilişki var ama ilişki oldukça zayıf.

Aldığı puan ile attığı gole bakalım. İlişki var, korelasyon katsayısı yüksek değil. Şu ana kadarki en kuvvetli şey bu olsa da orta düzey kuvvetli bir korelasyon katsayısı var.

Sonuncuya geçelim; takımın aldığı puan ile en golcüsünün gol sayısı arasında ilişki yok.

Özetle;  takımın toplamının attığı golle takımın aldığı puan arasında bir ilişki var, korelasyon ise orta düzey kuvvetli. Daha çok gol atan takım ligi daha üstte bitiriyor denebilir ama korelasyon katsayısı zayıf.

14 Eylül 2017 Perşembe

Tekrar Merhaba

Bloga en son 2014 yılında yazmışım, o dönem neden koptuğumu hatırlamıyorum ama Twitter piyasa yaptıktan sonra buraları terk edenlerden biri de bendim sanırım. Hevesim bitene kadar tekrar buralardayım.

Sayfanın orasını burasını onarmayı pek düşünmüyorum, elbette bir restorasyon yaparım ama Kültür Bakanlığı'nın izin verdiği ölçüde bırakırım.

Beni tekrar heveslendiren şey istatistikler ve analizler oldu. Son yıllarda furbolda istatistikler epey popüler olmaya başladı. Bunda gelişen teknolojiyle istatistik tutmanın kolaylaşması da başrolde. Üstelik istatistikler izleyicinin tezini kuvvetlendirmesinden daha fazla misyona sahip, eminim bir çok hoca hem transfer yaparken, hem de kadro kurarken bu bilgilerden faydalanıyor.

İstatistikler benim gözümde çoğu insanınkinden çok daha değerli. Açıkçası biraz daha gaza gelsem, dünyadaki her şeyi sayısal bir şeye bağlayabilirim, buna duygularımız da dahil. Neyse şimdilik o kadar iddialı girmeyeyim.

İstatistik deyince muhtemelen aklınıza koşu mesafeleri falan geliyor. İşte biraz da bunlara kızdığım için gözümde başka bir yere taşıdım analizleri ve değerlendirmeleri. Koşu mesafesi veriden fazlası değil, bunlar tek başına bir anlam ifade etmez. Bakarsın "aaa Oğuzhan ne koşmuş lan ilk yarıda" dersin geçersin. En fazla "çok koşmuş, 60'ta tıkanır" diye yorum yapılır buna. Bu kısır muhabbet devre arasını doldurmaz işte.

Peki doğrusu nasıl olmalı? Çıkarırsın Oğuzhan'ın tüm arşivini -ulaşabildiğin kadar- sonra onunla başka bir şeyi korele etmeye çalışırsın. En güdük haliyle böyle bir şey yapabilirsin. Mesela, Ozzy'nin 40 maçına bakarsın, ilk yarı ne kadar koşmuş diye incelersin, sonra atıyorum, o maçlardaki skora katkısına bakarsın. İki veri arasında korelasyon var mı diye bakarsın. Düşük kasayılı bir korelasyon çıkarırsın, olur biter. İşte biraz bunları yapmaya çalışacağım.

Verileri Whoscored sitesinden alacağım. Opta kadar iyiler mi bilmiyorum, verilerine ulaşabildiğim için onu tercih ettim. Öneri olursa onu da değerlendiririm.