Gomis'in sezona muazzam başlaması üzerine Twitter'da bir tartışma gördüm. Tartışmanın temeli Gomis'in bu performansının Galatasaray'ı şampiyon yapıp yapmayacağıyla ilgiliydi. Şimdi bu cepte dursun.
Öte yandan yıllardır şunu duyarım, hatta o kadar hoşuma gider ki arada kendim de böyle düşünürüm: "Abi golcülerin 40 gol barajını aşarja seni şampiyon yapar" açıkçası bunu da bugüne kadar incelemedim.
Bu ikisini referans alarak 2010 yılına kadar gittim, 7 yıllık verileri çıkardım. Ligi ilk 3 sırada bitiren takımların golcülerini aldım, bir de gol kralı eğer başka bir takımdan çıktıysa bunu ekledim listeye. Böylece Fernandao, Aatıf ve Love da bir şekilde takımlarını listeye sokmuş oldu.
Açıkçası şampiyonluğun formülünü verecek bir analiz uzun boylu olurdu ve öte yandan amacından çıkardı, o yüzden daha basit ilerledim ve şampiyonluk ile golcülük, gol arasında bir korelasyon olup olmadığını inceledim.
İlkiyle başlayalım. Açık söylemeliyim ki; Lig sıralaması ile en golcünün gol sayısı arasında hiç ilişki yok.
Burada temel istatistik eğitimi vermeyeceğim, zaten ders verecek kadar bilgili değilim. Dileyen internetten araştırır, inceler. P-value değerinin oldukça düşük olmasını beklerim (bu ortaya attığımız hipotezde aldığımız riski gösterir) Yani ben golcünün gol sayısı ile lig sıralaması etkilidir dersem %58,4 risk almış olurum, yani kafadan atmış olurum. Bu değerin %5 civarında olmasını beklerim, biraz özgüvenli biriyseniz %10 civarındakini de kullanın. Diğer sayı (0,118) ise korelasyon katsayısını verir, eğer hipotezimiz tutarlı olsaydı onun oldukça büyük olmasını beklerdik.
Devam edelim.
En çok gol atan 3 oyuncunun toplam golüyle ligdeki durumun ilişkisi var mı? Yok. Var diyen adam %73 risk alıyor demektir. Kaba tabirle, sallama ihtimali %73.
Bir sonraki başlık lig durumu ile aldığı puan arasındaki ilişki. Mis gibi ilişki var. İçiniz rahat konuşabilirsiniz. Zaten en çok puan alan şampiyon olur. Bunu deneme amaçlı yazdım. "E abi ilişki mis gibi ama korelasyon katsayısı -0,831". Doğru, önce neden eksi olduğunu yazayım. Birinci, üçüncüden daha çok puan alıyor, birinin karşısında 1, diğerinde 3 yazıyor. Program diyor ki, daha çok puan alırsan, daha düşük sayıda olursun, yani 77 puan alırsan 1, 70 puan alırsan 3 olursun mesela. Eksi olma sebebi bu. -1 değil de, -0,831 olması da şundan kaynaklanıyor muhtemelen, mesela 2010 yılında Trabzon 82 puanla ikinci olmuş, ama iki yıl sonra Galatasaray 71 puanla şampiyon olmuş, ya da geçen sene Beşiktaş 77 puanla şampiyon olmuş.
Lig durumu ile takımın attığı gol arasında da ilişki var denebilir. P-Value 0,070 çıkmış, korelasyon katsayısı 0,376. Yani ilişki var ama ilişki oldukça zayıf.
Aldığı puan ile attığı gole bakalım. İlişki var, korelasyon katsayısı yüksek değil. Şu ana kadarki en kuvvetli şey bu olsa da orta düzey kuvvetli bir korelasyon katsayısı var.
Sonuncuya geçelim; takımın aldığı puan ile en golcüsünün gol sayısı arasında ilişki yok.
Özetle; takımın toplamının attığı golle takımın aldığı puan arasında bir ilişki var, korelasyon ise orta düzey kuvvetli. Daha çok gol atan takım ligi daha üstte bitiriyor denebilir ama korelasyon katsayısı zayıf.
Öte yandan yıllardır şunu duyarım, hatta o kadar hoşuma gider ki arada kendim de böyle düşünürüm: "Abi golcülerin 40 gol barajını aşarja seni şampiyon yapar" açıkçası bunu da bugüne kadar incelemedim.
Bu ikisini referans alarak 2010 yılına kadar gittim, 7 yıllık verileri çıkardım. Ligi ilk 3 sırada bitiren takımların golcülerini aldım, bir de gol kralı eğer başka bir takımdan çıktıysa bunu ekledim listeye. Böylece Fernandao, Aatıf ve Love da bir şekilde takımlarını listeye sokmuş oldu.
Açıkçası şampiyonluğun formülünü verecek bir analiz uzun boylu olurdu ve öte yandan amacından çıkardı, o yüzden daha basit ilerledim ve şampiyonluk ile golcülük, gol arasında bir korelasyon olup olmadığını inceledim.
İlkiyle başlayalım. Açık söylemeliyim ki; Lig sıralaması ile en golcünün gol sayısı arasında hiç ilişki yok.
Burada temel istatistik eğitimi vermeyeceğim, zaten ders verecek kadar bilgili değilim. Dileyen internetten araştırır, inceler. P-value değerinin oldukça düşük olmasını beklerim (bu ortaya attığımız hipotezde aldığımız riski gösterir) Yani ben golcünün gol sayısı ile lig sıralaması etkilidir dersem %58,4 risk almış olurum, yani kafadan atmış olurum. Bu değerin %5 civarında olmasını beklerim, biraz özgüvenli biriyseniz %10 civarındakini de kullanın. Diğer sayı (0,118) ise korelasyon katsayısını verir, eğer hipotezimiz tutarlı olsaydı onun oldukça büyük olmasını beklerdik.
Devam edelim.
En çok gol atan 3 oyuncunun toplam golüyle ligdeki durumun ilişkisi var mı? Yok. Var diyen adam %73 risk alıyor demektir. Kaba tabirle, sallama ihtimali %73.
Bir sonraki başlık lig durumu ile aldığı puan arasındaki ilişki. Mis gibi ilişki var. İçiniz rahat konuşabilirsiniz. Zaten en çok puan alan şampiyon olur. Bunu deneme amaçlı yazdım. "E abi ilişki mis gibi ama korelasyon katsayısı -0,831". Doğru, önce neden eksi olduğunu yazayım. Birinci, üçüncüden daha çok puan alıyor, birinin karşısında 1, diğerinde 3 yazıyor. Program diyor ki, daha çok puan alırsan, daha düşük sayıda olursun, yani 77 puan alırsan 1, 70 puan alırsan 3 olursun mesela. Eksi olma sebebi bu. -1 değil de, -0,831 olması da şundan kaynaklanıyor muhtemelen, mesela 2010 yılında Trabzon 82 puanla ikinci olmuş, ama iki yıl sonra Galatasaray 71 puanla şampiyon olmuş, ya da geçen sene Beşiktaş 77 puanla şampiyon olmuş.
Lig durumu ile takımın attığı gol arasında da ilişki var denebilir. P-Value 0,070 çıkmış, korelasyon katsayısı 0,376. Yani ilişki var ama ilişki oldukça zayıf.
Aldığı puan ile attığı gole bakalım. İlişki var, korelasyon katsayısı yüksek değil. Şu ana kadarki en kuvvetli şey bu olsa da orta düzey kuvvetli bir korelasyon katsayısı var.
Sonuncuya geçelim; takımın aldığı puan ile en golcüsünün gol sayısı arasında ilişki yok.
Özetle; takımın toplamının attığı golle takımın aldığı puan arasında bir ilişki var, korelasyon ise orta düzey kuvvetli. Daha çok gol atan takım ligi daha üstte bitiriyor denebilir ama korelasyon katsayısı zayıf.