Zipf kanunu, 1930’lu yıllarda Amerika’da Harvard Üniversitesi’nde dilbilim profesörü olan George Kingsley Zipf, tarafından geliştirilmiştir. Bu yüzden onun adı ile anılan yasa, istatistiki bir durumun deneysel keşfine dayanmaktadır.

George Kingsley Zipf

Basit Tarif

Hangi dilde olursa olsun herhangi bir metinde geçen sözcükler, kullanılma sıklığına göre sıralandığında oluşan listede her zaman geçerli bir kural vardır. Sıralama listesindeki sözcüklerin sıra numarası ile o sözcüğün sıklık sayısı sabit bir sayıdır. Bu kuralı formülle ifade edecek olursak; N sırasında yer alan sözcük, o metinde 1/N defa tekrarlanmıştır. Yani bu; listenin birinci sırasındaki sözcük, ikinci sıradaki sözcükten 2, üçüncü sıradaki sözcükten 3 kat daha fazla kullanılmış olduğu anlamına gelir.

Klasik Örnek

Diyelim ki sadece 10 sözcükten oluşan bir dil var ve bu dille kaleme alınmış metinde en sık kullanılan sözcük 100 defa kullanılmış. Bu durumda en sık kullanılan kelimeden en az kullanılan kelimeye göre yapılan sıralama listesi şöyle olacaktır:

1. sözcük => 100/1 = 100
2. sözcük => 100/2 = 50
3. sözcük => 100/3 = 33,3
4. sözcük => 100/4 = 25
5. sözcük => 100/5 = 20
6. sözcük => 100/6 = 16,6
7. sözcük => 100/7 = 14,3
8. sözcük => 100/8 = 12,5
9. sözcük => 100/9 = 11,1
10. sözcük => 100/10= 10

Profesör Zipf, James Joyce’un Ulysses adlı romanını incelediğinde yasanın geçerli olduğunu keşfetmiştir. Araştırmaya göre sıralama listesindeki

  • Birinci sözcük 8.000,
  • Onuncu sözcük 800,
  • Yüzüncü sözcük 80,
  • Bininci sözcük 8 defa kullanılmıştır.

Profesör Zipf bu çalışmayı yapmak için mutlaka saatlerce çalışmak zorunda kalmıştır ancak günümüzde bilgisayarlar kullanılarak sözcük sıralama listeleri kolaylıkla yapılabilmekte ve genellikle N sırasındaki sözcüğün sıralama fonksiyonu f(N) Zipf yasasına uymaktadır.

Konu ile ilgili çalışmalar yasanın pek çok alanda geçerli olduğunu göstermektedir: Güneş patlaması yoğunlukları, protein dizileri, bağışıklık reseptörleri, web sitelerinin tıklanma sayıları, deprem dereceleri, akademik makalelerden yapılan alıntı sayıları, soyadları, sinir ağlarının çalışma örüntüleri, yemek kitaplarında kullanılan malzemeler, telefon görüşme sayıları, Ay’daki kraterlerin çapları, satranç açılış hamlelerinin popülerliği vb. Bunca birbiri ile alakasız konunun ve karmaşık yapının kabaca da olsa bir yasaya uygun olmasının altında yatan nedene dair pek çok teori geliştirilmiştir. En popüler teoriler arasında istatistik bilimcilerinin teorileri ve insan zihninin yapısına atıf yapılarak üretilen teoriler olsa da üzerinde bilimsel uzlaşının sağlanmış olduğu bir teori henüz geliştirilmemiştir.

Kaynaklar:

Benzer Kanıtlar