Modül 1: Veriyle Tanışma
Makine öğreniminin ilk ve en kritik adımı: Verinizi tanımak! Bu modülde, veri kaynaklarını keşfedecek, bağımlı ve bağımsız değişkenleri ayırt edecek ve verinizin sağlığını kontrol edeceksiniz.
🎯 Modül Hedefleri
⚡ Hızlı Gösteri: Veri Önizleme
| fiyat | metrekare | oda_sayisi | bina_yasi | semt |
|---|---|---|---|---|
| 2,100,000 | 85 | 3 | 8 | B |
| 1,650,000 | 70 | 2 | 15 | A |
| 2,850,000 | 120 | 4 | 5 | C |
🎯 Hedef Değişken (Y)
fiyat - Tahmin etmek istediğimiz şey. Bağımlı değişken olarak adlandırılır.
📈 Açıklayıcı Değişkenler (X)
metrekare, oda_sayisi, bina_yasi, semt - Hedefi açıklamak için kullanacağımız değişkenler.
💡 İlk Kontroller
- Eksik veri var mı?
- Sayısal ve kategorik değişkenler neler?
- Dağılımlar nasıl görünüyor?
📚 Modül İçeriği
📊 Örnek Veri Seti
Başlamak için bu örnek veriyi kullanabilirsin:
🚀 Hızlı Başlangıç Kodu
import pandas as pd
# Veriyi yükle
df = pd.read_csv("ev_fiyatlari.csv")
# İlk bakış
print("İlk 5 satır:")
print(df.head())
print("\nTemel istatistikler:")
print(df.describe())
print("\nEksik değerler:")
print(df.isnull().sum())
# X/Y ayrımı
X = df[['metrekare', 'oda_sayisi', 'bina_yasi']]
y = df['fiyat']
🎯 Mini Görev
Görev 1: Değişken Tanımlama
Örnek veride hangi değişkenler bağımsız (X), hangisi bağımlı (Y)?