Ana Sayfa

Veri Bilimine Giriş

Modül 1: Veriyle Tanışma

Makine öğreniminin ilk ve en kritik adımı: Verinizi tanımak! Bu modülde, veri kaynaklarını keşfedecek, bağımlı ve bağımsız değişkenleri ayırt edecek ve verinizin sağlığını kontrol edeceksiniz.

🎯 Modül Hedefleri

0/3 tamamlandı
Veri Kaynakları
CSV, Excel, SQL
Değişken Rolleri
X/Y Ayrımı
İlk Analiz
Keşif ve Kalite

⚡ Hızlı Gösteri: Veri Önizleme

fiyat metrekare oda_sayisi bina_yasi semt
2,100,000 85 3 8 B
1,650,000 70 2 15 A
2,850,000 120 4 5 C

🎯 Hedef Değişken (Y)

fiyat - Tahmin etmek istediğimiz şey. Bağımlı değişken olarak adlandırılır.

📈 Açıklayıcı Değişkenler (X)

metrekare, oda_sayisi, bina_yasi, semt - Hedefi açıklamak için kullanacağımız değişkenler.

💡 İlk Kontroller

  • Eksik veri var mı?
  • Sayısal ve kategorik değişkenler neler?
  • Dağılımlar nasıl görünüyor?

📊 Örnek Veri Seti

Başlamak için bu örnek veriyi kullanabilirsin:

🚀 Hızlı Başlangıç Kodu

import pandas as pd

# Veriyi yükle
df = pd.read_csv("ev_fiyatlari.csv")

# İlk bakış
print("İlk 5 satır:")
print(df.head())

print("\nTemel istatistikler:")
print(df.describe())

print("\nEksik değerler:")
print(df.isnull().sum())

# X/Y ayrımı
X = df[['metrekare', 'oda_sayisi', 'bina_yasi']]
y = df['fiyat']

🎯 Mini Görev

Görev 1: Değişken Tanımlama

Örnek veride hangi değişkenler bağımsız (X), hangisi bağımlı (Y)?