Bu siteyi kullanarak Gizlilik Politikasını ve Kullanım Koşullarını kabul etmiş olursunuz.
Kabul et
Forty TwoForty Two
  • Hakkımızda
  • Kategoriler
  • Elektrikli Araç (EV)
    Elektrikli Araç (EV)
    “Elektrikli araçlar, şarj teknolojileri ve EV dünyasındaki en son gelişmeler Forty Two’da! Ulaşım ve geleceğin otomobilleri hakkında bilgi edinin.”
    Daha Fazla Göster
    En İyi Haberler
    Toyota Urban SUV: Elektrikli Subcompact SUV’lar için Umut Verici Bir Gelecek
    13 Aralık 2023
    Tesla, Cybercab'i tanıttı: 30.000 Dolarlık Elektrikli Robotaksi
    Tesla, Cybercab’i tanıttı: 30.000 Dolarlık Elektrikli Robotaksi
    11 Ekim 2024
    Voltpost Kaldırım Kenarı Elektrikli Araç Şarjında Nasıl Devrim Yaratıyor? Lamppost Çözümü
    26 Nisan 2024
    Son Haberler
    Tesla Supercharger Sırasına, Yüksek Teknolojili Bir Çözüm Getiriyor
    2 Temmuz 2025
    Tesla Robotaksi Hizmetini Austin’de Başlattı
    2 Temmuz 2025
    Yenilenmiş Tesla Model S ve Model X Çıktı! İşte Tüm Yenilikler
    16 Haziran 2025
    Xiaomi YU7 Sahneyi Ele Geçirdi: Tesla’yı Tedirgin Eden Elektrikli SUV
    27 Mayıs 2025
  • Yapay Zeka
    Yapay Zeka
    “Yapay zekâ dünyasındaki en son gelişmeler, makine öğrenimi, derin öğrenme ve AI teknolojileri hakkında detaylı içerikler Forty Two’da!”
    Daha Fazla Göster
    En İyi Haberler
    OpenAI Liderlik Geçişini Duyurdu: Sam Altman CEO Görevini Bırakıyor
    18 Kasım 2023
    Sam Altman GPT-5 Hakkında Konuştu
    15 Şubat 2024
    xAI, Dell ve Nvidia ile İş Birliği Yaparak Son Teknoloji Bir Yapay Zeka Süper Bilgisayarı Oluşturuyor
    26 Haziran 2024
    Son Haberler
    Gemini Video Yükleme Özelliği Tanıtıldı: AI ile Videolarınızı Anında Analiz Edin!
    20 Haziran 2025
    OpenAI Codex’i Tanıttı: Yazılım Geliştirme Şeklimizi Değiştiren AI Kodlama Asistanı
    21 Mayıs 2025
    ChatGPT Model Seçimi Rehberi: 2025’te Projelerinize En Uygun Modeli Bulun!
    10 Mayıs 2025
    Grok AI ile Kitap Kapağı Tasarımı: Yapay Zeka ile Raflarda Öne Çıkın!
    7 Mayıs 2025
  • Film
    FilmDaha Fazla Göster
    En İyi Biyografi Filmleri: Gerçek Hayatların Epik Dramasını Yaşatan 20 Yapım!
    En İyi Biyografi Filmleri: Gerçek Hayatların Epik Dramasını Yaşatan 20 Yapım!
    25 Haziran 2025
    En İyi Dram Filmleri: Sizi Gözyaşlarına Boğacak En İyi 20 Dram Filmi
    En İyi Dram Filmleri: Sizi Gözyaşlarına Boğacak En İyi 20 Dram Filmi
    4 Haziran 2025
    En İyi Yarış Filmleri: Hız ve Dram Arayanlar için 20 Unutulmaz Sinema Şöleni
    En İyi Yarış Filmleri: Hız ve Dram Arayanlar için 20 Unutulmaz Sinema Şöleni
    1 Haziran 2025
    Okulda İzlenebilecek Filmler: Öğretmen ve Öğrenciler için 15 Motivasyon Dolu Film!
    Okulda İzlenebilecek Filmler: Öğretmen ve Öğrenciler için 15 Motivasyon Dolu Film!
    20 Mayıs 2025
    Açlık Oyunları İzleme Sırası: Panem'de Hayatta Kalma Rehberi
    Açlık Oyunları İzleme Sırası: Panem’de Hayatta Kalma Rehberi
    14 Mayıs 2025
  • Ekip
  • İletişim
Okuyorum: Makine Öğreniminde Feature Engineering: Girdilerden Değer Çıkarmaya Yönelik Kanıtlanmış Teknikler
Paylaş
Yazı Tipi BoyutlandırıcıAa
Forty TwoForty Two
Yazı Tipi BoyutlandırıcıAa
Arama
  • Anime/Manga
  • Dizi
  • Film
  • Kitap
  • Yapay Zeka
  • Kategoriler
  • Ekip
  • Hakkımızda
  • İletişim
Takip et

Tüm Hakları Saklıdır © 2025 Forty Two

Ana Sayfa > Veri Bilimi > Makine Öğreniminde Feature Engineering: Girdilerden Değer Çıkarmaya Yönelik Kanıtlanmış Teknikler
Veri Bilimi

Makine Öğreniminde Feature Engineering: Girdilerden Değer Çıkarmaya Yönelik Kanıtlanmış Teknikler

Fatih Ilhan
Son güncelleme: 4 Ocak 2024 12:12
Fatih Ilhan
Fatih Ilhan
Mühendis & SEO Uzmanı
Elektrik-Elektronik Mühendisi ve Forty Two’nun kurucu ortağıyım. Teknoloji, bilim ve anime dünyasından içerikler hazırlıyorum. WordPress ve SEO tutkunu bir içerik üreticisi olarak, burada merakımı sizinle paylaşıyorum!
Takip et:
- Mühendis & SEO Uzmanı
59 Görüntülemeler
Paylaş
8 Dk Okuma
Paylaş

Algoritmaların hüküm sürdüğü makine öğrenimini dünyasında, özellik mühendisliğinin önemi küçümsenemez. Ham verileri anlamlı içgörülere dönüştürebilen ve modellerinizin gerçek potansiyelini ortaya çıkarabilen gizli bileşendir. Bu kapsamlı kılavuzda, özellik mühendisliğine şöyle bir bakacak, tanımını, tekniklerini ve yol gösterici örneğimiz olarak ünlü IRIS veri setini inceleyeceğiz. Makine Öğreniminde Feature Engineering yazımıza başlayalım!

İçindekiler
Feature Engineering (Özellik mühendisliği) Nedir?IRIS Veri Setini AnlamakGerekli Kütüphaneler:Veri Setini YükleyelimVeri GörselleştirmeFeature Engineering Teknikleri1. Ölçeklendirme ve Normalleştirme2. Eksik Değerleri Ele Alma3. Kategorik Değişkenlerin Kodlanması4. Etkileşim Özellikleri Oluşturma5. Özellik çıkarma6. Özellik SeçimiML Modelimizi KuralımVerileri eğitim ve test setlerine ayıralımBir makine öğrenimi modeli seçelimModeli eğitelimModeli değerlendirelimTahminlerde bulunalımSonuçları DeğerlendirelimForty Two Veri Bilimi Serisi

Feature Engineering (Özellik mühendisliği) Nedir?

Makine öğrenimi alanında özellik mühendisliği, ham verileri model eğitimi için daha uygun bir biçime dönüştürme sanatıdır. Makine öğrenimi algoritmalarının performansını artırmak için özelliklerin seçilmesini, oluşturulmasını ve dönüştürülmesini içerir. Feature Engineering, ilgili bilgileri çıkararak ve gürültüyü ortadan kaldırarak modellerin tahmin gücünü artırır ve karmaşık kalıpları yakalamalarını sağlar.

IRIS Veri Setini Anlamak

Feature Engineering (Özellik Mühendisliği) kavramlarını açıklamak için, makine öğrenimi alanında ünlü bir kıyaslama veri kümesi olan IRIS veri kümesini seçtim. Veri kümesi, her biri üç özelliğe sahip 50 iris çiçeği örneğinden oluşmaktadır: sepal uzunluk, sepal genişlik, yaprak uzunluk ve yaprak genişlik. Amaç, çiçekleri üç türden birine sınıflandırmaktır: setosa, versicolor veya virginica.

Makine Öğreniminde Feature Engineering: Girdilerden Değer Çıkarmaya Yönelik Kanıtlanmış Teknikler

Gerekli Kütüphaneler:

Şimdi kütüphanelerimizi ekleyerek incelemeye başlayalım!

  • Sklearn.preprocessing from StandardScaler: Sayısal özelliklerin ölçeklendirilmesini ve normalleştirilmesini gerçekleştiren bir sınıf.
  • Sklearn.preprocessing from OneHotEncoder: Kategorik değişkenlerin tek seferde kodlanmasını gerçekleştiren bir sınıf.
  • Sklearn.impute from SimpleImputer: Veri kümesindeki eksik değerleri işleyen bir sınıf.
  • Sklearn.decomposition from PCA: Özellik çıkarımı için temel bileşen analizini gerçekleştiren bir sınıf.
  • Sklearn.feature_selectio from SelectKBest ve f_classif: İstatistiksel testlere dayalı olarak özellik seçimi gerçekleştiren sınıflar.

Veri Setini Yükleyelim



Veri Görselleştirme

Verisetinde eksik değer ya da ikileme bulunmadığı için görselleştirmelere geçiyoruz. 


Sayısal özelliklerin dağılımlarını histogramları kullanarak görselleştirelim. 

Her bir özelliğin farklı iris türleri arasındaki dağılımını ve değişkenliğini görmek için kutu grafikleri oluşturalım.

Feature Engineering Teknikleri

Bu bölümde, IRIS veri setini geliştirmek ve modellerimizin performansını artırmak için uygulanabilecek çeşitli özellik mühendisliği tekniklerini keşfedeceğiz. Her bir tekniği ayrıntılı olarak inceleyelim.

1. Ölçeklendirme ve Normalleştirme

Özellik mühendisliğindeki yaygın tekniklerden biri ölçeklendirme ve normalleştirmedir. Bu, özellikleri ortak bir ölçeğe dönüştürerek modele eşit katkıda bulunmalarını sağlamayı içerir. Bu teknik, özellikler farklı aralıklara veya ölçüm birimlerine sahip olduğunda özellikle kullanışlıdır.

SepalLengthCm, SepalWidthCm, PetalLengthCm ve PetalWidthCm sayısal özellikleri, scikit-learn’deki StandardScaler kullanılarak standartlaştırılmıştır. Bu, özelliklerin sıfır ortalama ve birim varyansa sahip olmasını sağlayarak onları karşılaştırılabilir ve belirli makine öğrenimi algoritmaları için uygun hale getirir.

2. Eksik Değerleri Ele Alma

SepalLengthCm, SepalWidthCm, PetalLengthCm ve PetalWidthCm sayısal özelliklerindeki eksik değerler (varsa), scikit-learn’den SimpleImputer tarafından sağlanan ortalama strateji kullanılarak hesaplanır. Bu, eksik değerleri ilgili her özelliğin ortalama değeriyle doldurur.

3. Kategorik Değişkenlerin Kodlanması

Kategorik değişken Türler, tek geçişli kodlama kullanılarak kodlanır. Scikit-learn’in OneHotEncoder’ı, kategorik değişkeni ikili sütunlara dönüştürmek için kullanılır; burada her sütun, orijinal Tür değişkenindeki benzersiz bir kategoriyi temsil eder.

4. Etkileşim Özellikleri Oluşturma

İki yeni özellik, SepalAreaCm2 ve PetalAreaCm2, sırasıyla SepalLengthCm ve SepalWidthCm ile PetalLengthCm ve PetalWidthCm’nin öğe bazında çarpımı gerçekleştirilerek oluşturulur. Bu etkileşim özellikleri mevcut iki özelliğin çarpımını yakalar ve modele ek bilgi sağlayabilir.

5. Özellik çıkarma

Veri setinin boyutluluğunu azaltmak için Temel Bileşen Analizi (PCA) uygulanır. Dört orijinal sayısal özellik SepalLengthCm, SepalWidthCm, PetalLengthCm ve PetalWidthCm, orijinal özelliklerin doğrusal kombinasyonları olan PCA1 ve PCA2 olmak üzere iki yeni özelliğe dönüştürülür. Bu yeni özellikler verilerdeki maksimum varyansın yönlerini temsil eder.

6. Özellik Seçimi

Bu kod satırı, özellik seçme tekniğini (SelectKBest) uyguladıktan sonra seçilen özellikleri depolamak için yeni bir DataFrame (selected_features_df) oluşturur.

ML Modelimizi Kuralım

Verileri eğitim ve test setlerine ayıralım

Modeli kurmadan önce verilerinizi bir eğitim seti ve bir test seti olarak bölmek çok önemlidir. Bu, modeli bir veri alt kümesi üzerinde eğitmemize ve görünmeyen veriler üzerindeki performansını değerlendirmemize olanak tanır. Bunu başarmak için sklearn.model_selection modülündeki train_test_split işlevini kullanalım.

Burada X_train ve y_train eğitim verileri (özellikler ve hedef), X_test ve y_test ise test verileri olacaktır.

Bir makine öğrenimi modeli seçelim

Bu örnek için Lojistik Regresyon modeliyle devam edelim;

Modeli eğitelim

Artık modeli eğitim verilerini kullanarak eğitebiliriz

Modeli değerlendirelim

Eğitimden sonra test verilerini kullanarak performansını değerlendirebiliriz.

Model accuracy: 1.0

Tahminlerde bulunalım

Modeli eğittikten sonra test verilerini kullanarak performansını değerlendirebiliriz.

Predicted labels: [0. 0. 1. 0. 0. 0. 0. 1. 0. 0. 1. 0. 0. 0. 0. 0. 1. 0. 0. 1. 0. 1. 0. 1.
 1. 1. 1. 1. 0. 0.]

Modelin performansını daha ayrıntılı değerlendirmek için tahmin edilen etiketleri gerçek etiketlerle (y_test) karşılaştırabilirsiniz. Örneğin, sklearn.metrics modülündeki işlevleri kullanarak hassasiyet, geri çağırma ve F1 puanı gibi ölçümleri hesaplayabilirsiniz:

Classification Report:
              precision    recall  f1-score   support
         0.0       1.00      1.00      1.00        19
         1.0       1.00      1.00      1.00        11
    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30

Sonuçları Değerlendirelim

Örneğimizde, iris_data veri kümesinden en iyi 3 özelliği seçmek için puanlama fonksiyonu olarak karşılıklı bilgi ile SelectKBest özellik seçme tekniğini uyguladık. Bunu yaparak, veri kümesinin boyutluluğunu azalttık ve yalnızca en bilgilendirici özellikleri koruduk.

Feature Engineering uyguladıktan sonra, değiştirilmiş veri kümesi üzerinde bir Lojistik Regresyon modeli eğittik ve performansını değerlendirdik. Modelin test verilerinde 1,0’lık mükemmel bir doğruluk elde ettiğini gözlemledik; bu da seçilen özelliklerin son derece bilgilendirici olduğunu ve modelimizin örnekleri doğru bir şekilde sınıflandırmasını sağladığını gösteriyor.

Karışıklık matrisi: Modelin yaptığı doğru ve yanlış tahminlerin sayısına genel bir bakış sağlar. Isı haritası görselleştirmesi, modelin sorun yaşıyor olabileceği kalıpları veya alanları belirlememize yardımcı olur.

Feature Engineering, özellikle de özellik seçimi, model performansının iyileştirilmesinde ve boyutluluğun azaltılmasında çok önemli bir rol oynar.

Puanlama fonksiyonu olarak karşılıklı bilgi ile kullanılan SelectKBest tekniği, hedef değişkenle olan ilişkilerine dayanarak en alakalı özellikleri seçmemizi sağlar.

Bu makalede, özellik mühendisliğinin (Feature Engineering) özünü ve makine öğrenimindeki rolünü araştırdık. Ölçekleme ve normalleştirme, eksik değerlerin ele alınması, kategorik değişkenlerin kodlanması, etkileşim özelliklerinin oluşturulması, özellik çıkarımı ve özellik seçimi gibi çeşitli teknikleri inceledik. Bu teknikleri ünlü IRIS veri setine uygulayarak, ham verilerin anlamlı içgörülere dönüştürülmesine tanık olduk.

Bu işlemler sayesinde yalnızca güçlü bir makine öğrenimi modeli oluşturmakla kalmadık, aynı zamanda model performansını iyileştirmede özellik mühendisliğinin önemini de öğrendik. Feature Engineering, en bilgilendirici özellikleri seçmemize olanak tanıyarak son derece doğru bir model ortaya çıkardı.

Feature Engineering yazısı için oluşturduğum Notebook’u Kaggle hesabımda bulabilirsiniz. Daha fazla veri bilimi içeriği için lütfen takipte kalın.

Forty Two Veri Bilimi Serisi

    ETİKETLER:#AI#datascience#datavisualizations#featureengineering#fortytwo#fortytwofficial#kaggle#ML#model#Verianalizi#veribilimi
    Bu İçeriği Paylaş
    Pinterest LinkedIn Reddit Bluesky Bağlantıyı Kopyala Yazdır
    BU İÇERİĞE EMOJİYLE TEPKİ VER
    0
    0
    0
    0
    0
    0
    0
    Fatih Ilhan
    Mühendis & SEO Uzmanı
    Takip et:
    Elektrik-Elektronik Mühendisi ve Forty Two’nun kurucu ortağıyım. Teknoloji, bilim ve anime dünyasından içerikler hazırlıyorum. WordPress ve SEO tutkunu bir içerik üreticisi olarak, burada merakımı sizinle paylaşıyorum!
    Önceki İçerik Podcast Günlüğü: İngilizce Becerilerinizi Geliştirmek için En İyi 10 Podcast
    Sonraki İçerik Perihelion Günü Fenomeni: Dünya’nın Güneş’e En Yakın Anı
    Yorum yapılmamış Yorum yapılmamış

    Bir yanıt yazın Yanıtı iptal et

    E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

    Sosyal Medya'da Forty Two

    XTakip et
    PinterestPin
    InstagramTakip et
    LinkedInTakip et
    BlueskyTakip et

    Reklam

    Son Yazılar

    MIT Otonom Robotu, Daha İyi Güneş Enerjisi Malzemeleri Arayışını Hızlandırıyor
    MIT Otonom Robotu, Daha İyi Güneş Enerjisi Malzemeleri Arayışını Hızlandırıyor
    Yenilenebilir Enerji
    9 Temmuz 2025
    Squid Game Benzeri Diziler: Ahlak ve Hayatta Kalma Sınavında 12 Dizi!
    Squid Game Benzeri Diziler: Ahlak ve Hayatta Kalma Sınavında 12 Dizi!
    Dizi
    9 Temmuz 2025
    Squid Game 3. Sezon İncelemesi: Acımasız Final Bölümünde Neler Oldu?
    Squid Game 3. Sezon İncelemesi: Acımasız Final Bölümünde Neler Oldu?
    Dizi
    7 Temmuz 2025
    Dyson Süpürmeyi Bıraktı, Meyve Büyütmeye Başladı!
    Dyson Süpürmeyi Bıraktı, Meyve Büyütmeye Başladı!
    Teknoloji
    7 Temmuz 2025

    Bunları da Beğenebilirsin!

    Elektrikli Araç (EV)

    Lucid Gravity: Etkileyici Menzili ve Tasarımıyla Ezber Bozan Elektrikli SUV

    14 Aralık 2023
    Veri Bilimi

    Açık Veri Setleri Bulmak İçin En İyi 15 Kaynak

    12 Nisan 2024
    Uzay

    RocketLab Tekrarlanabilir Fırlatma Arayışı: Uzay Uçuşlarında Yeni Yöntemler

    3 Şubat 2024
    Uzay

    2024’ün Heyecan Verici Uzay Uçuşu Görevlerini Keşfedelim

    30 Aralık 2023

    Forty Two ile hayatın, evrenin ve her şeyin sırrını keşfetme yolculuğu.

    • X
    • Instagram
    • LinkedIn
    • Pinterest
    • Bluesky

    Kategoriler

    • Anime/Manga
    • Bilim
    • Dizi
    • Kitap
    • Teknoloji

    Faydalı Linkler

    • Hakkımızda
    • Çerez Politikası
    • Gizlilik Politikası
    • Sponsorluk
    • İletişim

    Son Yazılar

    • MIT Otonom Robotu, Daha İyi Güneş Enerjisi Malzemeleri Arayışını Hızlandırıyor
    • Squid Game Benzeri Diziler: Ahlak ve Hayatta Kalma Sınavında 12 Dizi!
    • Squid Game 3. Sezon İncelemesi: Acımasız Final Bölümünde Neler Oldu?

    Tüm Hakları Saklıdır © 2025 Forty Two

    Kullanıcı Adı veya E-posta Adresi
    Şifre

    Parolanızı mı unuttunuz?