Öznitelik çıkarımı
Makine öğrenimi, örüntü tanıma ve görüntü işleme alanlarında kullanılan öznitelik çıkarımı (özellik çıkarımı), girdi olarak verilen ölçülmüş verileri kullanarak türetilmiş değerler (öznitelikler) oluşturur. Türetilen değerlerin bilgilendirici ve artıksız olması, öğrenme sürecini kolaylaştırıcı olması ve bazı durumlarda insan uzmanlar tarafından daha iyi anlaşılabilir (yorumlanabilir) olması amaçlanır. Öznitelik çıkarımı, boyut indirgeme konusuyla ilişkilidir.
Makine öğrenmesi ve veri madenciliği |
---|
Problemler
|
|
|
|
Yapılandırılmış tahmin
|
Anomali tespiti
|
|
|
Teori
|
Konferanslar ve dergiler
|
Genel
Öznitelik çıkarımı büyük bir veri kümesini açıklamak için gereken kaynak miktarını azaltmayı içerir. Karmaşık bir veri üzerinde analiz yapılırken ortaya çıkan ana problemlerden biri de kullanılan değişken sayısının artmasıdır. Çok fazla değişken içeren analizler genellikle büyük bir bellek alanına ve işlemci gücüne gereksinim duyar, ayrıca sınıflandırma algoritmalarının eğitim kümesine aşırı uymasına sebep olarak tahmin performansını düşürür. Öznitelik çıkarımı, değişkenlerin kombinasyonlarını oluşturarak bu sorunları aşmayı ve veriyi yeterli bir doğrulukla açıklayabilir olmayı sağlayan yöntemleri tanımlayan genel bir terimdir.
Öznitelikler bir alan uzmanı tarafından öznitelik mühendisliği yapılarak çıkarılabilir. Eğer böyle bir uzman bilgisi mevcut değilse genel boyut indirgeme yöntemleri kullanılabilir.[1] Bunlardan bazıları:
- Temel bileşen analizi (PCA)
- Doğrusal ayırma analizi (LDA)
- Faktör analizi
- Otomatik kodlayıcı (İngilizce: Autoencoder)
- Eşölçülü özellik haritalama (İngilizce: Isomap)
- Derin öznitelik sentezi
Görüntü işleme
Önemli bir uygulama alanı görüntü işlemedir. Bir görüntünün ya da videonun içinden istenilen kısımların ya da şekillerin (öznitelikler) çeşitli algoritmalar yardımıyla tespit edilmesi ve yalıtılması için kullanılır. Özellikle optik karakter tanıma konusunda kullanımı önemlidir.
Öznitelik çıkarma yazılımları
Birçok veri analizi yazılımı öznitelik çıkarımını ve boyut indirgemeyi içeren paketler sağlar. Yaygın sayısal programlama ortamlarından MATLAB, SciLab, NumPy veR programlama dili bazı basit öznitelik çıkarma yöntemlerini dahili komutlar ile destekler. Daha özellikli algoritmalara kamuya açık kodlar ya da eklentiler olarak ulaşılabilir.
Kaynakça
- Ethem Alpaydın (2010). Introduction to Machine Learning. Londra: The MIT Press. s. 110. ISBN 978-0-262-01243-0. 2 Mart 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Şubat 2017.