Topluluk Yöntemleri - Genel Bakış, Kategoriler, Ana Türler

Ensemble yöntemleri, tek bir model kullanmak yerine birden çok modeli birleştirerek modellerde sonuçların doğruluğunu artırmayı amaçlayan tekniklerdir. Birleşik modeller, sonuçların doğruluğunu önemli ölçüde artırır. Bu, makine öğreniminde topluluk yöntemlerinin popülaritesini artırdı.

Topluluk Yöntemleri

Hızlı özet

  • Topluluk yöntemleri, çok güvenilir bir model oluşturmak için birkaç modeli birleştirerek modellerde öngörülebilirliği artırmayı amaçlar.
  • En popüler topluluk yöntemleri artırma, torbalama ve istiflemedir.
  • Topluluk yöntemleri, modellerin doğruluğunu artırmak için önyargı ve varyansı azalttığı regresyon ve sınıflandırma için idealdir.

Topluluk Yöntemlerinin Kategorileri

Topluluk yöntemleri iki geniş kategoriye ayrılır, yani sıralı topluluk teknikleri ve paralel topluluk teknikleri. Sıralı topluluk teknikleri , bir sırayla temel öğrenenler oluşturur, örneğin, Uyarlamalı Güçlendirme (AdaBoost). Sıralı temel öğrenen nesli, temel öğrenciler arasındaki bağımlılığı teşvik eder. Modelin performansı daha sonra önceden yanlış temsil edilen öğrencilere daha yüksek ağırlıklar atanarak geliştirilir.

Gelen paralel topluluk teknikleri , baz öğrenenler örneğin rastgele orman Rastgele Orman Rastgele orman tahminleri ve davranış analizini modellenmesinde kullanılan bir tekniktir ve karar ağaçları üzerine kuruludur, bir paralel biçimde oluşturulur. Rastgele bir orman birçok karar ağacı içerir. Paralel yöntemler, temel öğrenenler arasındaki bağımsızlığı teşvik etmek için paralel nesil temel öğrenicileri kullanır. Temel öğrenicilerin bağımsızlığı, ortalamaların uygulanmasından kaynaklanan hatayı önemli ölçüde azaltır.

Topluluk tekniklerinin çoğu temel öğrenmede tek bir algoritma uygular, bu da tüm temel öğrenicilerde homojenlikle sonuçlanır. Homojen temel öğrenenler, benzer niteliklere sahip aynı türden temel öğrenicileri ifade eder. Diğer yöntemler heterojen temel öğrenenleri uygular ve heterojen topluluklara yol açar. Heterojen temel öğrenenler, farklı türlerin öğrenicileridir.

Topluluk Yöntemlerinin Ana Türleri

1. Torbalama

Bootstrap toplamanın kısa biçimi olan Torbalama, esas olarak sınıflandırma ve regresyonda uygulanır. Regresyon Analizi Regresyon analizi, bağımlı bir değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkilerin tahmin edilmesi için kullanılan bir dizi istatistiksel yöntemdir. Değişkenler arasındaki ilişkinin gücünü değerlendirmek ve aralarındaki gelecekteki ilişkiyi modellemek için kullanılabilir. . Varyansı büyük ölçüde azaltan karar ağaçlarının kullanılmasıyla modellerin doğruluğunu arttırır. Varyansın azaltılması doğruluğu arttırır, dolayısıyla pek çok öngörücü model için bir zorluk olan aşırı uyumu ortadan kaldırır.

Torbalama, önyükleme ve toplama olmak üzere iki türe ayrılır. Bootstrapping , örneklerin değiştirme prosedürü kullanılarak tüm popülasyondan (set) türetildiği bir örnekleme tekniğidir. Değiştirme yöntemiyle örnekleme, seçim prosedürünün rastgele hale getirilmesine yardımcı olur. Temel öğrenme algoritması, prosedürü tamamlamak için numuneler üzerinde çalıştırılır.

Toplama torbalama tahmin olası tüm sonuçları birleştirmek ve sonucunu rastgele için yapılır. Toplama olmadan tahminler doğru olmayacaktır çünkü tüm sonuçlar dikkate alınmaz. Bu nedenle birleştirme, olasılık önyükleme prosedürlerine veya tahmine dayalı modellerin tüm sonuçlarına dayalıdır.

Torbalama avantajlıdır, çünkü zayıf temel öğrenenler, tek öğrenenlerden daha istikrarlı olan tek ve güçlü bir öğrenci oluşturmak için birleştirilir. Ayrıca herhangi bir farklılığı ortadan kaldırarak modellerin aşırı uyumunu azaltır. Torbalamanın bir sınırlaması, hesaplama açısından pahalı olmasıdır. Bu nedenle, uygun torbalama prosedürü ihmal edildiğinde modellerde daha fazla önyargıya yol açabilir.

2. Güçlendirme

Boosting, gelecekte daha iyi tahminler yapmak için önceki tahmin hatalarından ders alan bir toplu tekniktir. Teknik, güçlü bir öğrenci oluşturmak için birkaç zayıf temel öğreniciyi birleştirir, böylece modellerin öngörülebilirliğini önemli ölçüde geliştirir. Güçlendirme, zayıf öğrencileri bir sıraya göre düzenleyerek çalışır, öyle ki zayıf öğrenciler, daha iyi tahmine dayalı modeller oluşturmak için sıradaki bir sonraki öğrenciden öğrenirler.

Yükseltme, gradyan artırma, Adaptive Boosting (AdaBoost) ve XGBoost (Extreme Gradient Boosting) gibi birçok biçim alır. AdaBoost, çoğunlukla halk arasında karar kütükleri olarak bilinen bir bölünmeyi içeren karar ağaçları şeklindeki zayıf öğrenicilerden yararlanır. AdaBoost'un ana karar kaynağı, benzer ağırlıklara sahip gözlemlerden oluşur.

Gradyan artırma Gradyan Arttırma Gradyan artırma, tahmin için modeller oluşturmada kullanılan bir tekniktir. Teknik çoğunlukla regresyon ve sınıflandırma prosedürlerinde kullanılır. önceki tahminçilerin ardıllarını düzelttiği ve böylece modelin doğruluğunu artırdığı yerde, topluluğa art arda tahmin edicileri ekler. Yeni tahmin ediciler, önceki tahmin edicilerdeki hataların etkilerine karşı koymak için uygundur. İniş eğimi, öğrencilerin tahminlerindeki sorunları tanımlamada ve bunlara uygun şekilde karşı koymada gradyan güçlendiriciye yardımcı olur.

XGBoost, artırılmış eğimli karar ağaçlarından yararlanarak gelişmiş hız ve performans sağlar. Hedef modelin hesaplama hızına ve performansına büyük ölçüde dayanır. Model eğitimi bir sırayı takip etmeli, böylece gradyan destekli makinelerin uygulamasını yavaşlatmalıdır.

3. İstifleme

Başka bir toplu yöntem olan istifleme, genellikle yığın genelleme olarak adlandırılır. Bu teknik, bir eğitim algoritmasının diğer birkaç benzer öğrenme algoritması tahminini bir araya getirmesine izin vererek çalışır. Yığınlama, regresyon, yoğunluk tahminleri, uzaktan öğrenme ve sınıflandırmalarda başarıyla uygulanmıştır. Torbalama sırasında ortaya çıkan hata oranını ölçmek için de kullanılabilir.

Varyans Azaltma

Ensemble yöntemleri, modellerdeki varyansı azaltmak ve dolayısıyla tahminlerin doğruluğunu artırmak için idealdir. Birden çok model birleştirildiğinde, birleştirilmiş modellerden tüm diğer olası tahminlerden seçilen tek bir tahmin oluşturduğunda varyans ortadan kalkar. Bir modeller topluluğu, tüm tahminlerin dikkate alınmasına dayalı olarak ortaya çıkan tahminin mümkün olan en iyi olmasını sağlamak için çeşitli modelleri bir araya getirme eylemidir.

Ek kaynaklar

Finance, küresel Sertifikalı Bankacılık ve Kredi Analisti (CBCA) ™ CBCA ™ Sertifikasyonunun resmi sağlayıcısıdır Sertifikalı Bankacılık ve Kredi Analisti (CBCA) ™ akreditasyonu, finans, muhasebe, kredi analizi ve nakit akışı analizini kapsayan kredi analistleri için küresel bir standarttır , sözleşme modelleme, kredi geri ödemeleri ve daha fazlası. Herkesin birinci sınıf bir finansal analist olmasına yardımcı olmak için tasarlanmış sertifika programı. Kariyerinizi ilerletmeye devam etmek için aşağıdaki ek Finans kaynakları faydalı olacaktır:

  • Elastic Net Elastic Net Elastic net, regresyon modellerini düzenlemek için hem kement hem de sırt tekniklerinden gelen cezaları doğrusal olarak kullanır. Teknik hem kementi hem de kementi birleştirir
  • Overfitting Overfitting Overfitting, bir fonksiyon belirli bir veri setine çok yakın olduğunda ortaya çıkan bir modelleme hatasını ifade eden istatistiklerde kullanılan bir terimdir.
  • Ölçeklenebilirlik Ölçeklenebilirlik Ölçeklenebilirlik hem finansal hem de iş stratejisi bağlamlarında düşebilir. Her iki durumda da, kuruluşun aşağıdaki baskılara dayanma kabiliyetini ifade eder:
  • Sahtekarlık Sahtekarlığı Sahtekarlık, vadeli işlem sözleşmelerini satın almak veya satmak için teklifler vermeyi ve anlaşmanın yürütülmesinden önce teklifleri veya teklifleri iptal etmeyi içeren yıkıcı bir algoritmik ticaret uygulamasıdır. Uygulama, piyasada yanlış bir talep resmi veya yanlış karamsarlık yaratmayı amaçlamaktadır.