Pekiştirmeli öğrenme algoritmaları

Istanbul Aydin University

Pekiştirmeli öğrenme

Bir aracının ödülleri en üst düzeye çıkarmak için bir görevi yerine getirmek için elinden gelenin en iyisini yapmaya çalıştığı pekiştirmeli öğrenme (RL) A* Arama

Pekiştirmeli öğrenme

Esneklik: Pekiştirmeli öğrenme algoritmaları, dinamik ve belirsiz ortamlarda bile etkili bir şekilde çalışabilir

Örneğin, bir ekipman parçası “F” (başarısız) veya “R” (çalışıyor) olarak etiketlenmiş veri noktalarına sahip olabilir

Denetimsiz öğrenme algoritmaları, denetimli öğrenmeye kıyasla daha karmaşık işleme görevleri gerçekleştirmenizi sağlar

Bu başlıklardan ilki Eğiticisiz Öğrenme (Unsupervised Learning); bu blogta da değindiğimiz K-Means, Temel Bileşen Analizi gibi yöntemleri kapsamaktadır

edu

Bu çalışmada, yapay sinir ağları ve pekiştirmeli öğrenmenin birleşiminden oluşan Deep Deterministic Policy Gradient (DDPG) derin pekiştirme öğrenme algoritması Dikey Kalkış ve İniş (VTOL) sistemi modeline yunuslama (pitch) açısını kontrol edebilme amacıyla uygulanmıştır

Pekiştirmeli Öğrenme, denetimli ve denetimsiz öğrenmenin bir karışımı olmakla birlikte genellikle daha karmaşık problemleri çözmek için kullanılır ve bir çevre ile etkileşim Pekiştirmeli Öğrenme’de YSA değer fonksiyonlarını öğrenmek için TD hatasını kullanabilmekte, gradyen haydut ve politika gradyenini eğitmek için kullanılabilmektedir

Makine öğrenme algoritmaları, yarı otonom bir arabanın kısmen görünür bir nesneyi tanımasını ve sürücüyü uyarmasını mümkün kılabilir

Hemen hemen tüm Pekiştirmeli Öğrenme algoritmaları, durumların ajan için ne kadar önemli olduğu gösteren değer fonksiyonlarının tahminlemesini kullanmaktadır

Denetimli Öğrenme (Supervised Learning): Etiketli verilerden eğitim ve test kümesi oluşturarak eğitim kümesinden bir model oluşturulmasını sağlayan ve modelin performansını test kümesi üzerinden

\(n\)-adımlı yöntemler, bir ucunda Monte Carlo metotları

Denetimsiz öğrenme algoritmaları, denetimli öğrenmeye kıyasla daha karmaşık işleme görevleri gerçekleştirmenizi sağlar