Derin öğrenme, temelde üç veya daha fazla katmana sahip bir sinir ağı olan makine öğrenimin bir alt kümesidir. Bu nöral ağlar, insan beyninin davranışını simüle etmeye çalışır, büyük miktarda veriden öğrenmesine izin verir. New York'taki IBM TJ Watson Laboratories'te derin öğrenme ve yapay zeka uygulamaları için sistem mimarileri uzmanı olan Augusto Vega derin öğrenmeyi şu şekilde açıklıyor: ‘’Derin öğrenme, insan beyninin işleyişine ilişkin bazı ilkelerden ilham alarak, deneyimlerden öğrenme yeteneğine sahip bilgi işlem sistemlerinin incelenmesi ve inşa edilmesi olan yapay zekaya ait bir alandır.’’
Genel olarak bu sistemler, küçük bir çocuğa etrafındaki nesneleri veya sesleri tanımasının öğretilmesine benzer bir şekilde gerçekleşir. Örnek olarak bir çocuğa bir ağacı işaret edip "bu bir ağaç" diyerek veya bir trenin sesini duyduğunuzda "bu bir tren sesi" diyerek nesneler ve sesler öğretilir.
Bu tür makine öğrenimi, söz konusu verilerden farklı düzeylerde ayrıntı çıkaran hiyerarşik bir yapı sunduğu için "derin" olarak adlandırılır. Örneğin, görüntü tanıma sırasında, birleştirildiğinde konturların algılanmasını mümkün kılan ve daha sonra nesnenin farklı kısımlarını tanımayı ve nihai olarak kimliğini belirlemeyi mümkün kılan kenarlar çıkarılır.
Derin öğrenme, çalıştığı veri türü ve öğrenme yöntemleri ile kendisini klasik makine öğreniminden ayırır. Makine öğrenimi algoritmaları, tahminlerde bulunmak için yapılandırılmış, etiketlenmiş verilerden yararlanır; bu, belirli özelliklerin model için girdi verilerinden tanımlandığı ve tablolar halinde düzenlendiği anlamına gelir. Bu mutlaka yapılandırılmamış veri kullanmadığı anlamına gelmez; bu sadece, eğer öyleyse, onu yapılandırılmış bir formatta düzenlemek için genellikle bazı ön işlemlerden geçtiği anlamına gelir.
Derin öğrenme, tipik olarak makine öğrenimiyle ilgili olan bazı veri ön işleme işlemlerini ortadan kaldırır. Bu algoritmalar, metin ve resimler gibi yapılandırılmamış verileri alıp işleyebilir ve özellik çıkarma işlemini otomatikleştirerek insan uzmanlara olan bağımlılığın bir kısmını ortadan kaldırır. Örneğin, farklı evcil hayvanların bir dizi fotoğrafımız olduğunu ve "kedi", "köpek", "hamster" vb. Derin öğrenme algoritmaları, her bir hayvanı diğerinden ayırt etmek için hangi özelliklerin (örneğin kulaklar) en önemli olduğunu belirleyebilir. Makine öğreniminde, bu özellik hiyerarşisi bir insan uzman tarafından manuel olarak oluşturulur.
Daha sonra, gradyan iniş ve geri yayılım süreçleri aracılığıyla, derin öğrenme algoritması, bir hayvanın yeni bir fotoğrafı hakkında artan hassasiyetle tahminler yapmasına izin vererek doğruluk için kendini ayarlar ve uydurur.
Makine öğrenmesi ve derin öğrenme modelleri, genellikle denetimli öğrenme, denetimsiz öğrenme ve takviyeli öğrenme olarak sınıflandırılan farklı öğrenme türlerini de gerçekleştirebilir. Denetimli öğrenme, kategorize etmek veya tahminlerde bulunmak için etiketli veri kümelerini kullanır; bu, girdi verilerini doğru bir şekilde etiketlemek için bir tür insan müdahalesi gerektirir. Bunun aksine, denetimsiz öğrenme, etiketlenmiş veri kümeleri gerektirmez ve bunun yerine, verilerdeki kalıpları algılar ve bunları herhangi bir ayırt edici özelliğe göre kümeler. Takviyeli öğrenme, bir modelin ödülü en üst düzeye çıkarmak için geri bildirime dayalı bir ortamda bir eylemi gerçekleştirmek için daha doğru olmayı öğrendiği bir süreçtir.
Derin öğrenme ağları, deneyimledikleri verilerdeki karmaşık yapıları keşfederek öğrenirler. Ağlar, birden çok işlem katmanından oluşan hesaplamalı modeller oluşturarak, verileri temsil etmek için birden çok soyutlama düzeyi oluşturabilir.
Örneğin, evrişimli sinir ağı olarak bilinen bir derin öğrenme modeli, kedi içerenler gibi çok sayıda (milyonlarca) görüntü kullanılarak eğitilebilir. Bu tür bir sinir ağı, genellikle elde ettiği görüntülerde bulunan piksellerden öğrenir. Bir kedinin özelliklerini temsil eden piksel gruplarını, bir görüntüde bir kedinin varlığını gösteren pençeler, kulaklar ve gözler gibi özellik grupları ile sınıflandırabilir.
Derin öğrenme, geleneksel makine öğreniminden temel olarak farklıdır. Bu örnekte, bir alan uzmanının, bir kediyi temsil eden özellikleri saptamak için geleneksel bir makine öğrenimi sistemini tasarlamak için önemli ölçüde zaman harcaması gerekir. Derin öğrenme ile ihtiyaç duyulan tek şey, sisteme çok sayıda kedi görüntüsü sağlamaktır ve sistem, bir kediyi temsil eden özellikleri otonom olarak öğrenebilir.
Derin öğrenme ağları, deneyimledikleri verilerdeki karmaşık yapıları keşfederek öğrenirler. Ağlar, birden çok işlem katmanından oluşan hesaplamalı modeller oluşturarak, verileri temsil etmek için birden çok soyutlama düzeyi oluşturabilir.
Örneğin, evrişimli sinir ağı olarak bilinen bir derin öğrenme modeli, kedi içerenler gibi çok sayıda (milyonlarca) görüntü kullanılarak eğitilebilir. Bu tür bir sinir ağı, genellikle elde ettiği görüntülerde bulunan piksellerden öğrenir. Bir kedinin özelliklerini temsil eden piksel gruplarını, bir görüntüde bir kedinin varlığını gösteren pençeler, kulaklar ve gözler gibi özellik grupları ile sınıflandırabilir.
Derin öğrenme, geleneksel makine öğreniminden temel olarak farklıdır. Bu örnekte, bir alan uzmanının, bir kediyi temsil eden özellikleri saptamak için geleneksel bir makine öğrenimi sistemini tasarlamak için önemli ölçüde zaman harcaması gerekir. Derin öğrenme ile ihtiyaç duyulan tek şey, sisteme çok sayıda kedi görüntüsü sağlamaktır ve sistem, bir kediyi temsil eden özellikleri otonom olarak öğrenebilir.