Co to jest deep learning (uczenie głębokie)?
Deep learning (głębokie uczenie) to iteracyjne rozwiązanie stosowane w sztucznej inteligencji (AI), które układa algorytmy uczenia maszynowego (machine learning) w hierarchię o rosnącej złożoności i abstrakcji. Każdy poziom deep learning jest tworzony na podstawie wiedzy zdobytej w poprzedniej warstwie hierarchii.
Na przykład pierwsza warstwa algorytmu głębokiego rozpoznawania obrazu może koncentrować się na nauce wzorców kolorów w danych szkoleniowych, a następna warstwa – na kształtach. Docelowo hierarchia będzie miała warstwy, które skupią się na różnych kombinacjach kolorów i kształtów, a górna warstwa skoncentruje się na rozpoznawanym obiekcie.
Głębokie uczenie jest obecnie najbardziej złożoną ze stosowanych architektur sztucznej inteligencji. Do popularnych algorytmów głębokiego uczenia należą:
Konwolucyjna sieć neuronowa (CNN) – splotowa sieć neuronowa, w której algorytm może przypisywać różnym obiektom na obrazie wagi oraz odchylenia i odróżniać jeden obiekt od drugiego. Stosuje się ją do wykrywania obiektów i klasyfikacji obrazów.
Rekurencyjne sieci neuronowe (RNN) – algorytm potrafi zapamiętać dane sekwencyjne. Stosuje się je do rozpoznawania mowy i głosu, przewidywania szeregów czasowych oraz przetwarzania języka naturalnego.
Sieci z długą pamięcią krótkotrwałą (LSTM) – algorytm może uczyć się zależności czasowej w problemach przewidywania sekwencji. Wykorzystuje się je w tłumaczeniu maszynowym i modelowaniu języka.
Generatywne sieci przeciwstawne (GAN) – dwa algorytmy konkurują ze sobą i wykorzystują swoje błędy jako nowe dane szkoleniowe. Używa się ich w cyfrowym przywracaniu zdjęć i filmach deepfake.
Głębokie sieci przekonań (deep belief networks) – nienadzorowany algorytm głębokiego uczenia, w którym każda warstwa ma dwa cele: działa jako warstwa ukryta dla tego, co było wcześniej, i warstwa widoczna dla tego, co nastąpi. Stosuje się je w sektorze opieki zdrowotnej do wykrywania raka i innych chorób.
Techopedia wyjaśnia pojęcie deep learningu
Deep learning służy do budowania i trenowania sieci neuronowych oraz węzłów sieci decyzyjnych. Uchodzi za podstawową technologię czwartej rewolucji przemysłowej (Przemysł 4.0) i Web3.
Uczenie głębokie eliminuje ręczną identyfikację cech w danych i zamiast tego opiera się na dowolnym procesie uczenia w celu odkrycia użytecznych wzorców w przykładach wejściowych. To ułatwia i przyspiesza szkolenie sieci neuronowej, a także może zapewnić lepsze wyniki, co pozwala rozwijać dziedzinę sztucznej inteligencji.
Algorytm uważa się za głęboki, gdy dane wejściowe przechodzą przez szereg nieliniowości lub nieliniowych przekształceń, zanim staną się danymi wyjściowymi. Obecnie większość rozwiązań biznesowych wykorzystuje algorytmy płytkiego uczenia maszynowego.
Wąska sztuczna inteligencja, zwana też płytką, nie buduje hierarchii wywołań podprogramów. Zamiast tego ten rodzaj algorytmu uczenia się jest przeznaczony do wykonywania pojedynczego, oddzielnego zadania.