Encyklopedia Ipsos: uczenie maszynowe

Uczenie maszynowe to zestaw technik i narzędzi, które pozwalają komputerom "myśleć" poprzez przewidywanie i definiowanie wzorców danych.

Encyklopedia Ipsos: uczenie maszynowe

Definicja

Uczenie maszynowe to zestaw technik i narzędzi, które pozwalają komputerom "myśleć" poprzez przewidywanie i definiowanie wzorców danych. Maszyny te do procesu uczenia się używają algorytmów matematycznych. Maszyna wykorzystuje algorytmy do analizy danych, uczenia się z nich, a następnie wnioskowania i przewidywania.

Zamiast ręcznie kodowanych poleceń zawierających instrukcje dot. wykonania jakiejś czynności, maszyna jest „szkolona” przy pomocy dużej ilości danych i algorytmów, które pozwalają jej uczyć się, jak należy wykonać daną czynność.

Uczenie maszynowe to dziedzina informatyki zajmująca się projektowaniem i wdrażaniem algorytmów, których celem jest optymalizacja według kryterium wydajności.

Komputery są zaprogramowane do uczenia się na podstawie kombinacji przykładowych (szkoleniowych) danych, wcześniejszej wiedzy z danej dziedziny oraz techniki prób i błędów, tak, aby przewidywać, klasyfikować lub grupować nowe dane.

Podstawowym zadaniem uczenia maszynowego jest wnioskowanie z próby - to znaczy uogólnianie na podstawie ograniczonych zestawów danych. Opracowując programy, które automatycznie doskonalą  się wraz z nabywanym doświadczeniem, procedury uczenia się maszyn dostosowują się do zmieniających się warunków oraz wykrywają i ekstrapolują znaczące wzorce danych.

Przydatność uczenia maszynowego

Jak zauważył Arthur Samuel, pionier sztucznej inteligencji „Uczenie maszynowe to dziedzina nauki, która daje komputerom możliwość uczenia się bez zaprogramowania". Jest tak, gdy uczenie maszynowe jest najbardziej przydatne, w szczególności, gdy problemu z danymi nie da się rozwiązać bezpośrednio.
Komputery wymagają sekwencji instrukcji do generowania danych wyjściowych na bazie danego wsadu. Istnieją jednak pewne zadania, w przypadku których algorytm nie jest ewidentny lub zmienia się w czasie, na przykład rozpoznawanie mowy lub wykrywanie nieuczciwych transakcji kartą kredytową. Mimo, że dane wejściowe są dostępne i maszyna może wiedzieć, jaki powinien być wynik, nie jest oczywiste, jak przekształcić dane wejściowe na wyjściowe.
Biorąc pod uwagę wystarczającą liczbę przykładowych danych, algorytm uczenia maszynowego może nauczyć się, jaki powinien być wynik. Dzieje się tak dlatego, że zakłada się, że istnieje proces wyjaśniający obserwowane dane - że istnieje proces generatywny, który nie jest całkowicie losowy i że można wyodrębnić wzorce w danych. Chociaż tego mechanizmu nie można bezpośrednio zdefiniować, można zbudować dobre i użyteczne przybliżenie.


Predykcyjność czy opisowość

Uczenie maszynowe może być predykcyjne, mające na celu dokładne przewidywanie w przyszłości lub opisowe, którego celem jest zdobycie wiedzy lub też  jedno i drugie.

To rozróżnienie można również rozpatrywać pod kątem rodzaju uczenia: nadzorowane lub nie \nadzorowane. Nadzorowane uczenie się to kategoria technik uczenia, w których algorytmy są "szkolone" na początkowym zestawie danych, a następnie testowane na zupełnie nowym zestawie danych. Uczenie się bez nadzoru odbywa się wtedy, gdy nic nie jest przewidziane, a ucząca się maszyna sama szuka wzorców, które wyłaniają się z danych w sposób naturalny.

Prawdopodobnie bardziej użytecznym sposobem opisania tego rozróżnienia w uczeniu maszynowym jest podział na uczenie się przez przewidywanie i uczenie się reprezentacji. W uczeniu się przez przewidywanie dane są obserwowane, a celem jest przewidywanie obserwowalnych wartości za pomocą dobrze zdefiniowanego zadania predykcyjnego (np. Random Forest, sieci neuronowe). W uczeniu się reprezentacji, celem nie jest przewidywanie, ale raczej obserwowanie podstawowej struktury tak, że ta reprezentacja może pomóc odpowiedzieć na różne pytania (na przykład klastrowanie, redukcja wymiarów).

Proces

Predykcyjne uczenie maszynowe rozpoczyna się od fazy szkoleniowej, podczas której model jest  "szkolony" na przykładowych danych. Potem następuje faza testowania, w której wykorzystywane są nowe dane w celu sprawdzenia, jak dobry jest model. Podczas tej oceny należy przeprowadzić walidację krzyżową, a wydajność mierzy się za pomocą ustalonego wskaźnika błędu.

W przypadku uczenia reprezentacyjnego, w sytuacji braku opisanych danych, zadaniem jest odkrycie reprezentacji danych przez nauczenie się, w jaki sposób opisy danych są podobne lub różne od siebie oraz odpowiednie grupowanie danych, wyodrębnienie najbardziej opisowych cech lub znalezienie wspólnych atrybutów lub ukrytych klas. Tutaj nie ma standardowego sposobu mierzenia wydajności.

Wyodrębnianie i wybór cech są prawdopodobnie najważniejszymi i często pomijanymi etapami uczenia maszynowego. Podczas wyodrębniania cech ważne jest oparcie się na wiedzy o danej dziedzinie, a większość energii zużywanej na zbudowanie modelu powinna być próbą znalezienia lepszych sposobów opisu danej dziedziny przy zachowaniu jasności co do tego, których cech można się nauczyć.

Czarna skrzynka

W modelu predykcyjnym algorytmy uczenia maszynowego są czasami określane jako "czarna skrzynka". W takich przypadkach maszyna zwykle nie koncentruje się na interpretacji parametrów, ani na wyjaśnianiu  procesu generatywnego, a jeśli tak, to z myślą o ręcznym dostrojeniu cech lub modelu po to, aby zwiększyć siłę predykcyjną.

Uczenie maszynowe w kontekście

W przeciwieństwie do procesu uczenia się przez człowieka, kiedy to umiejętności i wiedza są elastycznie rozwijane i mają zastosowanie do szerokiego zakresu kontekstów i problemów, uczenie maszynowe polega na definiowaniu schematów przychodzących informacji. W związku z tym algorytmy uczenia maszynowego prawie zawsze wymagają znacznej ilości danych, koniecznych, aby zbudować model.

Uczenie maszynowe można uznać za krewnego sztucznej inteligencji, ponieważ dotyczy inteligentnych systemów, mających zdolność uczenia się i dostosowywania w zmieniającym się środowisku. Model jest zdefiniowany zgodnie pewnymi parametrami, a zadaniem uczenia jest optymalizacja tych parametrów lub poprawa wskaźników efektywności.

Data Mining (eksploracja danych)

Termin Data Mining (eksploracja danych)  jest często mylony z uczeniem maszynowym. Eksploracja danych to proces wyodrębniania przydatnych modeli danych, zwykle na podstawie dużych baz danych. Jednym ze sposobów odkrycia tych modeli jest wykorzystanie algorytmów uczenia maszynowego do wydobywania danych. Termin "wydobycie" używany jest w odniesieniu do analogicznej czynności wydobywania surowca z kopalni i przerabiania go na niewielką ilość metalu szlachetnego. W Data Mining dane są przetwarzane w celu zbudowania prostych, ale użytecznych modeli.

Deep Learning & Neural Networks

Deep Learning jest gałęzią uczenia maszynowego, która uczy się hierarchii lub reprezentacji cech i często opiera się na sztucznych sieciach neuronowych i jest powszechnie wykorzystywane w takich dziedzinach jak przetwarzanie języka naturalnego, rozpoznawania obrazów i bioinformatyka. Sieć neuronowa jest systemem komputerowym zaprojektowanym do pracy poprzez klasyfikowanie informacji w taki sam sposób jak roni to ludzki mózg: może np. nauczyć się rozpoznawać obrazy i klasyfikować je zgodnie z zawartymi w nich elementami.

Typologia uczenia maszynowego

Uczenie maszynowe - typologia

 

Komentarz Ipsos 

Uczenie maszynowe można zdefiniować bardzo szeroko, jako cały wachlarz metod, w których komputer może poprawić jakość wykonywanych zadań w miarę nabywania doświadczenia. W popularnej literaturze termin ten jest czasem używany jako trochę egzotyczne modne słowo i często mylony ze sztuczną inteligencją.

W przypadku analizy danych ankietowych, transakcyjnych lub behawioralnych zwykle zbieranych przez Ipsos, uczenie maszynowe znajduje się gdzieś pomiędzy i może stanowić zróżnicowany zbiór zaawansowanych, często skomplikowanych algorytmów. Według tej definicji, metody, które ograniczą się do względnie prostych rozwiązań (jak w przypadku większości tradycyjnych statystyk) nie będą uznawane za uczenie maszynowe.

W Ipsos używamy takich modeli jak Random Forest i maszyna wektorowych nośnych, algorytm centroidów, sieci Kohoneta, analiza skupień czy sieci bayesowskie. 

Bardziej tradycyjne metody, takie jak regresja liniowa, nie będą uznawane za uczenie maszynowe.

Należy podkreślić, że uczenie maszynowe nie jest magicznym rozwiązaniem każdego problemu. Jeśli zmienne są słabe lub niezwiązane z wynikiem, niewiele może zrobić, aby takie zaawansowane techniki algorytmiczne, jak uczenie maszynowe, mogły to naprawić. W takich przypadkach lepiej rozważyć, które zmienne powinniśmy uwzględnić lub jak je zdefiniować.