Tipuri de învățare automată și diferențele dintre ele.

Tipuri de învățare automată și diferențele dintre ele.

Domeniul învățării este vast și există multe abordări diferite, iar același lucru este valabil și pentru modelele de învățare automată. Învățarea automată poate fi împărțită în mai multe abordări principale, în funcție de sarcinile care trebuie îndeplinite, dar și de elementele disponibile pentru studiu.

Pentru a pregăti un model ML, sunt necesare mai multe etape. Primul pas este definirea problemei pe care dorim să o rezolvăm. În același timp, trebuie să analizăm datele pe care le avem la dispoziție și să le pregătim pentru contextul nostru. Din acest punct încolo, pot fi utilizate mai multe modele de învățare automată, în funcție de avantajele și dezavantajele acestora în raport cu datele.

Aceasta este urmată de a doua etapă, în care putem evalua rezultatele mai multor modele și putem îmbunătăți algoritmii prin optimizare și parametrizare. Așadar, după această fază de studiu preliminar, putem rula un model.

Unul dintre marile puncte forte ale învățării automate este bogăția acestor abordări, care, în multe cazuri, ne permite să găsim un model care să răspundă la o sarcină. În multitudinea de modele care au fost descoperite, mai multe elemente distinctive pot fi utilizate pentru a clasifica modelele.

Primul element distinctiv este învățarea supravegheată și nesupravegheată.

În funcție de natura datelor disponibile pentru model, există trei familii principale care sunt utilizate în mod regulat ca bază pentru separarea abordărilor.

Primul principiu care separă procesele ML este dacă seturile de date de intrare sunt supravegheate sau nesupravegheate. Învățarea constă în stocarea experienței și utilizarea acesteia pentru a genera cunoștințe. Dar această experiență poate varia în funcție de situație. Uneori, experiența constă în urmărirea desfășurării unei situații la care se dă un răspuns, alteori răspunsul nu este dat.

Noțiuni de bază ale învățării supravegheate.

În cazul în care se oferă un răspuns pentru un număr suficient de cazuri, ne aflăm în contextul învățării supravegheate. În cele din urmă, atunci când se dă un răspuns, este ca și cum un supraveghetor ar fi furnizat informații suplimentare. Există un set de elemente pentru care cunoaștem răspunsul și avem un așa-numit set de date de testare pentru a valida viitorul nostru model.

Atunci când datele sunt furnizate cu o valoare de ieșire așteptată, cel puțin pentru o parte din date, scopul este de a defini o regulă generală pentru a face să corespundă datele cu valoarea de ieșire. Datele de ieșire, atunci când sunt definite, indică faptul că eșantionul este etichetat sau marcat. Partea etichetată a datelor este, în general, furnizată prin capturarea situației reale sub formă de date sau prin etichetarea într-o etapă ulterioară de către experți în domeniul de studiu sau de către un grup de persoane care etichetează manual date la scară largă.

Cu alte cuvinte, scopul este de a defini un model predictiv care, pentru un set de elemente (X; y) în care X este un set de date și y este răspunsul dat pentru setul X, poate găsi ulterior valoarea necunoscută y pentru un nou element X. Elementele lui X sunt denumite, în general, caracteristici sau atribute. Acestea pot lua mai multe forme, de la date numerice la imagini sau texte. Evident, în cadrul unui set de date X, poate exista un amestec de diferite forme de date.

Elementul y poate fi, de asemenea, de mai multe forme, dar, în general, este o dată categorică definită printr-un text sau un format numeric. În acest caz, vorbim despre o problemă de clasificare: încercăm să definim clasa în care se încadrează un set X. Atunci când y este o valoare necategorică, cum ar fi, de exemplu, un număr real, vorbim despre o problemă de regresie. Încercăm să determinăm valoarea lui y pe baza relațiilor dintre alte perechi cunoscute (X; y), facem o regresie pe baza a ceea ce știm despre comportamentul evidențiat de setul de date.

În domeniul învățării supravegheate, există mai multe metode de recunoaștere a vorbirii, de recomandări și de detectare a spam-ului.

Bazele învățării nesupravegheate.

În cazul în care avem date, dar nu s-a dat niciun răspuns, situația devine și mai complicată atunci când vine vorba de definirea unei reguli. Din păcate, acesta este cel mai frecvent caz. În acest caz, folosim modele nesupravegheate.

În acest caz, nu mai avem o pereche (X; y), ci doar mai multe elemente X fără partea y. Datele sunt prezente, dar sunt transmise fără o structură definită și nu este propusă nicio valoare y. Este la latitudinea modelului să definească valorile y pe care le consideră eficiente pentru definirea seturilor. În plus, se spune că datele prezentate fără un element de clasificare sunt neetichetate.

Evident, analiza relevanței modelului este mai dificilă, deoarece nu dispunem de date de referință pentru a valida activitatea algoritmului. În această situație, modelul trebuie să propună o structură de date care să fie relevantă pentru datele furnizate.

Învățarea nesupravegheată este foarte des utilizată pentru a detecta fenomene anormale, cum ar fi frauda sau bolile rare. Este adesea necesar să se îmbunătățească înțelegerea datelor de intrare prin utilizarea tehnicilor de reducere a dimensiunilor sau de curățare a zgomotului.

Pentru a concluziona cu privire la cele două categorii principale de învățare supravegheată și nesupravegheată, este important să subliniem că există abordări hibride, în special învățarea semisupravegheată atunci când volumul de date etichetate este considerat insuficient pentru modelele de învățare supravegheată. Acest lucru este foarte frecvent atunci când este costisitoare implicarea experților în etichetarea seturilor de date. Aceasta este adesea o alternativă eficientă la dificultățile reale de colectare și prelucrare a informațiilor.

Cazul special al învățării prin întărire.

Ultimul domeniu important în învățarea automată este învățarea prin întărire, care utilizează o paradigmă complet diferită. Această abordare este mai puțin cunoscută, dar capătă din ce în ce mai mult interes, în special datorită numeroaselor utilizări pe care le-a avut în ultima vreme. Aici, la fiecare etapă, modelul ML va învăța dacă o anumită acțiune este pozitivă sau negativă prin intermediul unei politici de distribuție a recompenselor. Modelul își va adapta comportamentul pe baza feedback-ului pe care îl primește de la date. Modelul încearcă să urmărească obiectivele care au fost definite. Acest domeniu include robotica și transportul autonom. Marea diferență în această familie de modele constă în faptul că algoritmul interacționează direct cu mediul.

Diferențe legate de utilizarea învățării automate.

Învățarea activă și pasivă.

În această secțiune, se pune întrebarea cu privire la acțiunile întreprinse de model. Dacă, în timpul antrenamentului, modelul îmbunătățește informațiile puse la dispoziție inițial, acționând asupra datelor inițiale, ne aflăm în contextul învățării active. Dacă modelul rămâne în cadrul unei lecturi stricte a datelor de intrare, se spune că este pasiv.

Învățare online și offline.

O altă distincție importantă se referă la contextul de învățare și face distincția între modelele care trebuie să analizeze situația online, adică să furnizeze un rezultat în același timp cu învățarea, și cele care au timp în amonte (offline) să analizeze un volum de date de formare și se bazează doar pe formarea anterioară pentru a furniza rezultate a posteriori. În cazul învățării online, este ușor de imaginat că este nevoie de o curbă de progresie pentru ca modelul să producă rezultate concludente. Există, prin urmare, abordări hibride în care modelul online nu pornește complet fără experiență (pornire la rece).

Diferențe în ceea ce privește acțiunile care trebuie efectuate asupra modelelor de învățare automată.

Modelul are nevoie de un agent extern?

O distincție majoră se referă la faptul că modelul este sau nu este susținut. Acest lucru se poate face prin implicarea unui expert uman sau a unui alt algoritm pentru a ajuta modelul să își atingă obiectivele. De asemenea, este posibil să se utilizeze un jucător care este un adversar al modelului, încercând să îl inducă în eroare astfel încât acesta să se îmbunătățească.

Setarea parametrilor pentru algoritmii de învățare automată.

Abordările de învățare automată pot fi, de asemenea, separate în funcție de faptul că modelul este parametrizabil sau nu. Un model parametrizabil poate fi optimizat prin găsirea configurației corecte a parametrilor, iar performanța sa poate fi analizată cu ajutorul unei funcții.

Punctul cheie în definirea configurației optime este natura setului de date pus la dispoziție. Adesea, seturile de date sunt limitate ca volum. Uneori, și acest lucru este mai grav, seturile de date nu sunt reprezentative pentru setul de studii (suprageneralizare). În acest caz, este posibil ca algoritmii de învățare automată parametrizabili să compenseze parțial acest neajuns.

Diferențe în ceea ce privește alegerea tehnicilor utilizate de algoritmi.

În cele din urmă, pe lângă distincțiile de mai sus, algoritmii ML sunt, de asemenea, împărțiți în mai multe familii, în funcție de tehnicile utilizate. Există patru familii principale.

Învățarea logică

Aceasta este, fără îndoială, abordarea cea mai rapid prezentată. Aici, omul propune reguli algoritmului, pe care acesta din urmă trebuie să le urmeze pentru a raționa logic și a face presupuneri. Aici ne apropiem de fundamentele automatizării.

Învățarea statistică

Datele utilizate în acești algoritmi de învățare joacă un rol important, deoarece natura lor va ghida căutarea unei funcții care să facă legătura între datele de intrare și datele de ieșire. Pentru a face acest lucru, modelele utilizează concepte din matematică și, mai frecvent, din statistică.

Învățarea cu ajutorul rețelelor neuronale artificiale

RNA (rețele neuronale artificiale) se bazează pe structura neuronilor din biologia animală pentru a determina relații complexe între datele de intrare și cele de ieșire. Acest grup a fost ulterior împărțit într-o nouă subramură numită învățare profundă, care presupune utilizarea capacităților de calcul ale mașinilor moderne pentru a proiecta rețele din ce în ce mai extinse (profunde) pentru a răspunde la probleme complexe.

Algoritmii genetici

În cele din urmă, algoritmii genetici imită, de asemenea, un concept biologic, cel al teoriei evoluției, cu evenimente precum mutațiile și încrucișările, pentru a produce modele optimizate pentru o anumită situație.

Pentru a încheia această introducere inițială în ceea ce privește diferențele cheie dintre diferitele abordări de învățare automată, este important să ne amintim că învățarea automată oferă o varietate de soluții și că alegerea metodei potrivite în amonte este cheia succesului. Nu am intrat în detalii cu privire la care familii sunt cele mai bune pentru o anumită problemă, pur și simplu pentru că această întrebare depinde enorm de context și de cazurile particulare. În cele din urmă, numai având o cunoaștere globală a diferitelor tehnici, inginerul de inteligență artificială poate propune un model după ce a analizat cadrul în care trebuie să lucreze.

Photo Maxime Macé

Maxime Macé

Simple passionné de thématiques diverses et variées. J’apprécie enrichir mes connaissances dans les disciplines techniques comme l’informatique, les sciences et l’ingénierie, mais aussi dans les domaines merveilleux de la philosophie, l’art et la littérature.

Prenons contact

Vous souhaitez me contacter suite à la lecture de cet article ? Merci de renseigner votre adresse électronique et je vous recontacterai dans les plus brefs délais.

CV Ingénieur développeur informatique

CV Étudiant PhD Artificial Intelligence

Portfolio Artist designer