Salta el contingut
 

Xarxes neuronals

Autor: Joan Puigcerver Ibáñez

Correu electrònic: j.puigcerveribanez@edu.gva.es

Llicència: CC BY-NC-SA 4.0

(Reconeixement - NoComercial - CompartirIgual) 🅭

Xarxes Neuronals

Les xarxes neuronals (neural networks o NN) són un model computacional inspirat en el funcionament del cervell dels organismes vius: un conjunt de neurones interconnectades entre sí, que s'activen quan reben un estímul i treballen col·lectivament per resoldre un problema.

Aquest model ha revolucionat el camp del Aprenentatge Automàtica (ML) en els últims anys.

Perceptró

Les xarxes neuronals estan compostes per neurones artificials, que són l'element bàsic d'aquest model. La neurona artificial esta inspirada en la neurona natural, que és la cèl·lula bàsica del cervell dels animals.

Neurona natural

Mauro Lanari, Wikimedia Commons

Figura 1. Neurona natural

La neurona artificial, també anomenada perceptró, és la unitat bàsica d'una xarxa neuronal. Aquesta rep un conjunt d'entrades (inputs), que són ponderades per uns pesos (weights) i sumades amb un biaix (sesgo o bias).

L'eixida (output) de la neurona es calcula aplicant una funció d'activació a la suma ponderada de les entrades.

Perceptró

Autor desconegut

Figura 2. Perceptró

L'eixida d'un perceptró es linear respecte a les entrades, per tant, no podria resoldre problemes no lineals. Per evitar aquesta limitació, s'han afegit les funcions d'activació, que permeten a les xarxes neuronals resoldre problemes més complexos.

Les funcions d'activació són funcions no lineals que s'apliquen a abans de l'eixida de la neurona.

Funcions d'activació

Autor desconegut

Figura 3. Funcions d'activació

Nota

Existeixes moltes funcions d'activació, que caldrà seleccionar segons el problema a resoldre.

Xarxes neuronals profundes (DNN)

Les xarxes neuronals profundes (Deep Neural Networks o DNN) són un tipus de xarxes neuronals, en les quals es connecten múltiples capes de neurones entre sí.

Aquesta estructura permet modelar relacions més complexes entre les dades, i per tant, resoldre problemes més complicats.

Nota

Realment, el que defineix el DNN no és el nombre de capes, sinó el processament de les dades de manera jeràrquica. Cada capa extrau característiques més abstractes de les dades que la capa anterior arribant a la resposta final.

Deep Neural Networks

https://wwww.quantamagazine.org

Figura 4. Procés d'una xarxa neuronal profunda

La primera capa s'anomena capa d'entrada, que tindrà tantes neurones com entrades tinguen les nostres dades.

Exemple

Si volem predir el preu d'una casa, les entrades podrien ser:

  • Metres quadrats
  • Nombre de dormitoris
  • Nombre de banys
  • Barri

En aquest cas, la capa d'entrada tindria 4 neurones.

De la mateixa manera, l'última capa s'anomena capa d'eixida, que tindrà tantes neurones com resultats esperem obtindre.

Exemple

En el problema anterior, l'eixida que esperem és el preu de la casa.

Per tant, la capa d'eixida tindria una sola neurona.

Les capes intermèdies s'anomenen capa ocultes que estan connectades entre sí, de manera que l'eixida d'una capa és l'entrada de la següent. El nombre de neurones en aquestes capes depèn del problema a resoldre.

Xarxa neuronal profunda

Autor desconegut

Figura 5. Xarxa neuronal profunda

Retropropagació (backpropagation)

La retropropagació (backpropagation) és un algoritme d'aprenentatge supervisat que s'utilitza per entrenar xarxes neuronals.

Aquest algoritme ajusta els pesos de les connexions entre les neurones per minimitzar l'error entre l'eixida de la xarxa i l'eixida esperada.

El funcionament és el següent:

  • S'envia un conjunt de dades a la xarxa, i es calcula l'eixida de la xarxa.
  • Es compara l'eixida de la xarxa amb l'eixida esperada, i es calcula l'error.
  • L'error es propaga cap enrere a través de la xarxa, ajustant els pesos de les connexions.

Retropropagació

Autor desconegut

Figura 6. Retropropagació

Aquest procés es repeteix moltes vegades de manera iterativa, reduint l'error de la xarxa fins a arribar a un valor acceptable.

Nota

La retropropagació és un algoritme computacionalment intensiu, i requereix una gran quantitat de dades per a ser efectiu.

Tipus de xarxes neuronals

Hi ha molts tipus de xarxes neuronals, cadascuna dissenyada per a resoldre un tipus de problema concret.

Xarxes neuronals convolucionals (CNN)

Les xarxes neuronals convolucionals (Convolutional Neural Networks o CNN) són un tipus de xarxes neuronals especialment dissenyades per a processar imatges.

Les primeres capes d'una CNN són capes de convolució, que apliquen s'encarreguen d'extraure característiques de xicotetes regions de la imatge (lines, curves, textures, etc.).

Xarxa neuronal convolucional

Autor desconegut

Figura 7. Xarxa neuronal convolucional

Xarxes neuronals recurrents (RNN)

Les xarxes neuronals recurrents (Recurrent Neural Networks o RNN) són un tipus de xarxes neuronals dissenyades per a processar seqüències de dades, com textos, temps, etc.

Aquest tipus de xarxes tenen connexions cícliques entre les neurones, de manera que l'eixida de la xarxa pot ser utilitzada com a entrada en la següent iteració.

Xarxa neuronal recurrent

Autor desconegut

Figura 8. Xarxa neuronal recurrent

Xarxes neuronals generatives adversàries (GAN)

Les xarxes neuronals generatives adversàries (Generative Adversarial Networks o GAN) són un tipus de xarxes neuronals dissenyades per a generar dades noves a partir de dades existents.

Aquest tipus de xarxes estan compostes per dues xarxes neuronals:

  • Generador: Aquesta xarxa genera dades noves a partir de dades existents.
  • Discriminador: Aquesta xarxa intenta distingir entre les dades reals i les dades generades pel generador.

La tasca del generador és enganyar el discriminador, i la tasca del discriminador és diferenciar entre les dades reals i les dades generades.

Quan el discriminador descarta les dades generades pel generador, aquest aprén de l'error i millora la seua capacitat per a generar dades noves.

En canvi, quan el discriminador no pot distingir entre les dades reals i les dades generades, el discriminador aprén de l'error i millora la seua capacitat per a distingir entre les dades reals i les dades generades.

Xarxa neuronal generativa adversària

Autor desconegut

Figura 9. Xarxa neuronal generativa adversària

Recursos addicionals

Bibliografia

Comentaris