|
Què és la Intel·ligència Artificial?¶La Intel·ligència Artificial (IA) consisteix en un programa informàtic capaç d'executar tasques i processos que tradicionalment requerien d'una intel·ligència humana. En molts casos, aquests programes són capaços de realitzar les tasques de forma més eficient i precisa que els humans. No obstant això, no tots el programes que realitzen tasques de manera eficient que els humans són considerats IA. Determinar si un ordinador realment es comporta de manera intel·ligent és complex. Hi ha moltes definicions de què és exactament la IA. La més estesa és la de John McCarthy (1995): Cita És la ciència i l'enginyeria de fer màquines intel·ligents.
Hi ha molts programes que es comporten de manera intel·ligent, però hui en dia es dona molta importància a les següents característiques:
Exemples d'ús de la IA¶Alguns exemples d'ús de la IA més estesos i fins i tot, quotidians són:
IA feble vs IA forta¶Imagina't un robot o un ordinador que no sols puga fer tasques específiques, sinó que també pense i entenga el món exactament com el fem nosaltres, els humans. Això es coneix com intel·ligència artificial forta(1), que a dia d'avui, sols existeix en la ciència ficció. Aquesta és la IA que veiem en pel·lícules com Ex Machina, Her, Blade Runner o llibres com Jo, Robot i altres d'Isaac Asimov. Aquest tipus de IA és capaç de realitzar qualsevol tasca que un ésser humà puga fer, entenent el món i prenent decisions de manera autònoma. En canvi, la intel·ligència artificial feble(1) és el tipus de IA que coneixem avui en dia. Aquesta és capaç de realitzar tasques específiques de manera molt eficient, però no pot realitzar tasques per a les quals no ha estat dissenyada, és a dir, estan orientades a un objectiu. Classificació i conceptes relacionats¶
Altres conceptes relacionats són:
Aprenentatge Automàtic¶L'Aprenentatge Automàtic (Machine Learning o ML) és un camp de la IA que es basa en la idea que les màquines poden aprendre de les dades per si mateixes, sense ser programades explícitament per a realitzar una tasca concreta. Aprenentatge Supervisat¶L'Aprenentatge Supervisat (Supervised Learning o SL) és un tipus de ML en el qual l'aprenentatge es basa en un conjunt de dades etiquetades, de les quals es coneix el resultat esperat. Dins del SL, trobem dos principals tipus de problemes: classificació i regressió. Exemple En aquest example de classificació, el model ha segut entrenat amb imatges de gats, gossos i gallines, indicant-li al model l'animal (etiqueta) que apareix en cada imatge. El model aprén a diferenciar entre aquests animals. Després, el model pot ser utilitzat per a predir l'animal en una imatge que no ha vist abans. Classificació¶En un problema de classificació, el model ha de predir a quina categoria o classe (valors discrets) pertany una observació (imatge, text, etc.). Durant el procés d'entrenament, el model aprén a diferenciar entre les diferents classes a partir de les dades d'entrenament i les etiquetes associades. Alguns exemples de classificació són:
Regressió¶En un problema de regressió, el model ha de predir un valor numèric (valors continus) a partir de les dades d'entrada. Durant el procés d'entrenament, el model aprén a predir aquest valor numèric a partir de les característiques de les dades d'entrenament.G Alguns exemples de regressió són:
Aprenentatge No Supervisat¶D'un altre costat, l'Aprenentatge No Supervisat (Unsupervised Learning o UNS) és un tipus de ML en el qual l'aprenentatge es basa en un conjunt de dades sense etiquetar, és a dir, sense saber el resultat esperat. Dins de l'UNS, trobem dos principals tipus de problemes: clustering i reducció de la dimensionalitat. Clustering¶En un problema de clustering, el model ha de dividir les dades en diferents grups o clústers, de manera que les observacions dins d'un mateix clúster siguin similars entre si. La Figure 9 mostra un exemple de clustering en el qual les dades són dividides tres clústers. Alguns exemples de clustering són:
Reducció de la dimensionalitat¶En un problema de reducció de la dimensionalitat, el model ha de reduir el nombre de dimensions (característiques) de les dades, mantenint la informació més rellevant. Aquest tipus de problema és útil per a reduir el temps de càlcul i millorar la precisió dels models. Alguns exemples de reducció de la dimensionalitat són:
Aprenentatge semisupervisat¶De vegades, tenim un conjunt de dades on sols algunes de les observacions estan etiquetades. En aquests casos, podem utilitzar l'Aprenentatge semisupervisat per a combinar les tècniques de SL i UNS. Aprenentatge per reforçament¶L'Aprenentatge per reforçament (Reinforcement Learning o RL) és un tipus de ML en el qual l'aprenentatge es basa en la interacció amb un entorn. En aquest tipus d'aprenentatge, un agent (robot, cotxe autònom, etc.) ha de prendre decisions per a maximitzar una recompensa a llarg termini. Quan l'agent pren una decisió correcta, rep una recompensa, i quan pren una decisió incorrecta, rep un càstig. Aprenentatge per lots¶En l'Aprenentatge per lots (Batch Learning), el model és entrenat amb un conjunt de dades fix. Si volem actualitzar el model amb noves dades, hem de tornar a entrenar-lo des de zero. Aprenentatge en línia¶En l'Aprenentatge en línia (Online Learning), el model és entrenat amb dades que arriben en temps real. Aquest tipus d'aprenentatge és útil quan les dades són massa grans per a ser processades en memòria o quan les dades arriben de manera contínua. Aprenentatge basat en models¶En l'Aprenentatge basat en models (Model-based Learning), existeix un model (normalment matemàtic/estadístic) que descriu com les dades són transformades en una predicció. Aquest model és entrenat amb les dades d'entrenament i després utilitzat per a fer prediccions. Aprenentatge basat en instàncies¶En l'Aprenentatge basat en instàncies (Instance-based Learning), les prediccions es basen en la similitud entre les observacions d'entrenament i les noves observacions. Aquest tipus d'aprenentatge és útil quan no es pot construir un model matemàtic/estadístic. Prova i validació de models¶Una vegada s'ha entrenat un model, és important avaluar la seva precisió i rendiment. Per a això, es divideixen les dades en dos conjunts: dades d'entrenament i dades de prova.
Important És molt important que les dades de prova no hagen segut utilitzades en el procés d'entrenament. Estem avaluant si el model generalitza bé el problema o no, per tant, el model no ha de conéixer les dades de prova. Info Normalment la proporció entre les dades d'entrenament i les dades de prova és de 80%/20% o 70%/30%, respectivament. Cada tipus de problema té unes mètriques associades per a avaluar la qualitat del model. Principals problemes de l'Aprenentatge Automàtic¶L'Aprenentatge Automàtic és una eina molt potent, però també difícil d'utilitzar perquè siga eficient. Alguns dels principals problemes són:
A més, és important conéixer els problemes que ens podem trobar en el procés d'entrenament:
Mesurant el rendiment del model amb les dades de prova, podem determinar si el model pateix d'aquests problemes:
El moment de parar l'entrenament del model és quan aquest té un bon rendiment amb les dades d'entrenament i la validació de les dades de prova comença a empitjorar. Recursos addicionals¶Bibliografia¶
|