Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
L'IA n'a peut-être pas besoin de données d'entraînement massives après tout | Hannah Robbins, Université Johns Hopkins
Résumé : De nouvelles recherches montrent que l'IA n'a pas besoin de données d'entraînement infinies pour commencer à agir davantage comme un cerveau humain. Lorsque les chercheurs ont redessiné les systèmes d'IA pour mieux ressembler aux cerveaux biologiques, certains modèles ont produit une activité semblable à celle du cerveau sans aucune formation préalable. Cela remet en question l'approche actuelle de développement de l'IA avide de données. Ce travail suggère qu'un design plus intelligent pourrait accélérer considérablement l'apprentissage tout en réduisant les coûts et la consommation d'énergie.
---
De nouvelles recherches de l'Université Johns Hopkins montrent que les systèmes d'intelligence artificielle construits avec des conceptions inspirées de la biologie peuvent commencer à ressembler à l'activité cérébrale humaine même avant d'être formés sur des données. L'étude suggère que la manière dont l'IA est structurée peut être tout aussi importante que la quantité de données qu'elle traite.
Les résultats, publiés dans Nature Machine Intelligence, remettent en question la stratégie dominante dans le développement de l'IA. Au lieu de s'appuyer sur des mois d'entraînement, d'énormes ensembles de données et une puissance de calcul considérable, la recherche met en avant la valeur de commencer avec une base architecturale semblable à celle du cerveau.
Repenser l'approche axée sur les données de l'IA
"La façon dont le domaine de l'IA évolue actuellement consiste à jeter une quantité de données sur les modèles et à construire des ressources informatiques de la taille de petites villes. Cela nécessite de dépenser des centaines de milliards de dollars. Pendant ce temps, les humains apprennent à voir en utilisant très peu de données," a déclaré l'auteur principal Mick Bonner, professeur adjoint de sciences cognitives à l'Université Johns Hopkins. "L'évolution a peut-être convergé vers ce design pour une bonne raison. Notre travail suggère que des conceptions architecturales plus semblables à celles du cerveau placent les systèmes d'IA dans un point de départ très avantageux."
Bonner et ses collègues ont cherché à tester si l'architecture seule pouvait donner aux systèmes d'IA un point de départ plus semblable à celui des humains, sans s'appuyer sur un entraînement à grande échelle.
Comparer les architectures d'IA populaires
L'équipe de recherche s'est concentrée sur trois types majeurs de conceptions de réseaux neuronaux couramment utilisés dans les systèmes d'IA modernes : les transformateurs, les réseaux entièrement connectés et les réseaux de neurones convolutifs.
Ils ont ajusté ces conceptions à plusieurs reprises pour créer des dizaines de réseaux neuronaux artificiels différents. Aucun des modèles n'a été formé au préalable. Les chercheurs ont ensuite montré aux systèmes non entraînés des images d'objets, de personnes et d'animaux et ont comparé leur activité interne aux réponses cérébrales d'humains et de primates non humains regardant les mêmes images.
Pourquoi les réseaux convolutifs se sont démarqués
Augmenter le nombre de neurones artificiels dans les transformateurs et les réseaux entièrement connectés a produit peu de changements significatifs. Cependant, des ajustements similaires aux réseaux de neurones convolutifs ont conduit à des motifs d'activité qui correspondaient davantage à ceux observés dans le cerveau humain.
Selon les chercheurs, ces modèles convolutifs non entraînés ont performé au même niveau que les systèmes d'IA traditionnels qui nécessitent généralement une exposition à des millions, voire des milliards d'images. Les résultats suggèrent que l'architecture joue un rôle plus important dans la formation d'un comportement semblable à celui du cerveau que ce qui était précédemment cru.
Un chemin plus rapide vers une IA plus intelligente
...

Meilleurs
Classement
Favoris
