[ad_1]
Un nouveau intelligence artificielle (IA) L'outil peut générer des images en moins de deux secondes et son fonctionnement ne nécessite pas de matériel coûteux.
Des scientifiques sud-coréens ont utilisé une technique spéciale appelée distillation des connaissances pour compresser la taille d'un modèle de génération d'images open source (ou accessible au public) connu sous le nom de Stable Diffusion XL, qui comporte 2,56 milliards de paramètres ou de variables que l'IA utilise pour apprendre pendant la formation.
La plus petite version du nouveau modèle, connue sous le nom de « KOALA », ne comporte que 700 millions de paramètres, ce qui signifie qu'elle est suffisamment légère pour fonctionner rapidement et sans avoir besoin de matériel coûteux et énergivore.
En rapport: Les chatbots IA doivent mieux mémoriser les choses. Les scientifiques viennent-ils de résoudre leur terrible problème de mémoire ?
La méthode qu'ils ont utilisée, la distillation des connaissances, transfère les connaissances d'un grand modèle à un plus petit, idéalement sans compromettre les performances. L’avantage d’un modèle plus petit est qu’il faut moins de temps pour effectuer des calculs et générer une réponse.
L'outil peut fonctionner sur des unités de traitement graphique (GPU) à faible coût et nécessite environ 8 Go de RAM pour traiter les demandes, contrairement aux modèles plus grands, qui nécessitent des GPU industriels haut de gamme.
L'équipe a publié ses conclusions dans un article le 7 décembre 2023 dans la base de données pré-imprimée. arXiv. Ils ont également rendu leur travail disponible via le référentiel open source AI. Visage câlin.
L'Institut de recherche en électronique et télécommunications (ETRI), l'institution à l'origine des nouveaux modèles, a créé cinq versions, dont trois versions du générateur d'images « KOALA » — qui génère des images basées sur la saisie de texte — et deux versions de « Ko-LLaVA » — qui peut répondre à des questions textuelles avec des images ou des vidéos.
Lorsqu'ils ont testé KOALA, celui-ci a généré une image basée sur l'invite « une image d'un astronaute lisant un livre sous la lune sur Mars » en 1,6 seconde. DALL·E 2 d'OpenAI a généré une image basée sur la même invite en 12,3 secondes, et DALL·E 3 l'a générée en 13,7 secondes, selon une déclaration.
Les scientifiques prévoient désormais d'intégrer la technologie qu'ils ont développée dans les services existants de génération d'images, les services éducatifs, la production de contenu et d'autres secteurs d'activité.
[ad_2]