Cours 22 oct - AI etc#
Intro - quel rapport avec l’IA?#
- Gitlab copilot - assistant pour progammation
- Usage pour reformuler phrase?
- Résolution exercices physiques?
- Gain de temps?
Point sur l’horaire#
Lundi pro : sophie leclou : travail sur dynamique de groupe etc. Se pencher sur la problématique / pas encore sur la solution Prototypage rapide = rentrer dans la révision. examen : lundi 13/01 ou jeudi 16/01
Deadline doc perso : 24/11
Compte FabMan : à éclaircir#
Présa Nicolas Decoster#
Pourquoi ce cours?#
- N. Decoster : utilise IA pour faire des petits scripts : gain de temps important.
Qu’est-ce ?#
Statistique
- IA * :
- “Machine Learning” * = étape de calibration , d’agréger les sets de donnée
ex. le plus simple : droite de régression linéaire
-
Deep Learning* = < traduction , et aussi : reconnaissance images, génération de texte… (Deeple) = avec réseau neuronale
le système s’ajuste et se corrige petit-à-petit > n’empêche pas les sorties de route
-
Large Language Models* =
- deep learning spécialisés dans le langage
- au départ textuel
- toujours inférence statistique en fonction du contexte (=token)
- l’enjeu : base de donnée suffisament grande pour pouvoir répondre
- ET suffisament qualitative et pertinente
- ET trop grande base de donnée : trop dur à gerer
- modèles de environ 140 Gparamètres : demande technologie et énergie ++++ et argent
- Réseau de neurone…*
Comment classifier les différents LLMs#
- Benchmarks pour évaluer niveau de pertinence
- “Danger” : tout le monde à accès à l’examen
- Alan Turing : test de Turing:
- l’IA passe le test si pas possible de détecter si machine ou humain en face.
-
(Mais invention algorithme, bien à avant : ___ )
-
Mix of expert : plutôt que un énorme modèle -> différents sous domaines - (=2 experts qui répondes avec moins de ressources utilisées au total)
cf. huggingface
- modèle audio > texte > traitement > texte > audio : temps de latence important, ne mime pas une conservation
-
système “multiparadigme” : gère audio directement
-
Claude : plusoumoins comme ChatGPT, Gemini (google) et Llama (facebook) aussi – codes propriétaires
- Outsiders : ( < 3 français) - dans le top20 - ultra performant et en compet avec les autres
- License Apache ou CC-BY-NB
Comment utiliser les AI?#
- Article 40 ULB - réglementation usage IA.
- Il faut citer et expliquer l’usage
- Règle de base : l’utiliser pour des choses que je sais ou je saurais faire
- ne pas l’utiliser pour quelque chose que je ne comprends pas / que je ne sais pas critique;
- Toujours double-check
- ex : demander bilbio - il va sortir des auteurs et articles qui n’existe pas.
- usage spécifique et intelligent
- Différentes IA de la société Mistral:
- Si but c’est de faire du code : Codestral
- possible utilser API pour interroger automatiquement
- (Même interface que Mistral Large 2
- Nemo : petit modèle - consomme moins / moins bon : plutôt utile pour le télécharger et l’entrainer sur ses propres données
- ‘Hallucination’ = quand l’IA invente
- Pixtral : interprétation image - ré-écrire sous forme textuelle
- Mieux de subdiviser les tâches
- être précis :
- ex : pour code :
- ajout commenatire, norme doxygen
- décl variable en début de programme
- …
Points d’attention :#
- failles de sécurité
- Attention à fausses objectivité
- Contrainte/censure > restraignent IA > donc fonctionne moins bien
- (intelligence plus safe = moins performante)
- Style parfois vague
Pour quelles usage?#
- Sommarre / article / squelette .. ?
- problème : ne remplace jamais l’originalité
- Traduction - mais avec gros risques
- pour transformer md to html par ex, mais existe des outils bcp plus adaptés
- pour code et script : très bon
- quand insomnie : travailler comme un robot - pas tjrs créatif - si c’est sytématique
- ne fait pas écrire des programmes mais demande squelette
- usage : assistant/stagiaire qu’on exploiterait
- pour reformater datas mais en petites quantités
- exemple : générer une VCARD -> import dans agenda
- (json > XML) > ou plutôt utiliser AI qui écrit programme pour transfo json sur XML
- rappel rapide des concepts importants, etc.
- autres types :
- OpenCV = reconnaissance d’image
-
automation
-
usage : je cherche un programme qui … blabla
- quel format existe?
Autres :#
RUST = C++
Questions :#
- Quid réseau de neurone ?
- Pour corriger les fautes de grammaire / d’orthographe?
To do :#
- regarder si génère bon code pour spirale
NCDU = ?