Cours 22 oct - AI etc#

Intro - quel rapport avec l’IA?#

  • Gitlab copilot - assistant pour progammation
  • Usage pour reformuler phrase?
  • Résolution exercices physiques?
  • Gain de temps?

Point sur l’horaire#

Lundi pro : sophie leclou : travail sur dynamique de groupe etc. Se pencher sur la problématique / pas encore sur la solution Prototypage rapide = rentrer dans la révision. examen : lundi 13/01 ou jeudi 16/01

Deadline doc perso : 24/11

Compte FabMan : à éclaircir#

Présa Nicolas Decoster#

Pourquoi ce cours?#

  • N. Decoster : utilise IA pour faire des petits scripts : gain de temps important.

Qu’est-ce ?#

Statistique

  • IA * :
  • “Machine Learning” * = étape de calibration , d’agréger les sets de donnée

    ex. le plus simple : droite de régression linéaire

  • Deep Learning* = < traduction , et aussi : reconnaissance images, génération de texte… (Deeple) = avec réseau neuronale

    le système s’ajuste et se corrige petit-à-petit > n’empêche pas les sorties de route

  • Large Language Models* =

  • deep learning spécialisés dans le langage
  • au départ textuel
  • toujours inférence statistique en fonction du contexte (=token)
  • l’enjeu : base de donnée suffisament grande pour pouvoir répondre
  • ET suffisament qualitative et pertinente
  • ET trop grande base de donnée : trop dur à gerer
  • modèles de environ 140 Gparamètres : demande technologie et énergie ++++ et argent
  • Réseau de neurone…*

Comment classifier les différents LLMs#

  • Benchmarks pour évaluer niveau de pertinence
  • “Danger” : tout le monde à accès à l’examen
  • Alan Turing : test de Turing:
  • l’IA passe le test si pas possible de détecter si machine ou humain en face.
  • (Mais invention algorithme, bien à avant : ___ )

  • Mix of expert : plutôt que un énorme modèle -> différents sous domaines - (=2 experts qui répondes avec moins de ressources utilisées au total)

cf. huggingface

  • modèle audio > texte > traitement > texte > audio : temps de latence important, ne mime pas une conservation
  • système “multiparadigme” : gère audio directement

  • Claude : plusoumoins comme ChatGPT, Gemini (google) et Llama (facebook) aussi – codes propriétaires

  • Outsiders : ( < 3 français) - dans le top20 - ultra performant et en compet avec les autres
  • License Apache ou CC-BY-NB

Comment utiliser les AI?#

  • Article 40 ULB - réglementation usage IA.
  • Il faut citer et expliquer l’usage
  • Règle de base : l’utiliser pour des choses que je sais ou je saurais faire
  • ne pas l’utiliser pour quelque chose que je ne comprends pas / que je ne sais pas critique;
  • Toujours double-check
  • ex : demander bilbio - il va sortir des auteurs et articles qui n’existe pas.
  • usage spécifique et intelligent
  • Différentes IA de la société Mistral:
  • Si but c’est de faire du code : Codestral
  • possible utilser API pour interroger automatiquement
  • (Même interface que Mistral Large 2
  • Nemo : petit modèle - consomme moins / moins bon : plutôt utile pour le télécharger et l’entrainer sur ses propres données
  • ‘Hallucination’ = quand l’IA invente
  • Pixtral : interprétation image - ré-écrire sous forme textuelle
  • Mieux de subdiviser les tâches
  • être précis :
  • ex : pour code :
  • ajout commenatire, norme doxygen
  • décl variable en début de programme

Points d’attention :#

  • failles de sécurité
  • Attention à fausses objectivité
  • Contrainte/censure > restraignent IA > donc fonctionne moins bien
  • (intelligence plus safe = moins performante)
  • Style parfois vague

Pour quelles usage?#

  • Sommarre / article / squelette .. ?
  • problème : ne remplace jamais l’originalité
  • Traduction - mais avec gros risques
  • pour transformer md to html par ex, mais existe des outils bcp plus adaptés
  • pour code et script : très bon
  • quand insomnie : travailler comme un robot - pas tjrs créatif - si c’est sytématique
  • ne fait pas écrire des programmes mais demande squelette
  • usage : assistant/stagiaire qu’on exploiterait
  • pour reformater datas mais en petites quantités
  • exemple : générer une VCARD -> import dans agenda
  • (json > XML) > ou plutôt utiliser AI qui écrit programme pour transfo json sur XML
  • rappel rapide des concepts importants, etc.
  • autres types :
  • OpenCV = reconnaissance d’image
  • automation

  • usage : je cherche un programme qui … blabla

  • quel format existe?

Autres :#

RUST = C++

Questions :#

  • Quid réseau de neurone ?
  • Pour corriger les fautes de grammaire / d’orthographe?

To do :#

  • regarder si génère bon code pour spirale

NCDU = ?