VeilleTechFR — Mercredi 1 avril 2026

Social — Discussions

Harness définit la limite des agents : de l'exécution de code à l'itération de projet

Harness devient un facteur décisif pour les performances des agents IA. Bien que les modèles aient atteint une certaine homogénéité, l'environnement dans lequel ils évoluent (Harness) est désormais le principal déterminant de leurs capacités. Les entreprises travaillent sur des Harness couvrant tout le cycle de développement, au-delà de la simple édition de code.

v2ex.com

Social — Discussions

L'équipe du professeur Han Jun du KAIST développe une technologie 'ModelSpy' pour voler à distance les modèles d'IA

Des chercheurs du KAIST, de l'Université nationale de Singapour et de l'Université de Zhejiang ont développé une nouvelle menace de sécurité permettant de voler à distance la structure des modèles d'IA, des smartphones aux voitures autonomes. Ils ont également présenté des technologies de défense contre cette attaque, qui pourrait être utilisée pour renforcer la sécurité de l'IA dans divers domaines comme l'automobile, la santé et la finance.

aitimes.kr

Social — Discussions

CLAUDE.md n'est qu'un aspect - Comprendre l'ensemble du Context Engineering en 10 minutes

Bien que l'écriture de CLAUDE.md puisse améliorer l'IA Claude, cela ne suffit pas. L'auteur a dû approfondir les couches sous-jacentes, comme l'ajout de RAG, la gestion de la mémoire, pour obtenir des résultats satisfaisants. Ce processus itératif et fastidieux est nécessaire pour maîtriser le Context Engineering dans son ensemble.

zenn.dev

Social — Discussions

Implémentation de GPT-2 avec WebGPU dans le navigateur

Google a développé une implémentation complète de GPT-2 en utilisant WebGPU Compute Shader, sans dépendre de bibliothèques existantes. Bien que réalisable, l'exécution de modèles de langage de grande taille dans un navigateur reste actuellement un défi important.

zenn.dev

Tech — Tendances

La divergence cognitive : fenêtres de contexte IA, déclin de l'attention humaine et boucle de rétroaction de délégation

Les fenêtres de contexte des modèles de langage IA ont connu une expansion exponentielle, passant de 512 à 2 000 000 tokens d'ici 2026. Parallèlement, la capacité d'attention soutenue des humains a diminué, passant d'environ 16 000 à 1 800 tokens. Cette asymétrie croissante est qualifiée de 'divergence cognitive'.

arxiv.org

Tech — Tendances

AlpsBench : Un référentiel de personnalisation des LLM pour la mémorisation des dialogues réels et l'alignement des préférences

AlpsBench est un nouveau référentiel d'évaluation de la personnalisation des modèles de langage (LLM) dérivé de dialogues réels entre humains et LLM. Il comprend 2 500 séquences d'interactions à long terme avec des souvenirs structurés vérifiés par des humains, couvrant les informations de personnalisation explicites et implicites.

arxiv.org

Tech — Tendances

Un modèle neuro-symbolique pour la détection de fraude en temps réel

Un modèle neuro-symbolique produit une explication déterministe et lisible par l'humain en 0.9 ms, soit 33 fois plus rapide que SHAP. Ce modèle offre des performances de détection de fraude identiques tout en fournissant une explication en temps réel.

towardsdatascience.com

Tech — Tendances

Événements assistant avec des formes non documentées — comment les consommateurs devraient-ils les analyser ?

Les événements assistant peuvent apparaître sous au moins 4 formes différentes, mais la documentation n'en décrit qu'une seule. Les développeurs d'automatisation doivent correctement analyser ces sorties pour assurer le bon fonctionnement de leurs systèmes.

forum.cursor.com

Tech — Tendances

Traitement de 1M de parties d'échecs en 15 secondes avec Rust

L'auteur a réécrit son pipeline Python en Rust pour traiter 1M de parties d'échecs. Le pipeline Rust prend désormais 15 secondes, contre 25 minutes pour le pipeline Python. Cela s'explique par des améliorations dans l'analyse des fichiers PGN et la tokenisation des mouvements.

dev.to

La Une

Attaque 0-day de la chaîne d'approvisionnement visant les développeurs et les utilisateurs MCP

Signaux du jour

Harness définit la limite des agents : de l'exécution de code à l'itération de projet

L'équipe du professeur Han Jun du KAIST développe une technologie 'ModelSpy' pour voler à distance les modèles d'IA

CLAUDE.md n'est qu'un aspect - Comprendre l'ensemble du Context Engineering en 10 minutes

Implémentation de GPT-2 avec WebGPU dans le navigateur

La divergence cognitive : fenêtres de contexte IA, déclin de l'attention humaine et boucle de rétroaction de délégation

AlpsBench : Un référentiel de personnalisation des LLM pour la mémorisation des dialogues réels et l'alignement des préférences

Un modèle neuro-symbolique pour la détection de fraude en temps réel

Événements assistant avec des formes non documentées — comment les consommateurs devraient-ils les analyser ?

Traitement de 1M de parties d'échecs en 15 secondes avec Rust

En bref