Après avoir finalement câblé tout le site web et la documentation à un flux de travail de traduction étanche (en utilisant po4a par-dessus Hugo), qui utilise exactement les mêmes outils et logique que l’application Ansel, j’ai eu l’idée de traduire automatiquement les traductions vides, d’abord à partir des fichiers de traduction logicielle, puis via l’API ChatGPT, qui fait un très bon travail pour traduire la syntaxe Markdown.

Travaillant seul, vous ne pouvez pas compter sur la paresse sociale , donc vous devez être astucieux. Vous pouvez consulter la liste des choses que j’ai déjà automatisées en arrière-plan pour Ansel.

Ayant moi-même écrit un moteur de recherche IA complet AI search engine myself, ce qui signifie principalement un robot d’exploration web (car c’était la partie la plus fastidieuse à écrire et à déboguer), j’ai eu l’opportunité de voir ce site web à travers les yeux d’un bot. Pièce par pièce, j’ai modifié les modèles HTML et les métadonnées pour rendre plus facile l’exploration, l’indexation et la recherche, d’abord pour le moteur de recherche interne,1 puis pour Chantal AI .

Même avec Chantal, je reçois encore trop de questions récurrentes concernant des informations déjà écrites quelque part. Bien sûr, la documentation accuse un peu de retard par rapport au code, mais les messages de commit  que j’écris visent à être suffisamment non techniques pour que les utilisateurs avancés puissent comprendre l’évolution actuelle du logiciel.

Je comprends qu’il n’y a rien de pire que d’être bloqué dans son problème sans réponse opportune, mais je ne peux pas non plus servir de support technique pour chaque personne dans chaque fuseau horaire avec tout ce qui nécessite un nettoyage dans ce logiciel stupide. Ce qui signifie qu’il y a encore un fossé à combler.

Le principal inconvénient de Chantal est que le modèle linguistique est assez lourd à réentraîner et je ne peux pas l’automatiser sur un serveur. De plus, les sites Web ne peuvent pas être explorés trop rapidement sans être bloqués par les serveurs, donc cela ne prend pas trop de puissance mais nécessite qu’un ordinateur soit branché pendant une semaine avec une connexion Internet stable. Ce qui signifie que je mets à jour le modèle linguistique et l’index web seulement 4 fois par an. À ce jour, l’index web contient 63.452 pages, le modèle linguistique connaît 47.579 mots, et j’ai finalement réussi à le rendre assez compatible avec les limitations de mémoire I/O d’un hébergement mutualisé.

Le plan, pour l’instant, est d’automatiser l’exploration web sur un serveur, car ce n’est pas trop lourd, puis de réentraîner le modèle durant la nuit sur mon propre ordinateur (ce qui prend environ 4 h de calcul et presque toute ma RAM de 32 Go…).

Bref, en bidouillant avec l’API ChatGPT, j’ai découvert que vous pouvez entraîner votre propre GPT personnalisé.2 C’est aussi simple que de lui fournir du contenu textuel qu’il peut utiliser, et maintenant ChatGPT peut aussi charger des sites web, des sitemaps et peut être configuré pour envoyer des requêtes à une API Rest. Donc, sans plus attendre rencontrez Ansel GPT.

Ansel GPT est configuré pour mettre en cache et mettre à jour chaque semaine les problèmes GitHub, les commits, les messages du forum communautaire, et tout le site actuel. Il est capable de fournir des réponses complexes (et assez précises) concernant quel module utiliser, comment et quand, dans Ansel, ainsi que sur les concepts de théorie des couleurs. Je l’ai aussi configuré pour utiliser le backend de Chantal AI, qui est (presque) une API Rest et le GPT suivra les liens indexés par Chantal pour améliorer ses réponses.

Le hic, c’est que l’utilisation d’Ansel GPT est réservée aux abonnés ChatGPT Plus, alors j’ai l’impression d’avoir travaillé 2 jours pour tout configurer afin que OpenAI puisse tirer profit de mon travail. Mais en tout cas, si cela signifie moins de travail pour moi à moyen terme, appelons cela une victoire.


Translated from English by : Aurélien Pierre, ChatGPT. In case of conflict, inconsistency or error, the English version shall prevail.

  1. Which actually works client-side in Javascript in your own browser, meaning it works offline too, should you install this website as a webapp to keep the documentation locally. ↩︎

  2. Provided you are a ChatGPT Plus subscriber, for a not-so-modest 23€/month. ↩︎