Después de finalmente conectar todo el sitio web y la documentación a un flujo de trabajo de traducción hermético (utilizando po4a sobre Hugo), que resulta utilizar el mismo conjunto de herramientas y lógica que la aplicación Ansel, se me ocurrió la idea de automatizar las traducciones vacías, primero a partir de los archivos de traducción del software, y luego a través de la API de ChatGPT, que hace un trabajo bastante justo al traducir la sintaxis de Markdown.
Trabajando solo, no puedes depender de el efecto de holgazanería social , por lo que debes ser ingenioso. Puedes ver la lista de cosas que ya he automatizado en segundo plano para Ansel.
Habiendo escrito todo un motor de búsqueda de IA yo mismo, que significa principalmente un rastreador web (porque esa fue la parte más tediosa de escribir y depurar), tuve la oportunidad de ver este sitio web desde los ojos de un bot. Pieza por pieza, modifiqué las plantillas HTML y los metadatos para hacer ahora más fácil rastrear, indexar y buscar, primero para el motor de búsqueda interno,1 luego para Chantal AI .
Incluso con Chantal, sigo recibiendo demasiadas preguntas recurrentes sobre información que ya está escrita en algún lado. Claro, la documentación está un poco atrasada con respecto al código, pero los mensajes de confirmación que escribo apuntan a ser lo suficientemente no técnicos para que los usuarios avanzados entiendan qué está pasando estos días en el software.
Entiendo que no hay nada peor que estar atrapado en tu problema sin una respuesta oportuna, pero entonces no puedo servir como servicio de ayuda para cada persona en cada zona horaria con todo lo que necesita ser limpiado en este software tonto. Lo que significa que todavía hay una brecha por llenar.
El principal inconveniente de Chantal es que el modelo de lenguaje es bastante pesado para volver a entrenar, y no puedo automatizarlo en algún servidor. Luego, los sitios web no pueden ser rastreados demasiado rápido sin ser bloqueados por los servidores, por lo que eso no toma demasiada energía, pero se requiere algún ordenador conectado durante una semana con una conexión a Internet estable. Lo que significa que actualizo el modelo de lenguaje y el índice web solo 4 veces al año. Actualmente, el índice web contiene 63.452 páginas, el modelo de lenguaje conoce 47.579 palabras, y finalmente he logrado que sea bastante compatible con las limitaciones de E/S de memoria de un alojamiento compartido.
El plan, ahora mismo, es automatizar el rastreo del sitio web en algún servidor, porque eso no es muy pesado, luego volver a entrenar el modelo durante la noche en mi propio ordenador (lo que lleva alrededor de 4 horas de computación y casi toda mi memoria RAM de 32 GB…).
De todos modos, durante mis experimentos con la API de ChatGPT, descubrí que puedes entrenar tu propio GPT personalizado.2 Esto es tan simple como alimentarlo con contenido de texto que pueda usar, y ahora ChatGPT también puede cargar sitios web, sitemaps y puede configurarse para enviar solicitudes a la Rest API. Así que, sin más preámbulos, conoce Ansel GPT .
Ansel GPT está configurado para almacenar en caché y actualizar una vez por semana los problemas de Github, los commits, las publicaciones del foro comunitario, y todo el sitio web actual. Es capaz de proporcionar respuestas complejas (y bastante precisas) sobre qué módulo usar, cómo y cuándo, en Ansel, así como sobre conceptos de teoría del color. También lo configuré para usar el backend de Chantal AI, que es (casi) una Rest API y el GPT seguirá los enlaces indexados por Chantal para mejorar sus respuestas.
La pega es que el uso de Ansel GPT está reservado para suscriptores de ChatGPT Plus, así que siento que trabajé dos días para configurar todo para que OpenAI pueda beneficiarse de mi trabajo. Pero de todos modos, si eso significa al menos menos trabajo para mí a mediano plazo, llámemoslo una victoria.
Translated from English by : ChatGPT. In case of conflict, inconsistency or error, the English version shall prevail.