Cuando la IA se construye a sí misma
No es ciencia ficción: la Inteligencia Artificial ya está acelerando su propio desarrollo
Hagamos este experimento mental juntos. Imaginemos un carpintero que, en lugar de fabricar sillas, construye una máquina que fabrica sillas mejores que las que él hacía a mano. Hasta ahí, nada nuevo: es la historia de la Revolución Industrial. Pero ahora imaginemos que esa máquina, además, aprende a diseñar y construir la próxima generación de máquinas que hacen sillas mejores que la que ella hacía. Y que esa nueva generación es más rápida, más precisa y, encima, capaz de diseñar a su sucesora. El carpintero, en algún momento de esa cadena, dejó de ser el que fabrica. Pasó a ser el que mira, aprueba y (ojalá), entienda lo que está pasando.
Esa escena, que durante años fue ciencia ficción, dejó de serlo. Anthropic, la empresa que desarrolla Claude, acaba de publicar un documento donde, con datos internos que nunca habían mostrado, plantea algo que hay que leer con atención: la IA ya está acelerando el desarrollo de la propia IA. No es una promesa de marketing, es un hecho consumado que nos pone a todos frente a una pregunta que conviene hacerse con seriedad: ¿qué pasa cuando una tecnología empieza a mejorarse a sí misma?
Empecemos por lo concreto, que es como me gusta empezar. Según Anthropic, en mayo de 2026 más del 80% del código que se incorpora a su base de software lo escribió Claude, no un humano. Hace poco más de un año esa cifra era de un dígito. El ingeniero promedio de la empresa hoy produce ocho veces más código por trimestre que en el período 2021-2024. No porque trabaje ocho veces más horas, eso sería insostenible y bastante triste, sino porque pasó de escribir a "dirigir y revisar". El humano puso el objetivo; la máquina puso el método.
Y acá aparece el término técnico que da nombre a todo esto: recursive self-improvement, o mejora recursiva. La idea de un sistema capaz de diseñar, entrenar y perfeccionar a su propio sucesor, sin que un humano tenga que escribir cada línea del camino. Anthropic es honesta en una cosa: todavía no llegamos a ese punto, y aclara que tampoco es inevitable que lleguemos. Pero también dice algo incómodo: podría pasar antes de que la mayoría de las instituciones estén preparadas.
Yo agregaría una observación de quien convive todos los días con esta tecnología en proyectos reales: la curva no se está aplanando. Cada capacidad que se puede medir (la calidad del código, la resolución de problemas abiertos, hasta la capacidad de elegir el siguiente paso de una investigación) sigue subiendo. Y cuando una curva no se aplana, conviene preguntarse hacia dónde apunta.
Seamos justos, porque caer en el catastrofismo es tan vago intelectualmente como caer en el optimismo ciego. Los beneficios de esto son gigantescos y muy palpables.
Hay un ejemplo en el documento que me parece elocuente: en abril de 2026, Claude resolvió más de 800 errores que redujeron mil veces una clase de fallas. El ingeniero que lo supervisaba estimó que un humano habría tardado cuatro años en hacer ese trabajo. Cuatro años de una persona, comprimidos en un proceso supervisado. Eso, trasladado a la medicina, a la investigación de materiales o al desarrollo de fármacos, es la promesa de resolver en meses cosas que hoy nos llevan décadas.
Esto es lo que vengo diciendo hace rato y no me canso de repetir: la IA es una palanca. Una palanca no es buena ni mala; depende de dónde apoyes el punto de fuerza y qué quieras levantar. La mejora recursiva, bien gobernada, podría ser la palanca más poderosa que construyó la humanidad en su historia. El problema nunca es la palanca. El problema es quién la usa, cómo la usa y para qué.
Ahora vamos a la parte que me preocupa, no para asustar, sino para gestionar. Hay tres conceptos que, en mi experiencia, no se discuten lo suficiente en las reuniones donde se decide adoptar esta tecnología.
El primero es la endogamia de decisiones. Cuando una IA entrena a la próxima IA, que a su vez entrena a la siguiente, el "pool genético" de ideas se empieza a achicar. Es como una familia que se casa siempre entre sus propios miembros: al principio no se nota, pero las debilidades se concentran y se heredan. Si los criterios de una generación de modelos se transmiten a la siguiente sin sangre nueva, sin el criterio humano, sin perspectivas externas, sin el desacuerdo que aporta un equipo diverso, corremos el riesgo de construir sistemas cada vez más capaces de ejecutar y cada vez más parecidos entre sí en cómo piensan. Brillantes para resolver el problema que les pusiste; ciegos para darse cuenta de que era el problema equivocado.
El segundo es el error exponencial. Todos los que alguna vez sacamos una fotocopia de una fotocopia de una fotocopia entendemos esto sin que nos lo expliquen: cada copia degrada un poco la anterior, y al final la imagen es ilegible. El propio documento de Anthropic lo plantea con una sinceridad que se agradece: los casos raros de desalineación que existen hoy en los modelos podrían multiplicarse a medida que los modelos construyen a sus sucesores, volviéndose más frecuentes, pero menos comprendidos, hasta perder el control. Un pequeño sesgo en la generación uno, amplificado diez generaciones después, deja de ser un detalle. Se vuelve estructura.
El tercero, que engloba a los anteriores, es la falta de control. Y acá hay un dato que parece menor, pero es revelador: en Anthropic, a medida que la IA produce más código, el cuello de botella se mudó a la revisión humana. Es la vieja ley de Amdahl, la que dice que un proceso es tan rápido como su parte más lenta. Si la máquina genera más rápido de lo que un humano puede revisar, la revisión deja de ser un control y pasa a ser un trámite. Y cuando el control se vuelve trámite, ya no es control. Es ceremonia.
Los guardrails no son un freno, son el cinturón
Acá quiero ser muy claro, porque es el corazón de mi postura. Estar a favor de la velocidad no significa estar en contra de la seguridad. Al revés. Un auto de Fórmula 1 no anda a 350 km/h a pesar de los frenos: anda a esa velocidad gracias a que tiene frenos confiables. Si le sacás los frenos, no vas más rápido, pero te estrellás en la primera curva.
Los guardrails son exactamente eso. No son burocracia para frenar la innovación. Son la condición que permite ir rápido sin volar por el aire. Y el documento de Anthropic, para su crédito, no esquiva el tema: hoy revisan su propio código con un Claude automatizado que detecta fallas antes de que lleguen a producción, y al analizar el historial descubrieron que ese revisor habría atrapado un tercio de los errores que causaron incidentes reales.
La IA, vigilada por otra IA, vigilada por humanos que entienden qué están vigilando. Esa es la arquitectura sana. El problema empieza cuando se saltea el último eslabón.
Lo más interesante del planteo de Anthropic es que llegan a una conclusión que sorprende viniendo de quien corre la carrera: dicen que sería bueno para el mundo tener la opción de frenar o pausar temporalmente el desarrollo de frontera, para que la sociedad y la investigación en seguridad puedan ponerse al día. El detalle fino es que una pausa unilateral de un solo laboratorio no sirve de mucho: solo cambia quién va adelante. Hace falta coordinación, y hace falta poder verificar que los demás también frenaron, algo escandalosamente difícil cuando un entrenamiento de IA es mucho más fácil de esconder que un silo de misiles.
Dónde quedamos parados
Mi lectura, después de leer todo esto con el café ya frío, es la siguiente: vamos en el camino correcto. La mejora recursiva, hoy todavía incompleta, es una de las palancas más prometedoras que vimos. El humano todavía conserva la ventaja que más importa: el criterio, el gusto por elegir qué problema vale la pena resolver, y eso no es poca cosa. Es, justamente, lo que nos vuelve insustituibles.
Pero "vamos bien" no es lo mismo que "vamos solos". La diferencia entre una tecnología que nos potencia y una que se nos escapa de las manos no está en la potencia del motor. Está en si soltamos o no el volante. Soltarlo, en este caso, no es una metáfora dramática: es la tentación concreta de dejar que el control se vuelva ceremonia porque revisar es lento y aburrido, y la máquina ya demostró que casi nunca se equivoca.
Casi nunca. Esa es la palabra que no me deja dormir del todo tranquilo. Porque en un sistema que se construye a sí mismo, ese "casi" no se queda quieto. Se hereda, se multiplica y, si no estamos mirando, se vuelve la norma.
Construyamos el avión mientras volamos, dale. Pero alguien tiene que seguir mirando los instrumentos. Y ese alguien, somos nosotros.