Nivel 2 · 35 min
Pretraining: next-token prediction a escala
Pretraining: next-token prediction a escala es una pieza que tenés que poder explicar desde el mecanismo, no desde la herramienta. El punto senior es conectar pretraining con garantías, límites y señales operativas.
Modelo mental
Empezá definiendo qué representa pretraining, qué entrada recibe, qué salida produce y qué garantía entrega. Esa definición te protege de aplicar una receta de memoria cuando cambian los constraints del problema.
Trade-offs de diseño
Una respuesta fuerte compara alternativas: costo, latencia, memoria, complejidad de implementación, seguridad y facilidad de debug. No alcanza con decir que algo es O(n) o que una arquitectura escala; tenés que decir bajo qué supuesto escala.
Fallas comunes
La falla típica es tratar pretraining como caja negra. En producción necesitás instrumentar inputs, estado intermedio y outputs para distinguir un bug de datos, un supuesto roto o una mala elección de diseño.
Code example
Checklist:
1. Definir objetivo del usuario
2. Declarar garantía del sistema
3. Enumerar supuestos
4. Elegir diseño o algoritmo
5. Instrumentar métricas
6. Probar el modo de falla más probable