La ciencia de datos en publicidad no se limita a predecir clics. En los últimos 15 años, el campo ha evolucionado desde modelos básicos de CTR hasta sistemas complejos que integran fijación de precios, optimización bajo restricciones, aprendizaje por refuerzo, experimentación y, más recientemente, aplicaciones de LLMs. Este artículo organiza ese recorrido técnico en un mapa claro: qué problemas se resolvieron primero, cómo se conectan entre sí y qué desafíos siguen vigentes. El objetivo no es listar papers, sino ofrecer una visión estructurada que permita entender dónde estamos y hacia dónde se mueve el AdTech.

Cuando alguien escucha “data science en publicidad”, suele pensar en modelos que predicen CTR o CVR. Y sí, ese fue el punto de partida. Pero la realidad es mucho más amplia. La publicidad digital combina predicción, subastas en tiempo real, control presupuestario, optimización creativa, experimentación y ahora incluso modelos multimodales. Entender este ecosistema completo es difícil porque el conocimiento está fragmentado entre artículos académicos, implementaciones prácticas y sistemas internos que evolucionan con el tiempo. Este artículo propone ordenar ese mapa.

La investigación en publicidad digital fue especialmente activa entre 2010 y 2015. Muchos de los papers fundamentales nacieron en ese período.
El problema hoy no es la falta de información, sino lo contrario:
Para quienes comienzan en el campo, distinguir entre tecnología madura, tendencias vigentes y hype es un reto real.
La ciencia de datos en publicidad puede entenderse como una evolución en capas:
No son temas aislados. Son piezas de un mismo sistema.
La primera gran ola se centró en la predicción.

Aunque parezcan antiguos muchos de estos modelos siguen siendo competitivos debido a:
Una vez que podemos estimar probabilidades, surge la pregunta clave: ¿Cómo usamos esa predicción para pujar mejor?
Aquí entran temas como:
La publicidad digital no es solo predicción, es competencia estratégica en tiempo real.
Los sistemas publicitarios operan bajo límites claros:

Esto dio paso a:
Aquí la ciencia de datos deja de ser estática y se convierte en un problema de toma de decisiones secuenciales.
Cuando múltiples anunciantes compiten simultáneamente, el problema deja de ser sólo predictivo y pasa a ser estratégico. El entorno se vuelve dinámico: cada campaña aprende, ajusta y responde a las decisiones de otras. Aquí entra el multi-agent reinforcement learning, donde ya no basta con estimar probabilidades, sino que se debe actuar considerando que el sistema cambia constantemente.
Más allá del bidding, el rendimiento depende de creatividad, experimentación rigurosa y adaptación al nuevo ecosistema de privacidad. La optimización no es solo técnica, también metodológica. Sin evaluación sólida, ningún modelo importa.

La ciencia de datos en publicidad no es una colección de técnicas aisladas, sino un sistema interconectado que evolucionó desde modelos predictivos simples hasta arquitecturas complejas de decisión, control y experimentación. Entender este mapa completo permite distinguir entre moda y fundamento, entre innovación real y complejidad innecesaria. Más allá del CTR, el verdadero desafío está en integrar predicción, estrategia y evaluación en un entorno dinámico, competitivo y cada vez más regulado.