ChatGPT ha lanzado recientemente el plugin de interpretación de código, «Code Interpreter», para los suscriptores de ChatGPT Plus. Según Open AI, este complemento permite que ChatGPT ejecute código, opcionalmente con acceso a los archivos cargados por el usuario. Así, ChatGPT puede analizar datos, crear gráficos, editar archivos, realizar cálculos matemáticos y más tareas relacionadas con el análisis de datos. En otras palabras, podríamos decir que ChatGPT ha aprendido a actuar como un Data Scientist o Científico de datos, «la profesión más sexy del siglo XXI», según la revista Harvard Business Review y diversas publicaciones sobre los profesionales más valorados por las empresas. En este ámbito, ChatGPT muestra grandes mejoras en la ejecución de operaciones y modelos matemáticos, superando una de las debilidades de las versiones anteriores de este popular chatbot inteligente.

En esta publicación, pondré a prueba a ChatGPT con un trabajo de análisis de datos que desarrollé previamente y expliqué en este artículo, explorando la relación entre las ventas y el precio del tabaco en España. En este caso, ChatGPT se convertirá en mi copiloto de datos, al que pediré ayuda en el análisis de los datos proporcionados y en la extracción de conclusiones.

Primero, habilitaré el complemento «Code Interpreter» en mi cuenta de ChaGPT Plus siguiendo los pasos de este enlace. Luego, cargaré un archivo .csv que contiene cuatro columnas: mes, ventas de tabaco en España (en cajetillas de 20 cigarrillos), pernoctaciones (turismo) y precio del tabaco. A continuación, dirigiré a ChatGPT con los siguientes seis comandos (= prompts):

1. Lee, resume qué información contiene el fichero y representa los datos mensuales de las variables (un gráfico por variable).

2. Descompón las ventas de tabaco en tendencia, estacionalidad y error y representa los gráficos, ¿es una serie con una estacionalidad marcada?, ¿a qué se puede deber el comportamiento de la serie a lo largo del tiempo y que factores serán los más relevantes?

3. Representa las ventas en el eje principal (línea de color naranja) y el precio en el eje secundario (línea de color azul) y calcula la correlación entre ambas variables junto con la interpretación del resultado.

4. Crea nuevas variables en la tabla: 1) Variable llamada «SubidaIvaJulio2010»: que represente este evento que está activo desde Julio 2010, 2) Variable llamada «SubidaIvaSeptiembre2012»: que represente este evento que está activo desde Julio 2012, 3) Variable llamada «Ley Antitabaco»: que represente este evento que está activo desde Enero 2011,

5. Desarrolla un modelo de regresión para explicar las ventas de tabaco en función de todas las variables disponibles y añade aquellos meses que representen una estacionalidad en las ventas, es decir, una variable por cada mes significativo. Da un resumen del ajuste y del impacto de cada variable.

6. En función del análisis que has realizado, ¿podrías preparar un artículo para un periódico generalista español que resuma la influencia del precio del tabaco en las ventas en España en el periodo analizado?

7. Y ahora, ¿puedes preparar un resumen del artículo anterior?

A continuación, el vídeo completo que muestra el proceso y en análisis impecable que a cualquiera de nosotros nos llevaría varias horas:

En base a las respuestas generadas por ChatGPT durante el análisis de los datos proporcionados, presento a continuación algunas conclusiones clave. Cabe destacar que estas conclusiones se obtuvieron sin necesidad de escribir una sola línea de código manualmente o de utilizar un programa especializado con interfaz gráfica:

Análisis de tendencia y de estacionalidad

El comportamiento decreciente de la serie de ventas a lo largo del tiempo podría deberse a varios factores. Aunque estos no se pueden determinar con certeza a partir de los datos proporcionados, aquí hay algunas posibles explicaciones:

  • Aumento de los precios: Como se observó en el gráfico del precio del tabaco, los precios han aumentado a lo largo del tiempo. Esto podría haber disuadido a algunos consumidores de comprar tabaco, lo que resulta en una disminución de las ventas.

  • Políticas de salud pública: Las políticas de salud pública y las campañas contra el tabaquismo podrían haber llevado a una disminución en el número de fumadores, lo que se refleja en una disminución de las ventas de tabaco.

  • Cambio en las preferencias del consumidor: Las preferencias de los consumidores podrían haber cambiado a lo largo del tiempo, con una tendencia hacia estilos de vida más saludables y una disminución en el consumo de tabaco.

La estacionalidad en las ventas de tabaco podría deberse a factores como las vacaciones y los eventos especiales, que pueden conducir a un aumento temporal en el consumo de tabaco. Sin embargo, se necesitaría más información y análisis para confirmar esto.

Impacto del precio del tabaco

Un aumento de 1 en el precio del tabaco se asocia con una disminución en las ventas de tabaco de aproximadamente 57.6 millones.

Explicación estadística

Los p-valores indican la significancia de cada variable en el modelo. Un p-valor menor que 0.05 indica que la variable es significativa. Según los p-valores, todas las variables son significativas en el modelo a excepción de la variable «SubidaIvaJulio2010».

Conclusiones del análisis

Nuestro análisis de los datos históricos muestra una correlación negativa entre el precio del tabaco y las ventas en España. A medida que el precio de las cajetillas de tabaco ha aumentado, las ventas han disminuido. Este efecto persiste incluso después de ajustar por factores estacionales.

Además, ciertos eventos legislativos, como la ley antitabaco de 2011 y la subida del IVA en 2012, se asociaron con disminuciones significativas en las ventas de tabaco. Por otro lado, los meses de verano, particularmente julio y agosto, muestran un aumento en las ventas, posiblemente debido a factores estacionales como las vacaciones.

Sorprendente, ¿no es así? A partir de ahora, deberemos acostumbrarnos a convivir con herramientas que facilitan el análisis de datos. El desafío consistirá en pensar de manera creativa cómo aprovechar al máximo la IA generativa. Este nuevo «copiloto», disponible para todos, ha llegado para cambiar las reglas del juego. Ahora, ChatGPT ya ha adquirido habilidades que, hasta hace poco, estaban sólo en manos de los Data Scientists y esto nos lleva automáticamente a la pregunta: ¿continuará la profesión de Data Scientist siendo la más «sexy» de este siglo?

 

Comparte con: