Resumen del experimento
La Comisión Nacional del Mercado de Valores (CNMV) ha puesto a prueba cuatro modelos de IA —ChatGPT, Gemini, DeepSeek y Perplexity— en una simulación de inversión real sobre el Ibex 35. Dos técnicos de la Dirección General de Estrategia y Asuntos Internacionales ejecutaron la prueba entre abril 2025 y enero 2026. Los resultados mostraron que los cuatro sistemas duplicaron la rentabilidad del Ibex durante el periodo.
Método y resultados de cada modelo
Se compararon tres modos de interacción con las IA: consulta básica, enfoque estructurado y razonamiento en cadena. La consulta básica imitaba a un inversor minorista sin guía metodológica. El enfoque estructurado obligaba al modelo a evaluar acciones mediante un marco multifactorial que incluía valoración, crecimiento, salud financiera, indicadores técnicos, riesgos macro y sentimiento de mercado. El razonamiento en cadena añadía una supervisión humana iterativa para revisar, corregir y validar cada paso del análisis.
Los cuatro modelos obtuvieron su mejor desempeño con la estrategia de razonamiento en cadena, donde la interacción estrecha con el técnico permitió corregir errores al vuelo. Perplexity lideró con un exceso de 3,5 p.p. de rentabilidad mensual frente al Ibex, acumulando más de 80 % en diez meses. ChatGPT y aportaron mensuales cada uno, mientras que añadió . Estas cifras mensuales equivalen a más que la revalorización del índice (43 %) en el mismo periodo, lo que explica la duplicación de retornos.





