Histograma de operaciones y curva normal
 
 

Histograma de operaciones y curva normal

 
TradingSys (AndG) - 23 Mar 2007
3 comentarios
 

tradingsys En todo sistema de trading, la distribución de resultados se mueve en una difícil dialéctica: Si su normalidad es alta, entonces nuestra operativa será más aleatorios e impredecible, pero si pierde por completo la normalidad, posiblemente estaremos ante un sistema demasiado pegado a la curva de precios y, en consecuencia, sobreoptimizado.

De este modo, el histograma de una serie histórica de operaciones, no sólo contiene información valiosa para conocer la calidad y robustez de los beneficios obtenidos, sino que también constituye una buena herramienta para inferir lo que nos cabe esperar en el futuro.

¿CÓMO SE CONSTRUYE UN HISTOGRAMA?

El punto de partida será siempre una secuencia amplia y fiable de operaciones. Sobre este particular ya hemos hablado de manera extensa en nuestro anterior artículo; Principio de Pareto y distribución de resultados. Recomiendo repasar los criterios mencionados para disponer de una serie adecuada.

Algunas plataformas, como TradeStation o Wealth-Lab disponen de sofisticadas herramientas para analizar el rendimiento de un sistema, que incluyen numerosos gráficos de distribución de resultados:

 

tradingsys

 

En otros casos, por ejemplo con  Visual Chart, será preciso exportar los datos a una hoja de cálculo para componer el histograma. De cualquier manera, construir este tipo de representación es muy sencillo. En las siguientes líneas explicaré brevemente como se hace en Excel.

1.- Una vez pegada en la primera columna de hoja la secuencia de operaciones, especificamos en la siguiente columna los rangos de precios para el cálculo de las frecuencias. Por ejemplo: Si la mejor operación fue de seiscientos puntos y la peor de cuatrocientos,  podemos establecer diez intervalos de cien puntos (o veinte de cincuenta, si queremos afinar más) entre los cuales distribuir la frecuencia de las operaciones. Numerosos autores -y, desde luego, buenos motivos no les faltan- prefieren trabajar con porcentajes en lugar de valores absolutos. En tal caso, tendremos que exportar a Excel la secuencia porcentual de operaciones.

2.- Una vez establecidos los rangos, emplearemos la función histograma (Menú principal: > Herramientas > Análisis de datos) para crear el gráfico mediante el siguiente formulario:

 

tradingsys

 

El "rango de entrada" es la columna de operaciones y el de "clases" los intervalos. En las opciones de salida marcamos las casillas "Porcentaje acumulado" y "crear gráfico". Y ya está, con esto veremos la curva, más o menos normal (o a-normal), de las operaciones del sistema.

La imagen inferior muestra el histograma de una estrategia intradiaria  basada en ruptura de rangos de volatilidad:

 

tradingsys

 

En el eje "Y", aparece la frecuencia y, en el "X", las operaciones agrupadas por tamaños. La curva superpuesta a las barras representa la frecuencia acumulada. En la parte superior de cada barra, y para facilitar la lectura del gráfico, hemos puesto el número de operaciones de cada rango.

¿CÓMO INTERPRETAR UN HISTOHRAMA?

Básicamente, nos interesan cuatro cosas: Centralidad, dispersión, asimetría y curtosis.

CENTRALIDAD: La media, la mediana y la moda, son los estadísticos de centralidad más empleados.  En una distribución normal las tres deben coincidir. Sin  embargo en los histogramas de trading, la moda es irrelevante, pues puede que no existan dos operaciones iguales en toda la serie. Como sustituto de la moda debemos fijarnos en el rango que se repite con mayor frecuencia. Si la distribución está desplazada hacia la izquierda, la mediana será más pequeña que la media. Pudiendo tener, incluso, valor negativo, como ocurre en muchos sistemas seguidores de tendencia. Sin embargo, nosotros preferimos sistemas con la mediana en terreno positivo que evidencien un equilibrio óptimo entre el porcentaje de operaciones ganadoras y la  capacidad de cortar rápidamente las pérdidas dejando correr los beneficios.

Dicho así, parecería que esto es tarea sencilla, pero, obviamente, no es el caso, ya que al ir ciñendo cada vez más los stops,  el porcentaje de aciertos se irá degradando inexorablemente. De hecho, esos maravillosos "juguetitos de salón" que obtienen en back-testing fiabilidades superiores al 80% se caracterizan por pervertir el "orden natural de las cosas"; permitiendo operaciones negativas ( y riesgos descomunales) en relación a los promedios de operaciones positivas.

DISPERSIÓN: En algunos histogramas las operaciones aparecerán relativamente agrupadas en torno a la media -sobre todo cuando se establecen recorridos muy cortos (intradiarios y tipo swing), otros mostrarán largas colas a izquierda y derecha de la   curva, con leve sesgo positivo (tendenciales largos). En todos ellos, convendrá observar  que el ratio media / desviación típica obtenga un equilibrio no inferior a 0,20. Con todo, cuando la desviación es muy grande, las operaciones serán erráticas e impredecibles. En general es preferible operar con desviaciones pequeñas, aún a costa de sacrificar cierta porción del equity curve.

ASIMETRÍA: Este concepto hace referencia a la concentración de los valores que forman la curva a izquierda y derecha de la media aritmética. Para medir el nivel de asimetría, generalmente se emplea el Coeficiente de Asimetría de Fisher (g1). Este estadístico caracteriza tres tipos de curva:

  • A) Simétrica (g1 = 0): los valores se distribuyen de manera homogénea a ambos lados de la media.
  • B) Asimétrica negativa (g1 < 0): Mayor concentración de valores a la izquierda que a la derecha.
  • C) Asimétrica positiva (g1 >0): Mayor concentración de valores a la derecha de la media.

En el histograma de operaciones mostrado anteriormente, la media es de 262€ y el Coeficiente de Fisher de 1,37, lo que indica  un sesgo claramente positivo en la distribución. Ni que decir tiene que, en igualdad de otros factores, hemos de preferir sistemas cuyo histograma muestre una simetría positiva.

Ahora bien, no nos engañemos, ya hemos dicho antes que cuando una secuencia de operaciones se aparta sospechosamente de la normalidad debemos ponernos rápidamente en guardia y sospechar lo peor...

CURTOSIS: Indica una mayor o menor concentración de valores en los rangos centrales del histograma. El Coeficiente de Curtosis (g2) es un buen indicador del grado de homogeneidad de la serie analizada. Como en el caso anterior,  el signo del coeficiente determina tres modelos de distribución:

  • A) Mesocúrtica: (g2 =0) Representa la normalidad: Grado de concentración medio en torno a los valores centrales de la variable.
  • B) Leptocúrtica (g2 >0) Elevada concentración. Barras centrales del histograma muy apuntadas.
  • C) Platicúrtica (g2 < 0) Curva más plana. Reducida concentración alrededor de los valores centrales.

El histograma anterior tiene un coeficiente de curtosis de 4,71. Por tato, estamos ante una distribución de operaciones típicamente leptocúrtica. Siendo la mediana positiva (como es el caso) esto está muy bien, pues indica que hay una alta concentración de valores -y por tanto el comportamiento del sistema es más predecible- en torno a un valor central que está en el "lado de los números verdes".

Lógicamente, si la mediana del sistema fuese negativa, nos horrorizaría ver demasiados valores concentrados en torno a ese punto, por lo que una distribución platicúrtica y, a ser posible, con una larga cola a la derecha, nos dejaría mucho más tranquilos.

En general los sistemas con una alta frecuencia de operaciones (de pequeño tamaño) y porcentaje de aciertos superior al 50% (casi todos los intradiarios puros), se acomodan a una distribución leptocúrtica. Por el contrario, los tendenciales de tipo continuo, con  reducida fiabilidad < 35%, basarán sus expectativas en un reducido número de operaciones positivas de gran tamaño, frente a un número mucho mayor de pequeñas operaciones negativas (o improductivas) En este caso, la distribución característica es de tipo platicúrtico.

FIABILIDAD DE RESULTADOS: ERROR TÍPICO Y CONFIANZA.

Bien, ya tenemos un preciso histograma y unas estadísticas que dan la talla. ¿Significa eso que podemos dormir a pata suelta confiando en que los resultados futuros se acomodarán al guión previsto? Je, Je... Mejor no contestar por ahora.

Pero, veamos. En nuestro anterior  artículo hemos hablado de la conveniencia de simular series largas de operaciones cuando no disponemos de un histórico suficientemente grande. También hemos dicho que, cuando una distribución de resultados es demasiado parecida a la campana de Gauss,  la estrategia está evidenciando un comportamiento demasiado aleatorio. Bien, pues una primera forma de salir de dudas será ir multiplicando x 10, x 20, x 30... el número de datos del histograma y contemplar qué ocurre.

Un sistema aleatorio de posicionamiento, tal y como vimos en el artículo Procesos aleatorios y estrategias de entrada, mostrará un perfil como este:

 

tradingsys

 

El grado de normalidad de la curva es alto, aunque no completo. Pues, como ya vimos en su momento, algunos factores como el peso de las comisiones y deslizamientos (responsables de la centralidad negativa) o el propio "arrastre" del mercado (retorno positivo en plazos muy largos) producen asimetrías más o menos mesurables.

Si al ir añadiendo más y más operaciones, nuestro histograma va ganando normalidad: ¡Malo, malo...! Quizá estemos ante una estrategia insostenible en el futuro.

Lo ideal, sería que ocurriese algo así:

 

tradingsys

 

Que se corresponde con las siguientes estadísticas:

 

tradingsys

 

Ciertamente, se trata de una estrategia prometedora. Pero, ¿merecerá la pena confiar a  ella nuestros ahorros? Bien, veamos:

1) La media (259,4) y la mediana (105,7) son positivas y la mayor parte de las barras del histograma aparecen agrupadas en torno a estos valores.

2) La distribución es leptocúrtica y el coeficiente de asimetría positivo. ¡Estupendo! Todo va encajando.

3) El cociente media / desviación, se sitúa en 0,18. Algo justo (recordemos que lo ideal son valores por encima de 0,20) Pero en fin, no se puede tener todo.

4) Para un nivel de confianza de 61,2 al 95% -valor considerado "suficiente" para casi todas las muestras, que se corresponde con 1,96 desviaciones típicas- la media podría fluctuar entre 198,2 (en el peor de los casos) y 320,6 (en el mejor) No está nada mal, pues la línea de los números rojos sigue estando alejada del tamaño medio de las operaciones.

Con el gráfico sobre la mesa, tambien podemos realizar algunas inferencias interesantes:

1) Probabilidad de pérdidas extremas. Por ejemplo, las que calan hasta el hueso y, en este caso, suponen descalabros de más de 1500€. La frecuencia acumulada por debajo del valor -1.500 es del 6,8% (En total 136 operaciones sobre una muestra de 2.000) Bueno, por el lado izquierdo del gráfico podemos estar relativamente tranquilos.

2) Esperanza de obtener beneficios más o menos "razonables" (o inferiores a una desviación típica). Entre los rangos 100 y 1300 del histograma (pues no conviene apurar demasiado) encontramos 950 operaciones. Es decir, tenemos una probabilidad (950/2000) del 47,5% de obtener beneficios "estadísticamente normales".

3) Probabilidad de beneficios atípicamente buenos. A la derecha del histograma hay una larga mecha que incluye todas las operaciones (103) que sobrepasan los 3.500€ y que, en este caso, representan aproximadamente el 5% de ellas. Este es el listón en el que, subjetivamente, se fundamenta el verdadero interés del sistema. La suma de todas estas raras pero maravillosas operaciones (484.520€) justifica un 40% del total de las operaciones positivas (1.184.292€) y nada menos que el ¡¡93%!! del beneficio acumulado por el sistema en sus 2.000 operaciones. ¿A que ahora ya no parece tan buena la estrategia en cuestión?

Con los histogramas -cuando nos acostumbramos a usarlos y lo hacemos bien-   ocurre lo mismo que con el análisis de Montecarlo: Constituyen un buen antídoto contra la precipitación y el autoengaño, aportando esa dosis de realismo, tan necesaria como urgente, en este endiablado laberinto repleto de rampas deslizantes, frías mazmorras y dragones hambrientos. 

Andrés A. García.

© Tradingsys.org, 2007.

 

 

Comentarios

 

trikero - ¿?soft de destripamienot de si

hola, he leido este y otros articulos tuyos. veo que empleas mucho el msa y ahora tambien citas el wealth lab ¿?cual de los dos es mejor para destripar/analizar convenientemente los sistemas¿? ¿?algun otro soft recomendable¿?

admin - WL versus MSA

Las plataformas Wealth Lab y MSA no son comparables. Considera que, en el primer caso, estamos ante un software, completísimo y altamente integrado, para el desarrollo de estrategias, su aplicación a múltiples mercados, gestión de carteras de sistemas y evaluación de resultados. Mientras que, en el segundo caso, el software de Michael Brayant, está enfocado únicamente al análisis de series de operaciones y aplicación sobre ellas de diversas estrategias de position syzing. 
 
Con todo, cuando ya se dispone de otra plataforma de trading, las herramientas de MSA son, en relación calidad / precio, una de las mejores opciones para someter sistemas y carteras (pues la versión 3.0.0, aún en fase beta, pero que ya se puede descargar de www.adaptrade.com ofrece la posibilidad de componer carteras de sistemas y aplicar sobre ellas todos los tests y algoritmos de posicionamiento) a rigurosas evaluaciones que incluyen análisis de Montecarlo y tests de significación paramétrica y dependencia.  
 
WL es, a mi juicio, y considerando lo que hay en el mercado, una de las mejores herramientas profesionales para la operativa sistemática. El único “pero” que le encuentro son las dificultades para obtener un servicio fiable de datos en TR (sobre todo del mercado español) y de lanzamiento de órdenes que sea adecuado para los brokers con los que habitualmente trabajamos. Por ejemplo, en el caso de IB, me ha decepcionado mucho la herramienta ofrecida por Finantic. 

trikero - mejora web

gracias por tu respuesta. como ves la pregunta era para analisis "off-line", no para operacion en tr. 
no obstante y aunque entiendo que puede ser limitacion de la herramienta de blogs,como sugerencia ¿?seria posible un boton donde poder mirar mis preguntas y si hay respuestas¿? ¿?o un link donde vengan las ultimas respuestas publicadas¿? 
 
saludos.

Añadir comentario

 
Modificado por TradingSys (AndG) - 23 Mar 2007
 
 

Secciones

 
 

Entradas recientes

 
 

Enlaces