En todo sistema de trading, la distribución de resultados se mueve en una difícil dialéctica: Si su normalidad es alta, entonces nuestra operativa será más aleatorios e impredecible, pero si pierde por completo la normalidad, posiblemente estaremos ante un sistema demasiado pegado a la curva de precios y, en consecuencia, sobreoptimizado.
De este modo, el histograma de una serie histórica de operaciones, no sólo contiene información valiosa para conocer la calidad y robustez de los beneficios obtenidos, sino que también constituye una buena herramienta para inferir lo que nos cabe esperar en el futuro.
¿CÓMO SE CONSTRUYE UN HISTOGRAMA?
El punto de partida será siempre una secuencia amplia y fiable de operaciones. Sobre este particular ya hemos hablado de manera extensa en nuestro anterior artículo; Principio de Pareto y distribución de resultados. Recomiendo repasar los criterios mencionados para disponer de una serie adecuada.
Algunas plataformas, como TradeStation o Wealth-Lab disponen de sofisticadas herramientas para analizar el rendimiento de un sistema, que incluyen numerosos gráficos de distribución de resultados:
En otros casos, por ejemplo con Visual Chart, será preciso exportar los datos a una hoja de cálculo para componer el histograma. De cualquier manera, construir este tipo de representación es muy sencillo. En las siguientes líneas explicaré brevemente como se hace en Excel.
1.- Una vez pegada en la primera columna de hoja la secuencia de operaciones, especificamos en la siguiente columna los rangos de precios para el cálculo de las frecuencias. Por ejemplo: Si la mejor operación fue de seiscientos puntos y la peor de cuatrocientos, podemos establecer diez intervalos de cien puntos (o veinte de cincuenta, si queremos afinar más) entre los cuales distribuir la frecuencia de las operaciones. Numerosos autores -y, desde luego, buenos motivos no les faltan- prefieren trabajar con porcentajes en lugar de valores absolutos. En tal caso, tendremos que exportar a Excel la secuencia porcentual de operaciones.
2.- Una vez establecidos los rangos, emplearemos la función histograma (Menú principal: > Herramientas > Análisis de datos) para crear el gráfico mediante el siguiente formulario:
El "rango de entrada" es la columna de operaciones y el de "clases" los intervalos. En las opciones de salida marcamos las casillas "Porcentaje acumulado" y "crear gráfico". Y ya está, con esto veremos la curva, más o menos normal (o a-normal), de las operaciones del sistema.
La imagen inferior muestra el histograma de una estrategia intradiaria basada en ruptura de rangos de volatilidad:
En el eje "Y", aparece la frecuencia y, en el "X", las operaciones agrupadas por tamaños. La curva superpuesta a las barras representa la frecuencia acumulada. En la parte superior de cada barra, y para facilitar la lectura del gráfico, hemos puesto el número de operaciones de cada rango.
¿CÓMO INTERPRETAR UN HISTOHRAMA?
Básicamente, nos interesan cuatro cosas: Centralidad, dispersión, asimetría y curtosis.
CENTRALIDAD: La media, la mediana y la moda, son los estadísticos de centralidad más empleados. En una distribución normal las tres deben coincidir. Sin embargo en los histogramas de trading, la moda es irrelevante, pues puede que no existan dos operaciones iguales en toda la serie. Como sustituto de la moda debemos fijarnos en el rango que se repite con mayor frecuencia. Si la distribución está desplazada hacia la izquierda, la mediana será más pequeña que la media. Pudiendo tener, incluso, valor negativo, como ocurre en muchos sistemas seguidores de tendencia. Sin embargo, nosotros preferimos sistemas con la mediana en terreno positivo que evidencien un equilibrio óptimo entre el porcentaje de operaciones ganadoras y la capacidad de cortar rápidamente las pérdidas dejando correr los beneficios.
Dicho así, parecería que esto es tarea sencilla, pero, obviamente, no es el caso, ya que al ir ciñendo cada vez más los stops, el porcentaje de aciertos se irá degradando inexorablemente. De hecho, esos maravillosos "juguetitos de salón" que obtienen en back-testing fiabilidades superiores al 80% se caracterizan por pervertir el "orden natural de las cosas"; permitiendo operaciones negativas ( y riesgos descomunales) en relación a los promedios de operaciones positivas.
DISPERSIÓN: En algunos histogramas las operaciones aparecerán relativamente agrupadas en torno a la media -sobre todo cuando se establecen recorridos muy cortos (intradiarios y tipo swing), otros mostrarán largas colas a izquierda y derecha de la curva, con leve sesgo positivo (tendenciales largos). En todos ellos, convendrá observar que el ratio media / desviación típica obtenga un equilibrio no inferior a 0,20. Con todo, cuando la desviación es muy grande, las operaciones serán erráticas e impredecibles. En general es preferible operar con desviaciones pequeñas, aún a costa de sacrificar cierta porción del equity curve.
ASIMETRÍA: Este concepto hace referencia a la concentración de los valores que forman la curva a izquierda y derecha de la media aritmética. Para medir el nivel de asimetría, generalmente se emplea el Coeficiente de Asimetría de Fisher (g1). Este estadístico caracteriza tres tipos de curva:
En el histograma de operaciones mostrado anteriormente, la media es de 262€ y el Coeficiente de Fisher de 1,37, lo que indica un sesgo claramente positivo en la distribución. Ni que decir tiene que, en igualdad de otros factores, hemos de preferir sistemas cuyo histograma muestre una simetría positiva.
Ahora bien, no nos engañemos, ya hemos dicho antes que cuando una secuencia de operaciones se aparta sospechosamente de la normalidad debemos ponernos rápidamente en guardia y sospechar lo peor...
CURTOSIS: Indica una mayor o menor concentración de valores en los rangos centrales del histograma. El Coeficiente de Curtosis (g2) es un buen indicador del grado de homogeneidad de la serie analizada. Como en el caso anterior, el signo del coeficiente determina tres modelos de distribución:
El histograma anterior tiene un coeficiente de curtosis de 4,71. Por tato, estamos ante una distribución de operaciones típicamente leptocúrtica. Siendo la mediana positiva (como es el caso) esto está muy bien, pues indica que hay una alta concentración de valores -y por tanto el comportamiento del sistema es más predecible- en torno a un valor central que está en el "lado de los números verdes".
Lógicamente, si la mediana del sistema fuese negativa, nos horrorizaría ver demasiados valores concentrados en torno a ese punto, por lo que una distribución platicúrtica y, a ser posible, con una larga cola a la derecha, nos dejaría mucho más tranquilos.
En general los sistemas con una alta frecuencia de operaciones (de pequeño tamaño) y porcentaje de aciertos superior al 50% (casi todos los intradiarios puros), se acomodan a una distribución leptocúrtica. Por el contrario, los tendenciales de tipo continuo, con reducida fiabilidad < 35%, basarán sus expectativas en un reducido número de operaciones positivas de gran tamaño, frente a un número mucho mayor de pequeñas operaciones negativas (o improductivas) En este caso, la distribución característica es de tipo platicúrtico.
FIABILIDAD DE RESULTADOS: ERROR TÍPICO Y CONFIANZA.
Bien, ya tenemos un preciso histograma y unas estadísticas que dan la talla. ¿Significa eso que podemos dormir a pata suelta confiando en que los resultados futuros se acomodarán al guión previsto? Je, Je... Mejor no contestar por ahora.
Pero, veamos. En nuestro anterior artículo hemos hablado de la conveniencia de simular series largas de operaciones cuando no disponemos de un histórico suficientemente grande. También hemos dicho que, cuando una distribución de resultados es demasiado parecida a la campana de Gauss, la estrategia está evidenciando un comportamiento demasiado aleatorio. Bien, pues una primera forma de salir de dudas será ir multiplicando x 10, x 20, x 30... el número de datos del histograma y contemplar qué ocurre.
Un sistema aleatorio de posicionamiento, tal y como vimos en el artículo Procesos aleatorios y estrategias de entrada, mostrará un perfil como este:
El grado de normalidad de la curva es alto, aunque no completo. Pues, como ya vimos en su momento, algunos factores como el peso de las comisiones y deslizamientos (responsables de la centralidad negativa) o el propio "arrastre" del mercado (retorno positivo en plazos muy largos) producen asimetrías más o menos mesurables.
Si al ir añadiendo más y más operaciones, nuestro histograma va ganando normalidad: ¡Malo, malo...! Quizá estemos ante una estrategia insostenible en el futuro.
Lo ideal, sería que ocurriese algo así:
Que se corresponde con las siguientes estadísticas:
Ciertamente, se trata de una estrategia prometedora. Pero, ¿merecerá la pena confiar a ella nuestros ahorros? Bien, veamos:
1) La media (259,4) y la mediana (105,7) son positivas y la mayor parte de las barras del histograma aparecen agrupadas en torno a estos valores.
2) La distribución es leptocúrtica y el coeficiente de asimetría positivo. ¡Estupendo! Todo va encajando.
3) El cociente media / desviación, se sitúa en 0,18. Algo justo (recordemos que lo ideal son valores por encima de 0,20) Pero en fin, no se puede tener todo.
4) Para un nivel de confianza de 61,2 al 95% -valor considerado "suficiente" para casi todas las muestras, que se corresponde con 1,96 desviaciones típicas- la media podría fluctuar entre 198,2 (en el peor de los casos) y 320,6 (en el mejor) No está nada mal, pues la línea de los números rojos sigue estando alejada del tamaño medio de las operaciones.
Con el gráfico sobre la mesa, tambien podemos realizar algunas inferencias interesantes:
1) Probabilidad de pérdidas extremas. Por ejemplo, las que calan hasta el hueso y, en este caso, suponen descalabros de más de 1500€. La frecuencia acumulada por debajo del valor -1.500 es del 6,8% (En total 136 operaciones sobre una muestra de 2.000) Bueno, por el lado izquierdo del gráfico podemos estar relativamente tranquilos.
2) Esperanza de obtener beneficios más o menos "razonables" (o inferiores a una desviación típica). Entre los rangos 100 y 1300 del histograma (pues no conviene apurar demasiado) encontramos 950 operaciones. Es decir, tenemos una probabilidad (950/2000) del 47,5% de obtener beneficios "estadísticamente normales".
3) Probabilidad de beneficios atípicamente buenos. A la derecha del histograma hay una larga mecha que incluye todas las operaciones (103) que sobrepasan los 3.500€ y que, en este caso, representan aproximadamente el 5% de ellas. Este es el listón en el que, subjetivamente, se fundamenta el verdadero interés del sistema. La suma de todas estas raras pero maravillosas operaciones (484.520€) justifica un 40% del total de las operaciones positivas (1.184.292€) y nada menos que el ¡¡93%!! del beneficio acumulado por el sistema en sus 2.000 operaciones. ¿A que ahora ya no parece tan buena la estrategia en cuestión?
Con los histogramas -cuando nos acostumbramos a usarlos y lo hacemos bien- ocurre lo mismo que con el análisis de Montecarlo: Constituyen un buen antídoto contra la precipitación y el autoengaño, aportando esa dosis de realismo, tan necesaria como urgente, en este endiablado laberinto repleto de rampas deslizantes, frías mazmorras y dragones hambrientos.
Andrés A. García.
© Tradingsys.org, 2007.