Wilfredo Pareto, puso el dedo en la llaga cuando descubrió -quizá de manera demasiado empírica y aproximativa- que, en muchos procesos económicos y sociales, el 20% de las causas son responsables del 80% de los resultados. En las siguientes líneas, intentaré comprobar si esta relación se cumple también en el ámbito de los sistemas y las implicaciones prácticas que pudiera tener.
Cuando observamos la distribución de resultados de una amplia muestra de sistemas, enseguida aparece una pauta claramente discernible: Tan sólo un pequeño número del total de operaciones es responsable de la mayoría de los beneficios. El resto, o son operaciones improductivas (que a penas consiguen sacar cabeza sobre los gastos fijos de la operativa) o claramente perdedoras. Si al restar al equity curve el 20% de las operaciones que más ganan obtenemos una pendiente plana o ligeramente negativa, entonces nuestro sistema se acomoda al principio de Pareto o regla 80/20.
En realidad, esto sería una muy buena noticia pues, de hecho -y sobre todo cuando trabajamos con sistemas tendenciales- lo normal es encontrar relaciones ligeramente peores, que van desde 80/20 a 90/10, e incluso menos.
Quizá, llegado a este punto, amigo lector, estarás pensando: Bueno, pero ¡qué demonios! A fin de cuentas ¿qué importancia puede tener esto cuando sé que las expectativas de mi sistema son positivas y el tamaño de las operaciones ganadoras supera con creces el de las perdedoras? Cierto... Pero ponte, por un momento, en lo peor: ¿Te tragarías imperturbable una media de diez operaciones malas o mediocres con la esperanza de que la operación número once compense todos tus desasosiegos? Si es así, te felicito. Eres un todoterreno preparado para estos inhóspitos paisajes. Sin embargo, lo normal será que, en algún momento, decidas revisar tu estrategia para encontrar una operativa con menos sobresaltos. Te anticipo que es difícil, pero nadie dijo que el arte de ordenar la vaca se saldase sin callos en las manos.
SERIES DE RESULTADOS
Si queremos analizar de manera precisa el potencial de un sistema (o cartera de trading) necesitamos una secuencia de operaciones suficientemente larga, fiable y representativa de los mercados de referencia.
A) Estadísticamente relevante en el espacio muestral de procedencia (No es lo mismo 60 operaciones en un histórico de tres años que en uno de siete; como tampoco es lo mismo que estas operaciones se agrupen anualmente de este modo: 20-20-20, que de este otro: 9-15-36).
B) Estadísticamente significativa tanto para las ratios como para las herramientas de representación empleadas: Por ejemplo, difícilmente voy a poder hacer un histograma de frecuencias "creíble" con menos de 50 operaciones.
El término "FIABLE" representa, ante todo, un compromiso con nosotros mismos. El trading sistemático es un buen escenario para el autoengaño y la complacencia. De nada servirá una secuencia de operaciones errática y fragmentaria; o peor aún, basada únicamente en pruebas de back-testing sin ninguna salvaguarda para prevenir la optimización. En mi opinión, es preferible emplear un track-record (o histórico de operaciones reales) de pequeño tamaño que una larga retahíla de "cifras hipotéticas" de dudosa calidad. Quizá, una solución de compromiso sea comparar los datos out-sample con los de la operativa real y, cuando las diferencias no resulten muy grandes, añadirlos a la serie.
Por último, considero más "REPRESENTATIVA", por este orden, a) una serie de datos de "cartera" (sistema aplicado en múltiples mercados) que una serie de caso único (o de binomio sistema / mercado), y, b) una serie de diferentes marcoépocas, que incluyan las fases alcistas, laterales y bajistas del mercado en el que se desea aplicar el sistema.
CÓMO COMPONER SERIES.
En algunos casos será conveniente el recurso a series sintéticas obtenidas a partir de las estadísticas del sistema. Sobre todo, cuando el track-record disponible no es de suficiente amplitud. Algunos simuladores, como Market System Analyzer (MSA), permiten construir series de extensión variable. Para ello sólo necesitaremos cinco datos básicos:
La precisión es notable, aunque, lógicamente, el parecido con la serie original no tiene por qué ser el mismo ya que el simulador parte de la premisa -como no podía ser de otra manera- de que no existe dependencia entre operaciones y, por tanto, su orden es aleatorio. (Sobre este particular recomiendo leer el artículo "Reglas de dependencia")
En el gráfico inferior mostramos la curva original de beneficios y la serie sintética de una cartera compuesta por seis sistemas intradiarios.
Naturalmente, existe un número ilimitado de curvas posibles que satisfacen las estadísticas básicas de una serie de operaciones. Si agrupamos, por ejemplo, mil de estas curvas y pedimos al ordenador que procese todos sus datos, entonces tendremos una simulación de Montecarlo.
En mi opinión, cuando se dispone de pocos datos de operativa real (de 100 a 200, pues con menos, las estadísticas básicas dejarán de ser fiables) y se quiere obtener una proyección más amplia del comportamiento futuro del sistema, ésta es la mejor opción.
CURVA DE BENEFICIOS Y PRINCIPIO DE PARETO
Nuestro siguiente paso será comprobar si los resultados del sistema se acomodan al principio de Pareto y en qué grado lo hacen. Para esto bastará con una sencilla hoja Excel:
El primer paso será ordenar las serie de operaciones de mayor a menor. Y en otras celdas ir calculando las sumas de las relaciones 80/20, 85/15, 90/10 y 95/5.
Por ejemplo, y en el caso de la cartera que hemos tomado como "conejillo de indias":
Las barras azules representan el beneficio en cada uno de los cinco escenarios planteados y las rojas, la aportación al equity curve del resto de las operaciones.
Vemos claramente que esta cartera está muy por debajo de la regla 80/20: Pues, considerando que en las 157 operaciones analizadas el beneficio total es de 46.251€, el 20% de las mejores operaciones (31) acumula unos beneficios de 67.351€, mientras que el 80% restante incurre en unas pérdidas de 21.099€. No se alcanza una situación de equilibrio hasta el tercer supuesto, 90/10, con 15 operaciones. En otras palabras, los beneficios de esta estrategia dependen demasiado de unas pocas operaciones excepcionalmente buenas, sin las cuales la operativa dejaría de ser rentable.
En la literatura especializada sobre investigación microeconómica y teoría del juego, a menudo se habla de soluciones pareto-óptimas para hacer referencias a problemas de optimización de objetivos determinados por parejas variables interrelacionadas. Por ejemplo, se dice que una solución S1 al problema "N" es pareto-óptima cuando no existe una solución alternativa, S2, que mejore los resultados determinantes (el 20%) sin empeorar el resto (el 80%).
En el caso que nos ocupa, podemos asumir la siguiente premisa: El Ratio de Sharpe (RS) es un buen estimador del potencial de un sistema, considerando la relación riesgo / beneficio. A efectos prácticos, podemos incluso omitir el valor de la inversión libre de riesgo en la fórmula original, reduciendo la expresión al conciente entre el beneficio medio por operación y la desviación típica de resultados.
Como ahora sólo tenemos dos términos (media y desviación), podemos razonar, en conformidad con la lógica de Pareto, del siguiente modo:
1.- Problema general: ¿Cómo obtener el cociente RS más alto posible mejorando la media (Solución S1), la desviación (Solución S2) o ambas (Solución S3)?
El beneficio medio por operación (BMO) y la desviación de resultados, con independencia del tipo de sistema, dependen básicamente de algunos de estos factores:
Huelga decir que, al operar sobre estos factores, los resultados de media y desviación que obtendremos estarán fuertemente correlacionadas. Por tanto, de entrada, tendremos que descartar la tercera solución a problema planteado: No es posible mejorar simultáneamente ambos términos de la ecuación de Sharpe. Lo que sí resulta factible -y deseable- es conseguir un equilibrio entre riesgo y recompensa que se aproxime al óptimo de Pareto.
Pongamos un ejemplo:
Supongamos un sistema microtendencial simple, de cruce de medias, con una frecuencia de dos operaciones diarias y un Stop Loss basado en unidades ATR. Su secuencia de operaciones ofrece las siguientes estadísticas básicas:
En este caso, el cociente RS (media / desviación) es de 0,206. Si consideramos que la desviación estándar es un estimador adecuado del riesgo (cosa que no recomiendo; normalmente suelo emplear el valor de la peor operación) entonces estamos ante uno de los muchos sistemas del tipo 5:1. Es decir, necesita arriesgar cinco unidades (manzanas, peras, euros, lo que sea...) para ganar una.
Bien, pues vamos a ver que se puede hacer para obtener una solución pareto-óptima en este caso:
Jugamos un poco con el Stop Loss. Aquí es muy fácil, pues bastará con aumentar o disminuir el multiplicador del ATR (también podríamos trastear con su número de barras ... Pero, en fin, buena gana de ponernos más pesados a estas alturas del discurso). Veamos que ocurre:
Bueno, pues me gustaría haber sido más original, pero parece que en este caso la solución óptima es la que ya teníamos desde el principio.
Recordemos: ¿Por qué es óptima en términos de Pareto? Sencillamente, porque es la que consigue que la Solución 1 (aumentar la media) y la Solución 2 (disminuir la desviación típica) encuentren, en este caso, el equilibrio idóneo. Es decir, optimizar al máximo la relación riesgo / beneficio.
Andrés A. García.
© Tradingsys.org, 2007.