Saltar al contenido

Elo

¿Qué es Elo en Ajedrez?

El sistema de clasificación Elo es un método para calcular los niveles relativos de habilidad de los jugadores en partidas de dos jugadores.

«Elo» se escribe a menudo en mayúsculas (ELO), pero no es un acrónimo. Es el apellido del creador del sistema, Arpad Elo (1903-1992), un profesor de física estadounidense nacido en Hungría.

Origen del ELO

Elo fue originalmente inventado como un sistema de clasificación de ajedrez mejorado aunque se usa en muchas partidas hoy en día. También se utiliza como un sistema de clasificación para el juego multijugador competitivo en los juegos de ordenador, y se ha adaptado a los deportes de equipo, incluyendo el fútbol internacional, el fútbol americano universitario y el baloncesto, y las Grandes Ligas de Béisbol.

Creador del ELO

Arpad Elo fue un jugador de ajedrez de nivel maestro y un participante activo en la Federación de Ajedrez de los Estados Unidos (USCF) desde su fundación en 1939. La USCF utilizó un sistema de calificación numérica, ideado por Kenneth Harkness, para permitir a los miembros hacer un seguimiento de su progreso individual en términos distintos de las victorias y derrotas en los torneos. El sistema Harkness era razonablemente justo, pero en algunas circunstancias dio lugar a calificaciones que muchos observadores consideraron inexactas. En nombre de la USCF, Elo ideó un nuevo sistema con una base más estadística.

El sistema de Elo sustituyó la estimación estadística por un sistema de recompensas competitivas. Sistemas de calificación para muchos deportes de acuerdo con evaluaciones subjetivas de la «grandeza» de ciertos logros. Por ejemplo, ganar un torneo de golf importante podría valer la pena un semi-arbitrariamente elegido cinco veces más puntos que ganar un torneo menor.

Un esfuerzo estadístico, por el contrario, utiliza un modelo que relaciona los resultados del juego con las variables subyacentes que representan la capacidad de cada jugador. Los competidores todavía pueden sentir que están siendo recompensados y castigados por buenos y malos resultados, pero la afirmación de un sistema estadístico es que indirectamente mide alguna verdad oculta.

Nivel del Jugador de Ajedrez por su ELO

La Federación de Ajedrez de EE.UU. está dividiendo a los jugadores en el orden que se muestra a continuación:

2400 y superior Senior Master
2200 – 2399 Maestro
2000 – 2199 Experto
1800 – 1999 Clase A
1600 – 1799 Clase B
1400 – 1599 Clase C
1200 – 1399 Clase D
1000 – 1199 Clase E
En general, 1200 se considera un principiante brillante. Un jugador regular de ajedrez de competición tiene una puntuación de 1750.

Modelo de sistema de clasificación ELO

La suposición central de Elo era que el rendimiento de ajedrez de cada jugador en cada partida es una variable aleatoria normalmente distribuida. Aunque un jugador puede tener un rendimiento significativamente mejor o peor de un partido a otro, Elo asumió que el valor medio de los rendimientos de un jugador determinado cambia sólo lentamente con el tiempo. Elo pensó en la verdadera habilidad de un jugador como la media de la variable aleatoria de rendimiento de ese jugador.

Una suposición adicional es necesaria, porque el rendimiento de ajedrez en el sentido anterior todavía no es medible. No se puede mirar una secuencia de movimientos y decir: «Esa actuación es 2039». El rendimiento sólo puede deducirse de las victorias, los empates y las derrotas. Por lo tanto, si un jugador gana una partida, se supone que ha jugado a un nivel más alto que su oponente en esa partida. Por el contrario, si pierde, se supone que ha actuado a un nivel inferior. Si el juego es un empate, se asume que los dos jugadores han jugado casi al mismo nivel.

Elo agitó las manos ante varios detalles de su modelo. Por ejemplo, no especificó exactamente qué tan cerca deberían estar dos actuaciones para obtener un empate en lugar de un resultado decisivo. Y aunque pensó que era probable que cada jugador tuviera una desviación estándar diferente de su rendimiento, hizo una suposición simplificadora de lo contrario.

Para simplificar aún más el cálculo, Elo propuso un método directo para estimar las variables en su modelo (es decir, la verdadera habilidad de cada jugador). Uno podría calcular con relativa facilidad, a partir de tablas, cuántas partidas se espera que gane un jugador basándose en una comparación de su puntuación con la de sus oponentes. Si un jugador gana más juegos de los que se espera que gane, su puntuación se ajustará al alza, mientras que si gana menos juegos de los esperados, su puntuación se ajustará a la baja. Además, ese ajuste debía ser en proporción lineal exacta al número de victorias por las cuales el jugador había excedido o no había alcanzado el número esperado de victorias.

Desde una perspectiva moderna, las suposiciones simplificadoras de Elo no son necesarias porque la potencia de computación es barata y ampliamente disponible. Además, incluso dentro del modelo simplificado, son bien conocidas las técnicas de estimación más eficientes. Varias personas, especialmente Mark Glickman, han propuesto el uso de maquinaria estadística más sofisticada para estimar las mismas variables. En noviembre de 2005, el servicio de juegos online Xbox Live propuso el sistema de clasificación TrueSkill, que es una extensión del sistema de Glickman para juegos multijugador y multiequipo. Por otro lado, la simplicidad computacional del sistema Elo ha demostrado ser uno de sus mayores activos. Con la ayuda de una calculadora de bolsillo, un competidor de ajedrez informado puede calcular dentro de un punto cuál será su siguiente calificación publicada oficialmente, lo que ayuda a promover una percepción de que las calificaciones son justas.

Origen del Elo

La USCF implementó las sugerencias de Elo en 1960, y el sistema rápidamente ganó reconocimiento como más justo y preciso que el sistema Harkness. El sistema de Elo fue adoptado por la FIDE en 1970. Elo describió su trabajo con cierto detalle en el libro The Rating of Chessplayers, Past and Present, publicado en 1978.

Pruebas estadísticas subsecuentes han mostrado que el rendimiento de ajedrez es casi seguro que no se distribuye normalmente. Los jugadores más débiles tienen muchas más posibilidades de ganar de lo que predice el modelo de Elo. Por lo tanto, tanto la USCF como la FIDE han cambiado a fórmulas basadas en la distribución logística. Sin embargo, en deferencia a la contribución de Elo, se sigue diciendo comúnmente que ambas organizaciones utilizan «el sistema Elo».

La frase «Elo rating» se utiliza a menudo para significar el rating de ajedrez de un jugador según lo calculado por la FIDE. Sin embargo, este uso es confuso y a menudo engañoso, porque las ideas generales de Elo han sido adoptadas por muchas organizaciones diferentes, incluyendo la USCF (antes FIDE), el Club de Ajedrez de Internet (ICC), los Juegos de Yahoo! y la ya desaparecida Asociación de Ajedrez Profesional (PCA). Cada organización tiene una implementación única, y ninguna de ellas sigue exactamente las sugerencias originales de Elo. Sería más exacto referirse a todas las clasificaciones anteriores como clasificaciones Elo, y ninguna de ellas como clasificación Elo.

En su lugar, se puede hacer referencia a la organización que otorga la calificación, por ejemplo, «A partir de agosto de 2002, Gregory Kaidanov tenía una calificación FIDE de 2638 y una calificación USCF de 2742». Cabe señalar que las calificaciones Elo de estas diversas organizaciones no siempre son directamente comparables. Por ejemplo, alguien con una clasificación FIDE de 2500 generalmente tendrá una clasificación USCF cercana a 2600 y una clasificación ICC en el rango de 2500 a 3100.

El siguiente análisis de la lista de clasificación FIDE de enero de 2006 da una impresión aproximada de lo que significa una clasificación FIDE dada:

19743 jugadores tienen una puntuación superior a 2200, y normalmente están asociados con el título de Candidate Master.
1868 jugadores tienen una puntuación entre 2400 y 2499, la mayoría de los cuales tienen el título de Maestro Internacional (IM) o de Gran Maestro Internacional (GM).
563 jugadores tienen una puntuación entre 2500 y 2599, la mayoría de los cuales tienen el título de GM.
123 jugadores tienen una puntuación entre 2600 y 2699, todos (menos uno) de los cuales tienen el título de GM.
18 jugadores tienen una puntuación entre 2700 y 2799
Sólo Garry Kasparov de Rusia, Vladimir Kramnik de Rusia, Veselin Topalov de Bulgaria y Viswanathan Anand de India han tenido alguna vez una calificación de 2800 o más. En abril de 2007, nadie tiene una calificación superior a 2800; Anand es el más alto con una calificación de 2786. Aunque la última clasificación de Kasparov fue 2812, ha estado inactivo por más de un año y ha sido removido de la lista de la FIDE.
La calificación más alta de la FIDE fue de 2851, que Garry Kasparov tenía en las listas de julio de 1999 y enero de 2000.

En toda la historia del sistema de clasificación de la FIDE, sólo 39 jugadores (hasta abril de 2006), a veces llamados «Super-grandmasters», han alcanzado una puntuación máxima de 2700 o más. Sin embargo, debido a la inflación de las calificaciones, casi todos ellos son actores modernos: todos menos dos alcanzaron su calificación máxima después de 1993.

ELO de las máquinas

Se dice que varias computadoras de ajedrez funcionan a una fuerza mayor que cualquier jugador humano, aunque tales afirmaciones son difíciles de verificar. Las computadoras no reciben calificaciones oficiales de la FIDE. Los partidos entre las computadoras y los mejores grandes maestros bajo las condiciones del torneo ocurren, pero son comparativamente raros. Además, la mayoría de los jugadores de ordenador son paquetes de software, lo que hace que su fuerza de juego (y por lo tanto su puntuación) depende del ordenador en el que se están ejecutando.

La computadora de ajedrez Grand Master de Excalibur Electronics tiene una calificación estimada de Elo de 2100

El modelo Grand Master 747K tiene una clasificación Elo estimada de 2100!

En abril de 2006, la supercomputadora Hydra era posiblemente el jugador de ajedrez más fuerte en el mundo; sus creadores estiman que su fuerza de juego es de más de 3000 en la escala de la FIDE. Esto es coherente con su partido de seis partidos contra Michael Adams en 2005, en el que el entonces séptimo mejor jugador del mundo sólo logró anotar un único empate. Sin embargo, seis juegos son escasa evidencia estadística y Jeff Sonas sugirió que Hydra sólo se demostró que estaba por encima de 2850 por ese solo partido tomado de forma aislada.

Rybka está un poco más firme. Desde enero de 2007, Rybka está clasificado en varias listas dentro de 2900-3000, dependiendo del hardware en el que se ejecute y de la versión de software utilizada. Estas listas utilizan fórmulas de Elo e intentan calibrar a la escala FIDE. Sin dicha calibración, los diferentes grupos de clasificación son independientes y sólo pueden utilizarse para la comparación relativa dentro del grupo.

Objetivo del ELO

El objetivo principal de las clasificaciones de Elo es predecir con precisión los resultados de los juegos entre los competidores contemporáneos, y las clasificaciones de la FIDE realizan esta tarea relativamente bien. Un objetivo secundario, más ambicioso, es utilizar las clasificaciones para comparar a los jugadores entre diferentes épocas. Sería conveniente que una calificación FIDE de 2500 significara lo mismo en 2005 que en 1975. Si las calificaciones sufren de inflación, entonces una calificación moderna de 2500 significa menos que una calificación histórica de 2500, mientras que si las calificaciones sufren de deflación, lo contrario será cierto. Desafortunadamente, incluso entre las personas que quisieran que las calificaciones de diferentes épocas «significaran lo mismo», las intuiciones difieren marcadamente en cuanto a si una calificación dada debe representar una habilidad absoluta fija o un rendimiento relativo fijo.

Aquellos que creen en la habilidad absoluta (incluyendo la FIDE) preferirían que las clasificaciones modernas fueran más altas en promedio que las clasificaciones históricas, si los grandes maestros hoy en día están jugando mejor al ajedrez. Según este estándar, el sistema de puntuación está funcionando perfectamente si un jugador moderno de 2.500 jugadores tendría un cincuenta por ciento de posibilidades de vencer a un jugador de 2.500 de otra época, si pudieran jugar. Se cree ampliamente que viajar en el tiempo es imposible, pero el advenimiento de computadoras de ajedrez fuertes permite una evaluación un tanto objetiva de la habilidad de juego absoluta de maestros de ajedrez pasados, basada en sus partidas grabadas.

Aquellos que creen en el desempeño relativo preferirían que la calificación media (o algún otro rango de referencia) de todas las épocas fuera la misma. Por un estándar de desempeño relativo, el sistema de calificación está funcionando perfectamente si un jugador en el vigésimo percentil de la clasificación mundial tiene la misma calificación que un jugador en el vigésimo percentil solía tener. Los valores deben indicar aproximadamente dónde se encuentra un jugador en la jerarquía de ajedrez de su propia era.

ELO FIDE

El promedio de la clasificación FIDE de los mejores jugadores ha estado subiendo constantemente durante los últimos veinte años, lo que es la inflación (y por lo tanto indeseable) desde la perspectiva del rendimiento relativo. Sin embargo, es al menos plausible que las calificaciones de la FIDE no se estén inflando en términos de habilidad absoluta. Quizás los jugadores modernos son mejores que sus predecesores debido a un mayor conocimiento de las aperturas y al entrenamiento táctico asistido por ordenador.

En cualquier caso, ambos bandos pueden estar de acuerdo en que no sería deseable que la puntuación media de los jugadores disminuyera en absoluto, o que subiera más rápido de lo que puede atribuirse razonablemente al aumento general de las habilidades. Ambos bandos llamarían a la primera deflación y a la segunda inflación. La rápida inflación y la deflación no sólo imposibilitan la comparación entre diferentes épocas, sino que tienden a introducir inexactitudes entre contemporáneos más activos y menos activos.

El intento más directo de evitar la inflación/deflación de la calificación es tener cada final de juego en una transacción igual de puntos de calificación. Si el ganador gana N puntos de clasificación, el perdedor debe caer por N puntos de clasificación. La intención es mantener constante la puntuación media, evitando que los puntos entren o salgan del sistema.

Desafortunadamente, este simple enfoque típicamente resulta en la deflación de la calificación, como el USCF se apresuró a descubrir. Los puntos entran en el sistema cada vez que un jugador que no ha sido clasificado anteriormente obtiene una puntuación inicial. Del mismo modo, los puntos de valoración salen del sistema cada vez que alguien se retira del juego. La mayoría de los jugadores son significativamente mejores al final de sus carreras que al principio, por lo que tienden a quitar más puntos del sistema de lo que trajeron, y el sistema se desinfla como resultado.

Para combatir la deflación, la mayoría de las implementaciones de las calificaciones Elo tienen un mecanismo para inyectar puntos en el sistema. La FIDE tiene dos mecanismos inflacionarios. En primer lugar, las actuaciones por debajo de un «suelo de clasificación» no se registran, por lo que un jugador con verdadera habilidad por debajo del suelo sólo puede ser sin clasificación o sobrevalorado, nunca correctamente clasificado. En segundo lugar, los jugadores establecidos y con mayor puntuación tienen un factor K más bajo. No hay ninguna razón teórica por la que éstos deban proporcionar un equilibrio adecuado a un esquema que de otro modo sería deflacionista; quizás se corrigen en exceso y dan lugar a una inflación neta que va más allá del aumento de la habilidad absoluta de la población que juega. Por otro lado, no existe una alternativa obviamente superior. En particular, los sistemas de clasificación de juegos en línea parecen haber sufrido al menos tantos dolores de cabeza de inflación/deflación como la FIDE, a pesar de los mecanismos alternativos de estabilización.

El rendimiento no puede medirse absolutamente; sólo puede deducirse de las ganancias y las pérdidas. Por lo tanto, las calificaciones sólo tienen significado en relación con otras calificaciones. Por lo tanto, tanto la media como la dispersión de las calificaciones pueden elegirse arbitrariamente. Elo sugirió escalar las clasificaciones de modo que una diferencia de 200 puntos de clasificación en el ajedrez significaría que el jugador más fuerte tiene una puntuación esperada de aproximadamente 0,75, y la USCF inicialmente apuntó a que un jugador de club promedio tuviera una puntuación de 1500.

¿Cómo se calcula el ELO?

Si el Jugador A tiene RA de fuerza verdadera y el Jugador B tiene RB de fuerza verdadera, la fórmula exacta (usando la curva logística) para la puntuación esperada del Jugador A es

formula elo jugador ajedrez

Del mismo modo, la puntuación esperada para el Jugador B es

calculo elo jugadores ajedrez

Tenga en cuenta que EA + EB = 1. En la práctica, como se desconoce la verdadera fuerza de cada jugador, las puntuaciones esperadas se calculan utilizando las puntuaciones actuales del jugador.

Cuando las puntuaciones reales del torneo de un jugador exceden sus puntuaciones esperadas, el sistema Elo toma esto como evidencia de que la puntuación del jugador es demasiado baja, y necesita ser ajustada hacia arriba. Del mismo modo, cuando las puntuaciones reales de un jugador en el torneo son inferiores a sus puntuaciones esperadas, la puntuación de ese jugador se ajusta a la baja. La sugerencia original de Elo, que todavía es ampliamente utilizada, fue un simple ajuste lineal proporcional a la cantidad por la cual un jugador tuvo un desempeño superior o inferior al esperado. El máximo ajuste posible por juego (a veces llamado valor K) se estableció en K = 16 para los maestros y K = 32 para los jugadores más débiles.

Suponiendo que se esperara que el Jugador A anotara puntos EA pero en realidad anotó puntos SA. La fórmula para actualizar su calificación es la siguiente

ranking elo ajedrez formula

Esta actualización puede realizarse después de cada partido o torneo, o después de cualquier período de calificación adecuado. Un ejemplo puede ayudar a clarificar. Suponga que el jugador A tiene una puntuación de 1613, y juega en un torneo de cinco rondas. Pierde contra un jugador con una puntuación de 1609, empata con un jugador con una puntuación de 1477, derrota a un jugador con una puntuación de 1388, derrota a un jugador con una puntuación de 1586 y pierde contra un jugador con una puntuación de 1720. Su puntuación real es (0 + 0,5 + 1 + 1 + 0) = 2,5. Su puntuación esperada, calculada según la fórmula anterior, fue (0,506 + 0,686 + 0,785 + 0,539 + 0,351) = 2,867. Por lo tanto, su nuevo valor es (1613 + 32- (2.5 – 2.867)) = 1601.

Tenga en cuenta que si bien dos victorias, dos derrotas y un empate pueden parecer una puntuación a la par, es peor de lo esperado para el Jugador A debido a que sus oponentes tuvieron una puntuación más baja en promedio. Por lo tanto, está ligeramente penalizado. Si hubiera anotado dos victorias, una derrota y dos empates, para un puntaje total de tres puntos, eso habría sido ligeramente mejor de lo esperado, y su nueva puntuación habría sido (1613 + 32- (3 – 2.867)) = 1617.

Este procedimiento de actualización es el núcleo de las calificaciones utilizadas por FIDE, USCF, Yahoo! Games, el ICC, kdice y FICS. Sin embargo, cada organización ha seguido un camino diferente para hacer frente a la incertidumbre inherente a las calificaciones, en particular las calificaciones de los recién llegados, y para hacer frente al problema de la inflación y la deflación de las calificaciones. A los nuevos jugadores se les asignan clasificaciones provisionales, que se ajustan más drásticamente que las clasificaciones establecidas, y se han ideado varios métodos (ninguno completamente exitoso) para inyectar puntos en el sistema de clasificación de modo que las clasificaciones de diferentes épocas sean aproximadamente comparables.

Los principios utilizados en estos sistemas de clasificación pueden utilizarse para clasificar otras competiciones, por ejemplo, partidos de fútbol internacionales.

Las clasificaciones de Elo también se han aplicado a juegos sin posibilidad de empates, y a juegos en los que el resultado puede tener también una cantidad (pequeño/gran margen) además de la calidad (ganancia/pérdida).

Actividad de juego versus proteger la clasificación de uno
En general, el sistema Elo ha aumentado el clima competitivo para el ajedrez y ha inspirado a los jugadores a seguir estudiando y mejorando su juego. Ha permitido una visión fascinante al comparar la fuerza relativa de jugadores de generaciones completamente diferentes, como la capacidad de comparar Capablanca con Kasparov, por ejemplo.

Sin embargo, en algunos casos las clasificaciones pueden desalentar la actividad del juego para los jugadores que desean «proteger su clasificación».

Ejemplos Cálculo ELO

Pueden elegir sus eventos u oponentes con más cuidado cuando sea posible.
Si un jugador está en un torneo suizo, y pierde un par de partidos seguidos, puede sentir la necesidad de abandonar el torneo para evitar cualquier otra calificación de «daño».
Los jugadores júnior, que pueden tener altas calificaciones provisionales, y que realmente deberían estar practicando tanto como sea posible, podrían jugar menos de lo que lo harían, debido a preocupaciones de calificación.
En estos ejemplos, la «agenda» de clasificación a veces puede entrar en conflicto con la agenda de promoción de la actividad ajedrecística y las partidas clasificadas.

Parte del choque de agendas entre la actividad del juego y las preocupaciones de clasificación también se ve en muchos servidores en línea que han implementado el sistema Elo. Por ejemplo, los jugadores mejor valorados, al ser mucho más selectivos en cuanto a quiénes juegan, a menudo dan lugar a que esos jugadores acechen, esperando a que sus oponentes «sobrevalorados» intenten desafiarlos. Tales jugadores, debido a las preocupaciones de calificación, pueden sentirse desanimados, por supuesto, de jugar con cualquier jugador con una calificación significativamente más baja de nuevo por preocupaciones de calificación. Por lo tanto, éste es un posible aspecto antiactividad/antisocial del sistema de calificación Elo que debe ser comprendido. La agenda de puntuación de puntos puede interferir con el juego con el abandono, y sólo por diversión.

Interesante desde la perspectiva de preservar altos índices de Elo frente a la promoción de la actividad de los juegos clasificados es una propuesta reciente del Gran Maestro Británico John Nunn con respecto a los clasificatorios basados en el índice de Elo para un modelo de campeonato mundial. Nunn destaca en la sección sobre «Selección de jugadores», que los jugadores no sólo deben ser seleccionados por su alto nivel de Elo, sino también por su actividad en el juego. Nunn separa claramente el «bono de actividad» de la calificación Elo, y sólo implica utilizarlo como mecanismo de desempate.

El sistema Elo cuando se aplica a servidores en línea casuales tiene por lo menos otros dos problemas prácticos importantes que necesitan ser abordados cuando Elo se aplica al contexto de calificaciones de servidores de ajedrez en línea. Se trata del abuso del motor y del emparejamiento selectivo.

ELO por Nacionalidades y Regiones

ELO FEDA

Es el sistema de ELO utilizado en España, a nivel nacional, para más información clic en ELO FEDA

ELO FADA

Es el sistema de ELO utilizado en Andalucía y Aragón, a nivel regional, para más información clic en ELO FADA