13.12.04
Cooperstown: La tabla de similitudes
El tercer método es el más divertido, a mi parecer. En él se realizan una serie de cálculos que permiten comparar qué tan parecidos son dos peloteros -- o al menos, que tan parecidas son las estadísticas de dos peloteros.
La finalidad que tienen los Similarity scores no es otra que tratar de rebatir el argumento que dice que porque el pelotero A está en el Salón de la Fama, entonces el pelotero B, que es 'similar', merece estar también. De hecho, si uno identificara a los diez jugadores más comparables a Babe Ruth, vería que cada uno de ellos está en el Salón de la Fama, y considerando que Ruth es uno de esos jugadores de los que nadie puede dudar su talento, entonces los diez más parecidos a él también deberían estar en Cooperstown ¿o no? En este caso, no hay argumento en contra -- claro, si se considera que los diez peloteros más comparables son Ted Williams, Lou Gehrig, Willie Mays, Jimmie Foxx, Mel Ott, Han Aaron, Frank Robinson, Mickey Mantle, Stan Musial y Reggie Jackson.
Esta coincidencia ocurre prácticamente para todos aquellos miembros del Salón de la Fama que se puedan tildar como los más grandes de la historia, Mays, Aaron, Musial, etc.
La pregunta que surge entonces es si un pelotero que sea comparable a otro que ya está en Cooperstown, merezca estarlo también. La respuesta es que no en todos los casos. Aunque un pelotero sea comparable o similar a otros que ya estén en el Hall de la Fama, es posible que exista un muy buen argumento para justificar que él no lo esté -- o vice versa, puede suceder que un pelotero no sea similar a nadie que esté en Cooperstown, pero que él si merezca estarlo por otros méritos.
Antes de seguir confundiéndolos, veamos la forma en la que se calcula este valor. Si suponemos que dos jugadores que tuvieran carreras idénticas y jugaran la misma posición defensiva tendrían 1000 puntos, entonces deberíamos comenzar por restar puntos por cada diferencia que se vaya encontrando en ellos. Esta resta se hace de la siguiente manera:
1. Por cada 20 juegos jugados de diferencia, restar 1 punto
2. Por cada 75 turnos al bate de diferencia, restar 1 punto
3. Por cada 10 carreras anotadas, restar 1 punto
4. Por cada 15 hits, restar 1 punto
5. Por cada 5 dobles, 1 punto
6. Por cada 4 triples, 1 punto
7. Por cada 2 jonrones, 1 punto
8. Por cada 10 carreras empujadas, 1 punto
9. Por cada 25 bases por bolas, 1 punto
10. Por cada 150 ponches, 1 punto
11. Por cada 20 bases robadas, 1 punto
12. Por cada punto de promedio de bateo (.001), 1 punto
13. Por cada dos puntos de promedio de slugging (.002), 1 punto
Si se dan cuenta, estos cálculos no incluyen, en ningún momento, el factor defensivo. Esto puede traer como consecuencia que dos peloteros parezcan ser similares, a pesar de jugar posiciones tremendamente diferentes (y si no se los había comentado antes, la posición defensiva también impacta el rendimiento ofensivo de un pelotero -- pero esa es una discusión para otro momento). Para cubrir esta debilidad, se asignan valores por posición (de una manera parecida a lo hecho con Los Estándares del Salón de la Fama) de la siguiente manera:
1. Catcher - 20 puntos
2. Shortstop - 14 puntos
3. Segunda base - 11 puntos
4. Tercera base - 7 puntos
5. Center field - 5 puntos
6. Right field - 4 puntos
7. Left field - 3 puntos
8. Primera base - 1 punto
9. Bateador designado - 0 puntos
Una vez que se calcule la similitud entre dos peloteros, si estos jugaron posiciones diferentes, se debe restar la diferencia entre los valores de dicha posición, se multiplica por 12 y se resta del total de la similitud encontrada. Por ejemplo, si compara dos jugadores y uno es un catcher y el otro un left field, debo restar 20 (catcher) - 3 (left field), lo que me da 17, lo multiplico por 12 y obtengo 204 puntos, que debo restar del total que haya obtenido de la comparación.
Ahora, ¿cómo determinamos si un pelotero es verdaderamente similar a otro? Al comenzar aceptamos la afirmación que dos peloteros exactamente iguales tendrían una calificación de 1000. Si a ese valor le comenzamos a restar puntos, vamos, cada vez, separándonos más de la igualdad, es decir, dejando de ser similares. En este sentido, utilizamos la siguiente tabla de rangos:
Si el valor es superior a 950, decimos que son 'inusualmente similares'
Si el valor es superior a 900, son 'verdaderamente similares'
Si el valor es superior a 850, son 'similares' o 'similares en esencia'
Si el valor es superior a 800, son 'relativamente similares'
Si el valor es superior a 750, son 'vagamente similares'
Si el valor está por debajo de 750, podemos decir que 'no son similares'
Típicamente, cualquier jugador debería tener entre cinco y diez peloteros que sean, como mínimo, 'similares' o 'similares en esencia'. Esta regla suele no cumplirse en los casos de los verdaderos super estrellas, quienes se distancian considerablemente y no acostumbran tener peloteros similares a ellos (caso Babe Ruth, por ejemplo).
Pero veámos esto con ejemplos, y retomemos a nuestro querido Andrés Galarraga. ¿Quién es el pelotero que estadísticamente es más similar a Galarraga?
Orlando Cepeda. El jugador cuyas estadísticas se asemejan más a las de Galarraga son las del Puertorriqueño Orlando 'Peluchín' Cepeda, miembro, justamente, del Salón de la Fama.
Cepeda alcanza 949 puntos de similitud con Galarraga, lo que lo hace un jugador 'verdaderamente similar' al Gato, y casi 'inusualmente similar'. Veamos los datos de cada pelotero para ver dónde está el parecido:
2. Turnos al bate: hay una diferencia de 161 turnos, es decir, 2 puntos (van 8)
3. Carreras anotadas: hay una diferencia de 60, es decir, 6 puntos (van 14)
4. Hits: hay una diferencia de 18, es decir, 1 punto (van 15)
5. Dobles: hay una diferencia de 27, es decir, 5 puntos (van 20)
6. Triples: hay una diferencia de 5, es decir, 1 punto (van 21)
7. Jonrones: hay una diferencia de 20, es decir, 10 puntos (van 31)
8. Carreras empujadas: hay una diferencia de 60, es decir, 6 puntos (van 37)
9. Bases por bolas: hay una diferencia de 5 - no se restan puntos (siguen 37)
10. Ponches: hay una diferencia de 834, es decir, 5 puntos (van 42)
11. Bases robadas: hay una diferencia de 14 - no se restan puntos (siguen 42)
12. Promedio de bateo: hay una diferencia de .009, es decir, 9 puntos (van 51)
13. Promedio de slugging: no hay diferencia - no se restan puntos (quedan 51)
Se tienen 51 puntos acumulados, que, restados a los 1000 originales, nos dan un total de 949.
¿Quiénes forman parte de la lista de los diez jugadores más similares a Galarraga?
El resto de la lista de los jugadores más parecidos a Galarraga es la siguiente:
**: con algún chance de entrar al Salón de la Fama (Bagwell sigue activo)
***: no van a entrar nunca
Como se ve, la compañía de Galarraga es algo variada, dos miembros de Cooperstown, incluyendo al más similar de todos (y que entró por la via del Comité de Veteranos), tres peloteros con algún chance lejano de entrar, y el resto, cinco de ellos, sin oportunidad alguna.
En el caso de los lanzadores, tenemos una lista de restas bastante parecida:
1. Por cada victoria de diferencia, restar 1 punto
2. Por cada dos derrotas de diferencia, restar 1 punto
3. Por cada dos puntos de porcentaje de victorias (.002), restar 1 punto (hasta un máximo de 100)
4. Por cada dos puntos de efectividad (.02), restar 1 punto (hasta un máximo de 100)
5. Por cada 10 juegos, 1 punto
6. Por cada 20 aperturas, 1 punto
7. Por cada 20 juegos completos, 1 punto
8. Por cada 50 innings lanzados, 1 punto
9. Por cada 50 hits permitidos, 1 punto
10. Por cada 30 ponches, 1 punto
11. Por cada 10 bases por bolas, 1 punto
12. Por cada 5 blanqueos, 1 punto
13. Por cada 3 ponches, 1 punto
Adicionalmente, se debe restar 10 puntos si se está comparando un lanzador zurdo con uno derecho, y restar 25 puntos si además son relevistas ambos. Si comparamos lanzadores de relevo, debemos cambiar el punto 3 (porcentaje de victorias), para que sea 1 punto por cada .001 de diferencia.
Por último, y debido a que el deporte ha cambiado tanto, si un lanzador nació antes de 1890 y el otro nació después, se deberán restar otros 25 puntos, siempre y cuando hayan nacido con al menos diez años de diferencia (es decir, si uno nació en 1888 y el otro en 1892, no se restaría nada). Suena más complicado que lo que en realidad es.
Y así como hicimos con Galarraga, ¿por qué no lo hacemos con Santana? ¿Quién es el lanzador que más se le parece?
El más parecido a Santana es Joel Piñeiro. La lista de Santana es mucho menos interesante que la de Galarraga, dado que este apenas está comenzando su carrera. No tiene mucho sentido determinarla ahora, a sabiendas de que va a cambiar mucho en el tiempo.
Como ven, este método es divertido y relativamente sencillo. Lo que sí no es, es definitivo -- no porque dos peloteros resulten similares quiere decir que ambos merezcan o no estar en el Salón de la Fama. Hay otros elementos que el método no considera y que son relevantes a la hora de la elección.
Un ejemplo que da Bill James, el autor de estas fórmulas, es el de Willie McCovey y Harmon Killebrew. Ambos son miembros de Cooperstown, ambos conectaron 500 jonrones en sus carreras, ambos empujaron más de 1500 carreras. Si buscamos al jugador más similar a McCovey, el sistema nos indicará que se trara de Killebrew, y sin embargo, si uno conoce a estos dos hombres, se da cuenta inmediatamente de que no son similares para nada: McCovey es un bateador zurdo que jugó toda su carrera en la Liga Nacional y tenía un swing fluido y largo. Killebrew es un bateador derecho que jugó toda su carrera en la Liga Americana y tenía un swing compacto. McCovey era primera base. Killebrew jugaba en tercera base. McCovey es negro. Killebrew es blanco.
En resumen, al igual que con los otros métodos, el similarity score ayuda a determinar el mérito de un jugador a ser electo para el Salón de la Fama, siempre y cuando se le utilice en conjunción con los otros métodos. Por si solo nos puede dar resultados que confundan o que presenten solo una parte de la realidad.
Como datos curiosos, les pregunto ¿se imaginan qué jugador (cuando tenía 21 años) es el más similar a Miguelito Cabrera? Hank Aaron. ¿Saben cuál es el pelotero que más se parece a Bob Abreu? Magglio Ordóñez. Interesante, ¿no?
La próxima semana veremos el último método; la lista de Keltner
Si quieres ver la lista con todos los métodos, haz click aquí
Estadísticas cortesía de: Béisbol Report
La finalidad que tienen los Similarity scores no es otra que tratar de rebatir el argumento que dice que porque el pelotero A está en el Salón de la Fama, entonces el pelotero B, que es 'similar', merece estar también. De hecho, si uno identificara a los diez jugadores más comparables a Babe Ruth, vería que cada uno de ellos está en el Salón de la Fama, y considerando que Ruth es uno de esos jugadores de los que nadie puede dudar su talento, entonces los diez más parecidos a él también deberían estar en Cooperstown ¿o no? En este caso, no hay argumento en contra -- claro, si se considera que los diez peloteros más comparables son Ted Williams, Lou Gehrig, Willie Mays, Jimmie Foxx, Mel Ott, Han Aaron, Frank Robinson, Mickey Mantle, Stan Musial y Reggie Jackson.
Esta coincidencia ocurre prácticamente para todos aquellos miembros del Salón de la Fama que se puedan tildar como los más grandes de la historia, Mays, Aaron, Musial, etc.
La pregunta que surge entonces es si un pelotero que sea comparable a otro que ya está en Cooperstown, merezca estarlo también. La respuesta es que no en todos los casos. Aunque un pelotero sea comparable o similar a otros que ya estén en el Hall de la Fama, es posible que exista un muy buen argumento para justificar que él no lo esté -- o vice versa, puede suceder que un pelotero no sea similar a nadie que esté en Cooperstown, pero que él si merezca estarlo por otros méritos.
Antes de seguir confundiéndolos, veamos la forma en la que se calcula este valor. Si suponemos que dos jugadores que tuvieran carreras idénticas y jugaran la misma posición defensiva tendrían 1000 puntos, entonces deberíamos comenzar por restar puntos por cada diferencia que se vaya encontrando en ellos. Esta resta se hace de la siguiente manera:
1. Por cada 20 juegos jugados de diferencia, restar 1 punto
2. Por cada 75 turnos al bate de diferencia, restar 1 punto
3. Por cada 10 carreras anotadas, restar 1 punto
4. Por cada 15 hits, restar 1 punto
5. Por cada 5 dobles, 1 punto
6. Por cada 4 triples, 1 punto
7. Por cada 2 jonrones, 1 punto
8. Por cada 10 carreras empujadas, 1 punto
9. Por cada 25 bases por bolas, 1 punto
10. Por cada 150 ponches, 1 punto
11. Por cada 20 bases robadas, 1 punto
12. Por cada punto de promedio de bateo (.001), 1 punto
13. Por cada dos puntos de promedio de slugging (.002), 1 punto
Si se dan cuenta, estos cálculos no incluyen, en ningún momento, el factor defensivo. Esto puede traer como consecuencia que dos peloteros parezcan ser similares, a pesar de jugar posiciones tremendamente diferentes (y si no se los había comentado antes, la posición defensiva también impacta el rendimiento ofensivo de un pelotero -- pero esa es una discusión para otro momento). Para cubrir esta debilidad, se asignan valores por posición (de una manera parecida a lo hecho con Los Estándares del Salón de la Fama) de la siguiente manera:
1. Catcher - 20 puntos
2. Shortstop - 14 puntos
3. Segunda base - 11 puntos
4. Tercera base - 7 puntos
5. Center field - 5 puntos
6. Right field - 4 puntos
7. Left field - 3 puntos
8. Primera base - 1 punto
9. Bateador designado - 0 puntos
Una vez que se calcule la similitud entre dos peloteros, si estos jugaron posiciones diferentes, se debe restar la diferencia entre los valores de dicha posición, se multiplica por 12 y se resta del total de la similitud encontrada. Por ejemplo, si compara dos jugadores y uno es un catcher y el otro un left field, debo restar 20 (catcher) - 3 (left field), lo que me da 17, lo multiplico por 12 y obtengo 204 puntos, que debo restar del total que haya obtenido de la comparación.
Ahora, ¿cómo determinamos si un pelotero es verdaderamente similar a otro? Al comenzar aceptamos la afirmación que dos peloteros exactamente iguales tendrían una calificación de 1000. Si a ese valor le comenzamos a restar puntos, vamos, cada vez, separándonos más de la igualdad, es decir, dejando de ser similares. En este sentido, utilizamos la siguiente tabla de rangos:
Si el valor es superior a 950, decimos que son 'inusualmente similares'
Si el valor es superior a 900, son 'verdaderamente similares'
Si el valor es superior a 850, son 'similares' o 'similares en esencia'
Si el valor es superior a 800, son 'relativamente similares'
Si el valor es superior a 750, son 'vagamente similares'
Si el valor está por debajo de 750, podemos decir que 'no son similares'
Típicamente, cualquier jugador debería tener entre cinco y diez peloteros que sean, como mínimo, 'similares' o 'similares en esencia'. Esta regla suele no cumplirse en los casos de los verdaderos super estrellas, quienes se distancian considerablemente y no acostumbran tener peloteros similares a ellos (caso Babe Ruth, por ejemplo).
Pero veámos esto con ejemplos, y retomemos a nuestro querido Andrés Galarraga. ¿Quién es el pelotero que estadísticamente es más similar a Galarraga?
Orlando Cepeda. El jugador cuyas estadísticas se asemejan más a las de Galarraga son las del Puertorriqueño Orlando 'Peluchín' Cepeda, miembro, justamente, del Salón de la Fama.
Cepeda alcanza 949 puntos de similitud con Galarraga, lo que lo hace un jugador 'verdaderamente similar' al Gato, y casi 'inusualmente similar'. Veamos los datos de cada pelotero para ver dónde está el parecido:
JUGADOR JG AB H 2B 3B HR CA CE BB SO BR .AVG .SLG
Galarraga 2257 8088 2333 444 32 399 1192 1425 583 2003 128 .288 .499
Cepeda 2124 7927 2351 417 27 379 1131 1365 588 1169 142 .297 .499
1. Juegos jugados: hay una diferencia de 133 partidos, es decir, 6 puntos2. Turnos al bate: hay una diferencia de 161 turnos, es decir, 2 puntos (van 8)
3. Carreras anotadas: hay una diferencia de 60, es decir, 6 puntos (van 14)
4. Hits: hay una diferencia de 18, es decir, 1 punto (van 15)
5. Dobles: hay una diferencia de 27, es decir, 5 puntos (van 20)
6. Triples: hay una diferencia de 5, es decir, 1 punto (van 21)
7. Jonrones: hay una diferencia de 20, es decir, 10 puntos (van 31)
8. Carreras empujadas: hay una diferencia de 60, es decir, 6 puntos (van 37)
9. Bases por bolas: hay una diferencia de 5 - no se restan puntos (siguen 37)
10. Ponches: hay una diferencia de 834, es decir, 5 puntos (van 42)
11. Bases robadas: hay una diferencia de 14 - no se restan puntos (siguen 42)
12. Promedio de bateo: hay una diferencia de .009, es decir, 9 puntos (van 51)
13. Promedio de slugging: no hay diferencia - no se restan puntos (quedan 51)
Se tienen 51 puntos acumulados, que, restados a los 1000 originales, nos dan un total de 949.
¿Quiénes forman parte de la lista de los diez jugadores más similares a Galarraga?
El resto de la lista de los jugadores más parecidos a Galarraga es la siguiente:
1. Orlando Cepeda - 949**: en el Salón de la Fama
2. Jim Rice - 893**
3. Joe Carter - 883***
4. Chili Davis - 863***
5. Willie Stargell - 862*
6. Fred McGriff - 851**
7. Dale Murphy - 844***
8. Jeff Bagwell - 842**
9. Ellis Burks - 840***
10. Will Clark - 839***
**: con algún chance de entrar al Salón de la Fama (Bagwell sigue activo)
***: no van a entrar nunca
Como se ve, la compañía de Galarraga es algo variada, dos miembros de Cooperstown, incluyendo al más similar de todos (y que entró por la via del Comité de Veteranos), tres peloteros con algún chance lejano de entrar, y el resto, cinco de ellos, sin oportunidad alguna.
En el caso de los lanzadores, tenemos una lista de restas bastante parecida:
1. Por cada victoria de diferencia, restar 1 punto
2. Por cada dos derrotas de diferencia, restar 1 punto
3. Por cada dos puntos de porcentaje de victorias (.002), restar 1 punto (hasta un máximo de 100)
4. Por cada dos puntos de efectividad (.02), restar 1 punto (hasta un máximo de 100)
5. Por cada 10 juegos, 1 punto
6. Por cada 20 aperturas, 1 punto
7. Por cada 20 juegos completos, 1 punto
8. Por cada 50 innings lanzados, 1 punto
9. Por cada 50 hits permitidos, 1 punto
10. Por cada 30 ponches, 1 punto
11. Por cada 10 bases por bolas, 1 punto
12. Por cada 5 blanqueos, 1 punto
13. Por cada 3 ponches, 1 punto
Adicionalmente, se debe restar 10 puntos si se está comparando un lanzador zurdo con uno derecho, y restar 25 puntos si además son relevistas ambos. Si comparamos lanzadores de relevo, debemos cambiar el punto 3 (porcentaje de victorias), para que sea 1 punto por cada .001 de diferencia.
Por último, y debido a que el deporte ha cambiado tanto, si un lanzador nació antes de 1890 y el otro nació después, se deberán restar otros 25 puntos, siempre y cuando hayan nacido con al menos diez años de diferencia (es decir, si uno nació en 1888 y el otro en 1892, no se restaría nada). Suena más complicado que lo que en realidad es.
Y así como hicimos con Galarraga, ¿por qué no lo hacemos con Santana? ¿Quién es el lanzador que más se le parece?
El más parecido a Santana es Joel Piñeiro. La lista de Santana es mucho menos interesante que la de Galarraga, dado que este apenas está comenzando su carrera. No tiene mucho sentido determinarla ahora, a sabiendas de que va a cambiar mucho en el tiempo.
Como ven, este método es divertido y relativamente sencillo. Lo que sí no es, es definitivo -- no porque dos peloteros resulten similares quiere decir que ambos merezcan o no estar en el Salón de la Fama. Hay otros elementos que el método no considera y que son relevantes a la hora de la elección.
Un ejemplo que da Bill James, el autor de estas fórmulas, es el de Willie McCovey y Harmon Killebrew. Ambos son miembros de Cooperstown, ambos conectaron 500 jonrones en sus carreras, ambos empujaron más de 1500 carreras. Si buscamos al jugador más similar a McCovey, el sistema nos indicará que se trara de Killebrew, y sin embargo, si uno conoce a estos dos hombres, se da cuenta inmediatamente de que no son similares para nada: McCovey es un bateador zurdo que jugó toda su carrera en la Liga Nacional y tenía un swing fluido y largo. Killebrew es un bateador derecho que jugó toda su carrera en la Liga Americana y tenía un swing compacto. McCovey era primera base. Killebrew jugaba en tercera base. McCovey es negro. Killebrew es blanco.
En resumen, al igual que con los otros métodos, el similarity score ayuda a determinar el mérito de un jugador a ser electo para el Salón de la Fama, siempre y cuando se le utilice en conjunción con los otros métodos. Por si solo nos puede dar resultados que confundan o que presenten solo una parte de la realidad.
Como datos curiosos, les pregunto ¿se imaginan qué jugador (cuando tenía 21 años) es el más similar a Miguelito Cabrera? Hank Aaron. ¿Saben cuál es el pelotero que más se parece a Bob Abreu? Magglio Ordóñez. Interesante, ¿no?
La próxima semana veremos el último método; la lista de Keltner
Si quieres ver la lista con todos los métodos, haz click aquí
comentarios:
Regresa a la página anterior...
Hola, es Julio!!! Me da ladilla que en este blog hay que registrarse para comentar... :D
El caso de Abreu y Magglio lo utilizo yo todo el tiempo para mostrarle a mis amigos lo impresionante que es el hecho de que dos jugadores tan diferentes sean tan similares. Cuando Magglio tuvo una aparentemente buena temporada y Abreu tuvo una aparentemente mala temporada también lo use para mostrar que en realidad Abreu fue mucho mejor que Magglio gracias a su capacidad de embasarse con boletos.
Muy buena la explicación, es un método algo tortuoso pero bastante efectivo. No se de donde lo sacaste tú, pero yo lo revisé por primera ves en http://www.baseball-reference.com
Saludos!!!
El caso de Abreu y Magglio lo utilizo yo todo el tiempo para mostrarle a mis amigos lo impresionante que es el hecho de que dos jugadores tan diferentes sean tan similares. Cuando Magglio tuvo una aparentemente buena temporada y Abreu tuvo una aparentemente mala temporada también lo use para mostrar que en realidad Abreu fue mucho mejor que Magglio gracias a su capacidad de embasarse con boletos.
Muy buena la explicación, es un método algo tortuoso pero bastante efectivo. No se de donde lo sacaste tú, pero yo lo revisé por primera ves en http://www.baseball-reference.com
Saludos!!!
JC, el método lo vi por primera vez en un libro de Bill James, "The politics of glory" (después le cambiaron el nombre), en el que habla detalladamente sobre cómo funciona el Salón de la Fama y plantea los cuatro métodos que estoy explicando aquí...
Publicar un comentario
Regresa a la página anterior...