Por fin he terminado de procesar los datos de la base de datos Lahman, para poder convertirla de modo que la edad sea un factor en mis cálculos. Un proceso lento, ya que por cada estadÃstica analizada, tenÃa que sacar la carrera de cada jugador desde 1960 hasta 2006. Más de 45.000 temporadas, que finalmente arrojaron casi 8000 jugadores con datos utilizables. Para los que quieran saber de que trata el método utilizado, les recomiendo que revisen mi post anterior, dónde se describe el procedimiento.
En fin, la primera vÃctima seleccionada es Miguel Cabrera de los Marlins de Florida. A continuación, podemos ver dos tablas donde se muestran tanto el desempeño de Miguelito en las dos últimas zafras (2005 y 2006), como mis predicciones para el año que viene, acotadas entre un mÃnimo y un máximo.
| AÑO |
EDAD |
AB |
R |
H |
H2 |
H3 |
HR |
RBI |
SB |
CS |
BB |
SO |
IBB |
| 2005 |
22 |
613 |
106 |
198 |
43 |
2 |
33 |
116 |
1 |
0 |
64 |
125 |
12 |
| 2006 |
23 |
576 |
112 |
195 |
50 |
2 |
26 |
114 |
9 |
6 |
86 |
108 |
27 |
| 2007-Min |
24 |
533 |
88 |
156 |
22 |
2 |
26 |
85 |
7 |
5 |
54 |
85 |
4 |
| 2007-Avg |
24 |
540 |
99 |
161 |
28 |
2 |
29 |
98 |
11 |
5 |
62 |
105 |
10 |
| 2007-Max |
24 |
568 |
111 |
172 |
35 |
4 |
31 |
112 |
15 |
6 |
67 |
132 |
14 |
| AÑO |
EDAD |
HBP |
SH |
SF |
GIDP |
AVG |
OBP |
SLG |
OPS |
| 2005 |
22 |
2 |
0 |
6 |
20 |
.323 |
.385 |
.561 |
.947 |
| 2006 |
23 |
10 |
0 |
4 |
18 |
.339 |
.430 |
.568 |
.998 |
| 2007-Min |
24 |
5 |
0 |
2 |
4 |
.293 |
.362 |
.488 |
.850 |
| 2007-Avg |
24 |
6 |
0 |
4 |
12 |
.298 |
.374 |
.519 |
.893 |
| 2007-Max |
24 |
9 |
1 |
7 |
14 |
.303 |
.381 |
.542 |
.923 |
Cabrera es todavÃa muy joven, por lo que el algoritmo no cree que sus números sean sustentables en esta temporada. Para el algoritmo, y para la historia, Cabrera es un caso excepcional, porque a muy joven edad arroja resultados impresionantes. Los números que parecen agregar mayor variabilidad a la predicción son los dobletes, ya que viene de acumular 43 y 50 en las dos últimas temporadas, mientras que el algoritmo le pronostica un máximo de 31. Lo mismo pasa con la cantidad de hits conectados, con una predicción máxima de 172 a pesar de que ha conseguido 198 y 195 en los dos pasados años. Aquà pesa mucho más el rendimiento de jugadores parecidos a Miguel que lo mostrado hasta ahora. De hecho, según Baseball Reference, el jugador más parecido a Cabrera, por termino general y hasta los 23 años, es Hank Aaron, toda una referencia en excepciones estadÃsticas.
¿De que depende que Cabrera siga por el camino de super estrella? Básicamente de lograr que sus batazos sigan cayendo de hit, es decir, de la suerte. Cabrera aumentó su número de boletos la temporada pasada, pero sigue dependiendo de lograr muchos hits para mantener sus números. Sin embargo, con unos números decentes como los que en promedio podrÃa lograr, un OPS de .900 no es nada despreciable para un joven de 24 años. Asà que es posible que su desempeño esté entre un excelente bateador y la super estrella que hasta ahora ha sido.
Esta es una prueba dura para el método, pero quise iniciarlo de esta manera, porque es obvio que mi método pueda fallar al decir que Miguel Cabrera no repetirá las dos super temporadas que hasta ahora ha tenido. Históricamente los jugadores de 24 años de edad no lo logran y los que si lo hacen, llegan muy, muy lejos.