Warning: Invalid argument supplied for foreach() in /home/.gingersnap/frankpereiro/beisblogs.com/wp-content/themes/freshy-10/functions.php on line 278
Recta por la media » 2007 » Julio

Peras vs. Manzanas (parte IV)

27 07 2007

De vuelta a la blogosfera, ya que estoy un poco más asentado en Caracas. Tengo que estirar un poco mis entumecidos dedos para darle forma a la cuarta entrega de esta serie.

En el artículo previo vimos un ejemplo en el que, a través de la distancia de Euclides, se realizó la comparación entre un grupo de lanzadores. El ejemplo no discriminaba entre las estadística utilizadas, se consideraban todas igualmente importante. Pero en la realidad, los factores evaluados difícilmente tienen este comportamiento.

En estadística, uno de los principales problemas es calcular los pesos del modelo utilizado, para poder minimizar el error cometido; ríos de tinta se ha derramado para obtener los mejores método de solucionar este problema. En la lógica borrosa este problema se confía, de nuevo, a los expertos, quienes mediante un criterio de ponderación, establecen la importancia absoluta de cada factor.

En el ejemplo que hemos venido utilizando, se usan cuatro variables de comparación: ERA, IP, OBP en contra y razón SO/BB. Al utilizar pesos iguales, descubrimos que la razón SO/BB era el factor decisorio más importante debido a su variabilidad inherente. Pero que pasaría si dejamos al experto (gerente general, manager, coach o scout) establecer importancias diferentes a cada una de estas medidas.

Lo único que tendríamos que decirle a nuestro hipotético experto es que asigne un peso a cada variable dentro del intervalo [0,1]. Este nos indica que prefiere un caballo come innings al que no se le embasen mucho, pero que las otras dos estadísticas (ERA y razón SO/BB) no le importan mucho. Por lo tanto, se obtiene del experto la siguiente escala de pesos:

1- ERA: 0.5
2- IP: 1
3- OBP en contra: 1
4- Razón SO/BB: 0.3

A continuación, se convierten los pesos absolutos para que tengan convexidad, es decir, sumen uno:

.

Por lo tanto, los pesos relativos serían:

1- ERA: 0.5/(0.5+1+1+0.3) = 0.5/2.8 = 0.18
2- IP: 1/2.8 = 0.36
3- OBP en contra: 1/2.8 = 0.36
4- Razón SO/BB: 0.3/2.8 = 0.1

La ecuación de la distancia de Minkowski cambiaría a:

.

Recordemos que en el caso de las distancias euclidianas k=2. Finalmente, la matriz que recoge las distancias euclidianas sería:

Distancias Euclidianas

  P1 P2 P3 P4
P1 0.000 0.096 0.033 0.046
P2 0.096 0.000 0.086 0.057
P3 0.033 0.086 0.000 0.035
P4 0.046 0.057 0.035 0.000

Una diferencia obvia al usar pesos convexos es que las distancias bajan en magnitud. Además, algunas de las distancias cambian radicalmente con respecto al resto de las distancias para ese mismo jugador. Por ejemplo, para P4: al no usar pesos la mayor distancia era con P3, la segunda mayor era con P2 y la menor era con P1. Al utilizar los pesos, la mayor distancia de P4 es ahora con P2, la segunda mayor es con P1 y la menor es con P3. También podemos apreciar que se rompe el empate que había entre P3 y P4 con respecto a P1, siendo ahora más parecido (tiene una distancia más corta) P3 a P1 que P4.

La definición de los pesos permite ser más específicos a la hora de establecer el perfil del jugador adecuado. Se puede ser tan detallado como se quiera, buscando identificar con precisión que jugadores se adaptan mejor a una situación en particular. En nuesto ejemplo, que pasa si el experto decide que los innings no son tan importantes pues su cuerpo de relevistas es el mejor de la liga. O que el factor más importante es la efectividad pues el equipo batea poco, aunque defensivamente es impecable. Es esta flexibilidad uno de los factores que más aleja metodológicamente a la lógica borrosa de la estadística, ya que en la estadística los pesos adoptan una sola forma según el modelo específico que utilicemos y sólo cambian con los datos utilizados para estimarlos. Les debo para la próxima entrega la inclusión de variables subjetivas y la obtención del jugador ideal.



Viaje

5 07 2007

Por ahora voy a tener el blog practicamente clausurado. Estoy preparando mi regreso a Venezuela y no tengo ni tiempo, ni acceso Internet permanente para hacer actualizaciones. En cuanto me desocupe un poco escribiré algo, así sea pequeño.

Gracias a todos los que me visitan por entender.



El draft de la “Guerra de los Blogs”

1 07 2007

Que desastre… Sólo eso puedo decir. Hice toda mi revisión de información sobre una base sabermétrica. Todo un error cuando el fantasy es un rottisserie clásico. Las estadísticas evaluadas en este tipo de torneos son de las que combatimos a diario, de las que quisiéramos fuesen sustituidas en todos los períodicos: AVG por OBP, HR por SLG, RBI por Runs Created. Además, creo que tendré que volver a publicar el artículo en el que se mostraba matemáticamente por qué las bases robadas (SB) no son efectivas.

Gracias a esta “confusión”, las selecciones ofensivas que realicé dejaron mucho que desear. Pero bueno, a lo hecho pecho. No voy a narrar todas las rondas de la selección, sólo las que considero más importantes.

En primera ronda seleccioné a Vladimir Guerrero, nada mal. Sin embargo, la diferencia en experiencia en este tipo de torneos se observa cuando P!t3x, en el puesto anterior al mío, selecciona a Carl Crawford. A Crawford no lo selecciona para su equipo ni la madre que lo parió. Pero con bastantes impulsadas, anotadas y, sobre todo, bases robadas, es una maravilla de selección.

Mi segunda selección fue una joya: B.J. Upton. La estaba destrozando, literalmente, con excelente promedio, impulsadas, anotadas y algunos robos. Además, contaba con elegibilidad en 3 posiciones, por lo que pensé que me la había comido. Pero había un pequeño problema… Estaba lesionadísmo!!! Y para largo!!!

En tercera ronda escogí al careta niuyorkino Jorge Posada. Creo que me adelanté al menos una ronda en esta escogencia. La cuarta y quinta fueron muy bien, con Jonathan Papelbon y J.J. Hardy. En la sexta ronda me ha caído Barry Bonds. Que mal estamos, cuando el casi, casi máximo jonronero de la historia cae hasta la sexta ronda. Quisiera darle una nota especial a los equipos Planeta Béisbol por escoger a Félix Hernández en la 4ta ronda y CaciquesFX por Andruw Jones en la 5ta. De alguien que va en último puesto, les puedo decir que fueron selecciones increíbles. ;)

En la 7ma ronda la boté de jonrón, seleccionando a Kelly Johnson cuando estaba Ben Sheets dando vueltas por ahí. Genial Julio, genial. Este error lo enmendé tomando a Brad Penny y Derek Lowe en las siguientes dos rondas y, “arriesgándome” con el viejito Roger Clemens. De aquí en adelante, sólo se puede destacar la selección de Kelvim Escobar en la 13ra.

Como ven, muy buen cuerpo de lanzadores, pero fatal ofensiva. Lo que me ha catapultado, hasta el día de hoy, al último puesto de la clasificación. Mi mejor selección es un empate entre Penny y Lowe. La peor, obviamente Upton en la segunda ronda. Creo que será mejor que me retire de esto de las ligas de fantasía, o mi reputación se verá fuértemente golpeada. Lo ideal sería que me quedara con lo que se me da mejor, eso de hablar tonterías con formulitas y numeritos.

Amanecerá y veremos…