Dibujando la Zona de Strike IV: Bayes.

Después de exhibir las diferencias que existen entre los lanzamientos de las últimas seis temporadas de la Liga Mexicana del Pacífico ha llegado la hora de intentar dibujar la zona de strike para alguna de las campañas. Así, este post detalla la metodología que se empleó a fin de dibujar la zona de strike de la temporada 16-17.

El problema de definir dicha zona puede ser replanteado como el de encontrar las franjas que mejor dividen a las bolas de los strikes. Asimismo, dicho replanteamiento puede ser resuelto más fácilmente si es dividido en sub-problemas y cada sub-problema es solucionado por separado. De este modo, al fraccionar el problema en cuatro (uno para cada franja que compone a la zona de strike) se obtiene:

Rplot

Establecidos los sub-problemas, cada uno de ellos puede ser resuelto por medio de modelos de Aprendizaje Automático. Esto a razón de que el problema de definir una franja que separe a las bolas de los strikes no es más que una problemática de clasificación biclase. Así, empleando el algoritmo de Bayes Ingenuo (un modelo de clasificación supervisada inspirado en el teorema de Bayes) en cada uno de los sub-problemas, se obtuvieron las siguientes franjas de separación:

gif

Tal y como se puede apreciar en la imagen anterior, dichas franjas de agrupamiento son un tanto curvas.  No obstante, dichas curvaturas no son tan pronunciadas, por lo que es posible convertir dichas líneas de separación en rectas sin afectar desmesuradamente las clasificaciones realizadas por el algoritmo de Bayes. Los resultados de los modelos de Aprendizaje Automático se muestran en la tabla roja y los resultados de su transformación se muestran en la tabla azul. Cabe decir que la exactitud varía muy poco entre ambas tablas.

tabla

Conocidos los puntos por donde cruzan las rectas de categorización, es posible trazar la zona de strike y clasificar todo aquello que se sitúa dentro de las cuatro rectas como strike y lo restante como bola. El modelo final proporciona una exactitud del 97%.

tabla2

Rplot04

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s