Los sabermétricos explican la correlación.

A continuación les traigo uno de los artículos de los colegas de GIIB (Grupo Independiente de Investigación para el Beisbol), que es de hecho matriz de cualquier análisis estadístico propuesto por la Sabermetría. Una sugerencia comparto con ustedes, y es la de leer este trabajo inicial y tomarlo como referencia al resto por venir.
La correlación.
Escrito por Camilo Quintas y Alejandro Aldama.
El uso de las estadísticas avanzadas en el béisbol puede ser intimidante para aquéllos que nos saltamos algunas clases de matemática o no hemos sido seguidores de la revolución inspirada por Bill James desde el principio.
Pero eso no quiere decir que debamos sentirnos enajenados de una de las formas más extraordinarias de entender y apreciar el juego que todos nosotros amamos. En los próximos trabajos exploraremos el camino de las estadísticas avanzadas intentando explicar de forma simple los conceptos principales y su uso.
En el presente material intentaremos explicar la idea expresada por el concepto de correlación lineal. No se pretende dar una clase de Estadísticas o Minería de Datos. Por tal razón las explicaciones que daremos carecen de total formalismo científico, pues nuestro objetivo es que el aficionado medio entienda la utilización de esta técnica en la demostración de teorías sobre el béisbol.
Comenzaremos con una pregunta, ¿qué es correlación?
De manera general podríamos decir que es una correspondencia o relación recíproca entre dos o más variables. En el contexto del béisbol generalmente nos estaríamos refiriendo a correspondencia o relación recíproca entre dos o más estadísticas; entendiéndose por estadísticas: AVE, HR, estatura, peso, etc. En fin, podemos considerar como estadísticas cualquier información que se pueda representar a través de números.
Entonces, ¿qué es correlación lineal?
Siguiendo la lógica de nuestro análisis, podemos considerar correlación lineal como la correspondencia o relación recíproca entre dos o más estadísticas de manera lineal. Obviaremos la explicación de por qué se especifica qué es lineal la correlación.
¿Qué es el coeficiente de correlación lineal?
Es el valor numérico que mide que tan buena es la correlación lineal entre 2 o más variables. Este valor numérico se denota con la letra r y está comprendido entre -1 y 1 (−1 ≤ r ≤ 1).
Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.
Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.
Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
Si r=1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente.
Hemos tratado de explicar la correlación lineal de manera intuitiva y superficial tratando de conseguir el objetivo propuesto.
Pongamos un ejemplo que permita ilustrar lo explicado hasta aquí:
La estatura y peso de los jugadores de un equipo de beisbol son:

Alguien investiga sobre si existe relación de algún tipo entre la estatura del jugador y su peso. Utilizando las técnicas necesarias obtiene como resultado que existe una correlación lineal entre la estadística X (estatura) y la estadística Y (peso) con un coeficiente r=0.94; el cual es muy bueno.
Esto se puede interpretar de varias formas; todas equivalentes:
-    La estatura de un jugador explica el 94% del  peso de este.
-    Existe una gran dependencia del peso de un jugador con respecto a su estatura.
Es importante aclarar, que no es parte de nuestro objetivo explicar cómo calcular las correlaciones, debido a que sencillamente no se necesita conocer estas cosas para entender la utilidad de esta herramienta.




Comentarios

  1. Me cuadro. Sencillo y Concreto. Donde esta el Profe?
    Profe estas escondido, imagino que ahora que tus niños sacaron esto salgas de nuevo a la luz. Viste hasta ellos reconocen que no saben nada de matematicas, usted es un cheo. Exito para el GIIB

    ResponderBorrar
  2. Por favor no empiecen caballeros. Anonimo no creo que los sabermetricos hallan dicho que no saben matematicas, mas bien creo que despues del chanchullito que se armó en los pasados articulos trataron de solidarisarse un poco con los ignorantes como tu para que no se sintieran mal.

    ResponderBorrar
  3. Gracias "Anonimo" por reclamar mi presencia, no me cansaré de intentar ejercer el magisterio pues vivo para la profesión.
    Gracias tambieén por permitirme con tus deslices hacer uso de mi profesión. Hoy será una exhortación a leer mejor lo que te haré. Es incorrecta la interpretación que haces del conocimiento de matematicas del que escribe: saltarse algunas clases lo hicimos todos durante nuestros estudios, pero de ahí a que eso signifique que no sabemos nada va un largo trecho.
    Por otra parte, hay algo que se llama modestia que al parecer a esos chicos le sobra, de ahí la expresión que no lograste captar. Un sabio de la antiguedad (se le atribuye a Sócrates) decia algo asi como: "solo sé que nada sé" y era uno de los hombres de mayor conocimiento de su época.
    Saludos cordiales a todos y unas gracias enormes para los chicos del grupo GIIB por su esfuerzo por expandir el conocimiento, espero que en el futuro se refleje con un aumento de la cantidad de jóvenes decididos a estudiar ciencias exactas, algo que necesitamos urgentemente!!!!

    ResponderBorrar
  4. Excelente artículo que en layman's terms desgloza, explica y da una idea al fanático común el ABC de cómo interpretar las Estadísticas.

    Yo opino modestamente que hasta allí deben de llegar en dificultad porque el que quiera ser Estadístico o Matemático pues que vaya a la universidad como el que quiera ser médico que vaya a Ciencias Médicas por 6.

    Mi petición para los Sabermétricos cubanos es la siguiente que quizás ustedes la tengan cuando coleccionan los datos para sus trabajos.

    10 primeros en todo

    Bateadores
    1. Cuáles son los lanzadores cubanos que más velocidad promedio tienen en la recta?
    2. Relevistas con más bajo % de hombres en base que anotaron una vez que entraron a lanzar
    3. Quiénes son los bateadores cubanos que más lanzamientos toman por veces al bate?
    4. % Swings que no se hizo contacto

    Lanzadores
    5. Promedio o Average Secondario
    6. Proporción K/BB
    7. HR permitidos por 9 entradas
    8. Eficiencia de un relevista contra el primer bateador enfrentado

    Gracias,

    Billy

    ResponderBorrar
  5. Promedio o Average Secondario debió de estar en los bateadores.

    Billy

    ResponderBorrar
  6. Articulos como estos se agradecen por el aficionado medio. Bravo por los chicos del GIIB.

    ResponderBorrar
  7. El aficionado medio agradece articulos como este, sencillo y claro. Bravo por los muchachos del GIIB.

    ResponderBorrar
  8. Ni me lo podia creer. Tenias que ser de la Lenin. Chama que orgullo pa la gente de la escuela.Un abrazo de la gente del audio

    ResponderBorrar

Publicar un comentario

Formulario de comentarios

Síguenos en Facebook