lunes, abril 28, 2008

Promedios y relaciones

Todos sabemos sacar promedios. Lo aprendimos desde pequeños y sabemos que es un método muy efectivo para, por ejemplo, interpretar datos a gran escala. Pero, a diferencia de lo que muchos pensamos, sacar promedios no es en general tan trivial. Los promedios son sólo claros cuando tenemos una relación de uno a muchos. Por ejemplo, el número de años que una persona ha vivido o similares.
Pero, ¿qué pasa si la relación es de muchos a muchos?
Veamos un ejemplo. Tenemos una serie de libros, relacionados con sus respectivos autores. Hay libros que pueden tener más de un autor y, obviamente, también hay autores que pueden haber escrito más de un libro. Supongamos que sólo tenemos dos libros y dos autores de tal forma que Autor1 es el único autor de Libro1, pero Libro2 tiene dos autores, a saber, Autor1 y Autor2.
Tenemos dos formas de promediar el número de libros por autor. Podríamos, en primer lugar, contar el número de libros (dos) y el número de autores (dos) y dividir la primera cifra entre la segunda. Así tenemos, en promedio un libro por autor.
Por otro lado, podríamos revisar de cada autor, cuantos libros tiene. Así, vemos que Autor1 tiene dos libros y Autor2 tiene uno. En promedio, cada autor tiene: ¡1.5 libros!
Lo mejor del caso es que ambos métodos son correctos; ambos responden a una pregunta adecuadamente, lo que cambia es la pregunta que se hace. Y, en general, no podemos saber cuál es la pregunta que vamos a querer responder con los datos, eso dependerá siempre de la aplicación.

3 comentarios:

Juan dijo...

Esto esta curioso, para la pregunta, en promedio, ¿cuántos libros escribe un autor? La respuesta que para mi tiene sentido es el 1.5.

¿Cuál es una pregunta para la cual el resultado esperado es 1?

Rafael Peñaloza dijo...

"¿Cuántos libros hay por autor?"
Tal vez con libros y autores no hace tanto sentido, pero piensa por ejemplo en "¿cuántas lámparas hay por habitante?" que sería el mismo caso, y distinto al equivalente de tu pregunta de "en promedio, ¿cuántas lámparas tiene cada habitante?"

Rafael Peñaloza dijo...

O tal vez un mejor ejemplo: "¿cuántos profesores hay por alumno?"