viernes, octubre 26, 2007

Achatando la navaja de Occam

La ciencia se rige en general por la navaja de Occam que dice, en pocas palabras, que la explicación más sencilla es comúnmente la correcta. En la ciencia podemos tener por lo general varias teorías simultáneas que explican un fenómeno, pero comúnmente aceptamos la más sencilla, bella, o elegante. Así somos los seres humanos, tenemos un sesgo hacia las explicaciones que son a la vez visualmente atractivas. Pero este proceso de aceptación de la sencillez nos conduce muy fácilmente a teorías innecesariamente complejas. ¿Cómo es esto posible?
Una característica esencial de la ciencia es la forma estructurada en que se desarrolla: a partir de fenómenos sencillos se explican otros más complejos, y así se continúa creciendo paulatinamente. Al avanzar en este proceso, vamos seleccionando la explicación más sencilla de cada uno de los fenómenos que nos vamos encontrando. Y es ahí donde surge el problema: la sencillez no se propaga a través de este proceso constructivo.
Quiero mostrar esto con un ejemplo. Con mucha maña me he tomado la libertad de no especificar a qué me refiero con el término sencillo; ¿qué tipo de explicación es más sencilla que otra? En el ejemplo voy a usar teoría de conjuntos. Supongamos que tenemos una lista fija de conocimiento (axiomas) sobre algunos conjuntos:

latex to png at http://math.b3co.com

nuestros fenómenos son simplemente relaciones (posiblemente complejas) entre conjuntos: latex to png at http://math.b3co.com, y una explicación es simplemente una sub-lista de nuestros axiomas que implica el fenómeno dado. Voy a decir que una explicación es más sencilla que otra si utiliza menos axiomas.
Así, para explicar el fenómeno latex to png at http://math.b3co.com podemos utilizar ya sea la lista que tiene los axiomas 1, 3 y 5 o la lista que tiene los axiomas 2 y 4. Esta última será la que preferimos según la noción de la navaja de Occam: nuestra teoría dice que latex to png at http://math.b3co.com porque 2 y 4 están presentes.
Si sustituimos C por D, hay únicamente una explicación posible: la lista con los axiomas 1, 3 y 6.
Pero ahora, ¿qué pasa si queremos explicar que latex to png at http://math.b3co.com? En ese caso, tenemos que explicar latex to png at http://math.b3co.com para lo que usamos 2 y 4, y explicar latex to png at http://math.b3co.com para lo que usamos 1, 3 y 6. En total, ¡nuestra explicación del fenómeno utiliza 1,2,3,4 y 6! Pero, de haber seleccionado la otra explicación - en principio menos sencilla - para latex to png at http://math.b3co.com, en conjunto tendríamos la explicación - más sencilla - que utiliza únicamente los axiomas 1,3,5 y 6.
Así, como ven, si las explicaciones más sencillas son deseadas en el resultado final, muchas veces es necesario complicar las explicaciones de los elementos intermedios. De otra forma, podríamos encontrarnos con teorías innecesariamente complicadas.
Este ejemplo depende completamente de definir sencillo como lo hice, pero es posible adaptarlo para arruinar otras definiciones.

5 comentarios:

Leonardo dijo...

Ciertamente el truco está en la definición de sencillo.

Considerando que la navaja de Ockham ayuda a discriminar posibles explicaciones para un fenómeno, podríamos decir que para fenómenos físicos (incluso también lógicos) la sencillez se puede definir como el menor número de afirmaciones. Esas afirmaciones ya no serían tan sólo los axiomas del marco lógico, si no también teoremas.

Por ejemplo, dentro del marco lógico que defines, podemos decir que: "Si A es subconjunto de B2, entonces es subconjunto de B3", a lo que llamaremos teorema 1. Entonces, para demostrar que A es subconjunto de la intersección de C y D necesitaríamos tan sólo el teorema 1 y los axiomas 5 y 6, lo que afilaría nuevamente a la navaja.

L.

juan antonio dijo...

Quizá un poco en la dirección de lo que menciona Leonardo. Donde yo creo que está el ‘meollo’ es un tu definición de ‘componer’ explicaciones.

Efectivamente los humanos tendemos a explicar primero casos sencillos y luego ‘componernos’ para explicar fenómenos más complejos. Pero la composición no es, normalmente, reescribir las explicaciones de los fenómenos sencillos uno tras otro.

En lugar de eso, como dice Leonardo, nosotros tratamos de estructurar las explicaciones en Lemas, Teoremas, etc. Al final el ‘árbol’ de explicaciones es quizá más grande que el listado de todas las explicaciones ‘atómicas’ pero, definitivamente, es también más sencillo de entender (para un humano).

Rafael Peñaloza dijo...

Hola Leonardo y Juan; gracias por sus comentarios.
Es cierto que usar proposiciones de "más alto nivel", como teoremas, ayuda a la simplicidad, pero no este proceso tampoco está libre de problemas.
Si nuestro sistema axiomático no está fijo, corremos el riesgo de encontrar explicaciones para dos fenómenos distintos que son incompatibles entre sí, y si explicamos algo por medio de ambos fenómenos tendríamos entonces una teoría inconsistente, aunque no lo notaríamos tan fácilmente.
No puedo construir un ejemplo de eso con conjuntos (porque no uso negaciones, y no hay forma de generar inconsistencias), pero podemos voltear a ver lo que está pasando con la física moderna: por un lado, tenemos una explicación para los fenómenos macroscópicos: la relatividad general; y por el otro tenemos una explicación para los microscópicos: la mecánica cuántica. Y no está claro que estas dos teorías sean compatibles entre sí - ojo, no estoy diciendo que no lo sean, simplemente que todavía no se sabe. Tal vez si viéramos a los axiomas que estamos usando para cada una de ellas, notaríamos que cualquier teoría que las reuniera sería necesariamente inconsistente, por lo que no hay teoría unificadora y habría que buscar por otro lado.
Saludos.

Leonardo dijo...

Rafael, llegaste al punto de dónde yo, no siendo matemático, hubiera empezado: las leyes de la física.
A finales del siglo XIX se pensaba que la electricidad y magnetismo eran dos fenómenos diferentes e independientes. Se tenían dos modelos matemñaticos distitntos, con sus respectivos sitemas axiómaticos. Entonces llegó James Clerk Maxwell y vació las dos leyes de Gauss (magnética y electrica), la de Ampere y la de Faraday en una coctelera, añadió grenadina (bueno, eso último es de mi cosecha ;-)),agitó vigorosamente, et voilá; ¡se hizo la luz! Electricidad y magnetismo eran la misma cosa.

¿Qué modelo era entonces válido? ¿Se asumiría que existen dos fenómenos distintos con sus respectivos modelos matemáticos? ¿o se tomaría el modelo unificado de Maxwell?. Según la navaja de Ockham, lo segundo es lo mas simple. Es parsomónico y no asume cosas superfluas.

Para poder aplicar el principio de la navaja a nivel de la física, la complejidad de las afirmaciones (o propocisiones) alcanza la de sistemas axiomáticos en sí. Para explicar el universo en su plano mas general, según el principio de la navaja de Ockham, se debería optar por aquél marco axiomático que lo englobe todo, llamesé éste teoría del campo unificado o teoría de supercuerdas.

Buenas noches,

L.

Rafael Peñaloza dijo...

Hola Leonardo.
Ese es exactamente mi punto. Que la navaja de Occam es incompatible con la forma en que construimos la ciencia. Tenemos dos fenómenos, para los cuales tenemos las "explicaciones más sencillas" de forma independiente, pero que al saber que ambos ocurren a la vez no podemos simplemente obtener la explicación más sencilla a partir de lo que teníamos antes. Tenemos que voltear atrás, prescindir de algunos aspectos de nuestras explicaciones anteriores, y buscar una teoría que englobe ambos fenómenos. En este caso, usar la navaja de Occam para los pasos intermedios no sólo no nos ayudó, sino que además nos llevó por un camino que después habríamos de retroceder.
Saludos.