Bombas, presidiarios y John Nash

Creo que a gran parte de los lectores de este blog le será familiar la situación que esta mañana viví al finalizar mi clase de psicología del lenguaje:

El profesor mira su reloj dando por finalizada la hora, y con una templanza absoluta se dirige al alumnado.

"Como muchos sabéis, mañana se ha convocado una huelga. Yo no tengo problema en pasar la clase al día siguiente, pero si uno solo de vosotros decide venir, me veo en mi obligación de dar la lección a los asistentes"

Inmediatamente un murmullo se apodera de la sala. ¿Asistir o no a la mañana siguiente?. Por supuesto, nadie desea dar clase pudiendo tener unas cuantas horas más de sueño, pero tampoco hace gracia el hecho de perder un día de materia. La situación puede ser perfecta para todos si cada uno se queda en su casa, pero en caso de que uno rompa con la coordinación del grupo el resto queda perjudicado. Incluso se suele dar el caso de aquel que no quiere ir a la facultad, pero lo va por miedo a que otro lo también lo haga?

Todo esto me hizo pensar en un libro que tuve en mis manos hace unos meses. En la portada se leía “Fundamentos de la teoría de juegos: El dilema del prisionero”. En las siguiente líneas me gustaría explicaros de qué trataba.

En los años 50 el mundo estaba un convulso a causa de la Guerra fría. Como ya sabéis, los continuos “roces” entre el bloque occidental-capitalista liderado por EEUU, y el oriental-comunistas con la URSS a la cabeza, dieron lugar a una carrera bélica frenética y galopante hacia el dominio de armas cada vez más devastadoras, capaces de decantar la balanza hacia uno de los dos bandos.

Paralelamente a esta atmósfera beligerante, John Von Neumann y Morgenstern (famosísimo matemático el primero e importante economista el segundo), trabajan en la Teoría de juegos. El nombre puede resultar confuso, ya que no se dedicaban precisamente a jugar a la Oca o a descubrir una táctica infalible para ganar al dominó; el trabajo de estos dos científicos era algo más ambicioso. Podríamos resumir que la Teoría de juegos busca operativizar matemáticamente aquellas situaciones que suponen un dilema de costes y beneficios, con el fin último de alcanzar una solución lógica bajo las reglas matemáticas (no os asustéis que no es de matemática de lo que quiero hablaros en esta entrada).

Por poner un ejemplo trivial, supongamos que una pareja de novios decide ir al cine: Anacleto quiere ver “Django”, la encarnizada y sanguinolenta entrega de Tarantino; por otro lado, María Dolores (Mariló para los amigos), prefiere ver por quinta vez “Diario de una pasión”, una película mucho más almibarada y soporífera para nuestro amigo Anacleto. Por supuesto, ninguno de los dos quiere ir sólo al cine, dando lugar a tres posibles opciones: A) Anacleto sale ganando y Mariló se atraganta de vísceras y palabrotas, pero al menos disfruta de la compañía de su “gordo” (+1 para Anacleto/ 0 para Mariló). B) La “churri” toma el mando y Anacleto pasa 3 horas al borde de la hiperglucemia (0 para Anacleto/ +1 para Mariló). C) Ninguno da su brazo a torcer y acaban teniendo bronca en casa (-1 para ambos).

Los expertos en Teoría de juegos toman lápiz y papel llenando libretas enteras con fórmulas y operaciones en busca de la elección óptima desde el método lógico-matemático. Pero dejemos aparcado el complicado mundo de la Teoría de juegos por el momento.

Como ya dijimos antes, conflictos por aquellos años 50 no faltaban y la creación de la Bomba de hidrógeno (Bomba H) cambió de pies a cabeza el concepto de la guerra. Es por ello que el ejército de los EEUU decide llamar a las mentes más brillantes del momento a servir a la nación. Bajo el nombre de la Organización RAND (Research and Development) se reúnen algunos de los más importantes científicos con el fin de aplicar sus conocimientos a la batalla. Entre ellos figuraban los nombres de Von Neumann y Morgenstern por sus atribuciones a la Teoría de juegos.

La situación era complicada, ambas potencias tenían los conocimientos y recursos necesarios para construir la Bomba, pero su uso tendría consecuencias completamente devastadoras (como la historia nos enseñó con Hiroshima y Nagasaki). Ninguno de los dos bandos quería iniciar una guerra nuclear y para ello lo más lógico es que ninguno la construyese; pero también es cierto que en el caso de que una de las dos naciones se hiciese con armas nucleares y la otra no, los últimos se verían completamente vulnerables frente a los primeros en construirla. Una tercera opción sería que ambos construyesen la bomba e iniciaran una guerra nuclear arrasándose mutuamente.

Así, podemos distinguir tres posibilidades:

Se llega a una negociación y ninguno construye la bomba.

Uno de los dos países rompe la negociación y deja al otro completamente “en pelotas”.

No se llega a ningún acuerdo y ambos sufren daños gravísimos e innumerables pérdidas humanas.

Sospechoso A NO delata y sospechoso B NO delata= 1 año para cada uno.

Sospechoso A NO delata y sospechoso B SÍ delata = 10 años para A/ 0 años para B.

Sospechoso A SÍ delata y sospechoso B NO delata= 0 años para A/ 10 años para B.

Sospechoso A SÍ delata y sospechoso B SÍ delata= 5 años para ambos.

Situación		Consecuencias para Preso A
Preso A Coopera	Preso B Coopera	Estímulo aversivo= 1
Preso A Coopera	Preso B NO coopera	E.a= 10
Preso A No coopera	Preso B Coopera	E.a= 0
Preso A No coopera	Preso B NO coopera	E.a= 5

Si no va nadie a la huelga, pero tú sí, eres un pringao (y un poco más pobre).

Si vas a la huelga y esta es un éxito, has perdido tu sueldo y la huelga hubiese sido un éxito aunque no hubieses asistido.

Si no vas a la huelga y no va nadie, no has perdido tu sueldo (algo es algo).

Si no vas a la huelga y esta ha sido un éxito, eres un “crack”, te aprovechas de un beneficio colectivo sin haber sufrido ningún prejuicio individual. Es en este punto donde se encuentra el Equilibrio que le hizo ganar el Nobel .

¿No os recuerda a algo?

Podríamos decir que este dilema no es diferente al que sufren nuestros amigos Anacleto y Mariló unos párrafos más arriba, la no cooperación entre las partes da lugar a una situación no deseada para ninguno de los dos.

Cabe decir que la construcción de la Bomba H era un proyecto muy costoso y de muy poca longevidad, ya que los iniciadores de polonio necesarios para la detonación necesitan del isótopo polonio210, que tan solo tiene una vida activa de unos 138 días. Es decir, que si se invertían millones de dólares en la construcción de la Bomba era para que fuese utilizada, ya que “gastar por gastar es tontería”. Por lo tanto, no vale decir - Voy a construir la Bomba solo por si acaso.

Pero ¿Por qué os hablo de la guerra y la bomba? Paciencia.

Otro importante matemático colaborador en la organización RAND llamado Merryl Flood, desarrolló junto con Malvin Dresher las bases teóricas de lo que hoy en día se conoce como El dilema del prisionero; que trabajando sobre las bases de la teoría de juegos de Von Neumann, buscaban elaborar el modelo matemáticamente perfecto aplicable a las situaciones de cooperación y conflicto en función de los costes y beneficios.

Los teoremas de Flood y Dresher se sustentaban en explicaciones matemáticas muy complejas, con lo que sus ideas eran prácticamente inaccesibles para todos aquellos no doctos en las matemáticas avanzadas.

En una conferencia impartida en la Universidad de Standford, Albert Tucker se ve en la necesidad de explicar el trabajo de Flood y Dresher. Dado que el auditorio no era de matemáticos, sino de psicólogos, decidió inventarse una historia penitenciaria que les permitiese ejemplificar la vincular entre las decisiones de los sujetos, fue en este momento donde se bautiza a este dilema como “El juego del dilema del prisionero” (JDP).

Tucker lo formuló del siguiente modo:

Se trata de dos sospechosos de cometer un crimen, ambos en celdas separadas. Al no tener pruebas contra ellos, si no obtienen ninguna confesión por parte de los sospechosos, el fiscal tiene pensado proponer una condena menor idéntica para ambos (1 año de cárcel), pero para animar a los sospechosos a la confesión, les propone el siguiente trato por separado: Si delatas a tu compñaero y tu compañero no lo hace, serás libre mientras que tu compañero cargará con todo el peso del crimen (una condena de 10 años), por supuesto este trato también se le ofrece al otro preso, si ambos os delatáis mutuamente compartiréis la condena de 5 años cada uno.

Ordenando las opciones, tendríamos lo siguiente:

La historieta que inventó Albert Tucker permitió divulgar este tipo de situaciones a diferentes ramas de estudio ajenas al mundo matemático, como son la psicología o la sociología.

Por supuesto, desde este blog la visión que nos interesa es aquella relativa a la psicología. Este dilema tuvo su hueco en las ciencias del comportamiento, puesto que permitía estudiar las conductas de cooperación y negociación entre sujetos o grupos. Así, en el ejemplo de Tucker, NO DELATAR supondría una actitud cooperativa con el otro preso, mientras que DELATAR supondría la no cooperación con el fin del beneficio mutuo.

El dilema del prisionero resulta un instrumento muy versátil para la investigación de programas de reforzamiento, ya que nos permite manipular muchas variables cuantitativas y cualitativas. Para explicarme mejor reestructuraré este dilema con conceptos propios de los programas de conducta:

Lo que el fiscal ofrece a los presos como recompensa sería considerado un reforzador negativo (el refuerzo consiste en retirar algo que el sujeto quiere evitar, en este caso la cárcel).

Como íbamos diciendo, lo realmente atractivo de este dilema es el estudio en función del cambio de las variables. Por ejemplo, podemos modificar la magnitud del refuerzo: ¿Tendrá el mismo comportamiento el Preso A, si la cooperación en lugar de exponerle a 10 años le supusiesen 50?, o podemos modificar la naturaleza del reforzador: ¿Habría diferencias en la conducta de los presos si en lugar de un reforzador negativo, se le ofrece un reforzador positivo, por ejemplo dinero?. También puede resultar interesante estudiar otras variantes ajenas al reforzador, como las diferencias individuales o los factores ambientales: Si uno de los presos es un hombre heterosexual y dotado de visión, y el otro resulta ser la atractiva Scarlett Johansson ¿Quién de los aquí presentes no estaría dispuesto a cooperar ciegamente?.

Por supuesto, el dilema del prisionero a sido contextualizado de infinitas formas, dando lugar a multitud de historias diferentes, pero manteniendo siempre la esencia de los experimentos de Flood y Dresher. En muchos casos nos cruzamos con Dilemas del prisionero en nuestro día a día, y siempre suponen un conflicto para el que lo sufre.

Para la ciencia ficción este tipo de dilemas es un valioso instrumento para crear incertidumbre entre los espectadores. Un ejemplo muy ilustrativo lo podemos ver en la película de Batman “El caballero oscuro”:

Hasta aquí todo muy bonito, pero ¿Se ha encontrado alguna solución a este tipo de situación?. Lo cierto es que en la historia se han elaborado muchas teoría que surgieron y fracasaron en el intento de dar una solución definitiva a los problemas que nos presentan este tipo de juegos, pero hubo una persona que marcó un antes y un después en la teoría de juegos, Jonh Nash; a quien muchos conoceréis por ser el personaje principal de la película titulada “Una mente maravillosa”.

Nash estudió en Priceton, donde tuvo profesores de la talla de Einstein o el mismo Von Neumann. Durante la Guerra fría, Nash trabajaría para la organización RAND en el sector de logística militar, y posteriormente lograría el premio Nobel de economía en 1994 por la aportación del Equilibrio de Nash (y el Oscar por su interpretación en Gladiator).

¿Qué me estás contando ahora?, diréis muchos. Pues el Equilibrio de Nash se consideró durante mucho tiempo como la solución al dilema del prisionero.

Explicado muy por encima y sin meterme en números, la teoría del Equilibrio de Nash se cumple bajo la condición de que todos los participantes opten por su mayor beneficio, y se conozcan abiertamente los costes y beneficios del resto de jugadores. En este caso, el Equilibrio de Nash dicta que la mejor opción es encontrar un punto de equilibrio entre la situación óptima individual y la situación óptima del resto. Tan simplificada, la teoría de Nash puede parecer un poco “de cajón”, pero lo cierto es que con este concepto, Nash puso patas arriba el sistema económico capitalista de Adam Smith.

En la película Una mente maravillosa se explica a grandes rasgos de que trata todo esto:

“Adam Smith estaba equivocado”, ¡Guau! Acabamos de pasar de algo más que un chiste de policías y ladrones a cuestionar los pilares de la economía moderna. Con esto quiero decir que la teoría de juegos tiene una aplicación de gran profundidad y no consiste en la mera invención de juegos triviales.

Pero tampoco se debe confundir esta teoría con las ideas marxistas, el equilibrio de Nash no supone un equilibrio de máximo beneficio común, sino que supone un punto exacto entre el beneficio común y el prejuicio propio.

Y es esta la razón por la que me acordé de Nash esta mañana: ¿Iría John Nash a una huelga?

Partiendo de la idea de que ir a la huelga supone perder el sueldo y el éxito de la misma conlleva una serie de beneficios para todo el mundo, se darían varias posibilidades:

Es decir, que aplicando la Ley de Equilibrio, Nash hubiese asistido a trabajar como buen esquirol, ya que, traidor o no, lo que está claro que tonto no era.

Pero la Teoría de juegos, y con ella el Equilibrio de Nash, tuvieron sus detractores. Una de las principales críticas que recibió fue la falta de aplicabilidad al mundo real con jugadores de carne y hueso, ya que en este tipo de juegos no se puede contemplar únicamente el coste y los beneficios de la decisión, sino que hay que tener en cuenta otros factores como los valores morales o la capacidad de “jugar por jugar”. Steve J.Heims en su libro John Von Neumann and Norbert Wiener (1980) dice lo siguiente: “La teoría de juegos refleja un mundo en el que las personas persiguen lo que consideran que son intereses de manera implacable, sin piedad, mas con inteligencia y cálculo”. Así mismo, muchas personas defendieron que la Teoría de juegos no era más que una herramienta militar maquiavélica para justificar la guerra o acciones en contra de la ética.

De cualquier modo, no debemos olvidar que el trabajo de Von Neumann y Morgenstern abrió las puertas a una nueva forma de estudio del conflicto y la toma de decisiones basada en la operativización de variables, dando resultados muy interesantes en áreas de estudio tan distantes entre sí como pueden ser la informática, la economía o la psicología.

Nicolás López Granged

Columbus

Buscar este blog

Bombas, presidiarios y John Nash

Etiquetas

Entradas populares de este blog

La máquina de Skinner

El criterio de demarcación en Psicología

¿Qué es el análisis del comportamiento?