Tal para cual

Tit for Tat es una frase en inglés que se registró por primera vez en el siglo XVI en forma de "tip for tap". Ambas palabras deben entenderse en el sentido de golpear, empujar. El modismo puede traducirse aproximadamente como "Como tú yo, así yo tú" o ojo por ojo .

En teoría de juegos , "Tit for Tat" describe una estrategia para los dilemas repetidos del prisionero basada en el principio de reciprocidad . Un jugador que usa la estrategia de ojo por ojo comienza la interacción con un juego cooperativo ("amistoso"). Luego, un jugador de ojo por ojo imita el último movimiento del otro jugador. Esta estrategia fue desarrollada formalmente por Anatol Rapoport en la década de 1960 . Conocido como "Tit for Tat", se dio a conocer al público en general a través del libro La evolución de la cooperación de Robert Axelrod , en el que describe un gran éxito de esta estrategia en una competición de dos personas en un torneo informático .

Definición de términos y propiedades

En teoría de juegos, ojo por ojo describe la estrategia de un jugador que coopera en un juego continuo en el primer movimiento (se comporta "amistoso") y luego actúa de la misma manera que el oponente en la ronda de juego anterior. Si el oponente ha cooperado previamente, el jugador de ojo por ojo también coopera . Si, por el contrario, el oponente tiene un defecto en la ronda preliminar (un desertor reacciona "antipático"), el jugador de ojo por ojo (en represalia ) también responde con un defecto.

El ojo por ojo estrategia formulada por Anatol Rapoport no sólo incluye el principio de reciprocidad o el talión " Un ojo por ojo, diente por diente: hacer que otros, ya que le han hecho"), sino también la limitada de un Represalias para mantener las penalizaciones bajas y las recompensas altas, independientemente de cómo se comporte la otra parte. La estrategia también tiene la regla de actuar siempre de manera cooperativa al comienzo de una interacción . Tit for Tat es, por tanto, una estrategia amistosa . Cuando dos jugadores de ojo por ojo se encuentran, siempre cooperan.

El potencial de la estrategia de ojo por ojo quedó claro en un experimento informático de Robert Axelrod, ampliamente aclamado . Axelrod pidió a científicos de diversas disciplinas que le informaran de estrategias que, en forma de reglas de comportamiento , deberían determinar las decisiones dentro del dilema de un prisionero repetido . Usando estas estrategias, Axelrod simuló un torneo en el que cada jugador compitió repetidamente entre sí. Bajo diversas condiciones de prueba, Tit for Tat prevaleció repetidamente como una de las estrategias más exitosas.

En el dilema de un prisionero repetido durante varias rondas, un jugador que usa la estrategia de ojo por ojo nunca puede hacerlo mejor que el oponente respectivo, ya que sus movimientos siempre se copian. El déficit máximo del oponente es relativamente pequeño. Si el otro jugador también juega ojo por ojo (u otra estrategia que siempre reacciona de manera amistosa a la amabilidad), no hay acumulación, ya que ambos jugadores obtienen los mismos beneficios de cooperación. En un juego con varios jugadores, por otro lado, a menudo lo haces mejor que los jugadores con otras estrategias, porque la cooperación vale la pena allí, pero la estrategia de ojo por ojo no se puede "explotar" al mismo tiempo. La estrategia "siempre cooperar", por otro lado, es significativamente peor con oponentes hostiles o en grupos de interacción mixta, ya que puede ser explotada.

Según Axelrod, Tit for Tat cumple cuatro propiedades que toda estrategia en el dilema del prisionero repetido debe tener para ser efectiva:

  • claridad
  • Indulgencia
  • Amabilidad
  • Provocabilidad

Tit for Tat es claro y simple, ya que consta de dos reglas muy simples. La estrategia es "agradable" en el sentido de que cada interacción comienza de manera amistosa. Puede ser provocado, es decir, no permite que el comportamiento hostil de un oponente quede impune. Y es indulgente porque no reacciona con resentimiento y está dispuesta a reanudar la cooperación.

La estrategia de ojo por ojo es muy susceptible a la más mínima perturbación en el dilema del prisionero repetido , ya que un solo malentendido puede repercutir indefinidamente. Las estrategias más desarrolladas intentan superar esta debilidad.

Máximas comparables

"Tit for Tat" se remonta a Anatol Rapoport como una estrategia de teoría de juegos. En términos de historia cultural, se pueden encontrar máximas comparables . En el islandés Hávamál , parte de la Edda , se puede encontrar esta regla:

“El amigo debe otorgar amistad al amigo
y el regalo cuenta con el regalo.
El héroe debe responder al desprecio con desprecio,
y la desidia con mentiras ".

- Edda mayor: Hávámal

El Talion histórico busca el equilibrio entre el daño sufrido por la víctima de un hecho y el daño con el que se castiga al perpetrador. La regla quid-pro-quo requiere un equilibrio entre desempeño y consideración .

Tit por Tat en el dilema del prisionero repetido

Tit for Tat se hizo conocido como una estrategia exitosa en el dilema del prisionero repetido . Dos acusados ​​se enfrentan a una decisión difícil, porque el veredicto sobre su culpabilidad o inocencia se toma de acuerdo con reglas estrictas. Si solo uno de los dos traiciona al otro, el traicionado irá tras las rejas durante cinco años. El traidor, sin embargo, es absuelto y recibe una recompensa adicional. Si ambos se traicionan, ambos tienen que ir a la cárcel por tres años. Y si ninguno traiciona al otro, ambos serán absueltos. Sin embargo, ninguno de ellos recibirá una recompensa.

Si uno mirara solo una de estas decisiones, el asunto sería simple: cada acusado asumiría que el otro elegiría la mayor ganancia posible: libertad y dinero. El resultado sería claro: ambos se traicionarían e irían a la cárcel.

Si los dos prisioneros se enfrentan repetidamente a esta decisión y si ambos conocen la decisión anterior del otro, existen diferentes estrategias para completar con éxito el juego. Tit for Tat es uno de los más exitosos.

En este ejemplo, esto significa que uno de los prisioneros generalmente entra en el juego de manera cooperativa y ayuda al otro participante permaneciendo en silencio. Si el otro prisionero no permanece en silencio, el jugador de ojo por ojo se venga en la siguiente ronda al no guardar silencio tampoco. Sin embargo, está listo para olvidar inmediatamente cuando el compañero de equipo mejora y vuelve a jugar cooperativamente. En la siguiente ronda volverá a jugar cooperativamente.

Discusión de aplicaciones prácticas

¿Prohibición de comunicación?

El dilema del prisionero repetido, en el que Tit for Tat hace bien en promedio, establece reglas extremas del juego en una situación extrema. Sin embargo, no siempre está claro si una situación de acción real puede interpretarse con suficiente precisión como un dilema repetido del prisionero. Entonces, la única " comunicación " entre los dos jugadores es que conocen la decisión previa del otro. La posibilidad a menudo obvia de comunicarse explícitamente con el otro sobre el comportamiento cooperativo es, por definición, imposible.

Malentendidos entre grandes potencias

Dos problemas potenciales con Tit for Tat son la capacidad de ser provocado rápidamente y la represalia automática de la estrategia. Por lo tanto, la regla es peligrosa de usar en situaciones en las que la reacción del interlocutor no se puede reconocer o interpretar correctamente. Por ejemplo, si una acción se reconoce erróneamente como un defecto, se ha producido un malentendido . Pero incluso una acción reconocida erróneamente como hostil desencadena una reacción hostil propia en un jugador de ojo por ojo . Si el otro jugador también juega ojo por ojo , este malentendido puede llevar a una ruptura total de la cooperación.

Por ejemplo, en 1987 agentes soviéticos pincharon y espiaron la embajada estadounidense en Moscú . El de EE.UU. después se redujo el número de diplomáticos soviéticos admitidos a Washington . Los soviéticos, a su vez, retiraron a los auxiliares locales de la embajada de Estados Unidos en Moscú y exigieron que se redujera el tamaño de la delegación estadounidense. Como resultado, se hizo más difícil para ambas partes continuar con sus actividades diplomáticas.

De acuerdo con esta descripción de los hechos, los rusos no "jugaron" ojo por ojo ya que comenzaron con un "movimiento" hostil. Los estadounidenses interpretaron el "molestar" de su mensaje como un acto hostil, al que siguieron con represalias en el sentido de ojo por ojo . Quizás, sin embargo, hubo un malentendido: los rusos interpretaron la demanda unilateral de Estados Unidos de reducir el número de diplomáticos rusos como una (primera) deserción y castigaron este comportamiento de Estados Unidos. Si existen tales malentendidos, puede resultar una reacción en cadena de comportamiento defectuoso, como en el caso descrito. Sociológicamente, esta forma de malentendido también se describe como un círculo vicioso .

En situaciones en las que pueden surgir tales malentendidos, la estrategia de ganar-quedarse, perder-turno es superior a la estrategia de "ojo por ojo", ya que los jugadores pueden regresar de un bucle de no cooperación y volver a la cooperación.

Estrategias derivadas

En caso de un defecto, Tit for Tat también castiga a los compañeros de interacción que se hayan comportado previamente de manera cooperativa durante un largo período de tiempo. Por ejemplo, dada la posibilidad de malentendidos, es concebible una estrategia que tenga en cuenta este entorno amistoso. La estrategia podría ser indulgente cuando el defecto parece ser una excepción y tomar represalias cuando parece ser la regla. Tit for Tat se puede usar como castigo cuando parece que la otra parte está tratando de aprovecharse de ti.

Deben observarse las siguientes pautas:

  1. Comience con la cooperación.
  2. Lleve un registro de la frecuencia con la que la otra parte actúa de manera poco amable mientras coopera.
  3. Cuando la proporción de comportamiento desagradable sea demasiado alta, vuelva al ojo por ojo .

Para determinar la proporción irrazonable del comportamiento hostil, se requiere información a corto, mediano y largo plazo sobre la historia del comportamiento de la otra parte. Esto significa que debe saber con qué frecuencia el interlocutor ha cooperado "recientemente". Una visión a largo plazo por sí sola no es suficiente. Si alguien ha cooperado durante mucho tiempo, eso no significa que no se aproveche de usted ahora. Un ejemplo de una estrategia de este tipo: comience a cooperar hasta que una de las siguientes pruebas sea negativa:

  • Primera impresión: Comportamiento hostil desde el primer movimiento. - ¡ Vuelve al ojo por ojo !
  • Corto plazo: Comportamiento hostil en dos de cada tres rondas. - ¡ Vuelve al ojo por ojo !
  • Medio plazo: Comportamiento hostil en tres de las últimas 20 rondas. - ¡ Vuelve al ojo por ojo !
  • A largo plazo: Comportamiento hostil en cinco de las últimas 100 vueltas. - ¡ Vuelve al ojo por ojo !

El castigo de ojo por ojo no tiene por qué durar para siempre. Si es la primera lesión de una de estas cuatro pruebas, y luego regresa a la cooperación después de 20 períodos de tit-por- tat de eco con la alternancia de comportamiento hostil. Sin embargo, el otro lado debe estar en libertad condicional . Esto significa que deben reducirse los umbrales de mala conducta permitida en la prueba a medio y largo plazo. Si la otra parte ha estado suspendida por 50 períodos, vuelva a los estándares originales. Si no es así, regrese al ojo por ojo para siempre .

El principio más importante es no castigar todos los comportamientos hostiles de la misma manera. Se deben hacer suposiciones sobre si hay un malentendido, ya sea del lado del oponente o del suyo. La indulgencia adicional permite a los oponentes un comportamiento poco amistoso, pero tiene la consecuencia de que la confianza que se ha depositado en este oponente se reduce. La hostilidad del oponente continúa perjudicándolo.

Esta estrategia tiene una desventaja: si te enfrentas a un traidor constante solo, él prevalecerá. Entonces, en realidad, es extremadamente difícil, por ejemplo, fuera de un estado de guerra, lograr el cese de una acción punitiva contraria mediante un armisticio unilateral. La estrategia “indulgente” propuesta solo puede triunfar si también se pueden encontrar otros socios amigos que, mediante un comportamiento cooperativo, garanticen que la desventaja (única) de la traición del traidor consecuente sea compensada después de dos asociaciones exitosas a más tardar.

Otra desventaja es la implementación relativamente compleja de la estrategia en comparación con la versión original "simple y clara" de Tit for Tat . Una estrategia más simple, más "indulgente" es la de dos : sólo después de la deserción dos veces se reacciona de forma hostil, lo que evita los castigos mutuos en la interacción con otras estrategias menos indulgentes. Esta estrategia habría ganado contra Tit for Tat en la primera ronda del torneo informático de la RAND Corporation , pero hubo estrategias más agresivas en torneos posteriores que podrían explotar la buena naturaleza de Tit para dos Tats . La ventaja de la estrategia Tit for Two Tats sobre Tit for Tat es su menor susceptibilidad a los errores de comunicación.

literatura

  • Anatol Rapoport, Albert M. Chammah: El dilema del prisionero: un estudio sobre el conflicto y la cooperación . 2ª Edición. Prensa de la Universidad de Michigan, Ann Arbor 1970.
  • Avinash K. Dixit, Barry J. Nalebuff: Teoría de juegos para principiantes - Conocimientos estratégicos para ganadores . Schäffer-Poeschel-Verlag, Stuttgart 1997, ISBN 3-7910-1239-8 .
  • Avinash K. Dixit, Susan Skeath: Juegos de estrategia . 2ª Edición. WW Norton & Company, Nueva York 2004, ISBN 0-393-92499-8 .
  • Harald Wiese: Decisión y teoría de juegos . Springer-Verlag, Berlín / Heidelberg 2002, ISBN 3-540-42747-3 .
  • Robert Axelrod : La evolución de la cooperación (= Scientia nova ). 6a edición, Oldenbourg, Munich 2005, ISBN 3-486-53995-7 .
  • Thomas Riechmann: Teoría de juegos . 2da edición, Verlag Franz Vahlen, Munich 2008, ISBN 978-3-8006-3505-4 .

Evidencia individual

  1. Gernot Sieg: Teoría de juegos. 2a edición revisada, Oldenbourg, Munich / Viena 2005, ISBN 3-486-27526-7 , p. 45.
  2. ^ Anatol Rapoport (PDF; 80 kB) Instituto de estudios avanzados.
  3. Ernst Fehr: Comportamiento humano: no pierda su reputación . En: Naturaleza . No. 432 , 25 de noviembre de 2004, pág. 449-450 , doi : 10.1038 / 432449a . leer en línea , (PDF 345 kB, consultado el 15 de septiembre de 2015)
  4. Sinónimos y orígenes
    • Sinónimos del verbo defecto en inglés (extracto), Oxford Dictionaries 2015. Consultado el 19 de junio de 2015.
      • desertar, pasar al enemigo, cambiar de bando / lealtades / lealtades, volverse traidor, rebelarse, renegar, fugarse, irse sin permiso, renunciar, escapar;
        (Alemán: desertar, desertar al enemigo, cambiar de bando / lealtad / juramento de lealtad, convertirse en traidores, rebelarse, romper promesas, retirarse de las tropas sin excusa, disolverse, huir );
      • cambiar terreno, romper la fe, ser apóstata, apostatar;
        (dtsch: cambiar el punto de vista de uno o negarse a obedecer, romper la confianza, apóstata, apóstata )
      • abandonar, renunciar, repudiar, separarse de, rebelarse contra (extracto)
        (engl: dejar algo renunciar a algo o renunciar, rechazar algo o no reconocer separarse o separarse, levantarse contra algo de algo )
    • Origen del defecto . Oxford Dictionaries 2015. Consultado el 19 de septiembre de 2015.
      Cita: “Late Middle English (como sustantivo, influenciado por el defecto francés antiguo 'deficiencia'): del latín defectus, participio pasado de deficere 'desert or fail', de des (expresando reversión) + facere 'do'. "
      (Inglés medio tardío alemán (como nombre de sustancia , influenciado por el defecto francés antiguo 'deficiencia'): del latín defectus , participio pasado de deficere 'desertieren o fail', de de - ( como una expresión de inversión) + facere 'hacer / hacer'.)
    Nota: En el mundo de habla alemana, el término inglés desertor se traduce principalmente o se usa como desertor. Un desertor, cuando se repite un Dilema del Prisionero, "corresponde a los jugadores de contraataque " (ver FIG. Adversario ).
  5. a b Estrategia de "ojo por ojo" . Universidad de Munster.
  6. a b c d e f Avinash K. Dixit , Barry J. Nalebuff: Teoría de juegos para principiantes: conocimientos estratégicos para ganadores . Schäffer / Poeschel, Stuttgart 1997, ISBN 3-7910-1239-8 , págs. 105-108.
    Inglés original Pensamiento estratégico: la ventaja competitiva en los negocios, la política y la vida cotidiana . 1991 (Nueva edición, Norton, Nueva York 1993, ISBN 0-393-31035-3 )
  7. Per Molander: El nivel óptimo de generosidad en un entorno egoísta e incierto . En: The Journal of Conflict Resolution , Vol. 29, No. 4, diciembre de 1985, págs. 611-618. Sage Publications, JSTOR 174244,
    citado de Robert Axelrod: Sobre seis avances en la teoría de la cooperación. Escuela de Políticas Públicas, Universidad de Michigan, Ann Arbor (EE. UU.), Enero de 2000, pág. 27; umich.edu (PDF)
    (Cita) Es bien sabido que la estrategia Tit for Tat sufre incluso pequeñas cantidades de ruido porque una sola defección errónea puede hacer eco indefinidamente.
    Traducción sugerida: Es bien sabido que la estrategia Tit for Tat sufre incluso con bajos niveles de ruido, ya que un solo defecto mal entendido puede reverberar indefinidamente.
  8. Edda mayor: Hávámal ( Wikisource )
  9. Martin A. Nowak, Roger Highfield: Supercooperadores: altruismo, evolución y por qué nos necesitamos mutuamente para tener éxito . Free Press, Nueva York 2011
  10. ^ A b Avinash K. Dixit, Barry J. Nalebuff: Teoría de juegos para principiantes - Conocimientos estratégicos para ganadores. Stuttgart 1997, pág.112 y sigs.
  11. ^ A b Robert M. Axelrod: La evolución de la cooperación. Munich 2005, pág.107.
  12. ^ Rudolf Kruse et al.: Inteligencia computacional . Vieweg + Teubner, Wiesbaden 2011, ISBN 3-8348-1275-7 , pág.240 .