martes. 21.05.2024

El cerebro fundamentalmente toma decisiones que nos ayudan a sobrevivir, a adaptarnos, a crecer, a evolucionar y a alcanzar nuestra plenitud, igual que el árbol debe tener sistemas que le ayuden a adaptarse y a crecer para ser el tipo de árbol que puede llegar a ser.

La toma de decisiones puede definirse como la selección de una alternativa dentro de un rango de opciones existentes, considerando los posibles resultados de las selecciones realizadas y sus consecuencias en el comportamiento presente y futuro. Tradicionalmente, se ha afirmado que desde el punto de vista anatómico la base neural fundamental de este proceso lo constituye la corteza prefrontal; sin embargo, nuevos estudios validan la hipótesis de la existencia una compleja red neural que incluyen estructuras tanto corticales como subcorticales.

Este complejo proceso ha sido estudiado por diversas disciplinas científicas (psicología cognitiva, economía, ciencias de la computación y neuropsicología), tomando como referente variados modelos teóricos. En este sentido, resulta de especial interés para los neurólogos y neuropsicólogos la hipótesis del marcador somático planteada por Damasio, la cual ofrece un referente teórico y metodológico al establecer las bases de la relación entre las estructuras corticales y subcorticales a la hora de decidir, así como las alteraciones relacionadas con ciertos daños cerebrales.

Desde un punto de vista anatómico, se ha considerado la corteza prefrontal (CPF) como la región cerebral de mayor importancia a la hora de delimitar las bases neurales subyacentes a este proceso. Estructuralmente, la CPF está compuesta por 3 subregiones cerebrales: la corteza orbitofrontal (COF), el córtex cingulado anterior (CCA) y la CPF dorsolateral (CPFDL), las que en estrecha relación con otras regiones, como el tálamo, la amígdala y los ganglios basales, garantizan un adecuado proceso de TD. Estas estructuras se organizan en 3 circuitos fundamentales que guardan relación con la TD: 1) la COF y las conexiones límbicas, estrechamente relacionadas con las recompensas y las decisiones de base emocional; 2) la corteza dorsolateral del córtex prefrontal (CPFDL) especializada en la integración de múltiples fuentes de información, y 3) la corteza cingulada anterior (CCA) implicada en el manejo de información conflictiva y el procesamiento del feedback asociado a las decisiones. Además, el córtex prefrontal posee conexiones con otras regiones subcorticales que guardan relación con el funcionamiento de las estructuras mencionadas anteriormente.

La neuroeconomía ha hecho un progreso notable hacia la comprensión de cómo el cerebro toma decisiones económicas

La neuroeconomía  ha hecho un progreso notable hacia la comprensión de cómo el cerebro toma decisiones económicas. Dos modelos matemáticos, la teoría prospectiva y la teoría del aprendizaje por refuerzo, se han utilizado con frecuencia para construir un marco biológicamente viable que explique la elección económica. Estos dos modelos fueron desarrollados en principio para describir el comportamiento de toma de decisiones en diferentes situaciones. La teoría prospectiva se centra en las preferencias de riesgo, mientras que la teoría del aprendizaje por refuerzo se centra en aprender de los resultados de decisiones anteriores. 

En general, la literatura existente sugiere que la ponderación de probabilidad asumida en la teoría prospectiva podría ser heterogénea entre los individuos y que la ponderación de probabilidad de un individuo podría ajustarse sobre la base de eventos probabilísticos experimentados en un entorno durante el juego.

La teoría del aprendizaje por refuerzo, por otro lado, describe cómo los tomadores de decisiones aprenden los valores de las opciones disponibles a través de la experiencia de recompensas bajo el supuesto de que aprenden los valores de todas las alternativas. Estos valores se actualizan dinámicamente calculando el error de predicción de recompensa EPR), que es la diferencia entre el valor de la recompensa obtenida y su valor previsto señalado en el cerebro. Este algoritmo matemático produce dinámicas de aprendizaje para un comportamiento de elección óptimo bajo incertidumbre y ha sido ampliamente examinado para describir el comportamiento de toma de decisiones y la actividad neuronal relacionada en humanos, monos y roedores. Sin embargo, aún no se ha explorado si el algoritmo EPR actualiza la utilidad de las recompensas o la función de ponderación de probabilidad con la que se recibe la recompensa. Es difícil dilucidar cómo estas dos influyentes teorías de decisión se combinan en un solo modelo para explicar la toma de decisiones arriesgadas.

La teoría prospectiva se centra en las preferencias de riesgo, mientras que la teoría del aprendizaje por refuerzo se centra en aprender de los resultados de decisiones anteriores

Estudios anteriores han implicado que los hallazgos de la investigación con monos amplían nuestra comprensión del comportamiento humano al permitir a los investigadores comprender las raíces evolutivas de la elección, así como realizar investigaciones que no son fácilmente factibles con participantes humanos. Por ejemplo, se ha descrito previamente las funciones de ponderación de utilidad y probabilidad en monos utilizando el mismo conjunto de datos en el presente estudio. Aprovechar el uso del mismo paradigma experimental para ambas especies nos permitió comparar el comportamiento humano y del mono a través de la lente de dos teorías principales de decisión y contribuir a la larga disputa sobre hasta qué punto los monos son un buen modelo para la toma de decisiones humanas. Hasta la fecha, tales comparaciones se han realizado principalmente entre estudios que utilizan paradigmas sustancialmente diferentes para cada especie. Una comparación justa entre monos y humanos ayuda a resolver los asuntos en debate.

Investigadores de la Universidad de Tsukuba han desarrollado y validado un modelo ("teoría de la perspectiva dinámica") que integra el modelo más popular en economía conductual para describir la toma de decisiones bajo incertidumbre: la teoría de la prospectiva y un modelo bien establecido de aprendizaje de la neurociencia: la teoría del aprendizaje por refuerzo.

Este modelo describió con mayor precisión las decisiones que las personas y los monos tomaron mientras enfrentaban riesgos que la teoría prospectiva o la teoría del aprendizaje por refuerzo solas.

Datos clave:

1. El modelo de "teoría de la prospectiva dinámica", que integra la teoría de la prospectiva y la teoría del aprendizaje por refuerzo, describió con mayor precisión la toma de decisiones humanas y monos bajo riesgo.

2. Después de experimentar un resultado mayor de lo esperado, los participantes y los monos se comportaron como si la probabilidad de ganar aumentara en la próxima lotería.

3. Este cambio en el comportamiento parece estar impulsado por un cambio en la percepción de las probabilidades, no por un cambio en la valoración de las recompensas.

Específicamente, los investigadores pidieron a 70 personas que eligieran repetidamente entre dos loterías en las que pudieran obtener alguna recompensa con cierta probabilidad. Las loterías variaban en el tamaño de la recompensa, la probabilidad de recibirla y la cantidad de riesgo involucrado.

Los resultados mostraron que inmediatamente después de experimentar un resultado que era mayor que el valor esperado de la opción seleccionada, los participantes se comportaron como si la probabilidad de ganar en la próxima lotería aumentara.

Los investigadores comentaron que la similitud en el comportamiento humano y de monos fue notable en este estudio

El autor principal del estudio, el profesor asistente Hiroshi Yamada, dice: "Este comportamiento es sorprendente porque las probabilidades de ganar se describieron claramente a los participantes (los participantes no tuvieron que aprenderlas de la experiencia) y estas probabilidades también fueron completamente independientes de los resultados anteriores".

Usando su modelo de teoría de prospectos dinámicos, los investigadores pudieron determinar que el cambio en el comportamiento es impulsado por un cambio en la percepción de las probabilidades en lugar de por un cambio en la valoración de las recompensas.

Yamada también dice: "Tal aprendizaje de eventos inesperados subyace a la teoría del aprendizaje por refuerzo y es un algoritmo bien conocido que ocurre cuando las personas necesitan aprender las recompensas de la experiencia. Es interesante que ocurra incluso si el aprendizaje no es necesario".

En experimentos similares con monos macacos, cuyos cerebros se parecen mucho a los de los humanos, esencialmente se observaron los mismos resultados. Los investigadores comentaron que la similitud en el comportamiento humano y de monos fue notable en este estudio.

Con base en los resultados de esta investigación, se espera que la investigación del cerebro del mono conduzca a una comprensión de los mecanismos cerebrales involucrados en la percepción de las recompensas y la probabilidad que todos usamos al tomar decisiones arriesgadas, así como la alegría que sentimos cuando tenemos éxito.

Por último, compartir esta reflexión paradójica de la escritora Carmen Martín Gaite: “También las indecisiones se toman, también dejar de hacer es una forma de hacer”.

La toma de decisiones