7 El Teorema de Bell | Introducción a la comunicación y la computación cuántica

7.1 Teoría de la probabilidad

Consideremos un experimento con varios posibles resultados. La teoría de la probabilidad cuantifica la frecuencia con la que se produce cada uno de estos resultados. Formalmente, consideramos un espacio muestral $\Omega$ (que representa los posibles resultados del experimento), así como una serie de eventos $\mathcal{A} \subseteq \Omega$ con una cierta probabilidad $\Pr\{\mathcal{A}\}$ asociada. Si se repite el experimento (de forma independiente) varias veces, la frecuencia con la que se obtiene un resultado en $\mathcal{A}$ tiende a esa probabilidad $\Pr\{\mathcal{A}\}$ .

Para formalizar esta premisa, sea $x_{\ell}\in\Omega$ el resultado del experimento en el intento $\ell$ . Entonces, se cumple $\begin{align*} \Pr\{\mathcal{A}\} = \lim_{n\to\infty} \frac{1}{n}\sum_{\ell=1}^n \hbox{\small1\normalsize\kern-.33em1} \bigl[x_{\ell} \in \mathcal{A}\bigr], \end{align*}$ donde $\hbox{\small1\normalsize\kern-.33em1}[\cdot]$ denota la función indicador, que es igual a $1$ si su parámetro es verdadero, y $0$ en otro caso.

Vemos que la probabilidad (un ente matemático abstracto) está relacionada con algo observable y medible (la frecuencia con la que se produce un suceso). La teoría de la probabilidad estudia este tipo de experimentos y se construye a partir de tres postulados o premisas básicas:

$\Pr\{\Omega\} = 1$ , donde $\Omega$ es el conjunto de todos los eventos posibles,
$\Pr\{\mathcal{A}\}\geq 0$ para cualquier evento $\mathcal{A}$ ,
$\Pr\{\mathcal{A} \cup \mathcal{B}\} = \Pr\{\mathcal{A}\} + \Pr\{\mathcal{B}\}$ para eventos disjuntos tales que $\mathcal{A}\cap\mathcal{B} = \emptyset$ .

Estas tres sencillas premisas son la base de una teoría que ha impulsado a múltiples ámbitos de la ciencia.

Variables aleatorias

Una variable aleatoria es una función de los eventos de un experimento aleatorio. Una variable aleatoria no tiene un valor definido, ya que modela la función correspondiente antes de realizar el experimento. Por otra parte, denominamos realización al valor que toma la variable aleatoria después de realizar el experimento. Para distinguir estos dos escenarios, nos referiremos a las variables aleatorias utilizando letras mayúsculas ( $A, B, X, Y, \ldots$ ) y a sus realizaciones con las correspondientes letras minúsculas ( $a, b, x, y, \ldots$ ).

Ejemplo 7.1 Consideramos una tirada de dos dados no trucados. Los posibles eventos del experimento son todas las posibles combinaciones de los resultados, por tanto el espacio muestral es $\begin{align*} \Omega = \bigl\{ (1,1),\, (1,2), \ldots, (6,6)\bigr\}. \end{align*}$ Al ser dados dados no trucados, cada uno de los elementos del espacio muestral tiene la misma probabilidad, $\Pr\{(x,y)\}= 1/36$ , para $x = 1,\ldots,6$ , e $y = 1,\ldots,6$ . Para este experimento podemos definir una variable aleatoria $Z$ que se corresponde a ``suma de los dos dados’’. Esta variable aleatoria tiene una probabilidad heredada del espacio muestral. En nuestro ejemplo, $\begin{align*} \Pr\{ Z = 1 \} &= \Pr\{ \emptyset \} = 0,\\ \Pr\{ Z = 2 \} &= \Pr\{ (1,1) \} = 1/36,\\ \Pr\{ Z = 3 \} &= \Pr\{ (1,2) \cup (2,1) \} = 2/36,\\ %\Pr\{ Z = 4 \} &= \Pr\{ (1,3) \cup (3,1) \cup (2,2) \} = 3/36,\\ &\ldots \end{align*}$ Una realización de este experimento ocurre al realizar una tirada de los dados y ver el valor concreto que toma la variable considerada, por ejemplo, “en una tirada de $2$ dados ha salido la suma $z=7$ ”.

Función de probabilidad

La función de probabilidad de una variable aleatoria discreta se define como $\begin{align*} P_{X}(x) &\triangleq \Pr\{ X=x \} \end{align*}$ y para dos variables aleatorias $X$ e $Y$ , se cumple que $\begin{align*} P_{XY}(x,y) &= \Pr\bigl\{ (X=x) \cap (Y=y) \bigr\} \qquad\qquad&\text{(probabilidad conjunta),}\\ P_{X}(x) &= \sum_{y\in\mathcal{Y}} P_{XY}(x,y) \qquad\qquad&\text{(probabilidad marginal).} \end{align*}$ A partir de la probabilidad conjunta y marginal, definimos la probabilidad condicional como $\begin{align*} P_{Y|X}(y|x) &= \frac{P_{XY}(x,y)}{P_{X}(x)} \qquad\qquad\qquad\qquad\quad &\text{(probabilidad condicional).} \end{align*}$ Esta probabilidad se puede interpretar intuitivamente como la frecuencia de una realización $y$ cuando se ha observado una realización $x$ , y tiene el correspondiente significado operacional.

Operador promedio

Para una variable aletatoria $X$ con función de probabilidad $P_{X}$ , definimos el operador promedio, o valor esperado, de la función $f(x)$ como $\begin{align*} \text{E}\bigl[f(X)\bigr] &= \sum_{x\in\mathcal{X}} P_{X}(x) f(x). \end{align*}$ El operador promedio también tiene una interpretación operacional intuitiva. La variable aleatoria $X$ está asociada a un experimento. Si repetimos este experimento $n$ veces (de forma independiente), obtendremos una secuencia de realizaciones $x_1,x_2,\ldots,x_{n}$ . A medida que aumenta el número de repeticiones, la media de la función de las observaciones tiende al promedio estadístico de la función considerada, es decir, $\begin{align*} \lim_{n\to\infty} \frac{1}{n}\sum_{\ell=1}^n f(x_{\ell}) = \text{E}\bigl[f(X)\bigr]. \end{align*}$

Ejercicio 7.1 Para la tirada de $2$ dados no trucados del Ejemplo 7.1, definimos la variable aleatoria $X$ igual al resultado del $1^{\text{er}}$ dado, la variable $Y$ como el resultado del $2^{\text{o}}$ dado, y $Z=X+Y$ .

Determine la probabilidad conjunta $P_{XZ}(x,z)$ para $z=1,\ldots,12$ cuando $x=1$ . Verifique que $\begin{align*} \sum\nolimits_{z} P_{XZ}(1,z) = P_{X}(1). \end{align*}$
Obtenga la probabilidad condicional $P_{Z|X}(z|x)$ para $x=3$ y $z=1,\ldots,12$ .
Obtenga los valores promedio $\text{E}[Z]$ y $\text{E}[Z^2]$ .

Limitaciones

La teoría de la probabilidad puede explicar y modelar una gran cantidad de experimentos, observaciones, y sistemas físicos que nos encontramos en nuestro día a día. Intuitivamente, podemos pensar en la teoría de la probabilidad clásica como una herramienta que nos permite caracterizar dos aspectos:

Ignorancia: Un sistema del que, aunque sea determinista, no conocemos su estado interno.
Vagancia: Un sistema, que por falta de conocimiento o recursos, no modelamos de forma completa.

Ejemplo 7.2 Un ejemplo del primer tipo podría ser un generador de números pseudo-aleatorios, que parte de un número semilla para generar una salida. El número generado pasaría a ser la semilla de la siguiente interacción. Aunque el generador pseudo-aleatorio funciona de forma determinista internamente, si desconocemos la semilla, el experimento se puede modelar como aleatorio (con su correspondiente espacio muestral y eventos con cierta probabilidad asociada).

Una de las primeras propuestas de esta herramienta fue el generador cuadrado-medio, propuesto por John von Neumann en 1946. Este generador toma el cuadrado de un número semilla $x_i$ y devuelve las cifras centrales del resultado: $\begin{align*} x_i^2 = 549\underbrace{0684654}_{x{i+1}}841 \end{align*}$

Así, si la semilla fuese conocida sería sencillo predecir la salida del generador de forma determinista. Si la semilla es desconocida, en cambio, el resultado es aparentemente aleatorio. En este caso, se puede emplear la teoría de la probabilidad para modelar la ignorancia sobre el estado interno del sistema.

Ejemplo 7.3 En la predicción meteorológica existe una combinación de vagancia e ignorancia. Por una parte, con la capacidad computacional disponible no es posible modelar el movimiento de todas las moléculas de la atmósfera, para así simular sus interacciones y comportamiento. Debido a esto, en la práctica se utilizan modelos simplificados basados en la dinámica de fluidos. Incluso así, no es posible conocer de forma precisa todas las variables y condiciones de contorno que afectan a este sistema, por lo que se utilizan estimaciones o aproximaciones, resultando en una predicción probabilística.

Ejemplo de predicción metereológica. El resultado de un modelo de predicción metereológica sólo ofrece una estimación fiable a corto plazo, debido por una parte al modelo simplificado (vagancia) y, por otra, al desconocimiento de su estado interno de forma precisa (ignorancia).

7.2 El Teorema de Bell

Aunque la teoría de la probabilidad permite caracterizar sistemas que no se comportan de forma determinista, siempre asume una realidad subyacente (asociada al espacio muestral) que toma un valor definido al realizar un experimento (evento observado). Para Albert Einstein y otros científicos, la naturaleza probabilística de la mecánica cuántica demostraba que este modelo estaba incompleto, y desembocó en la publicación del famoso artículo de 1935 escrito por Einstein, Podolsky y Rosen¹. Para ellos, la realidad física debía seguir un modelo determinista y los resultados aleatorios predichos por la mecánica cuántica no eran más que el resultado de nuestra ignorancia y vagancia a la hora de definir el modelo. Así, se panteaba que con un modelo cuántico más completo y detallado, este pasaría a ser un modelo determinista y permitiría predecir de forma precisa los resultados de los experimentos. A raíz de este artículo surgió el comentario de Einstein: “Dios no juega a los dados”.

Tras la publicación de este artículo en 1935, se generó un gran revuelo en la comunidad científica. Esta discusión se desarrolló en gran medida de forma filosófica, ya que parecía imposible de demostrar si la naturaleza aleatoria de los experimentos era debido a la ignorancia y vagancia o era algo intrínseco de la naturaleza. Este problema (salvando las distancias) sería como intentar determinar si el generador de números pseudo-aleatorios del Ejemplo . es realmente aleatorio o si existe una ecuación que gobierna su funcionamiento sólo observando sus resultados, pero para un modelo físico muchísimo más complejo.

No sería hasta décadas más tarde cuando el físico John Stewart Bell propuso una comprobación experimental² que pretendía zanjar este debate. Para demostrar que existen procesos descritos por la mecánica cuántica que realmente no están definidos por naturaleza, J. S. Bell propuso en 1964 una comprobación experimental con una serie de variables aleatorias que debían cumplir dos premisas:

Realidad: En un instante dado estas variables presentan un estado definido, aunque es posible que no lo conozcamos porque no sea observable (ignorancia) o porque nuestro modelo sea incompleto (vagancia).
Localidad: La realidad es “local” y para dos procesos físicamente separados, uno de ellos no puede modificar las probabilidades de observación del otro.

A partir de estas premisas, Bell propuso una desigualdad sencilla que se podía comprobar experimentalmente. Entonces, si el resultado de un experimento no cumplía esta desigualdad, se podía concluir que una de las premisas (o ambas) no era correcta. Así, se concluiría que:

El nombre variables locales ocultas hace referencia a una de las propiedades fundamentales del modelo cuántico presentado en las secciones anteriores: no es posible observar o medir el estado interno de un sistema cuántico sin destruirlo (de ahí el nombre de variables ocultas). Entonces, ¿cómo comprobar experimentalmente esta afirmación sin poder determinar el valor oculto de estas variables?

Bell propuso un experimento que, con una serie de medidas realizadas sobre pares de partículas entrelazadas, permitiría estimar su estado interno. A través de una desigualdad matemática sencilla se podría entonces determinar la validez del teorema, lo que permitiría su comprobación experimental.

7.3 Desigualdad CHSH

Existen varias versiones de la desigualdad de Bell. La que vamos a utilizar durante el curso fue propuesta por los físicos experimentalistas Clauser, Horne, Shimony y Holt³, que simplificaba la comprobación experimental. Nos referiremos a este resultado como desigualdad CHSH por las iniciales de sus autores originales. Tal y como se indicado anteriormente, la desigualdad CHSH se basa en las premisas de realidad y de localidad.

Teorema 7.1 (Desigualdad CHSH) Consideramos cuatro variables aleatorias binarias $A,B,X,Y$ , que pueden tomar valores en $\{-1,+1\}$ , y que presentan una distribución conjunta arbitraria. Definimos la variable aleatoria $\begin{align*} Z &\triangleq A B + X B + X Y - A Y \end{align*}$ Entonces, si las variables $A,B,X,Y$ son locales (no interaccionan entre ellas) y reales (toman un valor determinista durante el experimento), se debe cumplir que $\begin{align*} -2 \,\leq\, E[Z] \,\leq\, 2. \end{align*}$

Demostración. En primer lugar, agrupamos términos para ver que $\begin{align*} Z &= A B + X B + X Y - A Y\\ &= (A+X) B - (A-X) Y \end{align*}$ Por el principio de realidad, durante el experimento las variables toman un valor definido $A=a$ , $B=b$ , $X=x$ , $Y=y$ , donde $a,b,x,y \in \{-1,+1\}$ . Así, independientemente de la distribución de probabilidad de estas variables, se tiene que:

Si $a$ y $x$ presentan diferente signo $\; \Rightarrow\ a + x = 0$ , y $a - x = \pm 2$ .
Si $a$ y $x$ presentan el mismo signo $\; \Rightarrow\ a + x = \pm 2$ , y $a - x = 0$ .

Por tanto, dado que $b,y\in \{-1,+1\}$ , para cualquier combinación de valores de $a$ , $b$ , $x$ e $y$ , obtenemos $\begin{align*} z \,=\, (a+x)b - (a-x)y \,=\, \pm 2, \end{align*}$ Es decir, una realización de la variable aleatoria $Z$ solo puede tomar los valores $2$ y $-2$ . Por tanto, $\begin{align*} \text{E}[Z] &= \text{E}\bigl[ A B + X B + X Y - A Y \bigr]\\ &= \sum_{a,b,x,y} P_{A,B,X,Y}(a,b,x,y) (ab+xb+xy-ay)\\ &\leq 2 \sum_{a,b,x,y} P_{A,B,X,Y}(a,b,x,y)\\ &= 2 \end{align*}$ donde en el tercer paso hemos utilizado que $z = ab+xb+xy-ay \leq 2$ , y en el último, hemos utilizado que, para cualquier distribución de probabilidad conjunta $P_{A,B,X,Y}$ , se tiene que $\sum_{a,b,x,y} P_{A,B,X,Y}(a,b,x,y)=1$ .

Por tanto, tenemos que $\text{E}[Z] \leq 2$ . De forma análoga, utilizando que $z = ab+xb+xy-ay \geq -2$ , podemos demostrar que $\text{E}[Z]$ está acotado inferiormente por $-2$ . Así, el teorema queda demostrado.

Ejercicio 7.2 Considere un experimento con variables aleatorias clásicas $A$ , $B$ , $X$ , $Y$ , tales que: $\begin{align*} A &= B = \begin{cases} +1 & \text{ con probabilidad $1/2$,}\\ -1 & \text{ con probabilidad $1/2$,} \end{cases}\\ X &= Y = \begin{cases} +1 & \text{ con probabilidad $1/4$,}\\ -1 & \text{ con probabilidad $3/4$,} \end{cases} \end{align*}$ donde $A$ y $B$ son independientes de $X$ e $Y$ .

Determine la distribución conjunta $P_{A,B,X,Y}$
Para $Z = A B + X B + X Y - A Y$ obtenga $\text{E}[Z]$ . ¿Cumple la desigualdad CHSH?

El ejemplo anterior muestra como, si consideramos una serie de variables aleatorias clásicas, la métrica $\text{E}[Z]$ debe cumplir la desigualdad CHSH. Sin embargo, en la Práctica 2 del curso veremos que en ciertos sistemas de naturaleza cuántica se pueden asignar las variables aleatorias $A,B,X,Y$ a observaciones. Una estimación de $\text{E}[Z]$ a partir de estas observaciones nos va a permitir concluir que, en ciertos casos, no se cumple la desigualdad CHSH.

Así, la física que gobierna nuestro mundo debe violar alguna de las dos premisas del teorema de Bell: bien la realidad o bien la localidad. Para evitar entrar en conflicto con la teoría de la relatividad, se suele asumir que las variables aleatorias no interactuan entre ellas (es decir, sí se cumpliría la premisa de localidad). Si este fuese el caso, este experimento implicaría que la premisa erronea sería la de la existencia de una realidad definida subyacente. Es decir, el mundo cuántico (nuestro mundo) no estaría en un estado definido y la naturaleza “sí jugaría a los dados”.

7.4 Verificación experimental

La verificación experimental de la violación de esta desigualdad se realizó por primera vez en 1972 por Freedman and Clauser, y desde entonces se ha repetido en múltiples laboratorios de todo el mundo eliminando posibles lagunas experimentales.