7 Teorema de Bell

En el modelo matemático que hemos introducido en las secciones anteriores, a pesar de que un sistema se encuentre en un estado definido, su medida es en general aleatoria y sólo podemos calcular las probabilidades de cada uno de los posibles resultados. Para Albert Einstein y otros científicos, la naturaleza probabilística de la mecánica cuántica mostraba que este modelo estaba incompleto, y desembocó en la publicación de un famoso artículo de 1935 escrito por Einstein, Podolsky y Rosen (Einstein, Podolsky, and Rosen 1935). Para ellos, la realidad física debía seguir un modelo determinista y los resultados aleatorios predichos por la mecánica cuántica sólo era debido a qué faltaba algo en el modelo considerado. Recordemos:

Dios no juega a los dados.

Aunque en las decadas siguiente hubo un gran debate filosófico sobre este tema, nadie consideraba que se pudiera resolver de una forma científicamente rigurosa. Y es que la pregunta subyacente era muy sutil. Utilizando la analogía del estado cuántico con una caja cerrada, la cuestión sería la siguiente: ¿su estado interno no está definido hasta el momento de abrir la caja? ¿o la caja sí tiene un estado definido pero no sabemos cuál antes de abrirla?

Es fácil ver que a efectos de un observador que abre la caja no existe ninguna diferencia entre las dos situaciones: en ambos casos no puede ver el interior de la caja antes de abrirla, y cuando la abre observa un estado definido.

Para entender cómo es posible diseñar un experimento que pueda distinguir estas dos situaciones necesitamos introducir ciertos conceptos de teoría de la probabilidad, su capacidad para explicar observaciones y ofrecer predicciones estadísticas, así como sus limitaciones.

7.1 Teoría de la probabilidad

Consideremos un experimento con varios posibles resultados. La teoría de la probabilidad cuantifica la frecuencia con la que se produce cada uno de estos resultados. Formalmente, la teoría define un espacio muestral Ω\Omega (que representa los posibles resultados del experimento), así como una serie de eventos AΩ\mathcal{A} \subseteq \Omega con una cierta probabilidad Pr{A}\Pr\{\mathcal{A}\} asociada.

Esta métrica abstracta de probabilidad tiene una conexión con el mundo real: si se repite el experimento (de forma independiente) varias veces, la frecuencia con la que se obtiene un resultado en A\mathcal{A} tiende a esa probabilidad Pr{A}\Pr\{\mathcal{A}\}. Formalmente, sea xΩx_{\ell}\in\Omega el resultado del experimento en el intento \ell. Entonces, se cumple Pr{A}=limn1n=1n11[xA],\begin{align*} \Pr\{\mathcal{A}\} = \lim_{n\to\infty} \frac{1}{n}\sum_{\ell=1}^n \hbox{\small1\normalsize\kern-.33em1} \bigl[x_{\ell} \in \mathcal{A}\bigr], \end{align*} donde 11[]\hbox{\small1\normalsize\kern-.33em1}[\cdot] denota la función indicador, que es igual a 11 si su parámetro es verdadero, y 00 en otro caso.

Vemos que la probabilidad (un ente matemático abstracto) está relacionada con algo observable y medible (la frecuencia con la que se produce un suceso). La teoría de la probabilidad estudia este tipo de experimentos y se construye a partir de tres postulados o premisas básicas:

  1. Pr{Ω}=1\Pr\{\Omega\} = 1, donde Ω\Omega es el conjunto de todos los eventos posibles,
  2. Pr{A}0\Pr\{\mathcal{A}\}\geq 0 para cualquier evento A\mathcal{A},
  3. Pr{AB}=Pr{A}+Pr{B}\Pr\{\mathcal{A} \cup \mathcal{B}\} = \Pr\{\mathcal{A}\} + \Pr\{\mathcal{B}\} para eventos disjuntos tales que AB=\mathcal{A}\cap\mathcal{B} = \emptyset.

Estas tres sencillas reglas son la base de una teoría que ha impulsado múltiples ámbitos de la ciencia.

Variables aleatorias

Una variable aleatoria es una función de los eventos de un experimento aleatorio. Sin embargo, una variable aleatoria no tiene un valor definido, ya que modela la función correspondiente antes de realizar el experimento. Por otra parte, denominamos realización al valor que toma la variable aleatoria después de realizar el experimento. Para distinguir estos dos escenarios, nos referiremos a las variables aleatorias utilizando letras mayúsculas (A,B,X,Y,A, B, X, Y, \ldots) y a sus realizaciones con las correspondientes letras minúsculas (a,b,x,y,a, b, x, y, \ldots).

Ejemplo 7.1 Consideramos una tirada de dos dados no trucados. Los posibles eventos del experimento son todas las combinaciones de los resultados, por tanto el espacio muestral es Ω={(1,1),(1,2),,(6,6)}.\begin{align*} \Omega = \bigl\{ (1,1),\, (1,2), \ldots, (6,6)\bigr\}. \end{align*}

Tirada de dos dados

Al ser dados dados no trucados, cada uno de los elementos del espacio muestral tiene la misma probabilidad, Pr{(x,y)}=1/36\Pr\{(x,y)\}= 1/36, para x=1,,6x = 1,\ldots,6, e y=1,,6y = 1,\ldots,6. Para este experimento podemos definir una variable aleatoria ZZ que se corresponde a “suma de los dos dados”. Esta variable aleatoria tiene una probabilidad heredada del espacio muestral. En nuestro ejemplo, Pr{Z=1}=Pr{}=0,Pr{Z=2}=Pr{(1,1)}=1/36,Pr{Z=3}=Pr{(1,2)(2,1)}=2/36,Pr{Z=4}=Pr{(1,3)(3,1)(2,2)}=3/36,\begin{align*} \Pr\{ Z = 1 \} &= \Pr\{ \emptyset \} = 0,\\ \Pr\{ Z = 2 \} &= \Pr\{ (1,1) \} = 1/36,\\ \Pr\{ Z = 3 \} &= \Pr\{ (1,2) \cup (2,1) \} = 2/36,\\ \Pr\{ Z = 4 \} &= \Pr\{ (1,3) \cup (3,1) \cup (2,2) \} = 3/36,\\ &\ldots \end{align*} Una realización de este experimento ocurre al realizar una tirada de los dados y ver el valor concreto que toma la variable considerada, por ejemplo, “en una tirada de 22 dados ha salido la suma z=7z=7”.

Jupyter notebooks: Octave, Python

Función de probabilidad

La función de probabilidad de una variable aleatoria discreta se define como PX(x)Pr{X=x}\begin{align*} P_{X}(x) &\triangleq \Pr\{ X=x \} \end{align*} y para dos variables aleatorias XX e YY, se cumple que PXY(x,y)=Pr{(X=x)(Y=y)}(probabilidad conjunta),PX(x)=yYPXY(x,y)(probabilidad marginal).\begin{align*} P_{XY}(x,y) &= \Pr\bigl\{ (X=x) \cap (Y=y) \bigr\} \qquad\qquad&\text{(probabilidad conjunta),}\\ P_{X}(x) &= \sum_{y\in\mathcal{Y}} P_{XY}(x,y) \qquad\qquad&\text{(probabilidad marginal).} \end{align*} A partir de la probabilidad conjunta y marginal, definimos la probabilidad condicional como PYX(yx)=PXY(x,y)PX(x)(probabilidad condicional).\begin{align*} P_{Y|X}(y|x) &= \frac{P_{XY}(x,y)}{P_{X}(x)} \qquad\qquad\qquad\qquad\quad &\text{(probabilidad condicional).} \end{align*} Esta probabilidad se puede interpretar intuitivamente como la frecuencia de una realización yy cuando se ha observado una realización xx, y tiene el correspondiente significado operacional.

Operador promedio

Para una variable aletatoria XX con función de probabilidad PXP_{X}, definimos el operador promedio, o valor esperado, de la función f(x)f(x) como E[f(X)]=xXPX(x)f(x).\begin{align*} \text{E}\bigl[f(X)\bigr] &= \sum_{x\in\mathcal{X}} P_{X}(x) f(x). \end{align*} El operador promedio también tiene una interpretación operacional intuitiva. La variable aleatoria XX está asociada a un experimento. Si repetimos este experimento nn veces (de forma independiente), obtendremos una secuencia de realizaciones x1,x2,,xnx_1,x_2,\ldots,x_{n}. A medida que aumenta el número de repeticiones, la media de la función de las observaciones tiende al promedio estadístico de la función considerada, es decir, limn1n=1nf(x)=E[f(X)].\begin{align*} \lim_{n\to\infty} \frac{1}{n}\sum_{\ell=1}^n f(x_{\ell}) = \text{E}\bigl[f(X)\bigr]. \end{align*}

Ejercicio 7.1 Para la tirada de 22 dados no trucados del Ejemplo 7.1, definimos la variable aleatoria XX igual al resultado del 1er1^{\text{er}} dado, la variable YY como el resultado del 2o2^{\text{o}} dado, y Z=X+YZ=X+Y.

  1. Determine la probabilidad conjunta PXZ(x,z)P_{XZ}(x,z) para x=1x=1 y z=1,,12z=1,\ldots,12. Verifique que zPXZ(1,z)=PX(1).\begin{align*} \sum\nolimits_{z} P_{XZ}(1,z) = P_{X}(1). \end{align*}
  2. Obtenga la probabilidad condicional PZX(zx)P_{Z|X}(z|x) para x=3x=3 y z=1,,12z=1,\ldots,12.
  3. Obtenga los valores promedio E[Z]\text{E}[Z] y E[Z2]\text{E}[Z^2].

Jupyter notebooks: Octave, Python

Limitaciones

La teoría de la probabilidad puede explicar y modelar una gran cantidad de experimentos, observaciones, y sistemas físicos que nos encontramos en nuestro día a día. Intuitivamente, podemos pensar en la teoría de la probabilidad clásica como una herramienta que nos permite caracterizar dos aspectos:

  • Ignorancia: Un sistema del que, aunque sea determinista, no conocemos su estado interno.
  • Vagancia: Un sistema, que por falta de conocimiento o recursos, no modelamos de forma completa.

Aunque la teoría de la probabilidad permite caracterizar sistemas que no se comportan de forma determinista, siempre asume una realidad subyacente (asociada al espacio muestral) que toma un valor definido al realizar un experimento (evento observado). De esta forma, por si sóla sólo puede modelar la ignorancia y/o vagancia a la hora de modelar un sistema.

Ejemplo 7.2 Un generador de números pseudo-aleatorios parte de un número semilla para generar una salida. El número generado pasaría a ser la semilla de la siguiente interacción. Aunque el generador pseudo-aleatorio funciona de forma determinista internamente, si desconocemos la semilla, el experimento se puede modelar como aleatorio (con su correspondiente espacio muestral y eventos con cierta probabilidad asociada).

Una de las primeras propuestas de esta herramienta fue el generador cuadrado-medio, propuesto por John von Neumann en 1946. Este generador toma el cuadrado de un número semilla xix_i y devuelve las cifras centrales del resultado: xi2=5490684654xi+1841\begin{align*} x_i^2 = 549\underbrace{0684654}_{x{i+1}}841 \end{align*}

Así, si la semilla fuese conocida sería sencillo predecir la salida del generador de forma determinista. Si la semilla es desconocida, en cambio, el resultado es aparentemente aleatorio. En este caso, se puede emplear la teoría de la probabilidad para modelar la ignorancia sobre el estado interno del sistema.

Jupyter notebooks: Octave, Python

7.2 El Teorema de Bell

Tras la publicación de el artículo de Einstein, Podolsky y Rosen (Einstein, Podolsky, and Rosen 1935) en 1935, se generó un gran revuelo en la comunidad científica. Esta discusión se desarrolló en gran medida de manera filosófica, sin aportar evidencias de ninguna de las posturas. En ese momento, parecía imposible de demostrar si la naturaleza aleatoria de los experimentos era debido a la ignorancia y vagancia o era algo intrínseco de la propia realidad física subyacente.

El problema (salvando las distancias) sería como intentar determinar si una caja negra que genera números aletatorios (como podría ser el generador de números pseudo-aleatorios del Ejemplo 7.2) es realmente aleatoria o si existe una ecuación que gobierna su funcionamiento. En este símil, tendríamos que determinar su naturaleza sólo observando sus resultados, ya que no podemos acceder al funcionamiento interno de la caja.

No sería hasta décadas más tarde cuando en 1964 el físico John Stewart Bell propuso una posible comprobación experimental (Bell 1964) que pretendía zanjar este debate. Para demostrar que ciertos experimentos cuánticos realmente no están definidos por naturaleza, J. S. Bell propuso una comprobación experimental sobre una serie de variables que partía de dos premisas muy concretas:

  • Realidad: En un instante dado estas variables presentan un estado definido, aunque es posible que no lo conozcamos porque no sea observable (ignorancia) o porque nuestro modelo sea incompleto (vagancia).
  • Localidad: La realidad es “local” y para dos procesos físicamente separados, uno de ellos no puede modificar el estado del otro.

Con estas premisas propuso un experimento que, de cumplirse, permitiría establecer lo que se conoce como Teorema de Bell:

Teorema 7.1 (Teorema de Bell) Ninguna teoría física de variables locales ocultas puede reproducir todas las predicciones de la mecánica cuántica.

La expresión variables locales ocultas hace referencia a una de las propiedades fundamentales del modelo cuántico que estamos estudiando: no es posible observar o medir el estado interno de un sistema cuántico (de ahí el nombre de variable oculta). Entonces, ¿cómo comprobar experimentalmente esta afirmación sin poder determinar el valor oculto de estas variables, es decir, sin poder mirar lo que hay dentro de la caja antes de abrirla?

Desigualdad CHSH

Existen varias versiones de las desigualdades que Bell necesarias para probar el teorema. La que vamos a utilizar durante el curso fue desarrollada por los físicos experimentalistas Clauser, Horne, Shimony y Holt (Clauser et al. 1969), ya que simplificaba la comprobación experimental. Nos referiremos a este resultado como desigualdad CHSH por las iniciales de sus autores originales. Tal y como se indicado anteriormente, la desigualdad CHSH se basa en las premisas de realidad y de localidad.

Teorema 7.2 (Desigualdad CHSH) Consideramos cuatro variables aleatorias binarias A,B,X,YA,B,X,Y, que pueden tomar valores en {1,+1}\{-1,+1\}, y que presentan una distribución conjunta arbitraria. Definimos una nueva variable aleatoria ZAB+XB+XYAY\begin{align*} Z &\triangleq A B + X B + X Y - A Y \end{align*} Entonces, si las variables A,B,X,YA,B,X,Y son locales (no interaccionan entre ellas) y reales (toman un valor determinista durante el experimento), se debe cumplir que 2E[Z]2.\begin{align*} -2 \,\leq\, E[Z] \,\leq\, 2. \end{align*}

Demostración. En primer lugar, agrupamos términos para ver que Z=AB+XB+XYAY=(A+X)B(AX)Y\begin{align*} Z &= A B + X B + X Y - A Y\\ &= (A+X) B - (A-X) Y \end{align*} Por el principio de realidad, durante el experimento las variables toman un valor definido A=aA=a, B=bB=b, X=xX=x, Y=yY=y, donde a,b,x,y{1,+1}a,b,x,y \in \{-1,+1\}. Así, independientemente del valor concreto de estas variables, se tiene que:

  • Si aa y xx presentan diferente signo    a+x=0\; \Rightarrow\ a + x = 0, y ax=±2a - x = \pm 2.
  • Si aa y xx presentan el mismo signo    a+x=±2\; \Rightarrow\ a + x = \pm 2, y ax=0a - x = 0.

Por tanto, dado que b,y{1,+1}b,y\in \{-1,+1\}, para cualquier combinación de valores de aa, bb, xx e yy, obtenemos z=(a+x)b(ax)y=±2,\begin{align*} z \,=\, (a+x)b - (a-x)y \,=\, \pm 2, \end{align*} Es decir, una realización de la variable aleatoria ZZ solo puede tomar los valores 22 y 2-2. Por tanto, E[Z]=E[AB+XB+XYAY]=a,b,x,yPA,B,X,Y(a,b,x,y)(ab+xb+xyay)2a,b,x,yPA,B,X,Y(a,b,x,y)=2\begin{align*} \text{E}[Z] &= \text{E}\bigl[ A B + X B + X Y - A Y \bigr]\\ &= \sum_{a,b,x,y} P_{A,B,X,Y}(a,b,x,y) (ab+xb+xy-ay)\\ &\leq 2 \sum_{a,b,x,y} P_{A,B,X,Y}(a,b,x,y)\\ &= 2 \end{align*} donde en el tercer paso hemos utilizado que z=ab+xb+xyay2z = ab+xb+xy-ay \leq 2, y en el último, hemos utilizado que, para cualquier distribución de probabilidad conjunta PA,B,X,YP_{A,B,X,Y}, se tiene que a,b,x,yPA,B,X,Y(a,b,x,y)=1\sum_{a,b,x,y} P_{A,B,X,Y}(a,b,x,y)=1.

Por tanto, tenemos que E[Z]2\text{E}[Z] \leq 2. De forma análoga, utilizando que z=ab+xb+xyay2z = ab+xb+xy-ay \geq -2, podemos demostrar que E[Z]\text{E}[Z] está acotado inferiormente por 2-2. Así, el teorema queda demostrado.

Ejercicio 7.2 Considere un experimento con variables aleatorias clásicas AA, BB, XX, YY, tales que: A=B={+1 con probabilidad 1/2,1 con probabilidad 1/2,X=Y={+1 con probabilidad 1/4,1 con probabilidad 3/4,\begin{align*} A &= B = \begin{cases} +1 & \text{ con probabilidad $1/2$,}\\ -1 & \text{ con probabilidad $1/2$,} \end{cases}\\ X &= Y = \begin{cases} +1 & \text{ con probabilidad $1/4$,}\\ -1 & \text{ con probabilidad $3/4$,} \end{cases} \end{align*} donde AA y BB son independientes de XX e YY.

  1. Determine la distribución conjunta PA,B,X,YP_{A,B,X,Y}
  2. Para Z=AB+XB+XYAYZ = A B + X B + X Y - A Y obtenga E[Z]\text{E}[Z]. ¿Cumple la desigualdad CHSH?

Jupyter notebooks: Octave, Python

El ejemplo anterior muestra como, si consideramos una serie de variables aleatorias clásicas, la métrica E[Z]\text{E}[Z] debe cumplir la desigualdad CHSH. Sin embargo, veremos que en ciertos sistemas de naturaleza cuántica se pueden asignar las variables aleatorias A,B,X,YA,B,X,Y a observaciones. Una estimación de E[Z]\text{E}[Z] a partir de estas observaciones nos va a permitir concluir que, en ciertos casos, no se cumple la desigualdad CHSH.

7.3 Verificación experimental

La verificación experimental de la violación de esta desigualdad se realizó por primera vez en 1972 por Freedman and Clauser, y desde entonces se ha repetido en múltiples laboratorios de todo el mundo eliminando posibles lagunas experimentales.

Un posible esquema de este experimento aparece representado a continuación:

Montaje experimental para verificar la desigualdad CHSH

En este sistema tenemos un generador de estados entrelazados cuyas partes se distribuyen a los laboratorios de Alice y de Bob. Alice recibe el estado binario ρA\rho^A que se corresponde con una parte de un estado entrelazado δAB\delta^{AB}. Entonces, Alice procede a medir su parte del estado escogiendo al azar una base de medida POVMA={00,11},(Alice mide en la base +)POVMX={π4π4,π4π4}.(Alice mide en la base ×)\begin{align*} \text{POVM}_A &= \bigl\{ \ket{0}\bra{0},\, \ket{1}\bra{1} \bigr\}, & \text{(Alice mide en la base $+$)}\\ \text{POVM}_X &= \bigl\{ \ket{\tfrac{\pi}{4}}\bra{\tfrac{\pi}{4}},\, \ket{-\tfrac{\pi}{4}}\bra{-\tfrac{\pi}{4}} \bigr\}. & \text{(Alice mide en la base $\times$)} \end{align*} Estas medidas se corresponden con las variables aleatorias AA, y XX, respectivamente, y toman los valores {1,+1}\{-1,+1\} dependiendo del resultado observado.

De forma análoga, Bob aplica una medida en su parte σB\sigma^B con respecto a una base que escoge al azar: POVMB={00,11},(Bob mide el la base +)POVMY={π4π4,π4π4}.(Bob mide el la base ×)\begin{align*} \text{POVM}_B &= \bigl\{ \ket{0}\bra{0},\, \ket{1}\bra{1} \bigr\}, & \text{(Bob mide el la base $+$)}\\ \text{POVM}_Y &= \bigl\{ \ket{\tfrac{\pi}{4}}\bra{\tfrac{\pi}{4}},\, \ket{-\tfrac{\pi}{4}}\bra{-\tfrac{\pi}{4}} \bigr\}. & \text{(Bob mide el la base $\times$)} \end{align*} Estas medidas se corresponden con las variables aleatorias BB, e YY, respectivamente.

Para ciertos estados entrelazados δAB\delta^{AB}, se puede comprobar que E[Z]=E[AB]+E[XB]+E[XY]E[AY]2,\begin{align*} E[Z] \,=\, E[AB] + E[XB] + E[XY] -E[AY] \,\geq\, 2, \end{align*} y por tanto este experimento no cumple la desigualdad CHSH. Aunque no es posible aplicar una medida simultánea a las variables aleatorias AA y XX o a las variables BB e YY (por tratarse de medidas sobre el mismo estado cuántico binario), sí es posible hacer las medidas simultáneas sobre los pares de variables aleatorias (A,B)(A,B), (X,B)(X,B), (X,Y)(X,Y) y (A,Y)(A,Y), necesarios para estimar las esperanzas correspondientes. Así, estas esperanzas se pueden estimar con una precisión arbitraria repitiendo el experimento un número suficientemente alto de veces.

Concluimos que la física que gobierna nuestro mundo debe violar alguna de las dos premisas del teorema de Bell: bien la realidad o bien la localidad. Para evitar entrar en conflicto con la teoría de la relatividad, se suele asumir que las variables aleatorias no interactuan entre ellas (es decir, sí se cumpliría la premisa de localidad). Si este fuese el caso, este experimento implicaría que la premisa erronea sería la de la existencia de una realidad definida subyacente. Es decir, el mundo cuántico (nuestro mundo) no estaría en un estado definido y la naturaleza “sí jugaría a los dados”.

Referencias

Bell, J. S. 1964. “On the Einstein Podolsky Rosen Paradox.” Physics Physique Fizika 1 (November): 195–200. https://doi.org/10.1103/PhysicsPhysiqueFizika.1.195.
Clauser, John F., Michael A. Horne, Abner Shimony, and Richard A. Holt. 1969. “Proposed Experiment to Test Local Hidden-Variable Theories.” Phys. Rev. Lett. 23 (October): 880–84. https://doi.org/10.1103/PhysRevLett.23.880.
Einstein, A., B. Podolsky, and N. Rosen. 1935. “Can Quantum-Mechanical Description of Physical Reality Be Considered Complete?” Phys. Rev. 47 (May): 777–80. https://doi.org/10.1103/PhysRev.47.777.