Lección 1: PROBABILIDAD
Teoría de probabilidad básica
1600: Desarrollo de la teoría de la probabilidad.
Elementos de la teoría de probabilidad: Las variables o cantidades que pueden
cambiar de valor a través del curso de un experimento o serie de eventos. Las
variables pueden clasificarse en discretas y continuas.
Variables discretas: Tienen solamente un número limitado de valores específicos. Ejemplo: El resultado del lanzamiento de una moneda puede tomar sólo uno de dos valores: cara o cruz.
Los valores posibles que una variable puede tomar se llama espacio muestral de la variable, S. En el
ejemplo del lanzamiento de una moneda, el espacio muestral sólo está constituido por dos valores, es
decir, S = cara, cruz.
Variables continuas: Pueden tomar cualquier valor entre unos límites. Ejemplo: La temperatura es un ejemplo variable continua. La escala de temperatura absoluta se extiende
desde 0 K a infinito, con la variable temperatura capaz de tomar cualquier valor comprendido entre estos
dos límites. El espacio muestral se define, en estos casos, mediante los límites de la variable.
El tratamiento de la probabilidad difiere dependiendo de si tratamos con variables
discretas o variables continuas.
¿Cuál es la probabilidad de que la variable tome un cierto valor?
Ejemplo: Una lotería en la que las bolas numeradas de 1 a 50 se mezclan al azar en el
interior de una máquina, y se extrae una única bola. ¿Cuál es la probabilidad de que la
bola extraída tenga el valor uno (1)?
Condición: Las probabilidades de seleccionar cualquier bola son idénticas. ⇒ Resultado: La probabilidad
de extraer (1) es 1/50.
¿Esto significa que obtenemos (1) sólo una vez cada 50 selecciones?
Condición: Cada extracción de bola es un experimento individual. ⇒ Resultado: La probabilidad de extraer
(1) en cualquier experimento es 1/50.
Condición: El resultado de cada experimento es independiente de los otros resultados. ⇒ Resultado: Es
posible que (1) no se seleccione tras 50 ensayos o que (1) se obtenga más de una vez.
Condición: El experimento se lleva a cabo muchas veces. ⇒ Resultado: El resultado final será que el número
de (1) es 1/50-avo del número total de ensayos.
Conclusión: La probabilidad de que la variable tome un valor dado se determina a
partir de un número infinito de experimentos. En la práctica, se hace una
extrapolación de las probabilidades a situaciones que implican un número limitado
de experimentos entendiendo que las probabilidades proporcionan una esperanza
aproximada de un resultado experimental.
Consideremos una variable, X, para la que el espacio muestral consiste en M valores
denotados como x1, x2, … , xM. La probabilidad de que la variable X tome uno de
estos valores (pi) es:
0 ≤ ≤ 1 (1.1)
Como X debe tomar algún valor de la muestra en un experimento dado, entonces:
+ +⋯+ = ∑ = 1 (1.2)
La combinación del espacio muestral, S = x1, x2, … , xM y las correspondientes
probabilidades, P = p1, p2, … , pM, se conoce como modelo de probabilidad del
experimento.
Ejemplo práctico 1.1.
¿Cuál es el modelo de probabilidad para el experimento de la lotería en el que se tienen 50
bolas numeradas desde 1 hasta 50 y se considera la extracción de una bola?
Solución
El valor de la bola que se saca en cada experimento individual es la variable de interés y puede
tomar los valores enteros de 1 a 50. Por tanto, el espacio muestral es
= 1, 2, 3, … , 50.
Si la probabilidad de sacar cualquier bola individual es idéntica, y hay 50 bolas en total,
entonces las probabilidades están dadas por
= , , … , con todos los pi = 1/50
Obsérvese que la suma de todas las probabilidades es igual a 1:
= ∑ = + +…+ =1
¿Cuál es probabilidad asociada a un resultado dado en una serie de experimentos?
Ejemplo: Lanzamiento de una moneda cuatro veces. ¿Cuál es la probabilidad de que se observen al menos
dos caras?
Figura 1.1. Resultados posibles tras lanzar una moneda cuatro veces. El rojo significa cara y el
azul significa cruz.
La probabilidad de obtener al menos dos caras después de lanzar una moneda cuatro veces es 11/16, esto
es, el número de resultados de interés dividido por el número total de resultados.
Sea S = s1, s2, … , sN el espacio muestral asociado a una variable particular, j el número de valores en S
correspondientes al resultado de interés y PE la probabilidad de que el resultado de un evento de interés
sea E. Si las probabilidades de observar cualquier valor individual son idénticas, entonces
= ! + ! +…+ ! = "! (1.3)
Alternativamente, si hay N valores en el espacio muestral y E de estos valores corresponden al evento de
interés, entonces
= ! (1.4)
Ejemplo práctico 1.2.
¿Cuál es la probabilidad de seleccionar un corazón en una baraja estándar de 52 cartas?
Solución
= #$ = 1352 = 14
El principio enumerador fundamental Cuando tratamos con un número relativamente alto de experimentos, escribir todos
los posibles resultados y contarlos es un proceso largo y tedioso. Se muestra a
continuación un método más eficiente para llevar a cabo esto.
Ejemplo: Una clase consta de 30 estudiantes y el profesor necesita reunirlos en una fila.
¿Cuántas disposiciones de los estudiantes son posibles? Si las probabilidades de poner cualquier estudiante son iguales, entonces el número total de
formas de disponer a los estudiantes (W) es
W = (30)(29)(28) … (2)(1) = 30! = 2,65 · 1032
El símbolo de exclamación (!) en esta expresión se refiere como factorial, indicando con n! el
producto desde 1 a n.
El resultado anterior en su forma más general se conoce como principio
enumerador fundamental.
Para una serie de manipulaciones M1, M2 … , Mj teniendo ni formas de completar
cada manipulación n1, n2, … , nj, el principio enumerador fundamental establece que
el número total de formas de llevar a cabo la serie entera de manipulaciones (TotalM)
es el producto del número de formas de llevar a cabo cada manipulación bajo la
suposición de que las formas son independientes:
&'()* = +,-+,-….,"/ (1.5)
Ejemplo práctico 1.3.
¿Cuántas disposiciones de cinco cartas son posibles en una baraja estándar de 52 cartas?
Solución
&'()* = +,-+,-+,0-+,1-+,- = +52-+51-+50-+49-+48- = 311875200
Ejemplo práctico 1.4.
Usando el principio contador fundamental, ¿cuántos posibles estados de espín se esperan para
el primer estado excitado 1s12s1 del He?
Solución &'()* = +,-+,- = +2-+2- = 4
Permutaciones El número de formas diferentes de disponer un número de objetos teniendo en
cuenta el orden se denomina permutación. El número total de objetos que se
disponen es conocido como orden de la permutación. Por tanto, n! da cuenta del
número total de permutaciones de n objetos
¿Cuántas permutaciones son posibles si solamente se emplea una subserie de objetos
al construir la permutación?
Si P(n, j) representa el número de permutaciones posible, usando una subserie de j
objetos del grupo total de n, entonces:
+,, 5- = +,-+, − 1-+, − 2-…+, − 5 + 1- (1.6)
es decir,
+,-+, − 1-…+, − 5 + 1- = +7-+78-…+-+78"-+78"8-…+- = 7!+78"-! (1.7)
Por tanto, P(n, j) viene dado por:
+,, 5- = 7!+78"-! (1.8)
Ejemplo práctico 1.5.
El entrenador del equipo de baloncesto tiene 12 jugadores en la lista, pero sólo pueden jugar 5
jugadores simultáneamente. ¿Cuántos conjuntos ordenados de 5 jugadores son posibles
usando la lista de 12 jugadores?
Solución
+12,5- = 12!+12 − 5-! = 95040
Combinaciones Una combinación o configuración es una disposición desordenada de objetos.
De modo similar a las permutaciones, las combinaciones también se pueden construir usando
todos los objetos del conjunto que se manipulan (n), o solamente un subconjunto de objetos de
tamaño j. Nos referiremos a las configuraciones usando la nomenclatura C(n, j).
Ejemplo: Consideremos las cuatro bolas de colores mostradas en la Figura 1.2. ¿Cuántas
combinaciones de tres pelotas y permutaciones asociadas se pueden hacer utilizando estas
bolas?
Figura 1.2. Ilustración de las configuraciones y permutaciones usando cuatro bolas coloreadas.
Una combinación es una colección de bolas de tres colores y una permutación corresponde a
una disposición ordenada de esas mismas bolas, tales que cada configuración tiene seis
permutaciones asociadas. Por tanto,
:+,, 5- = ;+7,"-"! (1.9)
es decir,
:+,, 5- = ;+7,"-"! = 7!"!+78"-! (1.10)
Ejemplo práctico 1.6. Jugando a las cartas con una baraja estándar de 52 cartas, ¿cuántas posibles combinaciones de
5 cartas o “manos” hay?
Solución
:+,, 5- = :+52,5- = 52!5! +52 − 5-! = 2598960
Probabilidades binomiales Sea PE la probabilidad de que ocurra un evento, E, de entre un número total de
posibles resultados, N, y PEC, complemento de PE, la probabilidad de los resultados
distintos del asociado al evento de interés. Por tanto:
+ = = 1 (1.11)
Este resultado proporciona una definición para experimentos conocidos como
ensayos de Bernoulli. Una colección de ensayos de Bernoulli se conoce como experimento binomial y estos simples experimentos proporcionan un marco adecuado en el que explorar las distribuciones de probabilidad. En estos casos,
el resultado de cada ensayo es independiente del resultado de cualquier otro ensayo.
Ejemplo: Consideremos un experimento binomial en el que una moneda se lanza cuatro veces
y se formula esta pregunta: ¿Cuál es la probabilidad de obtener siempre caras?
La probabilidad de éxito para cada ensayo es ½. Por tanto, la probabilidad total:
= = > (1.12)
En una serie de ensayos de Bernoulli en los que la probabilidad de éxito para un
único ensayo es PE, la probabilidad de obtener j éxitos en una prueba que consta de n
ensayos está dada por
+5- = :+,, 5-+ -"+1 − -78" (1.13)
¿Por qué el número total de configuraciones es el que aparece en la ecuación (1.13)? La respuesta a esta cuestión está ligada a la diferencia entre permutaciones y configuraciones.
De nuevo, consideremos una serie de cuatro lanzamientos de monedas, donde el resultado de
interés es la permutación exacta cara, cruz, cruz, cara. Si cara es un ensayo con éxito que
ocurre con probabilidad PE, entonces la probabilidad de observar esta permutación es
= + -+1 − -+1 − -+ - = + -+1 − - = = > (1.14)
pero ésta es también la probabilidad de observar cara, cara, cara, cara. Es decir, es
equivalente la probabilidad de observar un orden específico de resultados del ensayo, o una
simple permutación. Si el resultado de interés es dos ensayos con éxito, que pueden ocurrir en
cualquier orden, entonces deben sumarse las probabilidades de todas las posibles
permutaciones correspondientes a dos ensayos con éxito, y esto se lleva a cabo con la inclusión
de C(n , j) en la ecuación (1.13).
Ejemplo práctico 1.7.
Imaginemos el lanzamiento de una moneda 50 veces. ¿Cuáles son las probabilidades de
obtener caras 10 veces (es decir, 10 experimentos con éxito) y 25 veces?
Solución
El ensayo de interés consta de 50 experimentos separados; por tanto, n = 50. Primero
consideramos el caso de 25 experimentos con éxito, donde j = 25. La probabilidad (P25) es
= :+,, 5-+ -"+1 − -78"
= :+50,25-+ -+1 − -
= !!! = 0,11
De forma análoga para j = 10, obtenemos que
= :+,, 5-+ -"+1 − -78"
= :+50,10-+ -+1 − -1
= !!1! 1 = 9,1 × 108>
Aproximación de Stirling
En general, los cálculos de P(n , j) y C(n , j) implican evaluar cantidades factoriales
altas. Por ejemplo, 100! es igual a 9,3 × 10157, que es un número extremadamente
grande y más allá del rango de muchas calculadoras. Además, estamos interesados en
extender los conceptos de probabilidad que hemos desarrollado a los sistemas
químicos en los que n ∼ 1023!. El factorial de un número tan grande está simplemente
más allá de la capacidad computacional de la mayoría de calculadoras.
No obstante, hay métodos de aproximación que permiten calcular el factorial de
números grandes. El más famoso de estos métodos se conoce como aproximación de Stirling, que proporciona un método simple para calcular el logaritmo natural de
N!. Una versión simplificada de esta aproximación es
ln$! = $*,$ − $ (1.15)
La ecuación (1.15) se deduce como sigue:
ln $! = *,C+$-+$ − 1-+$ − 2-…+2-+1-D
= *,+$- + *,+$ − 1- + *,+$ − 2- +⋯+ *,+2- + *,+1-
= ∑ ln+,-!7 = E ln+,- F,!7
= $*,$ − $ − +1*,1 − 1- ≈ $*,$ − $ (1.16) La suposición principal inherente a esta aproximación es que N es un número grande. El
principal interés de la aproximación de Stirling es cuando N es lo suficientemente grande para
justificar su aplicación.
Ejemplo práctico 1.8.
Evalúe ln(N!) para N = 10, 50 y 100 usando una calculadora, y compare el resultado con el
obtenido usando la aproximación de Stirling.
Solución N = 10
Calculadora: N! = 3,63 × 106, ln(N!) = 15,1
Aproximación de Stirling: ln$! = $*,$ − $ = 10 ln+10- − 10 = 13,0 Error relativo: 13.9%.
N = 50 y 100:
N ln(N!) calculado ln(N!) Stirling Error (%)
50 148,5 145,6 2,0
100 363,7 360,5 0,9
Funciones de distribución de probabilidad.
Considerando de nuevo el experimento del lanzamiento de la moneda. ¿Cuál es la
probabilidad de obtener un resultado dado (es decir, número de caras) después de
lanzar una moneda 50 veces? A partir de la ecuación (1.13), se puede construir una
tabla de probabilidad en función del número de caras con n = 50 (número total de
lanzamientos) y j = número de caras (es decir, el número de lanzamientos con éxito):
Número de caras Probabilidad Número de caras Probabilidad
0 8,88 x 10-16 30 0,042
1 4,44 x 10-14 35 2,00 x 10-3
2 1,09 x 10-12 40 9,12 x 10-6
5 1,88 x 10-9 45 1,88 x 10-9
10 9,12 x 10-6 48 1,09 x 10-12
15 2,00 x 10-3 49 4,44 x 10-14
20 0,042 50 8,88 x 10-16
25 0,112
En lugar de leer todos los valores de probabilidad de una tabla, se puede representar
gráficamente la probabilidad en función del resultado para obtener el mismo
resultado. Por ejemplo:
Figura 1.3. Representación de la probabilidad del número de caras que se observan tras el
lanzamiento de una moneda 50 veces. La curva roja representa la distribución de
probabilidades para PE = 0,5, la curva azul para PE = 0,3 y la curva amarilla para PE = 0,7.
Conclusiones:
- PE = 0.5 (línea roja de la Figura 1.3): La probabilidad máxima es para 25 caras.
- El valor real de la probabilidad correspondiente a 25 éxitos no es la unidad, sino
0,112. Sin embargo, sumando todos los resultados de las probabilidades
obtenemos que
+ +⋯+ = ∑ "" = 1 (1.17)
- La representación de la Figura 1.3 demuestra que se puede usar la fórmula
de la probabilidad para los ensayos de Bernoulli para describir la variación o distribución de la probabilidad frente al resultado del evento. Por tanto,
la expresión de la probabilidad que hemos empleado se puede entender también como la función de distribución en un experimento binomial.
A partir de la ecuación (1.13), la probabilidad de observar j ensayos con éxito entre
n ensayos en total, está dada por
+5- = 7!"!+78"-! + -"+1 − -78" )H)5 = 0, 1, 2, … , , (1.18)
¿Qué ocurriría si se usara una moneda en la que la probabilidad de obtener la cara
fuera 0,7?
Cuando PE = 0,7 y (1 − PE) = 0,3 (línea amarilla de la Figura 1.3), la comparación de
P(j) con la de PE = 0,5 demuestra que el resultado más probable está desplazado hacia
un número grande de caras, cara = 35 en el caso de PE = 0,7.
El resultado cara = 15 es el más probable cuando PE = 0,3 (línea azul de la Figura 1.3).
Un aspecto final a notar es que además de cambiar la probabilidad de cara = 25
conforme PE cambia de 0,5 a algún otro valor, la probabilidad del resultado más
probable también aumenta. Por ejemplo, para PE = 0,5, la probabilidad máxima es
0,112 para cara = 25. Si PE = 0,7, la probabilidad máxima se sitúa ahora en 0,128 para
cara = 35. Por tanto, no sólo el resultado más probable depende de PE, sino que la
probabilidad de observar el resultado más probable, también cambia con PE.
El experimento de lanzar la moneda proporciona un ejemplo excelente de una
función de distribución de probabilidad y motiva una definición más formal de tales
funciones. Una función de distribución de probabilidad representa la probabilidad
de que una variable (X) tenga un valor dado, con la probabilidad descrita por una
función
+I- ∝ K (1.19)
P(Xi) es la probabilidad de que la variable X tome el valor Xi en el espacio muestral.
Esta ecuación establece que el conjunto de probabilidades P(X1), P(X2),…, P(XM) será
proporcional al valor de la función de distribución evaluada para el valor
correspondiente de la variable f1, f2,…, fM.
En un experimento binomial, la ecuación (1.13) representa la función f de la ecuación
(1.19), que puede expresarse como una igualdad, introduciendo una constante de
proporcionalidad (C)
+I- = :K (1.20)
Imponiendo el requerimiento de que la probabilidad total sea igual a la unidad,
∑ +I- = 1 (1.21)
de modo que la constante de proporcionalidad será
: = ∑ LMNMOP (1.22)
Por tanto:
+I- = LM∑ LMNMOP (1.23)
La Ecuación (1.23) es una expresión general de la probabilidad que será utilizada
cuando definamos la distribución de Boltzmann, uno de los resultados centrales de la
Termodinámica Estadística. Ejemplo práctico 1.9.
¿Cuál es la probabilidad normalizada de sacar una carta dada de una baraja estándar de 52
cartas?
Solución +I- = LM∑ LMQRMOP = ∑ LMQRMOP =
Distribuciones de probabilidad de variables discretas y continuas.
Las distribuciones de probabilidad se pueden construir calculando la probabilidad
correspondiente cuando X toma cada valor del conjunto de la muestra. Sin embargo,
¿qué ocurre si la variable X es continua? En este caso la probabilidad se define con
respecto a la variable que tiene valor en una parte del dominio de X, denotado como
dX. Por tanto, P(X) es la densidad de probabilidad, y P(X)dX es la probabilidad de
que la variable X tenga un valor en el intervalo dX. Por analogía con el desarrollo de
las variables discretas, la probabilidad viene dada por
+I-FI = :K+I-FI (1.24)
Aplicando laa condición de normalización para asegurar que la probabilidad total es
la unidad en el dominio de la variable (X1 ≤ X ≤ X2):
E +I-FISRSP = : E K+I-FI = 1SRSP (1.25)
Por tanto,
: = E L+S-TSURUP
(1.26)
y en consecuencia:
+I-FI = L+S-TSE L+S-TSURUP
(1.27)
El parecido de esta expresión con la expresión correspondiente para las variables discretas,
ecuación (1.23), ilustra un punto importante. Cuando trabajamos con distribuciones de
probabilidad correspondientes a variables continuas, se lleva a cabo una integración en el
dominio de la variable. En contraste, cuando la variable es discreta, se lleva a cabo una suma.
Pese a que la aproximación matemática cambia entre las variables discreta y continua, es
importante comprobar que la descripción conceptual de la probabilidad permanece inalterada. En la asignatura Química Física II se ha visto un ejemplo de distribución de probabilidad
continua. Concretamente, la condición de normalización se aplicó al dominio espacial de la
función de onda:
E V∗X8X +Y, (-V+Y, (-FY = 1 (1.28)
La función de distribución de probabilidad asociada a la energía cinética traslacional de las
partículas de un gas ideal (E) es otro ejemplo de funciones de distribución que implica
variables continuas:
+#-F# = 2Z [\]0/ #/_8 /\]F# (1.29)
La energía correspondiente al
máximo cambia con la
temperatura y la probabilidad
de encontrar una partícula a
energías cinéticas grandes
también aumenta con la
temperatura. Este ejemplo
demuestra que usando las
distribuciones de probabilidad
se puede presentar de forma
sucinta una cantidad sustancial
de información sobre el
comportamiento de un sistema
químico.
Figura 1.4. Distribuciones de probabilidad de la
energía cinética traslacional de un gas ideal.
Representación continua de variables discretas Es teóricamente posible evaluar probabilidades que implican variables discretas
mediante una suma; sin embargo, encontraremos situaciones en donde la suma
implica un número prohibitivamente grande de términos. En tales casos, tratar una
variable discreta como continua, simplifica en gran medida las cosas. Sin embargo, la
cuestión clave en esta aproximación es el error introducido al incluir valores de la
variable discreta que no están contenidos en el conjunto de la muestra. ¿Bajo qué
condiciones tales errores son aceptables?
Consideremos la siguiente función de distribución de probabilidad sin normalizar:
+I- = _8,0S (1.30)
Hemos de normalizar esta distribución determinando la probabilidad total Ptotal. En
primer lugar, tratamos X como una variable discreta con el espacio muestral que
consta de valores enteros comprendidos entre 0 y 100, de modo que Ptotal es
= ∑ _8,0S = 3,86S (1.31)
A continuación, X se trata como continua en el dominio de muestra 0 ≤ X ≤ 100. La
expresión correspondiente para la probabilidad total es
= E _8,0SFI = 3,33 (1.32)
La única diferencia entre estas dos últimas ecuaciones es que la suma sobre los
valores discretos de la variable X se ha reemplazado por la integración sobre el rango
de la variable. Por tanto, la aproximación continua proporciona un resultado muy
cercano al exacto dado por la suma.
En general, si las diferencias entre los valores de la función son pequeñas en relación
al dominio de interés, entonces es apropiado tratar una variable discreta como
continua. Este hecho resultará útil cuando se discutan los diferentes niveles de
energía de un átomo o molécula. Concretamente, se utilizará la aproximación de la
ecuación (30.32) para tratar los estados traslacionales y rotacionales desde una
perspectiva continua ya que la suma es impracticable. De aquí en adelante, se harán
constar cuidadosamente las situaciones en las que la aproximación continua no sea
válida.
Caracterización de las funciones de distribución.
Las funciones de distribución proporcionan toda la información disponible sobre la
probabilidad para un sistema dado; sin embargo, hay veces en que no se requiere la
descripción completa de la función de distribución.
Imaginemos que hemos llevado a cabo una serie de experimentos en los que sólo se
estudian ciertos aspectos de una distribución molecular. Las cantidades de la función
de distribución de interés son componentes de la distribución que responde al
experimento. Consideremos la distribución de energía cinética traslacional descrita
en la Figura 1.4. ¿Cuál sería la energía cinética para la que la función de distribución
de probabilidad tiene un máximo? En este caso, no es necesario el conocimiento
completo de la distribución de la probabilidad. En lugar de ello, todo lo que
necesitamos es una única cantidad para compararla con el experimento, o un valor
“referencia”.
Por ello, presentamos a continuación los valores de referencia de utilidad sustancial
para caracterizar las funciones de distribución.
Valores medios Consideremos una función, g(X), cuyo valor depende de la variable X. El valor medio
de esta función depende de la distribución de probabilidad asociada a la variable X. Si
se conoce la distribución de probabilidad que describe la probabilidad de que X tome
un valor, esta distribución se puede emplear para determinar el valor medio de la
función como sigue:
⟨a+I-⟩ = ∑ a+I-+I- = ∑ c+SM-LMNMOP∑ LMNMOP (1.33)
La ecuación (1.33) establece que para determinar el valor medio de la función g(X),
simplemente se suman los valores de esta función para cada valor del conjunto muestral, X1,
X2,…, XM, multiplicada por la probabilidad de que la variable tome ese valor.
La suma en el denominador proporciona la normalización de la distribución de probabilidad.
Los corchetes en forma de ángulo abrazando a g(X) (es decir, <…>) denotan el valor medio de
la función, una cantidad que se refiere como valor esperado.
Ejemplo práctico 1.10.
Imaginemos que estamos en un espectáculo de atracciones y observamos un juego de dardos
en el que tiramos un único dardo a la siguiente diana:
Las cantidades en euros de la figura indican la cantidad de dinero que ganaremos si
alcanzamos con el dardo la parte correspondiente de la diana. La geometría de la diana es tal
que el radio de los círculos aumenta linealmente entre áreas sucesivas. Finalmente, tenemos
suficiente práctica en tiros de dardos como para no fallar enteramente no dando a la diana. Si
cuesta 1,50 € lanzamiento de un dardo, ¿merece la pena jugar en esta atracción?
Solución
Suponemos que la probabilidad de acertar en cada zona de la diana es directamente
proporcional al área. Si el radio del círculo interno es r, entonces los radios del segundo y
tercer círculo son 2r y 3r, respectivamente. El área de la curva interior, A1, es πr2 y las áreas de
los dos círculos más exteriores son d = Z+2H- − ZH = 3d d0 = Z+3H- − Z+2H- = 5d
Finalmente, el área total está dada por la suma de las áreas individuales, o 9A1, de modo que la
probabilidad de alcanzar cada parte de la diana es
K = dd + d + d0 = d9d = 19
K = dd + d + d0 = 3d9d = 39
K0 = d0d + d + d0 = 5d9d = 59
La suma de probabilidades es igual a 1, de forma que la distribución de probabilidad está
normalizada. La cantidad de interés es el pago promedio, o <n€>, dado por
⟨,€⟩ = ∑ ,€K0∑ K0 = +5€- 19 + +2€- 39 + +0€- 591 = 1,22€
La comparación del pago medio con la cantidad a pagar para tirar un dardo (1,50 €) sugiere
que este juego es una actividad en la que se pierde dinero (desde la perspectiva del lanzador
de dardos). Es interesante ver en este ejemplo que las cantidades “experimentales” que
estamos comparando son la cantidad de dinero que tenemos que pagar y la cantidad de dinero
que esperamos recibir en promedio, que es la cota de la distribución más interesante para
tomar la decisión de jugar.
Momentos de distribución Algunos de los valores de las cotas más ampliamente usados en las distribuciones
implican funciones de la forma xn donde n es un entero.
Si n = 1, la función correspondiente <x> se denomina primer momento de la función
de distribución, y es igual al valor medio de la distribución como discutimos
anteriormente.
Si n = 2, <x2> se denomina segundo momento de la distribución.
La raíz cuadrada de <x2> se denomina raíz cuadrática media o valor rms.
Los momentos primero y segundo, así como el valor rms, son cantidades
extremadamente útiles para caracterizar las funciones de distribución.
Ejemplo práctico 1.11.
Consideremos la función de distribución siguiente:
+Y- = :Y_8fR
Las distribuciones de probabilidad de esta forma se encuentran cuando se describen las
distribuciones de velocidad de las partículas del gas ideal. En esta función de distribución de
probabilidad, C es una constante de normalización que asegura que la probabilidad total es
igual a uno, y a es una constante. El dominio de interés está dado por 0 ≤ x≤∞. ¿Son los
valores medio y rms de esta distribución los mismos?
Solución
Aplicando la condición de normalización llegamos a que:
1 = g :Y_8fRFY = :g Y_8fRFYX
X = : h 14)iZ)j
y por tanto:
: = 1h 14)iZ)j
= 4)0/√Z
Una vez conocida la constante de normalización, determinamos los momentos de distribución.
⟨Y⟩ = g Y+Y-FY = g Y h4)0/√Z Y_8fRjFY = 2√Z)X
X
⟨Y⟩ = g Y+Y-FY = g Y h4)0/√Z Y_8fRjFY = 32)X
X
Hlm = n⟨Y⟩ = o 32)
Los valores medio y rms de la distribución no son
equivalentes. La distribución normalizada y la
posición de los valores medio y rms para el caso en
que a = 0,3 se muestran a continuación:
Varianza La varianza, σ2, proporciona una medida de la anchura de una distribución. La
varianza se define como el promedio del cuadrado de la desviación con respecto a la
media de la distribución:
p = ⟨+Y − ⟨Y⟩-⟩ = ⟨Y − 2Y⟨Y⟩ + ⟨Y⟩⟩ (1.34)
Esta ecuación se puede simplificar utilizando las dos siguientes propiedades
generales para los promedios que implican a dos funciones, b(x) y d(x):
⟨q+Y- + F+Y-⟩ = ⟨q+Y-⟩ + ⟨F+Y-⟩ (1.35)
⟨rq+Y-⟩ = r⟨q+Y-⟩ (1.36)
Utilizando estas propiedades la expresión para la varianza es:
p = ⟨+Y − ⟨Y⟩-⟩ = ⟨Y − 2Y⟨Y⟩ + ⟨Y⟩⟩ = ⟨Y⟩ − ⟨2⟨Y⟩⟨Y⟩⟩ + ⟨Y⟩
= ⟨Y⟩ − 2⟨Y⟩⟨Y⟩ + ⟨Y⟩
p = ⟨Y⟩ − ⟨Y⟩ (1.37)
Para ilustrar el uso de la varianza como una cota, consideremos la siguiente función
de distribución denominada distribución gaussiana:
+I-FI = +[sR-P/R _8+S8t-R/sR (1.38)
Es la función de distribución más importante utilizada para describir el error en las
medidas experimentales. La variable X es continua en el dominio −∞ ≤ X ≤ ∞.
La distribución de probabilidad gaussiana tiene un máximo en X = δ.
La anchura de la distribución está determinada por la varianza, con un incremento de
la varianza correspondiente al incremento de anchura de la distribución.
La dependencia de la distribución gaussiana con la varianza se ilustra en la Figura 1.5
usando la ecuación (1.38) con δ = 0.
Conforme la varianza de la distribución se incrementa desde σ2 = 0.4 hasta 2.0, la
anchura de la distribución de probabilidad crece.
Figura 1.5. Influencia de la varianza sobre las funciones de distribución de probabilidad
gaussianas. Se presentan las distribuciones para dos valores de la varianza, σ2: 2,0 (línea roja)
y 0,4 (línea amarilla).
Ejemplo práctico 1.12.
Determine la varianza de la función de distribución +Y- = :Y_8fR .
Solución
Esta es la función de distribución empleada en el ejemplo 1.11, y para los momentos primero y
segundo tenemos:
⟨Y⟩ = 2√Z)
⟨Y⟩ = 32)
Usando estos valores en la expresión de la varianza, encontramos
p = ⟨Y⟩ − ⟨Y⟩ = 32) − u 2√Z)v = 0,23)
Química Física III (Grado en Química)
Víctor Luaña
Universidad de OviedoOviedo, Curso 2016–2017
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 0 / 77
1. Termodinámica Estadística (Colectivos deGibbs)
La Mecánica Estadística representa uno de los cuerpos de doctrina centrales de la Química Física. Su papel esel de servir de conexión entre la visión microscópica de la Química Cuántica o la Espectroscopía, y la visiónmacroscópica de la Termodinámica. La descripción microscópica es de gran precisión y abundante en eldetalle. Demasiado abundante cuando se trata de determinar el comportamiento de un cuerpo macroscópico.Por el contrario, la Termodinámica adopta una perspectiva esencialmente empírica, de modo que bastan unaspocas variables, fácilmente medibles, para caracterizar el estado termodinámico. La Mecánica Estadística sirvede nexo entre ambas descripciones, de manera que permite utilizar la información detallada de la imagenmicroscópica para pronosticar el comportamiento termodinámico.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 1 / 77
Ergodicidad
La receta estadística es, en principio, bien simple. Debe tomarse una muestra representativa de los estadosposibles del sistema y determinar las propiedades promedio para la misma. El problema consiste en asegurar larepresentatividad de la muestra o, como se denomina en este contexto, la ergodicidad del procedimiento.El conjunto de todos los estados posibles de un sistema puede describirse como una región de un espacio defases, cuyas dimensiones coinciden con las variables mecánicas de las que depende la energía.Es más fácil describir este concepto si adoptamos el punto de vista de la mecánica clásica. Un sistema formadopor N partículas estaría entonces completamente caracterizado si conociéramos, en un instante dado, el valorde las 3N coordenadas de posición y de las 3N componentes del momento lineal de sus partículas. Por lo tanto,el espacio de fases clásico de este sistema depende de 6N variables: cada punto de este hiperespacio6N-dimensional representa un estado posible.El muestreo del espacio de fases se puede hacer de diversas formas. Un método puede consistir en comenzarcon un estado inicial aleatorio y después resolver las ecuaciones dinámicas (p. ej. las ecuaciones de Newton ode Hamilton), siguiendo la evolución en el tiempo de dicho estado inicial. Tal es el fundamento de las técnicasde Dinámica Molecular, que conforman uno de los instrumentos de simulación más útiles.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 2 / 77
El método de Gibbs de los colectivos
La simulación de un sistema complejo también puedellevarse a cabo mediante un muestreo aleatorio delos estados posibles del sistema, proporcionando acada estado un peso estadístico equivalente a suprobabilidad de ocurrir. Este tipo de procedimientosse conoce genéricamente con el nombre de métodosde Montecarlo, desde su introducción por Metropoliset al. en 1953 [J. Chem. Phys. 21 (1953) 1087].
En estas lecciones vamos a seguir, sin embargo, unprocedimiento muy diferente. Se trata de la formula-ción de colectivos, ideada por Josiah Williard Gibbsa finales del siglo XIX. El método garantiza de ante-mano la ergodicidad y, además, proporciona ecuacio-nes analíticas muy útiles de las propiedades termodi-námicas.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 3 / 77
Un colectivo es un conjunto formado por un número muy grande, A, de sistemas, todos los cuales seencuentran en el mismo estado termodinámico. La idea es que esta colección de sistemas representen unamuestra apropiada de todos los estados microscópicos y, por lo tanto, sus propiedades promedio sean las delsistema promedio ideal.A lo largo de esta lección y de la siguiente hablaremos de colectivos, de sistemas y de moléculas o partículas.Un colectivo está formado por sistemas. Cada sistema, a su vez, está formado por partículas o moléculas.Emplearemos un convenio tipográfico para distinguir entre las propiedades que se refieren a uno u otro ámbito:
Propiedades del colectivo: A, E , V ,N , S, G, ...Propiedades de un sistema: E, V, N, S, G, p, ...Propiedades de una partícula (molécula): e, v, s, g, ...
Vamos a restringir nuestra discusión a sistemas que se encuentran en equilibrio termodinámico y en los quesólo ocurre trabajo hidrostático (es decir, trabajo p dV). La extensión a otros tipos de trabajo es sencilla, pero laextensión a sistemas fuera del equilibrio está lejos de ser trivial.En estas condiciones, el estado termodinámico de un sistema puede establecerse dando valor a tan sólo tresvariables termodinámicas: una elegida de cada una de las tres parejas N, µ (número de partículas opotencial químico), V, p (volumen o presión), y E, T (energía interna o temperatura). Cada pareja estáformada por una variable extensiva y otra intensiva. Existen, por lo tanto, ocho formas diferentes de definir elestado termodinámico de los sistemas que forman el colectivo. Las más importantes de entre ellas son:
(N, V, E), que da lugar al colectivo microcanónico,(N, V, T), que define el colectivo canónico,(µ, V, T), del colectivo gran canónico,y (N, p, T), del colectivo isobárico e isotérmico.
También podemos describir las características de cada colectivo indicando las propiedades de las paredes queseparan cada uno de los sistemas de los restantes. P. ej. los sistemas de un colectivo gran canónico estánseparados entre sí por paredes permeables, rígidas y diatermanas.A continuación examinaremos las propiedades del colectivo canónico. Veremos después que los diferentescolectivos se relacionan entre sí y, lo que es más importante, que las propiedades de los distintos colectivos sonequivalentes dentro del grado de error determinado por la desviación típica estadística.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 4 / 77
Tipos de colectivos
Sistema energético:
var. intensiva µ p Tvar. extensiva N V E Nos centramos en sistemas homogéneos. En sistemas de varios
componentes N y µ son vectores.
colectivos:
estado colectivo ... Energía libre1 NVE microcanónico entropía, S2 NVT canónico E. Helmholtz, F3 µVT gran-canónico pV4 NpE iso-bárico5 µVE iso-químico6 NpT iso-pT E: Gibbs G
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 5 / 77
El colectivo canónico
Un colectivo canónico está formado por un número muy grande, A, de sistemas, cada uno de los cuales estálimitado por paredes impermeables, rígidas y diatermanas, de manera que el estado termodinámico (N, V, T)de todos los sistemas es el mismo. El colectivo completo se encuentra completamente aislado del resto deluniverso, de manera que su energía total, E , y el número total de partículas que contiene,N , permanecenconstantes.Cada sistema puede existir en uno cualquiera de una colección de estados cuánticos, de energíaE1, E2, E3, .... Estas energías dependen, en general, del número de partículas y del volumen del sistema:Ej(N, V).El estado del colectivo se puede establecer con tres grados diferentes de detalle:
Macroestado, que consiste en dar el valor de las tres variables termodinámicas (N, V, T), que fijan elestado termodinámico compartido por todos y cada uno de los sistemas.Microestado: representa el extremo contrario. Debemos proporcionar el estado cuántico de cada sistema.Es decir, una lista del tipo: el sistema 1 se encuentra en el estado E25, el sistema 2 en el estado E184, y asísucesivamente.Distribución: que proporciona un grado intermedio de detalle. Nos conformamos con conocer el númerode sistemas que se hallan en un estado Ei dado, renunciando a conocer cuáles son esos sistemas. Formal-mente, si ai representa el número de sistemas que se encuentran en el estado Ei, una distribución es unvector~a = a1, a2, a3, ....
Si conociéramos la probabilidad de que ocurra una determinada distribución, p(~a), sería sencillo calcular laenergía promedio de un sistema en el colectivo como:
〈E〉 =∑~a
p(~a)E(~a)
A=∑~a
p(~a)1A∑
i
aiEi, (1)
donde la primera suma recorre todas las posibles distribuciones y la segunda todos los posibles estadoscuánticos que un sistema puede adoptar. Esto se podría generalizar a todo tipo de propiedades que estén biendefinidas para un estado cuántico de un sistema.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 6 / 77
Vamos a examinar cuatro aspectos cruciales que nos permitirán completar este programa de trabajo.
1. Postulado de equiprobabilidad de los microestados: Aceptaremos a priori que todos los microestadoscompatibles con un macroestado dado tienen la misma probabilidad de ocurrir.
⇒ La probabilidad de una determinada distribución será proporcional al número de microestados quecomprende (permutaciones con repetición). Si hay A sistemas en total, de los que ai se encuentran en elmismo estado cuántico Ei y no se pueden distinguir, el número de posibilidades será:
W(~a) =A!
a1! a2! a3!...=A!∏k ak!
, (2)
donde la suma sobre k recorre todos y cada uno de los estados cuánticos posibles. A partir de aquí, el númerototal de microestados posibles lo obtendremos sumando W(~a) sobre todas las distribuciones:
Wtotal =∑~a
W(~a). (3)
La probabilidad de una distribución dada será entonces p(~a) = W(~a)/Wtotal. Esta probabilidad nos permiteobtener todo tipo de propiedades. Por ejemplo, una de las propiedades interesantes del colectivo es laprobabilidad de que un estado dado se encuentre poblado:
Pj =
⟨aj
A
⟩=
1A∑~a
p(~a)aj(~a) =1
AWtotal
∑~a
W(~a)aj(~a). (4)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 7 / 77
2. Teorema de la distribución más probable: No todas las distribuciones tienen la misma probabilidad. Dehecho, una consecuencia de que el número de sistemas A sea muy grande es que tan sólo una distribuciónconcreta, la distribución más probable~a ∗, tiene una probabilidad apreciable de ocurrir. Formalmente:
l«ımA→∞
p(~a) = δ(~a ∗) ≈
1 si ~a = ~a ∗
0 si ~a 6= ~a ∗ , (5)
donde δ(x) representa una función delta de Dirac.
Esquema: A medida que A crece la distribuciónde probabilidad p(~a) se va haciendo más y másaguda, tendiendo a una función delta de Dirac.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 8 / 77
En lugar de tratar de demostrar este teorema vamos a ver un ejemplo ilustrativo:
Ejemplo: Supongamos que el colectivo esta formadopor A = 50 sistemas, que ocupan uno de los estadosde energía E1 = 0, E2 = ε, E3 = 2ε, E4 = 3ε, E5 =4ε, E6 = 5ε. Supongamos que la energía total delcolectivo está fijada en E = 5ε. Podemos enumerartodas las distribuciones posibles y determinar su pro-babilidad (Tabla de la derecha).
a1 a2 a3 a4 a5 a6 W(~a) p(~a)1 49 0 0 0 0 1 50 0.002 48 1 0 0 1 0 2450 0.003 48 0 1 1 0 0 2450 0.004 47 2 0 1 0 0 58800 0.025 47 1 2 0 0 0 58800 0.026 46 3 1 0 0 0 921200 0.297 45 5 0 0 0 0 2118760 0.67
Total: 3162510 1.00
A Wtotal p(~a ∗)50 3,16× 106 0,67103 8,42× 1012 0,98106 8,33× 1027 0,99998
Este ejemplo está realmente muy alejado del tamaño de una muestra ma-croscópica. Cuando aumenta el número de sistemas en el colectivo la distri-bución de probabilidad converge rápidamente hacia una delta de Dirac y ladistribución más probable se convierte, en la práctica, en el suceso seguro.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 9 / 77
Hallar la distribución más probable
La distribución más probable es aquella que hace máximo W(~a). Esta función, sin embargo, toma valoresenormes y resulta más cómodo tratar con ln W(~a), que tiene idénticos máximos. Además
ln W(~a) = lnA!∏k ak!
= lnA!− ln
(∏k
ak!
)= lnA!−
∑k
ln ak!, (6)
y podemos hacer uso de la aproximación de Stirling,
ln n!−→n1
n ln n− n + 1 ≈ n ln n− n, (7)
para escribirln W(~a) ≈ A lnA−A−
∑k
ak ln ak +∑
k
ak︸ ︷︷ ︸A
(8)
Por otra parte, debemos asegurar que el número de sistemas, A, y la energía total del colectivo, E ,permanezcan constantes. Este problema de máximo con condiciones se puede tratar mediante el método demultiplicadores indeterminados de Lagrange. Para ello construimos una función objetivo
g(~a) = ln W(~a)− α
A︷ ︸︸ ︷∑k
ak −β
E︷ ︸︸ ︷∑k
akEk (9)
donde α y β son factores desconocidos.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 10 / 77
Al haber incorporado las condiciones del problema en la función objetivo, podemos minimizar ésta líbrementecon respecto a las variables aj. La condición necesaria de mínimo será
∀j
:∂g∂aj
= 0 =⇒∂ ln W∂aj
− α∂
∂aj
∑k
ak︸ ︷︷ ︸=1
−β∂
∂aj
∑k
akEk︸ ︷︷ ︸=Ej
= 0
=⇒∂
∂aj
(A lnA−
∑k
ak ln ak)− α− βEj = − ln aj −
aj
aj− α− βEj = 0. (10)
La solución es única, de manera que se trata de los coeficientes de la distribución más probable:
∀j : a∗j = e−α−1e−βEj . (11)
Aún no hemos terminado. Debemos obtener los multiplicadores α y β. El primero es el más sencillo. Para que elnúmero total de sistemas sea A debe cumplirse:
A =∑
j
a∗j = e−α−1∑
j
e−βEj = e−α−1Q, (12)
donde hemos introducido Q =∑
j e−βEj , que recibe el nombre de función de partición canónica.Despejando,
a∗j =Ae−βEj∑
k e−βEk=AQ
e−βEj . (13)
Si dividimos por el número total de sistemas obtenemos la probabilidad de que el estado cuántico j seencuentre poblado:
Pj =a∗jA
=1Q
e−βEj . (14)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 11 / 77
Este es un resultado muy importante: La población de un estado cuántico es proporcional a su exponencial deBoltzmann, e−βEj .La función de partición canónica, Q, es el objeto más importante de la estadística del colectivo. Como veremosenseguida, todas las propiedades termodinámicas del colectivo se pueden obtener a partir de la función departición. De algún modo, la función de partición tiene tanta importancia en estadística como la función de ondaen mecánica cuántica.Para llegar a ese punto debemos considerar cómo se determinan las propiedades termodinámicas del colectivo.En primer lugar, debemos distinguir entre aquellas propiedades termodinámicas que tienen un equivalentemecánico, como son la energía (Ej) o la presión (−∂Ej/∂V) de aquellas otras que son genuinamentemacroscópicas y carecen de una versión microscópica, tal como es el caso de la temperatura (T) o de laentropía (S). De ambos tipos de propiedades se ocupan los dos siguientes postulados.
3. Postulado de Gibbs: Las propiedades del colectivo que tienen un origen mecánico se pueden obtenerpromediando las correspondientes propiedades de cada sistema. Por ejemplo:
E = 〈E〉 =∑
j
EjPj =1Q
∑j
Eje−βEj , p = 〈p〉 =
1Q
∑j
(−∂Ej
∂V
)N
e−βEj . (15)
〈E〉 corresponderá a la energía interna, U, de la termodinámica clásica.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 12 / 77
4. Postulado de Boltzmann: La entropía del colectivo es proporcional al logaritmo neperiano del número demicroestados que comprende su estado macroscópico:
S = kB ln W(~a ∗), (16)
donde kB = 1,3806505(24)× 10−23J/K recibe el nombre de constante de Boltzmann y está relacionada con laconstante R de los gases y el número de Avogadro NA: kB = R/NA.
No podemos demostrar la ecuación de Boltzmann Pero sí podemos argumentar en favor de su plausibilidad:
La entropía del universo crece en todo proceso espontáneo e irreversible (2o principio)
Espontáneamente el colectivo tiende al desorden: al estado que se puede construir de un número máximode maneras diferentes.
S es aditiva, pero W es multiplicativa.
En cualquier caso, la justificación de este postulado está en el hecho de que nos permite construir una teoríaestadística que describe correctamente el comportamiento de la materia.Como primera aplicación del postulado de Boltzmann vamos a determinar β. Partimos de
S = AS = kB ln W(~a ∗) = kB
(A lnA−
∑j
a∗j ln a∗j)
= kB
(A lnA−
∑j
a∗j ln[A
Qe−βEj
])= kB
(A lnA−
lnA∑
j
a∗j +A ln Q + β∑
j
a∗j Ej
)= AkB ln Q + kBβAE. (17)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 13 / 77
Tomaremos ahora la diferencial de esta expresión, teniendo en cuenta que la energía cuántica de un estadodepende del volumen y del número de partículas, Ej(N, V), pero N es constante dado que estamos tratando conun colectivo canónico:
dS = kBdQQ
+ kBEdβ + kBβdE = kB1Q
∑j
e−βEj(−βdEj−Ejdβ
)+ kBEdβ + kBβdE
=
−kB
1Q
∑j
Eje−βEj dβ + kBβ
1Q
∑j
e−βEj
(−∂Ej
∂V
)dV +kBEdβ + kBβdE
= kBβpdV + kBβdE. (18)
Si despejamos dE podemos ver una expresión del primer principio de termodinámica en condiciones dereversibilidad y trabajo mecánico:
dE = −pdV +1
kBβdS = −pdV + TdS =⇒ β = 1/kBT, (19)
y la determinación de β nos permite completar las ecuaciones estadísticas.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 14 / 77
Antes de seguir, es interesante que examinemos la variación de energía del colectivo, para poner de manifiestoun aspecto que hemos utilizado implícitamente en demostración anterior. Partimos de:
E =∑
j
a∗j Ej =⇒ dE =
=δW︷ ︸︸ ︷∑j
a∗j dEj +
=δQ︷ ︸︸ ︷∑j
Ejda∗j . (20)
En esta ecuación, dE representa la variación de energía interna del colectivo que se compone, como vemos, dedos partes. En primer lugar, está el cambio asociado a la variación de energía de los estados cuánticos de cadasistema, que interpretamos como el trabajo (δW). En segundo lugar, sin variar el espectro de estadosenergéticos, se produce un cambio de energía interna debido a la variación de las poblaciones, es decir, delnúmero de sistemas que ocupan cada estado. Esto es lo que interpretamos como calor (δQ). La ecuaciónanterior representa, por lo tanto, la interpretación estadística del principio fundamental de la termodinámica(1o+2o).
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 15 / 77
Función de partición canónica y propiedades termodinámicas
La función de partición canónica contiene la información estadística acerca del colectivo:
Q(N, V, T) =∑
j
e−βEj =estados∑
j
e−Ej(N,V)/kBT (21)
Vemos que Q depende de las tres variables que fijan el macroestado del colectivo. La dependencia de latemperatura es explícita, y la dependencia con respecto a N y V es heredada del hecho que la energía de losestados cuánticos de cada sistema depende de ambas variables.
Algunos autores usan el símbolo Z(N, V, T) para la función de partición canónica debido a su muy descriptivadenominación en alemán: Zustandsumme (suma sobre estados).Presión, energía y potencial químico se pueden obtener derivando ln Q con respecto a V, T y N, es decir, susrespectivas variables conjugadas:(
∂ ln Q∂V
)N,T
=1Q
∑j
(−β)
(∂Ej
∂V
)N,T
e−βEj = βp ⇒ p = kBT(∂ ln Q∂V
)N,T
, (22)
(∂ ln Q∂T
)N,V
=1Q
∑j
(Ej
kBT2
)e−βEj =
EkBT2
⇒ E = kBT2(∂ ln Q∂T
)N,V
, (23)
(∂ ln Q∂N
)V,T
=1Q
∑j
(−β)
(∂Ej
∂N
)V,T
e−βEj = −βµ ⇒ µ = −kBT(∂ ln Q∂N
)V,T
, (24)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 16 / 77
Para obtener la última ecuación hemos introducido una definición microscópica del potencial químico de unestado cuántico: µj = (∂Ej/∂N)V,T . Esta definición tiene una gran importancia en el estudio de la capacidadaceptora o donora de electrones de las moléculas y, en definitiva, de su electronegatividad.La entropía se puede determinar fácilmente dividiendo por el número de sistemas la entropía del colectivo queobtuvimos anteriormente (eq. 17):
S = kB ln Q +ET
=⇒ S = kB ln Q + kBT(∂ ln Q∂T
)N,V
. (25)
Hemos dejado para el final la que quizás es la relación más transcendente. Así como Q es función de (N, V, T),las variables que determinan el macroestado del colectivo canónico, existe un potencial termodinámico quetiene esa misma terna como variables naturales. Se trata de la función de Helmholtz F (otros autores ladenominan A) cuya variación en un sistema puro es:
dF =
(∂F∂T
)N,V
dT +
(∂F∂V
)N,T
dV +
(∂F∂N
)V,T
dN = −SdT − pdV + µdN. (26)
Haciendo uso de la relación entre F y la energía interna (F = E − TS), podemos ver que la energía libre deHelmholtz adquiere una expresión particularmente simple expresada en términos de la función de particióncanónica:
F = −kBT ln Q. (27)
Esta relación tan simple no es casual, como veremos enseguida.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 17 / 77
Otros colectivos:
El colectivo microcanónico es el más básico y de él se derivan todos los restantes. El macroestado queda fijadopor las variables (N, V, E), de manera que cada sistema, lo mismo que el colectivo como un todo, se encuentraaislado del resto del universo y no existe flujo de materia, trabajo ni energía. En estas condiciones, la únicadistribución posible es aquella que sitúa a cada sistema en el nivel cuántico de energía E. Este nivel tendrá, engeneral, una degeneración Ω(N, V, E), de manera que cada sistema se puede encontrar en uno cualquiera delos Ω estados de idéntica energía. El número total de microestados del colectivo será W = ΩA y el postuladode Boltzmann nos permite escribir:
S = kB ln W = kBA ln Ω =⇒ S = kB ln Ω. (28)
Ω(N, V, E) no es otra cosa que la función de partición del colectivo microcanónico. Además, S esprecisamente el potencial termodinámico cuyas variables naturales son (N, V, E):
dS =
(∂S∂E
)N,V
dE +
(∂S∂V
)N,E
dV +
(∂S∂N
)V,E
dN =1T
dE +pT
dV −µ
TdN. (29)
Pero
dS = kBd ln Ω = kB
(∂ ln Ω
∂E
)N,V
dE + kB
(∂ ln Ω
∂V
)N,E
dV + kB
(∂ ln Ω
∂N
)V,E
dN, (30)
y comparando obtenemos las expresiones microcanónicas para la temperatura, presión y potencial químico.Volvemos, por lo tanto, a advertir la existencia de una relación privilegiada entre la función de partición y elpotencial termodinámico definidos por la terna de variables que fijan el macroestado. Este tipo de relaciónocurre en todos los colectivos.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 18 / 77
Las funciones de partición canónica y microcanónica están relacionadas. En Q(N, V, T) sumamos sobre todoslos estados cuánticos, pero también podríamos sumar soble los niveles energéticos y tener en cuenta ladegeneración de cada nivel:
Q(N, V, T) =estados∑
j
e−βEj =niveles∑
E
Ω(N, V, E)e−βE, (31)
que muestra la relación entre ambas funciones de partición.De manera similar, en el colectivo gran canónico:
Ξ(µ, V, T) =∑
N
∑j
e−βENj(V)e−γN=∑
N
∑E
Ω(N, V, E)e−βENj(V)e−γN, (32)
pV = kBT ln Ξ, (33)
y en el colectivo isobárico-isotémico:
∆(N, p, T) =∑
V
∑j
e−βEVj(N)e−δV=∑
V
∑E
Ω(N, V, E)e−βEVj(N)e−δV, (34)
G(N, p, T) = −kBT ln ∆, (35)
donde β = 1/kBT, γ = −µ/kBT, y δ = p/kBT.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 19 / 77
Fluctuaciones
Hemos examinado las propiedades medias, pero también la varianza, σ2x = 〈(x− 〈x〉)2〉 = 〈x2〉 − 〈x〉2, y otros
estadísticos proporcionan información termodinámica relevante. En el colectivo canónico (N, V, T) son fijos,pero (µ, p.E) presentan fluctuaciones, y similarmente ocurre en en los colectivos restantes.Como ejemplo vamos a examinar las fluctuaciones de energía en el colectivo canónico:
σ2E = 〈E2〉 − 〈E〉2 =
1Q
∑j
E2j e−βEj − 〈E〉2 = −
1Q∂
∂β
∑j
Eje−βEj − 〈E〉2 = −
1Q∂
∂β(Q 〈E〉)− 〈E〉2 (36)
= −(∂ 〈E〉∂β
)V,N− 〈E〉
(∂ ln Q∂β
)V,N− 〈E〉2
= −[(
∂ 〈E〉∂T
)V,N
+ 〈E〉(∂ ln Q∂T
)V,N
](dβdT
)−1
− 〈E〉2
= −[(
∂ 〈E〉∂T
)V,N
+ 〈E〉(∂ ln Q∂T
)V,N
](dβdT
)−1
− 〈E〉2
= kBT2(∂ 〈E〉∂T
)V,N
+kBT2
(∂ ln Q∂T
)V,N〈E〉 −〈E〉
2= kBT2
(∂ 〈E〉∂T
)V,N
= kBT2 〈Cv〉
En un gas ideal 〈E〉 = O(NkBT) y 〈Cv〉 = O(NkB), de manera queσE
〈E〉= (kBT2 〈Cv〉)1/2 〈E〉−1
= O(1/√
N). (37)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 20 / 77
Equivalencia termodinámica de los colectivos
Es decir, comparada con el valor promedio de la energía, la desviación típica de la misma decrece enproporción a la raíz cuadrada del número de partículas que forman el sistema. Este es un resultado prototípico:a medida que los sistemas crecen en tamaño, la importancia de las fluctuaciones disminuye siguiendo la ley deescala N−1/2. Por este motivo, en el examen de sistemas macroscópicos ordinarios es común que ignoremoslas fluctuaciones de las propiedades termodinámicos. Sin embargo, su importancia es muy grande cuandoexaminamos el comportamiento de pequeños agregados de materia.Por otra parte, en las cercanías de los puntos críticos del diagrama de fases de una sustancia, pueden darse lascircunstancias que aumentan las fluctuaciones hasta convertirlas en un fenómeno macroscópico y dominante.Pero esta importante propiedad escapa de nuestro programa de estudio.Debemos elegir el colectivo que nos permita analizar la propiedad de nuestro interés: Si nos interesan lasfluctuaciones en N no podemos usar el colectivo canónico, donde N es constante. sino que elegiríamos uncolectivo gran canónico, por ejemplo. En ese sentido, todos los colectivos son termodinámicamenteequivalentes, aunque matemáticamente distintos.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 21 / 77
Colectivos en un sistema puro
macroestado colectivo Función de partición Potencial termodinámicoN, V, E microcanónico Ω(N, V, E) = W(~a?)A Entropía: S = kB ln ΩN, V, T canónico Q(N, V, T) E. Helmholtz: F = −kBT ln Qµ, V, T grancanónico Ξ(µ, V, T) pV = kBT ln ΞN, p, T isotérmico-isobárico ∆(N, p, T) E. Gibbs: G = −kBT ln ∆
Relaciones entre colectivos:
Q(N, V, T) =niveles∑
E
Ω(N, V, E)e−βE(N,V) (38)
Ξ(µ, V, T) =∑
N
∑E
Ω(N, V, E)e−βE(N,V)e−γN (39)
∆(N, p, T) =∑
V
∑E
Ω(N, V, E)e−βE(N,V)e−δV (40)
Multiplicadores indeterminados de Lagrange: β = 1/kBT, γ = −µ/kBT, δ = p/kBT.Ecuaciones termodinámicas básicas para un sistema puro:
F(N, V, T) : dF =(∂F∂T
)N,V dT +
(∂F∂V
)N,T dV +
(∂F∂N
)V,T dN (41)
= −SdT − pdV + µdN,
S(N, V, E) : dS = kB(∂S∂E
)N,V dE + kB
(∂S∂V
)N,E dV + kB
(∂S∂N
)V,E dN (42)
= kB(∂ ln Ω∂E
)N,V dE + kB
(∂ ln Ω∂V
)N,E dV + kB
(∂ ln Ω∂N
)V,E dN
= 1T dE + p
T dV − µT dN,
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 22 / 77
2. Sistemas (ideales) de partículas independientes
Un gas en el que podemos ignorar la interacción entre partículas, pero también un cristal en que cada modo devibración se puede considerar por separado e ignorar su influencia mútua o un gas de partículas de luz en elque cada partícula se puede considerar por separado. Tal es la situación de partículas independientes en elsentido estadístico. Si la energía de un sistema se comporta aditivamente la función de partición se comportamultiplicativamente. Una energía total expresada como suma de componentes da lugar a una functión departición expresada como producto de factores. En este largo capítulo hablaremos de la estadística clásica deMaxwell-Boltzmann (MB) y de su aplicación al estudio de las velocidades moleculares. La ley de Maxwell o dedistribución de las velocidades moleculares es el fundamento de la teoría cinética de los gases. A su vez, ladistribución de MB es el comportamiento límite de las estadísticas cuánticas que regulan el comportamiento debosones (estadística de Bose-Einstein) y fermiones (estadística Fermi-Dirac).
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 23 / 77
Sistemas de partículas independientes
En este capítulo vamos a explotar la circunstancia de que el problema se hace más simple cuando laspartículas son independientes, lo que quiere decir que el hamiltoniano total se puede escribir como una suma,
H =∑
i
hi, (43)
donde hi depende sólo de un conjunto de grados de libertad pero es independiente de los restantes. Dicho deotro modo, los grados de libertad se pueden clasificar en grupos y no existen términos en el hamiltoniano totalque acoplen (mezclen) unos grupos con otros.En el caso de un gas muy diluido, hasta el punto de que podemos ignorar las interacciones moleculares, hi
puede ser el hamiltoniano de una molécula, mientras que H sería el del gas completo. En el caso de unamolécula aislada podemos hacer una separación de los movimiento de traslacción, rotación, vibración,electrónicos, etc, y escribir:
H ≈ Htras + Hrot + Hvib + Helec + Hnuc + ... (44)
Un haz de luz se puede describir como un gas de fotones independientes. Las propiedades mecánicas,termodinámicas y elásticas de un cristal no metálico se pueden caracterizar en términos de sus vibraciones,aproximadamente tratadas como cuasipartículas independientes llamadas fonones. Si el cristal es metálico, esimprescindible considerar además la contribución de los electrones que forman el mar de valencia ... Endefinitiva, la denominación de partículas independientes tiene un significado muy amplio, referido siempre a laposibilidad de descomponer el hamiltoniano como indica la ecuación 43.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 24 / 77
Estadísticas clásicas y cuánticas
Dependiendo de la descripción clásica o cuántica de las partículas distinguiremos:
Estadística de Maxwell-Boltzmann: Las partículas, o boltzones, se describen mediante las leyes mecá-nico clásicas, aunque es necesario suponerlas indistinguibles para lograr que la entropía sea extensiva.Ley de Maxwell: Aplicación de la estadística anterior al comportamiento de las velocidades moleculares.Estadística de Fermi-Dirac: Describe los sistemas formados por partículas de espín semientero (fermiones),cuya función de onda debe ser antisimétrica frente al intercambio de partículas. Como consecuencia delprincipio de exclusión, en un gas de fermiones idénticos dos partículas no pueden ocupar simultáneamenteel mismo estado cuántico.Estadística de Bose-Einstein: Describe los sistemas formados por partículas de espín entero (bosones),cuya función de onda debe ser simétrica frente al intercambio de partículas. Un número arbitrario de boso-nes pueden llegar a ocupar simultáneamente el mismo estado cuántico, dando lugar a un gas de Bose.
Las dos estadísticas cuánticas tienden a la de Maxwell-Boltzmann cuando la temperatura es lo bastanteelevada y la densidad de partículas escasa. La indistinguibilidad de las partículas, sin embargo, se conserva siqueremos un comportamiento estrictamente aditivo de la entropía.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 25 / 77
Estadística de Maxwell-Bolzmann I
Partimos de la función de partición canónica, Q(N, V, T). Supongamos que el sistema está formado por Npartículas idénticas y distinguibles. Cada partícula se puede encontrar en una colección de estados:εii=1,2,.... La energía total del sistema es una suma de las energías de todas sus partículas de modo que,para un estado del sistema: Eκ = εa
i + εbj + ..., donde a, b, ... son las partículas, e i, j, ... indica el estado en el
que se encuentra cada partícula. Recorrer todos los estados κ del sistema equivale a que cada índice i, j, ...recorra todos los estados de una partícula. Por lo tanto:
Q(N, V, T) =∑κ
e−Eκ/kBT=
estados∑i
∑j
... exp
(−εa
i + εbj + ...
kBT
)
=
(∑i
e−εi/kBT
)∑j
e−εj/kBT
... = [q(V, T)]N (45)
donde q(V, T) =∑
i e−εi/kBT es la función de partición molecular, idéntica para todas las partículas. Laexpresión anterior, 45, representa la ecuación fundamental de la estadística de Maxwell-Boltzmann parapartículas distinguibles.En mecánica clásica no hay ninguna razón que impida que las partículas se distingan, dado que la integraciónde su trayectoria debe permitir, en principio, conocer su posición en cada instante. Sin embargo, veremos que laecuación 45 conduce a sutiles anomalías en las propiedades relacionadas con la entropía, que sólo seresuelven aceptando la indistinguibilidad.La energía total del sistema seguirá siendo suma de las energías de las partículas, aunque éstas seanindistinguibles, pero no podemos establecer qué partícula ocupa cada estado. Por lo tanto, dada la expresiónEijk... = εi + εj + εk + ..., si cada índice i, j, k, ... recorre por separado todos los estados accesibles a unapartícula estaremos contando repetidas veces estados del sistema que no se pueden diferenciar y son, por lotanto, el mismo. En estas condiciones, Q(N, V, T) no es separable, en general.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 26 / 77
Estadística de Maxwell-Bolzmann II
Existe una circunstancia en la que la repetición de un estado es predecible y fácil de calcular. Sea Φ(ε) elnúmero de estados posibles de una molécula de energía menor o igual que ε. Si el número de estadosaccesibles a una partícula de energía media es muy superior al número N de partículas, es decir si Φ(ε) N,la probabilidad de que dos de los índices i, j, k, ... coincidieran, esto es, de que dos partículas se encontraran enel mismo estado, sería despreciable. En estas circunstancias, al recorrer independientemente cada índice i, j, k,... cada estado distinto aparecería repetido exactamente N! veces, correspondiendo a las formas de permutarentre sí los N índices diferentes. Por lo tanto, la indistinguibilidad sólo introduce una pequeña corrección sobrela expresión anterior:
Q(N, V, T) =q(V, T)N
N!. (46)
El resultado recibe el nombre de estadística de Maxwell-Boltzmann corregida.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 27 / 77
Estimación del número de estados disponibles por partícula: I
Podemos estimar la razón entre el número de partículas y el número de estados accesibles empleando elmodelo de la partícula en una caja 3D. Recordemos que los estados se caracterizan por tres números cuánticosnx, ny, nz = 1, 2, 3, ... y su energía es
ε(nx, ny, nz) =h2
8ma2(n2
x + n2y + n2
z ) (47)
nx
ny
nz
R
si la caja es un cubo de lado a. Todos los estados se pueden representar en un espa-cio de fases, cuyas cordenadas son los números cuánticos nx, ny y nz, de modo quea cada estado le corresponde un cubito de volumen unidad. El conjunto de estados deenergía menor o igual a ε están encerrados dentro de un octante de esfera de radioR =
√n2
x + n2y + n2
z = a√
8mε/h en el espacio de fases. El número de estados encerra-
dos se puede estimar igual al volumen de dicho octante, aunque esta estimación cometeun pequeño error, que vamos a ignorar, al contar los estados en la frontera. Por lo tanto
Φ(ε) =18
43πR3
=π
6
(8mεh2
)3/2
V (48)
donde V = a3 es el volumen de la caja. La energía promedio por partícula es ε ≈ 32 kBT, y podemos utilizar la
ecuación de estado del gas ideal, pV = NkBT para podemos preparar la tabla siguiente.Razón del número de partículas al número de estados accesibles para varios sistema prototipo. Los gases seencuentran a 1 atm. La estadística de Maxwell-Boltzmann corregida tiene sentido si N/Φ(ε) 1. El He a bajastemperaturas no cumple esta condición y, aún más, esta estadística ha de ser desastrosa en sistemas como elgas de electrones de un metal alcalino.
He(l) He(g) He(g) He(g) Ne(l) Ne(g) Ne(g) e:Na(c)T (K) 4 4 20 100 27 27 100 300
N/Φ(ε) 1.6 0.11 2,0× 10−3 3,5× 10−5 1,1× 10−2 8,2× 10−5 3,1× 10−6 1465
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 28 / 77
Propiedades termodinámicas en la estadística MBcorr
Las propiedades termodinámicas de un colectivo canónico formado por partículas independientes se puedendeterminar de la función de partición molecular
q(V, T) =
estados∑j
e−βεj ≡niveles∑
k
gke−βεk , (49)
donde β = 1/kBT, y gk es la degeneración, necesaria si sumamos sólo los niveles de energía diferente. Entrelas propiedades sencillas que más nos interesan están la probabilidad de que un determinado estado o un nivelestén poblados:
πj =Nj
N=
1q
e−βεj , y πk =Nk
N=
1q
gke−βεk . (50)
Para la energía interna promedio
〈ε〉 ≡ ε =〈E〉N
=1N
kBT2 ∂
∂Tln
(qN
N!
)= kBT2
(∂ ln q∂T
)V. (51)
Similarmente ocurre con otras funciones termodinámicas:
p = NkBT(∂ ln q∂V
)T, S = Ns = NkB ln
eqN
+ NkBT(∂ ln q∂T
)V, (52)
µ = g = −kBT lnqN, F = Nf = −NkBT ln
eqN. (53)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 29 / 77
Estadística del gas ideal
Un gas ideal está formado por moléculas sin interacción mutua. El hamiltoniano total es una suma de losoperadores de cada molécula por separado. Además, aceptaremos la separación efectiva entre los diferentesgrados de libertad: traslación, rotación, vibración, electrónicos, de espín nuclear, etc. En consecuencia, lafunción de partición molecular será el producto de las funciones de partición correspondientes a estos gradosde libertad. Como veremos:
q(V, T) = qtras(V, T)qrot(T)qvib(T)qelec(T)qspin−nuc(T)..., (54)
y sólo la función de partición traslacional depende sustancialmente del volumen del recipiente que contiene alsistema molecular. En las próximas secciones determinaremos la forma de las qi utilizando modelos cuánticossencillos que nos proporcionarán una descripción, aproximada pero suficiente, del espectro de nivelesenergéticos accesibles.Es importante recordar que una molécula con n átomos dispone de f = 3n grados de libertad de movimiento,que se reparten entre treslación, vibración y rotación:
a la traslación corresponden 3 en el espacio 3D,
a la rotación corresponden 2 en el caso de moléculas lineales o 3 en las no lineales.
ala vibración corresponden los restantes 3n− 5 o 3n− 6 grados de libertad.
Todos los grados de libertad aportan a las propiedades termodinámicas como las capacidades caloríficas o laentropía, pero lo hacen de diferentes formas.Por eso, la capacidad de aumentar la temperatura adquiriendo energía y emitir energía enfriándose varía con latemperatura: es la capacidad calorícica cv o cp lo que lo determina.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 30 / 77
Función de partición electrónica I
No existe ningún modelo sencillo que nos describa el conjunto de estados electrónicos de un átomo o unamolécula. Por lo tanto, debemos depender de que nos proporcionen una tabla con sus energías ydegeneraciones para poder evaluar la expresión general
qelec(T) =niveles∑
k
gke−εk/kBT. (55)
El cero de energías es, en principio, arbitrario. Sin embargo, debemos adoptar un criterio uniforme, sobre todo siqueremos comparar sistemas. En el caso de átomos tomaremos como cero la energía del estado electrónicofundamental. En el caso de moléculas será el límite de disociación en sus átomos componentes.En muchos sistemas atómicos y moleculares el estado fundamental es único y está lo bastante separadoenergéticamente de los estados excitados como para que la población de éstos sea despreciable y nocontribuya significativamente a las propiedades termodinámicas. En estas circunstancias qelec ≈ 1, o qelec ≈ g0si el nivel fundamental es degenerado. Un ejemplo típico es H2O, donde el primer estado excitado se encuentra53800 cm−1 por encima del fundamental (kBT equivale a 208.5 cm−1 a 300 K).En otros sistemas el estado fundamental es orbital y espinorialmente degenerado, de manera que elacoplamiento espín-órbita produce el desdoblamiento en varios niveles muy próximos en energía. El O es unátomo que exhibe este comportamiento y sus primeros niveles energéticos son: 1s22s2p4 − 3P2 (ε0 = 0, g0 = 5),3P1 (ε1 = 158,5 cm−1, g1 = 3), 3P0 (ε2 = 226,5 cm−1, g2 = 1), 1D2 (ε3 = 15867,7 cm−1, g3 = 5), ... Un ejemplomolecular típico es el NO, cuyos primeros estados son: X − 2Π1/2 (ε0 = 0, g0 = 2), 2Π3/2 (ε1 = 119,82 cm−1,g1 = 4), A− 2Σ+ (ε2 = 43965,7 cm−1, g2 = 2), ... En este tipo de sistemas no podemos ignorar la población delos estados excitados que provienen del desdoblamiento espín-órbita, ni su contribución a las propiedadestermodinámicas.Como ejemplo, la tabla siguiente proporciona la población en equilibrio de los primeros estados excitados del Oa distintas temperaturas:
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 31 / 77
Función de partición electrónica II
T (K) 100 200 300 500 1000f1 0.055 0.154 0.207 0.255 0.294f2 0.006 0.029 0.047 0.067 0.087f3 < 10−99 2× 10−50 6× 10−34 9× 10−21 7× 10−11
fk =1
qelecgke−εk/kBT
El tratamiento de la función de partición nuclear es equivalente. Los estados nucleares están normalmenteseparados por energías muy elevadas, de manera que los estados excitados de los núcleos no contribuyen alas propiedades termodinámicas en condiciones ambiente. Por lo tanto, sólo hemos de preocuparnos por ladegeneración del estado fundamental nuclear y, como veremos al tratar las diatómicas homonucleares, delacoplamiento de espines entre núcleos idénticos de una molécula.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 32 / 77
Función de partición traslacional I
Discutiremos el problema de la traslación utilizando el modelo de la partícula en la caja. Si la partícula, átomo omolécula, tiene una masa m y se encuentra confinado en una caja cúbica de lado a, los niveles de energía estáncuantizados según la expresión
ε(nx, ny, nz) =h2
8ma2(n2
x + n2y + n2
z ), con nx, ny, nz = 1, 2, 3, ... (56)
La función de partición traslacional será entonces
qtras =∞∑
nx=1
∞∑ny=1
∞∑nz=1
e−βε(nx,ny,nz)
=
∞∑nx=1
exp
−
h2n2x
8ma2kBT
∞∑ny=1
exp
−
h2n2y
8ma2kBT
∞∑nz=1
exp
−
h2n2z
8ma2kBT
= qxqyqz =
[ ∞∑n=1
exp
−
h2n2
8ma2kBT
]3
(57)
A temperaturas ordinarias, la energía térmica kBT es mucho mayor que el intervalo de energía entre dosestados sucesivos. En estas circunstancias cometemos un error despreciable al considerar que la suma sobreun conjunto discreto aunque infinito de niveles equivale a la integración sobre un contínuo. Por lo tanto
∞∑n=1
exp
−
h2n2
8ma2kBT
≈∞∑
n=0
(...) ≈∫ ∞
0exp
−
h2n2
8ma2kBT
dn =
√2πmkBT
h2a, (58)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 33 / 77
Función de partición traslacional II
donde hemos usado∫∞
0 e−bx2dx =
√π/4b. Finalmente
qtras(V, T) =
(2πmkBT
h2
)3/2
V, (59)
donde hemos tenido en cuenta que a3 = V es el volumen del recipiente. La función de partición traslacional, porlo tanto, depende linealmente del volumen y depende de la temperatura como una potencia T3/2. Estadependencia es el origen de las propiedades más características del gas ideal, como vamos a ver de inmediato.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 34 / 77
Ecuación de estado del gas ideal y energía interna de traslación
De todas las componentes de la función de partición molecular la traslacional es la única que depende delvolumen, y su dependencia es lineal. Por lo tanto, la presión promedio del gas ideal será
p = kBT(∂ ln Q∂V
)N,T
= ... = NkBT(∂ ln qtras
∂V
)N,T
=NkBT
V, (60)
y el resultado es la ecuación de estado del gas ideal. Si n representa el número de moles y N = nNA, donde NAes el número de Avogadro, la ecuación anterior conduce a
pV = nNAkBT = nRT (61)
que es la expresión más habitual de la ley. Vemos así de manera explícita la relación entre la constante deBoltzmann y la constante R de los gases: R = NAkB.La traslacional no es la única contribución a la energía interna, pero sí es la única que podría depender delvolumen. Sin embargo:
〈E〉tras = N 〈ε〉tras = kBT2(∂ ln Q∂T
)N,V
= ... =32
NkBT, (62)
y, por lo tanto, la energía interna del gas ideal es una función que depende exclusivamente de la temperatura.Este es un comportamiento bien conocido en la termodinámica clásica, que nuestra formulación estadística nospermite recuperar.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 35 / 77
Principio de equipartición de la energía I
Los tres grados de libertad traslacionales contribuyen con 32 kBT a la energía interna por partícula. Este
resultado se puede generalizar a otros grados de libertad. Concretamente: Sea un sistema formado por un grannúmero de partículas independientes clásicas cuya energía molecular se expresa como suma de f términoscuadráticos. Cuando este sistema alcanza el equilibrio, la energía media por partícula es f × 1/2kBT.La demostración es sencilla. Si la energía es ε = b1p2
1 + b2p22 + ...+ bf p2
f , donde pi representa una coordenadade posición o de momento, la función de partición molecular será
q =
f∑k
∫ ∞0
e−βbkp21 dpk =
f∑k
12
(π
βbk
)1/2
= (kBT)f/2
(πf
b1b2...
)1/212f
= T f/2C (63)
donde C es una constante. De aquí
〈ε〉 = kBT2(∂ ln q∂T
)N,V
=f2
kBT, (64)
y la capacidad calorífica molar debería ser cv = (∂E/∂T)N,V = f2 R.
En general, la descripción clásica puede considerarse un límite de la genuina descripción cuántica encondiciones de temperatura suficientemente elevada. La consecuencia es que la contribución clásica a laenergía interna sólo se alcanza como caso límite y, dependiendo del tipo de grado de libertad, la contribuciónreal en condiciones ordinarias puede ser mucho menor.Las energías cinéticas de traslación y de rotación toman la forma 1
2 mv2i y 1
2 Iiω2i , respectivamente y, por lo tanto
aportan 12 kBT por cada grado de libertad. Cada vibración, por su parte, aporta el doble, ya que tanto la energía
cinética como la potencial proporcionan el correspondiente término cuadrático: 12 mξ2 + 1
2 kξ2. En una moléculapoliatómica formada por M átomos deberíamos esperar: (a) 3 grados de libertad traslacionales, que aportarían32 kBT; (b) 3 grados de libertad rotacionales (2 si la molécula es lineal) que aportarán 3
2 kBT (ó kBT en lasmoléculas lineales); (c) los restantes 3M − 6 (ó 3M − 5) grados de libertad corresponden a otras tantasvibraciones y cada una aportará kBT en el límite clásico.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 36 / 77
Principio de equipartición de la energía II
De acuerdo con esto, la capacidad calorífica molar de un gas monoatómico debería ser cv = 32 R, lo que
concuerda bien con los experimentos. Para un gas diatómico deberíamos esperar cv = 72 R, aunque los valores
experimentales en condiciones ambiente se aproximan más a 52 R, y la discrepancia entre teoría y experimento
crece aún más a medida que aumenta el número de átomos. La razón es, como veremos después, que serequiere una temperatura muy alta para poblar los estados vibracionales excitados, de modo que los grados delibertad vibracionales no llegan a contribuir plenamente a la capacidad calorífica si no es a estas elevadastemperaturas.Para el gas monoatómico, por otra parte,
H = E + pV =32
NkBT + NkBT =52
NkBT =⇒ Cp =
(∂H∂T
)N,p
=52
NkB. (65)
De aquí
γ =Cp
Cv=
53. (66)
Esta relación se puede determinar con precisión en el laboratorio a partir de la medida de la velocidad delsonido en el gas: vs =
√γRT/M, donde M es la masa molar.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 37 / 77
Entropía traslacional. Ecuación de Sackur-Tetrode: I
La ecuación de la entropía nos permitirá observar uno de los hechos más notorios de la estadística clásica. Lasestadísticas de Maxwell-Boltzmann y MB corregida conducen a diferentes expresiones. Si las partículas sondistinguibles la entropía traslacional será
S = kB ln Q + kBT(∂ ln Q∂T
)N,V
= NkB ln q + NkBT(∂ ln q∂T
)N,V
(67)
=⇒ Stras = NkB ln
(2πemkBT
h2
)3/2
V
(68)
y si son indistinguibles
S = NkB lnqeN
+ NkBT(∂ ln q∂T
)N,V
=⇒ Stras = NkB ln
(2πemkBT
h2
)3/2 VeN
(69)
La diferencia entre ambas expresiones es notable. Sobre todo el hecho de que una dependa de ln V y la otra deln(V/N). La corrección debida a la indistinguibilidad es crucial para asegurar que la entropía sea una magnitudextensiva. Para comprobar esta notable propiedad vamos a examinar un ingenioso experimento mentalpropuesto por Gibbs mucho antes de que la mera existencia de los átomos fuese un hecho experimentalprobado.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 38 / 77
La Paradoja de Gibbs I
Imaginemos dos gases ideales monoatómicos A y B situados, cada unoen su recipiente, en idénticas condiciones de volumen y temperatura (Ien el diagrama adjunto). Rompemos la pared de separación para mez-clar ambos gases en un recipiente de volumen doble, pero sin modificarla temperatura (parte II del diagrama). Podemos calcular el cambio deentropía entre ambas situaciones. Hagamoslo primero de acuerdo conla estadística de Maxwell-Boltzmann original:
NAV T, ,SA
NBV T, ,BS
NA NB+2V T, ,SAB
A B
A+B
(I)
(II)
SI = SA + SB = NAkB ln
(2πemAkBT
h2
)3/2
V
+ NBkB ln
(2πemBkBT
h2
)3/2
V
, (70)
SII = SAB = NAkB ln
(2πemAkBT
h2
)3/2
2V
+ NBkB ln
(2πemBkBT
h2
)3/2
2V
, (71)
∆S = SAB − SA − SB = (NA + NB)kB ln 2. (72)
Si A y B son dos gases diferentes es correcto que el proceso de mezcla produzca un aumento en la entropía delsistema y que este sea, además proporcional al número de partículas involucradas en la mezcla. De hecho, laecuación estadístico de la entropía de mezcla compara bien con los experimentos en gases a baja presión. Elproblema, sin embargo, es que ∆S > 0 incluso cuando A y B son el mismo gas y, por lo tanto, la entropía no esuna magnitud extensiva según la estadística de Maxwell-Boltzmann de partículas distinguibles. Este resultadoestá en clara contradicción con la termodinámica clásica y supuso un claro problema del que Gibbs eraconsciente.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 39 / 77
La Paradoja de Gibbs II
Veamos ahora qué ocurre al repetir el análisis empleando las fórmulas de la estadística de partículasindistinguibles. Si A y B son gases diferentes tendremos:
SA + SB = NAkB ln
(2πemAkBT
h2
)3/2 VeNA
+ NBkB ln
(2πemBkBT
h2
)3/2 VeNB
, (73)
SAB = NAkB ln
(2πemAkBT
h2
)3/2 2VeNA
+ NBkB ln
(2πemBkBT
h2
)3/2 2VeNB
, (74)
∆S = SAB − SA − SB = (NA + NB)kB ln 2, (75)
de manera que se repite el pronóstico de la entropía de mezcla. Sin embargo, si A y B son el mismo gas yNA = NB = N para que no haya diferencia de presión entre los recipientes iniciales:
2SA = 2NkB ln
(2πemkBT
h2
)3/2 VeN
= 2NkB ln
(2πemkBT
h2
)3/2 2Ve2N
= SAB (76)
de donde ∆S = SAB − 2SA = 0: la entropía de mezcla es nula cuando ambos gases son el mismo. Laestadística de Maxwell-Boltzmann corregida para tener en cuenta la indistinguibilidad de las partículaspreserva el caracter extensivo de la entropía.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 40 / 77
Contribución traslacional al potencial químico
El potencial químico es una de las magnitudes fundamentales de la termodinámica química. Siguiendo lasideas de Lewis y Randall, para el gas ideal se adopta la expresión
µ(p, T) = µ(T) + RT ln(p/p), (77)
donde p = 1 bar = 101325 Pa es una presión de referencia. La termodinámica clásica no ofrece ningunaexpresión para µ(T), que debe determinarse experimentalmente. La termodinámica estadística, en cambio, síque permite estimar su valor. De la ecuaciones de los apartados anteriores
µtras = −kBT lnqtras
N= −kBT ln
(2πmkBT
h2
)3/2 VN
(78)
pero V/N = kBT/p para el gas ideal. Tenemos que tener cuidado al comparar las dos expresiones anteriores.Mientras la ecuación de la termodinámica clásica está expresada en moles, la ecuación estadística se refiere amoléculas. Teniendo en cuenta esta diferencia:
µtras(T) = −RT ln
(2πmkBT
h2
)3/2 kBTp
. (79)
En el caso del gas monoatómico, la contribución traslacional es, normalmente, la única contribución relevante.En el caso de los gases diatómicos y poliatómicos también hemos de considerar las contribuciones rotacional yvibracional.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 41 / 77
Distribución de Maxwell de las velocidades moleculares I
En ausencia de un potencial externo, la energía de un sistema de partículas independientes es exclusivamenteenergía cinética. Si utilizamos la descripción que proporciona la mecánica clásica ε = T = 1
2 m(v2x + v2
y + v2z ),
donde m es la masa de la partícula y (vx, vy, vz) son las componentes cartesianas del vector velocidad,~v. Lafracción de población correspondiente a una energía dada será proporcional a la exponencial de Boltzmann,sólo que ahora estamos hablando de una variable contínua. Por lo tanto:
dN(vx, vy, vz)
N= C exp
−
m(v2x + v2
y + v2z )
2kBT
dvx dvy dvz, (80)
describe la fracción de partículas cuya velocidad está comprendida entre vx y vx+dvx, vy y vy+dvy, y vz y vz+dvz.Integrando a todo el rango de velocidades podemos determinar la constante de normalización C:
1 =
∫ +∞
−∞
dN(vx, vy, vz)
N= C
+∞y
−∞
e−m(v2x+v2
y+v2z )/2kBT dvx dvy dvz = C
2πkBT
m
3/2
, (81)
donde hemos usado∫+∞−∞ e−bx2
dx =√π/b (b > 0).
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 42 / 77
El resultado es la distribución de Maxwell de velocidades moleculares:
dN(vx, vy, vz)
N= f (vx)dvx f (vy)dvy f (vz)dvz, f (vx) =
√m
2πkBTe−mv2
x/2kBT, ... (82)
que describe la probabilidad de que una partícula tenga una velocidad comprendida en un entorno diferencialdel valor~v = vx~ı+vy~+vz~k.
En cada dimensión f (vξ) (ξ : x, y, z)describe una campana de Gauss,centrada en torno al valor medio〈vξ〉 = 0 y con una varianza σ2
ξ =
kBT/m. En consecuencia, el valormedio del vector velocidad es nulo〈~v〉 = ~0, lo que puede dar la enga-ñosa impresión de inmovilidad. Nadamás lejos de la realidad, como vere-mos enseguida.
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
−4 −3 −2 −1 0 1 2 3 4
f(v x
) (u
v−1 )
vx (uv)
m/2kT = 1 uv2
= 2 uv2
= 3 uv2
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 43 / 77
La distribución de velocidades moleculares puede expresarse en coordenadas cartesianas, como en laecuación 82, pero también en coordenadas esféricas polares:
dN(vx, vy, vz)
N=
m
2πkBT
3/2
e−m(v2x+v2
y+v2z )/2kBT dvx dvy dvz
=
m
2πkBT
3/2
e−mv2/2kBT v2dv sen θdθdφ =dN(v, θ, φ)
N. (83)
El resultado es una función de distribución que nuestra claramente la simetría esférica del problema. Dicho deotro modo, las partículas se mueven al azar sin que exista ninguna dirección privilegiada de movimiento. Siintegramos con respecto a las coordenadas esféricas,
m2πkBT
3/2
e−mv2/2kBT v2dv∫ π
0sen θdθ
∫ 2π
0dφ =
= 4π
m2πkBT
3/2
e−mv2/2kBT v2dv = f (v)dv =dN(v)
N, (84)
obtenemos la probabilidad de que el módulo de la velocidad de una partícula esté comprendido entre v y v+dv.El resultado es que la función de distribución del módulo de la velocidad es completamente diferente de ladistribución de las componentes cartesianas de la velocidad. El término v2 domina el comportamiento a bajasvelocidades, dando por resultado un incremento cuadrático en el número de moléculas a medida que lavelocidad crece. El término gaussiano, por el contrario, domina la región de velocidades altas, de manera que elnúmero de moléculas en este régimen decae exponencialmente con v. Entre medias la función de distribución
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 44 / 77
f (v) pasa por un máximo cuya posición y altura depende de kBT/m.
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
0 0.5 1 1.5 2 2.5 3
f(v)
(uv
−1 )
v (uv)
m/2kT = 1 uv2
= 2 uv2
= 3 uv2
Podemos obtener más información acerca de esta distribución determinando el valor de tres importantesmedidas centrales: la moda, la media y la media cuadrática. La moda o velocidad más probable correspondeal máximo de la función densidad f (v). De la condición necesaria de máximo:
df (v)dv
= 0 = 4π
m2πkBT
3/2
v
2− 2mv
2kBTv2
e−mv2/2kBT
. (85)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 45 / 77
Es claro que las soluciones v = 0 y v→∞ no corresponden al máximo. Por lo tanto: vmp =√
2kBTm . Por otra
parte, las integrales∫ ∞0
x2n+1e−αx2dx =
n!
2αn+1y
∫ ∞0
x2ne−αx2dx =
(2n−1)!!
2n+1
√π
α2n+1(86)
permiten obtener
〈v〉 =
∫ ∞0
vf (v)dv = 4π
m2πkBT
3/2 ∫ ∞0
v3e−mv2/2kBT dv =
√8kBTπm
(87)
〈v2〉 =
∫ ∞0
v2f (v)dv =3kBT
m=⇒ vcm = vrms =
√〈v2〉 =
√3kBT
m. (88)
La comparación entre estas tres medidas centrales muestra que vmp < 〈v〉 < vrms y que, de hecho, las tres sehallan en una proporción fija:
√2 :√
8/π :√
3. Las tres se representan en la figura adjunta superpuestas a lafunción densidad f (v).
Cuanto más ligeras sean las partículas o mayorla temperatura, tanto mayor será la media delmódulo de velocidad. Si examinamos un gastípico veremos que, en condiciones ambiente, 〈v〉vale miles de km/h. Por lo tanto, el hecho de que〈~v〉 = ~0 no se debe a la inmovilidad sino a queel movimiento molecular se produce al azar y losmovimientos en una dirección compensan con losde la dirección opuesta.
Velocidad molecular media a 298 K y 1 atm.
gas m (g/mol) 〈v〉 (m/s) 〈v〉 (km/h)O2 32 444 1598H2 2 1770 6372
Velocidad de escape terrestre: 11.2 km/s.0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.0 0.5 1.0 1.5 2.0 2.5 3.0
f(v)
(uv
−1 )
v (uv)
vmp
<v>
vcm
m/2kT = 1 uv2
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 46 / 77
Función de partición vibracional
El tratamiento estadístico no requiere, usualmente, una expresión exquisitamente precisa de los nivelesenergéticos. De hecho, resulta suficiente utilizar el modelo de oscilador armónico más rotor rígido, el másbásico de los que desarrollamos al estudiar la rotovibración de las moléculas diatómicas.En el modelo de oscilador armónico, los estados vibracionales de una molécula diatómica AB tienen por energía
εv = (v+1/2)hνe con v = 0, 1, 2, 3, ... (89)
donde νe = 12π
√keµ es la frecuencia de vibración fundamental, ke es la constante de fuerza y
µ = mAmB/(mA+mB) la masa reducida de la molécula. Los niveles vibracionales de la molécula diatómicacarecen de degeneración.La función de partición vibracional será
qvib(T) =
∞∑v=0
exp−
(v+1/2)hνe
kBT
= e−hνe/2kBT
∞∑v=0
e−vhνe/kBT. (90)
Dado que r = e−hνe/kBT < 1, la suma de la ecuación anterior equivale a la suma de los términos de unaprogresión geométrica convergente,
∑∞v=0 rv = 1/(1− r), y
qvib(T) =e−hνe/2kBT
1− e−hνe/kBT=
e−θv/2T
1− e−θv/T, θv =
hνe
kB[=] K. (91)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 47 / 77
Es interesante observar que el numerador de qvib(T) provie-ne de la energía de punto cero, mientras que el denominadorcorresponde a la suma sobre todos los estados. También esimportante comprobar que, como habíamos anticipado, la fun-ción de partición vibracional es independiente del volumen.La figura adyacente representa qvib frente a la temperatura re-ducida Tr = T/θv. Podemos comprobar que, a temperaturasuficientemente alta, qvib crece linealmente con Tr . Y sólo seobserva un crecimiento supralineal en la región Tr < 0,1.
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
q vib
T / θv
La tabla siguiente muestra las temperaturas características de vibración, θv ≈ 102–103 K, de algunas moléculasdiatómicas. La masa reducida tiene un efecto dominante: cuanto más ligera la molécula mayor es θv. El átomomás ligero domina µ en las heterodiatómicas, lo que explica que los hidruros de un mismo período tengantemperaturas reducidas muy similares. Si la masa reducida es semejante, la molécula de enlace más fuerte(mayor ke) es la que posee mayor θv.
H2 D2 OH NH O2 N2 F2 Cl2 Br2 I2θv (K) 6332 4483 5378 4722 2274 3393 1319 805 468 309
Datos procedentes del "NIST WebBook".
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 48 / 77
Entre las propiedades termodinámicas que se derivan de qvib destacan la energía interna y la capacidadcalorífica:
Evib = NkBT2(∂qvib
∂T
)V
= NkBθv
12
+1
eθv/T − 1
, (92)
Cvibv =
(∂Evib
∂T
)V
= NkB
(θv
T
)2 eθv/T(eθv/T − 1
)2 . (93)
A elevadas temperaturas Cvibv tiende al límite clásico del principio de equipartición, pero se necesita que T > θv
para estar cerca de ese límite.
0.5
1.0
1.5
2.0
2.5
3.0
3.5
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Evi
b/N
kθv
T / θv
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Cvvi
b /Nk
T / θv
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 49 / 77
Ocupación en equilibrio de estados vibracionales I
La población en equilibrio de los estados vibracionales es:
fv =1
qvib(T)e−(v+1/2)θv/T
. (94)
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0.0 1.0 2.0 3.0 4.0 5.0
Pob
laci
ón, f
v
Estado vibracional, v
T/θv = 0.2T/θv = 0.5T/θv = 1.0T/θv = 1.5
La máxima población co-rresponde siempre al esta-do fundamental v = 0 y de-cae exponencialmente conv. El aumento de la tem-peratura aumenta la pobla-ción de los estados exci-tados. En condiciones am-biente, muchas moléculasdiatómicas tienen una po-blación despreciable en losestados excitados, como lafigura de la página siguien-te muestra claramente.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 50 / 77
Ocupación en equilibrio de estados vibracionales II
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0 200 400 600 800 1000 1200 1400
Pob
laci
ón e
n es
tado
s ex
cita
dos,
1−
f 0
Temperatura, T (K)
H2D2F2
Cl2Br2I2
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 51 / 77
Vibración en moléculas poliatómicas
En la aproximación armónica, una molécula de N átomos dispone de 3N − 6 modos normales independientesde vibración (3N − 5 si es lineal), que se pueden describir como osciladores armónicos. Cada modo normal dolugar a un número cuántico vibracional y tiene una frecuencia característica, aunque puede haber dos o másmodos de igual frecuencia. La energía vibracional total es
εvib ≈3N−6∑
i=1
εi =
3N−6∑i=1
(vi−1/2)hνi, (95)
de modo que la función de partición vibracional y la capacidad calorífica vibracional son
qvib(T) ≈3N−6∏
i=1
qi =
3N−6∏i=1
e−θi/2T
1− e−θi/T, Cvib
v ≈ NkB
3N−6∑i=1
(θi
T
)2 eθi/T(eθi/T − 1
)2 . (96)
H2O νi (cm−1) θi (K)1 a1 sym. str. 3825.32 55042 a1 sym. bend. 1653.91 23803 b1 asym. str. 3935.59 5662
CH4 νi (cm−1) θi (K)1 a1 sym. str. 2917.0 41972 e sym. bend. 1533.6 22063 t2 asym. str. 3019.5 43444 t2 asym. bend. 1306.2 1879
Datos procedentes del "NIST WebBook":
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 52 / 77
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0 1000 2000 3000 4000 5000 6000
Cvvi
b /Nk
T (K)
H2O
0.000.050.100.150.200.250.300.35
0 100 200 300 400 500 600
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 53 / 77
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Cvvi
b /Nk
T (K)
CH4
0.000.100.200.300.400.500.600.700.800.901.00
0 100 200 300 400 500 600
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 54 / 77
Función de partición rotacional (diatómica heteronuclear) I
Usaremos un modelo de rotor rígido para determinar las energías de los estados rotacionales. Por lo tanto:
• estados rotacionales : |JM〉 , J = 0, 1, 2, ..., M = 0,±1, ...,±J,
• energía : εJ = hBeJ(J + 1), Be =h
8π2µR2e
[=] s−1, (97)
• degeneración : gJ = 2J + 1.
La función de partición rotacional vendrá dada por
qrot(T) =
∞∑J=0
(2J+1)e−J(J+1)θr/T, θr =
hBe
kB[=] K. (98)
No hay una expresión analítica para la suma sobre J, como ocurre en el caso vibracional, pero la suma directaconverge rápidamente y es simple de evaluar con un sencillo programa informático. Además, si la temperaturaes T > θr resulta apropiado sustituir el sumatorio por una integración:
qrot(T) ≈∫ ∞
0(2J+1)e−J(J+1)θr/T dJ =
Tθr. (99)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 55 / 77
La integral anterior forma parte de la llamada fórmula de Euler-MacLaurin para la suma de los términos deuna serie. Si f (n) es una función definida para una variable entera n, pero que se comporta como una funcióncontínua en todo el intervalo real [a, b]:
b∑n=a
f (n) =
∫ b
af (x)dx +
12f (a) + f (b)+
∞∑j=1
(−1)j B∗j(2j)!
f (2j−1)
(a)− f (2j−1)(b), (100)
donde f k(a) es la derivada k-ésima en x = a, y los B∗j son los números de Bernoulli: B∗1 = 1/6, B∗2 = 1/30,B∗3 = 1/42, B∗4 = 1/30, B∗5 = 5/66, B∗6 = 691/2730, B∗7 = 7/6, B∗8 = 3617/510, ...Aplicada al caso de la función de partición rotacional, la fórmula de Euler-MacLaurin conduce a:
qrot(T) =Tθr
1 +
13
(θr
T
)+
115
(θr
T
)2
+4
315
(θr
T
)3
+1
315
(θr
T
)4
+ ...
. (101)
Bajo cualquiera de las expresiones 98, 99 y 101, podemos ver en la figura siguiente que qrot es una funciónuniversal de la temperatura reducida Tr = T/θr . Para temperaturas suficientemente altas (T > θr), la función departición rotacional crece linealmente con Tr . En este régimen la integral simple, ec. 99, es apropiada ya que,aunque difiere en una constante de la verdadera qrot, esta diferencia desaparece al derivar para obtener laspropiedades termodinámicas del gas. En el régimen T < θr la función de partición crece como una potenciaelevada de Tr . En estas circunstancias la aproximación lineal no es válida, la aproximación de Euler-MacLaurinnecesita cada vez más términos a medida que la temperatura desciende, y la única forma válida de obtener qrotes realizar directamente la suma sobre niveles, ec. 98.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 56 / 77
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
qro
t
T / θr
exactoT/θr
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 57 / 77
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
qro
t
T / θr
exactoT/θr
La temperatura característica de rotación, θr , se encuentra en el rango 10−2–101 K para la mayoría demoléculas pequeñas. Por lo tanto, la temperatura ambiente es elevada en términos rotacionales, no comoocurre con la vibración. La masa reducida y el tamaño molecular determinan la temperatura de rotación:
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 58 / 77
θr ∝ µ−1, θr ∝ R−2e . Moléculas pequeñas y con, al menos, un átomo ligero presentan los valores más
elevados, al contrario que las moléculas grandes y formadas por átomos pesados.
OH NH CO NO IClθr (K) 27.21 24.03 2.779 2.406 0.1642
H2 D2 O2 N2 F2 Cl2 Br2 I2θr (K) 87.55 43.80 2.068 2.875 1.281 0.3510 0.1181 0.05377
Datos procedentes del "NIST WebBook":En las dos figuras siguientes vemos la contribución rotacional a la energía interna y capacidad calorífica. Susexpresiones son simples de obtener a partir de la ecuación 98, aunque prolijas. Ambas son funcionesuniversales de Tr = T/θr . El comportamiento de Crot
v es particularmente interesante. Partiendo de un valor nuloa 0 K, la capacidad calorífica crece como una sigmoide con T, acercándose al límite clásico del principio deequipartición Crot
v → NkB, que se alcanza hacia T ≈ 2θr . Lo más llamativo es que Crotv llega a superar este valor
y tiende al límite desde arriba. Este comportamiento de la rotación es diferente al de otros grados de libertad.Desde un punto de vista práctico, Crot
v ≈ NkB para la mayoría de moléculas diatómicas heteronucleares encondiciones ambiente.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 59 / 77
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Ero
t/N
kθ
r
T / θr
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 60 / 77
0.0
0.2
0.4
0.6
0.8
1.0
1.2
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Cvro
t /Nk
T / θr
El extraño comportamiento de Crotv se puede explicar como consecuencia del modo en el que se pueblan los
estados rotacionales. La población en equilibrio de cada estado viene dada por
fJ =1
qrot(T)(2J + 1)e−J(J+1)θr/T
. (102)
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 61 / 77
El término lineal que describe la degeneración domina el comportamiento a pequeños valores de J, mientrasque el término exponencial decreciente se encarga de asegurar que fJ → 0 al aumentar J. A medida queaumenta el número cuántico rotacional la población fJ aumenta, pasa por un máximo y tiende, finalmente, adecrecer exponencialmente hasta cero. A diferencia de lo que sucede para otros grados de libertad (p. ej. lavibración) el estado más poblado no es el fundamental, salvo a temperaturas muy bajas (T θr). Estecomportamiento se observa claramente en la figura de la página siguiente.Las poblaciones rotacionales dependen únicamente de la temperatura relativa Tr = T/θr . Cuanto mayor Tr ,mayor es la población de los estados excitados y mayor el valor de J del estado más poblado. Suponiendo quela función fJ(J) está definida en un contínuo podemos determinar fácilmente el estado rotacional más poblado:
(condición necesaria de máximo)dfJdJ
= 0 =⇒ 2Jmax + 1 =
√2Tθr. (103)
Como vemos, Jmax es proporcional a la raíz cuadrada de la temperatura reducida. Para T fija Jmax ∝√µ.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 62 / 77
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pobla
ció
n, f J
Estado rotacional, J
T/θr = 1
5
10
50
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 63 / 77
0
5
10
15
20
25
30
35
40
0 200 400 600 800 1000 1200 1400
Esta
do
má
s p
ob
lad
o,
Jm
ax
Temperatura, T (K)
OH
NH
CO
NO
ICl
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 64 / 77
La población de los estados rotacionales domina el as-pecto de los espectros de rotación y rotovibración. Eneste caso se trata de la transición v : 0 → 1 de la mo-lécula de CO. Las ramas P y R están formadas por lastransiciones J → J +1 y J +1→ J, respectivamente. Laidentificación del estado más poblado, Jmax permite de-terminar la temperatura a que estaba el gas CO durantela medida.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 65 / 77
orto- y para-H2) I
Hacia 1925 se observó que la capacidad calorífica del H2 se comporta anómalamente a muy bajastemperaturas. F. Hund [Z. Physik, 42 (1927) 93] buscó una explicación basada en los requisitos de simetría de lafunción de onda total. Los dos núcleos Ha y Hb son protones y tienen espín nuclear I = 1/2. Por lo tanto, lafunción de onda completa
Ψ = ψtras ψvib ψrot ψelec ψnucl, (104)
debe ser antisimétrica frente al intercambio de un núcleo por otro, dejando inalterados los electrones delsistema. Sólo las componentes rotacional y nuclear de Ψ se ven afectadas por el cambio de núcleos:
ψrot es (a) simétrica en los estados de J par (J = 0, 2, 4, ...), y (b) antisimétrica en los de J impar (J =1, 3, 5, ...);ψnucl, por su parte, puede ser
simétrica si los espines de ambos núcleos se acoplan para producir un triplete, αα, ββ, (αβ +
βα)/√
2;antisimétrica si los espines nucleares se acoplan dando un singlete, (αβ − βα)/
√2.
Por lo tanto, las funciones rotacional y nuclear pueden existir en dos formas compatibles:
para-hidrógeno (p-H2), formada por moléculas con J par y espines nucleares acoplados en un singlete,orto-hidrógeno (o-H2), cuyas moléculas tiene J impar y espines nucleares acoplados en triplete.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 66 / 77
orto- y para-H2) II
En el equilibrio, la función de partición roto-nuclear del H2 será
qrot−nucl = gpara︸︷︷︸=1
∞∑J=0par
(2J + 1)e−J(J+1)θr/T+ gorto︸︷︷︸
=3
∞∑J=1impar
(2J + 1)e−J(J+1)θr/T, (105)
donde gpara y gorto son las degeneraciones asociadas al estado de acoplamiento de los núcleos. A partir de estafunción de partición se obtiene fácilmente la capacidad calorífica, que difiere marcadamente de las medidasexperimentales.En 1927, esta discrepancia sirvió como una fuerte evidencia en contra de la incipiente mecánica cuántica hastaque P. M. Denison [Proc. Royal Soc. (London) A115 (1927) 483] logró explicar satisfactoriamente la anomalía.En condiciones de equilibrio, la proporción de moléculas de orto- y parahidrógeno será
Norto
Npara=
3∑impar
J=1 (2J + 1)e−J(J+1)θr/T
1∑par
J=0(2J + 1)e−J(J+1)θr/T. (106)
En el límite de T → 0, todas las moléculas estarán en el estado J = 0 y, por tanto, tendremos p-H2. AT > 200 K, la degeneración nuclear será dominante y tendremos una proporción 3:1 de orto:para. Pero éstosólo es cierto si hay equilibrio termodinámico entre ambas formas. Denison conjeturó que la conversión entrelas formas orto y para es lenta, lo bastante para que la mezcla con la que se comience el experimentomantenga su composición a todas las temperaturas. Por lo tanto, si comenzamos con el gas ambiente ordinario,su capacidad calorífica rotonuclear debería ser 0,25Cpara
V + 0,75CortoV , y esta ecuación explica perfectamente los
experimentos ordinarios.Posteriormente se comprobó que la mezcla ambiente puede ser mantenida a temperaturas muy bajas duranteperíodos de años sin que se produzca un cambio apreciable en su composición. La razón de que la conversiónorto-para sea dificil proviene de la obligada conservación del momento angular. Básicamente, un tercer cuerpodebe recibir el momento angular del que se desprende la molécula de H2. Impurezas paramagnéticas, sin
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 67 / 77
orto- y para-H2) III
embargo, actúan como catalizadores en el intercambio orto-para, y esto permite en la práctica obtener p-H2puro y medir sus propiedades.La conversión de la mezcla ambiente en parahidrógeno a muy bajas temperaturas desprende una gran cantidadde calor (670 J/g), sobre todo en comparación con el calor latente de evaporación (440 J/g). Por ello, latransformación a parahidrógeno es responsable de graves pérdidas en el almacenamiento de hidrógeno líquido:hasta un 30 % en 48h, 56 % en 170h, 68 % en 3500h. Para evitarlo, se introducen catalizadores paramagnéticosque favorecen la conversión en parahidrógeno mientras se produce la liquefación. Por ejemplo, en presencia deCrO3 el tiempo de vida media del ortohidrógeno a 30 K pasa desde años a ≈5 min.Otras moléculas diatómicas homonucleares pueden tener comportamientos de similar complejidad, pero senecesita una θr suficientemente alta y que el sistema se mantenga como gas en las cercanías de T ≈ θr . El D2cumple también las condiciones y está bien estudiado.
núclido 1H 2H 3H 12C 13C 14N 15N 16O 17O 18OI 1/2 1 1/2 0 1/2 1 1/2 0 5/2 2
abundancia ( %) 99.985 0.015 — 98.89 1.11 99.634 0.366 99.762 0.038 0.200
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 68 / 77
orto- y para-H2) IV
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 69 / 77
orto- y para-H2) V
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 70 / 77
orto- y para-H2) VI
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 71 / 77
Para temperaturas superiores a ≈ 1,5θr la función de partición rotacional se puede simplificar sustituyendo lasuma por una integración sobre J. El resultado es que para una molécula diatómica homonuclear:
qrot ≈12
Tθr, (107)
donde el factor 1/2 proviene de que sólo la mitad de los estados rotacionales contribuye en cualquiera que sea elestado nuclear.Esta expresión se puede generalizar a moléculas poliatómicas:
qrot ≈1σ
Tθr
para una molécula lineal, (108)
qrot ≈1σ
(πT3
θaθbθc
)1/2
para una molécula no lineal, (109)
donde σ es el número de simetría, y equivale al número de diferentes configuraciones nucleares que sepueden alcanzar empleando exclusivamente rotaciones. De modo alternativo, σ equivale al número deoperaciones que son rotaciones puras (no rotaciones impropias) en el grupo puntual molecular. Lastemperaturas características de rotación provienen de los tres momentos de inercia independientes que tiene,como máximo, una molécula poliatómica:
Ae =h
8π2Ia, Be =
h8π2Ib
, Ce =h
8π2Ic, θa =
hAe
kB, θb =
hBe
kB, θc =
hCe
kB. (110)
CO2 H2O NH3 ClO2 SO2 N2O NO2 CH4 CH3Cl CCl4Sim. D∞h C2v C3v C2v C2v C∞v C2v Td C3v Td
σ 2 2 3 2 2 1 2 12 3 12θa (K) 0.561 40.1 13.6 2.50 2.92 0.603 11.5 7.54 7.32 0.0823θb (K) — 20.9 13.6 0.478 0.495 — 0.624 7.54 0.637 0.0823θc (K) — 13.4 8.92 0.400 0.422 — 0.590 7.54 0.637 0.0823
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 72 / 77
En función de sus propiedades rotacionales las moléculas se denominan:
trompoesféricas si θa = θb = θc. La presencia de dos o más ejes de simetría Cn>2 obliga a este compor-tamiento.tromposimétricas si dos de las temperaturas de rotación coinciden. Este fenómeno suele ser consecuen-cia de la existencia de un único eje de simetría Cn>2. Si θa = θb > θc se trata de un trompo achatado, yse denomina trompo alargado si θa > θb = θc.trompoasimétricas si θa > θb > θc. Este es el comportamiento de las moléculas que poseen, comomáximo, ejes de rotación binarios.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 73 / 77
Equilibrio químico entre gases ideales I
Sea una reacción en equilibrio aA + bB pP + qQ, ó mejor∑
i νiXi = 0, donde νi es el coeficienteestequimétrico del reactante i-ésimo, con el convenio de que νi < 0 para los reactivos y νi > 0 para losproductos.Por la condición general de equilibrio la actividad química debe ser nula:
∑i νiµi = 0, donde µi es el potencial
químico del reactante.Si todos los componentes se pueden describir como gases ideales, la función de partición canónica de lamezcla reactante será:
Q(NA,NB, ..., T, V) =qA(V, T)NA
NA!
qB(V, T)NB
NB!... (111)
de manera que el potencial químico del gas A en la mezcla será
µA = −kBT(∂ ln Q∂NA
)T,V,Nj 6=A
= −kBT lnqA(T, V)
NA. (112)
Sustituyendo la forma del potencial químico en la ecuación general del equilibrio:
0 =∑
i
νiµi = −kBT∑
i
νi lnqi
Ni= −kBT
∑i
ln(
qi
Ni
)νi= −kBT ln
∏i
(qi
Ni
)νi, (113)
de donde ∏i
(qi
Ni
)νi= 1 =⇒
∏i
(qi
V
)νi=∏
i
(Ni
V
)νi= Kc, (114)
siendo Kc la constante de equilibrio expresada en términos de concentraciones ci = Ni/V.La función de partición molecular de un gas ideal es lineal en V, de modo que qi(V, T)/V y, por lo tanto Kc, essólo función de la temperatura.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 74 / 77
Equilibrio químico entre gases ideales II
En gases es frecuente expresar la constante de equilibrio en términos de presiones parciales de loscomponentes, pero piV = NikBT, y
Kp =∏
i
pνii = (kBT)
∑i νi∏
i
(Ni
V
)νi= (kBT)
∑i νi Kc(T). (115)
Ej: Equilibrio en el vapor de sodio
REACCIÓN: 2Na Na2. (116)
CONSTANTE DE EQUILIBRIO: Kc(T) =qNa2/V
(qNa/V)2, Kp =
pNa2
p2Na
=1
kBTKc(T). (117)
FUNCIONES DE PARTICIÓN: qNa =
(2πmNakBT
h2
)3/2
Vqel, (118)
qNa2 =
(2π2mNakBT
h2
)3/2
VT
2θr
geleD0/kBT
1− e−θv/T, (119)
DATOS DEL NA: mNa = 22,989768 g/mol = 3,81754× 10−22 g. Estado fundamental 2S1/2 (gel = 2) y primerexcitado a 16000 cm−1, que podemos ignorar.DATOS DEL NA2 : θr = 0,221 K, θv = 229 K, D0 = 17,3 kcal/mol, D0/kB = 8706 K. Estado fundamental 1Σ+
g(gel = 1) y estados electrónicos a energías muy elevadas, que podemos ignorar.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 75 / 77
Ejercicios I
1 Sea un gas formado por NA partículas de A, NB partículas de B, etc. Supongamos que las interaccionesentre partículas son nulas o despreciables. Determina la función de partición canónica del gas en términosde las funciones de partición moleculares qA(V, T), qB(V, T), ...
2 Haciendo uso de la ecuación de estado del gas ideal y del principio de equipartición de la energía, calcula larazón entre el número de partículas y el de estados accesibles, N/Φ(ε), para los gases nobles: He, Ne, Ar,Kr, Xe. Varía la temperatura en el rango 10–300 K, y la presión en el rango 0.1–10 atm. Dibuja en gráficostus resultados más interesantes.
3 Calcula la población, relativa a la del nivel fundamental, de un nivel excitado situado 10, 100, 1000, 10000 cm−1
por encima de aquél. Supón que no hay degeneración y que la temperatura es 300 K.4 Considera un átomo de He moviéndose en una sóla dimensión y encerrado en una caja de 1 cm de lado.
De acuerdo con el principio de equipartición de la energía en el equilibrio térmico εtras = 12 kBT. Determina
el valor de número cuántico n para T = 300 K. Determina también el valor del cociente ∆ε/kBT si ∆ε es ladiferencia de energía entre los estados n y n + 1. Repite el cálculo para los átomos de Ne, Ar y Kr, y paralas temperaturas 10 K, 100 K y 1000 K.
5 Examina las dimensiones de Λ =√
h2/2πmkBT. ¿Encuentras una razón para que esta magnitud se deno-mine en ocasiones “longitud de de Broglie del cuanto térmico”? Determina el valor de Λ a 300 K para: unelectrón, un átomo de He, una molécula de benceno, un virus.
6 Considera la molécula de O2. El nivel electrónico fundamental es 3Σ−g , y su energía mínima se tomacomo cero para este ejercicio. Los tres primeros niveles excitados son de simetría 1∆g, 1Σ+
g y 3Σ+u , y
sus energías mínimas se encuentran 0.035915, 0.059783 y 0.162720 Eh, respectivamente, por encima delnivel fundamental. Calcula las temperaturas a las que deberíamos calentar un gas de O2 para conseguirque la población relativa de cada uno de estos niveles alcance un 1 % respecto de la población del nivelfundamental. La frecuencia de vibración del estado electrónico fundamental es νe = 1580 cm−1. Calcula lafracción de moléculas en el estado vibracional fundamental y en el primer excitado a 300 K. La distancia deequilibrio en este estado es de 1.2074 Å. Calcula las poblaciones de los cinco primeros niveles rotacionalesexcitados relativas a la del estado fundamental a 300 K.
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 76 / 77
Ejercicios II
7 Considera los niveles (no estados) de energía ε1, ε2, ... en orden creciente de energías. ¿En qué circuns-tancias es posible que en un sistema en equilibrio haya más moléculas en el nivel ε2 que en el ε1?
V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 77 / 77
Lección 3: COLECTIVOS Y FUNCIONES DE PARTICIÓN MOLECULARES
El colectivo canónico. Relación de Q con q en un gas ideal. Niveles de energía
molecular. Función de partición rotacional: diatómicas. Función de partición
rotacional: poliatómicas. Función de partición vibracional. El teorema de
equipartición. Función de partición electrónica.
En esta lección vamos a dar los conceptos y expresiones matemáticas que permiten
relacionar la descripción microscópica de las moléculas individuales con las
propiedades macroscópicas de un conjunto de moléculas.
El colectivo canónico
Un colectivo o conjunto es una colección de unidades idénticas o réplicas de un
sistema. Por ejemplo, un mol de agua se puede concebir como un conjunto de un
número de Avogadro de unidades idénticas de moléculas de agua. El colectivo
proporciona el marco teórico que sirve para relacionar las propiedades
microscópicas de la materia con las correspondientes propiedades
termodinámicas del sistema, tal y como expresa el siguiente postulado:
El valor medio de una propiedad del conjunto corresponde al valor promediado en el
tiempo de la correspondiente propiedad macroscópica del sistema.
Esto significa que si medimos al mismo tiempo el contenido de energía de cada una
de las unidades que constituyen un conjunto, la energía media del conjunto
obtenida a partir de estas energías será equivalente a la energía media del
conjunto, medida a lo largo del tiempo. Esta idea, formulada por primera vez por J.
W. Gibbs a finales de 1800, es el núcleo de la Termodinámica Estadística.
Para conectar los valores medios del colectivo con las propiedades
termodinámicas, comenzamos imaginando una colección de copias idénticas del
sistema, como se ilustra en la Figura 3.1. Estas copias del sistema se mantienen
fijas en el espacio, de forma que son distinguibles. El volumen, V, la temperatura, T,
y el número de partículas de cada sistema, N, son constantes. Un colectivo o
conjunto en el que V, T y N son constantes se conoce como conjunto canónico. El
término canónico significa “por la práctica común” debido a que este es el conjunto
que se emplea, salvo que el problema de interés requiera que se mantengan
constantes otras variables. Por ejemplo, si N, V y la energía se mantienen fijas, el
correspondiente colectivo se denomina microcanónico. Sin embargo, para los
propósitos de esta asignatura es suficiente el conjunto canónico.
Figura 3.1. Representación de un colectivo canónico. Las flechas indican que el
conjunto está compuesto por un número infinito de copias del sistema.
En el colectivo canónico, cada miembro del conjunto se introduce en un baño a
temperatura tal que la energía del conjunto total es constante. Las paredes que
definen el volumen de las unidades pueden conducir el calor, permitiendo el
intercambio de energía con el medio. Por analogía con lo que vimos en la lección
anterior, la energía total del colectivo, Ec, está dada por
∑ (3.1)
donde a(c)i son los números de ocupación correspondientes al número de
miembros del conjunto que tienen energía Ei. El peso, Wc, asociado a una
configuración de energía específica de los Nc miembros del conjunto, está dado por
!∏ !
(3.2)
y la probabilidad de encontrar una unidad del conjunto con energía Ei es
(3.3)
donde Wi se puede interpretar como el número de estados presentes con una
energía dada Ei. La cantidad Q de la ecuación (3.3) se conoce como función de partición canónica y se define como:
∑ (3.4)
donde el sumatorio se extiende a todos los niveles de energía.
La probabilidad definida en la ecuación (3.3) depende de dos factores: número de
estados presentes con una energía dada (Wi) y término de Boltzmann que describe
la probabilidad de que una unidad del conjunto tenga energía Ei (e-βEi/Q). La Figura
3.2 describe el comportamiento de cada factor con la energía. El primer factor
aumenta con la energía mientras que el segundo factor decrece exponencialmente.
El producto de estos términos pasa por un máximo correspondiente a la energía
del conjunto medio. Esto significa que las unidades individuales del conjunto
tendrán una energía igual o muy próxima a la energía media, <E>, y que serán muy
raras las unidades que tengan una energía alejada de ese valor. Por ejemplo, si
consideramos una piscina de baño llena de agua, dividida en unidades de un litro,
la temperatura medida en una de esas unidades de la piscina es suficiente para
caracterizar la temperatura del agua en cualquier parte de la piscina.
Figura 3.2. Variación de la probabilidad de que un miembro del colectivo tenga
una energía dada Ei con dicha energía.
Dado que la gran mayoría de sistemas del conjunto tienen energía <E>, las
propiedades termodinámicas de la unidad son representativas de las propiedades
termodinámicas del colectivo, demostrándose así la relación entre las unidades
microscópicas y el conjunto macroscópico. Para expresar matemáticamente esta
conexión, se debe relacionar la función de partición canónica, Q, con la función de
partición que describe los miembros individuales del colectivo o conjunto, q.
Relación de Q con q en un gas ideal
Consideremos, tal y como se muestra en la Figura 3.3, un colectivo constituido por
dos sistemas distinguibles A y B. Cada uno de estos sistemas está constituido por
partículas “ideales” independientes cuyas interacciones son despreciables (por
ejemplo, un gas ideal). La función de partición Q de este colectivo viene dada por
∑ ∑ !"## (3.5)
donde εAn y εBn son los niveles de energía asociados a las unidades A y B,
respectivamente.
Figura 3.3. Colectivo constituido por dos unidades A y B distinguibles.
La suma sobre los niveles de energía del colectivo de la ecuación (3.5) puede
reproducirse considerando todos los niveles energéticos individuales de cada
sistema. Así, en lugar de sumar sobre los niveles energéticos i del colectivo,
podemos sumar sobre todos los niveles individuales del sistema A y todos los
niveles individuales del sistema B. En consecuencia, la ecuación (3.5) se
transforma en:
$ !$" % $ !&" % $ !'" % ⋯ (3.6)
%& !$" % & !&" % & !'" % ⋯
%' !$" % ' !&" % ' !'" % ⋯
·········································································
% !$" % !&" % !'" % ⋯
$ % & % ' % ⋯ "!$ % !& % !' % ⋯ "
)*)+ ),
Si las unidades del conjunto son idénticas, las funciones de partición también lo
son. Extendiendo este resultado a un colectivo de N unidades distinguibles, la
función de partición canónica es el producto de las funciones de partición de las
unidades.
) para N unidades distinguibles (3.7)
El tamaño de los sistemas idénticos que componen el conjunto puede ser tan
pequeño como se desee, hasta el punto de ser una única molécula. Tomando el
límite de una única molécula, el colectivo canónico viene a ser el producto de las
funciones de partición molecular definidas tal y como se hizo en la lección anterior.
Esta es la conexión directa entre las perspectivas microscópicas y macroscópicas
que estábamos buscando. Los niveles de energía cuantizados del sistema molecular
(o atómico) están embebidos en la función de partición molecular, q, y esta
función de partición se puede usar para definir la función de partición del
conjunto, Q, que puede relacionarse directamente con las propiedades
termodinámicas del conjunto.
La deducción anterior supone que los miembros del conjunto son distinguibles,
pero ¿qué ocurre en el caso de unidades indistinguibles? Según discutimos en el
caso del estudio de tres osciladores distinguibles situados en tres estados de
energía, la configuración dominante denotada por (2,1,0) consta de seis
microestados: (2,1,0), (2,0,1), (1,2,0), (0,2,1), (1,0,2) y (1,2,0). Sin embargo, si los
tres osciladores son indistinguibles, no hay diferencia entre las disposiciones
anteriores, de modo que sólo contaremos una única disposición de la energía. Por
tanto, en el caso de unidades indistinguibles, el número total de permutaciones se
divide por N! donde N era el número de unidades de la colección. La extensión de
esta lógica a un conjunto molecular obliga a que la función de partición canónica
para partículas indistinguibles tenga la forma siguiente:
-.! para N unidades indistinguibles (3.8)
La ecuación (3.8) es correcta en el límite en que el número de niveles de energía
disponibles es significativamente mayor que el número de partículas. Esta
discusión de Mecánica Estadística está limitada a sistemas en los que esto es cierto,
y la validez de este enunciado se demostrará más tarde en este capítulo. Es
también importante tener en mente que la ecuación (3.8) se limita a sistemas
ideales de partículas que no interaccionan entre sí, tales como las de un gas ideal.
Niveles de energía molecular
La función de partición molecular se puede evaluar considerando los niveles de
energía moleculares. Para moléculas poliatómicas, hay cuatro grados de libertad energéticos a considerar al construir la función de partición molecular: traslación
(tras), rotación (rot), vibración (vib) y electrónico (elec).
Suponiendo que los grados de libertad energéticos no están acoplados, la función
de partición molecular total, que incluye todos esos grados de libertad, se puede
descomponer en un producto de funciones de partición correspondientes a cada
grado de libertad. La energía asociada a un nivel de energía molecular dado, εtotal,
dependerá de las energías de los niveles traslacional, rotacional, vibracional y
electrónico, como sigue:
εtotal = εtras + εrot + εvib + εelec (3.9)
Dado que la función de partición molecular es un sumatorio sobre los niveles de
energía moleculares y teniendo en cuenta la ecuación (3.9), entonces:
)/0/1 ∑ 2/0/134356 (3.10)
∑2/78270/29:21 3;5<6 ;43 => ?6?
∑2/783;5<"270/;43"29:=>"21?6?"
)/78)70/)9:)1
Esta relación demuestra que la función de partición molecular total es
simplemente el producto de las funciones de partición de cada grado de libertad
energético molecular. Usando esta definición para la función de partición
molecular, las relaciones finales son
/0/1 )/0/1 (distinguible) (3.11)
/0/1 @! )/0/1 (indistinguible) (3.12)
A continuación, deduciremos las funciones de partición de cada grado de libertad
de la ecuación (3.10), teniendo en cuenta los resultados de la resolución de la
ecuación de Schrödinger para la partícula en una caja, rotor rígido y oscilador
armónico. Estos sistemas, como veremos, son modelos teóricos aceptables que
ayudan a representar los movimientos moleculares de traslación, rotación y
vibración, respectivamente.
Función de partición traslacional
Los niveles de energía correspondientes al movimiento traslacional de átomos o
moléculas en un recipiente de volumen V vienen dados por las energías de la
partícula en una caja tridimensional. En lugar de trabajar directamente en tres
dimensiones, primero usaremos un modelo unidimensional y después lo
extenderemos a tres dimensiones. Los niveles de energía para una partícula de
masa m que se mueve libremente en una caja monodimensional de longitud a
están descritos en la Figura 3.4.
Figura 3.4. Niveles de energía para la partícula en una caja monodimensional.
Utilizando la expresión de la energía mostrada en la Figura 3.4, la función de
partición traslacional en una dimensión es
)/78,@B ∑ 'C'DE5'F@ (3.13)
Este sumatorio consta de un número infinito de términos y además, no existe una
expresión analítica para esta serie infinita de términos. Por ello, la ecuación (3.13)
tiene que evaluarse considerando todos los términos. Sin embargo, esta tarea
puede simplificarse notablemente analizando el espaciado entre los estados de
energía traslacional del siguiente ejemplo.
PROBLEMA PRÁCTICO 3.1 ¿Cuál es la diferencia de energía entre los estados n=2 y n=1 del oxígeno molecular
que está restringido en una caja unidimensional de longitud 1 cm?
Solución
La diferencia de energía entre los estados puede evaluarse a partir de la expresión
de la Figura 3.4 como sigue:
∆ , − @ 3@ 3ℎ,
8L,
La masa de una molécula de O2 es 5,31 × 10-25 kg de forma que
∆ 36,626 P 10STU V,
85,31 P 10,XY20,01 L, 3,10 P 10SZU
Convirtiendo a unidades cm−1:
∆ 3,10 P 10SZU
ℎ[ 3,10 P 10SZU6,626 P 10STU V2,998 P 10@][L V@
1,57 P 10@X[L@
A 298 K, la cantidad de energía térmica disponible dada por el producto de la
constante de Boltzmann y la temperatura, kT, es 208 cm-1. Claramente, el
espaciado entre los niveles de energía traslacional es extremadamente pequeño en
relación a kT a temperatura ambiente.
Debido a que son accesibles numerosos niveles de energía traslacionales a
temperatura ambiente, el sumatorio de la ecuación (3.13) se puede reemplazar por
una integración con un error despreciable:
)/78 ∑ _#' ≈F@ a _#'bc @,
F] d e
_f@/, (3.14)
siendo
h i'Zj' (3.15)
Sustituyendo α, la función de partición traslacional en una dimensión es
)/78,@B d,eji' f@/, (3.16)
Esta expresión se puede simplificar definiendo la longitud de onda térmica de de Broglie como sigue:
Λ d i' ,ejf (3.17)
de forma que
)/78,@B l 2mLYn@/,
i (3.18)
Λ es el cociente entre la constante de Planck (h) y el momento promedio clásico (p)
de una partícula de gas.
La extensión del resultado unidimensional a tres dimensiones es directa. Los
grados de libertad traslacional se consideran separables; por tanto, la función de
partición traslacional tridimensional es el producto de las funciones de partición
unidimensional para cada una de las dimensiones:
)/78,SB )/78,o)/78,p)/78,q drl f ds
l f dtl f
d@lfS op"q d@
lfS u
)/78,SB vlw 2mLYnS/, v
iw (3.19)
donde V es el volumen. En la ecuación (3.19) puede observarse que la partición
traslacional es función de V y T. Según vimos, la función de partición proporciona
una medida del número de estados de energía disponibles del sistema a una
temperatura dada. El aumento de qtras con el volumen refleja el hecho de que
conforme el volumen crece, el espaciado de los niveles de energía traslacional
decrece de forma que hay más estados disponibles para poblar a una T dada. El
pequeño espaciado de energía entre los niveles de energía traslacionales con
relación a kT a temperatura ambiente sugiere que a temperatura ambiente son
accesibles un número significativamente alto de estados de energía traslacional.
Función de partición rotacional: diatómicas
Los niveles energéticos de la función de partición rotacional vienen descritos por la
solución de la ecuación de Schrödinger para el rotor rígido. Por simplicidad,
consideremos una molécula diatómica (véase Figura 3.5) cuya longitud de enlace
(r) se supone que permanece constante durante el movimiento rotacional y se
desprecian efectos tales como la distorsión centrífuga.
Figura 3.5. Representación esquemática de una molécula diatómica.
Dentro de la aproximación del rotor rígido, la energía de un estado rotacional
dado, EJ, de una molécula diatómica viene dada por:
x ℎ[yUU % 1 U 0, 1, 2, … (3.20)
donde J es el número cuántico rotacional y B es la constante rotacional dada por
y iZe' (3.21)
donde I es el momento de inercia, que es igual a
| ~, (322)
siendo r la distancia que separa los dos centros atómicos y µ la masa reducida
definida como
j&j'j& j'
(323)
Las moléculas diatómicas difieren dependiendo de las masas de los átomos de la
molécula y de la longitud de enlace, por lo que el valor de la constante rotacional
depende de la molécula.
Sustituyendo la ecuación (3.21) en la forma general de la función de partición
molecular llegamos a la función de partición rotacional siguiente:
)70/ ∑ 2xi+xx @x (3.24)
donde gJ es la degeneración del nivel de energía rotacional, o sea, el número de
estados rotacionales presentes en un nivel de energía dado. Para determinar la
degeneración, debemos recordar que en el estudio mecano-cuántico del rotor
rígido, la ecuación de Schrödinger independiente del tiempo
70/70/ 70/70/ (3.25)
el hamiltoniano (70/) es proporcional al cuadrado del momento angular total, ,.
Los estados propios de este operador son los armónicos esféricos, con los
siguientes valores propios:
,70/ ,1,j, i'Te' % 11,j, (3.26)
siendo l un número cuántico correspondiente al momento angular total que toma
valores enteros desde cero hasta infinito. Los armónicos esféricos son también
funciones propias del operador correspondientes a la componente z del momento
angular. Los valores propios correspondientes empleando el operador q están
dados por
q1,j, i,e L11,j, (3.27)
donde ml es otro número cuántico cuyos valores posibles están descritos por el
número cuántico l:
ml = -l, -l+1, …, 0, …, l-1, l (3.28)
Todos los valores de ml correspondientes a un número cuántico dado l tienen el
mismo momento angular y, en consecuencia, la misma energía. Por tanto, la
degeneración de los niveles de energía rotacional es (2l + 1), de modo que la
función de partición rotacional queda como:
)70/ ∑ 2U % 1i+xx @x (3.29)
La Figura 3.6 muestra una serie de niveles de energía rotacionales, en unidades de
B, cuyos espaciados son múltiplos de B. La Tabla 3.1 muestra valores
representativos de B para varias moléculas diatómicas. La inspección de la tabla
revela unas cuantas tendencias de interés. En primer lugar, la constante rotacional
depende de la masa atómica, con un crecimiento en unidades atómicas que
produce una reducción de la constante rotacional. En segundo lugar, los valores de
B son muy diferentes; por tanto, cualquier comparación de las energías de los
estados rotacionales con kT dependerá de la molécula diatómica de interés. Por
ejemplo, a 298 K, kT = 208 cm-1, que es aproximadamente igual a la energía del
nivel J = 75 del I2. Para estas especies, los espaciados de los niveles de energía
claramente son mucho más pequeños que kT y, por tanto, el sumatorio de la
ecuación (3.29) puede transformarse en una integral. Sin embargo, para el H2 el
nivel de energía J = 2 es mayor que kT de forma que la evaluación de la función de
partición tendría que hacerse considerando el sumatorio de la ecuación (3.29), en
lugar de la integral. De aquí en adelante, a no ser que se indique lo contrario,
suponemos que la integración de la función de partición rotacional es apropiada.
Figura 3.6. Esquema de los niveles de energía rotacionales en unidades de B.
Tabla 3.1. Constantes rotacionales de algunas moléculas diatómicas
representativas.
Molécula B (cm-1) Molécula B (cm-1) H35Cl 10,595 H2 60,853
H37Cl 10,578 14N16O 1,7046
D35Cl 5,447 127I127I 0,03735
En el caso de que los espaciados de los niveles de energía sean pequeños con
relación a kT, la función de partición rotacional a evaluar será:
)70/ a 2U % 1i+xx @bUF] (3.30)
Sabiendo que
x i+xx @" −ℎ[y2U % 1i+xx @ (3.31)
La ecuación (3.30) se puede reescribir y el resultado es el siguiente:
)70/ d @i+f a −ℎ[y2U % 1i+xx @bUF
]
d @i+f i+xx @]
F @i+
)70/ @i+
i+ (3.32)
Números de simetría
La función de partición rotacional que hemos obtenido para una molécula
heterodiatómica debe corregirse en el caso de molécula homodiatómicas. La Figura
3.7 muestra el motivo de esta corrección. Una rotación de 180° en torno a un eje
perpendicular al eje de enlace de una molécula heterodiatómica como, por
ejemplo, HCl produce especies que son distinguibles de la molécula antes de la
rotación. Sin embargo, la misma rotación aplicada a una molécula homodiatómica
como, por ejemplo, N2 produce una configuración que es equivalente a la forma
antes de la rotación.
Figura 3.7. Ilustración de una rotación de 180° en moléculas heterodiatómicas y
homodiatómicas.
Este comportamiento diferente es similar a las diferencias entre funciones de
partición canónica para unidades distinguibles e indistinguibles. En el caso de la
función de partición, el resultado del caso distinguible se divide por N! para tener
en cuenta el contaje en exceso de los microestados no únicos obtenidos cuando las
unidades son indistinguibles. Análogamente, el número de estados rotacionales
para las especies homodiatómicas (es decir, configuraciones rotacionales
indistinguibles) está sobreestimado en un factor 2. Por ello, nuestra función de
partición rotacional se divide por el número de configuraciones rotacionales
equivalentes. Este factor se conoce como número de simetría, σ, y se incorpora a
la función de partición como sigue:
)70/ i+ (3.33)
El concepto de número de simetría se puede extender también a moléculas con
más de dos átomos. Por ejemplo, consideremos una molécula piramidal trigonal,
como NH3 (véase Figura 3.8). Una rotación de 120° en torno a un eje que pasa a
través del átomo de nitrógeno y del centro del triángulo que forman los tres
hidrógenos genera una configuración que es exactamente equivalente a la
configuración inicial. Una segunda rotación de 120° produce una tercera
configuración, idéntica a las dos anteriores. Finalmente, una tercera rotación de
120° acaba dando la configuración inicial. Por tanto, el NH3 tiene tres
configuraciones rotacionales equivalentes; y en consecuencia, σ = 3.
Figura 3.8. Configuraciones rotacionales del NH3.
Poblaciones de los niveles rotacionales y Espectroscopía
Teniendo en cuenta la ecuación (3.29), la probabilidad de ocupación de un nivel de
energía rotacional dado, pJ, viene dada por
x C!&-;43
,x @C!&-;43
(3.34)
Las poblaciones de los diferentes niveles de energía rotacional están relacionadas
con las intensidades de absorción infrarroja de vibración-rotación. A modo de
ejemplo, consideremos la molécula H35Cl, con B = 10,595 cm-1. A 300 K la función
de partición rotacional para H35Cl es
)70/ i+ @,SZ o @]'wx &"S]]
@,, o @]wx 8,,Z o @]&$j 8&@],XX j& 19,7 (3.35)
A partir del resultado de la ecuación (3.35) y utilizando la ecuación (3.34), se
obtienen las probabilidades de los niveles reflejados en la Figura 3.9. La Figura
3.10 muestra la intensidad de las transiciones de las ramas P y R que son
proporcionales a la probabilidad de ocupación de un nivel J dado. Esta
dependencia se refleja en la evolución de la intensidad de las transiciones de
vibración rotación en función de J. El momento de la transición muestra una
dependencia modesta de J, así como que la correspondencia entre la intensidad de
la transición y la población de los niveles rotacionales no es exacta.
Figura 3.9. Variación de la probabilidad de ocupación de un nivel de energía
rotacional, pJ, con el número cuántico rotacional J para H35Cl a 300 K.
Figura 3.10. Espectro de absorcion infrarroja simulado a 300 K. Los dos índices
encima de los picos se refieren a los valores de J inicial y final. La región del
espectro con ΔJ = +1 (alta frecuencia) es la rama R, y la region del espectro con ΔJ
= -1 (baja frecuencia) es la rama P.
Los estados rotacionales del H2
La distribución de los niveles rotacionales del H2 proporciona un ejemplo de la
influencia de la simetría molecular en la función de partición. El hidrógeno
molecular existe en dos formas, una en la que los espines nucleares están
apareados (para hidrógeno) y otra en la que los espines están alineados (orto
hidrógeno). Debido a que los núcleos de hidrógeno son partículas de espín 1/2,
son fermiones. El principio de exclusión de Pauli impone que cuando dos
fermiones idénticos intercambian la posición, la función de onda total que describe
el sistema debe ser antisimétrica (o cambiar el signo) para el intercambio. En este
caso la función de onda se puede separar en un producto de las componentes de
espín y rotacional. Consideremos, en primer lugar, la componente de espín. En el
caso del para hidrógeno, la rotación intercambia los dos núcleos (A y B) que tienen
espín opuesto (α y β), de forma que la componente de espín de la función de onda
será antisimétrica para el intercambio de los núcleos debido a la rotación. Este
requerimiento se satisface usando la siguiente combinación lineal de los estados de
espín nuclear:
8í#,7 hy − hy
El intercambio de las etiquetas nucleares A y B correspondientes a la rotación hará
que la función de onda anterior cambie de signo de forma que la componente de
espín de la función de onda del para hidrógeno será antisimétrica con respecto al
intercambio. Para el orto hidrógeno, la rotación produce el intercambio de los dos
núcleos del mismo espín; por tanto, la función de onda de espín será simétrica.
Este requerimiento lo reúnen tres combinaciones de los estados de espín nuclear:
8í#,07/0 hhy, y, hy % hy
En resumen, la componente de espín de la función de onda es antisimétrica con
respecto al intercambio de los núcleos del para hidrógeno, pero simétrica para el
orto hidrógeno. A continuación, consideremos la simetría de la componente
rotacional de la función de onda. Se puede demostrar que la simetría de los estados
rotacionales es dependiente del número cuántico rotacional, J. Si J es un entero par
(J = 0, 2, 4, 6, …), la correspondiente función de onda rotacional es simétrica con
respecto al intercambio, y si J es impar (J = 1, 3, 5, 7, … ) la función de onda es
antisimétrica. Debido a que la función de onda es el producto de las componentes
de espín y rotacional, este producto debe ser antisimétrico. Por tanto, la función de
onda rotacional del para hidrógeno está restringida a los niveles de J par, y para el
orto hidrógeno está restringida a los niveles J impar. Finalmente, la degeneración
del estado de espín nuclear para el orto y para hidrógeno es tres y uno,
respectivamente. Por tanto, los niveles de energía rotacional del orto hidrógeno
tienen una triple degeneración adicional. Una muestra de hidrógeno molecular
contendrá ambos orto y para hidrógeno, de forma que la función de partición
rotacional es
)70/ @T 1 ∑ 2U % 1i+xx @ % 3 ∑ 2U % 1i+xx @@,S,X,…],,,T,… (3.36)
El primer término del corchete de la ecuación (3.36) corresponde al para
hidrógeno y el segundo término al orto hidrógeno. En esencia, esta expresión de
qrot representa al H2 medio que consta de una parte de para hidrógeno y tres
partes de orto hidrógeno. En la ecuación (3.36) se omite el número de simetría
porque la sobreestimación de los niveles rotacionales permitidos ya se ha tenido
en cuenta restringiendo las sumas a J par o impar. A altas temperaturas, el valor de
qrot determinado usando la ecuación (3.36) será, en buena aproximación, igual al
obtenido usando la ecuación (3.33) con σ = 2.
La temperatura rotacional
El que la función de partición rotacional se evalúe por suma directa o por
integración depende completamente del tamaño del espaciado de energía
rotacional relativo a la cantidad de energía térmica disponible (kT). Esta
comparación se facilita mediante la introducción de la temperatura rotacional, Θrot, definida como la constante rotacional dividida por la constante de Boltzmann:
70/ i+ (3.37)
Del análisis de las unidades de la ecuación (3.37) se deduce que Θrot tiene unidades
de temperatura. Podemos reescribir la expresión de la función de partición
rotacional en términos de la temperatura rotacional como sigue:
)70/ i+
;43 (3.38)
Una segunda aplicación de la temperatura rotacional es como una métrica
comparativa de la temperatura a la que se evalúa la función de partición. La Figura
3.11 presenta una comparación entre qrot para el H35Cl (Θrot = 15,24 K)
determinada mediante suma discreta, ecuación (3.29), y usando la forma integrada
de la función de partición, ecuación (3.33). A bajas temperaturas, hay diferencias
significativas entre ambos resultados. A temperaturas elevadas, los resultados de
la suma son mayores que los resultados integrados; sin embargo, ambos resultados
predicen que qrot crece linealmente con la temperatura. A temperaturas elevadas,
el error al usar el resultado integrado es tal que para la temperatura a la que T ≥10,
es razonable el uso de la forma integrada de la función de partición rotacional. La
forma integrada de la función de partición se refiere como el límite a alta T,
porque es aplicable cuando kT es significativamente mayor que el espaciado de
energía rotacional.
Figura 3.11. Comparación de qrot para H35Cl (Θrot = 15,24 cm-1) determinada
mediante suma y por integración.
Función de partición rotacional: poliatómicas. En los sistemas diatómicos hay dos momentos de inercia no nulos como se ilustra
en la Figura 3.12. Para moléculas poliatómicas (más de dos átomos) la situación
puede llegar a ser más compleja. Si el sistema poliatómico es lineal, sólo hay, de
nuevo, dos momentos de inercia que no se anulan, de forma que una molécula
poliatómica lineal se puede tratar usando el mismo formalismo de las moléculas
diatómicas. Sin embargo, si la molécula poliatómica no es lineal, entonces hay tres
momentos de inercia no nulos. Por tanto, la función de partición que describe los
niveles de energía rotacionales debe tener en cuenta la rotación en torno a los tres
ejes. La deducción de esta función de partición no es trivial; por tanto, aquí
establecemos el resultado sin deducción:
)70/ √e d @
i+f@/, d @
i+!f@/, d @
i+f@/,
(3.39)
El subíndice de B en la ecuación (3.39) indica el correspondiente momento de
inercia como se muestra en la Figura 3.12 y σ es el número de simetría discutido
anteriormente. Además, se hace la suposición de que la poliatómica es “rígida”
durante el movimiento rotacional. El desarrollo de la función de partición
rotacional para sistemas diatómicos proporciona alguna intuición sobre el origen
de esta función de partición. Se puede entender que cada momento de inercia
contribuye con (βhcB)-1/2 a la función de partición total. En el caso de diatómicas o
poliatómicas lineales, los dos momentos de inercia que no se anulan son
equivalentes, de forma que el producto de la contribución de cada momento acaba
en la expresión para la diatómica deducida anteriormente. Para los sistemas
poliatómicos no lineales, la función de partición es el producto de la contribución
de cada uno de los momentos de inercia, que puede o no ser equivalente, como se
indica por los subíndices de las correspondientes constantes rotacionales en la
función de partición presentada anteriormente.
Figura 3.12. Momentos de inercia de moléculas diatómicas y poliatómicas.
Función de partición vibracional
Según el modelo del oscilador armónico, cada grado de libertad vibracional está
caracterizado por un potencial cuadrático (véase Figura 3.13) cuyos niveles de
energía son
# ℎ[ dc % @,f c 0, 1, 2, … (3.40)
donde la frecuencia del oscilador, o frecuencia vibracional, está dada por en
unidades de cm-1. En consecuencia, la función de partición asociada al movimiento
molecular vibracional, representado por el oscilador armónico, viene expresada
como:
)9: ∑ F] ∑ i¡¢d# &'f i¡¢/, ∑ i¡¢#F]F] (3.41)
Figura 3.13. Variación de la energía potencial del oscilador armónico utilizado
como modelo del movimiento vibracional de las moléculas.
Dado que el sumatorio de la ecuación (3.41) se puede expresar como:
∑ #_oF#£] @@¤r (3.42)
La función de partición vibracional (3.41) se transforma en:
)9: C¥¢/'@C¥¢ (3.43)
Esta expresión es ventajosa para redefinir los niveles de energía vibracionales, de
forma que E0 = 0. En otras palabras, disminuimos la energía de todos los niveles en
una cantidad igual a la energía del punto cero. ¿Por qué es ventajoso hacer esto?
Consideremos el cálculo de la probabilidad de ocupación de un nivel de energía
dado, pn, como sigue:
# -=>
C¥¢&'
?C¥¢/'&?C¥¢
C¥¢/'C¥¢?C¥¢/'&?C¥¢
i¡¢#1 − i¡¢" (3.44)
En la ecuación (3.44) se cancelan las contribuciones de la energía del punto cero
tanto en el nivel de energía como en la función de partición. Por tanto, la energía
relevante para determinar pn no es la energía absoluta de un nivel dado, sino la
energía relativa del nivel. Dado esto, simplemente podemos eliminar la energía del
punto cero, acabando en la siguiente expresión para la función de partición
vibracional:
)9: @@C¥¢ (3.45)
Es importante la consistencia incluyendo o no la energía del punto cero. Por
ejemplo, ¿qué ocurre si efectuamos el cálculo de la probabilidad presentado
anteriormente, incluyendo la energía del punto cero del estado vibracional de
interés, pero no incluyendo la energía del punto cero en la expresión para la
función de partición vibracional? Procediendo como antes, llegamos al siguiente
resultado incorrecto:
# -=>
C¥¢&'
&&?C¥¢
C¥¢/'C¥¢&
&?C¥¢ i¡¢#i¡¢#1 − i¡¢" (3.46)
En esta ecuación se pone de manifiesto que los términos de la energía del punto
cero no se cancelan como en el caso previo, reflejando el hecho de que la energía
del estado n está definida de forma diferente con relación a la función de partición.
En resumen, una vez que se ha tomado una decisión acerca de incluir o ignorar la
energía del punto cero, la aproximación tomada debe aplicarse consistentemente.
La función de partición vibracional en moléculas poliatómicas
La expresión de la función de partición vibracional deducida anteriormente es para
un único grado de libertad y es suficiente para moléculas diatómicas. Sin embargo,
las moléculas con más de dos átomos requieren una forma diferente de función de
partición que tenga en cuenta todos los grados de libertad vibracional. Para definir
la función de partición vibracional de poliatómicas, primero necesitamos saber
cuántos grados de libertad vibracional hay. Una molécula poliatómica consta de N
átomos con un total de 3N grados de libertad, correspondientes a tres grados de
libertad cartesianos de cada átomo. Los átomos están conectados por enlaces
químicos; por tanto, los átomos no son libres para moverse independientemente
unos de otros. En primer lugar, la molécula entera se puede trasladar a través del
espacio; por tanto, tres de los 3N grados de libertad totales corresponden al
movimiento traslacional de la molécula entera. Existe también un grado de libertad
rotacional para cada momento de inercia no nulo. Las poliatómicas lineales tienen
dos grados de libertad rotacional porque hay dos momentos de inercia no nulos
mientras que las no lineales tienen tres grados de libertad rotacional. Los grados
de libertad restantes son vibracionales, de forma que el número de grados de
libertad vibracional son
Poliatómicas lineales: 3N − 5 (3.47)
Poliatómicas no lineales: 3N − 6 (3.48)
Una molécula diatómica se puede interpretar como una poliatómica lineal con N =
2, y las expresiones precedentes disponen que sólo hay un grado de libertad
vibracional, 3(2) - 5 = 1, como se estableció anteriormente. El paso final para
deducir la función de partición de un sistema poliatómico se basa en suponer que
en la aproximación armónica los grados de libertad vibracionales son separables y
cada vibración se puede tratar como un grado de libertad energético separado.
Anteriormente hemos visto que varias formas de separar la energía molecular, de
modo que la función de partición molecular total es simplemente la suma de las
funciones de partición de cada grado de libertad energético. Análogamente, esto se
aplica a los grados de libertad vibracionales donde la función de partición
vibracional total es el producto de las funciones de partición vibracional para cada
grado de libertad vibracional:
)9:/0/1 ∑ )9:SX 0 S£@ (3.49)
donde la función de partición vibracional total es igual al producto de las funciones
de partición vibracional de cada modo vibracional (denotado por el subíndice i).
Por tanto, tendremos 3N - 5 o 3N - 6 funciones de partición de modos específicos
dependiendo de la geometría de la molécula.
La temperatura vibracional
De un modo análogo al desarrollo de la rotación, la temperatura vibracional (Θvib) se define como la frecuencia de un grado de libertad vibracional dada
dividida por k:
9: i¡¢ (3.50)
El análisis de unidades de la ecuación (3.50) indica que Θvib tiene unidades de
temperatura (K). Incorporando este término en la expresión para la función de
partición vibracional se llega a que:
)9: @@C¥¢ @
@C¥¢ ¦§⁄ @@©=> §⁄ (3.51)
Esta forma de la función de partición muestra la relación entre la energía y la
temperatura de un modo más transparente. Concretamente, cuando T se hace
grande en comparación a Θvib, el exponente se hace pequeño y el término
exponencial se aproxima a uno. El denominador de la ecuación (3.51) disminuirá,
de forma que la función de partición vibracional aumentará. Si la temperatura llega
a ser suficientemente grande con relación a Θvib, qvib se puede reducir a una forma
más simple ya que:
o 1 − P % P,
2 − ⋯
Para la función de partición vibracional de la ecuación (3.51), x=-Θvib/T. Cuando T
>> Θvib, x llega a ser suficientemente pequeña como para que sólo los dos primeros
términos se puedan incluir en el desarrollo en serie de e-x, ya que los términos de
orden elevado son despreciables. Sustituyendo en la expresión (3.51), se obtiene:
)9: @@©=> §⁄ @
@d@©=>§ f
=> (3.52)
Este resultado es el límite de alta T para la función de partición vibracional. La
utilización de la ecuación (3.52) para evaluar qvib depende de la frecuencia
vibracional de interés y de la temperatura. La Figura 3.14 proporciona una
comparación para I2 (Θvib=299 K) de la expresión exacta sin energía del punto cero,
ecuación (3.51), con la expresión de qvib a alta T, ecuación (3.52). Análogamente, al
caso de la rotación, los dos resultados son significativamente diferentes a bajas
temperaturas, pero predicen la misma dependencia lineal con T a temperaturas
elevadas. Cuando T ≥ 10Θvib, la diferencia de la fracción a alta T y el resultado
exacto es suficientemente pequeño para que se pueda usar el resultado de alta T
para qvib. Para la mayoría de moléculas, esta temperatura será extremadamente
alta.
Figura 3.14. Variación de la función de partición vibracional (función exacta, línea
roja, y función a alta T, línea naranja) frente a T/Θvib para I2 (Θvib= 299 K).
Degeneración y función de partición vibracional
La función de partición vibracional para una molécula poliatómica es el producto
de las funciones de partición para cada grado de libertad vibracional. Cuando dos o
más grados de libertad vibracional tienen la misma frecuencia, es decir, hay
degeneración, entonces dos o más de estos grados de libertad tendrán el mismo
espaciado de energía vibracional, o la misma temperatura vibracional. La función
de partición total sigue siendo el producto de las funciones de partición de cada
grado de libertad vibracional; sin embargo, los modos vibracionales degenerados
tienen funciones de partición idénticas. Hay dos formas de incorporar los efectos
de la degeneración vibracional en la expresión de la función de partición
vibracional. En primer lugar, se puede usar simplemente la forma existente de la
función de partición sin perder de vista ningún grado de libertad,
independientemente de la frecuencia. Un segundo método es reescribir la función
de partición total como producto de las funciones de partición correspondientes a
una frecuencia vibracional dada e incluir la degeneración en una frecuencia dada,
resultando que la correspondiente función de partición se eleva a la potencia de la
degeneración:
)9:/0/1 ∑ )9:#´£@ (3.53)
donde n´ es el número total de frecuencias vibracionales diferentes, indexadas con
i.
El teorema de equipartición
En el estudio de los movimientos rotacional y vibracional se encontró que cuando
la temperatura es suficientemente alta, la energía térmica disponible (kT) es
mucho mayor que el espaciado de los niveles de energía. En consecuencia, las
expresiones de qrot y qvib a alta T son equivalentes a las expresiones exactas de
dichas funciones de partición. A estas temperaturas elevadas, la naturaleza
cuántica de los niveles de energía llega a no tener importancia y es totalmente
necesaria una descripción clásica de la energía.
La definición de función de partición implica la suma de los niveles de energía
cuantizados, y se podría suponer que hay una expresión clásica correspondiente a
la función de partición en la que se emplee la descripción clásica de la energía del
sistema. Esta expresión existe; sin embargo, su deducción va más allá de las
pretensiones de esta asignatura, de forma que aquí, simplemente establecemos el
resultado. La expresión de la función de partición tridimensional de una molécula
que consta de N átomos es
)1á8 @iw. a··· a bSbPS (3.54)
donde los términos p y x representan el momento y las coordenadas de posición de
cada partícula, respectivamente, con tres dimensiones cartesianas disponibles para
cada término. La integral se multiplica por h-3N, que tiene unidades de (momento x
distancia)-3N de forma que la función de partición es adimensional. H representa el
hamiltoniano clásico y, al igual que el hamiltoniano cuántico, es la suma de las
energías cinética y potencial. Por tanto, e-βH es equivalente a e-βε en nuestra
expresión cuántica de la función de partición molecular.
Teniendo en cuenta el hamiltoniano del oscilador armónico unidimensional con
masa reducida µ y constante de fuerza k:
',® % @
, YP, (3.55)
La función de partición clásica del oscilador armónico unidimensional es
)1á8 @i a b a ¯°'
'± &'o'²bP
=> (3.56)
Este resultado está de acuerdo con la aproximación a alta T de qvib deducida
usando la función de partición cuántica de la ecuación (3.52). Este ejemplo ilustra
la aplicabilidad de la Mecánica Estadística Clásica a los sistemas moleculares
cuando la temperatura es suficientemente alta, de forma que la suma sobre los
estados cuánticos se puede reemplazar por la integración. En estas condiciones de
temperatura, el conocimiento de los detalles cuánticos del sistema no es necesario
porque, cuando evaluamos la ecuación (3.56), no hay implicado nada relacionado
con la cuantización de los niveles de energía del oscilador armónico.
La aplicación de la Mecánica Estadística Clásica a sistemas moleculares a alta
temperatura encuentra aplicación en un interesante teorema conocido como el
teorema de equipartición. Este teorema establece que cualquier término del
hamiltoniano clásico que es cuadrático con respecto al momento o la posición (es
decir, p2 o x2) contribuirá con kT/2 a la energía media. Por ejemplo, el
hamiltoniano del oscilador armónico unidimensional, ecuación (3.55), tiene ambos
términos p2 y x2, de forma que la energía media del oscilador por equipartición
será kT (o NkT para una colección de N osciladores armónicos). Por tanto, el
concepto de equipartición es una consecuencia de la Mecánica Clásica porque, para
un grado de libertad energético dado, el cambio de energía asociado con el paso de
un nivel de energía a otro es significativamente menor que kT. Como discutimos
anteriormente, esto es cierto para los grados de libertad traslacional y rotacional,
pero no para los grados de libertad vibracional a temperaturas relativamente
elevadas.
Función de partición electrónica
Los niveles de energía electrónicos corresponden a las diferentes disposiciones de
los electrones en un átomo o molécula. El átomo de hidrógeno proporciona un
ejemplo excelente de un sistema atómico en el que las energías orbitales están
dadas por:
# − j?Z$'i'#' 109 737 [L@ @
#' c 1, 2, 3, … (3.57)
Esta expresión indica que para el átomo de hidrógeno la energía de un orbital dado
depende del número cuántico n. Además, cada orbital tiene una degeneración 2n2.
Usando la ecuación (3.57), se pueden determinar los niveles de energía del
electrón del átomo de hidrógeno como se ilustra en la Figura 3.15.
Figura 3.15. Energías orbitales del átomo de hidrógeno. (a) Energías orbitales
basadas en la resolución de la ecuación de Schrödinger para el átomo de
hidrógeno. (b) Niveles de energía desplazados 109 737 cm−1, de forma que la
energía orbital más baja es 0.
Desde la perspectiva de la Mecánica Estadística, los niveles de energía del átomo
de hidrógeno representan los niveles de energía de los grados de libertad
energéticos electrónicos, con la correspondiente función de partición, deducida
sumando los niveles de energía. Sin embargo, en lugar de usar las energías
absolutas como se hace en la determinación de la resolución mecano-cuántica del
problema del átomo de hidrógeno, pueden ajustarse los niveles de energía de
forma que la energía asociada al orbital n = 1 sea cero, de forma análoga al ajuste
de la energía del estado fundamental del oscilador armónico a cero, por
eliminación de la energía del punto cero. Con esta redefinición de las energías
orbitales, la función de partición electrónica del átomo de hidrógeno es:
)1 ∑ 2#iF#£@ 2i& % 8i' % 18i' % ⋯ (3.58)
2i]j&" % 8iZ, S]S j&" % 18i³ XTTj&" % ⋯
2 % 8iZ, S]S j&" % 18i³ XTTj&" % ⋯
La magnitud de los términos de la función de partición correspondiente a n ≥ 2
dependerá de la temperatura a la que se evalúa la función de partición. Sin
embargo, puede constatarse que estas energías son muy grandes. Definiendo la
“temperatura electrónica” o Θelec, exactamente de la misma forma que hicimos con
las temperaturas rotacional y vibracional, tenemos que:
1 i
],X j&& (3.59)
Con la definición de E1 = 0 cm-1, la energía del orbital n = 2, E2, es 82 303 cm-1 que
corresponde a Θelec = 118 421 K. Esta es una temperatura extremadamente elevada
y este simple cálculo ilustra la principal diferencia entre los niveles de energía
electrónicos y los demás grados de libertad discutidos hasta aquí. Los grados de
libertad electrónicos se caracterizan, generalmente, por espaciados de los niveles
que son muy grandes con relación a kT. Por tanto, sólo el estado electrónico
fundamental está poblado en una extensión significativa, aunque se conocen
excepciones. Aplicando esto al átomo de hidrógeno, deducimos que los términos de
la función de partición correspondientes a n ≥ 2 son muy pequeños a 298 K. Por
ejemplo, el término del estado n= 2 es e-397,3, es decir, prácticamente cero.
Los términos correspondientes a orbitales de energía elevados serán también
extremadamente pequeños, de forma que la función de partición electrónica del
átomo de hidrógeno es ∼2 a 298 K. En general, se debe considerar la contribución
de cada estado a la función de partición, resultando la siguiente expresión para la
función de partición electrónica:
)1 ∑ 2#i# (3.60)
donde el término exponencial de cada nivel de energía se multiplica por la
degeneración del nivel, gn. Si el espaciado de los niveles de energía es muy grande
comparado con kT, entonces qelec ∼ gO, la degeneración del estado fundamental. Sin
embargo, ciertos átomos y moléculas pueden tener estados electrónicos excitados
que son energéticamente accesibles en relación a kT, y la contribución de estos
estados se incluye en la evaluación de la función de partición.
En el caso de moléculas, se aplica una lógica similar a la que hemos seguido en
sistemas atómicos. En la teoría del orbital molecular, se usan las combinaciones
lineales de orbitales atómicos para construir una nueva serie de orbitales
electrónicos conocidos como orbitales moleculares. Los orbitales moleculares
difieren en energía y la configuración electrónica de la molécula se determina
situando los electrones, con el espín apareado, en los orbitales, partiendo del
orbital de energía más baja. La Figura 3.16 muestra el diagrama de niveles de
energía de los orbitales moleculares del butadieno junto con las dos
configuraciones electrónicas de energía más baja: fundamental y primer estado
excitado. La separación de energía entre estos dos estados corresponde a la
cantidad de energía invertida en excitar un electrón desde el HOMO al LUMO. La
longitud de onda de la transición electrónica de energía más baja del butadieno es
∼220 nm, mostrando que la separación entre HOMO y LUMO es ∼45 000 cm-1,
significativamente mayor que kT a 298 K. Por tanto, sólo el estado de energía
electrónica más baja contribuye a la función de partición electrónica, de modo que,
qelec = 1 para el butadieno, ya que la degeneración del nivel de energía más bajo es
uno. Típicamente, el primer nivel excitado electrónico de las moléculas estará
entre 5000 y 50 000 cm-1 más alto en energía que el nivel más bajo, de forma que a
temperatura ambiente solamente se considera este nivel más bajo en la evaluación
de la función de partición:
)1 ∑ 2# ≈ 1# (3.61)
En ausencia de degeneración del estado electrónico fundamental, la función de
partición electrónica es igual a uno.
Figura 3.16. Descripción de los orbitales moleculares del butadieno. A la izquierda
se muestra la configuración electrónica de energía más baja, y en la derecha la
configuración de energía más alta siguiente, correspondiente a la promoción de un
electrón desde el HOMO al LUMO.
Lección 4: TERMODINÁMICA ESTADÍSTICA
Energía y grados de libertad moleculares. Capacidad calorífica. Entropía. Entropía
residual. Otras funciones termodinámicas. Equilibrio químico.
En esta lección vamos a utilizar los conceptos centrales de la Mecánica Estadística
que hemos visto anteriormente para conectar el punto de vista microscópico de la
materia con magnitudes termodinámicas fundamentales tales como la energía
interna, entropía, energía libre de Gibbs, etc.
Energía y grados de libertad moleculares
El valor de la energía media de una unidad del conjunto canónico, <ε>, es la
energía total del conjunto, E, dividida por el número de unidades del mismo, N:
⟨⟩ = = ∑ = ∑ (4.1)
En esta ecuación, εn es la energía del nivel n y an su correspondiente número de
ocupación. De acuerdo con lo que vimos en la lección anterior, el conjunto se divide
de forma que haya un átomo o molécula en cada unidad. La distribución de
Boltzmann para una serie de niveles de energía no degenerados es
= (4.2)
donde q es la función de partición molecular dada por
= ∑ (4.3)
Sustituyendo la ecuación (4.2) en (4.1) obtenemos
⟨⟩ = ∑ = ∑ (4.4)
Derivando la función de partición molecular con respecto a β, obtenemos:
− = ∑ (4.5)
Utilizando la ecuación (4.5), se puede reescribir la ecuación (4.4) para obtener las
siguientes expresiones de la energía media de la unidad y la energía del conjunto
total:
⟨⟩ = ∑ = = − (4.6)
= ⟨⟩ = = − (4.7)
Como β = (kT)-1 y la derivada de β respecto a T es
= − (4.8)
Utilizando la ecuación (4.8), las expresiones de las energías media y total,
ecuaciones (4.6) y (4.7), se pueden escribir como
⟨⟩ = = !"# (4.9)
= ⟨⟩ = = !"# (4.10)
La ecuación (4.10) muestra que la energía total del conjunto cambia con la
temperatura, un resultado conocido de la Termodinámica. Para conocer la
variación de E con T, se debe construir, primero, q y, después usarla para deducir
una expresión para E.
La energía del colectivo, E, que aparece en la ecuación (4.10) está relacionada con
la magnitud termodinámica energía interna, U, de la siguiente manera. Dado que V
es constante en el colectivo canónico, no puede haber trabajo tipo P-V, y por la
primera ley de la Termodinámica, cualquier cambio de energía interna del sistema
a volumen constante debe ser igual a un flujo de calor a volumen constante, qV, es
decir:
∆% = % − %& = ' (4.11)
siendo U y U0 la energía interna a una temperatura finita y a 0 K, respectivamente.
Si hay energía residual, se debe incluir la energía interna presente a 0 K para
determinar la energía global del sistema. Sin embargo, por convenio Uo
generalmente se hace cero.
Según vimos, para un conjunto de partículas indistinguibles no interactuantes, la
función de partición canónica, Q, está relacionada con la función de partición
molecular, q, de la siguiente manera:
( = ! (4.12)
De modo que,
*+( = *+ − *+! (4.13)
Derivando la ecuación (4.13) con respecto a β y teniendo en cuenta que N y, por
tanto, ln(N!), es constante en el colectivo canónico, llegamos a que:
, = (4.14)
La última relación es la energía total; por tanto, la relación entre Q y la energía
interna total, U, es
% = −, ' (4.15)
En la lección anterior vimos que, bajo la suposición de que los grados de libertad
energéticos no están acoplados, la relación entre la función de partición molecular
total (qtotal) y las funciones de partición correspondientes a un grado de libertad
energético individual es:
-.- = -/0/.-123 4 (4.16)
donde los subíndices tras, rot, vib y elec indican los grados de libertad energéticos
tranlacional, rotacional, vibracional y electrónicos, respectivamente.
Análogamente, se puede descomponer la energía interna en las contribuciones de
cada grado de libertad energético:
% = −, ' = − ' = − (67897:6;<=>?>@) ' (4.17)
= − B6789 ' + 7:6 ' + ;<= ' + >?>@ 'D
= %-/0 + %/.- + %123 + % 4
En efecto, la energía interna simplemente es la suma de las contribuciones de cada
grado de libertad energético molecular. Este resultado también ilustra la conexión
entre la propiedad macroscópica del conjunto (energía interna) y los detalles
microscópicos de las unidades mismas (niveles de energía molecular). Para
relacionar la energía interna total con los grados de libertad energéticos, se
necesitan expresiones de las contribuciones de la energía a partir de cada grado de
libertad energético (Utras, Urot y así sucesivamente). Vamos a deducir a continuación
estas relaciones.
Traslación
La contribución del movimiento molecular traslacional a la energía interna del
sistema es
%-/0 = − 6789 ' = − 6789 6789 ' (4.18)
siendo qtras la función de partición traslacional, que en tres dimensiones viene dada
por
-/0 = 'EF = 'GH IJKF/ (4.19)
Con esta función de partición, la contribución traslacional a la energía interna se
convierte en
%-/0 = − 6789 6789 ' = EF' M' NF⁄ P ' = −QR M NF⁄ P '
= −QR SM#TU V ⁄ PF/ W' = R#X
%-/0 = R#Y" = R#+Z" (4.20)
Es interesante resaltar aquí que la contribución del movimiento traslacional a la
energía interna es igual al predicho por el teorema de equipartición. Este teorema
establece que cualquier término del hamiltoniano clásico, que sea cuadrático con
respecto al momento o la posición, contribuye con kT/2 a la energía. El
hamiltoniano correspondiente al movimiento traslacional tridimensional de un gas
monoatómico ideal, es
[-/0 = #U M\]# + \# + \_#P (4.21)
Cada término p2 de la ecuación (4.20) contribuirá con kT/2 a la energía por
equipartición, de forma que la contribución total será 3kT/2 ó 3RT/2 para un mol
de partículas que es idéntico al resultado deducido usando la descripción mecano-
cuántica del movimiento traslacional. Este resultado no es sorprendente dada la
diferencia de energía entre los niveles de energía traslacional, de forma que es
esperable un comportamiento clásico.
Rotación
Utilizando la función de partición rotacional de una molécula diatómica en el límite
de alta temperatura
/.- = `V4a (4.22)
la contribución del movimiento molecular rotacional a la energía interna es
%/.- = − 7:6 7:6 ' = −bXℎde ( `V4a⁄ ) ' = −X Sf W' = X
%/.- = Y" = +Z" (4.23)
Conviene tener en cuenta que la ecuación (4.22) corresponde a una molécula
diatómica en la que la que Θrot << kT. En este límite, son accesibles un número
significativo de estados rotacionales. Si esto no se cumple, entonces hay que
evaluar todos los términos de la suma de la función de partición rotacional.
En el límite de alta temperatura, la energía rotacional se puede interpretar como la
adición de contribuciones kT/2 por cada momento de inercia que no se anula. Esta
partición de la energía es análoga al caso de la energía traslacional discutido
anteriormente en el contexto del teorema de equipartición. El concepto de
equipartición se puede usar para extender el resultado de Urot obtenido para una
molécula diatómica a moléculas poliatómicas lineales y no lineales. Como cada
momento de inercia no nulo proporciona kT/2 a la equipartición de la energía
rotacional, podemos establecer que
%/.- = +Z" (poliatómica lineal) (4.24)
%/.- = R#+Z" (poliatómica no lineal) (4.25)
Vibración
A diferencia de los grados de libertad traslacional y rotacional, el espaciado de los
niveles de energía vibracional es, típicamente, mayor que kT, de forma que el
teorema de equipartición no es aplicable a este grado de libertad energético.
Afortunadamente, el modelo del oscilador armónico genera un espaciado regular
de los niveles de energía dando lugar a una expresión relativamente sencilla de la
función de partición vibracional:
123 = H@hi (4.26)
siendo j la frecuencia vibracional en unidades cm−1. Usando esta función de
partición, la contribución del movimiento molecular vibracional a la energía
interna es
%123 = − ;<= ;<= ' = −M1 − V4miP SM H@hiPf W'
= −M1 − V4miPM−ℎdnV4miPM1 − V4miP#
%123 = V4mi H@hi (4.27)
Figura 4.1. Variación de la energía vibracional media en función de la temperatura
con j = 1000 cm−1.
En la Figura 4.1 se muestra la variación de Uvib/Nhc con T para un grado de libertad
vibracional (j = 1000 cm−1). Puede observarse que a las temperaturas más bajas
Uvib es cero. A bajas temperaturas, kT << hcj de forma que no hay suficiente
energía térmica para poblar, de forma apreciable, el primer estado vibracional
excitado. Sin embargo, a temperaturas ≥1000 K la energía media crece linealmente
con la temperatura, comportamiento idéntico al observado para la energía
traslacional y rotacional. Esta observación sugiere que también existe una
expresión de Uvib para alta temperatura. Para deducir la expresión límite de la
energía vibracional a alta temperatura, se escribe el término exponencial de qvib
usando el desarrollo en serie siguiente:
] = 1 + ]! + ] #! + ]FR! +⋯
Como x =Xℎdn = ℎdn/!", cuando kT >> hcj la serie es aproximadamente igual a 1
+ x dando lugar a
%123 = V4mi H@hi = V4mipV4mi =
%123 = Y" = +Z" (4.28)
Cuando la temperatura es suficientemente alta, de forma que es aplicable el límite
de alta temperatura, la contribución vibracional a la energía interna es nRT,
idéntica a la predicción del teorema de equipartición. Esta es la contribución de un
único grado de libertad vibracional y la contribución total será la suma de todos los
grados de libertad vibracional. Además, la aplicabilidad de la aproximación a alta
temperatura depende de los detalles del espectro de energía vibracional, de forma
que mientras la aproximación de alta temperatura se puede aplicar a algunas
vibraciones de baja energía, puede no ser aplicable a vibraciones de energía
elevada.
La aplicabilidad del límite de alta temperatura se puede determinar mediante la
temperatura vibracional definida previamente:
q123 = V4mi (4.29)
Se estableció que el límite de alta temperatura es aplicable cuando T ≥ 10 q123. En
la Tabla 4.1 se dan algunos ejemplos de q123 para moléculas diatómicas. De la
inspección de la tabla se deduce que se deben alcanzar temperaturas
relativamente elevadas antes de que sea aplicable el límite de alta temperatura en
la mayoría de los grados de libertad vibracional.
Tabla 4.1. Temperaturas vibracionales de algunas moléculas diatómicas.
Electrónica
Como los espaciados de los niveles de energía electrónica, en general, son muy
grandes comparados con kT, la función de partición electrónica es igual a la
degeneración del estado fundamental. Teniendo en cuenta que la degeneración es
una constante, la derivada de esta cantidad con respecto a β debe ser cero y
% 4 = 0 (4.30)
Hay, no obstante, excepciones al resultado de la ecuación (4.30). Concretamente,
en sistemas en los que los niveles de energía electrónica son comparables a kT, es
necesario evaluar la función de partición completa.
Capacidad calorífica
La definición termodinámica de la capacidad calorífica a volumen constante (CV) es
s' = tut' = −!X# tut' (4.32)
Como la energía interna se puede descomponer en contribuciones de cada grado
de libertad energético, la capacidad calorífica se puede descomponer de forma
similar. En la sección previa, se determinó la contribución a la energía interna
media de cada grado de libertad energético. De forma correspondiente, la
capacidad calorífica viene dada por la derivada de la energía interna con respecto a
la temperatura para un grado de libertad energético dado. En lo que resta de esta
sección, usamos esta aproximación para determinar las contribuciones
traslacional, vibracional, rotacional y electrónica a la capacidad calorífica a
volumen constante.
Figura 4.2. Variación de la capacidad calorífica a volumen constante de un sistema
de dos niveles en función de la temperatura.
La forma funcional de la capacidad calorífica es compleja como se muestra, a modo
de ejemplo, en la Figura 4.2. Se observan, de nuevo, comportamientos límite a baja
y alta temperatura. A baja temperatura, CV es cero, entonces aumenta hasta el
máximo valor, después del cual el incremento adicional de la temperatura produce
una disminución de la capacidad calorífica. Este comportamiento es fruto de la
evolución de la energía en función de la temperatura (véase Figura 3.2) y se debe al
mismo origen, la evolución de las poblaciones del estado en función de la
temperatura. La capacidad calorífica es una medida de la capacidad del sistema
para absorber energía del medio. A las temperaturas más bajas, hay insuficiente
energía para acceder al estado excitado, de forma que el sistema de dos niveles es
incapaz de absorber energía. Como la energía térmica disponible aumenta, el
estado excitado llega a ser accesible y la capacidad calorífica se incrementa.
Finalmente, a temperaturas más elevadas, la población de los estados fundamental
y excitado alcanza sus valores límite 0.5. Aquí, el sistema es, de nuevo, incapaz de
absorber la energía, y la capacidad calorífica tiende a cero.
Capacidad calorífica traslacional
El espaciado de los niveles de energía traslacional es extremadamente pequeño, de
forma que mientras las moléculas permanecen en fase gas, es válida la
aproximación de alta temperatura. La contribución del movimiento traslacional a
la energía molecular media de un gas ideal es
%-/0 = R#Y" (4.33)
Por tanto, la contribución traslacional a CV es:
s',-/0 = tu6789t ' = R#Y (4.34)
Este resultado demuestra que la contribución de las traslaciones a la capacidad
calorífica a volumen constante, no depende de la temperatura. El valor constante
de la contribución traslacional a CV cae a muy bajas temperaturas y es
consecuencia del denso conjunto de estados traslacionales poco espaciados.
Capacidad calorífica rotacional
Suponiendo que el espaciado de energía rotacional es pequeño comparado con kT,
se puede usar la expresión de alta temperatura de la contribución rotacional a la
energía media para determinar la contribución rotacional a CV. La energía interna
depende de la geometría molecular:
%/.- = Y" (lineal) (4.35)
%/.- = R#Y" (no lineal) (4.36)
Usando estas dos ecuaciones, la contribución rotacional a CV es
s',/.- = tu7:6t ' = Y (lineal) (4.37)
s',/.- = tu7:6t ' = R#Y (no lineal) (4.38)
Las expresiones (4.37) y (4.38) son correctas en el límite de alta temperatura. A
temperaturas más bajas, hay insuficiente energía térmica para poblar los niveles
de energía rotacional excitados. Por tanto, la capacidad calorífica tiende a cero.
Conforme aumenta la temperatura, la capacidad calorífica crece hasta alcanzar el
límite a alta temperatura. A estas temperaturas intermedias, la capacidad calorífica
debe determinarse evaluando qrot en forma de suma.
Capacidad calorífica vibracional
En contraste con las traslaciones y rotaciones, el límite de alta temperatura
generalmente no es aplicable a los grados de libertad vibracional. Por tanto, debe
evaluarse la forma funcional exacta de la energía, para determinar la contribución
vibracional a CV. Dado que la contribución vibracional a U es:
%123 = V4mi H@hi (4.39)
La contribución vibracional a la capacidad calorífica a volumen constante está dada
por:
s',123 = tu;<=t ' = −!X# tu;<=t '
= !X#(ℎdn)# H@hiM H@hiP (4.40)
La capacidad calorífica se puede expresar en términos de la temperatura
vibracional Θvib,
s',123 = ! w;<= # x;<= y⁄M x;<= y⁄ P (4.41)
Una molécula poliatómica, según vimos, tiene 3N - 6 o 3N – 5 grados de libertad
vibracional, respectivamente. Cada grado de libertad vibracional contribuye a la
capacidad calorífica a volumen constante vibracional global, de forma que
Ms',123P-.- = ∑ Ms',123PURz.RU| (4.42)
La contribución de un grado de libertad vibracional dado depende del espaciado
entre los niveles vibracionales con relación a kT. Por tanto, a las temperaturas más
bajas esperamos que la contribución vibracional a CV sea nula. Conforme aumenta
la temperatura, los modos vibracionales de energía más baja tienen espaciados
comparables a kT, de forma que estos modos contribuirán a la capacidad calorífica.
Finalmente, los modos vibracionales de energía más alta contribuyen solo a alta
temperatura. En resumen, esperamos que la contribución vibracional a CV muestre
una significativa dependencia de la temperatura. La Figura 4.3 presenta la
contribución vibracional a CV en función de la temperatura, para una molécula
triatómica no lineal que tiene tres modos vibracionales no degenerados con n igual
a 100, 1000 y 3000 cm-1. Como era de esperar, el modo de frecuencia más baja
contribuye a la capacidad calorífica a temperaturas bajas, alcanzando un valor
constante de Nk para temperaturas que superan largamente a Θvib para una
vibración dada. Conforme la temperatura crece, los modos vibracionales de
energía sucesivamente más altos comienzan a contribuir a la capacidad calorífica y
alcanzan el mismo valor límite de k a temperaturas más elevadas. Finalmente, la
capacidad calorífica vibracional total, que es simplemente la suma de las
contribuciones de los modos individuales, se aproxima al valor límite de 3Nk.
Figura 4.3. Evolución de la contribución vibracional a CV de una molécula con tres
grados de libertad vibracional en función de la temperatura. Se muestran las
contribuciones de cada modo vibracional (izquierda) y la contribución vibracional
total (derecha).
El comportamiento mostrado en la Figura 4.3 pone de manifiesto que para las
temperaturas en que kT >> hcn, la capacidad calorífica se aproxima al valor
constante, sugiriendo que, como para las traslaciones y rotaciones, hay un límite de
alta temperatura para la contribución vibracional a CV. Recordemos que la
aproximación a alta temperatura para la energía media de un grado de libertad
vibracional individual, es
%123 = = !" (4.43)
La diferenciación de esta expresión con respecto a la temperatura indica que la
contribución a CV es igual a Nk para cada modo vibracional en el límite de alta
temperatura, como se ilustra en la Figura 4.3 y como era de esperar según el
teorema de equipartición.
Capacidad calorífica electrónica
Debido a que la función de partición para el grado de libertad energético es
generalmente igual a la degeneración del estado fundamental, la energía media
resultante es cero. Por tanto, no hay contribución de estos grados de libertad a la
capacidad calorífica a volumen constante. Sin embargo, para sistemas con estados
electrónicos excitados que son comparables a kT, la contribución de los grados de
libertad electrónica a CV puede ser finita y debe determinarse usando la forma de
suma de la función de partición.
Entropía En la lección anterior vimos que un sistema se aproxima al equilibrio cuando
tiende hacia la configuración de energía con el máximo peso, es decir, la
configuración de energía que se observará en el equilibrio corresponde a Wmáx. La
tendencia de un sistema a maximizar W y la entropía, S, sugiere que existe una
relación entre estas cantidades. Boltzmann expresó esta relación en la siguiente
ecuación, conocida como fórmula de Boltzmann:
= !*+~ (4.44)
Esta relación establece que la entropía es directamente proporcional a ln(W), con
la constante de Boltzmann sirviendo de constante de proporcionalidad. La
ecuación (4.44) aclara que un máximo de W corresponde a un máximo de S. Pese a
que a primera vista la fórmula de Boltzmann parece ser, más bien, un enunciado ad
hoc, esta fórmula es, de hecho, equivalente a la definición termodinámica de
entropía. Para ilustrar esta equivalencia, consideremos la energía de un conjunto
de partículas. Esta energía es igual a la suma de los productos de las energías de los
niveles y sus números de ocupación de esos niveles, de forma que
= ∑ (4.45)
La diferencial total de E está dada por
= ∑ + ∑ (4.46)
Como el volumen es constante en el conjunto canónico, las energías de los niveles
son también constantes. Por tanto, el segundo término en la expresión (4.48) es
cero y el cambio de energía está relacionado exclusivamente con los cambios de los
números de ocupación de los niveles:
= ∑ (4.47)
La restricción de volumen constante también obliga a que no hay un trabajo de
tipo P-V; por tanto, por la primera ley de la Termodinámica, el cambio de energía
se debe al flujo de calor:
= / 1 = ∑ (4.48)
donde dqrev es el calor reversible intercambiado entre el sistema y el medio. La
definición termodinámica de entropía es
= 7>; (4.49)
La comparación de las dos últimas ecuaciones proporciona la siguiente definición
de entropía:
= 7>; = ∑ = !X ∑ (4.50)
donde hemos reescrito T-1 como kβ dada nuestra necesidad de β en el paso
siguiente de la deducción. Por otro lado, según vimos en la deducción de la
distribución de Boltzmann:
+ − X = 0 (4.51)
X = +
donde α y β son los multiplicadores de Lagrange de la deducción de la distribución
de Boltzmann. Sustituyendo la ecuación (4.51) en (4.50), obtenemos que:
= !X∑ = !∑ + !∑ (4.52)
= !∑ = !(*+~)
La ecuación (4.52) es simplemente una forma alternativa de la fórmula de
Boltzmann de la ecuación (4.44). La definición de entropía dada por la fórmula de
Boltzmann proporciona profundidad en la comprensión de la entropía, pero ¿cómo
se calcula la entropía de un sistema molecular? La respuesta a esta cuestión
requiere un poco más de trabajo. Debido a que la función de partición proporciona
una medida de la accesibilidad del estado de energía, se puede suponer que existe
la relación entre la función de partición y la entropía. Esta relación se puede
deducir aplicando la fórmula de Boltzmann como sigue:
= !*+~ = !*+ !∏ ! (4.53)
que se puede reescribir como:
= !*+! − !*+∏ ! = !(*+ − ∑ *+ ) (4.54)
con
= ∑ (4.55)
Usando esta definición de nuevo,
= !(*+ − ∑ *+ ) = !(∑ *+ − ∑ *+ )
= −!∑ *+ = −!∑ *+\ (4.56)
En la última línea de esta ecuación, pn es la probabilidad de ocupación del nivel de
energía n como se definió previamente. La ley de distribución de Boltzmann se
puede usar para reescribir el término de probabilidad de la ecuación (4.56) como
sigue:
*+\ = *+ = −X − *+ (4.57)
La expresión para la entropía entonces se convierte en
= −!∑ *+\ = −!∑ (−X − *+)
= !X ∑ + !∑ *+ = !X + !*+
= + !*+ = u + !*+( (4.58)
En esta expresión, U es la energía térmica del sistema y Q es la función de
participación canónica. En la ecuación (4.58), E se puede reemplazar por U, para
ser consistentes con la discusión previa al examinar la energía interna. La energía
interna está relacionada con la función de partición canónica por
% = −, ' = !"# , ' (4.59)
Usando esta relación, llegamos a una expresión muy compacta para la entropía:
= u + !*+( = !" , ' + !*+(
= , ' (4.60)
Entropía de un gas ideal monoatómico
Un gas monoatómico ideal es una colección de partículas indistinguibles.
Suponiendo que la función de partición electrónica es la unidad (es decir, el nivel
de energía electrónico fundamental es no degenerado), sólo quedan por evaluar los
grados de libertad traslacional, resultando que
= u + !*+( = R#Y" + !*+ 6789!
= R#Y" + !*+-/0 − !*+!
= R#Y +!*+-/0 − !(*+ − )
= #Y +!*+-/0 − !*+
= #Y +!*+ 'NF − !*+
= #Y + !*+ + R#!*+" − !*+ /FV #TU R/#
= #+Z + +Z*+ + R#+Z*+" − +Z*+ G /F /FV #TU KR/# (4.61)
La línea final de la ecuación (4.61) es una versión de la ecuación de Sackur–Tetrode, que puede reescribirse de forma más compacta como:
= +Z*+ / #TU R/# = +Z*+ / NF (4.62)
donde
ΛR = V #TUR/#
La ecuación de Sackur–Tetrode reproduce muchas de las propiedades
termodinámicas clásicas de los gases monoatómicos ideales encontradas
previamente. Por ejemplo, consideremos la expansión isotérmica de un gas
monoatómico ideal desde un volumen inicial V1 al volumen final V2. La inspección
de la forma expandida de la ecuación de Sackur–Tetrode, ecuación (4.61),
demuestra que todos los términos de esta expresión permanecen inalterados
excepto el segundo término que implica al volumen, de forma que
Δ = 2 − 2242 = +Z*+ ' 'f (4.63)
Este es el mismo resultado obtenido con la Termodinámica Clásica. ¿Qué ocurriría
si el cambio de entropía se iniciara con un calentamiento isocórico (∆V = 0)?
Usando la diferencia de temperatura entre los estados inicial (T1) y final (T2), la
ecuación (4.61) se transforma en
Δ = 2 − 2242 = R#+Z*+ f = +s1*+ f (4.64)
Reconociendo que CV = 3/2R para un gas monoatómico ideal, llegamos a un
resultado ya obtenido en la Termodinámica. El primer y cuarto términos de la
ecuación (4.61) son constantes, con el último variando con las masas atómicas. La
Termodinámica Clásica es totalmente incapaz de explicar el origen de estos
términos, y sólo se podría determinar su presencia a través de estudios empíricos.
Sin embargo, su contribución a la entropía aparece de forma natural cuando
usamos la perspectiva estadística.
Cuando se calcula la entropía de un gas ideal que consta de moléculas diatómicas o
poliatómicas, es mejor comenzar con la expresión general de la entropía, ecuación
(4.60), y expresar la función de partición canónica en términos del producto de las
funciones de partición molecular de cada grado de libertad energético. En el
cálculo de la entropía se debe incluir en la entropía traslacional el término
deducido anteriormente para un gas monoatómico ideal y también las
contribuciones de la energía rotacional, vibracional y electrónica.
Entropía residual
Cuando se compara la entropía calculada usando la Mecánica Estadística, con el
experimento, se observa un buen acuerdo para una gran variedad de sistemas
atómicos y moleculares. Sin embargo, en muchos sistemas moleculares, este
acuerdo no es tan bueno. Un ejemplo bien conocido es el monóxido de carbono en
el que la entropía calculada a la temperatura y presión estándares termodinámicas
es 197,9 J mol-1 K-1 y el valor experimental sólo es 193,3 J mol-1 K-1. Tanto en este
sistema como en otros, la entropía calculada es siempre mayor que la observada
experimentalmente.
Figura 4.4. Origen de la entropía residual en CO. Cada molécula de CO del sólido
puede tener una de las dos posibles orientaciones, como se ilustra en el CO central.
La razón de la discrepancia sistemática entre las entropías calculadas y
experimentales en tales sistemas es la entropía residual, o entropía asociada con la
orientación molecular en el cristal molecular a baja temperatura. Usando CO como
ejemplo, el débil momento eléctrico dipolar de la molécula hace que las
interacciones dipolo-dipolo no jueguen un papel dominante en la determinación de
la orientación de una molécula de CO en relación a las moléculas vecinas en un
cristal. Por tanto, cada CO puede adoptar una de dos orientaciones, como se ilustra
en la Figura 4.4. El sólido correspondiente a las posibles orientaciones del CO
tendrá un grado de azar inherente. Debido a que cada molécula de CO puede
asumir una de las dos orientaciones posibles, la entropía asociada a este desorden
orientacional es
= !*+~ = !*+2 = !*+2 = +Z*+2 (4.65)
donde W es el número total de disposiciones posibles del CO, que es igual a 2N con
N igual al número de moléculas de CO. Para un sistema que consta de 1 mol de CO,
se predice que la entropía residual es R ln 2 o 5,76 J mol-1 K-1, aproximadamente
igual a la diferencia entre los valores de la entropía experimental y calculada.
Finalmente, conviene hacer notar que el concepto de entropía residual aporta luz
sobre el origen de la tercera ley de la Termodinámica. Esta ley establece que la
entropía de una sustancia cristalina pura es cero a 0 K. Por “puro y cristalino,” la
tercera ley significa que el sistema debe ser puro con respecto a ambas,
composición (es decir, un único componente) y orientación en el sólido a 0 K. Para
un sistema puro tal, W = 1 y de forma correspondiente S = 0 por la ecuación (4.65).
Por tanto, la definición de la entropía cero proporcionada por la tercera ley es una
consecuencia derivada de la naturaleza estadística de la materia.
Otras funciones termodinámicas
La discusión hasta aquí ilustra la convergencia de las perspectivas estadística y
termodinámica y es impresionante la utilidad de la perspectiva estadística para
ilustrar las contribuciones destacables a las propiedades macroscópicas de la
materia. La relación entre la función de partición canónica y otras cantidades
termodinámicas se pueden deducir usando las siguientes relaciones
termodinámicas familiares para la entalpía, H, energía de Helmholtz, A, y energía
de Gibbs, G:
[ = % + (4.66)
= % − " (4.67)
= [ − " (4.68)
A partir de estas expresiones, se pueden deducir las relaciones entre la función de
partición canónica y las cantidades termodinámicas previas.
Energía de Helmholtz
Comenzando con la definición termodinámica de A de la ecuación (4.67), la
relación de esta cantidad con la función de partición canónica es
= % − " = % − " u + !*+( (4.69)
= −!"*+(
La energía de Helmholtz proporciona una interesante vía para obtener una
relación bien conocida: la ley del gas ideal. A partir de la Termodinámica, la
presión se relaciona con la energía de Helmholtz por
= −tt' (4.70)
Sustituyendo la definición de A proporcionada por la ecuación (4.69) en la
ecuación precedente,
= − t(,)t' = !" t,t'
= !" St!t' W
= !" tt' − t!t' = Y" tt' (4.71)
La función de partición canónica para un gas ideal es
( = ! = ΛR
Sustituyendo esta expresión por la función de partición canónica en la ecuación
precedente,
= !" St Ft' W = !" t't' − tNFt' = ' = ' (4.72)
Este resultado es novedoso. Esta relación se obtuvo primero a partir de medidas
empíricas, expresadas mediante las leyes de Boyle, Charles, Avogadro y Gay-
Lussac. Sin embargo, al deducir esta relación no hemos empleado esas leyes
empíricas. En lugar de ello, partiendo de un modelo mecano-cuántico para el
movimiento traslacional, hemos deducido la ley del gas ideal desde una
perspectiva puramente teórica. De nuevo la Mecánica Estadística ha
proporcionado la comprensión de una propiedad macroscópica. Este ejemplo
ilustra una de las mayores contribuciones de la Mecánica Estadística a la Química
Física: la capacidad de predecir relaciones que se han deducido hace mucho de
observaciones empíricas, y subsiguientemente se han establecido como leyes
termodinámicas.
Entalpía
Usando la definición termodinámica de entropía de la Ecuación (4.68), esta
cantidad se puede expresar en términos de la función de partición canónica, como
sigue:
[ = % + = −t,t − tt'
= −t,t + t,t'
= !"# t,t ' + !" t,t'
[ = " !" t,t ' − ! t,t' (4.73)
Pese a que la ecuación (4.73) es correcta, claramente requiere un poco de trabajo
para su implementación. No obstante, la perspectiva estadística ha mostrado que
se puede relacionar la entalpía con los detalles moleculares microscópicos, a través
de la función de partición.
Energía de Gibbs
Quizás la función de estado más importante que emerge de la Termodinámica es la
energía de Gibbs. Usando esta cantidad, se puede determinar si una reacción
química ocurrirá espontáneamente. La expresión estadística de la energía libre de
Gibbs se deduce también partiendo de la definición termodinámica de esta
cantidad, ecuación (4.68):
= +
= !"*+( + !" t,t'
= −!" *+( − t,t' (4.74)
Se han empleando expresiones deducidas previamente para la energía de
Helmholtz y la presión para llegar al resultado de la ecuación (4.78). Se puede
deducir un resultado más intuitivo aplicando la relación precedente a un gas ideal
en el que PV = nRT = NkT. Con esta relación:
= + = −!"*+( + !"
= −!"*+ ! + !" = −!"*+ = −+Z"*+ (4.75)
Esta relación es extremadamente importante porque permite penetrar en el origen
de la energía de Gibbs. A temperatura constante, el prefactor nRT de la expresión
de G es equivalente para todas las especies; por tanto, las diferencias entre las
energías de Gibbs se tienen que deber a la función de partición. Como la energía de
Gibbs es proporcional a −ln(q), un aumento del valor de la función de partición
producirá una energía de Gibbs más baja. La función de partición cuantifica el
número de estados que son accesibles a una temperatura dada; por tanto, la
perspectiva estadística obliga a que las especies con un número comparativamente
alto de estados de energía accesibles tengan una baja energía de Gibbs. Esta
relación tendrá profundas consecuencias cuando discutamos en la sección
siguiente el equilibrio químico.
Equilibrio químico
Consideremos la reacción genérica siguiente:
+ e ds + (4.76)
donde a, b, c, y d son los coeficientes estequiométricos de las especies A, B, C y D,
respectivamente.
El cambio de energía libre de Gibbs de la reacción (4.76) está relacionado con la
energía de Gibbs de las especies asociadas, como sigue:
Δ& = d& + & − & − a& (4.77)
donde el superíndice 0 indica el estado termodinámico estándar. Dado que la
constante de equilibrio K está dada por
Δ& = −Z"*+Y (4.78)
Se puede definir K en términos de las funciones de partición de las distintas
especies implicadas a partir de la aplicación de la expresión (4.74) a la energía
libre de Gibbs de cada una de las especies de la reacción (4.76):
Δ& = d S−Z"*+ W + S−Z"*+ W − S−Z"*+ W − S−Z"*+ W
= −Z"*+S W@S WS W8S W= (4.79)
La comparación de la relación anterior con la definición termodinámica de ∆G0,
conduce a que la constante de equilibrio se pueda definir como:
Y = S W@S WS W8S W= (4.80)
A T = 0 K, sólo están poblados los estados de energía más bajos de todos los grados
de libertad energéticos. Los estados fundamentales traslacional y rotacional de
todas las especies son equivalentes, pero no los estados fundamentales vibracional
y electrónico. En la representación del potencial vibrónico (vibracional y
electrónico) fundamental de una molécula diatómica mostrada en la Figura 4.5,
puede verse el origen de esta discrepancia. La presencia de un enlace entre los dos
átomos de la molécula disminuye su energía respecto a los fragmentos atómicos
separados. Debido a que la energía de los fragmentos atómicos se define como
cero, el estado vibracional fundamental está por debajo de cero en una cantidad
igual a la energía de disociación de la molécula, εD, o más comúnmente
denominada D0, Además, las diferentes moléculas tendrán diferentes valores de la
energía de disociación, de forma que esta posición del cero será específica de la
molécula.
Figura 4.5. Curva de energía potencial del estado fundamental de una molécula
diatómica. Sólo se indican los tres niveles de energía vibracionales más bajos.
El establecimiento de un estado de referencia común para los grados de libertad
vibracional y electrónico se completa como sigue. Primero, las diferencias en εD se
pueden incorporar en la parte vibracional del problema, de forma que la función
de partición electrónica permanece idéntica a nuestra anterior definición.
Volviendo al problema vibracional, la expresión general de la función de partición
vibracional se puede escribir incorporando εD como sigue:
123¡ = ∑ ¢& = () + (pmi) + (p#mi) +⋯
= M1 + mi + #mi +⋯P
= 123 (4.81)
Es decir, la forma corregida de la función de partición vibracional, q’vib, es el
producto de qvib original (sin energía del punto cero) por un factor que corrige el
desplazamiento de la energía debido a la disociación. Con este factor de corrección
en su sitio, todos los estados vibracionales fundamentales tienen energía nula. Por
tanto, la expresión final de la constante de equilibrio es
Y = S W@S WS W8S W= (4p3) =
S W@S WS W8S W= £ (4.82)
Las energías de disociación que aparecen en la ecuación (4.82) se obtienen
fácilmente usando técnicas espectroscópicas. La primera parte de la ecuación
(4.82) es la relación de las funciones de partición de productos y reactivos. Debido
a que las funciones de partición cuantifican el número de estados disponibles, esta
relación obliga a que el equilibrio favorezca aquellas especies con mayor número
de estados de energía disponibles a una temperatura dada. La segunda parte es la
energía de disociación. Este término hace que el equilibrio favorezca aquellas
especies con estados de energía más bajos. Las imágenes de la Figura 4.6 reflejan
este comportamiento. La gráfica de la izquierda muestra un reactivo y un producto
que tienen la misma energía en el estado fundamental. La única diferencia entre las
dos es que la especie producto tiene más estados de energía accesibles a una
temperatura dada que el reactivo. Otra forma de interpretar esta relación es que la
función de partición que describe el producto será mayor que la del reactivo, a la
misma temperatura, de forma que, en el equilibrio, se favorecerá el producto (K >
1). En la gráfica de la izquierda, los espaciados de energía del reactivo y del
producto son equivalentes; sin embargo, los estados del producto están situados
más altos en energía que los del reactivo. En este caso, el equilibrio estará
desplazado hacia el reactivo (K < 1).
Figura 4.6. Interpretación estadística del equilibrio. (a) Reactivo y producto con la
misma energía del estado fundamental y diferente espaciado energético. (b)
Reactivo y producto con el mismo espaciado energético y diferente energía de los
estados.
QUÍMICA FÍSICA III Serie 1 Curso 2017-2018
1. Sea un sistema formado por tres cajas idénticas, que representan subsistemas menores.
a) ¿Cuántas formas hay de colocar una bola negra en las tres cajas?
b) ¿Cuál es la probabilidad de que la bola negra se encuentre en la primera caja?
c) ¿Cuántas formas hay de colocar dos bolas, una negra y otra blanca, en las tres cajas?
d) ¿Cuál es la probabilidad de encontrar una de las dos bolas anteriores en la segunda
caja?
e) ¿Cuál es la probabilidad de colocar la bola blanca en la tercera caja?
f) ¿Cómo serían los resultados de los apartados c-e en el caso de que las dos bolas fueran
negras?
2. Considerando que la distribución de probabilidad de las velocidades moleculares en una
dimensión (vx ) viene dada por
= / .
a) Determínese la constante de normalización, C.
b) Determínese <vx>.
c) Determínese <vx2>.
d) Determínese la varianza.
3.* Demuéstrese que para cualquier variable aleatoria x, se verifica que <x2> > <x>2.
4. Una variable aleatoria x puede tomar los valores +1, 0 y -1 con probabilidades p, q y p,
respectivamente. Calcúlense el valor medio y la varianza de la función f(x) = sen (πx/4).
5. Un conjunto de 13 partículas ocupa estados con energía de 0, 100, 200 cm-1. Calcula la
energía total y el número de microestados para las configuraciones siguientes:
a) a0=8, a1=5 y a2=0
b) a0=9, a1=3 y a2=1
c) a0=10, a1=1 y a2=2
¿Alguna de estas configuraciones corresponde a una distribución de Boltzmann?
6.* Considérese un sistema de tres partículas con cuatro posibles estados de energía (0ε, 1ε,
2ε y 3ε). Sabiendo que la energía total del sistema es 5ε, ¿cuántas distribuciones distinguibles
puede haber?
7. Considérense las siguientes series de poblaciones para cuatro niveles de energía
igualmente espaciados:
T (K) Serie A Serie B Serie C
300 5 3 4
200 7 9 8
100 15 17 16
0 33 31 32
a) Demuéstrese que las series tienen la misma energía.
b) Determínese cuál de las series es la más probable.
c) Para la serie más probable, ¿es la distribución de energía consistente con la
distribución de Boltzmann?
8.* Para una colección de osciladores armónicos monodimensionales, calcúlense las
poblaciones relativas de los primeros niveles vibracionales más bajos para hν/kT igual a (a) 4;
(b) 1; (c) 0,2.
9. a) ¿Cuál es el número de microestados posibles, asociados al lanzamiento de una moneda N
veces sacando H veces cara y T veces cruz? b) Para una serie de 1000 lanzamientos, ¿cuál es el
número total de microestados asociados a 50% de caras y 50% de cruces? c) ¿Cuánto menos
probable es el resultado en el que la moneda caiga 40% caras y 60% cruces?
10. Constrúyase una tabla de configuraciones para una muestra de nueve moléculas con
energía total 9ε en un sistema con niveles de energía jε, siendo j=0, 1, 2, 3… . Determínese el
peso de cada configuración y la configuración más probable.
11. Consideremos el caso de 10 osciladores y ocho cuantos de energía. Determínese la
configuración dominante de energía para este sistema identificando las configuraciones de
energía y calcúlense los pesos correspondientes. ¿Cuál es la probabilidad de observar la
configuración dominante?
12. Cierta molécula tiene un estado excitado doblemente degenerado a 360 cm-1 por encima
del estado fundamental no degenerado. ¿A qué temperatura el 15% de las moléculas estará en
el estado superior?
13.* ¿Cuál es la temperatura de un sistema con dos niveles cuya separación energética es
equivalente a 300 cm-1 cuando la población del estado superior es la mitad que del estado
inferior?
14. La frecuencia vibracional del I2 es 208 cm−1. ¿Cuál es la probabilidad del I2 de poblar el
nivel vibracional n = 2 si la temperatura molecular es 298 K?
15.* En espectroscopía RMN, la separación de energía entre los estados de espín se crea
situando los núcleos en un campo magnético. Los protones tienen dos posibles estados de
espín: +1/2 y −1/2. La separacion de energıa entre estos dos estados depende de la intensidad
del campo magnético y está dada por
∆ = = 2,8210 JT#
donde B es la intensidad del campo magnético en teslas (T), y gN y βN son el factor nuclear y el
magnetón nuclear del protón, respectivamente. ¿Cuál es la relación de la población entre los
dos estados de espín a 1,45 T y 298 K?
16.* Determínese la función de partición para los grados de libertad vibracional del Cl2 ($ =
525 cm-1) y calcúlese la probabilidad de ocupación del primer nivel excitado vibracional a 300
y 1000 K. Determínese la temperatura a la que se observan probabilidades idénticas para el F2
($ = 917 cm−1).
*Problemas a resolver en TG por los estudiantes.
QUÍMICA FÍSICA III Serie 2 Curso 2017-2018
1. Un átomo de argón se encuentra atrapado en una caja cúbica de lado 1 cm.
a) ¿Cuál es la función de partición traslacional a 100 K, 298 K, 10000 K y 0 K? b) La forma de la función de partición traslacional, tal como se utiliza normalmente, es
válida cuando son accesibles un gran número de niveles de energía: i. ¿Cuándo resulta incorrecta la expresión normal y hemos de usar el sumatorio de forma explícita? ii. Calcúlese la temperatura del argón (atrapado en la caja cúbica de 1 cm de lado) necesaria para que la función de partición disminuya hasta un valor de 10. iii. ¿Cuál es el valor exacto de la función de partición a esta temperatura?
2. Considérese un sistema con niveles energéticos dados por un número cuántico, J, que toma valores enteros positivos desde cero hasta infinito. La energía de los niveles puede expresarse como EJ=J(J+1)a, donde a es una constante con unidades de energía. La degeneración de los niveles es 2J+1.
a) Calcúlese la función de partición a dos temperaturas, tal que kT/a = 10 y kT/a = 20. b) Represéntese la probabilidad de ocupación de los niveles energéticos en función de J.
¿Qué nivel es el más probable para cada una de las temperaturas dadas? 3. La longitud de enlace de la molécula de monóxido de carbono es 1,128 Å. Determínese la relación de poblaciones entre los niveles J=1 y J=0 para dicha molécula a 300 K y 600 K. ¿Cuál es el valor límite de esta relación cuando T → ∞? 4. Evalúese la función de partición rotacional para las siguientes especies a 298 K, suponiendo que la expresión de alta temperatura es válida.
a) OCS (B=1,48 cm-1) b) ONCl (BA=2,84 cm-1, BB=0,191 cm-1, BC=0,179 cm-1) c) CH2O (BA=9,40 cm-1, BB=1,29 cm-1, BC=1,13 cm-1)
5. El espectro de microondas de rotación pura del HCl tiene líneas de absorción en los siguientes números de onda (en cm-1): 21,19, 42,37, 63,56, 84,75, 105,93, 127,12, 148,31, 169,49, 190,68, 211,87, 233,06, 254,24, 275,43, 296,62, 317,80, 338,99, 360,18, 381,36, 402,55, 423,74, 444,92, 466,11, 487,30, 508,48. Calcúlese la función de partición rotacional a 298 K por suma directa. 6. Los niveles de energía vibracional de la molécula de I2 respecto al estado fundamental tienen los siguientes números de ondas: 213,30, 425,39, 636,27, 845,39, 1054,38 cm-1.
a) Obténgase la función de partición vibracional calculando explícitamente la suma en la expresión de la función de partición molecular, q, a 100 K y 298 K. Compárense los valores obtenidos con la función de partición calculada, suponiendo que la vibración de la molécula de iodo se puede considerar armónica, siendo el número de ondas en el equilibrio igual a 214,6 cm-1.
b) ¿Qué proporción de moléculas de iodo se encuentra en el estado fundamental y en los dos estados excitados vibracionales inferiores a la temperatura de a) 100 K y b) 298 K?
7. El dióxido de carbono tiene los grados de libertad vibracional siguientes: 1388, 667,4 (doblemente degenerado) y 2349 cm−1. ¿Cuál es la función de partición vibracional total de esta molécula a 1000 K? 8. A partir del espectro vibracional de una nueva molécula diatómica, X2, obtenido a 1000 K, se ha determinado que la fracción de moléculas que ocupa un estado vibracional dado n es como sigue:
n 0 1 2 3 >3 fracción 0,352 0,184 0,0963 0,050 0,318
¿Cuáles son los espaciados energéticos vibracionales del X2? 9. La molécula de NO tiene un estado electrónico excitado que sólo está 121,1 cm-1 por encima del estado fundamental, siendo este estado excitado y el fundamental doblemente
*Problemas a resolver en TG por los estudiantes.
degenerados. Calcúlese y dibújese la función de partición electrónica desde cero a 1000 K. ¿Cuál es la distribución de poblaciones a temperatura ambiente? 10. Los nueve niveles de energía más bajos del vanadio (V) gaseoso tienen las siguientes energías (E, cm-1) y degeneraciones (gn):
n 0 1 2 3 4 5 6 7 8 E 0 137,38 323,46 552,96 2112,28 2153,21 2220,11 2311,36 2424,78 gn 4 6 8 10 2 4 6 8 10
¿Cuál es el valor de la función de partición electrónica para el V a 298 K? 11. Supóngase un sistema con microestados no degenerados y con energías equidistantes En =
n ∆E, siendo ∆E > 0 y n cualquier número entero comprendido entre cero e infinito. a) Obténgase una expresión para la función de partición considerando que la suma de
infinitos términos de una progresión geométrica es a1/(1-r) siendo r la razón de la progresión y a1 el primer término de la progresión geométrica.
b) ¿Cuál sería la función de partición si kT >> ∆E? c) Para el caso del apartado b), dedúzcase una expresión para la energía interna del
sistema. 12. Determínese la energía interna de HCl (B=10,59 cm−1 y =2886 cm−1) bajo las condiciones termodinámicas estándar. 13. La velocidad del sonido, csonido, viene dada por la relación
=
/
donde Cp y Cv son, respectivamente, las capacidades caloríficas a presión y volumen constante, R es la constante de los gases ideales, T es la temperatura y M es la masa molar.
a) ¿Cuál es la expresión de la velocidad del sonido para un gas monoatómico ideal? b) ¿Cuál es la expresión de la velocidad del sonido de un gas diatómico ideal? c) ¿Cuál es la velocidad del sonido en el aire a 298 K, suponiendo que el aire está
compuesto mayoritariamente de nitrógeno (B=2,00 cm-1 y =2359 cm-1)? 14. Determínese la entropía molar estándar del OClO, una molécula triatómica no lineal, donde BA=1,06 cm−1, BB=0,31 cm−1, BC=0,29 cm−1 y =938 cm−1, =450 cm−1 y =1100 cm−1. 15. Determínese las contribuciones rotacional y vibracional a la energía de Gibbs estándar de N2O (NNO), una molécula triatómica lineal, donde B=0,419 cm−1 y =1285 cm−1, =589 cm−1 (doblemente degenerado) y =2224 cm−1. 16. Determínense − (0), − (0), − (0) y para la reacción de disociación !(") 2 !(") a 298 K, sabiendo que la constante rotacional, la frecuencia de vibración y la energía de disociación del Na2 son, respectivamente 0,155 cm−1, 159 cm−1 y 70,4 kJ/mol, y que la degeneración electrónica del estado fundamental del Na es 2. 17. Calcúlese el valor termodinámico estadístico de la constante de equilibrio Kp de la reacción I2 2I a 1000 K. Los datos espectroscópicos para la molécula de I2 son los siguientes: B=0,0373 cm-1, =214,56 cm-1, D0=1,5417 eV. Los átomos de iodo tienen un estado fundamental 2P3/2.
18.* Determínese la constante de equilibrio para la reacción de disociación !(") 2 !(") a 298 K, sabiendo que la constante rotacional, la frecuencia de vibración y la energía de disociación del Na2 son, respectivamente 0,155 cm−1, 159 cm−1 y 70.4 kJ/mol, y que la degeneración electrónica del estado fundamental del Na es 2. ¿Cuál es el valor de la energía de Gibbs estándar de esa reacción a 298 K? 19.* Calcúlense − (0), −(0), − (0) y a 300 K para la molécula de CO2. Los modos de vibración tienen los siguientes números de onda: 1340, 667 (doblemente degenerado) y 2349 cm−1. La constante rotacional es B=0,390 cm−1.
*Problemas a resolver en TG por los estudiantes.
20.* Calcúlense los valores de Δ&, Δ& y Δ& para (") 2(") a 3000 K sabiendo que para el H2 M=2,016 g/mol, D0=432,073 kJ/mol, Θrot=87,547 K, Θvib=6338,2 K y g0=1, y para el H M=1,008 g/mol y g0=2. ¿Cuál es el valor de la constante de equilibrio a 3000 K? 21.* Calcúlese la constante de equilibrio a 800 K para la reacción de intercambio '(") +)*+(") )'(") + *+(") a partir de los siguientes datos: (H2O)/cm-1=3656,7, 1594,8, 3755,8; (DCl) )/cm-1=2145; (HDO) )/cm-1=2726,7, 1402,2, 3707,5; (HCl) )/cm-1=2991; BA(H2O)/cm-1=27,88, BB(H2O)/cm-1=14,51; BC(H2O)/cm-1=9,29; B(DCl)/cm-1=5,449; BA(HDO)/cm-1=23,88, BB(HDO)/cm-1=9,102, BC(HDO)/cm-1=6,417; B(HCl)/cm-1=10,59.
22.* Calcúlense los valores de Δ&, Δ& y Δ& para (") +'(") '(") a 298 K
sabiendo que para el N2 M=28,0134 g/mol, D0=941,4 kJ/mol, Θrot=2,87505 K, Θvib=3392,01 K y g0=1; para el O2 M=31,9988 g/mol, D0=491,888 kJ/mol, Θrot=2,079 K, Θvib=2273,64 K y g0=3; y para el NO M=30,008 g/mol, D0=627,7 kJ/mol, Θrot=2,4520 K, Θvib=2738,87 K, g0=2 y Θelec=174,2 K. ¿Cuál es el valor de la constante de equilibrio a 3000 K? 23.* Calcúlense − (0), −(0), − (0) y a 298 K para la molécula de NO2 sabiendo que M=46,008 g/mol, D0=928,3 kJ/mol, Θrot=4,24301 K, Θvib/K=1088,9, 1953,6, 2396,3 y g0=2.
Lección 5: TEORÍA CINÉTICA DE GASES
Teoría cinética del movimiento y la presión de un gas. Distribución de velocidades
en una dimensión. La distribución de Maxwell de la velocidad molecular. Valores
comparativos de la distribución de velocidad Vmed, Vmp y Vrms. Efusión de un gas.
Colisiones moleculares. Recorrido libre medio.
El propósito de esta lección es deducir propiedades macroscópicas observadas
experimentalmente a partir de un modelo microscópico cuyas características han
de postularse. El modelo será correcto si los resultados obtenidos a partir de él
concuerdan con los datos experimentales. La teoría cinética de los gases es un
ejemplo sencillo de la relación entre teoría y experimento. Desde un punto de vista
estructural, los gases son las sustancias más simples. Por razón de sencillez, aquí
nos ocuparemos sólo de los gases ideales.
Teoría cinética del movimiento y la presión de un gas
La teoría cinética de los gases permite interpretar las leyes de los gases desde el
punto de vista microscópico considerando el movimiento traslacional de las
partículas de un gas. Esta teoría se basa en los siguientes supuestos:
1) El gas está constituido por un número enorme de átomos o moléculas,
llamados genéricamente partículas, requisito necesario para poder trabajar
con promedios estadísticos.
2) La densidad del gas es tal que la distancia entre las partículas es muy
grande en comparación con su tamaño. Por ejemplo, consideremos un mol
de Ar a una temperatura de 298 K y 1 atm de presión. Según la ley del gas
ideal, el gas ocupa un volumen de 24,4 L ó 0,0244 m3. Dividiendo este
volumen por el número de Avogadro obtenemos un valor medio por átomo
de Ar de 4,05 × 10−26 m3 o 40,5 nm3. El diámetro del átomo de Ar es ∼0,29
nm lo que corresponde a un volumen de 0.013 nm3. La comparación del
volumen disponible por partícula con el volumen medio de un átomo de Ar
individual demuestra que sólo un 0.03% del volumen disponible está
ocupado por partículas. Incluso para partículas con diámetros
sustancialmente mayores que el Ar, la diferencia entre el volumen medio
disponible por partícula y el volumen de la partícula misma son tales que la
distancia entre las partículas en fase gas es sustancial. Dada la gran
distancia entre partículas en fase gas, se interpreta que cada partícula se
desplaza a través del espacio como una entidad separada, sin perturbar,
hasta que ocurre una colisión con otra partícula o con las paredes del
recipiente que confina al gas.
3) El movimiento de las partículas se describe mediante las leyes del
movimiento de Newton. Pese a que en los capítulos previos hemos visto que
las descripciones clásicas fallan en la caracterización de muchas de las
propiedades microscópicas de átomos y moléculas, recordemos que el
espaciado de energía entre estados de energía traslacional es muy pequeño
en relación a kT, de forma que una descripción clásica del movimiento
traslacional es apropiada.
4) Las colisiones entre las partículas y con las paredes del recipiente se
consideran perfectamente elásticas, conservándose la energía cinética
traslacional molecular. Esto equivale a ignorar la transferencia de energía
con otras moléculas, la pared, y con los grados de libertad de rotación y
vibración, lo que supone obviar la estructura interna de las partículas. Sin
embargo, conviene matizar que esta restricción se refiere al promedio de
las colisiones. Es decir, la restricción de la conservación de la energía
cinética traslacional se aplica al conjunto de todas las moléculas,
conservándose entonces la energía de traslación media.
Un logro de la teoría cinética de gases es su capacidad para describir la presión de
un gas ideal. La presión ejercida por un gas sobre el recipiente que lo confina
proviene de las colisiones de las partículas del gas con las paredes del recipiente.
Debido a que el número de partículas que componen el gas es del orden del
número de Avogadro, se puede imaginar que el número de colisiones es también
grande. Para describir la presión usando la teoría cinética, una partícula se
interpreta desplazándose a través del espacio con un vector velocidad, , que se
puede descomponer en tres componentes cartesianas: vx, vy y vz como se ilustra en
la Figura 5.1.
Figura 5.1. Descomposición de la velocidad de una partícula, (es decir, v), en sus
componentes cartesianas.
El cuadrado del módulo de la velocidad (v2) en función de sus tres componentes es
(5.1)
La energía cinética de la partícula es (1/2)mv2, de modo que
, , , (5.2)
La ecuación (5.2) implica que la energía traslacional total es, simplemente, la suma
de la energía traslacional según cada dimensión cartesiana. La presión proviene de
las colisiones de las partículas de gas con el contenedor; por tanto, para describir la
presión usando la teoría cinética debemos considerar lo que ocurre durante una
colisión entre una partícula de gas y la pared. La partícula al chocar con la pared
del recipiente le trasmite su momento lineal, lo que origina la presión. La
definición de presión es la de fuerza por unidad de área y, según la segunda ley de
Newton, la fuerza es igual al producto de la masa por la aceleración. Usando estas
dos definiciones, la presión se expresa como
(5.3)
siendo F la fuerza de la colisión, A el área de la pared con la que colisiona la
partícula, m la masa de la partícula, vi la velocidad en la dirección i (i = x, y o z), y pi
el momento lineal de la partícula en la misma dirección i. La ecuación (5.3) ilustra
que la presión está relacionada con el cambio del momento lineal con respecto al
tiempo, y sugiere que el momento se intercambia entre la partícula y la pared
durante la colisión. Debido a la conservación del momento, cualquier cambio del
momento lineal de la partícula debe estar acompañado de un cambio igual y de
signo opuesto del momento de la pared del recipiente. En la Figura 5.2 se describe
una colisión, en la que el cambio del momento lineal de la partícula en la dirección
es -2mvx (nótese que no hay cambio en el momento en las direcciones y o z). En tal
caso, un cambio en el momento igual a 2mvx debe darse en la pared. (Tenga en
mente que la pared es muy pesada; por tanto no se mueve como consecuencia de la
colisión.
Figura 5.2. Representación de la colisión entre una partícula de gas de masa m que
se mueve en la dirección x con una velocidad vx y una pared.
La presión medida en la pared del recipiente es el resultado de la suma de las
colisiones de un gran número de partículas por unidad de tiempo. Por tanto, el
cambio de momento total que da lugar a la presión es igual al producto del cambio
en el momento de la colisión de una única partícula por el número total de
partículas que colisionan con la pared
Δ é"# %&ú()*+(*,é-.,/01 (5.4)
Figura 5.3. Elemento de volumen para determinar el número de colisiones con la
pared por unidad de tiempo.
¿Cuántas moléculas golpean la cara del contenedor en un periodo de tiempo? Para
responder a esta cuestión se debe considerar el tiempo en el que se cuentan las
colisiones. Consideremos un elemento de volumen definido por el área de la pared,
A, y la distancia, ∆x, como se ilustra en la Figura 5.3. El elemento de volumen de
colisión descrito en la Figura 5.3 viene dado por
2 3%∆51 (5.5)
La longitud de la caja, ∆x, está relacionada con el intervalo de tiempo en el que
contamos las colisiones, ∆t, y la componente de la velocidad de la partícula
perpendicular a la cara de la caja (que consideramos que es la dirección x):
∆5 ∆6 (5.6)
En esta expresión, vx es de una única partícula; sin embargo, cuando describamos
las colisiones de una colección de partículas usaremos un promedio de esta
cantidad. Finalmente, el número de partículas que colisionan con la pared del
recipiente en el intervalo de tiempo es igual a la densidad en número, 78, que es
igual al número de partículas del recipiente, N, dividido por el volumen del
recipiente, V, multiplicado por el elemento de volumen colisional de la Figura 5.3:
7 785%3∆61 9:;< %3∆61 (5.7)
El factor 1/2 de la ecuación (5.7) da cuenta de la direccionalidad del movimiento
de las partículas. Las colisiones de interés ocurren con la pared del recipiente
definido por el área A descrita en la Figura 5.3. Debido a que las partículas viajan
bien en la dirección +x o en la −x con igual probabilidad, sólo aquellas moléculas
que viajan en la dirección +x golpearán en el área de interés. Por tanto, el número
total de partículas, N, se divide por dos para tener en cuenta la dirección del
movimiento de la partícula. Empleando la ecuación (5.7), el cambio del momento
lineal de la pared del recipiente consecuencia de las colisiones de las partículas
vendrá dado por
∆ ∆é"# %&ú()*+(*,é-.,/01
%21%71 %21 9:;< >∆
9:;< 3∆6⟨⟩ (5.8)
donde ⟨⟩ representa un valor medio de la velocidad cuadrática en la dirección x,
ya que las partículas muestran una distribución de velocidades, cuya expresión
discutiremos más adelante en esta lección. Con el cambio total del momento lineal
proporcionado por la ecuación (5.8), la fuerza y la correspondiente presión
ejercida por el gas sobre la pared del recipiente, ecuación (5.3), son los siguientes:
A ∆BCBDE∆ 9:;
< 3⟨⟩
9:;
< ⟨⟩ (5.9)
La ecuación (5.9) se puede convertir en una expresión más familiar teniendo en
cuenta que la energía traslacional media de una partícula individual en una
dimensión es
⟨>F⟩ GH
(5.10)
Por tanto,
9:;< ⟨⟩ 9:;
< IJ 9KH< (5.11)
La ecuación (5.11) es la ley del gas ideal. Pese a que esta relación es familiar, la
forma en la que se ha deducido es extremadamente interesante. Empleando una
descripción clásica de las colisiones moleculares con la pared del recipiente, y
escalando este resultado a proporciones macroscópicas, hemos deducido uno de
los resultados centrales de la química de sistemas gaseosos. Un segundo resultado
deducido de la teoría cinética de gases es la relación entre la velocidad cuadrática media y la temperatura. Si el movimiento de las partículas es al azar, las
velocidades medias según las tres dimensiones cartesianas son equivalentes. La
velocidad media en cualquier dimensión será cero debido a que habrá, en
promedio, tantas partículas desplazándose en la dirección positiva como en la
negativa. Por contra, la raíz cuadrada de la velocidad cuadrática media, también
llamada velocidad raíz cuadrática media, viene dada por:
⟨⟩ ⁄ ⟨ ⟩ ⁄ ⟨3⟩ ⁄ NGH ⁄ (5.12)
Así, la teoría cinética predice que la velocidad raíz cuadrática media de las
partículas de gas aumentará con la raíz cuadrada de la temperatura y decrecerá
con la raíz cuadrada de la masa de la partícula.
Distribución de velocidades en una dimensión
La variación de las velocidades de las partículas de un gas puede describirse
mediante la función de distribución de velocidades. Teniendo en cuenta lo visto en
la Lección 1, una función de distribución de velocidades describe la probabilidad
de que una partícula del gas tenga una velocidad en un rango dado. Además, en la
Lección 3, obtuvimos que los espaciados de los niveles de energía traslacionales
son suficientemente pequeños como para que la velocidad se pueda tratar como
una variable continua. En consecuencia, la función de distribución de velocidades
describe la probabilidad de que una partícula tenga una velocidad en el rango vx +
dvx, vy + dvy y vz + dvz.
Sea ΩP , , Q la función que describe la distribución de velocidades para un
conjunto de partículas gaseosas. Dado que las tres componentes de la velocidad (vx,
vy, vz) son independientes entre sí, la función de distribución ΩP , , Q es el
producto de funciones de distribución individuales como sigue:
ΩP, , Q R%1RPQR%1 (5.13)
siendo f(vx) la distribución de velocidades en la dirección x y así sucesivamente.
Suponiendo que el gas está confinado en un espacio isotrópico, la dirección en la
que se mueve la partícula no afecta a las propiedades del gas, y, en consecuencia, la
función de distribución ΩP , , Q sólo depende del módulo de la velocidad (v).
Tomando el logaritmo neperiano de la ecuación (5.13) y derivando la expresión
resultante con respecto a vx mientras se mantienen constantes la velocidades
según las otras dos direcciones se llega a que:
,&Ω%1 ,&R%1 ,&RPQ ,&R%1
S9T%1S> U,V
9W%>1> (5.14)
La ecuación (5.14) se puede reescribir usando la regla de la cadena para la
diferenciación, permitiendo que la derivada de ln con respecto a vx se escriba como
9T%1 SS>U,V 9W%>1> (5.15)
Usando la ecuación (5.1), el segundo factor del primer miembro de la ecuación
(5.15) puede evaluarse fácilmente como:
SS>U,V SS> P Q
⁄ (5.16)
%21P Q
X ⁄ >
Sustituyendo este resultado en la ecuación (5.15) y reagrupando, se obtiene:
9T%1 SS>U,V 9W%>1>
9T%1 > 9W%>1>
9T%1 9W%>1>> (5.17)
Dado que las distribuciones de velocidades son equivalentes en todas las
direcciones, la deducción anterior es también aplicable a vy o vz, de modo que:
9T%1 9WPUQUU (5.18)
9T%1 9W%V1VV (5.19)
La comparación entre las ecuaciones (5.17), (5.18) y (5.19) establece la siguiente
igualdad:
9W%>1>> 9WPUQ
UU 9W%V1VV (5.20)
Para que la ecuación (5.20) sea correcta, cada uno de los miembros de la ecuación
(5.19) debe ser igual a una constante, γ, de forma que
9WPYQYY −[ donde j = x, y, z (5.21)
El signo menos en la ecuación (5.21) hace que [ una cantidad positiva que sirve
para asegurar que f(vj) no diverja cuando vj tiende a infinito. La integración de la
ecuación (5.21) conduce a:
RP\Q 3(X]YF ⁄ (5.22)
El último paso de la deducción es determinar A y γ. Por un lado, A puede calcularse
a partir de la normalización de la función f(vj) en el intervalo −∞ ≤ vj ≤ +∞,
^ RP\Q+\_`X` 1 ^ 3(X]YF ⁄ +\_`
X` (5.23)
1 3 ^ (X]YF ⁄ +\ 3bc]_`X`
3 b ]c
Incluyendo el factor de normalización en (5.22), la distribución de velocidades en
una dimensión es
RP\Q ]c ⁄ (X]YF ⁄
(5.24)
Por otro lado, γ puede evaluarse a partir de la expresión del segundo momento de
la distribución de velocidades con respecto a x, <vx2>, y sabiendo que <vx
2>=kT/m:
⟨⟩ GH ^ R%1_`
X` +
^ _`X` ]c
⁄ (X]>F ⁄ + ]c ⁄ ^ _`
X` (X]>F ⁄ +
]c ⁄ d]bc] e
]
GH
] (5.25)
Con la definición de γ, se llega a la llamada distribución de velocidades de Maxwell–
Boltzmann en una dimensión:
RP\Q cGH
⁄ (XYF ⁄ GH fcKH
⁄ (XfYF ⁄ KH (5.26)
donde m es la masa de la partícula en kg y M es la masa molar en kg mol−1,
obtenida a partir de la expresión que incluye m usando la relación R = NA k. La
distribución de velocidades es igual al producto de un factor pre-exponencial que
es independiente de la velocidad por un factor exponencial que sí depende de ella,
siendo este último término una reminiscencia de la distribución de Boltzmann. En
la Figura 5.4 se representa la distribución de velocidades unidimensional en la
dirección x para el CO2 a 298 K. Nótese que el máximo de la distribución está a 0
ms−1.
Figura 5.4. Distribución de velocidades en una dimensión para CO2 a 298 K.
La Figura 5.5 recoge la función de distribución de velocidades unidimensional de
Ar a dos temperaturas diferentes. Se puede observar el aumento de la anchura de
la distribución con la temperatura, consistentemente con el aumento de la
probabilidad de población de los estados de energía de traslación más elevados
cuyas velocidades son mayores. La Figura 5.6 muestra la distribución para Kr, Ar y
Ne a 298 K. La distribución de velocidades es estrecha para el Kr y ancha para el Ne
reflejando que la distribución depende de la masa.
Figura 5.5. Distribuciones de velocidades en una dimensión para Ar a 298 K (línea
roja) y 1000 K (línea amarilla).
Figura 5.6. Distribuciones de velocidades en una dimensión para Kr (línea roja,
masa molar = 83,8 g mol−1), Ar (línea amarilla, masa molar = 39,9 g mol−1) y Ne
(línea azul, masa molar = 20,2 g mol−1) a 298 K.
La distribución de Maxwell de la velocidad molecular
A partir de las distribuciones de velocidad unidimensionales, se puede determinar
la distribución tridimensional del módulo de la velocidad (v). Nos centramos en el
módulo de la velocidad en vez del vector velocidad porque las propiedades físicas
de los gases sólo dependen de la velocidad de la partícula del gas, y no de la
dirección del movimiento. Por tanto, en general, sólo interesa el módulo de la
velocidad, también llamado rapidez o celeridad. Según vimos:
P Q (5.27)
Para determinar la distribución del módulo de la velocidad de las partículas, F(v),
consideremos la interpretación geométrica de la velocidad mostrada en la Figura
5.7. Esta gráfica describe el espacio de velocidades, en donde por analogía con el
espacio cartesiano en distancia lineal (x, y, z) se han reemplazado las distancias por
las componentes cartesianas de la velocidad (vx, vy, vz). La Figura 5.7 muestra que la
velocidad de la partícula viene descrita por un vector, , con coordenadas vx, vy, y vz
en el espacio de velocidades cuya longitud es igual a la rapidez o módulo de la
velocidad (v), ecuación (5.27).
Figura 5.7. Ilustración del espacio de velocidades. Las componentes cartesianas de
la velocidad de las partículas, , vienen dadas por vx, vy y vz. La capa esférica
representa un elemento de volumen diferencial del espacio de las velocidades,
cuyo volumen es 4πv2dv.
La distribución del módulo de la velocidad de las partículas F(v) se define en
términos de las distribuciones de velocidad unidimensional según cada dirección,
ecuación (5.26), como sigue:
A%1+ R%1RPQR%1+++
g cGH
⁄ (X>F GH⁄ h g cGH
⁄ (XUF GH⁄ h
5 g cGH
⁄ (XVF GH⁄ h +++
cGH
N ⁄ (iXP>F_UF_VFQj GH⁄ +++ (5.28)
La distribución del módulo de la velocidad en la ecuación (5.28) está definida en
términos de las componentes cartesianas del vector velocidad. Esto conduce a
expresar los factores que implican al vector velocidad en términos del módulo de
la velocidad para así obtener F(v)dv. Para lograr esto, de forma similar a la
transformación de coordenadas cartesianas en coordenadas esféricas, se
transforma el elemento infinitesimal de volumen en el espacio de las velocidades,
dvxdvydvz (Figura 5.7), en el elemento volumen de velocidad, 4π2dv, después de la
integración respecto a las variables angulares, quedando únicamente una
dependencia con v. Además, sustituyendo vx2 + vy
2 + vz2 en (5.28) por v2, ecuación
(5.27), se obtiene que:
A%1+ 4l cGH
N ⁄ (XF GH⁄ + (5.29)
La ecuación (5.29) está expresada en términos de la masa de una partícula
individual de gas. Como la masa molar M es igual a NA × m, donde NA es el número
de Avogadro y m es la masa de la partícula, y R = NA × k, la ecuación (5.29) se puede
escribir también en términos de M como:
A%1+ 4l fcKH
N ⁄ (XfF KH⁄ + (5.30)
Las ecuaciones (5.29) y (5.30) son las llamadas distribuciones de velocidad de
Maxwell y representan la distribución de probabilidad de que una molécula tenga
una velocidad entre v y v+dv. La comparación de esta distribución con la
distribución de velocidades unidimensionales de la ecuación (5.26) revela muchas
similitudes siendo la principal diferencia la dependencia con que ahora aparece v2
en el factor pre-exponencial de la ecuación (5.30). Una segunda diferencia es el
rango de la distribución. A diferencia de las componentes de la velocidad, donde
los valores negativos son posibles ya que la partícula puede moverse en la
dirección contraria con respecto a una coordenada dada, la rapidez o módulo dela
velocidad de la partícula debe ser mayor que cero, de forma que la distribución va
de cero hasta infinito.
Figura 5.8. Representación de la distribución de velocidad para Ar a dos
temperaturas (298 K, línea roja, y 1000 K, línea amarilla).
La Figura 5.8 recoge la variación de la distribución de la velocidad de Maxwell con
la temperatura para Ar. A diferencia de la distribución de velocidades de la
ecuación (5.26), la distribución de la rapidez no es simétrica. Esto es debido a que
el aumento inicial de la probabilidad se debe al factor v2 de las ecuaciones (5.29) o
(5.30), pero para valores mayores de rapidez la probabilidad decae
exponencialmente. Segundo, conforme la temperatura crece, se hacen evidentes
dos tendencias. El máximo de la distribución se desplaza a alta rapidez conforme la
temperatura crece. Esto es de esperar porque un aumento de la temperatura
corresponde a un incremento de la energía cinética y subsecuentemente un
crecimiento de la rapidez de las partículas. Sin embargo, no es la distribución
completa la que se desplaza simplemente hacia velocidades mayores. En lugar de
ello, la curvatura de distribución cambia, con este comportamiento muy
pronunciado en la parte de alta rapidez ya que un incremento de kT aumenta la
probabilidad de ocupar los estados traslacionales de energía elevada.
Figura 5.9. Representación de la distribución de velocidad para Kr (línea roja,
masa molar = 83,8 g mol−1), Ar (línea amarilla, masa molar = 39,9 g mol−1) y Ne
(línea azul, masa molar = 20,2 g mol−1) a 298 K.
La Figura 5.9 presenta una comparación de las distribuciones de rapidez de Ne, Ar
y Kr, a 298 K. Los picos de la distribución de rapidez se desplazan hacia menores
valores de la rapidez, conforme aumenta la masa atómica. Este comportamiento se
debe a que la energía cinética media es 3/2 kT, una cantidad que sólo depende de
la temperatura. Como la energía cinética es igual a 1/2 mv2, un aumento de masa
debe compensarse con una reducción de la raíz cuadrática media de la rapidez.
Esta conducta se refleja en las distribuciones presentadas en la Figura 5.9.
Figura 5.10. Esquema de un aparato experimental usado para verificar la
distribución de rapidez de Maxwell. Las moléculas se emiten desde un horno y
pasan a través de ventanas para producir un haz de moléculas. Este haz alcanza un
selector de velocidad que consta de dos discos rotantes con ranuras en cada uno.
Después de pasar el primer disco, las moléculas alcanzan el segundo que ha rotado
un ángulo θ. Sólo las moléculas para las que la velocidad es igual a ωx/θ, donde ω
es la velocidad angular del disco y x es la separación entre los discos, pasarán a
través del segundo disco y alcanzarán el detector.
Una de las primeras comprobaciones experimentales de la ley de distribución de
Maxwell se debe a Miller y Kusch en 1955 [Phys. Rev. 99 (1955), 1314]. En la Figura
5.10 se presenta un esquema del aparato empleado en este estudio. Se usó un
horno para crear un gas a temperatura conocida, y se practicó un orificio en una
cara del horno a través de la cual podía emerger el gas. El chorro de moléculas de
gas que escapaban del horno se dirigió a través de aberturas espaciales para crear
un haz de partículas, que se dirigió hacia el selector de velocidad. Cambiando la
rapidez rotacional de selector de velocidad, se varió la velocidad del gas requerida
para pasar a través del cilindro. Entonces se mide el número de partículas de gas
que pasan a través del cilindro en función de la rapidez rotacional para determinar
la distribución de la rapidez del gas. Los resultados de este experimento para el
potasio en un horno a una temperatura de 466 ± 2 K se presentan en la Figura
5.11. La comparación entre el número de partículas con una cierta rapidez medida
experimentalmente y a la predicción teórica de una distribución de Maxwell es
excelente.
Figura 5.11. Comparación de la distribución experimental de la velocidad de las
partículas de potasio gaseoso a 466 ± 2 K (en círculo) frente a la distribución de
velocidad de Maxwell esperada (línea roja).
Valores comparativos de la distribución de velocidad vmed, vmp y vrms
La distribución de rapidez (o módulo de velocidad) de Maxwell describe la
probabilidad de observar una partícula en un rango de rapidez; sin embargo a
menudo se requiere el conocimiento de la distribución entera cuando se comparan
las propiedades de los gases. En lugar de ello, suelen ser más útiles las cantidades
representativas de esta distribución al indicar cómo cambia la distribución en
función de la masa o la temperatura. Por ejemplo, en la Figura 5.9 se ve claro que
las distribuciones de rapidez del Ne, Ar y Kr son diferentes, pero se puede alcanzar
el mismo resultado sin representar la distribución entera al comparar sólo ciertas
medidas de la distribución, tales como la rapidez a la que la distribución es máxima
o la rapidez media.
El primer valor comparativo que consideramos es la rapidez más probable, vmp,
que es igual a la rapidez a la que F(v) tiene el máximo. Esta cantidad se determina
calculando la derivada de F(v) con respecto a la rapidez:
%1
g4l cGH
N ⁄ (XF GH⁄ h
4l cGH
N ⁄ P(X
F GH⁄ Q
4l cGH
N ⁄ (XF GH⁄ 2 − mGH (5.31)
La rapidez más probable es la rapidez a la que dF(v)/dv es igual a cero, que se dará
cuando el factor contenido en el corchete de la ecuación (5.31) sea igual a cero. En
tal caso, vmp está dada por
2 − nomGH 0
bGH bKHf (5.32)
La velocidad media, vmed, se puede determinar usando la distribución de velocidad
de Maxwell y la definición de valor medio dado en la Lección 1:
q ⟨⟩ ^ A%1+`r
^ g4l cGH
N ⁄ (XF GH⁄ h +`r
4l cGH
N ⁄ ^ N(XF GH⁄ +`r
4l cGH
N ⁄ GH
q sGHc ⁄ sKHcf
⁄ (5.33)
La cantidad final a comparar es la raíz cuadrada de la rapidez cuadrática media,
vrms. Esta cantidad es igual a <v2>1/2 o simplemente la raíz cuadrada del segundo
momento de la distribución:
t⟨⟩u ⁄ NGH ⁄ NKHf ⁄ (5.34)
La ecuación (5.34) es igual a la predicción de la teoría cinética de los gases dada
por la ecuación (5.10). Las posiciones de vmed, vmp y vrms relativas a la distribución
de rapidez para el Ar a 298 K se muestran en la Figura 5.12. Comparando las
ecuaciones (5.32), (5.33) y (5.34) se encuentra que las únicas diferencias entre los
valores son las constantes, lo que se pone de manifiesto cuando se consideran las
relaciones entre esas cantidades. Concretamente, la relación de vrms/vmp= (3/2)1/2 y
vmed/vmp = (4/π)1/2 de forma que vrms > vmed > vmp. Se observa también que los tres
valores de referencia muestran la misma dependencia con T y con la masa de las
partículas: aumentan con la raíz cuadrada de T y decrecen con la raíz cuadrada de
M.
Figura 5.12. Comparación entre velocidad más probable (vmp), velocidad media
(vmed) y velocidad raíz cuadrática media (vrms) para Ar a 298 K.
Efusión de un gas
En los experimentos que verificaron la precisión de la distribución de rapidez de
Maxwell se utilizó el escape de un gas a través de un orificio en la pared del horno
que lo contenía (véase la Figura 5.10). En esta técnica, el gas confinado en la caja
está a una presión finita y separado del vacío por una pared fina del horno que
presenta una abertura. La presión del gas y el tamaño del orificio es tal que las
moléculas no sufren colisiones cuando pasan a través o cerca de la misma. El
proceso en el que un gas pasa a través de una abertura en estas condiciones se
denomina efusión y se emplea para producir un “haz” de partículas de gas. Esta
técnica se usa, por ejemplo, para crear haces atómicos o moleculares que pueden
colisionar con haces de otras moléculas en aras de estudiar la dinámica de las
reacciones químicas. La velocidad con la que escapan las partículas de gas a través
del orificio de un área dada se puede relacionar con la velocidad a la que las
partículas golpean un área de la cara de la caja u horno. Para deducir la velocidad
de efusión del gas, procedemos de forma análoga a como hicimos para deducir la
presión. Sea dNc el número de partículas que golpean la pared del recipiente y
dNc/dt la velocidad de colisión, es decir, el número de colisiones con la pared por
unidad de tiempo. Esta última cantidad es proporcional al área golpeada, A.
Además, la velocidad de colisión dependerá de la velocidad de las partículas de
modo que de un aumento de velocidad resultará un aumento de la velocidad de las
colisiones. Finalmente, la velocidad de colisión será directamente proporcional a la
densidad de partículas, 78, definida como el número de partículas por unidad de
volumen. Según lo anterior, se puede escribir que:
:v 783^ `
r R%1+ (5.35)
La integral de la ecuación (5.35) es la velocidad media de las partículas en la
dirección x de la colisión con el área de interés. Evaluando dicha integral desde
cero a infinito se obtiene:
:v 783^ `
r cGH
⁄ (X>F GH⁄ +
783 cGH
⁄ ^ `r (X>F GH⁄ +
783 cGH
⁄ GH 783 GHc
⁄
:v 783
w q (5.36)
En el paso final, se ha usado la definición de rapidez media, vmed, proporcionada
por la ecuación (5.33). Definiendo el flujo de colisiones, Zc, como el número de
colisiones por unidad de tiempo y por unidad de área, se llega a que:
x" :v ⁄
w78q (5.37)
A veces es más conveniente expresar el flujo de colisiones en términos de la
presión del gas. Para ello, se tiene en cuenta que:
78 :< 9:;
< yGH (5.38)
de modo que Zc se transforma en:
x" y%cGH1z/F y:;
%cfKH1z/F (5.39)
donde m es la masa de la partícula (en kg) y M es la masa molar (en kg mol−1).
La efusión produce un decrecimiento de la presión del gas en función del tiempo.
El cambio de presión está relacionado con el cambio del número de partículas del
recipiente, N, como sigue:
y :|H< GH
<: (5.40)
La cantidad dN/dt se puede relacionar con la velocidad de colisiones, ecuación
(5.39), considerando lo siguiente: primero, si el espacio fuera del recipiente está a
una presión significativamente más baja que el recipiente y escapa una partícula
del recipiente, no retornará. Segundo, cada colisión corresponde a una partícula
que golpea el área del orificio, de forma que el número de colisiones con el área de
la abertura es igual al número de moléculas perdidas, resultando que Nc = N en la
ecuación (5.37) y
: −x"3 Xy
%cGH1z/F (5.41)
donde el signo negativo es consistente con que el número de partículas del
recipiente decrecerá conforme la efusión procede. Sustituyendo el resultado
precedente en la ecuación (5.40), el cambio de presión en función del tiempo es
y G
< Xy%cGH1z/F (5.42)
La integración de la ecuación (5.42) da lugar a la siguiente expresión para la
presión del recipiente en función del tiempo:
r(5 g− < GH
c/h (5.43)
siendo P0 la presión inicial del recipiente. Este resultado demuestra que la efusión
produce un decrecimiento exponencial de la presión del recipiente en función del
tiempo.
Colisiones moleculares
Desde el punto de visto químico el mayor interés de la teoría cinética de gases se
centra en el cálculo de los choques que tienen lugar entre las moléculas, los cuales,
son el paso inicial de cualquier proceso reactivo. Para considerar las colisiones
moleculares se tratarán las partículas del gas como esferas rígidas impenetrables,
caracterizadas por un cierto diámetro. Supongamos que la partícula de interés se
mueve y que todas las demás partículas están quietas. En esta descripción, la
partícula de interés barre un volumen cilíndrico, lo que determina el número de
colisiones que la partícula sufre por unidad de tiempo. En la Figura 5.13 se
describe este cilindro. Las colisiones tienen lugar entre la partícula de interés y las
demás partículas que están posicionadas en el cilindro. El área de la base del
cilindro de colisiones o área de colisión, σ, es dependiente del radio de las
partículas de gas, r, del siguiente modo:
l%) )1 (5.44)
Los subíndices 1 y 2 de la ecuación (5.44) denotan a la pareja de partículas que
colisionan, que pueden ser o no de la misma especie. La longitud del cilindro está
dada por el producto del intervalo de tiempo (dt) y vmed. Por tanto, el volumen del
cilindro total es igual a σvmed(dt) como se describe en la Figura 5.13.
Figura 5.13. Esquema de las colisiones entre esferas rígidas.
Esta deducción del volumen del cilindro no es exactamente correcta, debido a que
las otras moléculas no están estacionarias. Para incorporar el movimiento de las
demás moléculas en la deducción, se introduce el concepto de velocidad efectiva.
Para ilustrar este concepto, imagine dos partículas moviéndose con la rapidez
media descrita en la Figura 5.14. La rapidez efectiva a la que se aproximan las dos
partículas es dependiente de la dirección relativa del movimiento de las partículas.
El primer caso descrito en la Figura 5.14 es el de dos partículas que viajan en la
misma dirección, de modo que <v12>=<v1>-<v2>. Si las partículas fueran idénticas,
la rapidez efectiva sería cero, ya que las moléculas viajarían con una separación
constante y nunca colisionarían. El caso opuesto aparece recogido en el centro de
Figura 5.14. Descripción de la rapidez efectiva en una colisión de dos partículas.
de la figura, donde las partículas viajan en sentidos contrarios y la rapidez efectiva
es <v1>+<v2>. Si las partículas fueran idénticas, entonces <v12>=2<v1>. Una
deducción completa de la rapidez efectiva es complicada y de una forma intuitiva
resulta lo que describe el tercer caso de la Figura 5.14. En este tercer caso, el
ángulo medio de aproximación es 90° y, usando el teorema de Pitágoras, la rapidez
efectiva es igual a
⟨⟩ %⟨⟩ ⟨⟩1 gd8IJle d8IJl
eh
sGHc z
F
zF sGHc
/ (5.45)
donde
Con la rapidez efectiva definida en la ecuación (5.45), definimos ahora el volumen
del cilindro de colisiones. El número de parejas que colisionan en el cilindro es
igual al producto de la densidad en número de partículas de la especie 2 (N2/V) y el
volumen del cilindro, Vcil=σvmeddt (Figura 5.13). Definiendo ahora la frecuencia de
colisión de una partícula, z12, como el número de colisiones que sufre una molécula
individual (denotada por el subíndice 1) con las demás parejas de colisión
(denotadas por el subíndice 2) por unidad de tiempo (dt), z12 es igual al número de
parejas que colisionan divididas por dt:
:F< <vE :F
< n :F< sGHc /
(5.46)
Si el gas está compuesto por un sólo tipo de partículas, µ=m1/2 y la ecuación (5.46)
se convierte en:
:z< √2 sGHcz
/ yz:;KH √2 sKHcfz/
(5.47)
La frecuencia de colisiones total vendrá dada por el número total de colisiones que
tienen lugar entre todas las partículas de gas. La frecuencia de colisiones total para
una colección de dos tipos de moléculas de gas, Z12, está dada por z12 veces la
densidad en número de la especie 1:
x :z< :z
<:F< sGHc
/ yz:;KH yF:;KH sGHc /
(5.48)
Las unidades de Z12 son colisiones por metro cúbico, o número de colisiones por
unidad de volumen. La correspondiente frecuencia de colisiones de un gas que
consta sólo de un tipo de partículas, es
x :z<
√ :z<
sGHcz/
√ yz:;KH
sKHcfz/
(5.49)
El factor 1/2 que aparece en la ecuación (5.49) asegura que cada colisión se cuenta
solamente una vez. La evaluación de las ecuaciones (5.46)-(5.49) requiere el
conocimiento de las secciones eficaces de colisión que a su vez dependen de los
radios de las esferas rígidas efectivas. Como veremos en la próxima lección, estos
valores se pueden determinar midiendo varias propiedades del gas. La Tabla 5.1
proporciona los radios de las esferas rígidas de una variedad de gases comunes
determinados a partir de medidas experimentales. Generalmente, para gases
monoatómicos y moléculas pequeñas los radios son del orden de 0.2 nm.
Tabla 5.1. Parámetros de colisión de varios gases.
Como puede observarse en las ecuaciones (5.48) y (5.49), la frecuencia total de
colisión por unidad de volumen depende del producto de la concentración de las
moléculas implicadas en la colisión. Aquí se puede encontrar el origen
microscópico de que en las leyes de velocidad de una etapa elemental aparezca el
producto de las concentraciones de las especies reactivas.
Recorrido libre medio
Un concepto relacionado con la frecuencia de colisión y que resulta muy útil a la
hora de entender el comportamiento de los gases es el recorrido libre medio, el
cual se define como la distancia media que, en término medio, recorre una
partícula de un gas entre dos colisiones sucesivas. En un intervalo de tiempo dado,
dt, la distancia que una partícula recorre es igual a vmeddt donde vmed es la velocidad
media de la partícula. Además, el número de colisiones que sufre la partícula viene
dado por (z11 + z12)dt, donde se incluyen las frecuencias de cualquier tipo de
colisión en la mezcla binaria. Dadas estas cantidades, el recorrido libre medio, λ,
está dado por la distancia media viajada dividida por el número de colisiones:
n%zz_zF1
n%zz_zF1 (5.50)
Para un gas con un único tipo de partículas, N2 = 0 resultando z12 = 0 y el recorrido
libre medio es
nzz n
z √n KH
yz:;√ (5.51)
La ecuación (5.51) demuestra que el recorrido libre medio disminuye si la presión
o la sección eficaz de colisión de la partícula aumentan. Este comportamiento tiene
un significado intuitivo. Conforme aumente la densidad de partículas (es decir,
conforme la presión aumente), esperamos que la partícula recorra una distancia
menor entre colisiones. También, conforme aumente el tamaño de la partícula es
de esperar que la probabilidad de colisiones aumente, reduciendo, por tanto, el
recorrido libre medio. Una de las suposiciones de la teoría cinética es que la
distancia entre las partículas es grande comparada con sus tamaños. ¿Es
consistente el recorrido libre medio con esta suposición? Para responder a esta
cuestión, volvemos al primer ejemplo proporcionado en esta lección, Ar a una
presión de 1 atm y temperatura de 298 K, para el que el recorrido libre medio es
d J7e1√2 7,98510Xs ≈ 80&
Comparado con el diámetro de 0,29 nm de Ar, el recorrido libre medio demuestra
que un átomo de Ar recorre entre colisión y colisión una distancia media igual a
∼275 veces su diámetro. Por tanto, esta diferencia en las escalas de longitud es
consistente con las suposiciones de la teoría cinética. Para profundizar en el
comportamiento de una colección de partículas gaseosas, la frecuencia de
colisiones se puede usar para determinar la escala de tiempo entre colisiones,
como sigue:
1
%7,98510Xs1%3970X1 2,01510Xr0
Un picosegundo es igual a 10−12 s; por tanto, un átomo de Ar individual sufre, en
promedio, una colisión cada 200 ps. Como veremos más adelante, la descripción
física del movimiento de las partículas de un gas esbozada aquí es crítica para la
comprensión de aspectos importantes de la Química Física como las propiedades
de transporte de los gases y la dinámica de las reacciones químicas.
*Problemas a resolver en TG por los estudiantes.
QUÍMICA FÍSICA III Serie 3 Curso 2017-2018
1. Determínese la expresión de la densidad de probabilidad para la componente x de la velocidad de una muestra de moléculas de O2 a 300 K. Represéntese la función de distribución resultante en el intervalo 0< |vx| <1000 ms-1. 2. Calcúlese la probabilidad de que la componente x de la velocidad de un átomo de neón, en una muestra gaseosa de dicho átomo a 300K, tenga valores inferiores a 500 m s-1. 3. Calcúlese el número de átomos de argón que, en una muestra gaseosa de 1 mol de átomos de argón a 273,15 K, tiene una componente x de la velocidad entre 450 y 460 m s-1. 4. Calcúlese la fracción de moléculas que, en una muestra gaseosa de O2 a 300 K, tienen una velocidad tal que sus componentes se encuentran en los siguientes intervalos: 500,0 < vx < 502,0; 370,0 < vy < 375,0; 420,0 < vz < 423,0. 5. Determínese la densidad de probabilidad para la velocidad de una muestra de moléculas de O2 a 300 K en el intervalo 0 < v < 1000 m s-1. Represéntese la función de distribución resultante. 6. Calcúlese, para el O2 a 15 °C y 1 atm, el cociente de la probabilidad de que una molécula tenga su velocidad en un intervalo infinitesimal dv localizado a 500 m s-1 y la probabilidad de que esté en un intervalo infinitesimal dv localizado a 1500 m s-1. ¿A qué temperatura tendrá el O2(g) la misma densidad de probabilidad de velocidad para v=500 m s-1 y v=1500 m s-1? 7. Calcúlese el porcentaje de moléculas que, en una muestra de O2 a 300 K, tienen velocidades entre (a) 200 y 400 m s-1, (b) 400 y 600 m s-1. 8. ¿Cuál es la proporción de moléculas gaseosas con velocidades menores que la raíz de la velocidad cuadrática media? ¿Cuál es la proporción con velocidades menores que la velocidad media? 9. Un vehículo espacial con un volumen interno de 3,0 m3 choca con un meteorito originándose un orificio de 0,1 mm de radio. Si la presión del oxígeno dentro del vehículo es inicialmente de 0,8 atm y su temperatura es de 298K, ¿cuánto tiempo tardará la presión en reducirse a 0.7atm? 10. Un recipiente que contiene escandio sólido en equilibrio con su vapor a 1690 K, experimenta una pérdida de peso de 10,5 mg en 49,5 minutos, a través de un agujero circular de 0,1763 cm de diámetro. Calcúlese la presión de vapor del Sc a 1690 k en torr. 11. La temperatura media de la superficie de Marte es 220 K y la presión es 4.7 torr. La atmósfera marciana está compuesta principalmente por CO2 y N2, con pequeñas cantidades de Ar, O2, CO, H2O y Ne. Considerando sólo los dos componentes principales, se puede aproximar la composición de la atmósfera marciana como x(CO2) ≈ 0,97 y x(N2) ≈ 0,03. Los diámetros de colisión son 4,6 Å para el CO2 y 3,7 Å para el N2. Para la atmósfera de la superficie marciana, calcúlese: (a) la frecuencia de colisión de una determinada molécula de CO2 con otras moléculas de CO2; (b) la frecuencia de colisión de una determinada molécula de N2 con moléculas de CO2; (c) el número de colisiones por segundo de una determinada molécula de N2; (d) el número de colisiones CO2-N2 por segundo en 1,0 cm3; (e) el número total de colisiones por segundo en 1 cm3. 12. Calcúlese el recorrido libre medio de una molécula de O2 en una muestra de aire a 298 K y 1,00 bar. Supóngase que las fracciones molares de N2 y O2 en el aire son 0,79 y 0,21, respectivamente, y que σ(N2)=0,373 nm y σ(O2)=0,353 nm.
13.* Calcúlese el porcentaje de moléculas de una muestra de H2 que tiene velocidades en el intervalo 200 < v < 600 m s-1 a 300 y 500 K. 14.* La presión de vapor de la plata a 2000 °C es de 170 torr. Calcúlense los gramos de Ag que colisionan por unidad de área (cm2) y de tiempo (s) con las paredes de un recipiente que contiene plata en equilibrio con su vapor a 2000 °C.
*Problemas a resolver en TG por los estudiantes.
15.* Calcúlese el número total de colisiones por segundo y por m3 en la atmósfera terrestre a 25 °C y 1 atm entre:
a) Moléculas de oxígeno. b) Moléculas de nitrógeno. c) Moléculas de oxígeno y de nitrógeno.
Utilícense los siguientes radios moleculares r(O2) = 178 pm y r(N2) = 185 pm. 16.* En un recipiente cúbico de 30 cm de lado se tiene a 300 K y 1 atm de presión una mezcla equimolar de nitrógeno (σ = 3,7 Å) y dióxido de carbono (σ = 4,6Å).
a) Obténgase el recorrido libre medio de las moléculas de CO2. b) En un momento dado se practica en el centro de una de las caras un agujero circular
de 0,2 mm de radio mientras el exterior está vacío. Calcúlese la velocidad inicial de efusión de ambos gases como número de moléculas que se escapan por unidad de tiempo.
c) Calcúlese el tiempo necesario que debe de transcurrir para que en el interior del recipiente quede una mezcla de gases en la proporción molar 40:60.
Lección 6: FENÓMENOS DE TRANSPORTE
Concepto de transporte. Transporte de masa: difusión. Evolución temporal de un
gradiente de concentración. Visión estadística de la difusión. Conducción térmica.
Viscosidad de los gases. Medida de la viscosidad. Difusión y viscosidad en líquidos.
Conducción iónica.
Concepto de transporte
Hasta aquí nos hemos ocupado de la descripción de las propiedades de un sistema
en equilibrio. Sin embargo, ahora consideraremos la aplicación de una
perturbación externa a un sistema de forma que una de sus propiedades se
desplaza fuera del equilibrio. Una vez que la perturbación externa se elimina, el
sistema evolucionará para restablecer la distribución de equilibrio de la propiedad.
Por ejemplo, consideremos una colección de partículas de gas en las que la
distribución espacial de equilibrio de las partículas corresponde a una densidad en
número homogénea en el recipiente. Si la densidad en número de las partículas
fuera mayor en una cara del recipiente que en la otra, entonces las partículas de
gas se trasladarán a través del recipiente para restablecer una densidad en número
homogénea. Esto es, el sistema evoluciona para restablecer una distribución de la
propiedad del sistema que sea consistente con el equilibrio. Los fenómenos de transporte implican la evolución de una propiedad del sistema en respuesta a una
distribución de no equilibrio de la misma. En la Tabla 6.1 se dan las propiedades
del sistema de interés, y cada propiedad se relaciona con los procesos de
transporte correspondientes.
Tabla 6.1. Propiedad transportada y fenómenos de transporte correspondientes.
Un concepto central en los fenómenos de transporte es el flujo, que se define como
la cantidad transferida a través de un área dada en una cantidad de tiempo. El flujo
es una consecuencia del gradiente de una propiedad del sistema y aparecerá en
sentido opuesto a ese gradiente. En el ejemplo anterior, si dividimos el recipiente
Figura 6.1. Representación gráfica del flujo. El flujo de partículas de gas, Jx, se
opone al gradiente de la densidad en número de partículas .
en dos partes con una partición y contamos el número de partículas que se mueven
desde una mitad del recipiente hacia la otra (véase Figura 6.1). El flujo en este caso
es igual al número de partículas que pasan a través de la partición por unidad de
tiempo. La base teórica de todos los procesos de transporte relacionados en la
Tabla 6.1 implica al flujo y el hecho de que el gradiente espacial de una propiedad
del sistema dará lugar al correspondiente flujo. La relación más básica entre el
flujo y el gradiente espacial de la propiedad transportada es:
(6.1)
donde Jx es el flujo expresado en unidades de (área de la propiedad)-1 tiempo-1. La
derivada de la ecuación (6.1) representa el gradiente espacial de la cantidad de
interés (masa, energía, etc.). La relación lineal entre el flujo y el gradiente espacial
de la propiedad es razonable cuando el desplazamiento con respecto al equilibrio
es modesto. De aquí en adelante, supondremos que el desplazamiento de la
propiedad del sistema con respecto al equilibrio es moderado. El signo negativo de
la ecuación (6.1) indica que el flujo tiene lugar en el sentido opuesto al gradiente;
por tanto, el flujo producirá una reducción del gradiente si no se realiza una acción
externa para mantenerlo. Si se mantiene externamente el gradiente en un valor
constante, el flujo también permanecerá constante. De nuevo, consideremos la
Figura 6.1, que presenta un ejemplo gráfico de la relación entre gradiente y flujo.
La densidad del gas es mayor en la parte izquierda del recipiente, de forma que la
densidad de partículas aumenta al ir de la parte derecha a la izquierda del
recipiente. De acuerdo con la ecuación (6.1), el flujo de partículas tiene lugar
oponiéndose al gradiente de la densidad en número, en un intento de hacer la
densidad de partículas espacialmente homogénea. La cantidad final de interés en la
ecuación (6.1) es la constante de proporcionalidad α, denominada coeficiente de transporte. En las secciones siguientes, determinaremos los coeficientes de
transporte para los procesos incluidos en la Tabla 6.1 y deduciremos las
expresiones del flujo implicado en los diversos fenómenos de transporte.
Transporte de masa: difusión
La difusión es el proceso mediante el que la densidad de partículas evoluciona en
respuesta a un gradiente espacial de concentración. Primero consideraremos el
caso de la difusión de un gas ideal y después la difusión en líquidos.
Figura 6.2. Modelo empleado para describir la difusión del gas. El gradiente de la
densidad en número produce la difusión de partículas desde −x a +x. El flujo de
partículas en respuesta al gradiente (el plano de flujo) se ha calculado en el plano
localizado en x = 0. Se consideran dos planos, localizados a la distancia del
recorrido libre medio (±λ), con partículas moviéndose desde esos planos al plano
de flujo.
Consideremos un gradiente de densidad en número de partículas de gas, , como
se describe en la Figura 6.2. Según la ecuación (6.1), habrá un flujo de partículas de
gas opuesto al gradiente que se puede determinar cuantificando el flujo de
partículas por unidad de tiempo que atraviesa un plano imaginario de área A en
x=0 llamado plano de flujo. Consideremos también otros dos planos a ambos lados
del plano de flujo a distancias iguales al recorrido libre medio ±λ. El flujo neto
vendrá, por tanto, de las partículas que se mueven desde cualquiera de estos dos
planos al plano de flujo. Según la Figura 6.2, existe un gradiente de densidad en
número de partículas en la dirección x de forma que:
0 (6.2)
Si el gradiente de fuera igual a cero, el flujo Jx sería igual a cero por la ecuación
(6.1). Sin embargo, esto no significaría que las partículas estuviesen estacionarias.
En lugar de ello, Jx = 0 indica que el flujo a través del plano de flujo de izquierda a
derecha está exactamente equilibrado por el flujo de partículas de derecha a
izquierda. Por tanto, el flujo expresado en la ecuación (6.1) representa el flujo neto,
o suma del flujo en cada dirección a través del plano de flujo y será proporcional al
gradiente espacial de . Para determinar la constante de proporcionalidad de este
problema de transporte de masa, consideremos la densidad en número de
partículas en los planos ±λ:
0 (6.3)
0 + (6.4)
Estas expresiones establecen que el valor de más allá de x = 0 es igual al valor de en x = 0 más un segundo término que representa el cambio de concentración
conforme uno se desplaza hacia los planos ±λ. El proceso de difusión se puede
interpretar como una efusión de partículas a través de un plano o apertura de un
área A. Procediendo de forma similar que en el estudio de la efusión de gases, el
número de partículas, N, que golpean un área dada por unidad de tiempo, es igual a
(6.5)
El flujo de partículas que se trasladan desde el plano –λ al plano de flujo (véase
Figura 6.2), es decir, el número de partículas que se mueven en la dirección +x y
golpean el plano de flujo por unidad de tiempo está dado por:
! (6.6)
"#$%&' #⁄ )*"+,- #⁄ %& !
%&#$"' #⁄
. "
En esta ecuación, hemos empleado la definición de vmed dada en la lección anterior.
Sustituyendo las ecuaciones (6.3) y (6.4) en (6.6) para Jx, el flujo desde los planos -
λ y +λ viene dado por:
*/, '. " '. " 10 2 (6.7)
/, '. " '. " 10 + 2 (6.8)
El flujo total a través del plano de flujo es simplemente la diferencia de flujo entre
los planos ±λ:
3 */, /, '. " 12 2 (6.9)
'# "
Las partículas se mueven desde los planos ±λ hacia el plano de flujo según el eje x.
La Figura 6.3 indica que si la trayectoria de la partícula no está alineada con el eje
x, la partícula no alcanzará el plano de flujo tras recorrer el recorrido libre medio.
En tal caso, pueden darse colisiones con otras partículas, provocando que se aleje
del plano de flujo; por tanto, estas partículas no contribuyen al flujo. La inclusión
de estas trayectorias requiere tomar el promedio de la orientación del recorrido
libre medio, lo que produce una reducción del flujo total en un factor de 2/3,
respecto al dado en la ecuación (6.9). Por ello, el flujo total es
3 '5 " (6.10)
Figura 6.3. Las trayectorias de las partículas alineadas con el eje x (línea de trazos)
hacen que las partículas se trasladen entre los planos sin colisionar. Sin embargo,
las trayectorias no alineadas con el eje x (línea sólida) provocan que la partícula no
alcance el plano de flujo antes de que tenga lugar una colisión con otra partícula.
Esta colisión puede provocar que la partícula se separe del plano de flujo.
Comparando la ecuación (6.10) con la (6.1), vemos que el coeficiente de difusión,
es:
6 '5 " (6.11)
El coeficiente de difusión tiene unidades m2 s-1 en el sistema internacional. Con
esta definición de coeficiente de difusión, la ecuación (6.10) se convierte en:
3 6 (6.12)
Esta ecuación es la llamada primera ley de Fick de la difusión. Puede verse que el
coeficiente de difusión se define usando parámetros deducidos mediante la teoría
cinética de gases como la rapidez media del gas y el recorrido libre medio. Este
último depende de la sección eficaz de colisión. Una crítica a esta aproximación es
que parámetros tales como la velocidad media se deducen usando una distribución
de equilibrio, y esos conceptos ahora se aplican en un contexto de no equilibrio
cuando se discuten los fenómenos de transporte. El desarrollo que se presenta
aquí se lleva a cabo con la suposición de que el desplazamiento del sistema con
respecto al equilibrio es moderado; por tanto, las cantidades basadas en el
equilibrio siguen siendo relevantes. Los fenómenos de transporte también se
pueden describir usando distribuciones de no equilibrio; sin embargo, la
complejidad matemática de esta aproximación se sitúa más allá del objetivo de
este asignatura.
A partir de la expresión del coeficiente de difusión, ecuación (6.11), está clara la
relación entre esta cantidad y los detalles de las partículas del gas. Esta relación
sugiere que se pueden emplear las propiedades de transporte, tales como la
difusión, para determinar parámetros de las partículas, tales como el tamaño
efectivo que describe la sección eficaz de colisión.
Según vimos en la lección anterior la sección eficaz de colisión para un gas puro es
igual a πd2 donde d es el diámetro de la partícula de gas. La ratio de secciones
eficaces de colisión determinadas usando los coeficientes de difusión, es
consistente con un diámetro de He que es un factor 0,89 menor que el de Ar. Sin
embargo, el diámetro de Ar, proporcionado en tablas de radios atómicos, es
aproximadamente 2,5 veces mayor que el de He. El origen de esta discrepancia se
puede remontar a la aproximación de esferas rígidas de las interacciones entre
partículas.
Evolución temporal de un gradiente de concentración
A partir de la ecuación de difusión pueden determinarse cuestiones importantes
como la escala de tiempo de la difusión y el espacio que recorre una partícula en
un tiempo dado mientras difunde. Según la primera ley de Fick, el flujo de
partículas viene dado por
6 (6.13)
Figura 6.4. Descripción del flujo a través de dos planos separados. Si Jx = Jx+dx,
entonces la concentración entre los planos no cambia. Sin embargo, si los flujos no
son iguales, entonces la concentración cambiará con el tiempo.
La cantidad Jx de la ecuación (6.13) es el flujo a través del plano x como se ilustra
en la Figura 6.4. El flujo en el plano x + dx también se puede escribir usando la
primera ley de Fick como:
7 6 7 (6.14)
La densidad de partículas en (x+dx) está relacionada con el correspondiente valor
en x como sigue:
8 + 8 8 + 8 (6.15)
Sustituyendo la ecuación (6.15) en (6.14), el flujo a través del plano (x + dx) es
7 6 1 + -- 82 (6.16)
El cambio de densidad en número de partículas entre los dos planos de flujo de la
Figura 6.4 depende de la diferencia de flujo a través de los dos planos. Si los flujos
son idénticos, la densidad de partículas permanece constante en el tiempo. Sin
embargo, la variación de la densidad en número de partículas con el tiempo
producirá una diferencia de flujo. El flujo es igual al número de partículas que
pasan a través de un área dada por unidad de tiempo. Si el área de los dos planos
de flujo es equivalente, entonces la diferencia de flujo es directamente
proporcional a la diferencia de la densidad en número de partículas. Esto puede
expresarse matemáticamente como:
, 9,*9,:;,
<6 , =6>, + ?-- 8@ABC
, 6 -,- (6.17)
Esta ecuación recibe el nombre de segunda ley de difusión de Fick y ahora
depende tanto de la posición x como del tiempo t. Esta ecuación demuestra que la
evolución con el tiempo del gradiente de concentración es proporcional a la
derivada del gradiente espacial de la concentración. Es decir, a mayor “curvatura”
del gradiente de concentración, relajación más rápida. La resolución de la ecuación
diferencial (6.17) conduce a que:
8, D E#F$GH -⁄ )*- .G⁄ (6.18)
En esta expresión, N0 representa el número inicial de moléculas confinadas en el
plano t=0, A es el área de este plano, x es la distancia al plano y D es el coeficiente
de difusión. La ecuación (6.18) se puede ver como una función de distribución que
describe la probabilidad de encontrar una partícula después de un tiempo t en un
plano situado a una distancia x del plano inicial t=0. En la Figura 6.5 se muestra un
ejemplo de la variación de con el tiempo para especies con D = 10−5 m2 s−1,
aproximadamente equivalente al coeficiente de difusión de Ar a 298 K y 1 atm. La
figura refleja que al aumentar el tiempo, crece a distancias más alejadas del
plano inicial (situado a 0 m).
Figura 6.5. Variación de la densidad en número de partículas, 8, D, en función
del tiempo. Esta densidad en número está definida con respecto a =N0/A, el
número de partículas confinadas en el plano x = 0 de área A (D = 10-5 m2 s-1, valor
típico para un gas a 1 atm y 298 K). Se indica también el correspondiente tiempo
de difusión para un perfil de concentración dado.
De forma similar a otras funciones de distribución encontradas hasta ahora, es más
conveniente usar una medida de la distribución de 8, D en vez de la distribución
entera. Normalmente, se utiliza la raíz del desplazamiento cuadrático medio (xrms),
en la dirección x que se determina como sigue:
8"I ⟨8#⟩' #⁄ 1 FE 8#8, D 8!*! 2' #⁄
1 '#$GH -⁄ 8#)*- .G⁄ 8!*! 2' #⁄
8"I √26D (6.19)
Es decir, el desplazamiento xrms aumenta con la raíz cuadrada del coeficiente de
difusión y del tiempo. Para la difusión en tres dimensiones, el correspondiente
término, rrms, se puede determinar usando el teorema de Pitágoras con la
suposición de que la difusión es equivalente en las tres dimensiones:
M"I √66D (6.20)
Visión estadística de la difusión
El proceso de difusión puede describirse desde un punto de vista estadístico
modelizando el movimiento de las partículas como una serie de desplazamientos
discretos o pasos, de modo que la dirección de un paso no está correlacionada con
la del paso previo (véase Figura 6.6(a)). Es decir, una vez que la partícula ha
efectuado un paso, la dirección del siguiente paso es al azar. Una secuencia de estos
pasos se denomina paseo al azar.
Figura 6.6. (a) Ilustración de un paseo al azar. La difusión de la partícula se
modeliza mediante una serie de pasos discretos (flechas); la longitud de cada paso
es igual, pero la dirección del paso es al azar. (b) Ilustración de un modelo de paseo
al azar unidimensional.
Consideremos una partícula que experimenta un paseo al azar en una única
dimensión x, de forma que la partícula se mueve un paso en la dirección +x o en la
−x (Figura 6.6(b)). Después de un cierto número de pasos, la partícula habrá
efectuado un número total de pasos igual a ∆. Llamando ∆− y ∆+ a los pasos
realizados en las direcciones −x y +x, respectivamente, la probabilidad de que la
partícula se haya desplazado una distancia X desde el origen está relacionada con
el peso asociado a esa distancia según la expresión:
O ∆!∆:!∆R! ∆!∆:!∆*∆:! (6.21)
Esta ecuación es idéntica al peso asociado con la observación de obtener un cierto
número de caras tras el lanzamiento de una moneda ∆ veces. Esta semejanza no es
fortuita porque el modelo de paseo al azar en una dimensión es muy parecido al
lanzamiento de una moneda. Cada resultado de un lanzamiento de moneda es
independiente del resultado previo y sólo es posible uno de dos resultados por
lanzamiento. La evaluación de la ecuación (6.21) requiere expresar ∆+ en términos
de ∆. Esta relación puede deducirse si asumimos que X es igual a la diferencia del
número de pasos en la dirección +x y −x:
S ∆7 ∆* ∆7 ∆ ∆7 2∆7 ∆ (6.22)
T7∆# ∆7
Con esta definición de ∆+, la expresión de W se convierte en
O ∆!U:∆- !∆*U:∆- ! ∆!∆:U- !∆RU- ! (6.23)
La probabilidad de que la partícula se encuentre a la distancia X del origen viene
dada por el peso asociado a esta distancia dividido por el peso total, 2∆, de forma
que:
V WWXYXZ[ W#∆ ∝ )*T- #∆⁄ (6.24)
La constante de proporcionalidad puede deducirse por medio de la evaluación de
la ecuación (6.23) usando la aproximación de Stirling. Como la distancia con la que
se aleja una partícula que se difunde desde el origen es también proporcional a un
término exponencial:
8, D ∝ )*- .G⁄ (6.25)
siendo x la distancia de difusión real, D el coeficiente de difusión y t el tiempo. Para
que estas dos descripciones de la difusión (ecuaciones (6.24) y (6.25)) den lugar al
mismo resultado físico, los exponentes deben ser iguales, de forma que:
-.G T-
#∆ (6.26)
El número total de pasos del paseo al azar, ∆, puede expresarse como el tiempo de
difusión total, t, dividido por el tiempo de un paso del paseo al azar, τ,
∆ ] (6.27)
y x se puede relacionar con el desplazamiento del paseo al azar X usando una
constante de proporcionalidad, xo, que representa la distancia media en el espacio
físico que recorre una partícula entre colisiones,
8 S8 (6.28)
Con estas definiciones de ∆ y X, la sustitución en la ecuación (6.26) conduce a la
siguiente definición de D:
6 E-#] (6.29)
La ecuación (6.29) recibe el nombre de ecuación de Einstein–Smoluchowski. La
importancia de esta ecuación es que relaciona una cantidad macroscópica, D, con
aspectos microscópicos de la difusión, como se describe en el modelo del paseo al
azar. Para reacciones en disolución, xo se toma generalmente como el diámetro de
la partícula. Usando esta definición y el valor experimental de D, se puede
determinar la escala de tiempo asociada a cada paseo al azar.
La ecuación de Einstein–Smoluchowski se puede relacionar con la difusión del gas
descrita previamente. Si igualamos xo con el recorrido libre medio y definimos el
tiempo por paso, como el tiempo medio que invierte una partícula de gas para
trasladarse un recorrido libre medio λ/vmed, entonces el coeficiente de difusión
viene dado por
6 /-#^ _`ab;c '# " (6.30)
Esta es la misma expresión de D obtenida a partir de la teoría cinética de gases en
ausencia de la corrección 2/3 de la trayectoria de las partículas, como se discutió
anteriormente. Por tanto, los puntos de vista estadístico y de la teoría cinética de la
difusión proporcionan descripciones equivalentes de la difusión de un gas.
Conducción térmica
La conducción térmica es el proceso de transporte mediante el que la energía
evoluciona en respuesta a un gradiente de temperatura. La Figura 6.7 describe una
colección de partículas de gas idénticas entre las que sólo existe un gradiente de
temperatura, ya que la densidad del número de partículas es la misma a través de
la caja. El equilibrio se alcanzará cuando el sistema tenga una temperatura idéntica
en todas las regiones de la caja. Como la temperatura y la energía cinética están
relacionadas, la evolución hacia el equilibrio implicará un transporte de energía
cinética desde la zona de la caja de temperatura a la de temperatura baja.
Figura 6.7. Gradiente de temperatura de una colección de partículas de gas (rojo:
regiones con partículas de energía cinética elevada, azul: regiones de energía
cinética baja). Se indican los sentidos del gradiente de energía cinética (y, por
tanto, de temperatura) y del flujo de energía respuesta a este gradiente, Jx.
Supongamos que la conducción térmica sólo se produce mediante una
transferencia de energía debida a las colisiones entre las partículas y que se
establece el equilibrio con el gradiente de energía tras cada colisión, asegurando,
por tanto, que las partículas están en equilibrio con el gradiente tras cada colisión.
De igual modo a como hicimos para la difusión, comenzamos considerando la
transferencia de energía en un gas monoatómico ideal. Recordemos de la Mecánica
Estadística y la Termodinámica que la energía de traslación media de una partícula
de gas monoatómico es 3/2kT. Además de la energía traslacional, las moléculas
diatómicas y poliatómicas pueden transportar más energía en los grados de
libertad rotacional y vibracional, y nuestro tratamiento se extiende brevemente a
esas moléculas más complejas. La energía cinética se transfiere cuando las
partículas golpean una de las caras del plano de flujo. En esta colisión, la energía se
Figura 6.8. Modelo usado para determinar la conductividad térmica de un gas. El
gradiente de temperatura produce la transferencia de energía cinética desde las
regiones de temperatura alta (plano rojo) a las de temperatura temperatura (plano
azul).
transmite desde una de las partes del plano de flujo a la otra. El transporte de
energía y la relajación hacia el equilibrio térmico se consiguen mediante las
colisiones moleculares, no por la difusión ya que la densidad en el número de
partículas es homogénea. Teniendo en cuenta la Figura 6.8, la energía en los planos
±λ con respecto al plano de flujo viene dada por las expresiones:
d d0 e (6.31)
d d0 + e (6.32)
El flujo desde el plano –λ al plano de flujo es:
d8 ! '.d8" (6.33)
donde es la densidad en número de las partículas de gas, que es constante (no
hay gradiente de densidad en número, sólo de energía). Substituyendo (6.31) y
(6.32) en la ecuación (6.33) llegamos a que el flujo de energía desde los planos
±λ al plano de flujo es:
*/, '.d" (6.34)
/, '.d" (6.35)
de modo que el flujo de energía total es:
3 */, /, '."fd dg (6.36)
'." 12 e2
'#" h?i-%& @j
5. k" &
Multiplicando el flujo total por 2/3 del promedio según la orientación de las
trayectorias de las partículas, la expresión del flujo total a través del plano de flujo
se convierte en
3 '# k" & (6.37)
Esta expresión da cuenta del flujo de energía total de un gas monoatómico ideal,
donde la energía transferida por colisión es 3/2kT. La expresión para el flujo total
se puede definir en términos de la capacidad calorífica molar, l+, admitiendo que la
capacidad calorífica molar a volumen constante de un gas monoatómico es 3/2R,
por tanto:
no 5# k (6.38)
Con esta sustitución, el flujo se puede expresar en términos de l+ para las especies
de interés y no está restringido a especies monoatómicas. Sustituyendo (6.38) en la
ecuación (6.39) tenemos que:
3 '5 no" & (6.39)
La comparación de (6.38) con la relación general entre el flujo y el gradiente de la
ecuación (6.1) implica que la constante de proporcionalidad para la transferencia
de energía, llamada conductividad térmica, p& , está dada por
p& '5 no" (6.40)
El análisis de las unidades de la ecuación (6.40) revela que p& tiene unidades de J
K−1 m−1 s−1. Cada factor de la expresión de la conductividad térmica se conoce de la
termodinámica o de la teoría cinética de gases. La presencia del recorrido libre
medio en la ecuación (6.40) demuestra que de forma similar al coeficiente de
difusión, la conductividad térmica se puede utilizar para estimar el radio de esferas
rígidas de gases.
Viscosidad de los gases
Consideremos el flujo de un gas a través de una tubería bajo presión. Algunos gases
fluyen más fácilmente que otros, y la propiedad que caracteriza la resistencia del
flujo es la viscosidad (η). La Figura 6.9 proporciona una vista de un corte del flujo
de un gas entre dos placas. Se puede demostrar experimentalmente que la
velocidad del gas, vx, es mayor en el medio de las dos placas y disminuye conforme
el gas se aproxima a cualquiera de ellas, hasta llegar alcanzar el valor de vx = 0 en el
límite de la placa. Por tanto, hay un gradiente de vx y, en consecuencia, del
momento lineal correspondiente mvx según la coordenada perpendicular a la
dirección del flujo (z en la Figura 6.9).
Figura 6.9. Sección transversal de un fluido que fluye entre dos placas. El fluido
está representado por el área azul que hay entre las placas y la longitud de las
flechas representa la rapidez del fluido.
Figura 6.10. Modelo de caja usado para deducir la viscosidad (planos azules:
planos de velocidad de partículas idénticas con la magnitud de la velocidad dada
por las flechas). El gradiente de momento lineal produce una transferencia de
momento desde las regiones de momento lineal alto (plano azul oscuro) a las de
momento lineal bajo (plano de azul claro). El plano z = 0 es la posición en la que se
determina el flujo del momento lineal en respuesta al gradiente.
Supongamos que el flujo de gas es un flujo laminar, es decir, que el gas se puede
descomponer en capas de rapidez constante, como se recoge en la Figura 6.9. Este
régimen se da en la mayoría de los gases y en algunos líquidos para los que la
velocidad de flujo no es demasiado elevada. A velocidades de flujo elevadas, se
alcanza el régimen de flujo turbulento donde las capas se entremezclan de forma
que no se puede llevar a cabo una disección clara del gas en términos de capas de
la misma rapidez. Aquí nos limitaremos a las condiciones de flujo laminar.
La Figura 6.9 muestra un gradiente del momento lineal en la dirección z; por tanto,
los planos de igual momento lineal son paralelos a la dirección del flujo del fluido,
como se recoge en la Figura 6.10. La transferencia de momento lineal tiene lugar
porque una partícula de una capa de momento colisiona con el plano de flujo y, por
tanto, le transfiere su momento a la capa adyacente. Por analogía con la difusión y
la conductividad térmica, el momento lineal, p, en los planos ±λ está dado por
q q0 rr (6.41)
q q0 + rr (6.42)
El flujo de momento lineal desde los planos ±λ al plano de flujo es:
*/, '.q" (6.43)
/, '.q" (6.44)
De modo que el flujo total viene a ser:
3 '." 12 rr2 (6.45)
'#" 1"+,r r2
'#s" +,r r
Multiplicando la ecuación (6.45) por el factor 2/3 procedente del promedio
orientacional de las trayectorias de las partículas, se obtiene que:
3 '5s" +,r (6.46)
Comparando (6.46) y (6.1), se obtiene que la constante de proporcionalidad entre
el flujo y el gradiente de velocidad está definida como
t '5s" (6.47)
donde la viscosidad del gas, η, aparece en términos de los parámetros deducidos a
partir de la teoría cinética de los gases. Las unidades de viscosidad son el Poise (P)
o 0,1 kg m−1 s−1. Las viscosidades generalmente se dan en µP (10−6 P) para los
gases y cP (10−2 P) para los líquidos.
Medida de la viscosidad
Teniendo en cuenta que la viscosidad es una medida de la resistencia de un fluido a
fluir, se acostumbra a medir la viscosidad de gases y líquidos controlando el flujo
de un fluido a través de un tubo. Para el flujo de un líquido a través de un tubo
redondo en condiciones de flujo laminar, Poiseuille encontró que:
uvu $wxy z-*zH-*H (6.48)
En esta ecuación conocida como ley de Poiseuille, ∆V/∆t representa el volumen de
fluido, ∆V, que pasa a través del tubo en una cantidad específica de tiempo, ∆t; r es
el radio del tubo a través del cual fluye el fluido; η es la viscosidad del fluido; y el
factor entre paréntesis representa el gradiente de presión macroscópico en la
longitud del tubo. La velocidad del flujo es directamente proporcional al radio del
tubo e inversamente proporcional a la viscosidad del fluido, lo que confirma que a
más viscosidad del fluido menor velocidad de flujo. El flujo de un gas ideal a través
de un tubo viene dado por
uvu $w'y|zE V## V'# (6.49)
donde L es la longitud del tubo, P2 y P1 son las presiones a la entrada y salida del
tubo, respectivamente, y P0 es la presión a la que se mide el volumen (P0 es igual a
P1 si el volumen se mide al final del tubo).
Figura 6.11. Viscosímetro de Ostwald.
La viscosidad de los líquidos puede medirse con un viscosímetro de Ostwald
(Figura 6.11). Para ello, se mide el tiempo que transcurre desde que el líquido baje
desde la marca de nivel “alto” a la marca de nivel “bajo” y el fluido fluya a través de
un capilar fino que asegura el flujo laminar. La presión que dirige el líquido a
través del capilar es ρgh, donde ρ es la densidad del fluido, g es la aceleración de la
gravedad y h es la diferencia de niveles del líquido en las dos secciones del
viscosímetro de la Figura 6.11. La diferencia de altura entre los dos niveles del
fluido variará a medida que el líquido fluya, por lo que h representa una altura
media. Como ρgh es la presión que genera el flujo, la ecuación (6.48) se puede
reescribir como sigue:
uvu $wxy ~-*H $wxy ~3 (6.50)
donde l es la longitud del capilar. Esta ecuación se puede reagrupar como:
t $wx ~uv3 ΔD + IΔD (6.51)
siendo + I la constante del viscosímetro que depende de la geometría del mismo.
Todos los parámetros del viscosímetro se pueden determinar a través de la medida
cuidadosa de las dimensiones del mismo; sin embargo, la constante del
viscosímetro se determina generalmente mediante calibración usando un fluido de
densidad y viscosidad conocidas.
Difusión y viscosidad en líquidos
En 1827 Robert Brown demostró por medio de experimentos de microscopía el
movimiento al azar de la difusión de partículas. En la Figura 6.12 se muestra una
partícula de masa m y radio r dentro de un líquido con viscosidadη. El movimiento
de esta partícula está dirigido por las colisiones con las partículas de líquido, que
proporcionan una fuerza que varía con el tiempo, F(t). Descomponiendo F(t) en sus
componentes cartesianas y centrándonos en la componente x, Fx(t), el movimiento
de la partícula en dicha dirección producirá una fuerza de fricción, Ffr,x, debida a la
viscosidad del líquido:
, (6.52)
Figura 6.12. Ilustración del movimiento browniano donde r es el radio de una
partícula esférica que se encuentra dentro de un líquido de viscosidad η y F(t) es la
fuerza que inicia el movimiento por colisión de la bola roja con la partícula de radio
r. El movimiento de la partícula se opone a la fuerza de fricción que es dependiente
de la viscosidad del disolvente.
El signo negativo de la ecuación (6.52) indica que la fuerza friccional se opone a la
dirección del movimiento y f es el coeficiente de fricción, que depende de la
geometría de la partícula y la viscosidad del fluido. La fuerza total sobre la
partícula es la suma de las fuerzas de colisión y fricción:
3, D + ,
s -- D (6.53)
Einstein estudió la ecuación diferencial (6.53) y demostró en 1905 que cuando se
promedia para numerosas colisiones de partículas de fluido, el desplazamiento
cuadrático medio de la partícula en una cantidad específica de tiempo, t, viene
dado por
⟨8#⟩ #%& (6.54)
donde k es la constante de Boltzmann y T es la temperatura. Si la partícula que
sufre difusión es esférica, el coeficiente de fricción está dado por
6tM (6.55)
de modo que
⟨8#⟩ 2 %&$y D (6.56)
La comparación de este resultado con el valor de <x2> determinado a partir de la
ecuación de difusión (6.19) impone que el término entre paréntesis es el
coeficiente de difusión, D, dado por
6 %&$y (6.57)
La ecuación (6.57) es la ecuación de Stokes–Einstein para la difusión de una
partícula esférica y establece que el coeficiente de difusión depende de la
viscosidad del medio, el tamaño de la partícula y la temperatura. Esta forma de la
ecuación de Stokes–Einstein es aplicable a la difusión en disolución, cuando el
radio de la partícula que se difunde es significativamente mayor que el radio de las
partículas del líquido. Para la difusión de una partícula en un fluido de tamaño
similar, los datos experimentales demuestran que la ecuación (6.57) es:
6 %&.$y (6.58)
Esta ecuación se puede usar también para la autodifusión, en la que tiene lugar la
difusión de una molécula de disolvente en el seno del propio disolvente.
A diferencia de los gases, la dependencia de la viscosidad del fluido con la
temperatura es difícil de explicar teóricamente. La principal razón de esta
dificultad es que, en promedio, la distancia entre las partículas de un líquido es
pequeña, y las interacciones intermoleculares llegan a ser importantes cuando se
describen las interacciones entre partículas. Como regla general, a mayor
interacción intermolecular en el líquido mayor viscosidad del líquido. Con respecto
a la temperatura, las viscosidades de los líquidos aumentan conforme la
temperatura disminuye. La razón de este comportamiento es que conforme se
reduce la temperatura, la energía cinética de las partículas también se reduce, y las
partículas tienen menor energía cinética para superar la energía potencial que
proviene de las interacciones intermoleculares, resultando que el fluido es más
resistente al flujo.
Conductividad iónica
La conducción iónica es el fenómeno de transporte mediante el que la carga
eléctrica en forma de iones se desplaza bajo la influencia de un potencial eléctrico.
La cantidad de carga que se mueve es igual a la corriente eléctrica, I, que se define
como la carga, Q, que se desplaza en un intervalo de tiempo dado:
(6.59)
La unidad usada para la corriente es el Amperio (A), que es igual a un culombio (C)
de carga por segundo (s), es decir, 1 A = 1 C s-1. Como la carga de un electrón es
1.602 x 10-19 C, 1,00 A de corriente corresponde al flujo de 6,25 x 1018 electrones
por segundo. La corriente también se puede cuantificar por la densidad de
corriente, j, definida como la cantidad de corriente que fluye a través de un
conductor con una sección transversal de área Área (Figura 6.13):
Á (6.60)
El transporte de carga se inicia por la presencia de una fuerza eléctrica, creada por
un campo eléctrico. En la Figura 6.13, el campo eléctrico que atraviesa el conductor
se genera usando una batería. La densidad de corriente es proporcional a la
magnitud del campo eléctrico, E, y la constante de proporcionalidad se conoce
como conductividad eléctrica, κ:
p (6.61)
Figura 6.13. Sección transversal de un conductor que transporta corriente. Se
muestra además la dirección del campo eléctrico aplicado, Ex, creado por la batería.
La conductividad eléctrica tiene unidades de siemens (S) por metro (m), o S m-1,
donde 1 S es igual a 1 ohm-1. Finalmente, la resistividad, ρ, de un material es la
inversa de la conductividad eléctrica:
' (6.62)
La resistividad se expresa en unidades de Ω m. En la Figura 6.19 se aplica un
campo eléctrico E a un conductor cilíndrico con una sección transversal Área y una
longitud l. Si el cilindro es de composición homogénea, el campo eléctrico y la
densidad de corriente serán equivalentes a través del conductor, de modo que:
v3 (6.63)
Á (6.64)
En la ecuación (6.63), V es la magnitud del potencial eléctrico o diferencia de
potencial entre los extremos del conductor, comúnmente llamado voltaje.
Sustituyendo las ecuaciones (6.63) y (6.64) en la expresión de la resistividad,
ecuación (6.62), se llega a la expresión siguiente:
' v F3 F3 (6.65)
En la ecuación (6.65), se usó la ley de Ohm para reescribir V/I como R, la
resistencia. Esta ecuación demuestra que la resistividad es proporcional a la
resistencia del material, R, en unidades de Ω con una constante de
proporcionalidad que es igual al área, Área, de la sección transversal del conductor
dividida por la longitud del mismo l. La aplicación de una batería a un conductor
(véase Figura 6.13) producirá un campo eléctrico dentro del conductor cuya
dirección se toma en la dirección x. El campo eléctrico está relacionado con el
gradiente del potencial eléctrico según la expresión:
(6.66)
Con esta definición, la ecuación (6.61) se convierte en
'F p (6.67)
El primer miembro de la ecuación (6.67) es el flujo de carga a través del conductor
en respuesta al gradiente de potencial eléctrico. La comparación de la ecuación
(6.67) con la ecuación (6.1) pone de manifiesto que la conductividad iónica se
describe como otro proceso de transporte. La constante de proporcionalidad de
este proceso de transporte es la conductividad eléctrica. Se puede profundizar en
la naturaleza del transporte de carga en disolución mediante la medida de la
conductividad de las disoluciones iónicas. Las medidas se llevan a cabo
usualmente, empleando una célula de conductividad, que es un recipiente en el que
Figura 6.14. Esquema de un circuito eléctrico usado para llevar a cabo medidas de
conductividad eléctrica.
se colocan dos electrodos de área y separación bien definidos y en el que se añade
una disolución de electrolito (Figura 6.14). La resistencia de la célula de
conductividad se mide generalmente usando corrientes alternas para limitar la
aparición de productos de la electrolisis en los electrodos. La resistencia de la
célula se mide usando un puente de Wheatstone como se ilustra en la Figura 6.14.
El principio operativo de este circuito es que cuando los dos “brazos” del puente
tienen igual resistencia, no fluye corriente entre los puntos A y B. En el
experimento, se varía la resistencia R3 hasta que ocurre esto. En estas condiciones,
la resistencia de la célula viene dada por
é33 -iH (6.68)
Si se mide la resistencia de la célula, la conductividad eléctrica de la disolución se
puede determinar usando la ecuación (6.68). La conductividad eléctrica de una
disolución depende del número de iones presentes. La conductividad de las
disoluciones iónicas se expresa como la conductividad molar, Λm, que se define
como:
Λ" (6.69)
donde c es la concentración molar de electrolito. La conductividad molar tiene
unidades de S m2 mol-1. Si κ es linealmente proporcional a la concentración de
electrolito, la conductividad molar será independiente de la concentración. La
Figura 6.15 presenta la conductividad molar medida para una variedad de
electrolitos en función de la concentración en agua a 25°C. Dos tendencias pueden
observarse: primero, ninguno de los electrolitos muestra una conductividad molar
independiente de la concentración; segundo, la dependencia con la concentración
de las diferentes especies indica que los electrolitos se pueden dividir en clasificar
en electrolitos fuertes y débiles. Los electrolitos fuertes como HCl, NaCl, KCl y
CuSO4 presentan una disminución moderada de la conductividad molar con el
aumento de la concentración. Los electrolitos débiles, representados por
CH3COOH, muestran que la conductividad molar es comparable a la de un
electrolito fuerte de concentración baja, pero decrece rápidamente con el aumento
de la concentración.
Figura 6.15. Conductividad molar, Λm, de varios compuestos en función de la
concentración, c. Las medidas se llevaron a cabo en agua a 25°C.
Electrolitos fuertes
La diferencia principal entre electrolitos fuertes y débiles es el grado de formación
de iones en disolución. Los electrolitos fuertes tales como los sólidos iónicos (KCl,
Na2SO4, etc.) y los ácidos y bases fuertes (HCl, NaOH, etc.) existen como especies
iónicas en disolución y su concentración está directamente relacionada con la
concentración de las especies iónicas en la disolución.
En 1900, Kohlrausch demostró que la dependencia de la conductividad molar de
los electrolitos fuertes está bien descrita por la siguiente ecuación:
Λ" Λ" E (6.70)
Esta ecuación, conocida como ley de Kohlrausch, establece que la conductividad
molar de los electrolitos fuertes disminuye linealmente con la raíz cuadrada de la
concentración, con una pendiente dada por la constante b. La pendiente depende
más de la estequiometría de los electrolitos (AB, AB2, etc.) que de la composición.
En la ecuación (6.70), Λ" es la conductividad molar a dilución infinita, es decir, la
conductividad molar esperada si las interacciones interiónicas estuvieran
enteramente ausentes. Es imposible llevar a cabo cualquier medida a dilución
“infinita”; sin embargo, la ley de Kohlrausch refleja que se puede determinar
realmente Λ" por medio de una representación gráfica de Λ" frente a la raíz
cuadrada de la concentración (referida a una concentración estándar, c0,
generalmente 1 M), y extrapolación a c = 0. La Figura 6.16 recoge la conductividad
molar de HCl, KCl y NaCl, inicialmente presentada en la Figura 6.15, pero ahora
muestra la representación de Λ" en función de (c/c0)1/2. La línea continua es un
ajuste de los datos usando la ley de Kohlrausch, y pone de manifiesto la capacidad
de esta ecuación para reproducir la dependencia de la concentración de Λ" para
electrolitos fuertes.
Figura 6.16. Variación de la conductividad molar frente a la raíz cuadrada de la
concentración para tres electrolitos fuertes: HCl, KCl y NaCl. Las líneas continuas
son los ajustes de la ley de Kohlrausch, ecuación (6.70).
Tabla 6.2. Valores de la conductancia molar iónica de iones representativos.
Ion 7 (S m2 mol-1) Ion * (S m2 mol-1)
H+ 0,0350 OH- 0,0199
Na+ 0,0050 Cl- 0,0076
K+ 0,0074 Br- 0,0078
Mg2+ 0,0106 F- 0,0054
Cu2+ 0,0107 NO3- 0,0071
Ca2+ 0,0119 CO32- 0,0139
Kohlrausch demostró también que para los electrolitos fuertes, la conductividad
molar a dilución infinita se puede describir en términos de contribuciones de los
constituyentes iónicos individuales, como sigue:
" 77 + ** (6.71)
En la ecuación (6.71),7y * son el número de especies cargadas positiva y
negativamente, respectivamente, en la fórmula empírica de un electrolito. Por
ejemplo, 7 = * =1 para el NaCl, que está constituido por Na+ y Cl−. La
conductividad molar iónica de los cationes y aniones se denota mediante 7 y *,
respectivamente, y representa la conductividad de un constituyente iónico
individual del electrolito. La ecuación (6.71) se conoce como ley de migración independiente de los iones y establece que en condiciones diluidas la
conductividad molecular de un electrolito es igual a la suma de las conductividades
de sus constituyentes iónicos. La Tabla 6.2 proporciona las conductividades
molares de varios iones en disolución acuosa.
Electrolitos débiles
Los electrolitos débiles sufren sólo una conversión fraccionaria en sus
constituyentes iónicos en disolución. El ácido acético es un ejemplo clásico de
electrolito débil. Los ácidos débiles se caracterizan por una conversión incompleta
a H3O+ y la base conjugada. La dependencia de Λ" con la concentración de un
electrolito débil se puede comprender considerando el grado de ionización. Para
un ácido débil (HA) que se disocia en agua para formar H3O+ y la base conjugada
(A−), la ionización incompleta se puede factorizar en las concentraciones iónica y
electrolítica del modo:
f57g f*g (6.72)
fg 1 (6.73)
donde α es el grado de ionización y c es la concentración inicial de electrolito.
Sustituyendo las ecuaciones (6.72) y (6.73) en la expresión de la constante de
equilibrio de un ácido débil se obtiene:
fi :gfFRgfFg ¡-'*¡ (6.74)
Resolviendo la ecuación (6.74) para α se obtiene
¢£# ?1 + .¢£' #¤ 1@ (6.75)
La conductividad molar de un electrolito débil a una concentración de electrolito
dada, Λm, se relaciona con la conductividad molar a dilución infinita, Λ¥ , por
Λ¥ Λ¥ (6.76)
Usando las ecuaciones (6.75) y (6.76), se puede determinar la dependencia con la
concentración de la conductividad molar y compararla con el experimento. La
relación entre Λm y c para un electrolito débil viene descrita por la ley de dilución de Ostwald:
'¦§ '¦§E + ¦§¢£¨¦§E ©- (6.77)
La Figura 6.17 muestra la comparación del comportamiento predicho por la
ecuación (6.77) con el experimento para el ácido acético (Kc = 1,8 x 10-5, Λ¥ =
0,03957 S m-2 mol-1), observándose un excelente acuerdo. La ley de dilución de
Ostwald se puede usar para determinar la conductividad molar a dilución infinita
para un ácido débil.
Figura 6.17. Comparación de la conductividad experimental y predicha para el
ácido acético (CH3COOH) en función de la concentración, usando la ley de dilución
de Ostwald de la ecuación (6.77). La ordenada en el origen, es igual a 1/Λ¥ .
QUÍMICA FÍSICA III Serie 4 Curso 2017-2018
1. El coeficiente de difusión de Xe a 273 K y 1 atm es 0,5 × 10−5 m2 s−1. (a) ¿Cuál es el área de
colisión de Xe? (b) En las mismas condiciones de presión y temperatura, ¿cuál es el área de
colisión del N2 si su coeficiente de difusión es tres veces mayor que el de Xe?
2. La conductividad térmica del Ar a 300 K y 1 atm es 0,0177 J K-1 m-1 s-1. ¿Cuál es el diámetro
de colisión de un átomo de Ar suponiendo que se comporta como un gas ideal?
3. La viscosidad y la densidad de la sangre humana a la temperatura del cuerpo son 4 cP y 1,0
g cm-3, respectivamente. El flujo de la sangre desde el corazón a través de la aorta es 5 L min-1
en un cuerpo humano en reposo. El diámetro de la aorta es típicamente de 2,5 cm. Calcúlese:
(a) el gradiente de presión a lo largo de la aorta; (b) la velocidad media de la sangre.
4. Calcúlese la distancia cuadrática media recorrida por una molécula de glucosa en agua a 25
°C en 30 minutos. Supóngase que las moléculas de glucosa se difunden a partir de (a) una capa
depositada en el fondo del vaso y (b) un pequeño terrón suspendido en el seno del agua.
¿Cuánto tiempo tardarán las moléculas de glucosa en recorrer una distancia de 1 mm y 1 cm
desde su punto de partida en el caso a? El coeficiente de difusión de la glucosa en agua a 25 °C
es 0,673 x 10-9 m2 s-1.
5. Dos tubos de cobre, cada uno de 3 m de longitud, con un diámetro interno el primero de 2,6
cm y de 1,3 cm el segundo, se conectan en serie. Se establece una presión de 5 atm en el
extremo abierto del tubo más ancho, y del extremo más estrecho sale aceite a una presión de
1 atm. Para el aceite, η = 0,114 Pa s a 15 °C. (a) Calcúlese la presión en el punto en que se unen
los dos tubos. (b) ¿Cuántos litros por minuto pueden obtenerse mediante esta combinación?
6. Los cilindros de gas CO2 se venden en función del peso de CO2. Un cilindro contiene 22,7 kg
de CO2. ¿Cuánto durará este cilindro en un experimento que requiere un flujo de CO2 a 293 K
(η =146 µP) a través de un tubo de 1,00 m de largo y 0,75 de diámetro con una presión de
entrada de 1,05 atm y una presión de salida de 1,00 atm? El flujo se mide a la salida del tubo.
7. Calcúlese la velocidad final de caída de una bola de acero de 1,00 mm de diámetro y 4 mg de
masa, en agua a 25 °C. Repítase el cálculo para glicerina (ρ = 1,25 g cm-3). Las viscosidades del
agua y de la glicerina a 25 °C y 1 atm son 0,89 y 954 cP, respectivamente.
8. El hidrógeno gaseoso se difunde a través de una lámina de paladio de 0,0050 cm de
espesor. Del lado izquierdo de la lámina, el hidrógeno se mantiene a 25 °C y una presión de
750 mm, mientras que del lado derecho se mantiene un buen vacío. Después de 24 h, el
volumen de hidrógeno en el compartimento de la izquierda disminuye en 14,1 cm3. Si el área
de la lámina a través de la cual ocurre la difusión es 0,743 cm2. ¿Cuál es el coeficiente de
difusión del hidrógeno en el paladio?
9. La hemoglobina es una proteína responsable del transporte de oxígeno. El coeficiente de
difusión de la hemoglobina humana en agua a 298 K (η = 0.891 cP) es 6,9 x 10−11 m2 s−1.
Suponiendo que esta proteína se puede aproximar como esférica, ¿cuál es el radio de la
hemoglobina?
10. En un experimento de conductividad se han obtenido los siguientes datos de
conductividad molar frente a concentración molar para un electrolito:
c (M) 0,0005 0,001 0,005 0,01 0,02 0,05 0,1
Λm (S m2 mol-1) 0,01245 0,01237 0,01207 0,01185 0,01158 0,01111 0,01067
Determínese si el electrolito es fuerte o débil y la conductividad molar del electrolito a
dilución infinita.
Lección 7: CINÉTICA QUÍMICA Conceptos básicos: velocidad de reacción, constante de velocidad, ecuación cinética, orden parcial y orden total de reacción. Integración de las ecuaciones cinéticas. Mecanismos de reacción. Influencia de la temperatura en las velocidades de reacción.
La Cinética Química trata esencialmente de las velocidades con que se llevan a cabo las reacciones y de los caminos que éstas siguen. Del estudio de la velocidad de una reacción y de las variables de que depende (concentración, temperatura, presión, etc.) se pueden sacar conclusiones sobre el camino por el que ésta transcurre, es decir, sobre el mecanismo de reacción.
Conceptos básicos: velocidad de reacción, constante de velocidad, ecuación cinética, orden parcial y orden total de reacción Consideremos la reacción homogénea A + B +⋯→ E + F +⋯ (7.1) donde a, b, …, e, f, … son los coeficientes estequiométricos y A, B, …, E, F, … las especies químicas, y supongamos que la reacción se realiza en un sistema cerrado. La velocidad a la cual cualquier reactivo se consume es proporcional a su coeficiente estequiométrico; por tanto,
/ / =
y =
(7.2)
donde t es el tiempo y nA y nB los números de moles de A y B, respectivamente. La velocidad de conversión J para la reacción (7.1) se define como
≡ − = −
= ⋯ =
=
= ⋯ (7.3)
Dado que A desaparece, dnA/dt es negativo y J es positivo. En el equilibrio, J=0. La velocidad de conversión, J, es una magnitud extensiva y, por tanto, depende del tamaño del sistema. La velocidad de conversión por unidad de volumen, J/V, se denomina velocidad de reacción, r:
≡ !" =
" #− $ = ⋯ (7.4)
r es una magnitud intensiva y depende de T, P y de la concentración en el sistema homogéneo. En la mayoría de los sistemas estudiados el sistema es constante o cambia en una cantidad despreciable. Cuando V es esencialmente constante, tenemos
" = %&
= ' = ()*
(7.5)
donde cA≡[A] es la concentración molar de A. Por tanto, para la reacción (7.1)
= − ()* = −
(+* = ⋯ =
(,* =
(-* = ⋯ .constante (7.6)
Las unidades de r son mol dm-3 s-1 y mol cm-3 s-1. Para muchas reacciones se ha encontrado experimentalmente que la forma de r a un tiempo t está relacionada con las concentraciones de las especies presentes en ese tiempo t mediante una expresión del tipo = 6(A*7(B*8 ··· (L*; (7.7) en donde los exponentes α, β, …, λ, llamados órdenes parciales de reacción son, en general, números enteros o semienteros (1/2, 3/2, …). Se dice que la reacción tiene orden α respecto a A, orden β respecto a B, etc. La suma α + β + ··· + λ = n es el orden total (o simplemente el orden) de la reacción. La constante de proporcionalidad k, denominada constante cinética o coeficiente de velocidad, depende de la temperatura y de la presión. La dependencia de k con la presión es pequeña y generalmente no se tiene en cuenta. Puesto que r tiene unidades de concentración dividida por el tiempo, las unidades de k en (7.7) son concentración1-n tiempo-1. En general, k suele expresarse en (dm3/mol)n-1 s-1. La expresión de r en función de las concentraciones, a una temperatura dada, se denomina ecuación cinética. Una ecuación cinética tiene la forma r=f([A], [B], …) para una temperatura dada, en donde f es función de las concentraciones. En la Tabla 7.1 se recogen algunas ecuaciones cinéticas observadas para reacciones homogéneas son: Tabla 7.1. Ejemplos de reacciones químicas homogéneas junto con sus respectivas ecuaciones cinéticas observadas.
(1) H2 + Br2 → 2HBr = 6(H=*(Br=*/=1 + @(HBr*/(Br=* (2) 2N2O5 → 4NO2 + O2 = 6(N=OC* (3) H2 + I2 → 2HI = 6(H=*(I=* (4) 2NO + O2 → 2NO2 = 6(NO*=(O=* (5) CH3CHO → CH4 + CO = 6(CHFCHO*F/= (7.8)
(6) 2SO2 + O2 GHIJ 2SO3 = 6(O=*(NO*=
(7) H2O2 + 2I- + 2H+ → 2H2O + I2 = 6(H=O=*(IK* + 6=(H=O=*(IK*(HL* (8) Hg22+ + Tl3+ → 2Hg2+ + Tl+ = 6 (Hg==L*(TlFL*(Hg=L*
donde los valores de k dependen apreciablemente de la temperatura y difieren de una reacción a otra; en la reacción (1), j es una constante. Las reacciones (1)-(6) transcurren en fase gaseosa; la (7) y la (8) ocurren en disolución acuosa. Para la reacción (1), el concepto de orden es inaplicable. En la reacción (7) cada uno de los dos términos de la ecuación cinética tiene un orden, pero la velocidad de reacción no tiene ninguno. La reacción (5) tiene un orden 3/7. En la reacción (6), el compuesto NO acelera la reacción, pero no aparece en la ecuación química neta, siendo, por consiguiente, un catalizador. En la reacción (8), el orden de reacción con respecto a Hg2+ es -1. Hay que hacer constar también que en las ecuaciones (1), (2), (5), (6), (7) y (8) los exponentes de las ecuaciones cinéticas pueden diferir de los coeficientes de la ecuación química ajustada. Por ejemplo, la reacción (1) tiene una estequiometría muy sencilla, pero su ecuación cinética es complicada. En algunos casos como las reacciones (2) y (3), la ecuación cinética sí refleja la estequiometría de la reacción, pero éste no es el caso general: las ecuaciones cinéticas han de determinarse a partir de medidas de velocidades de reacción y no pueden deducirse a partir de la estequiometría. Estos hechos apuntan a tres problemas. Primero, hay que ver cómo se llega a la ecuación cinética, y al valor de la constante de velocidad, a partir de los datos experimentales. Segundo, hay que ver cómo construir mecanismos de reacción que sean compatibles con la ecuación cinética. Tercero, hay que explicar los valores de las constantes de velocidad y su dependencia con respecto a la temperatura. Integración de las ecuaciones cinéticas
En los experimentos de Cinética Química se miden las concentraciones de las sustancias en tiempos diferentes. El problema es encontrar la ecuación cinética que gobierna la reacción, es decir, la expresión matemática que relaciona la velocidad con las concentraciones. Esto puede resolverse empezando por integrar una ecuación cinética que se supone aplicable para obtener una relación entre las concentraciones y el tiempo que, después, se compara con los datos experimentales. Si no hay acuerdo se prueba otra ecuación cinética y así sucesivamente hasta encontrar la que más se ajusta a los experimentos cinéticos. Veamos, a continuación, la integración de las ecuaciones cinéticas más frecuentes, empezando por las sencillas para luego comentar algunas más complejas. En todos los casos, supondremos que la reacción transcurre a temperatura y volumen constantes. La primera suposición implica que la constante de velocidad sólo depende de la temperatura y la segunda implica que la velocidad de reacción viene dada por la ecuación (7.6). I. Reacciones simples a) Reacciones de primer orden Supongamos que la reacción aA → productos es de primer orden. A partir de las ecuaciones (7.6) y (7.7) puede deducirse que la ecuación cinética para este caso es
= − ()* = 6(A* (7.9)
Esta ecuación diferencial se puede integrar separando variables y teniendo en cuenta que los límites de integración son [A] = [A]0 para t = 0 y [A] = [A] para t = t, respectivamente:
− P ()*
()*()*()*Q = 6 P RS
T (7.10)
− UVW(A*X()*Q()* = 6(S*T (7.11)
VW(A* = VW(A*T − 6S (7.12)
(A* = (A*TKY (7.13) Por tanto, para una reacción de primer orden, [A] decrece exponencialmente con respecto al tiempo y según la ecuación (7.12), una representación de ln[A] frente a t da una línea recta cuya pendiente nos permite conocer el valor de aK. Este producto es una constante cinética que se refiere a la velocidad del cambio de concentración de A. La reacción de descomposición 2N2O5(g) → 4NO2(g) + O2(g) es un ejemplo de reacción de primer orden. La Figura 7.1 recoge la variación experimental de la concentración de las sustancias N2O5, NO2 y O2 con el tiempo. El avance del tiempo trae consigo un aumento de la concentración de los productos y, en consonancia con una cinética de primer orden, se produce una disminución exponencial de la concentración del reactivo.
Figura 7.1. Variación de la concentración de N2O5 (línea roja), NO2 (línea verde) y O2 (línea azul) con el tiempo para la reacción de descomposición 2N2O5(g) → 4NO2(g) + O2(g) a 25 °C. La representación gráfica del ln[N2O5] frente t en la Figura 7.2 refleja un ajuste excelente (R2=0.9999) de los datos experimentales a la ecuación integrada lineal de una reacción de primer orden. La comparación de la recta de ajuste mostrada en la Figura 7.2 con la ecuación (7.12) en la que sustituimos [A], [A]0 y a por [N2O5],
0,00
0,01
0,02
0,03
0 100 200 300 400 500 600 700 800
Co
nce
ntr
ació
n (
M)
t (s)
[N2O5]0 y 2, respectivamente, lleva a deducir que -2k=-0,0017 s-1 y, por tanto, la constante cinética de la reacción tiene un valor de 8,5 x 10-4 s-1.
Figura 7.2. Variación de la concentración de N2O5 con el tiempo para la reacción de descomposición 2N2O5(g) → 4NO2(g) + O2(g) a 25 °C. Para indicar la rapidez de los procesos cinéticos, los químicos utilizan a menudo el concepto de periodo de semirreacción, t1/7. Se define como el tiempo necesario para que una reacción transcurra hasta la mitad del total para completarse. Por tanto, si la concentración inicial de la sustancia original es [A]0, transcurrido t1/2, la concentración ha disminuido hasta [A]0/7. Para una reacción de primer orden, sustituyendo [A] = [A]0/2 y t = t1/2 en (7.12), t1/2 es igual 0,693/(ak). Es decir, el periodo de semirreacción sólo depende de la constante cinética de primer orden y no depende de la concentración inicial. Una magnitud relacionada con t1/2, pero diferente es el tiempo de vida media, τ, de una molécula de reactivo, es decir, la media de los tiempos de vida de todas las moléculas que experimentan la reacción. Si la concentración de estas moléculas para un tiempo cualquiera t es [A], entonces el tiempo de vida media es
Z = P ([*\Q ()*Q (7.14)
Para una reacción de primer orden, sustituyendo (7.13) en (7.14) e integrando se obtiene que τ es igual a 1/(ak). Por consiguiente, t1/2 = 0,693τ. b) Reacciones de segundo orden Las dos formas más comunes de ecuaciones cinéticas de segundo orden son r = k[A]2 y r = k[A][B], donde A y B son dos reactivos diferentes. Supongamos que la reacción aA → productos es de segundo orden con r = k[A]7. Entonces:
= − ()* = 6(A*= (7.15)
ln [N2O5] = -0,0017t - 3,9128R² = 0,9999
-5,50
-5,00
-4,50
-4,00
-3,50
0 200 400 600 800
ln[N
2O
5]
t (s)
Procediendo de una forma similar a la cinética de primer orden deducimos que:
− P ()*
()*]()*()*Q = 6 P RS
T (7.16)
− ^−
()*_()*Q()* = 6(S*T (7.17)
()* =
()*Q + 6S (7.18)
A partir de (7.18), una representación de 1/[A] frente a t da una línea recta de pendiente ak, si r = k[A]7. El periodo de semirreacción para esta reacción de segundo orden es igual a (1/[A]0)ak. Es decir, que t1/2 depende de la concentración inicial de A, a diferencia de lo que sucedía con las reacciones de primer orden. Supongamos ahora que la reacción aA + bB → productos es de segundo orden con r = k[A][B]. Entonces, basándonos en las ecuaciones (7.6) y (7.7) se obtiene que:
− ()* = 6(A*(B* (7.19)
La ecuación anterior presenta tres variables, [A], [B] y t. Por ello, para integrar (7.19) debemos expresar [B] en términos de [A]. Las cantidades de B y A que reaccionan son proporcionales a sus coeficientes estequiométricos b y a, de forma que según las relaciones matemáticas (7.2) tenemos que:
∆a∆b =
(7.20)
Dividiendo por el volumen llegamos a que:
∆(c*∆([* =
(7.21)
Sustituyendo ∆[B] y ∆[A] por ([B]-[B]0) y ([A]-[A]0), respectivamente, y despejando [B] en (7.21) deducimos que:
(B* = (B*T + (A* − (A*T (7.22)
Sustituyendo (7.22) en (7.18), separando [A] y t e integrando, llegamos a las expresiones siguientes:
− P
()*#(+*QKde()*QLd
e()*$= R(A* = 6 P RS=
(7.23)
#(+*QKd
e()*Q$fVW (+*QKd
e()*QLde()*()* g
== 6 S= − S (7.24)
Utilizando (7.22) en (7.24) da
(+*QK()*Q ^VW
(+*()*_
= = 6 S= − S (7.25)
(+*QK()*Q VW
(+*/(+*Q()*/()*Q = 6S (7.26)
En (7.26), [A] y [B] son las concentraciones en el tiempo t y [A]0 y [B]0 las concentraciones en el tiempo 0. La representación del término izquierdo de (7.26) frente al tiempo da una línea recta de pendiente k. El concepto de periodo de semirreacción no es aplicable aquí, ya que cuando [B] = [B]0/2, [A] no es igual a [A]0/2, a menos que los reactivos sean mezclados en proporciones estequiométricas. Un ejemplo de una reacción de segundo orden es la descomposición 2NO2(g) → NO(g) + O2(g). Así, la Figura 7.3(a) pone de manifiesto que la representación gráfica de 1/[NO2] frente a t conduce a una recta de ajuste excelente (R2 = 1), lo que no sucede (R2 = 0,9737) cuando se representan frente al tiempo los valores de ln[NO2] (véase Figura 7.3(b)). (a)
(b)
Figura 7.3. Representación gráfica de (a) 1/[NO2] y (b) ln[NO2] frente al tiempo a partir de un estudio cinético de la reacción de 2NO2(g) → NO(g) + O2(g).
1/[NO2] = 0,5408t + 124,97R² = 1
100
150
200
250
300
350
400
0 100 200 300 400 500
1/[
NO
2]
(M-1
)
t (s)
ln[NO2] = -0,0023t - 4,9333
R² = 0,9737
-6,50
-6,00
-5,50
-5,00
-4,50
0 100 200 300 400 500
ln[N
O2]
t (s)
c) Reacciones de orden n Consideremos sólo una de las muchas posibles ecuaciones cinéticas de orden n.
= − ()* = 6(A* (7.27)
La integración entre [A] = [A]0 para t = 0 y [A] = [A] para t = t da
− P ()*
()*%()*()*Q = 6 P RS
T (7.28)
()*h%ijK()*Qh%ij
KL = −6S para n ≠ 1 (7.29)
()*%hj =
()*Q%hj + W − 16S para n ≠ 1 (7.30)
Sustituyendo [A] = [A]0/2 y t = t1/2 en (7.30), se obtiene como periodo de semirreacción
S/= = =%hjK KY()*Q%hj para n ≠ 1 (7.31)
Las ecuaciones (7.30) y (7.31) valen para todos los valores de n excepto para 1. Tomando logaritmos neperianos en (7.31), se llega a que
VW S/= = VW =%hjK KY − W − 1VW(A*T (7.32)
Una representación de ln(t1/2) frente a ln[A]0 ha de dar una recta con pendiente igual a (n-1). Por tanto, un procedimiento a seguir para determinar el orden de reacción consiste en determinar si el tiempo de vida media cambia o no con la concentración. En el caso de que t1/2 sea constante, la reacción es de primer orden; pero en caso contrario, entonces se representa ln(t1/2) frente a ln[A]0 y de la pendiente de la recta de ajuste obtenida se calcula n. II. Reacciones complejas En la práctica, la mayoría de las reacciones no transcurren según alguno de los procesos sencillos vistos anteriormente, sino por combinaciones de ellos. Tales reacciones se llaman complejas, y aunque no existe un método general para estudiarlas, hay, sin embargo, tres casos relativamente simples que trataremos a continuación. Por combinación de estos casos se pueden explicar muchos mecanismos de reacciones complejas. a) Reacciones reversibles Son aquellas en las cuales los productos de reacción se combinan entre sí para volver a dar los reactivos. Estudiaremos aquí el caso más sencillo en que tanto la reacción directa (reactivos → productos) como la inversa (productos → reactivos) son de primer orden y que los coeficientes estequiométricos son la unidad. Consideremos la reacción reversible
A66lC (7.33)
La velocidad de variación de [A] tiene dos contribuciones: disminuye por la reacción directa a una velocidad kd[A] y aumenta en la reacción inversa a una velocidad ki[C]. Por tanto, la velocidad neta de cambio es
()* = −6(A* + 6l(C* (7.34)
Tenemos que ∆[C] = -∆[A], por lo que [C]-[C]0 = -([A]-[A]0). Sustituyendo [C] = [C]0 + [A]0 - [A] en (7.34) se obtiene
()* = 6l(A*T+6l(C*T − 6+6l(A* (7.35)
En el límite t → ∞, el sistema alcanza el equilibrio, es decir, las velocidades de las reacciones directa e inversa se hacen iguales. En esta situación, la concentración de cada especie es constante y d[A]/dt es 0. Sea [A]eq la concentración de A en el equilibrio. Haciendo d[A]/dt = 0 y [A] = [A]eq en (7.35), obtenemos 6l(A*T+6l(C*T = 6+6l(A*mn (7.36)
Usando (7.35) en (7.34) llegamos a que
()* = 6+6lo(A*mn − (A*p (7.37)
Integrando (7.37), obtenemos
VW ()*K()*qr()*QK()*qr = − 6+6lS (7.38)
(A* − (A*mn = o(A*T − (A*mnpKs (7.39)
siendo j = kd + ki y donde [A]eq puede calcularse a partir de (7.36). La ecuación (7.39) recuerda la (7.13), obtenida para una reacción irreversible de primer orden, tomando [A]eq = 0 y ki = 0. La dependencia temporal de [A] y [C] para la reacción (7.33) con kd/ki igual a 2 se representa en la Figura 7.4. En el equilibrio (t → ∞), al cumplirse que [C]eq + [A]eq = [C]0 + [A]0, entonces (7.36) se transforma en
(t*qr()*qr = Yu
Yv = w (7.40)
donde K es la constante de equilibrio de la reacción reversible.
Figura 7.4. Concentraciones frente al tiempo para la reacción reversible de primer orden A C para el caso kd/ki = 7. b) Reacciones consecutivas Son aquellas en las que el producto de una reacción es el reactivo de la siguiente. El caso más simple corresponde al esquema
A Yj→ B Y]→ C (7.41)
donde por simplicidad consideraremos que ambas reacciones son de primer orden y que los coeficientes estequiométricos son la unidad. Por tanto, las velocidades de las reacciones primera y segunda son, respectivamente, r1 = k1[A] y r2 = k2[B]. Las velocidades con las que varía [B] debido a las reacciones primera y segunda son, respectivamente, (d[B]/dt)1 = k1[A] y (d[B]/dt)2 = -k2[B]. Por tanto,
(+* = 6(A* − 6=(B* (7.42)
Tenemos que
()* = −6(A*,(+* = 6(A* − 6=(B*,(t* = 6=(B* (7.43)
Suponiendo que para t = 0 sólo existe A en el sistema:
(A*T y 0,(B*T = 0,(C*T = 0 (7.44)
Tenemos tres ecuaciones diferenciales acopladas. La primera en (7.43) es la misma que (7.13), y teniendo en cuenta (7.16), se obtiene
(A* = (A*TKYj (7.45)
Sustituyendo (7.45) en la segunda ecuación de (7.43), resulta
(+* = 6(A*TKYj − 6=(B* (7.46)
La integración de esta ecuación conduce a
(B* = Yj()*QY]KYj KYj − KY] (7.47)
Para calcular [C], lo más sencillo es considerar la conservación de la materia. El número de total de moles presentes es constante en el tiempo, de modo que [A] + B] +[C] = [A]0. Utilizando (7.45) y (7.47), resulta
(C* = (A*T #1 − Y]Y]KYj KYj + Yj
Y]KYj KY]$ (7.48)
Figura 7.5. Variación de la concentración con el tiempo para las reacciones consecutivas A → B → C con constantes cinéticas a) k2 = 6k1 y b) k2 = (1/6)k7. La Figura 7.5 muestra curvas típicas de variación de la concentración de A, B y C en función del tiempo para los casos k1 >> k2 y k1 << k7. El caso k1 << k2 es típico de reacciones en las que intervienen especies intermedias inestables como radicales libres. En estas reacciones la velocidad de producción del intermedio es lenta, pero una vez que éste se forma desaparece prácticamente de forma instantánea para dar lugar a productos. En este caso, la concentración de B es pequeña a lo largo de la reacción (Figura 7.5b). En el otro caso, sin embargo, la reacción de B es grande y hay un periodo de inducción para la aparición de C. Cuando d[B]/dt = 0, la [B] alcanza su valor máximo (véase Figura 7.5). El tiempo correspondiente a ese máximo se denomina periodo de inducción, tind, y viene dado por tind =
[ln(k2/k1)]/(k2-k1). Por tanto, el periodo de inducción dependerá de los valores relativos de las constantes cinéticas k1 y k7. c) Reacciones competitivas Las reacciones competitivas, también llamadas paralelas, son aquellas en las que dos o más procesos compiten en la desaparición de un determinado reactivo o en la aparición de un determinado producto. Por ejemplo, la nitración del tolueno puede tener lugar en la posición orto, meta o para. Consideremos el caso más simple, el de dos reacciones irreversibles competitivas de primer orden y con coeficientes estequiométricos igual a 1:
A Yj→ CyA Y]→| (7.49) La ecuación cinética es
()* = −6(A* − 6=(A* = − 6 + 6=(A* (7.50)
Esta ecuación es la misma que (7.13) con k = k1 + k7. Por tanto, (7.17) da
(A* = (A*TK YjLY] (7.51)
Para C tenemos
(t* = 6(A* = 6(A*TK YjLY] (7.52)
de modo que separando variables e integrando desde t = 0 y [C] = 0 hasta t = t y [C] = [C], se obtiene
(C* = Yj()*QYjLY] o1 − K YjLY]p (7.53)
De igual forma, la integración de , d[D]/dt = k2[A] da
(D* = Y]()*QYjLY] o1 − K YjLY]p (7.54)
La suma de las constantes cinéticas k1+ k2 aparece en las expresiones para [C] y [D]. La Figura 7.6 representa [A], [C] y [D] frente al tiempo para k1 = 2k7. En cualquier instante de la reacción se obtiene, dividiendo (7.53) por (7.54):
(t*(~* = Yj
Y] (7.55)
Las cantidades de C y D obtenidas dependen de la velocidad relativa de las dos reacciones competitivas. La relación [C]/[D] nos permite determinar k1/k7.
Mecanismos de reacción
La ecuación química (7.1) nos da la estequiometría global de la reacción, pero no informa acerca del proceso o mecanismo por el que transcurre. Por ejemplo, se ha propuesto que la oxidación de SO2 catalizada por NO, reacción (6) en Tabla 7.1:
2SO2 + O2 GHIJ 2SO3 = 6(O=*(NO*=
transcurre a través del siguiente proceso
O2 + 2NO → 2NO2
NO2 + SO2 → NO + SO3
Como en el primer proceso se producen dos moléculas de NO2, el segundo proceso debe darse dos veces cada vez que ocurra el primero. Sumando dos veces el segundo proceso al primero se obtiene la reacción global 2SO2 + O2 → 2SO3. La reacción global no incluye la especie intermedia NO2 ni el catalizador NO (el cual se gasta en el primer proceso y se regenera en el segundo). Las especies como NO2 se denominan intermedios de reacción. Cada etapa en el mecanismo de reacción recibe el nombre de reacción elemental. Una reacción simple contiene una sola etapa. Una reacción compleja (o compuesta) contiene dos o más etapas elementales. Cualquier mecanismo de reacción que se proponga debe cumplir la ecuación cinética observada. Generalmente, no es posible una deducción exacta de la ecuación cinética a partir de las ecuaciones diferenciales de un mecanismo de reacción que consta de varias etapas, a causa de la dificultad matemática para tratar sistemas de varias ecuaciones diferenciales acopladas. Por ello, se recurre en general a la utilización de aproximaciones. Los métodos aproximados más utilizados son la aproximación de la etapa limitante y aproximación del estado estacionario.
1. Aproximación de la etapa determinante En todo mecanismo de reacción existirán etapas más rápidas y otras más lentas. En la aproximación de la etapa determinante de la velocidad (también llamada de la etapa limitante o aproximación de equilibrio) se supone que el mecanismo de reacción consta de una o más ecuaciones reversibles que permanecen cercanas al equilibrio durante la mayor parte de la reacción, seguidas por una etapa relativamente lenta, la cual, a su vez es seguida por una o más reacciones rápidas. En casos especiales, puede que no existan etapas del equilibrio antes de la etapa limitante o reacciones rápidas después de la misma. Consideremos, por ejemplo, el siguiente mecanismo
A 66KB 6=6K=
C 6F6KF
D (7.56)
donde se supone que la etapa 2 es la limitante. Para que esta suposición sea válida debe cumplirse que k-1 >> k2. La velocidad lenta de B → C comparada con B → A asegura que la mayoría de las moléculas de B se reconvierten en A, antes que den C, asegurando así que la etapa 1 permanece cercana al equilibrio. Además de esto, deberá cumplirse que k3 >> k2 y k3 >> k-2 para asegurar que la etapa 2 actúa como un cuello de botella y que el producto D se forma rápidamente a partir de C. La reacción global viene entonces controlada por la etapa limitante B → C. Dado que estamos examinando la velocidad de la reacción directa A → D, suponemos además que k2[B] >> k-2[C]. Durante los primeros instantes de la reacción, la concentración de C será baja comparada con la de B, cumpliéndose la condición anterior. Así, despreciamos la reacción inversa en la etapa 2. Puesto que la etapa que controla la velocidad se ha considerado esencialmente irreversible, es irrelevante que las etapas rápidas después de la limitante sean reversibles o no. La ecuación cinética observada dependerá sólo de la naturaleza del equilibrio que precede a la etapa limitante y de esta propia etapa. La magnitud relativa de k1, comparada con k2[B] >> k-2, es irrelevante para la validez de la aproximación de la etapa de la velocidad limitante. Por tanto, la constante cinética con k2 de la etapa limitante podría ser mayor que con k1. Sin embargo, la velocidad r2 = k2[B] de la etapa limitante debe ser mucho más pequeña que la velocidad r1 = k1[A] de la primera etapa. Esto se deduce a partir de k2 << k-1 y k1/k-1 ≈ [B]/[A]. Para la reacción global inversa, la etapa limitante es la inversa de la reacción directa. Por ejemplo, para la ecuación inversa de (7.56) la etapa limitante es C → B. Esto se desprende de la desigualdad anterior k-2 << k3 (que establece que la tercera etapa está en equilibrio) y k-1 >> k2 (que indica que B → A es rápida). A modo de ejemplo, apliquemos la aproximación de la etapa determinante a la reacción
HL + HNO= + CHCNH= +hIJCHCN=L + 2H=O (7.57) cuya ecuación cinética observada es
= 6(HL*(HNO=*(BrK* (7.58)
y teniendo en cuenta el mecanismo propuesto siguiente:
HL + HNO= 66K
H=NO=L equilibrio rápido
H=NO=L +BrK Y]→ ONBr + H=O lenta (7.59)
ONBr + CHCNH=Y→CHCN=L + H=O +BrK rápida
La segunda etapa del mecanismo de reacción (7.59) es la etapa determinante de la velocidad de reacción. Como la tercera etapa es mucho más rápida que la segunda, podemos tomar la velocidad de desaparición de ONBr en la tercera etapa, es decir, la velocidad de formación de CHCN=L igual a la velocidad de formación de ONBr en la segunda etapa. Por tanto, la velocidad de reacción es:
= 6=(H=NO=L*(BrK* (7.60)
Teniendo en cuenta que la primera etapa está cerca del equilibrio:
YjYhj = ]GH]i
(i*(GH]* (7.61)
de modo que:
(H=NO=L* = # YjYhj$ (HL*(HNO=* (7.62)
Sustituyendo la ecuación (7.62) en (7.60), se obtiene la ecuación (7.58), confirmando así el mecanismo de reacción propuesto. 2. Aproximación del estado estacionario Este método es particularmente útil cuando en el mecanismo de la reacción participan intermedios muy reactivos, que están presentes en muy pequeñas cantidades durante la reacción. En esos casos, suele ser una buena aproximación considerar que la variación de la concentración de estos intermedios con el tiempo es despreciable en comparación con el resto de especies participantes en la reacción global. De hecho, estos intermedios no aparecerán en la reacción global, aunque sí participen en dos o más de las etapas de las que está constituido el mecanismo. Matemáticamente, la condición del estado estacionario para el intermedio I se puede expresar como
(* ≈ 0 (7.63)
siendo [I] la concentración de dicho intermedio. Esta aproximación supone que (después del periodo de inducción) la velocidad de formación de un intermedio de reacción coincide esencialmente con su velocidad de desaparición, consiguiéndose así que éste se mantenga en una concentración próxima a un valor constante. Para aplicar la aproximación del estado estacionario: (a) se toma la velocidad de reacción r igual a la velocidad de formación de los productos de la última etapa; (b) se elimina la concentración de cualquier intermedio de reacción que aparezca en la ecuación cinética obtenida en (a) usando (7.63) para cada intermedio (c) si en el paso (b) aparecen concentraciones de otros intermedios, se aplica (7.63) a éstos para eliminar sus concentraciones.
Con el fin de demostrar el uso de la aproximación del estado estacionario, utilicemos de nuevo el mecanismo (7.59), propuesto para la reacción (7.57), sin tener en cuenta las suposiciones de que la primera etapa está próxima al equilibrio y que la segunda etapa es lenta. Tenemos, entonces, que:
= tG]i = 6F(ONBr*(CHCNH=* (7.64)
Los intermedios de reacción son ONBr y H=NO=L. Para eliminar el intermedio ONBr de la ecuación (7.64), aplicamos la aproximación del estacionario a esta especie, de modo que:
(HG+*
= 0 = 6=(H=NO=L*(BrK* − 6F(ONBr*(CHCNH=* (7.65)
Despejando (ONBr* en la ecuación (7.65), se obtiene:
(ONBr* = Y]]GH]i(+h*Y(tG]* (7.66)
Sustituyendo la ecuación (7.66) en (7.64), llegamos a que:
= 6=(H=NO=L*(BrK* (7.67)
Para eliminar H=NO=L de la ecuación (7.67), aplicamos la aproximación del estado estacionario a esta especie, de modo que:
]GH]i
= 0 = 6(HL*(HNO=* − 6K(H=NO=L* − 6=(H=NO=L*(BrK* (7.68)
(H=NO=L* = Yj(i*(GH]* YhjLY](+h* (7.69)
Sustituyendo la ecuación (7.69) en (7.67), se obtiene que:
= YjY](i*(GH]*(+h*YhjLY](+h* (7.70)
Suponiendo que 6K>> 6=(BrK*, la ecuación (7.70) se reduce a la ecuación (7.58). Esto equivale a suponer que la velocidad del proceso inverso de la primera etapa es mucho mayor que la velocidad de la segunda etapa, es decir, que la primera etapa está cercana al equilibrio, al igual que en la aproximación de la etapa de la velocidad determinate.
Influencia de la temperatura en las velocidades de reacción
La velocidad de la mayoría de las reacciones es muy sensible a la temperatura, observándose experimentalmente que dicha velocidad aumenta con la temperatura. Se ha observado experimentalmente también que los órdenes de reacción no dependen de la temperatura ni tampoco las concentraciones de los reactivos o productos de reacción. Es, por tanto, la constante de velocidad de reacción la magnitud que varía con la temperatura (véase Figura 7.6(a)) y, en mucha menor cuantía, con la presión. Una regla aproximada, válida para muchas reacciones en disolución, es que cerca de la temperatura ambiente, k se duplica o triplica por cada aumento de temperatura de 10 °C. En 1889, Arrhenius demostró que los datos de la constante k(T) para muchas reacciones podían ajustarse a la expresión 6 = Ke ⁄ (7.71)
donde A y Ea son constantes características de la reacción y R es la constante de los gases; Ea es la llamada energía de activación de Arrhenius y A es el factor pre-exponencial o factor de Arrhenius. Las unidades de A son las mismas que las de k. Las de Ea son las mismas que las de RT, es decir, energía por mol; Ea generalmente se expresa en kcal/mol o kJ/mol. Arrhenius llegó a (7.71) considerando que la influencia de la temperatura en la constante de velocidad sería del mismo tipo que en las constantes de equilibrio y por analogía escribió,
Y = e
] (7.72)
que al integrar da (7.73), suponiendo que Ea es independiente de T.
VW 6 = VW − e o V 6 = V − e
=,FTF (7.73)
Es decir, si la ecuación de Arrhenius se cumple, una representación de log k en función de 1/T ha de dar una línea recta de pendiente -Ea/2,303R y ordenada en el origen log A (véase Figura 7.6(b)). Esto nos permite obtener, respectivamente, Ea y A. El error típico experimental en Ea es 1 kcal/mol y en A es un factor de 3. La ecuación de Arrhenius (7.73) resulta satisfactoria para casi todas las reacciones homogéneas elementales y muchas reacciones complejas. El parámetro de energía de activación introducido por Arrhenius goza de plena vigencia hoy en día. Dicho término caracteriza la influencia de la temperatura en la velocidad de reacción. Una energía de activación pequeña significa poca pendiente en la representación de Arrhenius y que la reacción es tan rápida que poca aceleración o activación se logra elevando la temperatura. Por el contrario, una energía de activación grande significa una reacción lenta, gran pendiente en la representación tipo Arrhenius, y que por tanto se activará sustancialmente al elevar la temperatura. Fue también el propio Arrhenius quien asoció esta energía de activación a la idea de que dos moléculas que colisionan requieren una cantidad mínima en su energía relativa para romper el enlace apropiado y que pueda formarse el nuevo compuesto. Para
Figura 7.6. (a) Variación de la constante de velocidad con la temperatura para la reacción de descomposición de primer orden 2N2O5 → 4NO2 + O2. (b) Representación gráfica de Arrhenius del log k frente al inverso de la temperatura para dicha reacción. una reacción unimolecular se necesita una energía mínima para isomerizar o descomponer la molécula; la fuente de esa energía son las colisiones. La ley de distribución de Maxwell-Boltzmann contiene el factor e-ε/RT, y se encuentra que la fracción de colisiones donde la energía cinética relativa de las moléculas a lo largo de la línea que une sus centros excede el valor εa es igual a e-εa/kBT= e-Ea/RT, siendo Ea=NAεa la energía cinética molecular molar. El aumento rápido de la constante cinética con la temperatura se debe, por tanto, principalmente al aumento en el número de colisiones cuya energía excede la energía de activación (véase Figura 7.7).
(a) (b)
Figura 7.7. Variación de la fracción de colisiones con energía superior a la energía de activación frente a (a) la temperatura y (b) la energía de activación.
La definición general de energía de activación Ea para cualquier proceso cinético, tanto si es función o no de la temperatura, es:
= = Y (7.74)
Si Ea es independiente de T, la integración de (7.74) da (7.71), en donde A es también independiente de T. Tanto si Ea depende o no de T el factor pre-exponencial A para cualquier proceso cinético se define análogamente a (7.71) como: = 6Ke ⁄ (7.75) Las energías de activación empíricas caen en el intervalo de 0 a 80 kcal/mol (330 kJ/mol) para la mayoría de las reacciones químicas elementales y tienden a ser más bajas para reacciones bimoleculares que unimoleculares. Las descomposiciones unimoleculares de compuestos con enlaces covalentes fuertes tienen valores de Ea altos; por ejemplo, para la descomposición gaseosa del CO2 → CO + O, Ea vale 100 kcal/mol. Un límite superior sobre los valores de Ea viene establecido por el hecho de que reacciones con energías de activación muy grandes son demasiado lentas para ser observadas. En reacciones unimoleculares, A suele valer de 1012 a 1015 s-1. En las bimoleculares suele ser normalmente del orden de 108 a 1013 dm3 mol-1 s-1. La recombinación de dos radicales para formar una molécula poliatómica estable no requiere la ruptura de enlaces y la mayoría de dichas reacciones en fase gaseosa tienen una energía de activación nula. Algunos ejemplos son 2CH3 → C2H6 y CH3 + Cl → CH3Cl. Cuando la energía de activación es nula, la constante cinética es esencialmente independiente de T. Las velocidades de muchos procesos fisiológicos varían con T de acuerdo a la ecuación de Arrhenius. Entre otros ejemplos, pueden citarse la velocidad del chirrido de los grillos (Ea = 12 kcal/mol), la velocidad de los destellos de luz de la luciérnaga (Ea = 12 kcal/mol) y la frecuencia de las ondas alfa del cerebro humano (Ea = 7 kcal/mol). Si una reacción tiene lugar mediante dos mecanismos competitivos la constante de velocidad global no tiene por qué obedecer la ecuación de Arrhenius. Supongamos, por ejemplo, que la reacción A → C presenta el mecanismo siguiente:
A Yj→ CyA Y]→ D Y→ C (7.76) en donde el primer paso del segundo mecanismo (A → D) es la etapa limitante del mismo. Entonces
= − ()* = 6(A* + 6=(A* = 6 + 6=(A* (7.77)
y la constante cinética global es 6 = 6 + 6= = Ke,j ⁄ + =Ke,] ⁄ (7.78) que no es del tipo Arrhenius (7.71) a menos que Ea,1 y Ea,2 sean iguales (un mecanismo competitivo para una reacción en fase gaseosa puede ser una reacción heterogénea catalizada por las paredes del recinto). A temperaturas bajas, el mecanismo con menor energía de activación predominará; a temperaturas intermedias ambos mecanismos contribuirán; a temperaturas altas el mecanismo con mayor energía de activación predominará (suponiendo que tiene un factor pre-exponencial sustancialmente alto). Las energías de activación de cada mecanismo pueden obtenerse a partir de las pendientes a altas y bajas temperaturas.
*Problemas a resolver en TG por los estudiantes.
QUÍMICA FÍSICA III Serie 5 Curso 2017-2018
1. Si la reacción N2 + 3H2 → 2NH3 tiene
= -0,006 mol L-1 s-1. ¿Cuánto valdrá en ese mismo
instante
? ¿y
?
2. La constante cinética de la reacción en fase gaseosa 2NO2 + F2 → 2NO2F vale 38 L mol-1 s-1 a 27 0C. La reacción es de primer orden en NO2 y F2. a) Calcúlese el número de moles de NO2, F2 y NO2F presentes después de 10,0 s si se mezclan 2,00 moles de NO2 con 3,00 moles de F2 en un recipiente de 400 L a 27 0C. b) Para las condiciones del apartado a) calcúlese la velocidad de reacción inicial y la velocidad después de 10,0 s. 3. La reacción A + B → C transcurre de acuerdo con una cinetica 1+1. En el curso de un experimento realizado con unas concentraciones iniciales de [A]0=31,4 x 10-3 M, [B]0=21,0 x 10-3 M y [C]0=0, se han medido las siguientes concentraciones de producto en función del tiempo:
103[C]/M 4,45 7,55 11,57 14,04 15,69 16,85 18,62 19,56 20,43 t/min 1 2 4 6 8 10 15 20 30
Determínese la constante de velocidad de la reacción. 4. La constante de velocidad de la reacción en fase gaseosa 2N2O5 → 4NO2 + O2 vale 1,73 x 10-5 s-1 a 25 0C. Su ecuación cinética es r=k[N2O5]. Calcúlese: a) el tiempo de semirreacción para la descomposición del N2O5 a 25 0C, b) la concentración del reactivo una vez transcurridas 24,0 horas si el sistema reactivo se prepara con 0,010 mol/L a 25 0C. 5. La velocidad de reacción de la descomposición de ozono a oxígeno molecular 2O3 → 3O2 es r=k[O3]2/[O2]. El mecanismo propuesto para este proceso es:
O O + O
O + O →2O
Dedúzcase la ecuación de velocidad correspondiente a este mecanismo. ¿En qué condiciones la ecuación cinética experimental y la deducida a partir del mecanismo coinciden? Explíquese por qué disminuye la velocidad de la reacción cuando aumenta la concentración de O2. 6. La ecuación cinética observada para la reacción catalizada por Br- es:
H+ + HNO2 + C6H5NH2
C6H5N2+ + 2H2O r=k[H+][HNO2][Br-] y un mecanismo propuesto es:
1) H + HNO H NO
equilibrio rápido
2) H NO + Br!
→ ONBr + H O lenta
3) ONBr + C#H$NH
→H O + Br! + C#H$N
rápida Dedúzcase la ecuación cinética para este mecanismo y relaciónese la constante cinética observada con las constantes cinéticas del mecanismo propuesto. 7. Calcúlese la energía de activación de la reacción global para una reacción que tiene el siguiente mecanismo:
1) A + B C + D equilibrio rápido Ea,1=120 kJ/mol y Ea,-1=96 kJ/mol 2) 2C → G + H lenta Ea,2=196 kJ/mol
8. Los valores de k para la reacción 2 HI → H2 + I2, son 1,2 x 10-3 y 3,0 x 10-5 M-1 s-1 a 700 y 629 K, respectivamente. Calcúlense Ea y A. 9. Calcúlese, a través de la teoría de colisiones, la constante de velocidad para la reacción H2 + I2 → 2HI a 700 K; utilizando un diámetro de colisión de 4,5 Å y una energía de activación de 40 kcal mol-1. Estímese el factor estérico sabiendo que el valor experimental de la constante de velocidad es 6,42 x 10-2 L mol-1 s-1.
*Problemas a resolver en TG por los estudiantes.
10. Para la reacción entre el isocianato de m-tolueno y el alcohol n-butílico se han obtenido las siguientes constantes de velocidad de segundo orden:
T(0C) 0,0 7,0 15,0 25,0 105k (L mol-1 s-1) 4,04 7,72 12,9 25,0
Calcúlese la energía de activación y el factor de frecuencia. Usando la teoría del estado de transición (TET), calcúlese la entropía de activación a 298 K. 11. Calcúlese, por medio de la TET, la constante de velocidad de la reacción de intercambio D + H2 → DH + H a T=450 K y compárese con el valor experimental k=9 x 109 cm3 mol-1 s-1. Datos:
Reactivos Estructura de Transición parámetros H-H D [H-----H----D]≠
d(H-H)/Å 0,741 0,930 d(H-D)/ Å 0,930 &/cm-1 4400 1764 (1), 870 (2)
M/g mol-1 2,0156 2,0014 4,0297 I/g cm2 4,5945 x 10-41 3,9788 x 10-40
La diferencia de energía entre los estados electrónicos fundamentales de los reactivos y el estado de transición, ∆ε0≠, es 8,33 kcal/mol, es decir, 5,79 x 10-20 J. 12. La reacción de substitución nucleofílica en fase gas entre el fluoruro de metilo y el anión cloruro transcurre desde un complejo ion-dipolo (un solo reactivo) hasta productos a través de un estado de transición, tal y como se expresa a continuación:
F-CH3--------Cl- → [(F---CH3---Cl)-]≠ Mediante cálculos teóricos se han determinado las siguientes propiedades del complejo reactivo y del estado de transición a 298 K:
complejo reactivo estado de transición M (uma) 69,5 69,5
qrot 1,393 x 104 1,082 x 104 qvib 23,51 3,703
energía potencial (kcal/mol) 0,0 27,01 energía del punto cero (kcal/mol) 24,93 23,66
entalpía (kcal/mol) 0,0 25,32 a) Calcúlese, mediante la teoría del estado de transición, la constante de velocidad a 298 K, en unidades del sistema internacional. Supóngase que no existen estados electrónicos de baja energía ni en el complejo reactivo ni en el estado de transición. b) Calcúlese la entalpía, entropía y energía libre de activación, así como el factor pre-exponencial y la energía de activación a 298 K.
13.* Algunos datos de la dimerización 2A →A2 de un cierto óxido de nitrilo (compuesto A) en una disolución de etanol a 40 0C son:
[A]/M 68,0 50,2 40,3 33,1 28,4 22,3 18,7 14,5 t/min 0 40 80 120 160 240 300 420
Calcúlese el orden de reacción y la constante cinética usando el método del tiempo de semireacción. 14.* Para la reacción A + B → C + D, en un experimento con [A]0 =400 mmol L-1 y [B]0=0,400 mmol L-1 se obtuvieron los resultados siguientes:
104[C]/M 0 2,00 3,00 3,50 4,00 t/s 0 120 240 360 ∞
y en un experimento con [A]0 =0,400 mmol L-1 y [B]0 =1000 mmol L-1 dio: 104[C]/M 0 2,00 3,00 3,50 4,00 10-3t/s 0 69 208 485360 ∞
Determínese la ecuación cinética y la constante cinética.
*Problemas a resolver en TG por los estudiantes.
15.* El cerio (IV) oxida al talio (I) en disolución según la reacción Tl+ + 2Ce4+ → Tl3+ + 2Ce3+. Las etapas elementales correspondientes a un mecanismo propuesto son:
1) Ce4+ + Mn2+ → Ce3+ + Mn3+ 2) Ce4+ + Mn3+ → Ce3+ + Mn4+ 3) Tl+ + Mn4+ → Tl3+ + Mn2+
a) Identifíquese el catalizador, los intermedios y la etapa limitante si la ecuación de velocidad experimental es r=k[Ce4+][Mn2+]. Exprésese la constante de velocidad experimental en función de las constantes de velocidad de las etapas elementales del mecanismo de reacción propuesto. b) Dedúzcase la ecuación cinética correspondiente a ese mecanismo si no se conociera la etapa limitante. 16.* Los datos siguientes corresponden a la reacción 2H2(g) + 2NO(g) → 2H2O(g) + N2(g):
experimento [H2]/M [NO]/M r0/M s-1 1 0,010 0,025 2,4 x 10-6 2 0,0050 0,025 1,2 x 10-6 3 0,010 0,0125 0,60 x 10-6
a) Determínese la ecuación de velocidad de la reacción. b) Calcúlese la constante de velocidad de la reacción c) Propóngase un mecanismo de reacción que concuerde con la ecuación cinética (supóngase que el átomo de O es un intermedio). d) Estudios más minuciosos de la reacción mostraron que la ecuación cinética era:
( =)*NO H
1 + ) H
¿Qué sucede con la ecuación cinética a concentraciones de hidrógeno muy altas o muy bajas? 17.* A partir de los valores de la constante de velocidad para la descomposición térmica monomolecular en fase gas del hexodiciclopentadieno, calcúlense los parámetros de Arrhenius así como la entalpía y entropía de activación a 543,6 K.
T (K) 473,7 494,8 516,2 536,5 600,3 628,1 104r (s-1) 0,947 4,50 27,2 116,0 5640 17430
18.* Calcúlese la energía libre de Gibbs, la entalpía y la entropía de activación para la reacción de hidrogenación del eteno a 628 K sabiendo que A=1,24 x 106 M-1 s-1 y Ea=180 kJmol-1.
Lección 8: ASPECTOS TEÓRICOS EN CINÉTICA QUÍMICA
Teoría de colisiones. Teoría del estado de transición. Formulación termodinámica
de la teoría del estado de transición. Reacciones químicas en disolución.
En esta lección se aporta una descripción teórica de las constantes de velocidad de
reacción en fase gaseosa. Algunos de estos resultados se extenderán al caso de
reacciones en disolución.
Teoría de colisiones
La Teoría de Colisiones fue desarrollada hacia 1920 y parte de las siguientes
suposiciones para encontrar una expresión de la constante de velocidad para una
reacción elemental bimolecular en fase gaseosa (B + C → Productos):
a) Las moléculas se tratan como esferas rígidas, caracterizadas por un diámetro d.
b) Para que se produzca una reacción entre las moléculas B y C debe producirse
una colisión entre ambas moléculas.
c) No todos los choques dan lugar a la reacción; la reacción sólo se produce si, y
sólo si, la energía cinética traslacional relativa a lo largo de la línea que une los
centros de las moléculas que colisionan supera una cierta energía umbral ε0.
d) Durante la reacción se mantiene en todo momento la distribución de equilibrio
de Maxwell-Boltzmann para las velocidades moleculares.
Según la Teoría Cinética de Gases, el número de colisiones entre moléculas de B y C
por unidad de tiempo y volumen es:
= =
⟨⟩ =
/ (8.1)
donde NB y NC son el número de moléculas de B y C, respectivamente, V es el
volumen, σ es el área o sección de colisión, k es la constante de Boltzmann, T es la
temperatura y µ es la masa reducida.
Si cada colisión produjera una transformación de B y C en productos (es decir, si
todas las colisiones fueran eficaces), entonces el número de moléculas de tipo C
que desaparecerían por unidad de tiempo y volumen sería igual a ZBC,
−
= = ⟨⟩
(8.2)
que expresada en moles (ni) resulta:
−
= ⟨⟩
(8.3)
donde NA es el número de Avogadro. En consecuencia, la velocidad de reacción a
volumen constante valdría:
− ! = ⟨⟩ "! #! (8.4)
de modo que:
$% = ⟨⟩ = / (8.5)
La ecuación (8.4) logra explicar la dependencia observada experimentalmente de
la velocidad de reacción con el producto de las concentraciones de B y C. Sin
embargo, la ecuación (8.5) muestra una dependencia errónea de la constante de
velocidad con la temperatura y, además, conduce a sobreestimaciones
significativas de las velocidades de reacción. Por ejemplo, para la reacción entre H2
e I2 para dar ioduro de hidrógeno, la densidad de frecuencia de colisiones en una
mezcla equimolecular en condiciones estándar es aproximadamente igual a 1035 m-
3 s-1, lo que conduce a una velocidad del orden de 108 mol L-1 s-1, es decir, que
reaccionarían 100 millones de moles por litro y segundo.
La experiencia demuestra que no todas las colisiones son reactivas, sino que para
que esto ocurra se deben cumplir otros requisitos. Entre ellos, uno de los más
importantes es el llamado requisito energético que refleja la necesidad de que las
moléculas para reaccionar tengan que sobrepasar una barrera energética. Sólo las
colisiones cuya energía supere el valor umbral ε0 darán origen a la reacción
química. La fracción de colisiones efectivas desde el punto de vista energético
viene determinado por el factor exp(-ε0/kT), de modo que la constante de
velocidad predicha por la teoría de colisiones para una reacción bimolecular es:
$% = &'() / *+,-/ = &'()
/ *+.-// (8.6)
Recordando que Ea=RT2(dlnkr/dT), llegamos a que:
01 = 02 + 45 = 62 +
45 (8.7)
7 = &'() / */ (8.8)
Como (1/2)RT es pequeño, la energía umbral de esferas rígidas es prácticamente
igual a la energía de activación. La teoría de colisiones no proporciona ningún
método para calcular la energía umbral, sino que da únicamente el factor de
Arrhenius. Teniendo en cuenta las simplificaciones de esta teoría, no debe tomarse
muy en serio la dependencia de A con T1/2.
Para la mayoría de las reacciones, los valores calculados de A son mucho mayores
que los observados. Por eso, en la década de 1920 se modificó la teoría de
colisiones de esferas rígidas añadiendo un factor p en el término derecho de la
ecuación (8.6). El factor p se denomina factor estérico y su justificación se basa en
que las moléculas que chocan deben estar orientadas de forma adecuada para que
la colisión de lugar a la reacción. Se supone que p (cuyos valores oscilan entre 0 y
1) representa la fracción de colisiones en las cuales las moléculas tienen la
orientación adecuada. Por ejemplo, la reacción CO + O2 → CO2 + O sólo puede tener
lugar si la molécula de oxígeno colisiona con la de monóxido de carbono por el lado
del átomo de carbono, no si lo hace por el lado del átomo de oxígeno. La teoría de
colisiones no aporta ninguna forma de calcular p teóricamente. Por el contrario, p
se determina a partir de la relación entre el valor experimental de A y el de la
teoría de colisiones. De esta forma, para la reacción anterior, p=0,0043. Con esta
aproximación, p es únicamente un factor sin significado físico que hace que la
teoría coincida con los datos experimentales y, por tanto, la teoría de colisiones no
tiene un valor predictivo. A pesar de esto, esta teoría tiene la ventaja de que
permite dar una interpretación sencilla e intuitiva de lo que constituye la esencia
de la reacción química: es el resultado de una colisión entre moléculas de reactivos
que se produce con la energía y orientación adecuadas.
La teoría de colisiones puede mejorarse considerando en el modelo la estructura
de las moléculas (enlaces, vibraciones,…) y las interacciones intermoleculares. Un
ejemplo claro para ilustrar la importancia de las interacciones intermoleculares es
la reacción K + Br2 → KBr + Br. En este caso, la teoría de colisiones predice un
factor pre-exponencial menor que el experimental, lo que lleva a un factor estérico
mayor que la unidad (p=4,8). La razón de este comportamiento es que algunas
trayectorias que en principio serían no reactivas (factor de impacto mayor que el
diámetro de colisión) pueden dar lugar finalmente a colisión por la aparición de
fuertes interacciones atractivas. Efectivamente, un electrón del potasio puede
saltar hasta la molécula de bromo, quedando ambas especies cargadas (K+ y Br2-).
Esto da lugar a la aparición de una fuerza electrostática que puede conducir a la
colisión entre las dos moléculas.
Teoría del estado de transición
La Teoría del estado de transición (TET) o también llamada Teoría del complejo
activado (TCA) fue desarrollada en 1935 por Eyring, por una parte, y por Evans y
Polanyi, por la otra. El punto de partida de dicha teoría considera el cambio de
energía potencial a medida que los reactivos de una reacción bimolecular se
aproximan. Dicha evolución se representa mediante el denominado perfil
energético de reacción mostrado en la Figura 8.1. Tal y como puede verse, a
medida que las dos especies reactivas se acercan, la energía potencial aumenta
alcanzando un máximo tras el cual vuelve a descender hasta la zona de los
productos. En el máximo de la curva, se define una superficie que separa la región
de los reactivos de la de los productos. Esta superficie se llama superficie divisoria
o superficie crítica (véase Figura 8.2). Cualquier estructura situada a una distancia
arbitrariamente pequeña (δ) de la superficie divisoria se denomina complejo
activado. El conjunto de todos los complejos activados se llama estado de
transición, por analogía con el estado de reactivos o de productos. De todo el
conjunto de estructuras de la superficie crítica la de menor energía es la de la
estructura de transición o punto de silla de primer orden.
La versión canónica de la TET, que es la que trataremos aquí, se aplica en el caso de
que los reactivos de la reacción que se van a estudiar estén en equilibrio térmico.
Figura 8.1. Variación de la energía potencial con la coordenada de reacción
(distancia Ha-Hb) para la reacción Ha + HbHc → HaHb + Hc.
(a) (b)
Figura 8.2. Representación esquemática de la superficie divisoria o crítica, que
divide la superficie de energía potencial en una zona de reactivos y otra de
productos.
Se puede obtener una expresión de la constante de velocidad partiendo de las
siguientes suposiciones:
a) Todos los reactivos que cruzan la superficie crítica hacia los productos no
pueden volver hacia atrás.
b) Los reactivos mantienen una distribución de equilibrio de Boltzmann
correspondiente a la temperatura del sistema, durante toda la reacción. Las
moléculas de reactivos que superan una determinada energía son las que pueden
convertirse en productos, y por tanto sus niveles energéticos se despoblarían. No
obstante, se supondrá que la frecuencia de colisión con las paredes y con otras
moléculas es lo suficientemente alta como para recuperar rápidamente la
distribución de equilibrio en todos los grados de libertad moleculares.
c) Las moléculas que alcanzan la superficie crítica mantienen también una
distribución de Boltzmann correspondiente a la misma temperatura que los
reactivos. Un complejo activado tiene vida media muy corto (del orden de los
femtosegundos), es decir, no tiene tiempo suficiente para experimentar colisiones,
rotaciones, etc. y así redistribuir su energía y alcanzar el equilibrio térmico. Sin
embargo, el conjunto de todos los complejos activados que aparecen durante la
reacción sí que responde a una distribución de equilibrio. Esto significa que,
considerados en conjunto como la estructura de transición la de menor energía de
todos los complejos activados, habrá una mayor probabilidad de que el complejo
activado presente una geometría más cercana a él que a la de cualquier otro punto.
d) El movimiento de los reactivos a lo largo de la coordenada de reacción cuando
atraviesan la superficie divisoria puede ser separado de los demás grados de
libertad y tratado clásicamente. Existe una limitación en reacciones con átomos
ligeros (p.e. H) que tiene efectos cuánticos importantes.
Aplicando estas suposiciones a la reacción elemental bimolecular B + C →
Productos, se puede expresar esta ecuación como:
B + C Xǂ → Productos (8.9)
donde Xǂ representa el complejo activado y la doble flecha no indica un equilibrio
en sentido químico (el complejo activado no es una especie aislable y mensurable,
excepto en períodos de femtosegundos), sino que, de acuerdo con las hipótesis b) y
c), indica que estas especies se mantendrán con la distribución que corresponda al
equilibrio térmico entre ellas.
Según lo comentado hasta aquí, una molécula de producto se forma, o una de
reactivo desaparece, cuando un complejo activado cruza la superficie divisoria
hacia la región de los productos. Por tanto, la velocidad de reacción, en términos de
moléculas por unidad de tiempo, puede expresarse como el número de moléculas
de complejo activado (Nǂ) que atraviesan la superficie divisoria por unidad de
tiempo:
− = 9:;<=>?;@
= ‡B (8.10)
siendo τ el tiempo de vida medio que un complejo activado tarda en atravesar la
superficie divisoria. Este tiempo puede calcularse sabiendo la velocidad con la que
se mueve el complejo activado a lo largo de la coordenada de reacción (c.r.) y el
espesor (δ) de la superficie divisoria.
C = D⟨E>:⟩ (8.11)
Sustituyendo la ecuación (8.11) en (8.10) se llega a que:
− = 9:;<=>?;@
= ‡⟨E>:⟩D (8.12)
y, por tanto,
− ! = F%GHIGJ!
=
‡⟨E>:⟩D = K‡! ⟨E>:⟩
D (8.13)
donde K‡! es la concentración de complejo activado.
Teniendo en cuenta la hipótesis de equilibrio térmico entre reactivos y complejo
activado y recordando la expresión de la constante de equilibrio obtenida en la
lección de Termodinámica Estadística, llegamos a que:
‡
= L‡LL *+MN-‡OP (8.14)
donde qB, qC y Q‡ representan las funciones de partición de los reactivos B y C, y del
estado de transición. Δ62‡ es la diferencia de energía, a cero grados Kelvin, entre
reactivos y estado de transición, es decir, 62SXǂV − S62&B) + 62&C)V. Esta cantidad
ha de estimarse a partir de la energía del punto cero asociada a los niveles
vibracionales fundamentales de reactivos y estado de transición. La ecuación
(8.14) puede expresarse también en términos de concentraciones, dividiendo por
el número de Avogadro y el volumen:
YZ‡[
! ! = \ ]‡^_`
\ ]^_`\ ]^_` *+MN-‡OP (8.15)
El cálculo de las funciones de partición de las especies reactivas B y C se hace
teniendo en cuenta las distintas contribuciones a la energía: traslacional,
rotacional, vibracional y electrónica. Para el estado de transición se aplicará el
mismo tratamiento, aunque debe tenerse en cuenta que uno de los grados de
libertad corresponde a la coordenada de reacción. En efecto, una de las vibraciones
de la estructura de transición, el vector de transición, corresponde a la coordenada
que transforma reactivos en productos. Por ejemplo, para la reacción H + H2, el
vector de transición es la tensión antisimétrica Hbbc − −Hdbb − −Hbbc. Como los grados de
libertad los consideramos independientes, para calcular la función de partición del
estado de transición vamos a separar esta contribución (qcr), de modo que:
Q‡ = Q%1J‡ Q%G‡ QEef‡ QghgI‡ = QI%‡ YQ%1J‡ Q%G‡ QiEef‡ QghgI‡ [ = QI%‡ Qi‡ (8.16)
donde Qi‡ indica la función de partición para todos los grados de libertad excepto
para el movimiento (de vibración) a lo largo de la coordenada de reacción. El
cálculo de q‡ no implica ningún problema adicional a las funciones de partición de
los reactivos. Sin embargo, el cálculo de QI%‡ supone una novedad respecto a lo visto
hasta ahora. Efectivamente este grado de libertad corresponde a una vibración
pero con el pozo invertido. La estructura de transición es un máximo en esta
coordenada y, formalmente, este caso correspondería a un movimiento vibracional
con la constante de fuerza (kF) negativa, ya que la energía disminuye cuando nos
desplazamos del punto de silla. La frecuencia que podríamos calcular a partir de
esta constante de fuerza sería por tanto imaginaria:
j = k l
m>:‡ (8.17)
donde nI%‡ es la masa reducida asociada al movimiento a lo largo de la coordenada
de reacción. Así pues, no podemos emplear las fórmulas habituales basadas en el
oscilador armónico para el cálculo de la función de partición vibracional. Para
tratar este movimiento, puesto que en el punto de silla las derivadas de la energía
respecto a cualquier coordenada son cero, podremos suponer que en el entorno
inmediato la energía apenas cambia. Trataremos por lo tanto el movimiento del
complejo activado a lo largo de la coordenada de reacción como un movimiento de
traslación de una partícula en una caja unidimensional cuyo tamaño viene dado
por el espesor de la superficie divisoria δ. Por tanto, asumiendo el límite clásico
(separación entre niveles << kT), la expresión para la función de partición
traslacional asociada al movimiento a lo largo de la coordenada de reacción puede
escribirse como:
QI%‡ = \m>:‡ op `/ q (8.18)
En consecuencia, la ecuación (8.15), despejando K‡!, quedaría como sigue
K‡! = \m>:‡ op `/ q \ ]r‡
^_`\ ]^_`\ ]^_` *+MN-‡OP "! #! (8.19)
Para el cálculo de la velocidad media a lo largo de la coordenada de reacción
podemos usar la distribución de Maxwell-Boltzmann para una componente de la
velocidad (supuestos c) y d) de la TET):
s&I%) = \ m>:‡`
⁄ *+m>:‡ E>:p ⁄ (8.20)
Puesto que estamos calculando el proceso directo de conversión de reactivos en
productos, para calcular el valor medio de esta componente de la velocidad sólo
tomaremos los valores positivos (o negativos). Los valores negativos (o positivos)
corresponderían al proceso inverso:
⟨I%⟩ = u I%v2 s&I%)(I% = u I% \ m>:‡
` ⁄ *+m>:‡ E>:p ⁄ v
2 (I% = \ m>:‡
` ⁄ (8.21)
Sustituyendo las ecuaciones (8.19) y (8.21) en la ecuación (8.13), se obtiene la
expresión que proporciona la TET para la ley de velocidad:
− ! = K‡! ⟨E>:⟩
D =
= D \
m>:‡` ⁄ \m>:‡
op `/ q \ ]r‡^_`
\ ]^_`\ ]^_` *+MN-‡OP "! #! (8.22)
Simplificando el resultado obtenido nos queda:
− ! =
o \ ]r‡^_`
\ ]^_`\ ]^_` *+MN-‡OP "! #! (8.23)
Esta expresión refleja correctamente la dependencia de la velocidad con el
producto de las concentraciones. Comparando con la ley de velocidad
experimental para la reacción elemental bimolecular entre B y C, la constante de
velocidad en la TET es igual a:
$% = o \ ]r‡
^_`\ ]^_`\ ]^_` *+MN-‡OP (8.24)
Según la ecuación (8.24), para determinar la constante de velocidad necesitamos
conocer las funciones de partición de reactivos y del estado de transición, así como
la diferencia de energía entre los estados fundamentales. La información de los
reactivos puede obtenerse experimentalmente. De momento, para el estado de
transición la información necesaria para obtener su energía y función de partición
(masa, geometría, frecuencias, estados electrónicos,…) debe de obtenerse
mediante cálculos de mecánica cuántica. El conocimiento de la energía potencial, al
menos alrededor de reactivos y estructura de transición nos proporciona los datos
necesarios. Sin embargo, el reciente desarrollo de la espectroscopía de
femtosegundos está empezando a cambiar este hecho, al permitir la observación
del estado de transición.
Formulación termodinámica de la teoría del estado de transición
Para interpretar la expresión de la constante de velocidad que proporciona la TET,
ecuación (8.24), se puede acudir a la llamada formulación termodinámica de la
TET. En la ecuación (8.24), se puede apreciar que, aparte del factor kT/h, el resto
se parece mucho a la constante de equilibrio entre el complejo activado y los
reactivos. En efecto, la ecuación (8.15) es una relación entre las concentraciones de
estado de transición y reactivos. Si dividimos todas las concentraciones de esa
ecuación por la concentración estándar 1M (C0) resulta la constante de equilibrio
en la escala de concentraciones:
wI = xyz‡- |
!- !
- = #2 YZ‡[ ! ! = #2 \ ]‡
^_`\ ]^_`\ ]^_` *+MN-‡OP (8.25)
La expresión de la constante de velocidad (8.24) es igual a la (8.25) excepto por el
hecho de que la función de partición del estado de transición no contiene la
contribución de la coordenada de reacción. A la constante de equilibrio calculada
sin este término se la denominará wI‡ con lo que la expresión de la constante de
velocidad según la TET se escribe como:
$% = o
>‡- (8.26)
Por tanto, la constante de velocidad puede verse como un término de equilibrio
entre los reactivos y el estado de transición, en donde se descuenta la contribución
de la coordenada de reacción en el estado de transición, y otro término (kT/h) que
proviene de la contribución de la coordenada de reacción. Este término da la
frecuencia del movimiento de los complejos activados a lo largo de la coordenada
de reacción y como tal se expresa en s-1.
Recordando la relación entre constantes de equilibrio y energía libre de Gibbs,
podemos escribir en nuestro caso que:
∆I2‡ = ∆I2‡ − 5∆I2‡ = −45wI‡ (8.27)
siendo ∆I2‡ la energía libre de activación estándar en la escala de concentraciones
y, ∆I2‡ y ∆I2‡
la entalpía y la entropía de activación estándar, respectivamente. L
energía libre se calcula como diferencia entre las energías libres del estado de
transición y reactivos, utilizando las expresiones vistas en la lección 4 sobre
Termodinámica Estadística. Para esto, hay que tener en cuenta, que no se debe
contar el grado de libertad asociado a la coordenada de reacción. Es decir, si el
sistema químico contiene un total de N átomos, en lugar de 3 traslaciones, 3
rotaciones (2 si fuera lineal) y 3N-6 vibraciones (3N-5 si fuera lineal), para el
cálculo de la energía libre del estado de transición se contarían 3 traslaciones, 3
rotaciones (2 si fuera lineal) y 3N-7 vibraciones (3N-6 si fuera lineal). La vibración
que se deja fuera es la correspondiente al vector de transición, la que presenta una
constante de fuerza negativa. Utilizando las ecuaciones (8.26) y (8.27), la constante
de velocidad queda:
$% = o
- *+∆>-‡
P = o
- *+∆>-‡
P * ∆>-‡ (8.28)
Las ecuaciones (8.25)-(8.28) están basadas en la selección del estado estándar 1M.
Para gases, sin embargo, muchas veces se prefiere el estado estándar P0 = 1 bar.
Asumiendo un comportamiento ideal para los gases,
wI = xyz‡- |
!- !
- = #2 x9z‡P |
9P9P = -/F-
x9z‡9- |
99-99- (8.29)
resultando
>- = /
F- w (8.30)
de modo que
$% = o
/F- w =
o/F- *+∆-‡
P = o
/F- *+∆-‡
P *∆-‡ (8.31)
Hay que tener en cuenta que si hubiera n reactivos en lugar de dos, entonces el
factor RT/P0 o 1/C0 de las expresiones anteriores aparecería elevado a n-1 en lugar
de a 1.
A partir de la expresión (8.31) y procediendo de forma análoga a como hicimos en
el caso de la teoría de colisiones, se obtiene que los parámetros de Arrhenius para
una reacción elemental bimolecular son:
01 = 245 + ∆2‡ (8.32)
7 = o
/F- ** ∆-‡
(8.33)
Estas expresiones de la TET permiten dar interpretaciones más acertadas tanto de
la energía de activación como del factor de Arrhenius.
Reacciones químicas en disolución
Debido a las fuertes interacciones intermoleculares en el estado líquido, la teoría
de las reacciones en disolución está mucho menos desarrollada que la de las
reacciones en fase gaseosa. En general, no es posible calcular velocidades de
reacción en disolución a partir de propiedades moleculares, exceptuando las
reacciones controladas por la difusión.
Las reacciones químicas en disolución pueden dividirse en: (a) reacciones
controladas químicamente, donde la velocidad de reacción química entre las
moléculas B y C en un disolvente es mucho menor que la velocidad de difusión de B
y C a través del disolvente; (b) reacciones controladas por difusión, en las que la
velocidad de difusión es mucho menor que la velocidad de reacción química; (c)
reacciones de control mixto, donde la velocidad de difusión y de reacción química
tienen el mismo orden de magnitud. Veamos, a continuación, las expresiones que
aporta la TET a estas situaciones de reacciones químicas en disolución.
- Reacciones controladas químicamente:
Siguiendo el mismo planteamiento que en el caso de reacciones en fase gaseosa,
B + C Xǂ → Productos (8.34)
La velocidad de reacción a la cual los complejos activados cruzan la superficie
divisoria viene dada por:
= K‡! ⟨E>:⟩D (8.35)
Para determinar K‡!, modificamos la ecuación (8.15) para permitir la no
idealidad. Para lograr esto, utilizamos actividades en vez de concentraciones, de
modo que:
w1 = 1‡11 = ‡
xyz‡
- | !- !
- (8.36)
Todas las actividades (a) y coeficientes de actividad () están referidos a la escala
de concentraciones; por lo que, se sobreentiende un subíndice c en las a y .
Despejando K‡! en la ecuación (8.36) y sustituyendo el resultado obtenido en la
ecuación (8.35) se llega a que:
= ‡ \
m>:‡` ⁄
D- "! #! (8.37)
en donde se ha sustituido, la velocidad media del complejo activado cuando
atraviesa la superficie divisoria por el resultado (8.21). Por analogía con el caso del
sistema ideal:
w1‡ = w1 \m>:‡ op `+/
D (8.38)
de modo que la constante de velocidad viene expresada ahora por:
$% = o
‡
‡- (8.39)
que sólo difiere de la encontrada para el caso de la reacción en fase gaseosa por la
presencia de los coeficientes de actividad.
Las fuertes interacciones moleculares en la disolución no permiten expresar las
constantes de actividad en términos de funciones de partición individuales sobre
los reactivos y el estado de transición. Las constantes de equilibrio w1‡ y Ka son
funciones de la temperatura, presión y disolvente, pero son independientes de la
concentración del soluto. A dilución infinita, todos los coeficientes de actividad de
la ecuación (8.39) se convierten en 1 y la ecuación (8.39) se transforma en:
$%v = o
‡- (8.40)
donde $%ves la constante de velocidad en el límite de dilución infinita. Para una
temperatura, presión y disolvente fijos, la ecuación (8.39) de la TET puede
escribirse como:
$% = ‡ $%v (8.41)
Esta ecuación recibe el nombre de ecuación de Brønsted-Bjerrum y predice que la
constante de velocidad variará con las concentraciones de los reactivos, puesto que
los coeficientes de actividad cambian con el cambio en la composición de la
disolución. La pequeña exactitud de la mayor parte de los datos cinéticos hace que
este efecto no tenga una importancia significativa, excepto para reacciones iónicas.
Las disoluciones iónicas son altamente no ideales, aun a bajas concentraciones.
Consideremos la reacción iónica elemental bimolecular siguiente:
" + # → K‡&) → ( (8.42)
El logaritmo decimal de la ecuación (8.41) da:
log $% = log $%v + log + log − log ‡ (8.43)
Para fuerzas iónicas hasta 0,1 mol/dm3, en el caso de disoluciones acuosas a 25 0C
y 1 atm:
log = −0,51 /p /p − 0,30¢ (8.44)
con I=Ic/c0 e ¢I = ∑ eee (Ic es la fuerza iónica en la escala de concentraciones).
Procediendo de forma análoga para las demás especies de la reacción (8.42),
llegamos a que
log $% = log $%v + 1,02 /p /p − 0,30¢ (8.45)
Para muchas reacciones iónicas en disolución con fuerzas iónicas de hasta 0,1
mol/dm3 se ha encontrado un buen ajuste con la ecuación (8.45).
Por analogía con la ecuación (8.27), definimos ∆12‡, para una reacción en
disolución, por:
∆12‡ = ∆12‡ − 5∆12‡ = −45w1‡ (8.46)
La ecuación (8.39) se convierte en:
$% = o
‡
- *+∆-‡
P = o
- *+∆-‡
P *∆-‡ (8.47)
Para reacciones no iónicas en disoluciones diluidas, los coeficientes de actividad
tienen valores cercanos a 1 y (dada la inexactitud de la mayoría de los datos
cinéticos) pueden despreciarse:
$% ≈ o
- *+∆-‡
P = o *+∆-‡
P * ∆-‡ (8.48)
Esta ecuación resulta útil para racionalizar los cambios observados en las
constantes de velocidad, para una serie de reacciones en función de la variación de
las entropías y entalpías de activación en su estado normal. La solvatación de los
reactivos y del complejo activado debe tenerse en cuenta al estudiar las
variaciones de entropía y de entalpía de activación.
Mediante la definición de los parámetros de Arrhenius (Ea y A), dada en la lección
anterior, en términos de la variación del logaritmo neperiano de la constante de
velocidad con la temperatura, puede observarse que en el caso de reacciones no
iónicas en disoluciones diluidas:
01 ≈ 45 + ∆12‡ (8.49)
7 ≈ o
g- * ∆-‡
(8.50)
Las ecuaciones (8.49) y (8.50) permiten el cálculo de la variación de entalpía de
activación estándar y de la variación de entropía de activación estándar a partir de
los valores experimentales de Ea y A, respectivamente.
- Reacciones controladas químicamente y de control mixto:
La ecuación (8.39) de la TET no es aplicable para las reacciones controladas por
difusión o de control mixto, puesto que su velocidad está gobernada, al menos en
parte, por la velocidad a la que los reactivos pueden difundirse a través del
disolvente para encontrarse entre sí. Considerando, de nuevo, la reacción
elemental bimolecular B + C → Productos, al principio de las reacciones muy
rápidas, las especies B y C están distribuidas al azar en disolución. Poco tiempo
después la reacción comienza, muchos pares de moléculas de B y C que
inicialmente estaban próximas unas a otras se encontrarán y reaccionarán. Las
moléculas de B que queden serán probablemente la mayor parte de las moléculas
de B para las que no hubo moléculas de C en la vecindad inmediata. Si la difusión
no es suficientemente rápida para restablecer una distribución al azar, la región
alrededor de una molécula B dada estará algo vacía de moléculas C (y viceversa).
Sea R la distancia desde una molécula B dada. Cuando R aumenta, la concentración
media de C aumenta, alcanzando su valor en la disolución para un valore grande de
R, que llamaremos infinito. Hay un gradiente de concentración de C en la región
alrededor de una molécula B dada. Suponiendo que muy poco después de que la
reacción comienza se alcanza un estado estacionario, en el cual la velocidad de
difusión de C hacia B es igual a la velocidad de reacción de C con B.
La primera ley de Fick de la difusión (véase Lección 6) da la velocidad de difusión
de las moléculas B a través del disolvente (S). Para encontrar la velocidad a la cual
las moléculas B y C se difunden una hacia otra debemos usar un coeficiente de
difusión, que es la suma de los coeficientes de difusión de B y C en el disolvente S.
Suponiendo que la disolución es diluida, entonces pueden usarse los coeficientes
de difusión a dilución infinita. De esta forma,
¥ = &¦v + ¦v)§ !
(8.51)
donde ( , es el número de moles de C que en un tiempo dt atraviesan una
superficie esférica de área §=4πR2, rodeando una molécula B dada, y ¦v y ¦v son,
respectivamente, los coeficientes de difusión a dilución infinita de B y C en el
disolvente S. La utilización del símbolo prima evita la confusión de la cantidad
(8.51), que se refiere a la difusión de C hacia una molécula B particular, con la
velocidad de desaparición de C en la disolución. Tenemos d[C]/dR > 0 y
consideraremos (/dt positivo; por tanto, en (8.51) se usa el signo positivo.
Supongamos que B y C son moléculas esféricas con radios rB y rC, respectivamente.
Para una estado estacionario, (/dt es una constante. La integración de la
ecuación (8.51) entre los límites R=rB+rC (moléculas de B y C en contacto) y R=∞
(la disolución) da:
#!/©%% = #! − ¥
Sª«ª«V¬&%%) (8.52)
donde [C]=[C]R=∞ es la concentración de C en la disolución.
Sea r=kr[B][C] la velocidad de reacción por unidad de volumen observada, donde la
constante de velocidad observada kr combina los efectos de la velocidad de
difusión y la velocidad de reacción química. La condición del estado estacionario es
que la velocidad a la cual C se difunde hacia una molécula B dada es igual a la
velocidad de reacción entre C y la molécula B. La multiplicación de r por el
volumen de la disolución V da la velocidad de reacción total en la disolución. La
velocidad de reacción para una molécula particular B es, entonces, rV/NB, donde NB
es el número de moléculas B en la disolución. La condición del estado estacionario
da, entonces, (/dt= rV/NB= r/NA[B]=kr[C]/NA, de modo que la ecuación (8.52) se
convierte en:
#!/©%% = #! \1 − :Sª«ª«V¬&%%)` = #! \1 − :
<®` (8.53)
siendo
$e¯ = &¦v + ¦v)4'& + ) (8.54)
Sea kq la constante de velocidad para la reacción química entre B y C en un
disolvente. La aproximación del estado estacionario permite expresar r como:
r=kq[B] #!/©%% (8.55)
Comparando la ecuación (8.55) con r=kr[B][C], tenemos que kq= kr #!/©%%/[C].
Aplicando la ecuación (8.53) da kr=kq(1- kr/kdif). Despejando kr, tenemos como
resultado final:
: =
<® + ] (8.56)
Para el límite kq→∞, la reacción está controlada por difusión y la ecuación (8.54)
se convierte en kr=kdif. Por lo tanto, kdif en la ecuación (8.54) es la constante de
velocidad para la reacción controlada por difusión. Para el límite kdif→∞ (o, más
precisamente, kdif >> kq), la ecuación (8.56) se convierte en kr=kq. La reacción es
controlada químicamente. La constante de velocidad kq está dada por la ecuación
(8.39). Cuando kdif y kq son del mismo orden de magnitud, las cinéticas están
mezcladas y kr está dada por (8.56).
La existencia de un gradiente de concentración alrededor de cada molécula
reactiva es una desviación de la distribución de Boltzmann, la cual predeciría una
distribución uniforme en ausencia de campos eléctricos y gravitatorios.
Para reacciones iónicas rápidas, la velocidad a la cual B y C se difunden entre sí
está afectada por la atracción o repulsión de Coulomb.