Lección 1: PROBABILIDAD - FisicoQuímica · (1) en cualquier experimento es 1/50. Condición: El...

Lección 1: PROBABILIDAD

Teoría de probabilidad básica

1600: Desarrollo de la teoría de la probabilidad.

Elementos de la teoría de probabilidad: Las variables o cantidades que pueden

cambiar de valor a través del curso de un experimento o serie de eventos. Las

variables pueden clasificarse en discretas y continuas.

Variables discretas: Tienen solamente un número limitado de valores específicos. Ejemplo: El resultado del lanzamiento de una moneda puede tomar sólo uno de dos valores: cara o cruz.

Los valores posibles que una variable puede tomar se llama espacio muestral de la variable, S. En el

ejemplo del lanzamiento de una moneda, el espacio muestral sólo está constituido por dos valores, es

decir, S = cara, cruz.

Variables continuas: Pueden tomar cualquier valor entre unos límites. Ejemplo: La temperatura es un ejemplo variable continua. La escala de temperatura absoluta se extiende

desde 0 K a infinito, con la variable temperatura capaz de tomar cualquier valor comprendido entre estos

dos límites. El espacio muestral se define, en estos casos, mediante los límites de la variable.

El tratamiento de la probabilidad difiere dependiendo de si tratamos con variables

discretas o variables continuas.

¿Cuál es la probabilidad de que la variable tome un cierto valor?

Ejemplo: Una lotería en la que las bolas numeradas de 1 a 50 se mezclan al azar en el

interior de una máquina, y se extrae una única bola. ¿Cuál es la probabilidad de que la

bola extraída tenga el valor uno (1)?

Condición: Las probabilidades de seleccionar cualquier bola son idénticas. ⇒ Resultado: La probabilidad

de extraer (1) es 1/50.

¿Esto significa que obtenemos (1) sólo una vez cada 50 selecciones?

Condición: Cada extracción de bola es un experimento individual. ⇒ Resultado: La probabilidad de extraer

(1) en cualquier experimento es 1/50.

Condición: El resultado de cada experimento es independiente de los otros resultados. ⇒ Resultado: Es

posible que (1) no se seleccione tras 50 ensayos o que (1) se obtenga más de una vez.

Condición: El experimento se lleva a cabo muchas veces. ⇒ Resultado: El resultado final será que el número

de (1) es 1/50-avo del número total de ensayos.

Conclusión: La probabilidad de que la variable tome un valor dado se determina a

partir de un número infinito de experimentos. En la práctica, se hace una

extrapolación de las probabilidades a situaciones que implican un número limitado

de experimentos entendiendo que las probabilidades proporcionan una esperanza

aproximada de un resultado experimental.

Consideremos una variable, X, para la que el espacio muestral consiste en M valores

denotados como x1, x2, … , xM. La probabilidad de que la variable X tome uno de

estos valores (pi) es:

0 ≤ ≤ 1 (1.1)

Como X debe tomar algún valor de la muestra en un experimento dado, entonces:

+ +⋯+ = ∑ = 1 (1.2)

La combinación del espacio muestral, S = x1, x2, … , xM y las correspondientes

probabilidades, P = p1, p2, … , pM, se conoce como modelo de probabilidad del

experimento.

Ejemplo práctico 1.1.

¿Cuál es el modelo de probabilidad para el experimento de la lotería en el que se tienen 50

bolas numeradas desde 1 hasta 50 y se considera la extracción de una bola?

Solución

El valor de la bola que se saca en cada experimento individual es la variable de interés y puede

tomar los valores enteros de 1 a 50. Por tanto, el espacio muestral es

= 1, 2, 3, … , 50.

Si la probabilidad de sacar cualquier bola individual es idéntica, y hay 50 bolas en total,

entonces las probabilidades están dadas por

= , , … , con todos los pi = 1/50

Obsérvese que la suma de todas las probabilidades es igual a 1:

= ∑ = + +…+ =1

¿Cuál es probabilidad asociada a un resultado dado en una serie de experimentos?

Ejemplo: Lanzamiento de una moneda cuatro veces. ¿Cuál es la probabilidad de que se observen al menos

dos caras?

Figura 1.1. Resultados posibles tras lanzar una moneda cuatro veces. El rojo significa cara y el

azul significa cruz.

La probabilidad de obtener al menos dos caras después de lanzar una moneda cuatro veces es 11/16, esto

es, el número de resultados de interés dividido por el número total de resultados.

Sea S = s1, s2, … , sN el espacio muestral asociado a una variable particular, j el número de valores en S

correspondientes al resultado de interés y PE la probabilidad de que el resultado de un evento de interés

sea E. Si las probabilidades de observar cualquier valor individual son idénticas, entonces

= ! + ! +…+ ! = "! (1.3)

Alternativamente, si hay N valores en el espacio muestral y E de estos valores corresponden al evento de

interés, entonces

= ! (1.4)


¿Cuál es la probabilidad de seleccionar un corazón en una baraja estándar de 52 cartas?

Solución

= #$ = 1352 = 14

El principio enumerador fundamental Cuando tratamos con un número relativamente alto de experimentos, escribir todos

los posibles resultados y contarlos es un proceso largo y tedioso. Se muestra a

continuación un método más eficiente para llevar a cabo esto.

Ejemplo: Una clase consta de 30 estudiantes y el profesor necesita reunirlos en una fila.

¿Cuántas disposiciones de los estudiantes son posibles? Si las probabilidades de poner cualquier estudiante son iguales, entonces el número total de

formas de disponer a los estudiantes (W) es

W = (30)(29)(28) … (2)(1) = 30! = 2,65 · 1032

El símbolo de exclamación (!) en esta expresión se refiere como factorial, indicando con n! el

producto desde 1 a n.

El resultado anterior en su forma más general se conoce como principio

enumerador fundamental.

Para una serie de manipulaciones M1, M2 … , Mj teniendo ni formas de completar

cada manipulación n1, n2, … , nj, el principio enumerador fundamental establece que

el número total de formas de llevar a cabo la serie entera de manipulaciones (TotalM)

es el producto del número de formas de llevar a cabo cada manipulación bajo la

suposición de que las formas son independientes:

&'()* = +,-+,-….,"/ (1.5)


¿Cuántas disposiciones de cinco cartas son posibles en una baraja estándar de 52 cartas?

Solución

&'()* = +,-+,-+,0-+,1-+,- = +52-+51-+50-+49-+48- = 311875200


Usando el principio contador fundamental, ¿cuántos posibles estados de espín se esperan para

el primer estado excitado 1s12s1 del He?

Solución &'()* = +,-+,- = +2-+2- = 4

Permutaciones El número de formas diferentes de disponer un número de objetos teniendo en

cuenta el orden se denomina permutación. El número total de objetos que se

disponen es conocido como orden de la permutación. Por tanto, n! da cuenta del

número total de permutaciones de n objetos

¿Cuántas permutaciones son posibles si solamente se emplea una subserie de objetos

al construir la permutación?

Si P(n, j) representa el número de permutaciones posible, usando una subserie de j

objetos del grupo total de n, entonces:

+,, 5- = +,-+, − 1-+, − 2-…+, − 5 + 1- (1.6)

es decir,

+,-+, − 1-…+, − 5 + 1- = +7-+78-…+-+78"-+78"8-…+- = 7!+78"-! (1.7)

Por tanto, P(n, j) viene dado por:

+,, 5- = 7!+78"-! (1.8)


El entrenador del equipo de baloncesto tiene 12 jugadores en la lista, pero sólo pueden jugar 5

jugadores simultáneamente. ¿Cuántos conjuntos ordenados de 5 jugadores son posibles

usando la lista de 12 jugadores?

Solución

+12,5- = 12!+12 − 5-! = 95040

Combinaciones Una combinación o configuración es una disposición desordenada de objetos.

De modo similar a las permutaciones, las combinaciones también se pueden construir usando

todos los objetos del conjunto que se manipulan (n), o solamente un subconjunto de objetos de

tamaño j. Nos referiremos a las configuraciones usando la nomenclatura C(n, j).

Ejemplo: Consideremos las cuatro bolas de colores mostradas en la Figura 1.2. ¿Cuántas

combinaciones de tres pelotas y permutaciones asociadas se pueden hacer utilizando estas

bolas?

Figura 1.2. Ilustración de las configuraciones y permutaciones usando cuatro bolas coloreadas.

Una combinación es una colección de bolas de tres colores y una permutación corresponde a

una disposición ordenada de esas mismas bolas, tales que cada configuración tiene seis

permutaciones asociadas. Por tanto,

:+,, 5- = ;+7,"-"! (1.9)

es decir,

:+,, 5- = ;+7,"-"! = 7!"!+78"-! (1.10)

Ejemplo práctico 1.6. Jugando a las cartas con una baraja estándar de 52 cartas, ¿cuántas posibles combinaciones de

5 cartas o “manos” hay?

Solución

:+,, 5- = :+52,5- = 52!5! +52 − 5-! = 2598960

Probabilidades binomiales Sea PE la probabilidad de que ocurra un evento, E, de entre un número total de

posibles resultados, N, y PEC, complemento de PE, la probabilidad de los resultados

distintos del asociado al evento de interés. Por tanto:

+ = = 1 (1.11)

Este resultado proporciona una definición para experimentos conocidos como

ensayos de Bernoulli. Una colección de ensayos de Bernoulli se conoce como experimento binomial y estos simples experimentos proporcionan un marco adecuado en el que explorar las distribuciones de probabilidad. En estos casos,

el resultado de cada ensayo es independiente del resultado de cualquier otro ensayo.

Ejemplo: Consideremos un experimento binomial en el que una moneda se lanza cuatro veces

y se formula esta pregunta: ¿Cuál es la probabilidad de obtener siempre caras?

La probabilidad de éxito para cada ensayo es ½. Por tanto, la probabilidad total:

= = > (1.12)

En una serie de ensayos de Bernoulli en los que la probabilidad de éxito para un

único ensayo es PE, la probabilidad de obtener j éxitos en una prueba que consta de n

ensayos está dada por

+5- = :+,, 5-+ -"+1 − -78" (1.13)

¿Por qué el número total de configuraciones es el que aparece en la ecuación (1.13)? La respuesta a esta cuestión está ligada a la diferencia entre permutaciones y configuraciones.

De nuevo, consideremos una serie de cuatro lanzamientos de monedas, donde el resultado de

interés es la permutación exacta cara, cruz, cruz, cara. Si cara es un ensayo con éxito que

ocurre con probabilidad PE, entonces la probabilidad de observar esta permutación es

= + -+1 − -+1 − -+ - = + -+1 − - = = > (1.14)

pero ésta es también la probabilidad de observar cara, cara, cara, cara. Es decir, es

equivalente la probabilidad de observar un orden específico de resultados del ensayo, o una

simple permutación. Si el resultado de interés es dos ensayos con éxito, que pueden ocurrir en

cualquier orden, entonces deben sumarse las probabilidades de todas las posibles

permutaciones correspondientes a dos ensayos con éxito, y esto se lleva a cabo con la inclusión

de C(n , j) en la ecuación (1.13).


Imaginemos el lanzamiento de una moneda 50 veces. ¿Cuáles son las probabilidades de

obtener caras 10 veces (es decir, 10 experimentos con éxito) y 25 veces?

Solución

El ensayo de interés consta de 50 experimentos separados; por tanto, n = 50. Primero

consideramos el caso de 25 experimentos con éxito, donde j = 25. La probabilidad (P25) es

= :+,, 5-+ -"+1 − -78"

= :+50,25-+ -+1 − -

= !!! = 0,11

De forma análoga para j = 10, obtenemos que

= :+,, 5-+ -"+1 − -78"

= :+50,10-+ -+1 − -1

= !!1! 1 = 9,1 × 108>

Aproximación de Stirling

En general, los cálculos de P(n , j) y C(n , j) implican evaluar cantidades factoriales

altas. Por ejemplo, 100! es igual a 9,3 × 10157, que es un número extremadamente

grande y más allá del rango de muchas calculadoras. Además, estamos interesados en

extender los conceptos de probabilidad que hemos desarrollado a los sistemas

químicos en los que n ∼ 1023!. El factorial de un número tan grande está simplemente

más allá de la capacidad computacional de la mayoría de calculadoras.

No obstante, hay métodos de aproximación que permiten calcular el factorial de

números grandes. El más famoso de estos métodos se conoce como aproximación de Stirling, que proporciona un método simple para calcular el logaritmo natural de

N!. Una versión simplificada de esta aproximación es

ln$! = $*,$ − $ (1.15)

La ecuación (1.15) se deduce como sigue:

ln $! = *,C+$-+$ − 1-+$ − 2-…+2-+1-D

= *,+$- + *,+$ − 1- + *,+$ − 2- +⋯+ *,+2- + *,+1-

= ∑ ln+,-!7 = E ln+,- F,!7

= $*,$ − $ − +1*,1 − 1- ≈ $*,$ − $ (1.16) La suposición principal inherente a esta aproximación es que N es un número grande. El

principal interés de la aproximación de Stirling es cuando N es lo suficientemente grande para

justificar su aplicación.


Evalúe ln(N!) para N = 10, 50 y 100 usando una calculadora, y compare el resultado con el

obtenido usando la aproximación de Stirling.

Solución N = 10

Calculadora: N! = 3,63 × 106, ln(N!) = 15,1

Aproximación de Stirling: ln$! = $*,$ − $ = 10 ln+10- − 10 = 13,0 Error relativo: 13.9%.

N = 50 y 100:

N ln(N!) calculado ln(N!) Stirling Error (%)

50 148,5 145,6 2,0

100 363,7 360,5 0,9

Funciones de distribución de probabilidad.

Considerando de nuevo el experimento del lanzamiento de la moneda. ¿Cuál es la

probabilidad de obtener un resultado dado (es decir, número de caras) después de

lanzar una moneda 50 veces? A partir de la ecuación (1.13), se puede construir una

tabla de probabilidad en función del número de caras con n = 50 (número total de

lanzamientos) y j = número de caras (es decir, el número de lanzamientos con éxito):

Número de caras Probabilidad Número de caras Probabilidad

0 8,88 x 10-16 30 0,042

1 4,44 x 10-14 35 2,00 x 10-3

2 1,09 x 10-12 40 9,12 x 10-6

5 1,88 x 10-9 45 1,88 x 10-9

10 9,12 x 10-6 48 1,09 x 10-12

15 2,00 x 10-3 49 4,44 x 10-14

20 0,042 50 8,88 x 10-16

25 0,112

En lugar de leer todos los valores de probabilidad de una tabla, se puede representar

gráficamente la probabilidad en función del resultado para obtener el mismo

resultado. Por ejemplo:

Figura 1.3. Representación de la probabilidad del número de caras que se observan tras el

lanzamiento de una moneda 50 veces. La curva roja representa la distribución de

probabilidades para PE = 0,5, la curva azul para PE = 0,3 y la curva amarilla para PE = 0,7.

Conclusiones:

- PE = 0.5 (línea roja de la Figura 1.3): La probabilidad máxima es para 25 caras.

- El valor real de la probabilidad correspondiente a 25 éxitos no es la unidad, sino

0,112. Sin embargo, sumando todos los resultados de las probabilidades

obtenemos que

+ +⋯+ = ∑ "" = 1 (1.17)

- La representación de la Figura 1.3 demuestra que se puede usar la fórmula

de la probabilidad para los ensayos de Bernoulli para describir la variación o distribución de la probabilidad frente al resultado del evento. Por tanto,

la expresión de la probabilidad que hemos empleado se puede entender también como la función de distribución en un experimento binomial.

A partir de la ecuación (1.13), la probabilidad de observar j ensayos con éxito entre

n ensayos en total, está dada por

+5- = 7!"!+78"-! + -"+1 − -78" )H)5 = 0, 1, 2, … , , (1.18)

¿Qué ocurriría si se usara una moneda en la que la probabilidad de obtener la cara

fuera 0,7?

Cuando PE = 0,7 y (1 − PE) = 0,3 (línea amarilla de la Figura 1.3), la comparación de

P(j) con la de PE = 0,5 demuestra que el resultado más probable está desplazado hacia

un número grande de caras, cara = 35 en el caso de PE = 0,7.

El resultado cara = 15 es el más probable cuando PE = 0,3 (línea azul de la Figura 1.3).

Un aspecto final a notar es que además de cambiar la probabilidad de cara = 25

conforme PE cambia de 0,5 a algún otro valor, la probabilidad del resultado más

probable también aumenta. Por ejemplo, para PE = 0,5, la probabilidad máxima es

0,112 para cara = 25. Si PE = 0,7, la probabilidad máxima se sitúa ahora en 0,128 para

cara = 35. Por tanto, no sólo el resultado más probable depende de PE, sino que la

probabilidad de observar el resultado más probable, también cambia con PE.

El experimento de lanzar la moneda proporciona un ejemplo excelente de una

función de distribución de probabilidad y motiva una definición más formal de tales

funciones. Una función de distribución de probabilidad representa la probabilidad

de que una variable (X) tenga un valor dado, con la probabilidad descrita por una

función

+I- ∝ K (1.19)

P(Xi) es la probabilidad de que la variable X tome el valor Xi en el espacio muestral.

Esta ecuación establece que el conjunto de probabilidades P(X1), P(X2),…, P(XM) será

proporcional al valor de la función de distribución evaluada para el valor

correspondiente de la variable f1, f2,…, fM.

En un experimento binomial, la ecuación (1.13) representa la función f de la ecuación

(1.19), que puede expresarse como una igualdad, introduciendo una constante de

proporcionalidad (C)

+I- = :K (1.20)

Imponiendo el requerimiento de que la probabilidad total sea igual a la unidad,

∑ +I- = 1 (1.21)

de modo que la constante de proporcionalidad será

: = ∑ LMNMOP (1.22)

Por tanto:

+I- = LM∑ LMNMOP (1.23)

La Ecuación (1.23) es una expresión general de la probabilidad que será utilizada

cuando definamos la distribución de Boltzmann, uno de los resultados centrales de la

Termodinámica Estadística. Ejemplo práctico 1.9.

¿Cuál es la probabilidad normalizada de sacar una carta dada de una baraja estándar de 52

cartas?

Solución +I- = LM∑ LMQRMOP = ∑ LMQRMOP =

Distribuciones de probabilidad de variables discretas y continuas.

Las distribuciones de probabilidad se pueden construir calculando la probabilidad

correspondiente cuando X toma cada valor del conjunto de la muestra. Sin embargo,

¿qué ocurre si la variable X es continua? En este caso la probabilidad se define con

respecto a la variable que tiene valor en una parte del dominio de X, denotado como

dX. Por tanto, P(X) es la densidad de probabilidad, y P(X)dX es la probabilidad de

que la variable X tenga un valor en el intervalo dX. Por analogía con el desarrollo de

las variables discretas, la probabilidad viene dada por

+I-FI = :K+I-FI (1.24)

Aplicando laa condición de normalización para asegurar que la probabilidad total es

la unidad en el dominio de la variable (X1 ≤ X ≤ X2):

E +I-FISRSP = : E K+I-FI = 1SRSP (1.25)

Por tanto,

: = E L+S-TSURUP

(1.26)

y en consecuencia:

+I-FI = L+S-TSE L+S-TSURUP

(1.27)

El parecido de esta expresión con la expresión correspondiente para las variables discretas,

ecuación (1.23), ilustra un punto importante. Cuando trabajamos con distribuciones de

probabilidad correspondientes a variables continuas, se lleva a cabo una integración en el

dominio de la variable. En contraste, cuando la variable es discreta, se lleva a cabo una suma.

Pese a que la aproximación matemática cambia entre las variables discreta y continua, es

importante comprobar que la descripción conceptual de la probabilidad permanece inalterada. En la asignatura Química Física II se ha visto un ejemplo de distribución de probabilidad

continua. Concretamente, la condición de normalización se aplicó al dominio espacial de la

función de onda:

E V∗X8X +Y, (-V+Y, (-FY = 1 (1.28)

La función de distribución de probabilidad asociada a la energía cinética traslacional de las

partículas de un gas ideal (E) es otro ejemplo de funciones de distribución que implica

variables continuas:

+#-F# = 2Z [\]0/ #/_8 /\]F# (1.29)

La energía correspondiente al

máximo cambia con la

temperatura y la probabilidad

de encontrar una partícula a

energías cinéticas grandes

también aumenta con la

temperatura. Este ejemplo

demuestra que usando las

distribuciones de probabilidad

se puede presentar de forma

sucinta una cantidad sustancial

de información sobre el

comportamiento de un sistema

químico.

Figura 1.4. Distribuciones de probabilidad de la

energía cinética traslacional de un gas ideal.

Representación continua de variables discretas Es teóricamente posible evaluar probabilidades que implican variables discretas

mediante una suma; sin embargo, encontraremos situaciones en donde la suma

implica un número prohibitivamente grande de términos. En tales casos, tratar una

variable discreta como continua, simplifica en gran medida las cosas. Sin embargo, la

cuestión clave en esta aproximación es el error introducido al incluir valores de la

variable discreta que no están contenidos en el conjunto de la muestra. ¿Bajo qué

condiciones tales errores son aceptables?

Consideremos la siguiente función de distribución de probabilidad sin normalizar:

+I- = _8,0S (1.30)

Hemos de normalizar esta distribución determinando la probabilidad total Ptotal. En

primer lugar, tratamos X como una variable discreta con el espacio muestral que

consta de valores enteros comprendidos entre 0 y 100, de modo que Ptotal es

= ∑ _8,0S = 3,86S (1.31)

A continuación, X se trata como continua en el dominio de muestra 0 ≤ X ≤ 100. La

expresión correspondiente para la probabilidad total es

= E _8,0SFI = 3,33 (1.32)

La única diferencia entre estas dos últimas ecuaciones es que la suma sobre los

valores discretos de la variable X se ha reemplazado por la integración sobre el rango

de la variable. Por tanto, la aproximación continua proporciona un resultado muy

cercano al exacto dado por la suma.

En general, si las diferencias entre los valores de la función son pequeñas en relación

al dominio de interés, entonces es apropiado tratar una variable discreta como

continua. Este hecho resultará útil cuando se discutan los diferentes niveles de

energía de un átomo o molécula. Concretamente, se utilizará la aproximación de la

ecuación (30.32) para tratar los estados traslacionales y rotacionales desde una

perspectiva continua ya que la suma es impracticable. De aquí en adelante, se harán

constar cuidadosamente las situaciones en las que la aproximación continua no sea

válida.

Caracterización de las funciones de distribución.

Las funciones de distribución proporcionan toda la información disponible sobre la

probabilidad para un sistema dado; sin embargo, hay veces en que no se requiere la

descripción completa de la función de distribución.

Imaginemos que hemos llevado a cabo una serie de experimentos en los que sólo se

estudian ciertos aspectos de una distribución molecular. Las cantidades de la función

de distribución de interés son componentes de la distribución que responde al

experimento. Consideremos la distribución de energía cinética traslacional descrita

en la Figura 1.4. ¿Cuál sería la energía cinética para la que la función de distribución

de probabilidad tiene un máximo? En este caso, no es necesario el conocimiento

completo de la distribución de la probabilidad. En lugar de ello, todo lo que

necesitamos es una única cantidad para compararla con el experimento, o un valor

“referencia”.

Por ello, presentamos a continuación los valores de referencia de utilidad sustancial

para caracterizar las funciones de distribución.

Valores medios Consideremos una función, g(X), cuyo valor depende de la variable X. El valor medio

de esta función depende de la distribución de probabilidad asociada a la variable X. Si

se conoce la distribución de probabilidad que describe la probabilidad de que X tome

un valor, esta distribución se puede emplear para determinar el valor medio de la

función como sigue:

⟨a+I-⟩ = ∑ a+I-+I- = ∑ c+SM-LMNMOP∑ LMNMOP (1.33)

La ecuación (1.33) establece que para determinar el valor medio de la función g(X),

simplemente se suman los valores de esta función para cada valor del conjunto muestral, X1,

X2,…, XM, multiplicada por la probabilidad de que la variable tome ese valor.

La suma en el denominador proporciona la normalización de la distribución de probabilidad.

Los corchetes en forma de ángulo abrazando a g(X) (es decir, <…>) denotan el valor medio de

la función, una cantidad que se refiere como valor esperado.


Imaginemos que estamos en un espectáculo de atracciones y observamos un juego de dardos

en el que tiramos un único dardo a la siguiente diana:

Las cantidades en euros de la figura indican la cantidad de dinero que ganaremos si

alcanzamos con el dardo la parte correspondiente de la diana. La geometría de la diana es tal

que el radio de los círculos aumenta linealmente entre áreas sucesivas. Finalmente, tenemos

suficiente práctica en tiros de dardos como para no fallar enteramente no dando a la diana. Si

cuesta 1,50 € lanzamiento de un dardo, ¿merece la pena jugar en esta atracción?

Solución

Suponemos que la probabilidad de acertar en cada zona de la diana es directamente

proporcional al área. Si el radio del círculo interno es r, entonces los radios del segundo y

tercer círculo son 2r y 3r, respectivamente. El área de la curva interior, A1, es πr2 y las áreas de

los dos círculos más exteriores son d = Z+2H- − ZH = 3d d0 = Z+3H- − Z+2H- = 5d

Finalmente, el área total está dada por la suma de las áreas individuales, o 9A1, de modo que la

probabilidad de alcanzar cada parte de la diana es

K = dd + d + d0 = d9d = 19

K = dd + d + d0 = 3d9d = 39

K0 = d0d + d + d0 = 5d9d = 59

La suma de probabilidades es igual a 1, de forma que la distribución de probabilidad está

normalizada. La cantidad de interés es el pago promedio, o <n€>, dado por

⟨,€⟩ = ∑ ,€K0∑ K0 = +5€- 19 + +2€- 39 + +0€- 591 = 1,22€

La comparación del pago medio con la cantidad a pagar para tirar un dardo (1,50 €) sugiere

que este juego es una actividad en la que se pierde dinero (desde la perspectiva del lanzador

de dardos). Es interesante ver en este ejemplo que las cantidades “experimentales” que

estamos comparando son la cantidad de dinero que tenemos que pagar y la cantidad de dinero

que esperamos recibir en promedio, que es la cota de la distribución más interesante para

tomar la decisión de jugar.

Momentos de distribución Algunos de los valores de las cotas más ampliamente usados en las distribuciones

implican funciones de la forma xn donde n es un entero.

Si n = 1, la función correspondiente <x> se denomina primer momento de la función

de distribución, y es igual al valor medio de la distribución como discutimos

anteriormente.

Si n = 2, <x2> se denomina segundo momento de la distribución.

La raíz cuadrada de <x2> se denomina raíz cuadrática media o valor rms.

Los momentos primero y segundo, así como el valor rms, son cantidades

extremadamente útiles para caracterizar las funciones de distribución.


Consideremos la función de distribución siguiente:

+Y- = :Y_8fR

Las distribuciones de probabilidad de esta forma se encuentran cuando se describen las

distribuciones de velocidad de las partículas del gas ideal. En esta función de distribución de

probabilidad, C es una constante de normalización que asegura que la probabilidad total es

igual a uno, y a es una constante. El dominio de interés está dado por 0 ≤ x≤∞. ¿Son los

valores medio y rms de esta distribución los mismos?

Solución

Aplicando la condición de normalización llegamos a que:

1 = g :Y_8fRFY = :g Y_8fRFYX

X = : h 14)iZ)j

y por tanto:

: = 1h 14)iZ)j

= 4)0/√Z

Una vez conocida la constante de normalización, determinamos los momentos de distribución.

⟨Y⟩ = g Y+Y-FY = g Y h4)0/√Z Y_8fRjFY = 2√Z)X

X

⟨Y⟩ = g Y+Y-FY = g Y h4)0/√Z Y_8fRjFY = 32)X

X

Hlm = n⟨Y⟩ = o 32)

Los valores medio y rms de la distribución no son

equivalentes. La distribución normalizada y la

posición de los valores medio y rms para el caso en

que a = 0,3 se muestran a continuación:

Varianza La varianza, σ2, proporciona una medida de la anchura de una distribución. La

varianza se define como el promedio del cuadrado de la desviación con respecto a la

media de la distribución:

p = ⟨+Y − ⟨Y⟩-⟩ = ⟨Y − 2Y⟨Y⟩ + ⟨Y⟩⟩ (1.34)

Esta ecuación se puede simplificar utilizando las dos siguientes propiedades

generales para los promedios que implican a dos funciones, b(x) y d(x):

⟨q+Y- + F+Y-⟩ = ⟨q+Y-⟩ + ⟨F+Y-⟩ (1.35)

⟨rq+Y-⟩ = r⟨q+Y-⟩ (1.36)

Utilizando estas propiedades la expresión para la varianza es:

p = ⟨+Y − ⟨Y⟩-⟩ = ⟨Y − 2Y⟨Y⟩ + ⟨Y⟩⟩ = ⟨Y⟩ − ⟨2⟨Y⟩⟨Y⟩⟩ + ⟨Y⟩

= ⟨Y⟩ − 2⟨Y⟩⟨Y⟩ + ⟨Y⟩

p = ⟨Y⟩ − ⟨Y⟩ (1.37)

Para ilustrar el uso de la varianza como una cota, consideremos la siguiente función

de distribución denominada distribución gaussiana:

+I-FI = +[sR-P/R _8+S8t-R/sR (1.38)

Es la función de distribución más importante utilizada para describir el error en las

medidas experimentales. La variable X es continua en el dominio −∞ ≤ X ≤ ∞.

La distribución de probabilidad gaussiana tiene un máximo en X = δ.

La anchura de la distribución está determinada por la varianza, con un incremento de

la varianza correspondiente al incremento de anchura de la distribución.

La dependencia de la distribución gaussiana con la varianza se ilustra en la Figura 1.5

usando la ecuación (1.38) con δ = 0.

Conforme la varianza de la distribución se incrementa desde σ2 = 0.4 hasta 2.0, la

anchura de la distribución de probabilidad crece.

Figura 1.5. Influencia de la varianza sobre las funciones de distribución de probabilidad

gaussianas. Se presentan las distribuciones para dos valores de la varianza, σ2: 2,0 (línea roja)

y 0,4 (línea amarilla).


Determine la varianza de la función de distribución +Y- = :Y_8fR .

Solución

Esta es la función de distribución empleada en el ejemplo 1.11, y para los momentos primero y

segundo tenemos:

⟨Y⟩ = 2√Z)

⟨Y⟩ = 32)

Usando estos valores en la expresión de la varianza, encontramos

p = ⟨Y⟩ − ⟨Y⟩ = 32) − u 2√Z)v = 0,23)

Química Física III (Grado en Química)

Víctor Luaña

Universidad de OviedoOviedo, Curso 2016–2017

V. Luaña Química Física III (Grado en Química) Oviedo, curso 2016–2017 0 / 77

1. Termodinámica Estadística (Colectivos deGibbs)

La Mecánica Estadística representa uno de los cuerpos de doctrina centrales de la Química Física. Su papel esel de servir de conexión entre la visión microscópica de la Química Cuántica o la Espectroscopía, y la visiónmacroscópica de la Termodinámica. La descripción microscópica es de gran precisión y abundante en eldetalle. Demasiado abundante cuando se trata de determinar el comportamiento de un cuerpo macroscópico.Por el contrario, la Termodinámica adopta una perspectiva esencialmente empírica, de modo que bastan unaspocas variables, fácilmente medibles, para caracterizar el estado termodinámico. La Mecánica Estadística sirvede nexo entre ambas descripciones, de manera que permite utilizar la información detallada de la imagenmicroscópica para pronosticar el comportamiento termodinámico.


Ergodicidad

La receta estadística es, en principio, bien simple. Debe tomarse una muestra representativa de los estadosposibles del sistema y determinar las propiedades promedio para la misma. El problema consiste en asegurar larepresentatividad de la muestra o, como se denomina en este contexto, la ergodicidad del procedimiento.El conjunto de todos los estados posibles de un sistema puede describirse como una región de un espacio defases, cuyas dimensiones coinciden con las variables mecánicas de las que depende la energía.Es más fácil describir este concepto si adoptamos el punto de vista de la mecánica clásica. Un sistema formadopor N partículas estaría entonces completamente caracterizado si conociéramos, en un instante dado, el valorde las 3N coordenadas de posición y de las 3N componentes del momento lineal de sus partículas. Por lo tanto,el espacio de fases clásico de este sistema depende de 6N variables: cada punto de este hiperespacio6N-dimensional representa un estado posible.El muestreo del espacio de fases se puede hacer de diversas formas. Un método puede consistir en comenzarcon un estado inicial aleatorio y después resolver las ecuaciones dinámicas (p. ej. las ecuaciones de Newton ode Hamilton), siguiendo la evolución en el tiempo de dicho estado inicial. Tal es el fundamento de las técnicasde Dinámica Molecular, que conforman uno de los instrumentos de simulación más útiles.


El método de Gibbs de los colectivos

La simulación de un sistema complejo también puedellevarse a cabo mediante un muestreo aleatorio delos estados posibles del sistema, proporcionando acada estado un peso estadístico equivalente a suprobabilidad de ocurrir. Este tipo de procedimientosse conoce genéricamente con el nombre de métodosde Montecarlo, desde su introducción por Metropoliset al. en 1953 [J. Chem. Phys. 21 (1953) 1087].

En estas lecciones vamos a seguir, sin embargo, unprocedimiento muy diferente. Se trata de la formula-ción de colectivos, ideada por Josiah Williard Gibbsa finales del siglo XIX. El método garantiza de ante-mano la ergodicidad y, además, proporciona ecuacio-nes analíticas muy útiles de las propiedades termodi-námicas.


http://www.aip.org/history/gap/Gibbs/Gibbs.html

Un colectivo es un conjunto formado por un número muy grande, A, de sistemas, todos los cuales seencuentran en el mismo estado termodinámico. La idea es que esta colección de sistemas representen unamuestra apropiada de todos los estados microscópicos y, por lo tanto, sus propiedades promedio sean las delsistema promedio ideal.A lo largo de esta lección y de la siguiente hablaremos de colectivos, de sistemas y de moléculas o partículas.Un colectivo está formado por sistemas. Cada sistema, a su vez, está formado por partículas o moléculas.Emplearemos un convenio tipográfico para distinguir entre las propiedades que se refieren a uno u otro ámbito:

Propiedades del colectivo: A, E , V ,N , S, G, ...Propiedades de un sistema: E, V, N, S, G, p, ...Propiedades de una partícula (molécula): e, v, s, g, ...

Vamos a restringir nuestra discusión a sistemas que se encuentran en equilibrio termodinámico y en los quesólo ocurre trabajo hidrostático (es decir, trabajo p dV). La extensión a otros tipos de trabajo es sencilla, pero laextensión a sistemas fuera del equilibrio está lejos de ser trivial.En estas condiciones, el estado termodinámico de un sistema puede establecerse dando valor a tan sólo tresvariables termodinámicas: una elegida de cada una de las tres parejas N, µ (número de partículas opotencial químico), V, p (volumen o presión), y E, T (energía interna o temperatura). Cada pareja estáformada por una variable extensiva y otra intensiva. Existen, por lo tanto, ocho formas diferentes de definir elestado termodinámico de los sistemas que forman el colectivo. Las más importantes de entre ellas son:

(N, V, E), que da lugar al colectivo microcanónico,(N, V, T), que define el colectivo canónico,(µ, V, T), del colectivo gran canónico,y (N, p, T), del colectivo isobárico e isotérmico.

También podemos describir las características de cada colectivo indicando las propiedades de las paredes queseparan cada uno de los sistemas de los restantes. P. ej. los sistemas de un colectivo gran canónico estánseparados entre sí por paredes permeables, rígidas y diatermanas.A continuación examinaremos las propiedades del colectivo canónico. Veremos después que los diferentescolectivos se relacionan entre sí y, lo que es más importante, que las propiedades de los distintos colectivos sonequivalentes dentro del grado de error determinado por la desviación típica estadística.


Tipos de colectivos

Sistema energético:

var. intensiva µ p Tvar. extensiva N V E Nos centramos en sistemas homogéneos. En sistemas de varios

componentes N y µ son vectores.

colectivos:

estado colectivo ... Energía libre1 NVE microcanónico entropía, S2 NVT canónico E. Helmholtz, F3 µVT gran-canónico pV4 NpE iso-bárico5 µVE iso-químico6 NpT iso-pT E: Gibbs G


El colectivo canónico

Un colectivo canónico está formado por un número muy grande, A, de sistemas, cada uno de los cuales estálimitado por paredes impermeables, rígidas y diatermanas, de manera que el estado termodinámico (N, V, T)de todos los sistemas es el mismo. El colectivo completo se encuentra completamente aislado del resto deluniverso, de manera que su energía total, E , y el número total de partículas que contiene,N , permanecenconstantes.Cada sistema puede existir en uno cualquiera de una colección de estados cuánticos, de energíaE1, E2, E3, .... Estas energías dependen, en general, del número de partículas y del volumen del sistema:Ej(N, V).El estado del colectivo se puede establecer con tres grados diferentes de detalle:

Macroestado, que consiste en dar el valor de las tres variables termodinámicas (N, V, T), que fijan elestado termodinámico compartido por todos y cada uno de los sistemas.Microestado: representa el extremo contrario. Debemos proporcionar el estado cuántico de cada sistema.Es decir, una lista del tipo: el sistema 1 se encuentra en el estado E25, el sistema 2 en el estado E184, y asísucesivamente.Distribución: que proporciona un grado intermedio de detalle. Nos conformamos con conocer el númerode sistemas que se hallan en un estado Ei dado, renunciando a conocer cuáles son esos sistemas. Formal-mente, si ai representa el número de sistemas que se encuentran en el estado Ei, una distribución es unvector~a = a1, a2, a3, ....

Si conociéramos la probabilidad de que ocurra una determinada distribución, p(~a), sería sencillo calcular laenergía promedio de un sistema en el colectivo como:

〈E〉 =∑~a

p(~a)E(~a)

A=∑~a

p(~a)1A∑

i

aiEi, (1)

donde la primera suma recorre todas las posibles distribuciones y la segunda todos los posibles estadoscuánticos que un sistema puede adoptar. Esto se podría generalizar a todo tipo de propiedades que estén biendefinidas para un estado cuántico de un sistema.


Vamos a examinar cuatro aspectos cruciales que nos permitirán completar este programa de trabajo.

1. Postulado de equiprobabilidad de los microestados: Aceptaremos a priori que todos los microestadoscompatibles con un macroestado dado tienen la misma probabilidad de ocurrir.

⇒ La probabilidad de una determinada distribución será proporcional al número de microestados quecomprende (permutaciones con repetición). Si hay A sistemas en total, de los que ai se encuentran en elmismo estado cuántico Ei y no se pueden distinguir, el número de posibilidades será:

W(~a) =A!

a1! a2! a3!...=A!∏k ak!

, (2)

donde la suma sobre k recorre todos y cada uno de los estados cuánticos posibles. A partir de aquí, el númerototal de microestados posibles lo obtendremos sumando W(~a) sobre todas las distribuciones:

Wtotal =∑~a

W(~a). (3)

La probabilidad de una distribución dada será entonces p(~a) = W(~a)/Wtotal. Esta probabilidad nos permiteobtener todo tipo de propiedades. Por ejemplo, una de las propiedades interesantes del colectivo es laprobabilidad de que un estado dado se encuentre poblado:

Pj =

⟨aj

A

⟩=

1A∑~a

p(~a)aj(~a) =1

AWtotal

∑~a

W(~a)aj(~a). (4)


2. Teorema de la distribución más probable: No todas las distribuciones tienen la misma probabilidad. Dehecho, una consecuencia de que el número de sistemas A sea muy grande es que tan sólo una distribuciónconcreta, la distribución más probable~a ∗, tiene una probabilidad apreciable de ocurrir. Formalmente:

l«ımA→∞

p(~a) = δ(~a ∗) ≈

1 si ~a = ~a ∗

0 si ~a 6= ~a ∗ , (5)

donde δ(x) representa una función delta de Dirac.

Esquema: A medida que A crece la distribuciónde probabilidad p(~a) se va haciendo más y másaguda, tendiendo a una función delta de Dirac.


En lugar de tratar de demostrar este teorema vamos a ver un ejemplo ilustrativo:

Ejemplo: Supongamos que el colectivo esta formadopor A = 50 sistemas, que ocupan uno de los estadosde energía E1 = 0, E2 = ε, E3 = 2ε, E4 = 3ε, E5 =4ε, E6 = 5ε. Supongamos que la energía total delcolectivo está fijada en E = 5ε. Podemos enumerartodas las distribuciones posibles y determinar su pro-babilidad (Tabla de la derecha).

a1 a2 a3 a4 a5 a6 W(~a) p(~a)1 49 0 0 0 0 1 50 0.002 48 1 0 0 1 0 2450 0.003 48 0 1 1 0 0 2450 0.004 47 2 0 1 0 0 58800 0.025 47 1 2 0 0 0 58800 0.026 46 3 1 0 0 0 921200 0.297 45 5 0 0 0 0 2118760 0.67

Total: 3162510 1.00

A Wtotal p(~a ∗)50 3,16× 106 0,67103 8,42× 1012 0,98106 8,33× 1027 0,99998

Este ejemplo está realmente muy alejado del tamaño de una muestra ma-croscópica. Cuando aumenta el número de sistemas en el colectivo la distri-bución de probabilidad converge rápidamente hacia una delta de Dirac y ladistribución más probable se convierte, en la práctica, en el suceso seguro.


Hallar la distribución más probable

La distribución más probable es aquella que hace máximo W(~a). Esta función, sin embargo, toma valoresenormes y resulta más cómodo tratar con ln W(~a), que tiene idénticos máximos. Además

ln W(~a) = lnA!∏k ak!

= lnA!− ln

(∏k

ak!

)= lnA!−

∑k

ln ak!, (6)

y podemos hacer uso de la aproximación de Stirling,

ln n!−→n1

n ln n− n + 1 ≈ n ln n− n, (7)

para escribirln W(~a) ≈ A lnA−A−

∑k

ak ln ak +∑

k

ak︸︷︷︸A

(8)

Por otra parte, debemos asegurar que el número de sistemas, A, y la energía total del colectivo, E ,permanezcan constantes. Este problema de máximo con condiciones se puede tratar mediante el método demultiplicadores indeterminados de Lagrange. Para ello construimos una función objetivo

g(~a) = ln W(~a)− α

A︷︸︸︷∑k

ak −β

E︷︸︸︷∑k

akEk (9)

donde α y β son factores desconocidos.


http://mathworld.wolfram.com/StirlingsApproximation.html

http://mathworld.wolfram.com/LagrangeMultiplier.html

http://mathworld.wolfram.com/LagrangeMultiplier.html

Al haber incorporado las condiciones del problema en la función objetivo, podemos minimizar ésta líbrementecon respecto a las variables aj. La condición necesaria de mínimo será

∀j

:∂g∂aj

= 0 =⇒∂ ln W∂aj

− α∂

∂aj

∑k

ak︸︷︷︸=1

−β∂

∂aj

∑k

akEk︸︷︷︸=Ej

= 0

=⇒∂

∂aj

(A lnA−

∑k

ak ln ak)− α− βEj = − ln aj −

aj

aj− α− βEj = 0. (10)

La solución es única, de manera que se trata de los coeficientes de la distribución más probable:

∀j : a∗j = e−α−1e−βEj . (11)

Aún no hemos terminado. Debemos obtener los multiplicadores α y β. El primero es el más sencillo. Para que elnúmero total de sistemas sea A debe cumplirse:

A =∑

j

a∗j = e−α−1∑

j

e−βEj = e−α−1Q, (12)

donde hemos introducido Q =∑

j e−βEj , que recibe el nombre de función de partición canónica.Despejando,

a∗j =Ae−βEj∑

k e−βEk=AQ

e−βEj . (13)

Si dividimos por el número total de sistemas obtenemos la probabilidad de que el estado cuántico j seencuentre poblado:

Pj =a∗jA

=1Q

e−βEj . (14)


Este es un resultado muy importante: La población de un estado cuántico es proporcional a su exponencial deBoltzmann, e−βEj .La función de partición canónica, Q, es el objeto más importante de la estadística del colectivo. Como veremosenseguida, todas las propiedades termodinámicas del colectivo se pueden obtener a partir de la función departición. De algún modo, la función de partición tiene tanta importancia en estadística como la función de ondaen mecánica cuántica.Para llegar a ese punto debemos considerar cómo se determinan las propiedades termodinámicas del colectivo.En primer lugar, debemos distinguir entre aquellas propiedades termodinámicas que tienen un equivalentemecánico, como son la energía (Ej) o la presión (−∂Ej/∂V) de aquellas otras que son genuinamentemacroscópicas y carecen de una versión microscópica, tal como es el caso de la temperatura (T) o de laentropía (S). De ambos tipos de propiedades se ocupan los dos siguientes postulados.

3. Postulado de Gibbs: Las propiedades del colectivo que tienen un origen mecánico se pueden obtenerpromediando las correspondientes propiedades de cada sistema. Por ejemplo:

E = 〈E〉 =∑

j

EjPj =1Q

∑j

Eje−βEj , p = 〈p〉 =

1Q

∑j

(−∂Ej

∂V

)N

e−βEj . (15)

〈E〉 corresponderá a la energía interna, U, de la termodinámica clásica.


4. Postulado de Boltzmann: La entropía del colectivo es proporcional al logaritmo neperiano del número demicroestados que comprende su estado macroscópico:

S = kB ln W(~a ∗), (16)

donde kB = 1,3806505(24)× 10−23J/K recibe el nombre de constante de Boltzmann y está relacionada con laconstante R de los gases y el número de Avogadro NA: kB = R/NA.

No podemos demostrar la ecuación de Boltzmann Pero sí podemos argumentar en favor de su plausibilidad:

La entropía del universo crece en todo proceso espontáneo e irreversible (2o principio)

Espontáneamente el colectivo tiende al desorden: al estado que se puede construir de un número máximode maneras diferentes.

S es aditiva, pero W es multiplicativa.

En cualquier caso, la justificación de este postulado está en el hecho de que nos permite construir una teoríaestadística que describe correctamente el comportamiento de la materia.Como primera aplicación del postulado de Boltzmann vamos a determinar β. Partimos de

S = AS = kB ln W(~a ∗) = kB

(A lnA−

∑j

a∗j ln a∗j)

= kB

(A lnA−

∑j

a∗j ln[A

Qe−βEj

])= kB

(A lnA−

lnA∑

j

a∗j +A ln Q + β∑

j

a∗j Ej

)= AkB ln Q + kBβAE. (17)


Tomaremos ahora la diferencial de esta expresión, teniendo en cuenta que la energía cuántica de un estadodepende del volumen y del número de partículas, Ej(N, V), pero N es constante dado que estamos tratando conun colectivo canónico:

dS = kBdQQ

+ kBEdβ + kBβdE = kB1Q

∑j

e−βEj(−βdEj−Ejdβ

)+ kBEdβ + kBβdE

=

−kB

1Q

∑j

Eje−βEj dβ + kBβ

1Q

∑j

e−βEj

(−∂Ej

∂V

)dV +kBEdβ + kBβdE

= kBβpdV + kBβdE. (18)

Si despejamos dE podemos ver una expresión del primer principio de termodinámica en condiciones dereversibilidad y trabajo mecánico:

dE = −pdV +1

kBβdS = −pdV + TdS =⇒ β = 1/kBT, (19)

y la determinación de β nos permite completar las ecuaciones estadísticas.


Antes de seguir, es interesante que examinemos la variación de energía del colectivo, para poner de manifiestoun aspecto que hemos utilizado implícitamente en demostración anterior. Partimos de:

E =∑

j

a∗j Ej =⇒ dE =

=δW︷︸︸︷∑j

a∗j dEj +

=δQ︷︸︸︷∑j

Ejda∗j . (20)

En esta ecuación, dE representa la variación de energía interna del colectivo que se compone, como vemos, dedos partes. En primer lugar, está el cambio asociado a la variación de energía de los estados cuánticos de cadasistema, que interpretamos como el trabajo (δW). En segundo lugar, sin variar el espectro de estadosenergéticos, se produce un cambio de energía interna debido a la variación de las poblaciones, es decir, delnúmero de sistemas que ocupan cada estado. Esto es lo que interpretamos como calor (δQ). La ecuaciónanterior representa, por lo tanto, la interpretación estadística del principio fundamental de la termodinámica(1o+2o).


Función de partición canónica y propiedades termodinámicas

La función de partición canónica contiene la información estadística acerca del colectivo:

Q(N, V, T) =∑

j

e−βEj =estados∑

j

e−Ej(N,V)/kBT (21)

Vemos que Q depende de las tres variables que fijan el macroestado del colectivo. La dependencia de latemperatura es explícita, y la dependencia con respecto a N y V es heredada del hecho que la energía de losestados cuánticos de cada sistema depende de ambas variables.

Algunos autores usan el símbolo Z(N, V, T) para la función de partición canónica debido a su muy descriptivadenominación en alemán: Zustandsumme (suma sobre estados).Presión, energía y potencial químico se pueden obtener derivando ln Q con respecto a V, T y N, es decir, susrespectivas variables conjugadas:(

∂ ln Q∂V

)N,T

=1Q

∑j

(−β)

(∂Ej

∂V

)N,T

e−βEj = βp ⇒ p = kBT(∂ ln Q∂V

)N,T

, (22)

(∂ ln Q∂T

)N,V

=1Q

∑j

(Ej

kBT2

)e−βEj =

EkBT2

⇒ E = kBT2(∂ ln Q∂T

)N,V

, (23)

(∂ ln Q∂N

)V,T

=1Q

∑j

(−β)

(∂Ej

∂N

)V,T

e−βEj = −βµ ⇒ µ = −kBT(∂ ln Q∂N

)V,T

, (24)


Para obtener la última ecuación hemos introducido una definición microscópica del potencial químico de unestado cuántico: µj = (∂Ej/∂N)V,T . Esta definición tiene una gran importancia en el estudio de la capacidadaceptora o donora de electrones de las moléculas y, en definitiva, de su electronegatividad.La entropía se puede determinar fácilmente dividiendo por el número de sistemas la entropía del colectivo queobtuvimos anteriormente (eq. 17):

S = kB ln Q +ET

=⇒ S = kB ln Q + kBT(∂ ln Q∂T

)N,V

. (25)

Hemos dejado para el final la que quizás es la relación más transcendente. Así como Q es función de (N, V, T),las variables que determinan el macroestado del colectivo canónico, existe un potencial termodinámico quetiene esa misma terna como variables naturales. Se trata de la función de Helmholtz F (otros autores ladenominan A) cuya variación en un sistema puro es:

dF =

(∂F∂T

)N,V

dT +

(∂F∂V

)N,T

dV +

(∂F∂N

)V,T

dN = −SdT − pdV + µdN. (26)

Haciendo uso de la relación entre F y la energía interna (F = E − TS), podemos ver que la energía libre deHelmholtz adquiere una expresión particularmente simple expresada en términos de la función de particióncanónica:

F = −kBT ln Q. (27)

Esta relación tan simple no es casual, como veremos enseguida.


Otros colectivos:

El colectivo microcanónico es el más básico y de él se derivan todos los restantes. El macroestado queda fijadopor las variables (N, V, E), de manera que cada sistema, lo mismo que el colectivo como un todo, se encuentraaislado del resto del universo y no existe flujo de materia, trabajo ni energía. En estas condiciones, la únicadistribución posible es aquella que sitúa a cada sistema en el nivel cuántico de energía E. Este nivel tendrá, engeneral, una degeneración Ω(N, V, E), de manera que cada sistema se puede encontrar en uno cualquiera delos Ω estados de idéntica energía. El número total de microestados del colectivo será W = ΩA y el postuladode Boltzmann nos permite escribir:

S = kB ln W = kBA ln Ω =⇒ S = kB ln Ω. (28)

Ω(N, V, E) no es otra cosa que la función de partición del colectivo microcanónico. Además, S esprecisamente el potencial termodinámico cuyas variables naturales son (N, V, E):

dS =

(∂S∂E

)N,V

dE +

(∂S∂V

)N,E

dV +

(∂S∂N

)V,E

dN =1T

dE +pT

dV −µ

TdN. (29)

Pero

dS = kBd ln Ω = kB

(∂ ln Ω

∂E

)N,V

dE + kB

(∂ ln Ω

∂V

)N,E

dV + kB

(∂ ln Ω

∂N

)V,E

dN, (30)

y comparando obtenemos las expresiones microcanónicas para la temperatura, presión y potencial químico.Volvemos, por lo tanto, a advertir la existencia de una relación privilegiada entre la función de partición y elpotencial termodinámico definidos por la terna de variables que fijan el macroestado. Este tipo de relaciónocurre en todos los colectivos.


Las funciones de partición canónica y microcanónica están relacionadas. En Q(N, V, T) sumamos sobre todoslos estados cuánticos, pero también podríamos sumar soble los niveles energéticos y tener en cuenta ladegeneración de cada nivel:

Q(N, V, T) =estados∑

j

e−βEj =niveles∑

E

Ω(N, V, E)e−βE, (31)

que muestra la relación entre ambas funciones de partición.De manera similar, en el colectivo gran canónico:

Ξ(µ, V, T) =∑

N

∑j

e−βENj(V)e−γN=∑

N

∑E

Ω(N, V, E)e−βENj(V)e−γN, (32)

pV = kBT ln Ξ, (33)

y en el colectivo isobárico-isotémico:

∆(N, p, T) =∑

V

∑j

e−βEVj(N)e−δV=∑

V

∑E

Ω(N, V, E)e−βEVj(N)e−δV, (34)

G(N, p, T) = −kBT ln ∆, (35)

donde β = 1/kBT, γ = −µ/kBT, y δ = p/kBT.


Fluctuaciones

Hemos examinado las propiedades medias, pero también la varianza, σ2x = 〈(x− 〈x〉)2〉 = 〈x2〉 − 〈x〉2, y otros

estadísticos proporcionan información termodinámica relevante. En el colectivo canónico (N, V, T) son fijos,pero (µ, p.E) presentan fluctuaciones, y similarmente ocurre en en los colectivos restantes.Como ejemplo vamos a examinar las fluctuaciones de energía en el colectivo canónico:

σ2E = 〈E2〉 − 〈E〉2 =

1Q

∑j

E2j e−βEj − 〈E〉2 = −

1Q∂

∂β

∑j

Eje−βEj − 〈E〉2 = −

1Q∂

∂β(Q 〈E〉)− 〈E〉2 (36)

= −(∂ 〈E〉∂β

)V,N− 〈E〉

(∂ ln Q∂β

)V,N− 〈E〉2

= −[(

∂ 〈E〉∂T

)V,N

+ 〈E〉(∂ ln Q∂T

)V,N

](dβdT

)−1

− 〈E〉2

= −[(

∂ 〈E〉∂T

)V,N

+ 〈E〉(∂ ln Q∂T

)V,N

](dβdT

)−1

− 〈E〉2

= kBT2(∂ 〈E〉∂T

)V,N

+kBT2

(∂ ln Q∂T

)V,N〈E〉 −〈E〉

2= kBT2

(∂ 〈E〉∂T

)V,N

= kBT2 〈Cv〉

En un gas ideal 〈E〉 = O(NkBT) y 〈Cv〉 = O(NkB), de manera queσE

〈E〉= (kBT2 〈Cv〉)1/2 〈E〉−1

= O(1/√

N). (37)


Equivalencia termodinámica de los colectivos

Es decir, comparada con el valor promedio de la energía, la desviación típica de la misma decrece enproporción a la raíz cuadrada del número de partículas que forman el sistema. Este es un resultado prototípico:a medida que los sistemas crecen en tamaño, la importancia de las fluctuaciones disminuye siguiendo la ley deescala N−1/2. Por este motivo, en el examen de sistemas macroscópicos ordinarios es común que ignoremoslas fluctuaciones de las propiedades termodinámicos. Sin embargo, su importancia es muy grande cuandoexaminamos el comportamiento de pequeños agregados de materia.Por otra parte, en las cercanías de los puntos críticos del diagrama de fases de una sustancia, pueden darse lascircunstancias que aumentan las fluctuaciones hasta convertirlas en un fenómeno macroscópico y dominante.Pero esta importante propiedad escapa de nuestro programa de estudio.Debemos elegir el colectivo que nos permita analizar la propiedad de nuestro interés: Si nos interesan lasfluctuaciones en N no podemos usar el colectivo canónico, donde N es constante. sino que elegiríamos uncolectivo gran canónico, por ejemplo. En ese sentido, todos los colectivos son termodinámicamenteequivalentes, aunque matemáticamente distintos.


Colectivos en un sistema puro

macroestado colectivo Función de partición Potencial termodinámicoN, V, E microcanónico Ω(N, V, E) = W(~a?)A Entropía: S = kB ln ΩN, V, T canónico Q(N, V, T) E. Helmholtz: F = −kBT ln Qµ, V, T grancanónico Ξ(µ, V, T) pV = kBT ln ΞN, p, T isotérmico-isobárico ∆(N, p, T) E. Gibbs: G = −kBT ln ∆

Relaciones entre colectivos:

Q(N, V, T) =niveles∑

E

Ω(N, V, E)e−βE(N,V) (38)

Ξ(µ, V, T) =∑

N

∑E

Ω(N, V, E)e−βE(N,V)e−γN (39)

∆(N, p, T) =∑

V

∑E

Ω(N, V, E)e−βE(N,V)e−δV (40)

Multiplicadores indeterminados de Lagrange: β = 1/kBT, γ = −µ/kBT, δ = p/kBT.Ecuaciones termodinámicas básicas para un sistema puro:

F(N, V, T) : dF =(∂F∂T

)N,V dT +

(∂F∂V

)N,T dV +

(∂F∂N

)V,T dN (41)

= −SdT − pdV + µdN,

S(N, V, E) : dS = kB(∂S∂E

)N,V dE + kB

(∂S∂V

)N,E dV + kB

(∂S∂N

)V,E dN (42)

= kB(∂ ln Ω∂E

)N,V dE + kB

(∂ ln Ω∂V

)N,E dV + kB

(∂ ln Ω∂N

)V,E dN

= 1T dE + p

T dV − µT dN,


2. Sistemas (ideales) de partículas independientes

Un gas en el que podemos ignorar la interacción entre partículas, pero también un cristal en que cada modo devibración se puede considerar por separado e ignorar su influencia mútua o un gas de partículas de luz en elque cada partícula se puede considerar por separado. Tal es la situación de partículas independientes en elsentido estadístico. Si la energía de un sistema se comporta aditivamente la función de partición se comportamultiplicativamente. Una energía total expresada como suma de componentes da lugar a una functión departición expresada como producto de factores. En este largo capítulo hablaremos de la estadística clásica deMaxwell-Boltzmann (MB) y de su aplicación al estudio de las velocidades moleculares. La ley de Maxwell o dedistribución de las velocidades moleculares es el fundamento de la teoría cinética de los gases. A su vez, ladistribución de MB es el comportamiento límite de las estadísticas cuánticas que regulan el comportamiento debosones (estadística de Bose-Einstein) y fermiones (estadística Fermi-Dirac).


Sistemas de partículas independientes

En este capítulo vamos a explotar la circunstancia de que el problema se hace más simple cuando laspartículas son independientes, lo que quiere decir que el hamiltoniano total se puede escribir como una suma,

H =∑

i

hi, (43)

donde hi depende sólo de un conjunto de grados de libertad pero es independiente de los restantes. Dicho deotro modo, los grados de libertad se pueden clasificar en grupos y no existen términos en el hamiltoniano totalque acoplen (mezclen) unos grupos con otros.En el caso de un gas muy diluido, hasta el punto de que podemos ignorar las interacciones moleculares, hi

puede ser el hamiltoniano de una molécula, mientras que H sería el del gas completo. En el caso de unamolécula aislada podemos hacer una separación de los movimiento de traslacción, rotación, vibración,electrónicos, etc, y escribir:

H ≈ Htras + Hrot + Hvib + Helec + Hnuc + ... (44)

Un haz de luz se puede describir como un gas de fotones independientes. Las propiedades mecánicas,termodinámicas y elásticas de un cristal no metálico se pueden caracterizar en términos de sus vibraciones,aproximadamente tratadas como cuasipartículas independientes llamadas fonones. Si el cristal es metálico, esimprescindible considerar además la contribución de los electrones que forman el mar de valencia ... Endefinitiva, la denominación de partículas independientes tiene un significado muy amplio, referido siempre a laposibilidad de descomponer el hamiltoniano como indica la ecuación 43.


Estadísticas clásicas y cuánticas

Dependiendo de la descripción clásica o cuántica de las partículas distinguiremos:

Estadística de Maxwell-Boltzmann: Las partículas, o boltzones, se describen mediante las leyes mecá-nico clásicas, aunque es necesario suponerlas indistinguibles para lograr que la entropía sea extensiva.Ley de Maxwell: Aplicación de la estadística anterior al comportamiento de las velocidades moleculares.Estadística de Fermi-Dirac: Describe los sistemas formados por partículas de espín semientero (fermiones),cuya función de onda debe ser antisimétrica frente al intercambio de partículas. Como consecuencia delprincipio de exclusión, en un gas de fermiones idénticos dos partículas no pueden ocupar simultáneamenteel mismo estado cuántico.Estadística de Bose-Einstein: Describe los sistemas formados por partículas de espín entero (bosones),cuya función de onda debe ser simétrica frente al intercambio de partículas. Un número arbitrario de boso-nes pueden llegar a ocupar simultáneamente el mismo estado cuántico, dando lugar a un gas de Bose.

Las dos estadísticas cuánticas tienden a la de Maxwell-Boltzmann cuando la temperatura es lo bastanteelevada y la densidad de partículas escasa. La indistinguibilidad de las partículas, sin embargo, se conserva siqueremos un comportamiento estrictamente aditivo de la entropía.


Estadística de Maxwell-Bolzmann I

Partimos de la función de partición canónica, Q(N, V, T). Supongamos que el sistema está formado por Npartículas idénticas y distinguibles. Cada partícula se puede encontrar en una colección de estados:εii=1,2,.... La energía total del sistema es una suma de las energías de todas sus partículas de modo que,para un estado del sistema: Eκ = εa

i + εbj + ..., donde a, b, ... son las partículas, e i, j, ... indica el estado en el

que se encuentra cada partícula. Recorrer todos los estados κ del sistema equivale a que cada índice i, j, ...recorra todos los estados de una partícula. Por lo tanto:

Q(N, V, T) =∑κ

e−Eκ/kBT=

estados∑i

∑j

... exp

(−εa

i + εbj + ...

kBT

)

=

(∑i

e−εi/kBT

)∑j

e−εj/kBT

... = [q(V, T)]N (45)

donde q(V, T) =∑

i e−εi/kBT es la función de partición molecular, idéntica para todas las partículas. Laexpresión anterior, 45, representa la ecuación fundamental de la estadística de Maxwell-Boltzmann parapartículas distinguibles.En mecánica clásica no hay ninguna razón que impida que las partículas se distingan, dado que la integraciónde su trayectoria debe permitir, en principio, conocer su posición en cada instante. Sin embargo, veremos que laecuación 45 conduce a sutiles anomalías en las propiedades relacionadas con la entropía, que sólo seresuelven aceptando la indistinguibilidad.La energía total del sistema seguirá siendo suma de las energías de las partículas, aunque éstas seanindistinguibles, pero no podemos establecer qué partícula ocupa cada estado. Por lo tanto, dada la expresiónEijk... = εi + εj + εk + ..., si cada índice i, j, k, ... recorre por separado todos los estados accesibles a unapartícula estaremos contando repetidas veces estados del sistema que no se pueden diferenciar y son, por lotanto, el mismo. En estas condiciones, Q(N, V, T) no es separable, en general.


Estadística de Maxwell-Bolzmann II

Existe una circunstancia en la que la repetición de un estado es predecible y fácil de calcular. Sea Φ(ε) elnúmero de estados posibles de una molécula de energía menor o igual que ε. Si el número de estadosaccesibles a una partícula de energía media es muy superior al número N de partículas, es decir si Φ(ε) N,la probabilidad de que dos de los índices i, j, k, ... coincidieran, esto es, de que dos partículas se encontraran enel mismo estado, sería despreciable. En estas circunstancias, al recorrer independientemente cada índice i, j, k,... cada estado distinto aparecería repetido exactamente N! veces, correspondiendo a las formas de permutarentre sí los N índices diferentes. Por lo tanto, la indistinguibilidad sólo introduce una pequeña corrección sobrela expresión anterior:

Q(N, V, T) =q(V, T)N

N!. (46)

El resultado recibe el nombre de estadística de Maxwell-Boltzmann corregida.


Estimación del número de estados disponibles por partícula: I

Podemos estimar la razón entre el número de partículas y el número de estados accesibles empleando elmodelo de la partícula en una caja 3D. Recordemos que los estados se caracterizan por tres números cuánticosnx, ny, nz = 1, 2, 3, ... y su energía es

ε(nx, ny, nz) =h2

8ma2(n2

x + n2y + n2

z ) (47)

nx

ny

nz

R

si la caja es un cubo de lado a. Todos los estados se pueden representar en un espa-cio de fases, cuyas cordenadas son los números cuánticos nx, ny y nz, de modo quea cada estado le corresponde un cubito de volumen unidad. El conjunto de estados deenergía menor o igual a ε están encerrados dentro de un octante de esfera de radioR =

√n2

x + n2y + n2

z = a√

8mε/h en el espacio de fases. El número de estados encerra-

dos se puede estimar igual al volumen de dicho octante, aunque esta estimación cometeun pequeño error, que vamos a ignorar, al contar los estados en la frontera. Por lo tanto

Φ(ε) =18

43πR3

=π

6

(8mεh2

)3/2

V (48)

donde V = a3 es el volumen de la caja. La energía promedio por partícula es ε ≈ 32 kBT, y podemos utilizar la

ecuación de estado del gas ideal, pV = NkBT para podemos preparar la tabla siguiente.Razón del número de partículas al número de estados accesibles para varios sistema prototipo. Los gases seencuentran a 1 atm. La estadística de Maxwell-Boltzmann corregida tiene sentido si N/Φ(ε) 1. El He a bajastemperaturas no cumple esta condición y, aún más, esta estadística ha de ser desastrosa en sistemas como elgas de electrones de un metal alcalino.

He(l) He(g) He(g) He(g) Ne(l) Ne(g) Ne(g) e:Na(c)T (K) 4 4 20 100 27 27 100 300

N/Φ(ε) 1.6 0.11 2,0× 10−3 3,5× 10−5 1,1× 10−2 8,2× 10−5 3,1× 10−6 1465


Propiedades termodinámicas en la estadística MBcorr

Las propiedades termodinámicas de un colectivo canónico formado por partículas independientes se puedendeterminar de la función de partición molecular

q(V, T) =

estados∑j

e−βεj ≡niveles∑

k

gke−βεk , (49)

donde β = 1/kBT, y gk es la degeneración, necesaria si sumamos sólo los niveles de energía diferente. Entrelas propiedades sencillas que más nos interesan están la probabilidad de que un determinado estado o un nivelestén poblados:

πj =Nj

N=

1q

e−βεj , y πk =Nk

N=

1q

gke−βεk . (50)

Para la energía interna promedio

〈ε〉 ≡ ε =〈E〉N

=1N

kBT2 ∂

∂Tln

(qN

N!

)= kBT2

(∂ ln q∂T

)V. (51)

Similarmente ocurre con otras funciones termodinámicas:

p = NkBT(∂ ln q∂V

)T, S = Ns = NkB ln

eqN

+ NkBT(∂ ln q∂T

)V, (52)

µ = g = −kBT lnqN, F = Nf = −NkBT ln

eqN. (53)


Estadística del gas ideal

Un gas ideal está formado por moléculas sin interacción mutua. El hamiltoniano total es una suma de losoperadores de cada molécula por separado. Además, aceptaremos la separación efectiva entre los diferentesgrados de libertad: traslación, rotación, vibración, electrónicos, de espín nuclear, etc. En consecuencia, lafunción de partición molecular será el producto de las funciones de partición correspondientes a estos gradosde libertad. Como veremos:

q(V, T) = qtras(V, T)qrot(T)qvib(T)qelec(T)qspin−nuc(T)..., (54)

y sólo la función de partición traslacional depende sustancialmente del volumen del recipiente que contiene alsistema molecular. En las próximas secciones determinaremos la forma de las qi utilizando modelos cuánticossencillos que nos proporcionarán una descripción, aproximada pero suficiente, del espectro de nivelesenergéticos accesibles.Es importante recordar que una molécula con n átomos dispone de f = 3n grados de libertad de movimiento,que se reparten entre treslación, vibración y rotación:

a la traslación corresponden 3 en el espacio 3D,

a la rotación corresponden 2 en el caso de moléculas lineales o 3 en las no lineales.

ala vibración corresponden los restantes 3n− 5 o 3n− 6 grados de libertad.

Todos los grados de libertad aportan a las propiedades termodinámicas como las capacidades caloríficas o laentropía, pero lo hacen de diferentes formas.Por eso, la capacidad de aumentar la temperatura adquiriendo energía y emitir energía enfriándose varía con latemperatura: es la capacidad calorícica cv o cp lo que lo determina.


Función de partición electrónica I

No existe ningún modelo sencillo que nos describa el conjunto de estados electrónicos de un átomo o unamolécula. Por lo tanto, debemos depender de que nos proporcionen una tabla con sus energías ydegeneraciones para poder evaluar la expresión general

qelec(T) =niveles∑

k

gke−εk/kBT. (55)

El cero de energías es, en principio, arbitrario. Sin embargo, debemos adoptar un criterio uniforme, sobre todo siqueremos comparar sistemas. En el caso de átomos tomaremos como cero la energía del estado electrónicofundamental. En el caso de moléculas será el límite de disociación en sus átomos componentes.En muchos sistemas atómicos y moleculares el estado fundamental es único y está lo bastante separadoenergéticamente de los estados excitados como para que la población de éstos sea despreciable y nocontribuya significativamente a las propiedades termodinámicas. En estas circunstancias qelec ≈ 1, o qelec ≈ g0si el nivel fundamental es degenerado. Un ejemplo típico es H2O, donde el primer estado excitado se encuentra53800 cm−1 por encima del fundamental (kBT equivale a 208.5 cm−1 a 300 K).En otros sistemas el estado fundamental es orbital y espinorialmente degenerado, de manera que elacoplamiento espín-órbita produce el desdoblamiento en varios niveles muy próximos en energía. El O es unátomo que exhibe este comportamiento y sus primeros niveles energéticos son: 1s22s2p4 − 3P2 (ε0 = 0, g0 = 5),3P1 (ε1 = 158,5 cm−1, g1 = 3), 3P0 (ε2 = 226,5 cm−1, g2 = 1), 1D2 (ε3 = 15867,7 cm−1, g3 = 5), ... Un ejemplomolecular típico es el NO, cuyos primeros estados son: X − 2Π1/2 (ε0 = 0, g0 = 2), 2Π3/2 (ε1 = 119,82 cm−1,g1 = 4), A− 2Σ+ (ε2 = 43965,7 cm−1, g2 = 2), ... En este tipo de sistemas no podemos ignorar la población delos estados excitados que provienen del desdoblamiento espín-órbita, ni su contribución a las propiedadestermodinámicas.Como ejemplo, la tabla siguiente proporciona la población en equilibrio de los primeros estados excitados del Oa distintas temperaturas:


Función de partición electrónica II

T (K) 100 200 300 500 1000f1 0.055 0.154 0.207 0.255 0.294f2 0.006 0.029 0.047 0.067 0.087f3 < 10−99 2× 10−50 6× 10−34 9× 10−21 7× 10−11

fk =1

qelecgke−εk/kBT

El tratamiento de la función de partición nuclear es equivalente. Los estados nucleares están normalmenteseparados por energías muy elevadas, de manera que los estados excitados de los núcleos no contribuyen alas propiedades termodinámicas en condiciones ambiente. Por lo tanto, sólo hemos de preocuparnos por ladegeneración del estado fundamental nuclear y, como veremos al tratar las diatómicas homonucleares, delacoplamiento de espines entre núcleos idénticos de una molécula.


Función de partición traslacional I

Discutiremos el problema de la traslación utilizando el modelo de la partícula en la caja. Si la partícula, átomo omolécula, tiene una masa m y se encuentra confinado en una caja cúbica de lado a, los niveles de energía estáncuantizados según la expresión

ε(nx, ny, nz) =h2

8ma2(n2

x + n2y + n2

z ), con nx, ny, nz = 1, 2, 3, ... (56)

La función de partición traslacional será entonces

qtras =∞∑

nx=1

∞∑ny=1

∞∑nz=1

e−βε(nx,ny,nz)

=

∞∑nx=1

exp

−

h2n2x

8ma2kBT

∞∑ny=1

exp

−

h2n2y

8ma2kBT

∞∑nz=1

exp

−

h2n2z

8ma2kBT

= qxqyqz =

[ ∞∑n=1

exp

−

h2n2

8ma2kBT

]3

(57)

A temperaturas ordinarias, la energía térmica kBT es mucho mayor que el intervalo de energía entre dosestados sucesivos. En estas circunstancias cometemos un error despreciable al considerar que la suma sobreun conjunto discreto aunque infinito de niveles equivale a la integración sobre un contínuo. Por lo tanto

∞∑n=1

exp

−

h2n2

8ma2kBT

≈∞∑

n=0

(...) ≈∫ ∞

0exp

−

h2n2

8ma2kBT

dn =

√2πmkBT

h2a, (58)


Función de partición traslacional II

donde hemos usado∫∞

0 e−bx2dx =

√π/4b. Finalmente

qtras(V, T) =

(2πmkBT

h2

)3/2

V, (59)

donde hemos tenido en cuenta que a3 = V es el volumen del recipiente. La función de partición traslacional, porlo tanto, depende linealmente del volumen y depende de la temperatura como una potencia T3/2. Estadependencia es el origen de las propiedades más características del gas ideal, como vamos a ver de inmediato.


Ecuación de estado del gas ideal y energía interna de traslación

De todas las componentes de la función de partición molecular la traslacional es la única que depende delvolumen, y su dependencia es lineal. Por lo tanto, la presión promedio del gas ideal será

p = kBT(∂ ln Q∂V

)N,T

= ... = NkBT(∂ ln qtras

∂V

)N,T

=NkBT

V, (60)

y el resultado es la ecuación de estado del gas ideal. Si n representa el número de moles y N = nNA, donde NAes el número de Avogadro, la ecuación anterior conduce a

pV = nNAkBT = nRT (61)

que es la expresión más habitual de la ley. Vemos así de manera explícita la relación entre la constante deBoltzmann y la constante R de los gases: R = NAkB.La traslacional no es la única contribución a la energía interna, pero sí es la única que podría depender delvolumen. Sin embargo:

〈E〉tras = N 〈ε〉tras = kBT2(∂ ln Q∂T

)N,V

= ... =32

NkBT, (62)

y, por lo tanto, la energía interna del gas ideal es una función que depende exclusivamente de la temperatura.Este es un comportamiento bien conocido en la termodinámica clásica, que nuestra formulación estadística nospermite recuperar.


Principio de equipartición de la energía I

Los tres grados de libertad traslacionales contribuyen con 32 kBT a la energía interna por partícula. Este

resultado se puede generalizar a otros grados de libertad. Concretamente: Sea un sistema formado por un grannúmero de partículas independientes clásicas cuya energía molecular se expresa como suma de f términoscuadráticos. Cuando este sistema alcanza el equilibrio, la energía media por partícula es f × 1/2kBT.La demostración es sencilla. Si la energía es ε = b1p2

1 + b2p22 + ...+ bf p2

f , donde pi representa una coordenadade posición o de momento, la función de partición molecular será

q =

f∑k

∫ ∞0

e−βbkp21 dpk =

f∑k

12

(π

βbk

)1/2

= (kBT)f/2

(πf

b1b2...

)1/212f

= T f/2C (63)

donde C es una constante. De aquí

〈ε〉 = kBT2(∂ ln q∂T

)N,V

=f2

kBT, (64)

y la capacidad calorífica molar debería ser cv = (∂E/∂T)N,V = f2 R.

En general, la descripción clásica puede considerarse un límite de la genuina descripción cuántica encondiciones de temperatura suficientemente elevada. La consecuencia es que la contribución clásica a laenergía interna sólo se alcanza como caso límite y, dependiendo del tipo de grado de libertad, la contribuciónreal en condiciones ordinarias puede ser mucho menor.Las energías cinéticas de traslación y de rotación toman la forma 1

2 mv2i y 1

2 Iiω2i , respectivamente y, por lo tanto

aportan 12 kBT por cada grado de libertad. Cada vibración, por su parte, aporta el doble, ya que tanto la energía

cinética como la potencial proporcionan el correspondiente término cuadrático: 12 mξ2 + 1

2 kξ2. En una moléculapoliatómica formada por M átomos deberíamos esperar: (a) 3 grados de libertad traslacionales, que aportarían32 kBT; (b) 3 grados de libertad rotacionales (2 si la molécula es lineal) que aportarán 3

2 kBT (ó kBT en lasmoléculas lineales); (c) los restantes 3M − 6 (ó 3M − 5) grados de libertad corresponden a otras tantasvibraciones y cada una aportará kBT en el límite clásico.


Principio de equipartición de la energía II

De acuerdo con esto, la capacidad calorífica molar de un gas monoatómico debería ser cv = 32 R, lo que

concuerda bien con los experimentos. Para un gas diatómico deberíamos esperar cv = 72 R, aunque los valores

experimentales en condiciones ambiente se aproximan más a 52 R, y la discrepancia entre teoría y experimento

crece aún más a medida que aumenta el número de átomos. La razón es, como veremos después, que serequiere una temperatura muy alta para poblar los estados vibracionales excitados, de modo que los grados delibertad vibracionales no llegan a contribuir plenamente a la capacidad calorífica si no es a estas elevadastemperaturas.Para el gas monoatómico, por otra parte,

H = E + pV =32

NkBT + NkBT =52

NkBT =⇒ Cp =

(∂H∂T

)N,p

=52

NkB. (65)

De aquí

γ =Cp

Cv=

53. (66)

Esta relación se puede determinar con precisión en el laboratorio a partir de la medida de la velocidad delsonido en el gas: vs =

√γRT/M, donde M es la masa molar.


Entropía traslacional. Ecuación de Sackur-Tetrode: I

La ecuación de la entropía nos permitirá observar uno de los hechos más notorios de la estadística clásica. Lasestadísticas de Maxwell-Boltzmann y MB corregida conducen a diferentes expresiones. Si las partículas sondistinguibles la entropía traslacional será

S = kB ln Q + kBT(∂ ln Q∂T

)N,V

= NkB ln q + NkBT(∂ ln q∂T

)N,V

(67)

=⇒ Stras = NkB ln

(2πemkBT

h2

)3/2

V

(68)

y si son indistinguibles

S = NkB lnqeN

+ NkBT(∂ ln q∂T

)N,V

=⇒ Stras = NkB ln

(2πemkBT

h2

)3/2 VeN

(69)

La diferencia entre ambas expresiones es notable. Sobre todo el hecho de que una dependa de ln V y la otra deln(V/N). La corrección debida a la indistinguibilidad es crucial para asegurar que la entropía sea una magnitudextensiva. Para comprobar esta notable propiedad vamos a examinar un ingenioso experimento mentalpropuesto por Gibbs mucho antes de que la mera existencia de los átomos fuese un hecho experimentalprobado.


La Paradoja de Gibbs I

Imaginemos dos gases ideales monoatómicos A y B situados, cada unoen su recipiente, en idénticas condiciones de volumen y temperatura (Ien el diagrama adjunto). Rompemos la pared de separación para mez-clar ambos gases en un recipiente de volumen doble, pero sin modificarla temperatura (parte II del diagrama). Podemos calcular el cambio deentropía entre ambas situaciones. Hagamoslo primero de acuerdo conla estadística de Maxwell-Boltzmann original:

NAV T, ,SA

NBV T, ,BS

NA NB+2V T, ,SAB

A B

A+B

(I)

(II)

SI = SA + SB = NAkB ln

(2πemAkBT

h2

)3/2

V

+ NBkB ln

(2πemBkBT

h2

)3/2

V

, (70)

SII = SAB = NAkB ln

(2πemAkBT

h2

)3/2

2V

+ NBkB ln

(2πemBkBT

h2

)3/2

2V

, (71)

∆S = SAB − SA − SB = (NA + NB)kB ln 2. (72)

Si A y B son dos gases diferentes es correcto que el proceso de mezcla produzca un aumento en la entropía delsistema y que este sea, además proporcional al número de partículas involucradas en la mezcla. De hecho, laecuación estadístico de la entropía de mezcla compara bien con los experimentos en gases a baja presión. Elproblema, sin embargo, es que ∆S > 0 incluso cuando A y B son el mismo gas y, por lo tanto, la entropía no esuna magnitud extensiva según la estadística de Maxwell-Boltzmann de partículas distinguibles. Este resultadoestá en clara contradicción con la termodinámica clásica y supuso un claro problema del que Gibbs eraconsciente.


La Paradoja de Gibbs II

Veamos ahora qué ocurre al repetir el análisis empleando las fórmulas de la estadística de partículasindistinguibles. Si A y B son gases diferentes tendremos:

SA + SB = NAkB ln

(2πemAkBT

h2

)3/2 VeNA

+ NBkB ln

(2πemBkBT

h2

)3/2 VeNB

, (73)

SAB = NAkB ln

(2πemAkBT

h2

)3/2 2VeNA

+ NBkB ln

(2πemBkBT

h2

)3/2 2VeNB

, (74)

∆S = SAB − SA − SB = (NA + NB)kB ln 2, (75)

de manera que se repite el pronóstico de la entropía de mezcla. Sin embargo, si A y B son el mismo gas yNA = NB = N para que no haya diferencia de presión entre los recipientes iniciales:

2SA = 2NkB ln

(2πemkBT

h2

)3/2 VeN

= 2NkB ln

(2πemkBT

h2

)3/2 2Ve2N

= SAB (76)

de donde ∆S = SAB − 2SA = 0: la entropía de mezcla es nula cuando ambos gases son el mismo. Laestadística de Maxwell-Boltzmann corregida para tener en cuenta la indistinguibilidad de las partículaspreserva el caracter extensivo de la entropía.


Contribución traslacional al potencial químico

El potencial químico es una de las magnitudes fundamentales de la termodinámica química. Siguiendo lasideas de Lewis y Randall, para el gas ideal se adopta la expresión

µ(p, T) = µ(T) + RT ln(p/p), (77)

donde p = 1 bar = 101325 Pa es una presión de referencia. La termodinámica clásica no ofrece ningunaexpresión para µ(T), que debe determinarse experimentalmente. La termodinámica estadística, en cambio, síque permite estimar su valor. De la ecuaciones de los apartados anteriores

µtras = −kBT lnqtras

N= −kBT ln

(2πmkBT

h2

)3/2 VN

(78)

pero V/N = kBT/p para el gas ideal. Tenemos que tener cuidado al comparar las dos expresiones anteriores.Mientras la ecuación de la termodinámica clásica está expresada en moles, la ecuación estadística se refiere amoléculas. Teniendo en cuenta esta diferencia:

µtras(T) = −RT ln

(2πmkBT

h2

)3/2 kBTp

. (79)

En el caso del gas monoatómico, la contribución traslacional es, normalmente, la única contribución relevante.En el caso de los gases diatómicos y poliatómicos también hemos de considerar las contribuciones rotacional yvibracional.


Distribución de Maxwell de las velocidades moleculares I

En ausencia de un potencial externo, la energía de un sistema de partículas independientes es exclusivamenteenergía cinética. Si utilizamos la descripción que proporciona la mecánica clásica ε = T = 1

2 m(v2x + v2

y + v2z ),

donde m es la masa de la partícula y (vx, vy, vz) son las componentes cartesianas del vector velocidad,~v. Lafracción de población correspondiente a una energía dada será proporcional a la exponencial de Boltzmann,sólo que ahora estamos hablando de una variable contínua. Por lo tanto:

dN(vx, vy, vz)

N= C exp

−

m(v2x + v2

y + v2z )

2kBT

dvx dvy dvz, (80)

describe la fracción de partículas cuya velocidad está comprendida entre vx y vx+dvx, vy y vy+dvy, y vz y vz+dvz.Integrando a todo el rango de velocidades podemos determinar la constante de normalización C:

1 =

∫ +∞

−∞

dN(vx, vy, vz)

N= C

+∞y

−∞

e−m(v2x+v2

y+v2z )/2kBT dvx dvy dvz = C

2πkBT

m

3/2

, (81)

donde hemos usado∫+∞−∞ e−bx2

dx =√π/b (b > 0).


El resultado es la distribución de Maxwell de velocidades moleculares:

dN(vx, vy, vz)

N= f (vx)dvx f (vy)dvy f (vz)dvz, f (vx) =

√m

2πkBTe−mv2

x/2kBT, ... (82)

que describe la probabilidad de que una partícula tenga una velocidad comprendida en un entorno diferencialdel valor~v = vx~ı+vy~+vz~k.

En cada dimensión f (vξ) (ξ : x, y, z)describe una campana de Gauss,centrada en torno al valor medio〈vξ〉 = 0 y con una varianza σ2

ξ =

kBT/m. En consecuencia, el valormedio del vector velocidad es nulo〈~v〉 = ~0, lo que puede dar la enga-ñosa impresión de inmovilidad. Nadamás lejos de la realidad, como vere-mos enseguida.

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

−4 −3 −2 −1 0 1 2 3 4

f(v x

) (u

v−1 )

vx (uv)

m/2kT = 1 uv2

= 2 uv2

= 3 uv2


La distribución de velocidades moleculares puede expresarse en coordenadas cartesianas, como en laecuación 82, pero también en coordenadas esféricas polares:

dN(vx, vy, vz)

N=

m

2πkBT

3/2

e−m(v2x+v2

y+v2z )/2kBT dvx dvy dvz

=

m

2πkBT

3/2

e−mv2/2kBT v2dv sen θdθdφ =dN(v, θ, φ)

N. (83)

El resultado es una función de distribución que nuestra claramente la simetría esférica del problema. Dicho deotro modo, las partículas se mueven al azar sin que exista ninguna dirección privilegiada de movimiento. Siintegramos con respecto a las coordenadas esféricas,

m2πkBT

3/2

e−mv2/2kBT v2dv∫ π

0sen θdθ

∫ 2π

0dφ =

= 4π

m2πkBT

3/2

e−mv2/2kBT v2dv = f (v)dv =dN(v)

N, (84)

obtenemos la probabilidad de que el módulo de la velocidad de una partícula esté comprendido entre v y v+dv.El resultado es que la función de distribución del módulo de la velocidad es completamente diferente de ladistribución de las componentes cartesianas de la velocidad. El término v2 domina el comportamiento a bajasvelocidades, dando por resultado un incremento cuadrático en el número de moléculas a medida que lavelocidad crece. El término gaussiano, por el contrario, domina la región de velocidades altas, de manera que elnúmero de moléculas en este régimen decae exponencialmente con v. Entre medias la función de distribución


f (v) pasa por un máximo cuya posición y altura depende de kBT/m.

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

0 0.5 1 1.5 2 2.5 3

f(v)

(uv

−1 )

v (uv)

m/2kT = 1 uv2

= 2 uv2

= 3 uv2

Podemos obtener más información acerca de esta distribución determinando el valor de tres importantesmedidas centrales: la moda, la media y la media cuadrática. La moda o velocidad más probable correspondeal máximo de la función densidad f (v). De la condición necesaria de máximo:

df (v)dv

= 0 = 4π

m2πkBT

3/2

v

2− 2mv

2kBTv2

e−mv2/2kBT

. (85)


Es claro que las soluciones v = 0 y v→∞ no corresponden al máximo. Por lo tanto: vmp =√

2kBTm . Por otra

parte, las integrales∫ ∞0

x2n+1e−αx2dx =

n!

2αn+1y

∫ ∞0

x2ne−αx2dx =

(2n−1)!!

2n+1

√π

α2n+1(86)

permiten obtener

〈v〉 =

∫ ∞0

vf (v)dv = 4π

m2πkBT

3/2 ∫ ∞0

v3e−mv2/2kBT dv =

√8kBTπm

(87)

〈v2〉 =

∫ ∞0

v2f (v)dv =3kBT

m=⇒ vcm = vrms =

√〈v2〉 =

√3kBT

m. (88)

La comparación entre estas tres medidas centrales muestra que vmp < 〈v〉 < vrms y que, de hecho, las tres sehallan en una proporción fija:

√2 :√

8/π :√

3. Las tres se representan en la figura adjunta superpuestas a lafunción densidad f (v).

Cuanto más ligeras sean las partículas o mayorla temperatura, tanto mayor será la media delmódulo de velocidad. Si examinamos un gastípico veremos que, en condiciones ambiente, 〈v〉vale miles de km/h. Por lo tanto, el hecho de que〈~v〉 = ~0 no se debe a la inmovilidad sino a queel movimiento molecular se produce al azar y losmovimientos en una dirección compensan con losde la dirección opuesta.

Velocidad molecular media a 298 K y 1 atm.

gas m (g/mol) 〈v〉 (m/s) 〈v〉 (km/h)O2 32 444 1598H2 2 1770 6372

Velocidad de escape terrestre: 11.2 km/s.0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.0 0.5 1.0 1.5 2.0 2.5 3.0

f(v)

(uv

−1 )

v (uv)

vmp

<v>

vcm

m/2kT = 1 uv2


Función de partición vibracional

El tratamiento estadístico no requiere, usualmente, una expresión exquisitamente precisa de los nivelesenergéticos. De hecho, resulta suficiente utilizar el modelo de oscilador armónico más rotor rígido, el másbásico de los que desarrollamos al estudiar la rotovibración de las moléculas diatómicas.En el modelo de oscilador armónico, los estados vibracionales de una molécula diatómica AB tienen por energía

εv = (v+1/2)hνe con v = 0, 1, 2, 3, ... (89)

donde νe = 12π

√keµ es la frecuencia de vibración fundamental, ke es la constante de fuerza y

µ = mAmB/(mA+mB) la masa reducida de la molécula. Los niveles vibracionales de la molécula diatómicacarecen de degeneración.La función de partición vibracional será

qvib(T) =

∞∑v=0

exp−

(v+1/2)hνe

kBT

= e−hνe/2kBT

∞∑v=0

e−vhνe/kBT. (90)

Dado que r = e−hνe/kBT < 1, la suma de la ecuación anterior equivale a la suma de los términos de unaprogresión geométrica convergente,

∑∞v=0 rv = 1/(1− r), y

qvib(T) =e−hνe/2kBT

1− e−hνe/kBT=

e−θv/2T

1− e−θv/T, θv =

hνe

kB[=] K. (91)


Es interesante observar que el numerador de qvib(T) provie-ne de la energía de punto cero, mientras que el denominadorcorresponde a la suma sobre todos los estados. También esimportante comprobar que, como habíamos anticipado, la fun-ción de partición vibracional es independiente del volumen.La figura adyacente representa qvib frente a la temperatura re-ducida Tr = T/θv. Podemos comprobar que, a temperaturasuficientemente alta, qvib crece linealmente con Tr . Y sólo seobserva un crecimiento supralineal en la región Tr < 0,1.

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

q vib

T / θv

La tabla siguiente muestra las temperaturas características de vibración, θv ≈ 102–103 K, de algunas moléculasdiatómicas. La masa reducida tiene un efecto dominante: cuanto más ligera la molécula mayor es θv. El átomomás ligero domina µ en las heterodiatómicas, lo que explica que los hidruros de un mismo período tengantemperaturas reducidas muy similares. Si la masa reducida es semejante, la molécula de enlace más fuerte(mayor ke) es la que posee mayor θv.

H2 D2 OH NH O2 N2 F2 Cl2 Br2 I2θv (K) 6332 4483 5378 4722 2274 3393 1319 805 468 309

Datos procedentes del "NIST WebBook".


http://webbook.nist.gov/

Entre las propiedades termodinámicas que se derivan de qvib destacan la energía interna y la capacidadcalorífica:

Evib = NkBT2(∂qvib

∂T

)V

= NkBθv

12

+1

eθv/T − 1

, (92)

Cvibv =

(∂Evib

∂T

)V

= NkB

(θv

T

)2 eθv/T(eθv/T − 1

)2 . (93)

A elevadas temperaturas Cvibv tiende al límite clásico del principio de equipartición, pero se necesita que T > θv

para estar cerca de ese límite.

0.5

1.0

1.5

2.0

2.5

3.0

3.5

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Evi

b/N

kθv

T / θv

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Cvvi

b /Nk

T / θv


Ocupación en equilibrio de estados vibracionales I

La población en equilibrio de los estados vibracionales es:

fv =1

qvib(T)e−(v+1/2)θv/T

. (94)

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

0.0 1.0 2.0 3.0 4.0 5.0

Pob

laci

ón, f

v

Estado vibracional, v

T/θv = 0.2T/θv = 0.5T/θv = 1.0T/θv = 1.5

La máxima población co-rresponde siempre al esta-do fundamental v = 0 y de-cae exponencialmente conv. El aumento de la tem-peratura aumenta la pobla-ción de los estados exci-tados. En condiciones am-biente, muchas moléculasdiatómicas tienen una po-blación despreciable en losestados excitados, como lafigura de la página siguien-te muestra claramente.


Ocupación en equilibrio de estados vibracionales II

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0 200 400 600 800 1000 1200 1400

Pob

laci

ón e

n es

tado

s ex

cita

dos,

1−

f 0

Temperatura, T (K)

H2D2F2

Cl2Br2I2


Vibración en moléculas poliatómicas

En la aproximación armónica, una molécula de N átomos dispone de 3N − 6 modos normales independientesde vibración (3N − 5 si es lineal), que se pueden describir como osciladores armónicos. Cada modo normal dolugar a un número cuántico vibracional y tiene una frecuencia característica, aunque puede haber dos o másmodos de igual frecuencia. La energía vibracional total es

εvib ≈3N−6∑

i=1

εi =

3N−6∑i=1

(vi−1/2)hνi, (95)

de modo que la función de partición vibracional y la capacidad calorífica vibracional son

qvib(T) ≈3N−6∏

i=1

qi =

3N−6∏i=1

e−θi/2T

1− e−θi/T, Cvib

v ≈ NkB

3N−6∑i=1

(θi

T

)2 eθi/T(eθi/T − 1

)2 . (96)

H2O νi (cm−1) θi (K)1 a1 sym. str. 3825.32 55042 a1 sym. bend. 1653.91 23803 b1 asym. str. 3935.59 5662

CH4 νi (cm−1) θi (K)1 a1 sym. str. 2917.0 41972 e sym. bend. 1533.6 22063 t2 asym. str. 3019.5 43444 t2 asym. bend. 1306.2 1879

Datos procedentes del "NIST WebBook":



0.0

0.5

1.0

1.5

2.0

2.5

3.0

0 1000 2000 3000 4000 5000 6000

Cvvi

b /Nk

T (K)

H2O

0.000.050.100.150.200.250.300.35

0 100 200 300 400 500 600


0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Cvvi

b /Nk

T (K)

CH4

0.000.100.200.300.400.500.600.700.800.901.00

0 100 200 300 400 500 600


Función de partición rotacional (diatómica heteronuclear) I

Usaremos un modelo de rotor rígido para determinar las energías de los estados rotacionales. Por lo tanto:

• estados rotacionales : |JM〉 , J = 0, 1, 2, ..., M = 0,±1, ...,±J,

• energía : εJ = hBeJ(J + 1), Be =h

8π2µR2e

[=] s−1, (97)

• degeneración : gJ = 2J + 1.

La función de partición rotacional vendrá dada por

qrot(T) =

∞∑J=0

(2J+1)e−J(J+1)θr/T, θr =

hBe

kB[=] K. (98)

No hay una expresión analítica para la suma sobre J, como ocurre en el caso vibracional, pero la suma directaconverge rápidamente y es simple de evaluar con un sencillo programa informático. Además, si la temperaturaes T > θr resulta apropiado sustituir el sumatorio por una integración:

qrot(T) ≈∫ ∞

0(2J+1)e−J(J+1)θr/T dJ =

Tθr. (99)


La integral anterior forma parte de la llamada fórmula de Euler-MacLaurin para la suma de los términos deuna serie. Si f (n) es una función definida para una variable entera n, pero que se comporta como una funcióncontínua en todo el intervalo real [a, b]:

b∑n=a

f (n) =

∫ b

af (x)dx +

12f (a) + f (b)+

∞∑j=1

(−1)j B∗j(2j)!

f (2j−1)

(a)− f (2j−1)(b), (100)

donde f k(a) es la derivada k-ésima en x = a, y los B∗j son los números de Bernoulli: B∗1 = 1/6, B∗2 = 1/30,B∗3 = 1/42, B∗4 = 1/30, B∗5 = 5/66, B∗6 = 691/2730, B∗7 = 7/6, B∗8 = 3617/510, ...Aplicada al caso de la función de partición rotacional, la fórmula de Euler-MacLaurin conduce a:

qrot(T) =Tθr

1 +

13

(θr

T

)+

115

(θr

T

)2

+4

315

(θr

T

)3

+1

315

(θr

T

)4

+ ...

. (101)

Bajo cualquiera de las expresiones 98, 99 y 101, podemos ver en la figura siguiente que qrot es una funciónuniversal de la temperatura reducida Tr = T/θr . Para temperaturas suficientemente altas (T > θr), la función departición rotacional crece linealmente con Tr . En este régimen la integral simple, ec. 99, es apropiada ya que,aunque difiere en una constante de la verdadera qrot, esta diferencia desaparece al derivar para obtener laspropiedades termodinámicas del gas. En el régimen T < θr la función de partición crece como una potenciaelevada de Tr . En estas circunstancias la aproximación lineal no es válida, la aproximación de Euler-MacLaurinnecesita cada vez más términos a medida que la temperatura desciende, y la única forma válida de obtener qrotes realizar directamente la suma sobre niveles, ec. 98.


http://mathworld.wolfram.com/Euler-MaclaurinIntegrationFormulas.html

http://mathworld.wolfram.com/BernoulliNumber.html

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

qro

t

T / θr

exactoT/θr


1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

qro

t

T / θr

exactoT/θr

La temperatura característica de rotación, θr , se encuentra en el rango 10−2–101 K para la mayoría demoléculas pequeñas. Por lo tanto, la temperatura ambiente es elevada en términos rotacionales, no comoocurre con la vibración. La masa reducida y el tamaño molecular determinan la temperatura de rotación:


θr ∝ µ−1, θr ∝ R−2e . Moléculas pequeñas y con, al menos, un átomo ligero presentan los valores más

elevados, al contrario que las moléculas grandes y formadas por átomos pesados.

OH NH CO NO IClθr (K) 27.21 24.03 2.779 2.406 0.1642

H2 D2 O2 N2 F2 Cl2 Br2 I2θr (K) 87.55 43.80 2.068 2.875 1.281 0.3510 0.1181 0.05377

Datos procedentes del "NIST WebBook":En las dos figuras siguientes vemos la contribución rotacional a la energía interna y capacidad calorífica. Susexpresiones son simples de obtener a partir de la ecuación 98, aunque prolijas. Ambas son funcionesuniversales de Tr = T/θr . El comportamiento de Crot

v es particularmente interesante. Partiendo de un valor nuloa 0 K, la capacidad calorífica crece como una sigmoide con T, acercándose al límite clásico del principio deequipartición Crot

v → NkB, que se alcanza hacia T ≈ 2θr . Lo más llamativo es que Crotv llega a superar este valor

y tiende al límite desde arriba. Este comportamiento de la rotación es diferente al de otros grados de libertad.Desde un punto de vista práctico, Crot

v ≈ NkB para la mayoría de moléculas diatómicas heteronucleares encondiciones ambiente.



0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Ero

t/N

kθ

r

T / θr


0.0

0.2

0.4

0.6

0.8

1.0

1.2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Cvro

t /Nk

T / θr

El extraño comportamiento de Crotv se puede explicar como consecuencia del modo en el que se pueblan los

estados rotacionales. La población en equilibrio de cada estado viene dada por

fJ =1

qrot(T)(2J + 1)e−J(J+1)θr/T

. (102)


El término lineal que describe la degeneración domina el comportamiento a pequeños valores de J, mientrasque el término exponencial decreciente se encarga de asegurar que fJ → 0 al aumentar J. A medida queaumenta el número cuántico rotacional la población fJ aumenta, pasa por un máximo y tiende, finalmente, adecrecer exponencialmente hasta cero. A diferencia de lo que sucede para otros grados de libertad (p. ej. lavibración) el estado más poblado no es el fundamental, salvo a temperaturas muy bajas (T θr). Estecomportamiento se observa claramente en la figura de la página siguiente.Las poblaciones rotacionales dependen únicamente de la temperatura relativa Tr = T/θr . Cuanto mayor Tr ,mayor es la población de los estados excitados y mayor el valor de J del estado más poblado. Suponiendo quela función fJ(J) está definida en un contínuo podemos determinar fácilmente el estado rotacional más poblado:

(condición necesaria de máximo)dfJdJ

= 0 =⇒ 2Jmax + 1 =

√2Tθr. (103)

Como vemos, Jmax es proporcional a la raíz cuadrada de la temperatura reducida. Para T fija Jmax ∝√µ.


0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Pobla

ció

n, f J

Estado rotacional, J

T/θr = 1

5

10

50


0

5

10

15

20

25

30

35

40

0 200 400 600 800 1000 1200 1400

Esta

do

má

s p

ob

lad

o,

Jm

ax

Temperatura, T (K)

OH

NH

CO

NO

ICl


La población de los estados rotacionales domina el as-pecto de los espectros de rotación y rotovibración. Eneste caso se trata de la transición v : 0 → 1 de la mo-lécula de CO. Las ramas P y R están formadas por lastransiciones J → J +1 y J +1→ J, respectivamente. Laidentificación del estado más poblado, Jmax permite de-terminar la temperatura a que estaba el gas CO durantela medida.


orto- y para-H2) I

Hacia 1925 se observó que la capacidad calorífica del H2 se comporta anómalamente a muy bajastemperaturas. F. Hund [Z. Physik, 42 (1927) 93] buscó una explicación basada en los requisitos de simetría de lafunción de onda total. Los dos núcleos Ha y Hb son protones y tienen espín nuclear I = 1/2. Por lo tanto, lafunción de onda completa

Ψ = ψtras ψvib ψrot ψelec ψnucl, (104)

debe ser antisimétrica frente al intercambio de un núcleo por otro, dejando inalterados los electrones delsistema. Sólo las componentes rotacional y nuclear de Ψ se ven afectadas por el cambio de núcleos:

ψrot es (a) simétrica en los estados de J par (J = 0, 2, 4, ...), y (b) antisimétrica en los de J impar (J =1, 3, 5, ...);ψnucl, por su parte, puede ser

simétrica si los espines de ambos núcleos se acoplan para producir un triplete, αα, ββ, (αβ +

βα)/√

2;antisimétrica si los espines nucleares se acoplan dando un singlete, (αβ − βα)/

√2.

Por lo tanto, las funciones rotacional y nuclear pueden existir en dos formas compatibles:

para-hidrógeno (p-H2), formada por moléculas con J par y espines nucleares acoplados en un singlete,orto-hidrógeno (o-H2), cuyas moléculas tiene J impar y espines nucleares acoplados en triplete.


orto- y para-H2) II

En el equilibrio, la función de partición roto-nuclear del H2 será

qrot−nucl = gpara︸︷︷︸=1

∞∑J=0par

(2J + 1)e−J(J+1)θr/T+ gorto︸︷︷︸

=3

∞∑J=1impar

(2J + 1)e−J(J+1)θr/T, (105)

donde gpara y gorto son las degeneraciones asociadas al estado de acoplamiento de los núcleos. A partir de estafunción de partición se obtiene fácilmente la capacidad calorífica, que difiere marcadamente de las medidasexperimentales.En 1927, esta discrepancia sirvió como una fuerte evidencia en contra de la incipiente mecánica cuántica hastaque P. M. Denison [Proc. Royal Soc. (London) A115 (1927) 483] logró explicar satisfactoriamente la anomalía.En condiciones de equilibrio, la proporción de moléculas de orto- y parahidrógeno será

Norto

Npara=

3∑impar

J=1 (2J + 1)e−J(J+1)θr/T

1∑par

J=0(2J + 1)e−J(J+1)θr/T. (106)

En el límite de T → 0, todas las moléculas estarán en el estado J = 0 y, por tanto, tendremos p-H2. AT > 200 K, la degeneración nuclear será dominante y tendremos una proporción 3:1 de orto:para. Pero éstosólo es cierto si hay equilibrio termodinámico entre ambas formas. Denison conjeturó que la conversión entrelas formas orto y para es lenta, lo bastante para que la mezcla con la que se comience el experimentomantenga su composición a todas las temperaturas. Por lo tanto, si comenzamos con el gas ambiente ordinario,su capacidad calorífica rotonuclear debería ser 0,25Cpara

V + 0,75CortoV , y esta ecuación explica perfectamente los

experimentos ordinarios.Posteriormente se comprobó que la mezcla ambiente puede ser mantenida a temperaturas muy bajas duranteperíodos de años sin que se produzca un cambio apreciable en su composición. La razón de que la conversiónorto-para sea dificil proviene de la obligada conservación del momento angular. Básicamente, un tercer cuerpodebe recibir el momento angular del que se desprende la molécula de H2. Impurezas paramagnéticas, sin


orto- y para-H2) III

embargo, actúan como catalizadores en el intercambio orto-para, y esto permite en la práctica obtener p-H2puro y medir sus propiedades.La conversión de la mezcla ambiente en parahidrógeno a muy bajas temperaturas desprende una gran cantidadde calor (670 J/g), sobre todo en comparación con el calor latente de evaporación (440 J/g). Por ello, latransformación a parahidrógeno es responsable de graves pérdidas en el almacenamiento de hidrógeno líquido:hasta un 30 % en 48h, 56 % en 170h, 68 % en 3500h. Para evitarlo, se introducen catalizadores paramagnéticosque favorecen la conversión en parahidrógeno mientras se produce la liquefación. Por ejemplo, en presencia deCrO3 el tiempo de vida media del ortohidrógeno a 30 K pasa desde años a ≈5 min.Otras moléculas diatómicas homonucleares pueden tener comportamientos de similar complejidad, pero senecesita una θr suficientemente alta y que el sistema se mantenga como gas en las cercanías de T ≈ θr . El D2cumple también las condiciones y está bien estudiado.

núclido 1H 2H 3H 12C 13C 14N 15N 16O 17O 18OI 1/2 1 1/2 0 1/2 1 1/2 0 5/2 2

abundancia ( %) 99.985 0.015 — 98.89 1.11 99.634 0.366 99.762 0.038 0.200


orto- y para-H2) IV


orto- y para-H2) V


orto- y para-H2) VI


Para temperaturas superiores a ≈ 1,5θr la función de partición rotacional se puede simplificar sustituyendo lasuma por una integración sobre J. El resultado es que para una molécula diatómica homonuclear:

qrot ≈12

Tθr, (107)

donde el factor 1/2 proviene de que sólo la mitad de los estados rotacionales contribuye en cualquiera que sea elestado nuclear.Esta expresión se puede generalizar a moléculas poliatómicas:

qrot ≈1σ

Tθr

para una molécula lineal, (108)

qrot ≈1σ

(πT3

θaθbθc

)1/2

para una molécula no lineal, (109)

donde σ es el número de simetría, y equivale al número de diferentes configuraciones nucleares que sepueden alcanzar empleando exclusivamente rotaciones. De modo alternativo, σ equivale al número deoperaciones que son rotaciones puras (no rotaciones impropias) en el grupo puntual molecular. Lastemperaturas características de rotación provienen de los tres momentos de inercia independientes que tiene,como máximo, una molécula poliatómica:

Ae =h

8π2Ia, Be =

h8π2Ib

, Ce =h

8π2Ic, θa =

hAe

kB, θb =

hBe

kB, θc =

hCe

kB. (110)

CO2 H2O NH3 ClO2 SO2 N2O NO2 CH4 CH3Cl CCl4Sim. D∞h C2v C3v C2v C2v C∞v C2v Td C3v Td

σ 2 2 3 2 2 1 2 12 3 12θa (K) 0.561 40.1 13.6 2.50 2.92 0.603 11.5 7.54 7.32 0.0823θb (K) — 20.9 13.6 0.478 0.495 — 0.624 7.54 0.637 0.0823θc (K) — 13.4 8.92 0.400 0.422 — 0.590 7.54 0.637 0.0823


En función de sus propiedades rotacionales las moléculas se denominan:

trompoesféricas si θa = θb = θc. La presencia de dos o más ejes de simetría Cn>2 obliga a este compor-tamiento.tromposimétricas si dos de las temperaturas de rotación coinciden. Este fenómeno suele ser consecuen-cia de la existencia de un único eje de simetría Cn>2. Si θa = θb > θc se trata de un trompo achatado, yse denomina trompo alargado si θa > θb = θc.trompoasimétricas si θa > θb > θc. Este es el comportamiento de las moléculas que poseen, comomáximo, ejes de rotación binarios.


Equilibrio químico entre gases ideales I

Sea una reacción en equilibrio aA + bB pP + qQ, ó mejor∑

i νiXi = 0, donde νi es el coeficienteestequimétrico del reactante i-ésimo, con el convenio de que νi < 0 para los reactivos y νi > 0 para losproductos.Por la condición general de equilibrio la actividad química debe ser nula:

∑i νiµi = 0, donde µi es el potencial

químico del reactante.Si todos los componentes se pueden describir como gases ideales, la función de partición canónica de lamezcla reactante será:

Q(NA,NB, ..., T, V) =qA(V, T)NA

NA!

qB(V, T)NB

NB!... (111)

de manera que el potencial químico del gas A en la mezcla será

µA = −kBT(∂ ln Q∂NA

)T,V,Nj 6=A

= −kBT lnqA(T, V)

NA. (112)

Sustituyendo la forma del potencial químico en la ecuación general del equilibrio:

0 =∑

i

νiµi = −kBT∑

i

νi lnqi

Ni= −kBT

∑i

ln(

qi

Ni

)νi= −kBT ln

∏i

(qi

Ni

)νi, (113)

de donde ∏i

(qi

Ni

)νi= 1 =⇒

∏i

(qi

V

)νi=∏

i

(Ni

V

)νi= Kc, (114)

siendo Kc la constante de equilibrio expresada en términos de concentraciones ci = Ni/V.La función de partición molecular de un gas ideal es lineal en V, de modo que qi(V, T)/V y, por lo tanto Kc, essólo función de la temperatura.


Equilibrio químico entre gases ideales II

En gases es frecuente expresar la constante de equilibrio en términos de presiones parciales de loscomponentes, pero piV = NikBT, y

Kp =∏

i

pνii = (kBT)

∑i νi∏

i

(Ni

V

)νi= (kBT)

∑i νi Kc(T). (115)

Ej: Equilibrio en el vapor de sodio

REACCIÓN: 2Na Na2. (116)

CONSTANTE DE EQUILIBRIO: Kc(T) =qNa2/V

(qNa/V)2, Kp =

pNa2

p2Na

=1

kBTKc(T). (117)

FUNCIONES DE PARTICIÓN: qNa =

(2πmNakBT

h2

)3/2

Vqel, (118)

qNa2 =

(2π2mNakBT

h2

)3/2

VT

2θr

geleD0/kBT

1− e−θv/T, (119)

DATOS DEL NA: mNa = 22,989768 g/mol = 3,81754× 10−22 g. Estado fundamental 2S1/2 (gel = 2) y primerexcitado a 16000 cm−1, que podemos ignorar.DATOS DEL NA2 : θr = 0,221 K, θv = 229 K, D0 = 17,3 kcal/mol, D0/kB = 8706 K. Estado fundamental 1Σ+

g(gel = 1) y estados electrónicos a energías muy elevadas, que podemos ignorar.


Ejercicios I

1 Sea un gas formado por NA partículas de A, NB partículas de B, etc. Supongamos que las interaccionesentre partículas son nulas o despreciables. Determina la función de partición canónica del gas en términosde las funciones de partición moleculares qA(V, T), qB(V, T), ...

2 Haciendo uso de la ecuación de estado del gas ideal y del principio de equipartición de la energía, calcula larazón entre el número de partículas y el de estados accesibles, N/Φ(ε), para los gases nobles: He, Ne, Ar,Kr, Xe. Varía la temperatura en el rango 10–300 K, y la presión en el rango 0.1–10 atm. Dibuja en gráficostus resultados más interesantes.

3 Calcula la población, relativa a la del nivel fundamental, de un nivel excitado situado 10, 100, 1000, 10000 cm−1

por encima de aquél. Supón que no hay degeneración y que la temperatura es 300 K.4 Considera un átomo de He moviéndose en una sóla dimensión y encerrado en una caja de 1 cm de lado.

De acuerdo con el principio de equipartición de la energía en el equilibrio térmico εtras = 12 kBT. Determina

el valor de número cuántico n para T = 300 K. Determina también el valor del cociente ∆ε/kBT si ∆ε es ladiferencia de energía entre los estados n y n + 1. Repite el cálculo para los átomos de Ne, Ar y Kr, y paralas temperaturas 10 K, 100 K y 1000 K.

5 Examina las dimensiones de Λ =√

h2/2πmkBT. ¿Encuentras una razón para que esta magnitud se deno-mine en ocasiones “longitud de de Broglie del cuanto térmico”? Determina el valor de Λ a 300 K para: unelectrón, un átomo de He, una molécula de benceno, un virus.

6 Considera la molécula de O2. El nivel electrónico fundamental es 3Σ−g , y su energía mínima se tomacomo cero para este ejercicio. Los tres primeros niveles excitados son de simetría 1∆g, 1Σ+

g y 3Σ+u , y

sus energías mínimas se encuentran 0.035915, 0.059783 y 0.162720 Eh, respectivamente, por encima delnivel fundamental. Calcula las temperaturas a las que deberíamos calentar un gas de O2 para conseguirque la población relativa de cada uno de estos niveles alcance un 1 % respecto de la población del nivelfundamental. La frecuencia de vibración del estado electrónico fundamental es νe = 1580 cm−1. Calcula lafracción de moléculas en el estado vibracional fundamental y en el primer excitado a 300 K. La distancia deequilibrio en este estado es de 1.2074 Å. Calcula las poblaciones de los cinco primeros niveles rotacionalesexcitados relativas a la del estado fundamental a 300 K.


Ejercicios II

7 Considera los niveles (no estados) de energía ε1, ε2, ... en orden creciente de energías. ¿En qué circuns-tancias es posible que en un sistema en equilibrio haya más moléculas en el nivel ε2 que en el ε1?


Lección 3: COLECTIVOS Y FUNCIONES DE PARTICIÓN MOLECULARES

El colectivo canónico. Relación de Q con q en un gas ideal. Niveles de energía

molecular. Función de partición rotacional: diatómicas. Función de partición

rotacional: poliatómicas. Función de partición vibracional. El teorema de

equipartición. Función de partición electrónica.

En esta lección vamos a dar los conceptos y expresiones matemáticas que permiten

relacionar la descripción microscópica de las moléculas individuales con las

propiedades macroscópicas de un conjunto de moléculas.

El colectivo canónico

Un colectivo o conjunto es una colección de unidades idénticas o réplicas de un

sistema. Por ejemplo, un mol de agua se puede concebir como un conjunto de un

número de Avogadro de unidades idénticas de moléculas de agua. El colectivo

proporciona el marco teórico que sirve para relacionar las propiedades

microscópicas de la materia con las correspondientes propiedades

termodinámicas del sistema, tal y como expresa el siguiente postulado:

El valor medio de una propiedad del conjunto corresponde al valor promediado en el

tiempo de la correspondiente propiedad macroscópica del sistema.

Esto significa que si medimos al mismo tiempo el contenido de energía de cada una

de las unidades que constituyen un conjunto, la energía media del conjunto

obtenida a partir de estas energías será equivalente a la energía media del

conjunto, medida a lo largo del tiempo. Esta idea, formulada por primera vez por J.

W. Gibbs a finales de 1800, es el núcleo de la Termodinámica Estadística.

Para conectar los valores medios del colectivo con las propiedades

termodinámicas, comenzamos imaginando una colección de copias idénticas del

sistema, como se ilustra en la Figura 3.1. Estas copias del sistema se mantienen

fijas en el espacio, de forma que son distinguibles. El volumen, V, la temperatura, T,

y el número de partículas de cada sistema, N, son constantes. Un colectivo o

conjunto en el que V, T y N son constantes se conoce como conjunto canónico. El

término canónico significa “por la práctica común” debido a que este es el conjunto

que se emplea, salvo que el problema de interés requiera que se mantengan

constantes otras variables. Por ejemplo, si N, V y la energía se mantienen fijas, el

correspondiente colectivo se denomina microcanónico. Sin embargo, para los

propósitos de esta asignatura es suficiente el conjunto canónico.

Figura 3.1. Representación de un colectivo canónico. Las flechas indican que el

conjunto está compuesto por un número infinito de copias del sistema.

En el colectivo canónico, cada miembro del conjunto se introduce en un baño a

temperatura tal que la energía del conjunto total es constante. Las paredes que

definen el volumen de las unidades pueden conducir el calor, permitiendo el

intercambio de energía con el medio. Por analogía con lo que vimos en la lección

anterior, la energía total del colectivo, Ec, está dada por

∑ (3.1)

donde a(c)i son los números de ocupación correspondientes al número de

miembros del conjunto que tienen energía Ei. El peso, Wc, asociado a una

configuración de energía específica de los Nc miembros del conjunto, está dado por

!∏ !

(3.2)

y la probabilidad de encontrar una unidad del conjunto con energía Ei es

(3.3)

donde Wi se puede interpretar como el número de estados presentes con una

energía dada Ei. La cantidad Q de la ecuación (3.3) se conoce como función de partición canónica y se define como:

∑ (3.4)

donde el sumatorio se extiende a todos los niveles de energía.

La probabilidad definida en la ecuación (3.3) depende de dos factores: número de

estados presentes con una energía dada (Wi) y término de Boltzmann que describe

la probabilidad de que una unidad del conjunto tenga energía Ei (e-βEi/Q). La Figura

3.2 describe el comportamiento de cada factor con la energía. El primer factor

aumenta con la energía mientras que el segundo factor decrece exponencialmente.

El producto de estos términos pasa por un máximo correspondiente a la energía

del conjunto medio. Esto significa que las unidades individuales del conjunto

tendrán una energía igual o muy próxima a la energía media, <E>, y que serán muy

raras las unidades que tengan una energía alejada de ese valor. Por ejemplo, si

consideramos una piscina de baño llena de agua, dividida en unidades de un litro,

la temperatura medida en una de esas unidades de la piscina es suficiente para

caracterizar la temperatura del agua en cualquier parte de la piscina.

Figura 3.2. Variación de la probabilidad de que un miembro del colectivo tenga

una energía dada Ei con dicha energía.

Dado que la gran mayoría de sistemas del conjunto tienen energía <E>, las

propiedades termodinámicas de la unidad son representativas de las propiedades

termodinámicas del colectivo, demostrándose así la relación entre las unidades

microscópicas y el conjunto macroscópico. Para expresar matemáticamente esta

conexión, se debe relacionar la función de partición canónica, Q, con la función de

partición que describe los miembros individuales del colectivo o conjunto, q.

Relación de Q con q en un gas ideal

Consideremos, tal y como se muestra en la Figura 3.3, un colectivo constituido por

dos sistemas distinguibles A y B. Cada uno de estos sistemas está constituido por

partículas “ideales” independientes cuyas interacciones son despreciables (por

ejemplo, un gas ideal). La función de partición Q de este colectivo viene dada por

∑ ∑ !"## (3.5)

donde εAn y εBn son los niveles de energía asociados a las unidades A y B,

respectivamente.

Figura 3.3. Colectivo constituido por dos unidades A y B distinguibles.

La suma sobre los niveles de energía del colectivo de la ecuación (3.5) puede

reproducirse considerando todos los niveles energéticos individuales de cada

sistema. Así, en lugar de sumar sobre los niveles energéticos i del colectivo,

podemos sumar sobre todos los niveles individuales del sistema A y todos los

niveles individuales del sistema B. En consecuencia, la ecuación (3.5) se

transforma en:

$ !$" % $ !&" % $ !'" % ⋯ (3.6)

%& !$" % & !&" % & !'" % ⋯

%' !$" % ' !&" % ' !'" % ⋯

·········································································

% !$" % !&" % !'" % ⋯

$ % & % ' % ⋯ "!$ % !& % !' % ⋯ "

)*)+ ),

Si las unidades del conjunto son idénticas, las funciones de partición también lo

son. Extendiendo este resultado a un colectivo de N unidades distinguibles, la

función de partición canónica es el producto de las funciones de partición de las

unidades.

) para N unidades distinguibles (3.7)

El tamaño de los sistemas idénticos que componen el conjunto puede ser tan

pequeño como se desee, hasta el punto de ser una única molécula. Tomando el

límite de una única molécula, el colectivo canónico viene a ser el producto de las

funciones de partición molecular definidas tal y como se hizo en la lección anterior.

Esta es la conexión directa entre las perspectivas microscópicas y macroscópicas

que estábamos buscando. Los niveles de energía cuantizados del sistema molecular

(o atómico) están embebidos en la función de partición molecular, q, y esta

función de partición se puede usar para definir la función de partición del

conjunto, Q, que puede relacionarse directamente con las propiedades

termodinámicas del conjunto.

La deducción anterior supone que los miembros del conjunto son distinguibles,

pero ¿qué ocurre en el caso de unidades indistinguibles? Según discutimos en el

caso del estudio de tres osciladores distinguibles situados en tres estados de

energía, la configuración dominante denotada por (2,1,0) consta de seis

microestados: (2,1,0), (2,0,1), (1,2,0), (0,2,1), (1,0,2) y (1,2,0). Sin embargo, si los

tres osciladores son indistinguibles, no hay diferencia entre las disposiciones

anteriores, de modo que sólo contaremos una única disposición de la energía. Por

tanto, en el caso de unidades indistinguibles, el número total de permutaciones se

divide por N! donde N era el número de unidades de la colección. La extensión de

esta lógica a un conjunto molecular obliga a que la función de partición canónica

para partículas indistinguibles tenga la forma siguiente:

-.! para N unidades indistinguibles (3.8)

La ecuación (3.8) es correcta en el límite en que el número de niveles de energía

disponibles es significativamente mayor que el número de partículas. Esta

discusión de Mecánica Estadística está limitada a sistemas en los que esto es cierto,

y la validez de este enunciado se demostrará más tarde en este capítulo. Es

también importante tener en mente que la ecuación (3.8) se limita a sistemas

ideales de partículas que no interaccionan entre sí, tales como las de un gas ideal.

Niveles de energía molecular

La función de partición molecular se puede evaluar considerando los niveles de

energía moleculares. Para moléculas poliatómicas, hay cuatro grados de libertad energéticos a considerar al construir la función de partición molecular: traslación

(tras), rotación (rot), vibración (vib) y electrónico (elec).

Suponiendo que los grados de libertad energéticos no están acoplados, la función

de partición molecular total, que incluye todos esos grados de libertad, se puede

descomponer en un producto de funciones de partición correspondientes a cada

grado de libertad. La energía asociada a un nivel de energía molecular dado, εtotal,

dependerá de las energías de los niveles traslacional, rotacional, vibracional y

electrónico, como sigue:

εtotal = εtras + εrot + εvib + εelec (3.9)

Dado que la función de partición molecular es un sumatorio sobre los niveles de

energía moleculares y teniendo en cuenta la ecuación (3.9), entonces:

)/0/1 ∑ 2/0/134356 (3.10)

∑2/78270/29:21 3;5<6 ;43 => ?6?

∑2/783;5<"270/;43"29:=>"21?6?"

)/78)70/)9:)1

Esta relación demuestra que la función de partición molecular total es

simplemente el producto de las funciones de partición de cada grado de libertad

energético molecular. Usando esta definición para la función de partición

molecular, las relaciones finales son

/0/1 )/0/1 (distinguible) (3.11)

/0/1 @! )/0/1 (indistinguible) (3.12)

A continuación, deduciremos las funciones de partición de cada grado de libertad

de la ecuación (3.10), teniendo en cuenta los resultados de la resolución de la

ecuación de Schrödinger para la partícula en una caja, rotor rígido y oscilador

armónico. Estos sistemas, como veremos, son modelos teóricos aceptables que

ayudan a representar los movimientos moleculares de traslación, rotación y

vibración, respectivamente.

Función de partición traslacional

Los niveles de energía correspondientes al movimiento traslacional de átomos o

moléculas en un recipiente de volumen V vienen dados por las energías de la

partícula en una caja tridimensional. En lugar de trabajar directamente en tres

dimensiones, primero usaremos un modelo unidimensional y después lo

extenderemos a tres dimensiones. Los niveles de energía para una partícula de

masa m que se mueve libremente en una caja monodimensional de longitud a

están descritos en la Figura 3.4.

Figura 3.4. Niveles de energía para la partícula en una caja monodimensional.

Utilizando la expresión de la energía mostrada en la Figura 3.4, la función de

partición traslacional en una dimensión es

)/78,@B ∑ 'C'DE5'F@ (3.13)

Este sumatorio consta de un número infinito de términos y además, no existe una

expresión analítica para esta serie infinita de términos. Por ello, la ecuación (3.13)

tiene que evaluarse considerando todos los términos. Sin embargo, esta tarea

puede simplificarse notablemente analizando el espaciado entre los estados de

energía traslacional del siguiente ejemplo.

PROBLEMA PRÁCTICO 3.1 ¿Cuál es la diferencia de energía entre los estados n=2 y n=1 del oxígeno molecular

que está restringido en una caja unidimensional de longitud 1 cm?

Solución

La diferencia de energía entre los estados puede evaluarse a partir de la expresión

de la Figura 3.4 como sigue:

∆ , − @ 3@ 3ℎ,

8L,

La masa de una molécula de O2 es 5,31 × 10-25 kg de forma que

∆ 36,626 P 10STU V,

85,31 P 10,XY20,01 L, 3,10 P 10SZU

Convirtiendo a unidades cm−1:

∆ 3,10 P 10SZU

ℎ[ 3,10 P 10SZU6,626 P 10STU V2,998 P 10@][L V@

1,57 P 10@X[L@

A 298 K, la cantidad de energía térmica disponible dada por el producto de la

constante de Boltzmann y la temperatura, kT, es 208 cm-1. Claramente, el

espaciado entre los niveles de energía traslacional es extremadamente pequeño en

relación a kT a temperatura ambiente.

Debido a que son accesibles numerosos niveles de energía traslacionales a

temperatura ambiente, el sumatorio de la ecuación (3.13) se puede reemplazar por

una integración con un error despreciable:

)/78 ∑ _#' ≈F@ a _#'bc @,

F] d e

_f@/, (3.14)

siendo

h i'Zj' (3.15)

Sustituyendo α, la función de partición traslacional en una dimensión es

)/78,@B d,eji' f@/, (3.16)

Esta expresión se puede simplificar definiendo la longitud de onda térmica de de Broglie como sigue:

Λ d i' ,ejf (3.17)

de forma que

)/78,@B l 2mLYn@/,

i (3.18)

Λ es el cociente entre la constante de Planck (h) y el momento promedio clásico (p)

de una partícula de gas.

La extensión del resultado unidimensional a tres dimensiones es directa. Los

grados de libertad traslacional se consideran separables; por tanto, la función de

partición traslacional tridimensional es el producto de las funciones de partición

unidimensional para cada una de las dimensiones:

)/78,SB )/78,o)/78,p)/78,q drl f ds

l f dtl f

d@lfS op"q d@

lfS u

)/78,SB vlw 2mLYnS/, v

iw (3.19)

donde V es el volumen. En la ecuación (3.19) puede observarse que la partición

traslacional es función de V y T. Según vimos, la función de partición proporciona

una medida del número de estados de energía disponibles del sistema a una

temperatura dada. El aumento de qtras con el volumen refleja el hecho de que

conforme el volumen crece, el espaciado de los niveles de energía traslacional

decrece de forma que hay más estados disponibles para poblar a una T dada. El

pequeño espaciado de energía entre los niveles de energía traslacionales con

relación a kT a temperatura ambiente sugiere que a temperatura ambiente son

accesibles un número significativamente alto de estados de energía traslacional.

Función de partición rotacional: diatómicas

Los niveles energéticos de la función de partición rotacional vienen descritos por la

solución de la ecuación de Schrödinger para el rotor rígido. Por simplicidad,

consideremos una molécula diatómica (véase Figura 3.5) cuya longitud de enlace

(r) se supone que permanece constante durante el movimiento rotacional y se

desprecian efectos tales como la distorsión centrífuga.

Figura 3.5. Representación esquemática de una molécula diatómica.

Dentro de la aproximación del rotor rígido, la energía de un estado rotacional

dado, EJ, de una molécula diatómica viene dada por:

x ℎ[yUU % 1 U 0, 1, 2, … (3.20)

donde J es el número cuántico rotacional y B es la constante rotacional dada por

y iZe' (3.21)

donde I es el momento de inercia, que es igual a

| ~, (322)

siendo r la distancia que separa los dos centros atómicos y µ la masa reducida

definida como

j&j'j& j'

(323)

Las moléculas diatómicas difieren dependiendo de las masas de los átomos de la

molécula y de la longitud de enlace, por lo que el valor de la constante rotacional

depende de la molécula.

Sustituyendo la ecuación (3.21) en la forma general de la función de partición

molecular llegamos a la función de partición rotacional siguiente:

)70/ ∑ 2xi+xx @x (3.24)

donde gJ es la degeneración del nivel de energía rotacional, o sea, el número de

estados rotacionales presentes en un nivel de energía dado. Para determinar la

degeneración, debemos recordar que en el estudio mecano-cuántico del rotor

rígido, la ecuación de Schrödinger independiente del tiempo

70/70/ 70/70/ (3.25)

el hamiltoniano (70/) es proporcional al cuadrado del momento angular total, ,.

Los estados propios de este operador son los armónicos esféricos, con los

siguientes valores propios:

,70/ ,1,j, i'Te' % 11,j, (3.26)

siendo l un número cuántico correspondiente al momento angular total que toma

valores enteros desde cero hasta infinito. Los armónicos esféricos son también

funciones propias del operador correspondientes a la componente z del momento

angular. Los valores propios correspondientes empleando el operador q están

dados por

q1,j, i,e L11,j, (3.27)

donde ml es otro número cuántico cuyos valores posibles están descritos por el

número cuántico l:

ml = -l, -l+1, …, 0, …, l-1, l (3.28)

Todos los valores de ml correspondientes a un número cuántico dado l tienen el

mismo momento angular y, en consecuencia, la misma energía. Por tanto, la

degeneración de los niveles de energía rotacional es (2l + 1), de modo que la

función de partición rotacional queda como:

)70/ ∑ 2U % 1i+xx @x (3.29)

La Figura 3.6 muestra una serie de niveles de energía rotacionales, en unidades de

B, cuyos espaciados son múltiplos de B. La Tabla 3.1 muestra valores

representativos de B para varias moléculas diatómicas. La inspección de la tabla

revela unas cuantas tendencias de interés. En primer lugar, la constante rotacional

depende de la masa atómica, con un crecimiento en unidades atómicas que

produce una reducción de la constante rotacional. En segundo lugar, los valores de

B son muy diferentes; por tanto, cualquier comparación de las energías de los

estados rotacionales con kT dependerá de la molécula diatómica de interés. Por

ejemplo, a 298 K, kT = 208 cm-1, que es aproximadamente igual a la energía del

nivel J = 75 del I2. Para estas especies, los espaciados de los niveles de energía

claramente son mucho más pequeños que kT y, por tanto, el sumatorio de la

ecuación (3.29) puede transformarse en una integral. Sin embargo, para el H2 el

nivel de energía J = 2 es mayor que kT de forma que la evaluación de la función de

partición tendría que hacerse considerando el sumatorio de la ecuación (3.29), en

lugar de la integral. De aquí en adelante, a no ser que se indique lo contrario,

suponemos que la integración de la función de partición rotacional es apropiada.

Figura 3.6. Esquema de los niveles de energía rotacionales en unidades de B.

Tabla 3.1. Constantes rotacionales de algunas moléculas diatómicas

representativas.

Molécula B (cm-1) Molécula B (cm-1) H35Cl 10,595 H2 60,853

H37Cl 10,578 14N16O 1,7046

D35Cl 5,447 127I127I 0,03735

En el caso de que los espaciados de los niveles de energía sean pequeños con

relación a kT, la función de partición rotacional a evaluar será:

)70/ a 2U % 1i+xx @bUF] (3.30)

Sabiendo que

x i+xx @" −ℎ[y2U % 1i+xx @ (3.31)

La ecuación (3.30) se puede reescribir y el resultado es el siguiente:

)70/ d @i+f a −ℎ[y2U % 1i+xx @bUF

]

d @i+f i+xx @]

F @i+

)70/ @i+

i+ (3.32)

Números de simetría

La función de partición rotacional que hemos obtenido para una molécula

heterodiatómica debe corregirse en el caso de molécula homodiatómicas. La Figura

3.7 muestra el motivo de esta corrección. Una rotación de 180° en torno a un eje

perpendicular al eje de enlace de una molécula heterodiatómica como, por

ejemplo, HCl produce especies que son distinguibles de la molécula antes de la

rotación. Sin embargo, la misma rotación aplicada a una molécula homodiatómica

como, por ejemplo, N2 produce una configuración que es equivalente a la forma

antes de la rotación.

Figura 3.7. Ilustración de una rotación de 180° en moléculas heterodiatómicas y

homodiatómicas.

Este comportamiento diferente es similar a las diferencias entre funciones de

partición canónica para unidades distinguibles e indistinguibles. En el caso de la

función de partición, el resultado del caso distinguible se divide por N! para tener

en cuenta el contaje en exceso de los microestados no únicos obtenidos cuando las

unidades son indistinguibles. Análogamente, el número de estados rotacionales

para las especies homodiatómicas (es decir, configuraciones rotacionales

indistinguibles) está sobreestimado en un factor 2. Por ello, nuestra función de

partición rotacional se divide por el número de configuraciones rotacionales

equivalentes. Este factor se conoce como número de simetría, σ, y se incorpora a

la función de partición como sigue:

)70/ i+ (3.33)

El concepto de número de simetría se puede extender también a moléculas con

más de dos átomos. Por ejemplo, consideremos una molécula piramidal trigonal,

como NH3 (véase Figura 3.8). Una rotación de 120° en torno a un eje que pasa a

través del átomo de nitrógeno y del centro del triángulo que forman los tres

hidrógenos genera una configuración que es exactamente equivalente a la

configuración inicial. Una segunda rotación de 120° produce una tercera

configuración, idéntica a las dos anteriores. Finalmente, una tercera rotación de

120° acaba dando la configuración inicial. Por tanto, el NH3 tiene tres

configuraciones rotacionales equivalentes; y en consecuencia, σ = 3.

Figura 3.8. Configuraciones rotacionales del NH3.

Poblaciones de los niveles rotacionales y Espectroscopía

Teniendo en cuenta la ecuación (3.29), la probabilidad de ocupación de un nivel de

energía rotacional dado, pJ, viene dada por

x C!&-;43

,x @C!&-;43

(3.34)

Las poblaciones de los diferentes niveles de energía rotacional están relacionadas

con las intensidades de absorción infrarroja de vibración-rotación. A modo de

ejemplo, consideremos la molécula H35Cl, con B = 10,595 cm-1. A 300 K la función

de partición rotacional para H35Cl es

)70/ i+ @,SZ o @]'wx &"S]]

@,, o @]wx 8,,Z o @]&$j 8&@],XX j& 19,7 (3.35)

A partir del resultado de la ecuación (3.35) y utilizando la ecuación (3.34), se

obtienen las probabilidades de los niveles reflejados en la Figura 3.9. La Figura

3.10 muestra la intensidad de las transiciones de las ramas P y R que son

proporcionales a la probabilidad de ocupación de un nivel J dado. Esta

dependencia se refleja en la evolución de la intensidad de las transiciones de

vibración rotación en función de J. El momento de la transición muestra una

dependencia modesta de J, así como que la correspondencia entre la intensidad de

la transición y la población de los niveles rotacionales no es exacta.

Figura 3.9. Variación de la probabilidad de ocupación de un nivel de energía

rotacional, pJ, con el número cuántico rotacional J para H35Cl a 300 K.

Figura 3.10. Espectro de absorcion infrarroja simulado a 300 K. Los dos índices

encima de los picos se refieren a los valores de J inicial y final. La región del

espectro con ΔJ = +1 (alta frecuencia) es la rama R, y la region del espectro con ΔJ

= -1 (baja frecuencia) es la rama P.

Los estados rotacionales del H2

La distribución de los niveles rotacionales del H2 proporciona un ejemplo de la

influencia de la simetría molecular en la función de partición. El hidrógeno

molecular existe en dos formas, una en la que los espines nucleares están

apareados (para hidrógeno) y otra en la que los espines están alineados (orto

hidrógeno). Debido a que los núcleos de hidrógeno son partículas de espín 1/2,

son fermiones. El principio de exclusión de Pauli impone que cuando dos

fermiones idénticos intercambian la posición, la función de onda total que describe

el sistema debe ser antisimétrica (o cambiar el signo) para el intercambio. En este

caso la función de onda se puede separar en un producto de las componentes de

espín y rotacional. Consideremos, en primer lugar, la componente de espín. En el

caso del para hidrógeno, la rotación intercambia los dos núcleos (A y B) que tienen

espín opuesto (α y β), de forma que la componente de espín de la función de onda

será antisimétrica para el intercambio de los núcleos debido a la rotación. Este

requerimiento se satisface usando la siguiente combinación lineal de los estados de

espín nuclear:

8í#,7 hy − hy

El intercambio de las etiquetas nucleares A y B correspondientes a la rotación hará

que la función de onda anterior cambie de signo de forma que la componente de

espín de la función de onda del para hidrógeno será antisimétrica con respecto al

intercambio. Para el orto hidrógeno, la rotación produce el intercambio de los dos

núcleos del mismo espín; por tanto, la función de onda de espín será simétrica.

Este requerimiento lo reúnen tres combinaciones de los estados de espín nuclear:

8í#,07/0 hhy, y, hy % hy

En resumen, la componente de espín de la función de onda es antisimétrica con

respecto al intercambio de los núcleos del para hidrógeno, pero simétrica para el

orto hidrógeno. A continuación, consideremos la simetría de la componente

rotacional de la función de onda. Se puede demostrar que la simetría de los estados

rotacionales es dependiente del número cuántico rotacional, J. Si J es un entero par

(J = 0, 2, 4, 6, …), la correspondiente función de onda rotacional es simétrica con

respecto al intercambio, y si J es impar (J = 1, 3, 5, 7, … ) la función de onda es

antisimétrica. Debido a que la función de onda es el producto de las componentes

de espín y rotacional, este producto debe ser antisimétrico. Por tanto, la función de

onda rotacional del para hidrógeno está restringida a los niveles de J par, y para el

orto hidrógeno está restringida a los niveles J impar. Finalmente, la degeneración

del estado de espín nuclear para el orto y para hidrógeno es tres y uno,

respectivamente. Por tanto, los niveles de energía rotacional del orto hidrógeno

tienen una triple degeneración adicional. Una muestra de hidrógeno molecular

contendrá ambos orto y para hidrógeno, de forma que la función de partición

rotacional es

)70/ @T 1 ∑ 2U % 1i+xx @ % 3 ∑ 2U % 1i+xx @@,S,X,…],,,T,… (3.36)

El primer término del corchete de la ecuación (3.36) corresponde al para

hidrógeno y el segundo término al orto hidrógeno. En esencia, esta expresión de

qrot representa al H2 medio que consta de una parte de para hidrógeno y tres

partes de orto hidrógeno. En la ecuación (3.36) se omite el número de simetría

porque la sobreestimación de los niveles rotacionales permitidos ya se ha tenido

en cuenta restringiendo las sumas a J par o impar. A altas temperaturas, el valor de

qrot determinado usando la ecuación (3.36) será, en buena aproximación, igual al

obtenido usando la ecuación (3.33) con σ = 2.

La temperatura rotacional

El que la función de partición rotacional se evalúe por suma directa o por

integración depende completamente del tamaño del espaciado de energía

rotacional relativo a la cantidad de energía térmica disponible (kT). Esta

comparación se facilita mediante la introducción de la temperatura rotacional, Θrot, definida como la constante rotacional dividida por la constante de Boltzmann:

70/ i+ (3.37)

Del análisis de las unidades de la ecuación (3.37) se deduce que Θrot tiene unidades

de temperatura. Podemos reescribir la expresión de la función de partición

rotacional en términos de la temperatura rotacional como sigue:

)70/ i+

;43 (3.38)

Una segunda aplicación de la temperatura rotacional es como una métrica

comparativa de la temperatura a la que se evalúa la función de partición. La Figura

3.11 presenta una comparación entre qrot para el H35Cl (Θrot = 15,24 K)

determinada mediante suma discreta, ecuación (3.29), y usando la forma integrada

de la función de partición, ecuación (3.33). A bajas temperaturas, hay diferencias

significativas entre ambos resultados. A temperaturas elevadas, los resultados de

la suma son mayores que los resultados integrados; sin embargo, ambos resultados

predicen que qrot crece linealmente con la temperatura. A temperaturas elevadas,

el error al usar el resultado integrado es tal que para la temperatura a la que T ≥10,

es razonable el uso de la forma integrada de la función de partición rotacional. La

forma integrada de la función de partición se refiere como el límite a alta T,

porque es aplicable cuando kT es significativamente mayor que el espaciado de

energía rotacional.

Figura 3.11. Comparación de qrot para H35Cl (Θrot = 15,24 cm-1) determinada

mediante suma y por integración.

Función de partición rotacional: poliatómicas. En los sistemas diatómicos hay dos momentos de inercia no nulos como se ilustra

en la Figura 3.12. Para moléculas poliatómicas (más de dos átomos) la situación

puede llegar a ser más compleja. Si el sistema poliatómico es lineal, sólo hay, de

nuevo, dos momentos de inercia que no se anulan, de forma que una molécula

poliatómica lineal se puede tratar usando el mismo formalismo de las moléculas

diatómicas. Sin embargo, si la molécula poliatómica no es lineal, entonces hay tres

momentos de inercia no nulos. Por tanto, la función de partición que describe los

niveles de energía rotacionales debe tener en cuenta la rotación en torno a los tres

ejes. La deducción de esta función de partición no es trivial; por tanto, aquí

establecemos el resultado sin deducción:

)70/ √e d @

i+f@/, d @

i+!f@/, d @

i+f@/,

(3.39)

El subíndice de B en la ecuación (3.39) indica el correspondiente momento de

inercia como se muestra en la Figura 3.12 y σ es el número de simetría discutido

anteriormente. Además, se hace la suposición de que la poliatómica es “rígida”

durante el movimiento rotacional. El desarrollo de la función de partición

rotacional para sistemas diatómicos proporciona alguna intuición sobre el origen

de esta función de partición. Se puede entender que cada momento de inercia

contribuye con (βhcB)-1/2 a la función de partición total. En el caso de diatómicas o

poliatómicas lineales, los dos momentos de inercia que no se anulan son

equivalentes, de forma que el producto de la contribución de cada momento acaba

en la expresión para la diatómica deducida anteriormente. Para los sistemas

poliatómicos no lineales, la función de partición es el producto de la contribución

de cada uno de los momentos de inercia, que puede o no ser equivalente, como se

indica por los subíndices de las correspondientes constantes rotacionales en la

función de partición presentada anteriormente.

Figura 3.12. Momentos de inercia de moléculas diatómicas y poliatómicas.

Función de partición vibracional

Según el modelo del oscilador armónico, cada grado de libertad vibracional está

caracterizado por un potencial cuadrático (véase Figura 3.13) cuyos niveles de

energía son

# ℎ[ dc % @,f c 0, 1, 2, … (3.40)

donde la frecuencia del oscilador, o frecuencia vibracional, está dada por en

unidades de cm-1. En consecuencia, la función de partición asociada al movimiento

molecular vibracional, representado por el oscilador armónico, viene expresada

como:

)9: ∑ F] ∑ i¡¢d# &'f i¡¢/, ∑ i¡¢#F]F] (3.41)

Figura 3.13. Variación de la energía potencial del oscilador armónico utilizado

como modelo del movimiento vibracional de las moléculas.

Dado que el sumatorio de la ecuación (3.41) se puede expresar como:

∑ #_oF#£] @@¤r (3.42)

La función de partición vibracional (3.41) se transforma en:

)9: C¥¢/'@C¥¢ (3.43)

Esta expresión es ventajosa para redefinir los niveles de energía vibracionales, de

forma que E0 = 0. En otras palabras, disminuimos la energía de todos los niveles en

una cantidad igual a la energía del punto cero. ¿Por qué es ventajoso hacer esto?

Consideremos el cálculo de la probabilidad de ocupación de un nivel de energía

dado, pn, como sigue:

# -=>

C¥¢&'

?C¥¢/'&?C¥¢

C¥¢/'C¥¢?C¥¢/'&?C¥¢

i¡¢#1 − i¡¢" (3.44)

En la ecuación (3.44) se cancelan las contribuciones de la energía del punto cero

tanto en el nivel de energía como en la función de partición. Por tanto, la energía

relevante para determinar pn no es la energía absoluta de un nivel dado, sino la

energía relativa del nivel. Dado esto, simplemente podemos eliminar la energía del

punto cero, acabando en la siguiente expresión para la función de partición

vibracional:

)9: @@C¥¢ (3.45)

Es importante la consistencia incluyendo o no la energía del punto cero. Por

ejemplo, ¿qué ocurre si efectuamos el cálculo de la probabilidad presentado

anteriormente, incluyendo la energía del punto cero del estado vibracional de

interés, pero no incluyendo la energía del punto cero en la expresión para la

función de partición vibracional? Procediendo como antes, llegamos al siguiente

resultado incorrecto:

# -=>

C¥¢&'

&&?C¥¢

C¥¢/'C¥¢&

&?C¥¢ i¡¢#i¡¢#1 − i¡¢" (3.46)

En esta ecuación se pone de manifiesto que los términos de la energía del punto

cero no se cancelan como en el caso previo, reflejando el hecho de que la energía

del estado n está definida de forma diferente con relación a la función de partición.

En resumen, una vez que se ha tomado una decisión acerca de incluir o ignorar la

energía del punto cero, la aproximación tomada debe aplicarse consistentemente.

La función de partición vibracional en moléculas poliatómicas

La expresión de la función de partición vibracional deducida anteriormente es para

un único grado de libertad y es suficiente para moléculas diatómicas. Sin embargo,

las moléculas con más de dos átomos requieren una forma diferente de función de

partición que tenga en cuenta todos los grados de libertad vibracional. Para definir

la función de partición vibracional de poliatómicas, primero necesitamos saber

cuántos grados de libertad vibracional hay. Una molécula poliatómica consta de N

átomos con un total de 3N grados de libertad, correspondientes a tres grados de

libertad cartesianos de cada átomo. Los átomos están conectados por enlaces

químicos; por tanto, los átomos no son libres para moverse independientemente

unos de otros. En primer lugar, la molécula entera se puede trasladar a través del

espacio; por tanto, tres de los 3N grados de libertad totales corresponden al

movimiento traslacional de la molécula entera. Existe también un grado de libertad

rotacional para cada momento de inercia no nulo. Las poliatómicas lineales tienen

dos grados de libertad rotacional porque hay dos momentos de inercia no nulos

mientras que las no lineales tienen tres grados de libertad rotacional. Los grados

de libertad restantes son vibracionales, de forma que el número de grados de

libertad vibracional son

Poliatómicas lineales: 3N − 5 (3.47)

Poliatómicas no lineales: 3N − 6 (3.48)

Una molécula diatómica se puede interpretar como una poliatómica lineal con N =

2, y las expresiones precedentes disponen que sólo hay un grado de libertad

vibracional, 3(2) - 5 = 1, como se estableció anteriormente. El paso final para

deducir la función de partición de un sistema poliatómico se basa en suponer que

en la aproximación armónica los grados de libertad vibracionales son separables y

cada vibración se puede tratar como un grado de libertad energético separado.

Anteriormente hemos visto que varias formas de separar la energía molecular, de

modo que la función de partición molecular total es simplemente la suma de las

funciones de partición de cada grado de libertad energético. Análogamente, esto se

aplica a los grados de libertad vibracionales donde la función de partición

vibracional total es el producto de las funciones de partición vibracional para cada

grado de libertad vibracional:

)9:/0/1 ∑ )9:SX 0 S£@ (3.49)

donde la función de partición vibracional total es igual al producto de las funciones

de partición vibracional de cada modo vibracional (denotado por el subíndice i).

Por tanto, tendremos 3N - 5 o 3N - 6 funciones de partición de modos específicos

dependiendo de la geometría de la molécula.

La temperatura vibracional

De un modo análogo al desarrollo de la rotación, la temperatura vibracional (Θvib) se define como la frecuencia de un grado de libertad vibracional dada

dividida por k:

9: i¡¢ (3.50)

El análisis de unidades de la ecuación (3.50) indica que Θvib tiene unidades de

temperatura (K). Incorporando este término en la expresión para la función de

partición vibracional se llega a que:

)9: @@C¥¢ @

@C¥¢ ¦§⁄ @@©=> §⁄ (3.51)

Esta forma de la función de partición muestra la relación entre la energía y la

temperatura de un modo más transparente. Concretamente, cuando T se hace

grande en comparación a Θvib, el exponente se hace pequeño y el término

exponencial se aproxima a uno. El denominador de la ecuación (3.51) disminuirá,

de forma que la función de partición vibracional aumentará. Si la temperatura llega

a ser suficientemente grande con relación a Θvib, qvib se puede reducir a una forma

más simple ya que:

o 1 − P % P,

2 − ⋯

Para la función de partición vibracional de la ecuación (3.51), x=-Θvib/T. Cuando T

>> Θvib, x llega a ser suficientemente pequeña como para que sólo los dos primeros

términos se puedan incluir en el desarrollo en serie de e-x, ya que los términos de

orden elevado son despreciables. Sustituyendo en la expresión (3.51), se obtiene:

)9: @@©=> §⁄ @

@d@©=>§ f

=> (3.52)

Este resultado es el límite de alta T para la función de partición vibracional. La

utilización de la ecuación (3.52) para evaluar qvib depende de la frecuencia

vibracional de interés y de la temperatura. La Figura 3.14 proporciona una

comparación para I2 (Θvib=299 K) de la expresión exacta sin energía del punto cero,

ecuación (3.51), con la expresión de qvib a alta T, ecuación (3.52). Análogamente, al

caso de la rotación, los dos resultados son significativamente diferentes a bajas

temperaturas, pero predicen la misma dependencia lineal con T a temperaturas

elevadas. Cuando T ≥ 10Θvib, la diferencia de la fracción a alta T y el resultado

exacto es suficientemente pequeño para que se pueda usar el resultado de alta T

para qvib. Para la mayoría de moléculas, esta temperatura será extremadamente

alta.

Figura 3.14. Variación de la función de partición vibracional (función exacta, línea

roja, y función a alta T, línea naranja) frente a T/Θvib para I2 (Θvib= 299 K).

Degeneración y función de partición vibracional

La función de partición vibracional para una molécula poliatómica es el producto

de las funciones de partición para cada grado de libertad vibracional. Cuando dos o

más grados de libertad vibracional tienen la misma frecuencia, es decir, hay

degeneración, entonces dos o más de estos grados de libertad tendrán el mismo

espaciado de energía vibracional, o la misma temperatura vibracional. La función

de partición total sigue siendo el producto de las funciones de partición de cada

grado de libertad vibracional; sin embargo, los modos vibracionales degenerados

tienen funciones de partición idénticas. Hay dos formas de incorporar los efectos

de la degeneración vibracional en la expresión de la función de partición

vibracional. En primer lugar, se puede usar simplemente la forma existente de la

función de partición sin perder de vista ningún grado de libertad,

independientemente de la frecuencia. Un segundo método es reescribir la función

de partición total como producto de las funciones de partición correspondientes a

una frecuencia vibracional dada e incluir la degeneración en una frecuencia dada,

resultando que la correspondiente función de partición se eleva a la potencia de la

degeneración:

)9:/0/1 ∑ )9:#´£@ (3.53)

donde n´ es el número total de frecuencias vibracionales diferentes, indexadas con

i.

El teorema de equipartición

En el estudio de los movimientos rotacional y vibracional se encontró que cuando

la temperatura es suficientemente alta, la energía térmica disponible (kT) es

mucho mayor que el espaciado de los niveles de energía. En consecuencia, las

expresiones de qrot y qvib a alta T son equivalentes a las expresiones exactas de

dichas funciones de partición. A estas temperaturas elevadas, la naturaleza

cuántica de los niveles de energía llega a no tener importancia y es totalmente

necesaria una descripción clásica de la energía.

La definición de función de partición implica la suma de los niveles de energía

cuantizados, y se podría suponer que hay una expresión clásica correspondiente a

la función de partición en la que se emplee la descripción clásica de la energía del

sistema. Esta expresión existe; sin embargo, su deducción va más allá de las

pretensiones de esta asignatura, de forma que aquí, simplemente establecemos el

resultado. La expresión de la función de partición tridimensional de una molécula

que consta de N átomos es

)1á8 @iw. a··· a bSbPS (3.54)

donde los términos p y x representan el momento y las coordenadas de posición de

cada partícula, respectivamente, con tres dimensiones cartesianas disponibles para

cada término. La integral se multiplica por h-3N, que tiene unidades de (momento x

distancia)-3N de forma que la función de partición es adimensional. H representa el

hamiltoniano clásico y, al igual que el hamiltoniano cuántico, es la suma de las

energías cinética y potencial. Por tanto, e-βH es equivalente a e-βε en nuestra

expresión cuántica de la función de partición molecular.

Teniendo en cuenta el hamiltoniano del oscilador armónico unidimensional con

masa reducida µ y constante de fuerza k:

',® % @

, YP, (3.55)

La función de partición clásica del oscilador armónico unidimensional es

)1á8 @i a b a ¯°'

'± &'o'²bP

=> (3.56)

Este resultado está de acuerdo con la aproximación a alta T de qvib deducida

usando la función de partición cuántica de la ecuación (3.52). Este ejemplo ilustra

la aplicabilidad de la Mecánica Estadística Clásica a los sistemas moleculares

cuando la temperatura es suficientemente alta, de forma que la suma sobre los

estados cuánticos se puede reemplazar por la integración. En estas condiciones de

temperatura, el conocimiento de los detalles cuánticos del sistema no es necesario

porque, cuando evaluamos la ecuación (3.56), no hay implicado nada relacionado

con la cuantización de los niveles de energía del oscilador armónico.

La aplicación de la Mecánica Estadística Clásica a sistemas moleculares a alta

temperatura encuentra aplicación en un interesante teorema conocido como el

teorema de equipartición. Este teorema establece que cualquier término del

hamiltoniano clásico que es cuadrático con respecto al momento o la posición (es

decir, p2 o x2) contribuirá con kT/2 a la energía media. Por ejemplo, el

hamiltoniano del oscilador armónico unidimensional, ecuación (3.55), tiene ambos

términos p2 y x2, de forma que la energía media del oscilador por equipartición

será kT (o NkT para una colección de N osciladores armónicos). Por tanto, el

concepto de equipartición es una consecuencia de la Mecánica Clásica porque, para

un grado de libertad energético dado, el cambio de energía asociado con el paso de

un nivel de energía a otro es significativamente menor que kT. Como discutimos

anteriormente, esto es cierto para los grados de libertad traslacional y rotacional,

pero no para los grados de libertad vibracional a temperaturas relativamente

elevadas.

Función de partición electrónica

Los niveles de energía electrónicos corresponden a las diferentes disposiciones de

los electrones en un átomo o molécula. El átomo de hidrógeno proporciona un

ejemplo excelente de un sistema atómico en el que las energías orbitales están

dadas por:

# − j?Z$'i'#' 109 737 [L@ @

#' c 1, 2, 3, … (3.57)

Esta expresión indica que para el átomo de hidrógeno la energía de un orbital dado

depende del número cuántico n. Además, cada orbital tiene una degeneración 2n2.

Usando la ecuación (3.57), se pueden determinar los niveles de energía del

electrón del átomo de hidrógeno como se ilustra en la Figura 3.15.

Figura 3.15. Energías orbitales del átomo de hidrógeno. (a) Energías orbitales

basadas en la resolución de la ecuación de Schrödinger para el átomo de

hidrógeno. (b) Niveles de energía desplazados 109 737 cm−1, de forma que la

energía orbital más baja es 0.

Desde la perspectiva de la Mecánica Estadística, los niveles de energía del átomo

de hidrógeno representan los niveles de energía de los grados de libertad

energéticos electrónicos, con la correspondiente función de partición, deducida

sumando los niveles de energía. Sin embargo, en lugar de usar las energías

absolutas como se hace en la determinación de la resolución mecano-cuántica del

problema del átomo de hidrógeno, pueden ajustarse los niveles de energía de

forma que la energía asociada al orbital n = 1 sea cero, de forma análoga al ajuste

de la energía del estado fundamental del oscilador armónico a cero, por

eliminación de la energía del punto cero. Con esta redefinición de las energías

orbitales, la función de partición electrónica del átomo de hidrógeno es:

)1 ∑ 2#iF#£@ 2i& % 8i' % 18i' % ⋯ (3.58)

2i]j&" % 8iZ, S]S j&" % 18i³ XTTj&" % ⋯

2 % 8iZ, S]S j&" % 18i³ XTTj&" % ⋯

La magnitud de los términos de la función de partición correspondiente a n ≥ 2

dependerá de la temperatura a la que se evalúa la función de partición. Sin

embargo, puede constatarse que estas energías son muy grandes. Definiendo la

“temperatura electrónica” o Θelec, exactamente de la misma forma que hicimos con

las temperaturas rotacional y vibracional, tenemos que:

1 i

],X j&& (3.59)

Con la definición de E1 = 0 cm-1, la energía del orbital n = 2, E2, es 82 303 cm-1 que

corresponde a Θelec = 118 421 K. Esta es una temperatura extremadamente elevada

y este simple cálculo ilustra la principal diferencia entre los niveles de energía

electrónicos y los demás grados de libertad discutidos hasta aquí. Los grados de

libertad electrónicos se caracterizan, generalmente, por espaciados de los niveles

que son muy grandes con relación a kT. Por tanto, sólo el estado electrónico

fundamental está poblado en una extensión significativa, aunque se conocen

excepciones. Aplicando esto al átomo de hidrógeno, deducimos que los términos de

la función de partición correspondientes a n ≥ 2 son muy pequeños a 298 K. Por

ejemplo, el término del estado n= 2 es e-397,3, es decir, prácticamente cero.

Los términos correspondientes a orbitales de energía elevados serán también

extremadamente pequeños, de forma que la función de partición electrónica del

átomo de hidrógeno es ∼2 a 298 K. En general, se debe considerar la contribución

de cada estado a la función de partición, resultando la siguiente expresión para la

función de partición electrónica:

)1 ∑ 2#i# (3.60)

donde el término exponencial de cada nivel de energía se multiplica por la

degeneración del nivel, gn. Si el espaciado de los niveles de energía es muy grande

comparado con kT, entonces qelec ∼ gO, la degeneración del estado fundamental. Sin

embargo, ciertos átomos y moléculas pueden tener estados electrónicos excitados

que son energéticamente accesibles en relación a kT, y la contribución de estos

estados se incluye en la evaluación de la función de partición.

En el caso de moléculas, se aplica una lógica similar a la que hemos seguido en

sistemas atómicos. En la teoría del orbital molecular, se usan las combinaciones

lineales de orbitales atómicos para construir una nueva serie de orbitales

electrónicos conocidos como orbitales moleculares. Los orbitales moleculares

difieren en energía y la configuración electrónica de la molécula se determina

situando los electrones, con el espín apareado, en los orbitales, partiendo del

orbital de energía más baja. La Figura 3.16 muestra el diagrama de niveles de

energía de los orbitales moleculares del butadieno junto con las dos

configuraciones electrónicas de energía más baja: fundamental y primer estado

excitado. La separación de energía entre estos dos estados corresponde a la

cantidad de energía invertida en excitar un electrón desde el HOMO al LUMO. La

longitud de onda de la transición electrónica de energía más baja del butadieno es

∼220 nm, mostrando que la separación entre HOMO y LUMO es ∼45 000 cm-1,

significativamente mayor que kT a 298 K. Por tanto, sólo el estado de energía

electrónica más baja contribuye a la función de partición electrónica, de modo que,

qelec = 1 para el butadieno, ya que la degeneración del nivel de energía más bajo es

uno. Típicamente, el primer nivel excitado electrónico de las moléculas estará

entre 5000 y 50 000 cm-1 más alto en energía que el nivel más bajo, de forma que a

temperatura ambiente solamente se considera este nivel más bajo en la evaluación

de la función de partición:

)1 ∑ 2# ≈ 1# (3.61)

En ausencia de degeneración del estado electrónico fundamental, la función de

partición electrónica es igual a uno.

Figura 3.16. Descripción de los orbitales moleculares del butadieno. A la izquierda

se muestra la configuración electrónica de energía más baja, y en la derecha la

configuración de energía más alta siguiente, correspondiente a la promoción de un

electrón desde el HOMO al LUMO.

Lección 4: TERMODINÁMICA ESTADÍSTICA

Energía y grados de libertad moleculares. Capacidad calorífica. Entropía. Entropía

residual. Otras funciones termodinámicas. Equilibrio químico.

En esta lección vamos a utilizar los conceptos centrales de la Mecánica Estadística

que hemos visto anteriormente para conectar el punto de vista microscópico de la

materia con magnitudes termodinámicas fundamentales tales como la energía

interna, entropía, energía libre de Gibbs, etc.

Energía y grados de libertad moleculares

El valor de la energía media de una unidad del conjunto canónico, <ε>, es la

energía total del conjunto, E, dividida por el número de unidades del mismo, N:

⟨⟩ = = ∑ = ∑ (4.1)

En esta ecuación, εn es la energía del nivel n y an su correspondiente número de

ocupación. De acuerdo con lo que vimos en la lección anterior, el conjunto se divide

de forma que haya un átomo o molécula en cada unidad. La distribución de

Boltzmann para una serie de niveles de energía no degenerados es

= (4.2)

donde q es la función de partición molecular dada por

= ∑ (4.3)

Sustituyendo la ecuación (4.2) en (4.1) obtenemos

⟨⟩ = ∑ = ∑ (4.4)

Derivando la función de partición molecular con respecto a β, obtenemos:

− = ∑ (4.5)

Utilizando la ecuación (4.5), se puede reescribir la ecuación (4.4) para obtener las

siguientes expresiones de la energía media de la unidad y la energía del conjunto

total:

⟨⟩ = ∑ = = − (4.6)

= ⟨⟩ = = − (4.7)

Como β = (kT)-1 y la derivada de β respecto a T es

= − (4.8)

Utilizando la ecuación (4.8), las expresiones de las energías media y total,

ecuaciones (4.6) y (4.7), se pueden escribir como

⟨⟩ = = !"# (4.9)

= ⟨⟩ = = !"# (4.10)

La ecuación (4.10) muestra que la energía total del conjunto cambia con la

temperatura, un resultado conocido de la Termodinámica. Para conocer la

variación de E con T, se debe construir, primero, q y, después usarla para deducir

una expresión para E.

La energía del colectivo, E, que aparece en la ecuación (4.10) está relacionada con

la magnitud termodinámica energía interna, U, de la siguiente manera. Dado que V

es constante en el colectivo canónico, no puede haber trabajo tipo P-V, y por la

primera ley de la Termodinámica, cualquier cambio de energía interna del sistema

a volumen constante debe ser igual a un flujo de calor a volumen constante, qV, es

decir:

∆% = % − %& = ' (4.11)

siendo U y U0 la energía interna a una temperatura finita y a 0 K, respectivamente.

Si hay energía residual, se debe incluir la energía interna presente a 0 K para

determinar la energía global del sistema. Sin embargo, por convenio Uo

generalmente se hace cero.

Según vimos, para un conjunto de partículas indistinguibles no interactuantes, la

función de partición canónica, Q, está relacionada con la función de partición

molecular, q, de la siguiente manera:

( = ! (4.12)

De modo que,

*+( = *+ − *+! (4.13)

Derivando la ecuación (4.13) con respecto a β y teniendo en cuenta que N y, por

tanto, ln(N!), es constante en el colectivo canónico, llegamos a que:

, = (4.14)

La última relación es la energía total; por tanto, la relación entre Q y la energía

interna total, U, es

% = −, ' (4.15)

En la lección anterior vimos que, bajo la suposición de que los grados de libertad

energéticos no están acoplados, la relación entre la función de partición molecular

total (qtotal) y las funciones de partición correspondientes a un grado de libertad

energético individual es:

-.- = -/0/.-123 4 (4.16)

donde los subíndices tras, rot, vib y elec indican los grados de libertad energéticos

tranlacional, rotacional, vibracional y electrónicos, respectivamente.

Análogamente, se puede descomponer la energía interna en las contribuciones de

cada grado de libertad energético:

% = −, ' = − ' = − (67897:6;<=>?>@) ' (4.17)

= − B6789 ' + 7:6 ' + ;<= ' + >?>@ 'D

= %-/0 + %/.- + %123 + % 4

En efecto, la energía interna simplemente es la suma de las contribuciones de cada

grado de libertad energético molecular. Este resultado también ilustra la conexión

entre la propiedad macroscópica del conjunto (energía interna) y los detalles

microscópicos de las unidades mismas (niveles de energía molecular). Para

relacionar la energía interna total con los grados de libertad energéticos, se

necesitan expresiones de las contribuciones de la energía a partir de cada grado de

libertad energético (Utras, Urot y así sucesivamente). Vamos a deducir a continuación

estas relaciones.

Traslación

La contribución del movimiento molecular traslacional a la energía interna del

sistema es

%-/0 = − 6789 ' = − 6789 6789 ' (4.18)

siendo qtras la función de partición traslacional, que en tres dimensiones viene dada

por

-/0 = 'EF = 'GH IJKF/ (4.19)

Con esta función de partición, la contribución traslacional a la energía interna se

convierte en

%-/0 = − 6789 6789 ' = EF' M' NF⁄ P ' = −QR M NF⁄ P '

= −QR SM#TU V ⁄ PF/ W' = R#X

%-/0 = R#Y" = R#+Z" (4.20)

Es interesante resaltar aquí que la contribución del movimiento traslacional a la

energía interna es igual al predicho por el teorema de equipartición. Este teorema

establece que cualquier término del hamiltoniano clásico, que sea cuadrático con

respecto al momento o la posición, contribuye con kT/2 a la energía. El

hamiltoniano correspondiente al movimiento traslacional tridimensional de un gas

monoatómico ideal, es

[-/0 = #U M\]# + \# + \_#P (4.21)

Cada término p2 de la ecuación (4.20) contribuirá con kT/2 a la energía por

equipartición, de forma que la contribución total será 3kT/2 ó 3RT/2 para un mol

de partículas que es idéntico al resultado deducido usando la descripción mecano-

cuántica del movimiento traslacional. Este resultado no es sorprendente dada la

diferencia de energía entre los niveles de energía traslacional, de forma que es

esperable un comportamiento clásico.

Rotación

Utilizando la función de partición rotacional de una molécula diatómica en el límite

de alta temperatura

/.- = `V4a (4.22)

la contribución del movimiento molecular rotacional a la energía interna es

%/.- = − 7:6 7:6 ' = −bXℎde ( `V4a⁄ ) ' = −X Sf W' = X

%/.- = Y" = +Z" (4.23)

Conviene tener en cuenta que la ecuación (4.22) corresponde a una molécula

diatómica en la que la que Θrot << kT. En este límite, son accesibles un número

significativo de estados rotacionales. Si esto no se cumple, entonces hay que

evaluar todos los términos de la suma de la función de partición rotacional.

En el límite de alta temperatura, la energía rotacional se puede interpretar como la

adición de contribuciones kT/2 por cada momento de inercia que no se anula. Esta

partición de la energía es análoga al caso de la energía traslacional discutido

anteriormente en el contexto del teorema de equipartición. El concepto de

equipartición se puede usar para extender el resultado de Urot obtenido para una

molécula diatómica a moléculas poliatómicas lineales y no lineales. Como cada

momento de inercia no nulo proporciona kT/2 a la equipartición de la energía

rotacional, podemos establecer que

%/.- = +Z" (poliatómica lineal) (4.24)

%/.- = R#+Z" (poliatómica no lineal) (4.25)

Vibración

A diferencia de los grados de libertad traslacional y rotacional, el espaciado de los

niveles de energía vibracional es, típicamente, mayor que kT, de forma que el

teorema de equipartición no es aplicable a este grado de libertad energético.

Afortunadamente, el modelo del oscilador armónico genera un espaciado regular

de los niveles de energía dando lugar a una expresión relativamente sencilla de la

función de partición vibracional:

123 = H@hi (4.26)

siendo j la frecuencia vibracional en unidades cm−1. Usando esta función de

partición, la contribución del movimiento molecular vibracional a la energía

interna es

%123 = − ;<= ;<= ' = −M1 − V4miP SM H@hiPf W'

= −M1 − V4miPM−ℎdnV4miPM1 − V4miP#

%123 = V4mi H@hi (4.27)

Figura 4.1. Variación de la energía vibracional media en función de la temperatura

con j = 1000 cm−1.

En la Figura 4.1 se muestra la variación de Uvib/Nhc con T para un grado de libertad

vibracional (j = 1000 cm−1). Puede observarse que a las temperaturas más bajas

Uvib es cero. A bajas temperaturas, kT << hcj de forma que no hay suficiente

energía térmica para poblar, de forma apreciable, el primer estado vibracional

excitado. Sin embargo, a temperaturas ≥1000 K la energía media crece linealmente

con la temperatura, comportamiento idéntico al observado para la energía

traslacional y rotacional. Esta observación sugiere que también existe una

expresión de Uvib para alta temperatura. Para deducir la expresión límite de la

energía vibracional a alta temperatura, se escribe el término exponencial de qvib

usando el desarrollo en serie siguiente:

] = 1 + ]! + ] #! + ]FR! +⋯

Como x =Xℎdn = ℎdn/!", cuando kT >> hcj la serie es aproximadamente igual a 1

+ x dando lugar a

%123 = V4mi H@hi = V4mipV4mi =

%123 = Y" = +Z" (4.28)

Cuando la temperatura es suficientemente alta, de forma que es aplicable el límite

de alta temperatura, la contribución vibracional a la energía interna es nRT,

idéntica a la predicción del teorema de equipartición. Esta es la contribución de un

único grado de libertad vibracional y la contribución total será la suma de todos los

grados de libertad vibracional. Además, la aplicabilidad de la aproximación a alta

temperatura depende de los detalles del espectro de energía vibracional, de forma

que mientras la aproximación de alta temperatura se puede aplicar a algunas

vibraciones de baja energía, puede no ser aplicable a vibraciones de energía

elevada.

La aplicabilidad del límite de alta temperatura se puede determinar mediante la

temperatura vibracional definida previamente:

q123 = V4mi (4.29)

Se estableció que el límite de alta temperatura es aplicable cuando T ≥ 10 q123. En

la Tabla 4.1 se dan algunos ejemplos de q123 para moléculas diatómicas. De la

inspección de la tabla se deduce que se deben alcanzar temperaturas

relativamente elevadas antes de que sea aplicable el límite de alta temperatura en

la mayoría de los grados de libertad vibracional.

Tabla 4.1. Temperaturas vibracionales de algunas moléculas diatómicas.

Electrónica

Como los espaciados de los niveles de energía electrónica, en general, son muy

grandes comparados con kT, la función de partición electrónica es igual a la

degeneración del estado fundamental. Teniendo en cuenta que la degeneración es

una constante, la derivada de esta cantidad con respecto a β debe ser cero y

% 4 = 0 (4.30)

Hay, no obstante, excepciones al resultado de la ecuación (4.30). Concretamente,

en sistemas en los que los niveles de energía electrónica son comparables a kT, es

necesario evaluar la función de partición completa.

Capacidad calorífica

La definición termodinámica de la capacidad calorífica a volumen constante (CV) es

s' = tut' = −!X# tut' (4.32)

Como la energía interna se puede descomponer en contribuciones de cada grado

de libertad energético, la capacidad calorífica se puede descomponer de forma

similar. En la sección previa, se determinó la contribución a la energía interna

media de cada grado de libertad energético. De forma correspondiente, la

capacidad calorífica viene dada por la derivada de la energía interna con respecto a

la temperatura para un grado de libertad energético dado. En lo que resta de esta

sección, usamos esta aproximación para determinar las contribuciones

traslacional, vibracional, rotacional y electrónica a la capacidad calorífica a

volumen constante.

Figura 4.2. Variación de la capacidad calorífica a volumen constante de un sistema

de dos niveles en función de la temperatura.

La forma funcional de la capacidad calorífica es compleja como se muestra, a modo

de ejemplo, en la Figura 4.2. Se observan, de nuevo, comportamientos límite a baja

y alta temperatura. A baja temperatura, CV es cero, entonces aumenta hasta el

máximo valor, después del cual el incremento adicional de la temperatura produce

una disminución de la capacidad calorífica. Este comportamiento es fruto de la

evolución de la energía en función de la temperatura (véase Figura 3.2) y se debe al

mismo origen, la evolución de las poblaciones del estado en función de la

temperatura. La capacidad calorífica es una medida de la capacidad del sistema

para absorber energía del medio. A las temperaturas más bajas, hay insuficiente

energía para acceder al estado excitado, de forma que el sistema de dos niveles es

incapaz de absorber energía. Como la energía térmica disponible aumenta, el

estado excitado llega a ser accesible y la capacidad calorífica se incrementa.

Finalmente, a temperaturas más elevadas, la población de los estados fundamental

y excitado alcanza sus valores límite 0.5. Aquí, el sistema es, de nuevo, incapaz de

absorber la energía, y la capacidad calorífica tiende a cero.

Capacidad calorífica traslacional

El espaciado de los niveles de energía traslacional es extremadamente pequeño, de

forma que mientras las moléculas permanecen en fase gas, es válida la

aproximación de alta temperatura. La contribución del movimiento traslacional a

la energía molecular media de un gas ideal es

%-/0 = R#Y" (4.33)

Por tanto, la contribución traslacional a CV es:

s',-/0 = tu6789t ' = R#Y (4.34)

Este resultado demuestra que la contribución de las traslaciones a la capacidad

calorífica a volumen constante, no depende de la temperatura. El valor constante

de la contribución traslacional a CV cae a muy bajas temperaturas y es

consecuencia del denso conjunto de estados traslacionales poco espaciados.

Capacidad calorífica rotacional

Suponiendo que el espaciado de energía rotacional es pequeño comparado con kT,

se puede usar la expresión de alta temperatura de la contribución rotacional a la

energía media para determinar la contribución rotacional a CV. La energía interna

depende de la geometría molecular:

%/.- = Y" (lineal) (4.35)

%/.- = R#Y" (no lineal) (4.36)

Usando estas dos ecuaciones, la contribución rotacional a CV es

s',/.- = tu7:6t ' = Y (lineal) (4.37)

s',/.- = tu7:6t ' = R#Y (no lineal) (4.38)

Las expresiones (4.37) y (4.38) son correctas en el límite de alta temperatura. A

temperaturas más bajas, hay insuficiente energía térmica para poblar los niveles

de energía rotacional excitados. Por tanto, la capacidad calorífica tiende a cero.

Conforme aumenta la temperatura, la capacidad calorífica crece hasta alcanzar el

límite a alta temperatura. A estas temperaturas intermedias, la capacidad calorífica

debe determinarse evaluando qrot en forma de suma.

Capacidad calorífica vibracional

En contraste con las traslaciones y rotaciones, el límite de alta temperatura

generalmente no es aplicable a los grados de libertad vibracional. Por tanto, debe

evaluarse la forma funcional exacta de la energía, para determinar la contribución

vibracional a CV. Dado que la contribución vibracional a U es:

%123 = V4mi H@hi (4.39)

La contribución vibracional a la capacidad calorífica a volumen constante está dada

por:

s',123 = tu;<=t ' = −!X# tu;<=t '

= !X#(ℎdn)# H@hiM H@hiP (4.40)

La capacidad calorífica se puede expresar en términos de la temperatura

vibracional Θvib,

s',123 = ! w;<= # x;<= y⁄M x;<= y⁄ P (4.41)

Una molécula poliatómica, según vimos, tiene 3N - 6 o 3N – 5 grados de libertad

vibracional, respectivamente. Cada grado de libertad vibracional contribuye a la

capacidad calorífica a volumen constante vibracional global, de forma que

Ms',123P-.- = ∑ Ms',123PURz.RU| (4.42)

La contribución de un grado de libertad vibracional dado depende del espaciado

entre los niveles vibracionales con relación a kT. Por tanto, a las temperaturas más

bajas esperamos que la contribución vibracional a CV sea nula. Conforme aumenta

la temperatura, los modos vibracionales de energía más baja tienen espaciados

comparables a kT, de forma que estos modos contribuirán a la capacidad calorífica.

Finalmente, los modos vibracionales de energía más alta contribuyen solo a alta

temperatura. En resumen, esperamos que la contribución vibracional a CV muestre

una significativa dependencia de la temperatura. La Figura 4.3 presenta la

contribución vibracional a CV en función de la temperatura, para una molécula

triatómica no lineal que tiene tres modos vibracionales no degenerados con n igual

a 100, 1000 y 3000 cm-1. Como era de esperar, el modo de frecuencia más baja

contribuye a la capacidad calorífica a temperaturas bajas, alcanzando un valor

constante de Nk para temperaturas que superan largamente a Θvib para una

vibración dada. Conforme la temperatura crece, los modos vibracionales de

energía sucesivamente más altos comienzan a contribuir a la capacidad calorífica y

alcanzan el mismo valor límite de k a temperaturas más elevadas. Finalmente, la

capacidad calorífica vibracional total, que es simplemente la suma de las

contribuciones de los modos individuales, se aproxima al valor límite de 3Nk.

Figura 4.3. Evolución de la contribución vibracional a CV de una molécula con tres

grados de libertad vibracional en función de la temperatura. Se muestran las

contribuciones de cada modo vibracional (izquierda) y la contribución vibracional

total (derecha).

El comportamiento mostrado en la Figura 4.3 pone de manifiesto que para las

temperaturas en que kT >> hcn, la capacidad calorífica se aproxima al valor

constante, sugiriendo que, como para las traslaciones y rotaciones, hay un límite de

alta temperatura para la contribución vibracional a CV. Recordemos que la

aproximación a alta temperatura para la energía media de un grado de libertad

vibracional individual, es

%123 = = !" (4.43)

La diferenciación de esta expresión con respecto a la temperatura indica que la

contribución a CV es igual a Nk para cada modo vibracional en el límite de alta

temperatura, como se ilustra en la Figura 4.3 y como era de esperar según el

teorema de equipartición.

Capacidad calorífica electrónica

Debido a que la función de partición para el grado de libertad energético es

generalmente igual a la degeneración del estado fundamental, la energía media

resultante es cero. Por tanto, no hay contribución de estos grados de libertad a la

capacidad calorífica a volumen constante. Sin embargo, para sistemas con estados

electrónicos excitados que son comparables a kT, la contribución de los grados de

libertad electrónica a CV puede ser finita y debe determinarse usando la forma de

suma de la función de partición.

Entropía En la lección anterior vimos que un sistema se aproxima al equilibrio cuando

tiende hacia la configuración de energía con el máximo peso, es decir, la

configuración de energía que se observará en el equilibrio corresponde a Wmáx. La

tendencia de un sistema a maximizar W y la entropía, S, sugiere que existe una

relación entre estas cantidades. Boltzmann expresó esta relación en la siguiente

ecuación, conocida como fórmula de Boltzmann:

= !*+~ (4.44)

Esta relación establece que la entropía es directamente proporcional a ln(W), con

la constante de Boltzmann sirviendo de constante de proporcionalidad. La

ecuación (4.44) aclara que un máximo de W corresponde a un máximo de S. Pese a

que a primera vista la fórmula de Boltzmann parece ser, más bien, un enunciado ad

hoc, esta fórmula es, de hecho, equivalente a la definición termodinámica de

entropía. Para ilustrar esta equivalencia, consideremos la energía de un conjunto

de partículas. Esta energía es igual a la suma de los productos de las energías de los

niveles y sus números de ocupación de esos niveles, de forma que

= ∑ (4.45)

La diferencial total de E está dada por

= ∑ + ∑ (4.46)

Como el volumen es constante en el conjunto canónico, las energías de los niveles

son también constantes. Por tanto, el segundo término en la expresión (4.48) es

cero y el cambio de energía está relacionado exclusivamente con los cambios de los

números de ocupación de los niveles:

= ∑ (4.47)

La restricción de volumen constante también obliga a que no hay un trabajo de

tipo P-V; por tanto, por la primera ley de la Termodinámica, el cambio de energía

se debe al flujo de calor:

= / 1 = ∑ (4.48)

donde dqrev es el calor reversible intercambiado entre el sistema y el medio. La

definición termodinámica de entropía es

= 7>; (4.49)

La comparación de las dos últimas ecuaciones proporciona la siguiente definición

de entropía:

= 7>; = ∑ = !X ∑ (4.50)

donde hemos reescrito T-1 como kβ dada nuestra necesidad de β en el paso

siguiente de la deducción. Por otro lado, según vimos en la deducción de la

distribución de Boltzmann:

+ − X = 0 (4.51)

X = +

donde α y β son los multiplicadores de Lagrange de la deducción de la distribución

de Boltzmann. Sustituyendo la ecuación (4.51) en (4.50), obtenemos que:

= !X∑ = !∑ + !∑ (4.52)

= !∑ = !(*+~)

La ecuación (4.52) es simplemente una forma alternativa de la fórmula de

Boltzmann de la ecuación (4.44). La definición de entropía dada por la fórmula de

Boltzmann proporciona profundidad en la comprensión de la entropía, pero ¿cómo

se calcula la entropía de un sistema molecular? La respuesta a esta cuestión

requiere un poco más de trabajo. Debido a que la función de partición proporciona

una medida de la accesibilidad del estado de energía, se puede suponer que existe

la relación entre la función de partición y la entropía. Esta relación se puede

deducir aplicando la fórmula de Boltzmann como sigue:

= !*+~ = !*+ !∏ ! (4.53)

que se puede reescribir como:

= !*+! − !*+∏ ! = !(*+ − ∑ *+ ) (4.54)

con

= ∑ (4.55)

Usando esta definición de nuevo,

= !(*+ − ∑ *+ ) = !(∑ *+ − ∑ *+ )

= −!∑ *+ = −!∑ *+\ (4.56)

En la última línea de esta ecuación, pn es la probabilidad de ocupación del nivel de

energía n como se definió previamente. La ley de distribución de Boltzmann se

puede usar para reescribir el término de probabilidad de la ecuación (4.56) como

sigue:

*+\ = *+ = −X − *+ (4.57)

La expresión para la entropía entonces se convierte en

= −!∑ *+\ = −!∑ (−X − *+)

= !X ∑ + !∑ *+ = !X + !*+

= + !*+ = u + !*+( (4.58)

En esta expresión, U es la energía térmica del sistema y Q es la función de

participación canónica. En la ecuación (4.58), E se puede reemplazar por U, para

ser consistentes con la discusión previa al examinar la energía interna. La energía

interna está relacionada con la función de partición canónica por

% = −, ' = !"# , ' (4.59)

Usando esta relación, llegamos a una expresión muy compacta para la entropía:

= u + !*+( = !" , ' + !*+(

= , ' (4.60)

Entropía de un gas ideal monoatómico

Un gas monoatómico ideal es una colección de partículas indistinguibles.

Suponiendo que la función de partición electrónica es la unidad (es decir, el nivel

de energía electrónico fundamental es no degenerado), sólo quedan por evaluar los

grados de libertad traslacional, resultando que

= u + !*+( = R#Y" + !*+ 6789!

= R#Y" + !*+-/0 − !*+!

= R#Y +!*+-/0 − !(*+ − )

= #Y +!*+-/0 − !*+

= #Y +!*+ 'NF − !*+

= #Y + !*+ + R#!*+" − !*+ /FV #TU R/#

= #+Z + +Z*+ + R#+Z*+" − +Z*+ G /F /FV #TU KR/# (4.61)

La línea final de la ecuación (4.61) es una versión de la ecuación de Sackur–Tetrode, que puede reescribirse de forma más compacta como:

= +Z*+ / #TU R/# = +Z*+ / NF (4.62)

donde

ΛR = V #TUR/#

La ecuación de Sackur–Tetrode reproduce muchas de las propiedades

termodinámicas clásicas de los gases monoatómicos ideales encontradas

previamente. Por ejemplo, consideremos la expansión isotérmica de un gas

monoatómico ideal desde un volumen inicial V1 al volumen final V2. La inspección

de la forma expandida de la ecuación de Sackur–Tetrode, ecuación (4.61),

demuestra que todos los términos de esta expresión permanecen inalterados

excepto el segundo término que implica al volumen, de forma que

Δ = 2 − 2242 = +Z*+ ' 'f (4.63)

Este es el mismo resultado obtenido con la Termodinámica Clásica. ¿Qué ocurriría

si el cambio de entropía se iniciara con un calentamiento isocórico (∆V = 0)?

Usando la diferencia de temperatura entre los estados inicial (T1) y final (T2), la

ecuación (4.61) se transforma en

Δ = 2 − 2242 = R#+Z*+ f = +s1*+ f (4.64)

Reconociendo que CV = 3/2R para un gas monoatómico ideal, llegamos a un

resultado ya obtenido en la Termodinámica. El primer y cuarto términos de la

ecuación (4.61) son constantes, con el último variando con las masas atómicas. La

Termodinámica Clásica es totalmente incapaz de explicar el origen de estos

términos, y sólo se podría determinar su presencia a través de estudios empíricos.

Sin embargo, su contribución a la entropía aparece de forma natural cuando

usamos la perspectiva estadística.

Cuando se calcula la entropía de un gas ideal que consta de moléculas diatómicas o

poliatómicas, es mejor comenzar con la expresión general de la entropía, ecuación

(4.60), y expresar la función de partición canónica en términos del producto de las

funciones de partición molecular de cada grado de libertad energético. En el

cálculo de la entropía se debe incluir en la entropía traslacional el término

deducido anteriormente para un gas monoatómico ideal y también las

contribuciones de la energía rotacional, vibracional y electrónica.

Entropía residual

Cuando se compara la entropía calculada usando la Mecánica Estadística, con el

experimento, se observa un buen acuerdo para una gran variedad de sistemas

atómicos y moleculares. Sin embargo, en muchos sistemas moleculares, este

acuerdo no es tan bueno. Un ejemplo bien conocido es el monóxido de carbono en

el que la entropía calculada a la temperatura y presión estándares termodinámicas

es 197,9 J mol-1 K-1 y el valor experimental sólo es 193,3 J mol-1 K-1. Tanto en este

sistema como en otros, la entropía calculada es siempre mayor que la observada

experimentalmente.

Figura 4.4. Origen de la entropía residual en CO. Cada molécula de CO del sólido

puede tener una de las dos posibles orientaciones, como se ilustra en el CO central.

La razón de la discrepancia sistemática entre las entropías calculadas y

experimentales en tales sistemas es la entropía residual, o entropía asociada con la

orientación molecular en el cristal molecular a baja temperatura. Usando CO como

ejemplo, el débil momento eléctrico dipolar de la molécula hace que las

interacciones dipolo-dipolo no jueguen un papel dominante en la determinación de

la orientación de una molécula de CO en relación a las moléculas vecinas en un

cristal. Por tanto, cada CO puede adoptar una de dos orientaciones, como se ilustra

en la Figura 4.4. El sólido correspondiente a las posibles orientaciones del CO

tendrá un grado de azar inherente. Debido a que cada molécula de CO puede

asumir una de las dos orientaciones posibles, la entropía asociada a este desorden

orientacional es

= !*+~ = !*+2 = !*+2 = +Z*+2 (4.65)

donde W es el número total de disposiciones posibles del CO, que es igual a 2N con

N igual al número de moléculas de CO. Para un sistema que consta de 1 mol de CO,

se predice que la entropía residual es R ln 2 o 5,76 J mol-1 K-1, aproximadamente

igual a la diferencia entre los valores de la entropía experimental y calculada.

Finalmente, conviene hacer notar que el concepto de entropía residual aporta luz

sobre el origen de la tercera ley de la Termodinámica. Esta ley establece que la

entropía de una sustancia cristalina pura es cero a 0 K. Por “puro y cristalino,” la

tercera ley significa que el sistema debe ser puro con respecto a ambas,

composición (es decir, un único componente) y orientación en el sólido a 0 K. Para

un sistema puro tal, W = 1 y de forma correspondiente S = 0 por la ecuación (4.65).

Por tanto, la definición de la entropía cero proporcionada por la tercera ley es una

consecuencia derivada de la naturaleza estadística de la materia.

Otras funciones termodinámicas

La discusión hasta aquí ilustra la convergencia de las perspectivas estadística y

termodinámica y es impresionante la utilidad de la perspectiva estadística para

ilustrar las contribuciones destacables a las propiedades macroscópicas de la

materia. La relación entre la función de partición canónica y otras cantidades

termodinámicas se pueden deducir usando las siguientes relaciones

termodinámicas familiares para la entalpía, H, energía de Helmholtz, A, y energía

de Gibbs, G:

[ = % + (4.66)

= % − " (4.67)

= [ − " (4.68)

A partir de estas expresiones, se pueden deducir las relaciones entre la función de

partición canónica y las cantidades termodinámicas previas.

Energía de Helmholtz

Comenzando con la definición termodinámica de A de la ecuación (4.67), la

relación de esta cantidad con la función de partición canónica es

= % − " = % − " u + !*+( (4.69)

= −!"*+(

La energía de Helmholtz proporciona una interesante vía para obtener una

relación bien conocida: la ley del gas ideal. A partir de la Termodinámica, la

presión se relaciona con la energía de Helmholtz por

= −tt' (4.70)

Sustituyendo la definición de A proporcionada por la ecuación (4.69) en la

ecuación precedente,

= − t(,)t' = !" t,t'

= !" St!t' W

= !" tt' − t!t' = Y" tt' (4.71)

La función de partición canónica para un gas ideal es

( = ! = ΛR

Sustituyendo esta expresión por la función de partición canónica en la ecuación

precedente,

= !" St Ft' W = !" t't' − tNFt' = ' = ' (4.72)

Este resultado es novedoso. Esta relación se obtuvo primero a partir de medidas

empíricas, expresadas mediante las leyes de Boyle, Charles, Avogadro y Gay-

Lussac. Sin embargo, al deducir esta relación no hemos empleado esas leyes

empíricas. En lugar de ello, partiendo de un modelo mecano-cuántico para el

movimiento traslacional, hemos deducido la ley del gas ideal desde una

perspectiva puramente teórica. De nuevo la Mecánica Estadística ha

proporcionado la comprensión de una propiedad macroscópica. Este ejemplo

ilustra una de las mayores contribuciones de la Mecánica Estadística a la Química

Física: la capacidad de predecir relaciones que se han deducido hace mucho de

observaciones empíricas, y subsiguientemente se han establecido como leyes

termodinámicas.

Entalpía

Usando la definición termodinámica de entropía de la Ecuación (4.68), esta

cantidad se puede expresar en términos de la función de partición canónica, como

sigue:

[ = % + = −t,t − tt'

= −t,t + t,t'

= !"# t,t ' + !" t,t'

[ = " !" t,t ' − ! t,t' (4.73)

Pese a que la ecuación (4.73) es correcta, claramente requiere un poco de trabajo

para su implementación. No obstante, la perspectiva estadística ha mostrado que

se puede relacionar la entalpía con los detalles moleculares microscópicos, a través

de la función de partición.

Energía de Gibbs

Quizás la función de estado más importante que emerge de la Termodinámica es la

energía de Gibbs. Usando esta cantidad, se puede determinar si una reacción

química ocurrirá espontáneamente. La expresión estadística de la energía libre de

Gibbs se deduce también partiendo de la definición termodinámica de esta

cantidad, ecuación (4.68):

= +

= !"*+( + !" t,t'

= −!" *+( − t,t' (4.74)

Se han empleando expresiones deducidas previamente para la energía de

Helmholtz y la presión para llegar al resultado de la ecuación (4.78). Se puede

deducir un resultado más intuitivo aplicando la relación precedente a un gas ideal

en el que PV = nRT = NkT. Con esta relación:

= + = −!"*+( + !"

= −!"*+ ! + !" = −!"*+ = −+Z"*+ (4.75)

Esta relación es extremadamente importante porque permite penetrar en el origen

de la energía de Gibbs. A temperatura constante, el prefactor nRT de la expresión

de G es equivalente para todas las especies; por tanto, las diferencias entre las

energías de Gibbs se tienen que deber a la función de partición. Como la energía de

Gibbs es proporcional a −ln(q), un aumento del valor de la función de partición

producirá una energía de Gibbs más baja. La función de partición cuantifica el

número de estados que son accesibles a una temperatura dada; por tanto, la

perspectiva estadística obliga a que las especies con un número comparativamente

alto de estados de energía accesibles tengan una baja energía de Gibbs. Esta

relación tendrá profundas consecuencias cuando discutamos en la sección

siguiente el equilibrio químico.

Equilibrio químico

Consideremos la reacción genérica siguiente:

+ e ds + (4.76)

donde a, b, c, y d son los coeficientes estequiométricos de las especies A, B, C y D,

respectivamente.

El cambio de energía libre de Gibbs de la reacción (4.76) está relacionado con la

energía de Gibbs de las especies asociadas, como sigue:

Δ& = d& + & − & − a& (4.77)

donde el superíndice 0 indica el estado termodinámico estándar. Dado que la

constante de equilibrio K está dada por

Δ& = −Z"*+Y (4.78)

Se puede definir K en términos de las funciones de partición de las distintas

especies implicadas a partir de la aplicación de la expresión (4.74) a la energía

libre de Gibbs de cada una de las especies de la reacción (4.76):

Δ& = d S−Z"*+ W + S−Z"*+ W − S−Z"*+ W − S−Z"*+ W

= −Z"*+S W@S WS W8S W= (4.79)

La comparación de la relación anterior con la definición termodinámica de ∆G0,

conduce a que la constante de equilibrio se pueda definir como:

Y = S W@S WS W8S W= (4.80)

A T = 0 K, sólo están poblados los estados de energía más bajos de todos los grados

de libertad energéticos. Los estados fundamentales traslacional y rotacional de

todas las especies son equivalentes, pero no los estados fundamentales vibracional

y electrónico. En la representación del potencial vibrónico (vibracional y

electrónico) fundamental de una molécula diatómica mostrada en la Figura 4.5,

puede verse el origen de esta discrepancia. La presencia de un enlace entre los dos

átomos de la molécula disminuye su energía respecto a los fragmentos atómicos

separados. Debido a que la energía de los fragmentos atómicos se define como

cero, el estado vibracional fundamental está por debajo de cero en una cantidad

igual a la energía de disociación de la molécula, εD, o más comúnmente

denominada D0, Además, las diferentes moléculas tendrán diferentes valores de la

energía de disociación, de forma que esta posición del cero será específica de la

molécula.

Figura 4.5. Curva de energía potencial del estado fundamental de una molécula

diatómica. Sólo se indican los tres niveles de energía vibracionales más bajos.

El establecimiento de un estado de referencia común para los grados de libertad

vibracional y electrónico se completa como sigue. Primero, las diferencias en εD se

pueden incorporar en la parte vibracional del problema, de forma que la función

de partición electrónica permanece idéntica a nuestra anterior definición.

Volviendo al problema vibracional, la expresión general de la función de partición

vibracional se puede escribir incorporando εD como sigue:

123¡ = ∑ ¢& = () + (pmi) + (p#mi) +⋯

= M1 + mi + #mi +⋯P

= 123 (4.81)

Es decir, la forma corregida de la función de partición vibracional, q’vib, es el

producto de qvib original (sin energía del punto cero) por un factor que corrige el

desplazamiento de la energía debido a la disociación. Con este factor de corrección

en su sitio, todos los estados vibracionales fundamentales tienen energía nula. Por

tanto, la expresión final de la constante de equilibrio es

Y = S W@S WS W8S W= (4p3) =

S W@S WS W8S W= £ (4.82)

Las energías de disociación que aparecen en la ecuación (4.82) se obtienen

fácilmente usando técnicas espectroscópicas. La primera parte de la ecuación

(4.82) es la relación de las funciones de partición de productos y reactivos. Debido

a que las funciones de partición cuantifican el número de estados disponibles, esta

relación obliga a que el equilibrio favorezca aquellas especies con mayor número

de estados de energía disponibles a una temperatura dada. La segunda parte es la

energía de disociación. Este término hace que el equilibrio favorezca aquellas

especies con estados de energía más bajos. Las imágenes de la Figura 4.6 reflejan

este comportamiento. La gráfica de la izquierda muestra un reactivo y un producto

que tienen la misma energía en el estado fundamental. La única diferencia entre las

dos es que la especie producto tiene más estados de energía accesibles a una

temperatura dada que el reactivo. Otra forma de interpretar esta relación es que la

función de partición que describe el producto será mayor que la del reactivo, a la

misma temperatura, de forma que, en el equilibrio, se favorecerá el producto (K >

1). En la gráfica de la izquierda, los espaciados de energía del reactivo y del

producto son equivalentes; sin embargo, los estados del producto están situados

más altos en energía que los del reactivo. En este caso, el equilibrio estará

desplazado hacia el reactivo (K < 1).

Figura 4.6. Interpretación estadística del equilibrio. (a) Reactivo y producto con la

misma energía del estado fundamental y diferente espaciado energético. (b)

Reactivo y producto con el mismo espaciado energético y diferente energía de los

estados.

QUÍMICA FÍSICA III Serie 1 Curso 2017-2018

1. Sea un sistema formado por tres cajas idénticas, que representan subsistemas menores.

a) ¿Cuántas formas hay de colocar una bola negra en las tres cajas?

b) ¿Cuál es la probabilidad de que la bola negra se encuentre en la primera caja?

c) ¿Cuántas formas hay de colocar dos bolas, una negra y otra blanca, en las tres cajas?

d) ¿Cuál es la probabilidad de encontrar una de las dos bolas anteriores en la segunda

caja?

e) ¿Cuál es la probabilidad de colocar la bola blanca en la tercera caja?

f) ¿Cómo serían los resultados de los apartados c-e en el caso de que las dos bolas fueran

negras?

2. Considerando que la distribución de probabilidad de las velocidades moleculares en una

dimensión (vx ) viene dada por

= / .

a) Determínese la constante de normalización, C.

b) Determínese <vx>.

c) Determínese <vx2>.

d) Determínese la varianza.

3.* Demuéstrese que para cualquier variable aleatoria x, se verifica que <x2> > <x>2.

4. Una variable aleatoria x puede tomar los valores +1, 0 y -1 con probabilidades p, q y p,

respectivamente. Calcúlense el valor medio y la varianza de la función f(x) = sen (πx/4).

5. Un conjunto de 13 partículas ocupa estados con energía de 0, 100, 200 cm-1. Calcula la

energía total y el número de microestados para las configuraciones siguientes:

a) a0=8, a1=5 y a2=0

b) a0=9, a1=3 y a2=1

c) a0=10, a1=1 y a2=2

¿Alguna de estas configuraciones corresponde a una distribución de Boltzmann?

6.* Considérese un sistema de tres partículas con cuatro posibles estados de energía (0ε, 1ε,

2ε y 3ε). Sabiendo que la energía total del sistema es 5ε, ¿cuántas distribuciones distinguibles

puede haber?

7. Considérense las siguientes series de poblaciones para cuatro niveles de energía

igualmente espaciados:

T (K) Serie A Serie B Serie C

300 5 3 4

200 7 9 8

100 15 17 16

0 33 31 32

a) Demuéstrese que las series tienen la misma energía.

b) Determínese cuál de las series es la más probable.

c) Para la serie más probable, ¿es la distribución de energía consistente con la

distribución de Boltzmann?

8.* Para una colección de osciladores armónicos monodimensionales, calcúlense las

poblaciones relativas de los primeros niveles vibracionales más bajos para hν/kT igual a (a) 4;

(b) 1; (c) 0,2.

9. a) ¿Cuál es el número de microestados posibles, asociados al lanzamiento de una moneda N

veces sacando H veces cara y T veces cruz? b) Para una serie de 1000 lanzamientos, ¿cuál es el

número total de microestados asociados a 50% de caras y 50% de cruces? c) ¿Cuánto menos

probable es el resultado en el que la moneda caiga 40% caras y 60% cruces?

10. Constrúyase una tabla de configuraciones para una muestra de nueve moléculas con

energía total 9ε en un sistema con niveles de energía jε, siendo j=0, 1, 2, 3… . Determínese el

peso de cada configuración y la configuración más probable.

11. Consideremos el caso de 10 osciladores y ocho cuantos de energía. Determínese la

configuración dominante de energía para este sistema identificando las configuraciones de

energía y calcúlense los pesos correspondientes. ¿Cuál es la probabilidad de observar la

configuración dominante?

12. Cierta molécula tiene un estado excitado doblemente degenerado a 360 cm-1 por encima

del estado fundamental no degenerado. ¿A qué temperatura el 15% de las moléculas estará en

el estado superior?

13.* ¿Cuál es la temperatura de un sistema con dos niveles cuya separación energética es

equivalente a 300 cm-1 cuando la población del estado superior es la mitad que del estado

inferior?

14. La frecuencia vibracional del I2 es 208 cm−1. ¿Cuál es la probabilidad del I2 de poblar el

nivel vibracional n = 2 si la temperatura molecular es 298 K?

15.* En espectroscopía RMN, la separación de energía entre los estados de espín se crea

situando los núcleos en un campo magnético. Los protones tienen dos posibles estados de

espín: +1/2 y −1/2. La separacion de energıa entre estos dos estados depende de la intensidad

del campo magnético y está dada por

∆ = = 2,8210 JT#

donde B es la intensidad del campo magnético en teslas (T), y gN y βN son el factor nuclear y el

magnetón nuclear del protón, respectivamente. ¿Cuál es la relación de la población entre los

dos estados de espín a 1,45 T y 298 K?

16.* Determínese la función de partición para los grados de libertad vibracional del Cl2 ($ =

525 cm-1) y calcúlese la probabilidad de ocupación del primer nivel excitado vibracional a 300

y 1000 K. Determínese la temperatura a la que se observan probabilidades idénticas para el F2

($ = 917 cm−1).

*Problemas a resolver en TG por los estudiantes.


1. Un átomo de argón se encuentra atrapado en una caja cúbica de lado 1 cm.

a) ¿Cuál es la función de partición traslacional a 100 K, 298 K, 10000 K y 0 K? b) La forma de la función de partición traslacional, tal como se utiliza normalmente, es

válida cuando son accesibles un gran número de niveles de energía: i. ¿Cuándo resulta incorrecta la expresión normal y hemos de usar el sumatorio de forma explícita? ii. Calcúlese la temperatura del argón (atrapado en la caja cúbica de 1 cm de lado) necesaria para que la función de partición disminuya hasta un valor de 10. iii. ¿Cuál es el valor exacto de la función de partición a esta temperatura?

2. Considérese un sistema con niveles energéticos dados por un número cuántico, J, que toma valores enteros positivos desde cero hasta infinito. La energía de los niveles puede expresarse como EJ=J(J+1)a, donde a es una constante con unidades de energía. La degeneración de los niveles es 2J+1.

a) Calcúlese la función de partición a dos temperaturas, tal que kT/a = 10 y kT/a = 20. b) Represéntese la probabilidad de ocupación de los niveles energéticos en función de J.

¿Qué nivel es el más probable para cada una de las temperaturas dadas? 3. La longitud de enlace de la molécula de monóxido de carbono es 1,128 Å. Determínese la relación de poblaciones entre los niveles J=1 y J=0 para dicha molécula a 300 K y 600 K. ¿Cuál es el valor límite de esta relación cuando T → ∞? 4. Evalúese la función de partición rotacional para las siguientes especies a 298 K, suponiendo que la expresión de alta temperatura es válida.

a) OCS (B=1,48 cm-1) b) ONCl (BA=2,84 cm-1, BB=0,191 cm-1, BC=0,179 cm-1) c) CH2O (BA=9,40 cm-1, BB=1,29 cm-1, BC=1,13 cm-1)

5. El espectro de microondas de rotación pura del HCl tiene líneas de absorción en los siguientes números de onda (en cm-1): 21,19, 42,37, 63,56, 84,75, 105,93, 127,12, 148,31, 169,49, 190,68, 211,87, 233,06, 254,24, 275,43, 296,62, 317,80, 338,99, 360,18, 381,36, 402,55, 423,74, 444,92, 466,11, 487,30, 508,48. Calcúlese la función de partición rotacional a 298 K por suma directa. 6. Los niveles de energía vibracional de la molécula de I2 respecto al estado fundamental tienen los siguientes números de ondas: 213,30, 425,39, 636,27, 845,39, 1054,38 cm-1.

a) Obténgase la función de partición vibracional calculando explícitamente la suma en la expresión de la función de partición molecular, q, a 100 K y 298 K. Compárense los valores obtenidos con la función de partición calculada, suponiendo que la vibración de la molécula de iodo se puede considerar armónica, siendo el número de ondas en el equilibrio igual a 214,6 cm-1.

b) ¿Qué proporción de moléculas de iodo se encuentra en el estado fundamental y en los dos estados excitados vibracionales inferiores a la temperatura de a) 100 K y b) 298 K?

7. El dióxido de carbono tiene los grados de libertad vibracional siguientes: 1388, 667,4 (doblemente degenerado) y 2349 cm−1. ¿Cuál es la función de partición vibracional total de esta molécula a 1000 K? 8. A partir del espectro vibracional de una nueva molécula diatómica, X2, obtenido a 1000 K, se ha determinado que la fracción de moléculas que ocupa un estado vibracional dado n es como sigue:

n 0 1 2 3 >3 fracción 0,352 0,184 0,0963 0,050 0,318

¿Cuáles son los espaciados energéticos vibracionales del X2? 9. La molécula de NO tiene un estado electrónico excitado que sólo está 121,1 cm-1 por encima del estado fundamental, siendo este estado excitado y el fundamental doblemente


degenerados. Calcúlese y dibújese la función de partición electrónica desde cero a 1000 K. ¿Cuál es la distribución de poblaciones a temperatura ambiente? 10. Los nueve niveles de energía más bajos del vanadio (V) gaseoso tienen las siguientes energías (E, cm-1) y degeneraciones (gn):

n 0 1 2 3 4 5 6 7 8 E 0 137,38 323,46 552,96 2112,28 2153,21 2220,11 2311,36 2424,78 gn 4 6 8 10 2 4 6 8 10

¿Cuál es el valor de la función de partición electrónica para el V a 298 K? 11. Supóngase un sistema con microestados no degenerados y con energías equidistantes En =

n ∆E, siendo ∆E > 0 y n cualquier número entero comprendido entre cero e infinito. a) Obténgase una expresión para la función de partición considerando que la suma de

infinitos términos de una progresión geométrica es a1/(1-r) siendo r la razón de la progresión y a1 el primer término de la progresión geométrica.

b) ¿Cuál sería la función de partición si kT >> ∆E? c) Para el caso del apartado b), dedúzcase una expresión para la energía interna del

sistema. 12. Determínese la energía interna de HCl (B=10,59 cm−1 y =2886 cm−1) bajo las condiciones termodinámicas estándar. 13. La velocidad del sonido, csonido, viene dada por la relación

=

/

donde Cp y Cv son, respectivamente, las capacidades caloríficas a presión y volumen constante, R es la constante de los gases ideales, T es la temperatura y M es la masa molar.

a) ¿Cuál es la expresión de la velocidad del sonido para un gas monoatómico ideal? b) ¿Cuál es la expresión de la velocidad del sonido de un gas diatómico ideal? c) ¿Cuál es la velocidad del sonido en el aire a 298 K, suponiendo que el aire está

compuesto mayoritariamente de nitrógeno (B=2,00 cm-1 y =2359 cm-1)? 14. Determínese la entropía molar estándar del OClO, una molécula triatómica no lineal, donde BA=1,06 cm−1, BB=0,31 cm−1, BC=0,29 cm−1 y =938 cm−1, =450 cm−1 y =1100 cm−1. 15. Determínese las contribuciones rotacional y vibracional a la energía de Gibbs estándar de N2O (NNO), una molécula triatómica lineal, donde B=0,419 cm−1 y =1285 cm−1, =589 cm−1 (doblemente degenerado) y =2224 cm−1. 16. Determínense − (0), − (0), − (0) y para la reacción de disociación !(") 2 !(") a 298 K, sabiendo que la constante rotacional, la frecuencia de vibración y la energía de disociación del Na2 son, respectivamente 0,155 cm−1, 159 cm−1 y 70,4 kJ/mol, y que la degeneración electrónica del estado fundamental del Na es 2. 17. Calcúlese el valor termodinámico estadístico de la constante de equilibrio Kp de la reacción I2 2I a 1000 K. Los datos espectroscópicos para la molécula de I2 son los siguientes: B=0,0373 cm-1, =214,56 cm-1, D0=1,5417 eV. Los átomos de iodo tienen un estado fundamental 2P3/2.

18.* Determínese la constante de equilibrio para la reacción de disociación !(") 2 !(") a 298 K, sabiendo que la constante rotacional, la frecuencia de vibración y la energía de disociación del Na2 son, respectivamente 0,155 cm−1, 159 cm−1 y 70.4 kJ/mol, y que la degeneración electrónica del estado fundamental del Na es 2. ¿Cuál es el valor de la energía de Gibbs estándar de esa reacción a 298 K? 19.* Calcúlense − (0), −(0), − (0) y a 300 K para la molécula de CO2. Los modos de vibración tienen los siguientes números de onda: 1340, 667 (doblemente degenerado) y 2349 cm−1. La constante rotacional es B=0,390 cm−1.


20.* Calcúlense los valores de Δ&, Δ& y Δ& para (") 2(") a 3000 K sabiendo que para el H2 M=2,016 g/mol, D0=432,073 kJ/mol, Θrot=87,547 K, Θvib=6338,2 K y g0=1, y para el H M=1,008 g/mol y g0=2. ¿Cuál es el valor de la constante de equilibrio a 3000 K? 21.* Calcúlese la constante de equilibrio a 800 K para la reacción de intercambio '(") +)*+(") )'(") + *+(") a partir de los siguientes datos: (H2O)/cm-1=3656,7, 1594,8, 3755,8; (DCl) )/cm-1=2145; (HDO) )/cm-1=2726,7, 1402,2, 3707,5; (HCl) )/cm-1=2991; BA(H2O)/cm-1=27,88, BB(H2O)/cm-1=14,51; BC(H2O)/cm-1=9,29; B(DCl)/cm-1=5,449; BA(HDO)/cm-1=23,88, BB(HDO)/cm-1=9,102, BC(HDO)/cm-1=6,417; B(HCl)/cm-1=10,59.

22.* Calcúlense los valores de Δ&, Δ& y Δ& para (") +'(") '(") a 298 K

sabiendo que para el N2 M=28,0134 g/mol, D0=941,4 kJ/mol, Θrot=2,87505 K, Θvib=3392,01 K y g0=1; para el O2 M=31,9988 g/mol, D0=491,888 kJ/mol, Θrot=2,079 K, Θvib=2273,64 K y g0=3; y para el NO M=30,008 g/mol, D0=627,7 kJ/mol, Θrot=2,4520 K, Θvib=2738,87 K, g0=2 y Θelec=174,2 K. ¿Cuál es el valor de la constante de equilibrio a 3000 K? 23.* Calcúlense − (0), −(0), − (0) y a 298 K para la molécula de NO2 sabiendo que M=46,008 g/mol, D0=928,3 kJ/mol, Θrot=4,24301 K, Θvib/K=1088,9, 1953,6, 2396,3 y g0=2.

Lección 5: TEORÍA CINÉTICA DE GASES

Teoría cinética del movimiento y la presión de un gas. Distribución de velocidades

en una dimensión. La distribución de Maxwell de la velocidad molecular. Valores

comparativos de la distribución de velocidad Vmed, Vmp y Vrms. Efusión de un gas.

Colisiones moleculares. Recorrido libre medio.

El propósito de esta lección es deducir propiedades macroscópicas observadas

experimentalmente a partir de un modelo microscópico cuyas características han

de postularse. El modelo será correcto si los resultados obtenidos a partir de él

concuerdan con los datos experimentales. La teoría cinética de los gases es un

ejemplo sencillo de la relación entre teoría y experimento. Desde un punto de vista

estructural, los gases son las sustancias más simples. Por razón de sencillez, aquí

nos ocuparemos sólo de los gases ideales.

Teoría cinética del movimiento y la presión de un gas

La teoría cinética de los gases permite interpretar las leyes de los gases desde el

punto de vista microscópico considerando el movimiento traslacional de las

partículas de un gas. Esta teoría se basa en los siguientes supuestos:

1) El gas está constituido por un número enorme de átomos o moléculas,

llamados genéricamente partículas, requisito necesario para poder trabajar

con promedios estadísticos.

2) La densidad del gas es tal que la distancia entre las partículas es muy

grande en comparación con su tamaño. Por ejemplo, consideremos un mol

de Ar a una temperatura de 298 K y 1 atm de presión. Según la ley del gas

ideal, el gas ocupa un volumen de 24,4 L ó 0,0244 m3. Dividiendo este

volumen por el número de Avogadro obtenemos un valor medio por átomo

de Ar de 4,05 × 10−26 m3 o 40,5 nm3. El diámetro del átomo de Ar es ∼0,29

nm lo que corresponde a un volumen de 0.013 nm3. La comparación del

volumen disponible por partícula con el volumen medio de un átomo de Ar

individual demuestra que sólo un 0.03% del volumen disponible está

ocupado por partículas. Incluso para partículas con diámetros

sustancialmente mayores que el Ar, la diferencia entre el volumen medio

disponible por partícula y el volumen de la partícula misma son tales que la

distancia entre las partículas en fase gas es sustancial. Dada la gran

distancia entre partículas en fase gas, se interpreta que cada partícula se

desplaza a través del espacio como una entidad separada, sin perturbar,

hasta que ocurre una colisión con otra partícula o con las paredes del

recipiente que confina al gas.

3) El movimiento de las partículas se describe mediante las leyes del

movimiento de Newton. Pese a que en los capítulos previos hemos visto que

las descripciones clásicas fallan en la caracterización de muchas de las

propiedades microscópicas de átomos y moléculas, recordemos que el

espaciado de energía entre estados de energía traslacional es muy pequeño

en relación a kT, de forma que una descripción clásica del movimiento

traslacional es apropiada.

4) Las colisiones entre las partículas y con las paredes del recipiente se

consideran perfectamente elásticas, conservándose la energía cinética

traslacional molecular. Esto equivale a ignorar la transferencia de energía

con otras moléculas, la pared, y con los grados de libertad de rotación y

vibración, lo que supone obviar la estructura interna de las partículas. Sin

embargo, conviene matizar que esta restricción se refiere al promedio de

las colisiones. Es decir, la restricción de la conservación de la energía

cinética traslacional se aplica al conjunto de todas las moléculas,

conservándose entonces la energía de traslación media.

Un logro de la teoría cinética de gases es su capacidad para describir la presión de

un gas ideal. La presión ejercida por un gas sobre el recipiente que lo confina

proviene de las colisiones de las partículas del gas con las paredes del recipiente.

Debido a que el número de partículas que componen el gas es del orden del

número de Avogadro, se puede imaginar que el número de colisiones es también

grande. Para describir la presión usando la teoría cinética, una partícula se

interpreta desplazándose a través del espacio con un vector velocidad, , que se

puede descomponer en tres componentes cartesianas: vx, vy y vz como se ilustra en

la Figura 5.1.

Figura 5.1. Descomposición de la velocidad de una partícula, (es decir, v), en sus

componentes cartesianas.

El cuadrado del módulo de la velocidad (v2) en función de sus tres componentes es

(5.1)

La energía cinética de la partícula es (1/2)mv2, de modo que

, , , (5.2)

La ecuación (5.2) implica que la energía traslacional total es, simplemente, la suma

de la energía traslacional según cada dimensión cartesiana. La presión proviene de

las colisiones de las partículas de gas con el contenedor; por tanto, para describir la

presión usando la teoría cinética debemos considerar lo que ocurre durante una

colisión entre una partícula de gas y la pared. La partícula al chocar con la pared

del recipiente le trasmite su momento lineal, lo que origina la presión. La

definición de presión es la de fuerza por unidad de área y, según la segunda ley de

Newton, la fuerza es igual al producto de la masa por la aceleración. Usando estas

dos definiciones, la presión se expresa como

(5.3)

siendo F la fuerza de la colisión, A el área de la pared con la que colisiona la

partícula, m la masa de la partícula, vi la velocidad en la dirección i (i = x, y o z), y pi

el momento lineal de la partícula en la misma dirección i. La ecuación (5.3) ilustra

que la presión está relacionada con el cambio del momento lineal con respecto al

tiempo, y sugiere que el momento se intercambia entre la partícula y la pared

durante la colisión. Debido a la conservación del momento, cualquier cambio del

momento lineal de la partícula debe estar acompañado de un cambio igual y de

signo opuesto del momento de la pared del recipiente. En la Figura 5.2 se describe

una colisión, en la que el cambio del momento lineal de la partícula en la dirección

es -2mvx (nótese que no hay cambio en el momento en las direcciones y o z). En tal

caso, un cambio en el momento igual a 2mvx debe darse en la pared. (Tenga en

mente que la pared es muy pesada; por tanto no se mueve como consecuencia de la

colisión.

Figura 5.2. Representación de la colisión entre una partícula de gas de masa m que

se mueve en la dirección x con una velocidad vx y una pared.

La presión medida en la pared del recipiente es el resultado de la suma de las

colisiones de un gran número de partículas por unidad de tiempo. Por tanto, el

cambio de momento total que da lugar a la presión es igual al producto del cambio

en el momento de la colisión de una única partícula por el número total de

partículas que colisionan con la pared

Δ é"# %&ú()*+(*,é-.,/01 (5.4)

Figura 5.3. Elemento de volumen para determinar el número de colisiones con la

pared por unidad de tiempo.

¿Cuántas moléculas golpean la cara del contenedor en un periodo de tiempo? Para

responder a esta cuestión se debe considerar el tiempo en el que se cuentan las

colisiones. Consideremos un elemento de volumen definido por el área de la pared,

A, y la distancia, ∆x, como se ilustra en la Figura 5.3. El elemento de volumen de

colisión descrito en la Figura 5.3 viene dado por

2 3%∆51 (5.5)

La longitud de la caja, ∆x, está relacionada con el intervalo de tiempo en el que

contamos las colisiones, ∆t, y la componente de la velocidad de la partícula

perpendicular a la cara de la caja (que consideramos que es la dirección x):

∆5 ∆6 (5.6)

En esta expresión, vx es de una única partícula; sin embargo, cuando describamos

las colisiones de una colección de partículas usaremos un promedio de esta

cantidad. Finalmente, el número de partículas que colisionan con la pared del

recipiente en el intervalo de tiempo es igual a la densidad en número, 78, que es

igual al número de partículas del recipiente, N, dividido por el volumen del

recipiente, V, multiplicado por el elemento de volumen colisional de la Figura 5.3:

7 785%3∆61 9:;< %3∆61 (5.7)

El factor 1/2 de la ecuación (5.7) da cuenta de la direccionalidad del movimiento

de las partículas. Las colisiones de interés ocurren con la pared del recipiente

definido por el área A descrita en la Figura 5.3. Debido a que las partículas viajan

bien en la dirección +x o en la −x con igual probabilidad, sólo aquellas moléculas

que viajan en la dirección +x golpearán en el área de interés. Por tanto, el número

total de partículas, N, se divide por dos para tener en cuenta la dirección del

movimiento de la partícula. Empleando la ecuación (5.7), el cambio del momento

lineal de la pared del recipiente consecuencia de las colisiones de las partículas

vendrá dado por

∆ ∆é"# %&ú()*+(*,é-.,/01

%21%71 %21 9:;< >∆

9:;< 3∆6⟨⟩ (5.8)

donde ⟨⟩ representa un valor medio de la velocidad cuadrática en la dirección x,

ya que las partículas muestran una distribución de velocidades, cuya expresión

discutiremos más adelante en esta lección. Con el cambio total del momento lineal

proporcionado por la ecuación (5.8), la fuerza y la correspondiente presión

ejercida por el gas sobre la pared del recipiente, ecuación (5.3), son los siguientes:

A ∆BCBDE∆ 9:;

< 3⟨⟩

9:;

< ⟨⟩ (5.9)

La ecuación (5.9) se puede convertir en una expresión más familiar teniendo en

cuenta que la energía traslacional media de una partícula individual en una

dimensión es

⟨>F⟩ GH

(5.10)

Por tanto,

9:;< ⟨⟩ 9:;

< IJ 9KH< (5.11)

La ecuación (5.11) es la ley del gas ideal. Pese a que esta relación es familiar, la

forma en la que se ha deducido es extremadamente interesante. Empleando una

descripción clásica de las colisiones moleculares con la pared del recipiente, y

escalando este resultado a proporciones macroscópicas, hemos deducido uno de

los resultados centrales de la química de sistemas gaseosos. Un segundo resultado

deducido de la teoría cinética de gases es la relación entre la velocidad cuadrática media y la temperatura. Si el movimiento de las partículas es al azar, las

velocidades medias según las tres dimensiones cartesianas son equivalentes. La

velocidad media en cualquier dimensión será cero debido a que habrá, en

promedio, tantas partículas desplazándose en la dirección positiva como en la

negativa. Por contra, la raíz cuadrada de la velocidad cuadrática media, también

llamada velocidad raíz cuadrática media, viene dada por:

⟨⟩ ⁄ ⟨ ⟩ ⁄ ⟨3⟩ ⁄ NGH ⁄ (5.12)

Así, la teoría cinética predice que la velocidad raíz cuadrática media de las

partículas de gas aumentará con la raíz cuadrada de la temperatura y decrecerá

con la raíz cuadrada de la masa de la partícula.

Distribución de velocidades en una dimensión

La variación de las velocidades de las partículas de un gas puede describirse

mediante la función de distribución de velocidades. Teniendo en cuenta lo visto en

la Lección 1, una función de distribución de velocidades describe la probabilidad

de que una partícula del gas tenga una velocidad en un rango dado. Además, en la

Lección 3, obtuvimos que los espaciados de los niveles de energía traslacionales

son suficientemente pequeños como para que la velocidad se pueda tratar como

una variable continua. En consecuencia, la función de distribución de velocidades

describe la probabilidad de que una partícula tenga una velocidad en el rango vx +

dvx, vy + dvy y vz + dvz.

Sea ΩP , , Q la función que describe la distribución de velocidades para un

conjunto de partículas gaseosas. Dado que las tres componentes de la velocidad (vx,

vy, vz) son independientes entre sí, la función de distribución ΩP , , Q es el

producto de funciones de distribución individuales como sigue:

ΩP, , Q R%1RPQR%1 (5.13)

siendo f(vx) la distribución de velocidades en la dirección x y así sucesivamente.

Suponiendo que el gas está confinado en un espacio isotrópico, la dirección en la

que se mueve la partícula no afecta a las propiedades del gas, y, en consecuencia, la

función de distribución ΩP , , Q sólo depende del módulo de la velocidad (v).

Tomando el logaritmo neperiano de la ecuación (5.13) y derivando la expresión

resultante con respecto a vx mientras se mantienen constantes la velocidades

según las otras dos direcciones se llega a que:

,&Ω%1 ,&R%1 ,&RPQ ,&R%1

S9T%1S> U,V

9W%>1> (5.14)

La ecuación (5.14) se puede reescribir usando la regla de la cadena para la

diferenciación, permitiendo que la derivada de ln con respecto a vx se escriba como

9T%1 SS>U,V 9W%>1> (5.15)

Usando la ecuación (5.1), el segundo factor del primer miembro de la ecuación

(5.15) puede evaluarse fácilmente como:

SS>U,V SS> P Q

⁄ (5.16)

%21P Q

X ⁄ >

Sustituyendo este resultado en la ecuación (5.15) y reagrupando, se obtiene:

9T%1 SS>U,V 9W%>1>

9T%1 > 9W%>1>

9T%1 9W%>1>> (5.17)

Dado que las distribuciones de velocidades son equivalentes en todas las

direcciones, la deducción anterior es también aplicable a vy o vz, de modo que:

9T%1 9WPUQUU (5.18)

9T%1 9W%V1VV (5.19)

La comparación entre las ecuaciones (5.17), (5.18) y (5.19) establece la siguiente

igualdad:

9W%>1>> 9WPUQ

UU 9W%V1VV (5.20)

Para que la ecuación (5.20) sea correcta, cada uno de los miembros de la ecuación

(5.19) debe ser igual a una constante, γ, de forma que

9WPYQYY −[ donde j = x, y, z (5.21)

El signo menos en la ecuación (5.21) hace que [ una cantidad positiva que sirve

para asegurar que f(vj) no diverja cuando vj tiende a infinito. La integración de la

ecuación (5.21) conduce a:

RP\Q 3(X]YF ⁄ (5.22)

El último paso de la deducción es determinar A y γ. Por un lado, A puede calcularse

a partir de la normalización de la función f(vj) en el intervalo −∞ ≤ vj ≤ +∞,

^ RP\Q+\_`X` 1 ^ 3(X]YF ⁄ +\_`

X` (5.23)

1 3 ^ (X]YF ⁄ +\ 3bc]_`X`

3 b ]c

Incluyendo el factor de normalización en (5.22), la distribución de velocidades en

una dimensión es

RP\Q ]c ⁄ (X]YF ⁄

(5.24)

Por otro lado, γ puede evaluarse a partir de la expresión del segundo momento de

la distribución de velocidades con respecto a x, <vx2>, y sabiendo que <vx

2>=kT/m:

⟨⟩ GH ^ R%1_`

X` +

^ _`X` ]c

⁄ (X]>F ⁄ + ]c ⁄ ^ _`

X` (X]>F ⁄ +

]c ⁄ d]bc] e

]

GH

] (5.25)

Con la definición de γ, se llega a la llamada distribución de velocidades de Maxwell–

Boltzmann en una dimensión:

RP\Q cGH

⁄ (XYF ⁄ GH fcKH

⁄ (XfYF ⁄ KH (5.26)

donde m es la masa de la partícula en kg y M es la masa molar en kg mol−1,

obtenida a partir de la expresión que incluye m usando la relación R = NA k. La

distribución de velocidades es igual al producto de un factor pre-exponencial que

es independiente de la velocidad por un factor exponencial que sí depende de ella,

siendo este último término una reminiscencia de la distribución de Boltzmann. En

la Figura 5.4 se representa la distribución de velocidades unidimensional en la

dirección x para el CO2 a 298 K. Nótese que el máximo de la distribución está a 0

ms−1.

Figura 5.4. Distribución de velocidades en una dimensión para CO2 a 298 K.

La Figura 5.5 recoge la función de distribución de velocidades unidimensional de

Ar a dos temperaturas diferentes. Se puede observar el aumento de la anchura de

la distribución con la temperatura, consistentemente con el aumento de la

probabilidad de población de los estados de energía de traslación más elevados

cuyas velocidades son mayores. La Figura 5.6 muestra la distribución para Kr, Ar y

Ne a 298 K. La distribución de velocidades es estrecha para el Kr y ancha para el Ne

reflejando que la distribución depende de la masa.

Figura 5.5. Distribuciones de velocidades en una dimensión para Ar a 298 K (línea

roja) y 1000 K (línea amarilla).

Figura 5.6. Distribuciones de velocidades en una dimensión para Kr (línea roja,

masa molar = 83,8 g mol−1), Ar (línea amarilla, masa molar = 39,9 g mol−1) y Ne

(línea azul, masa molar = 20,2 g mol−1) a 298 K.

La distribución de Maxwell de la velocidad molecular

A partir de las distribuciones de velocidad unidimensionales, se puede determinar

la distribución tridimensional del módulo de la velocidad (v). Nos centramos en el

módulo de la velocidad en vez del vector velocidad porque las propiedades físicas

de los gases sólo dependen de la velocidad de la partícula del gas, y no de la

dirección del movimiento. Por tanto, en general, sólo interesa el módulo de la

velocidad, también llamado rapidez o celeridad. Según vimos:

P Q (5.27)

Para determinar la distribución del módulo de la velocidad de las partículas, F(v),

consideremos la interpretación geométrica de la velocidad mostrada en la Figura

5.7. Esta gráfica describe el espacio de velocidades, en donde por analogía con el

espacio cartesiano en distancia lineal (x, y, z) se han reemplazado las distancias por

las componentes cartesianas de la velocidad (vx, vy, vz). La Figura 5.7 muestra que la

velocidad de la partícula viene descrita por un vector, , con coordenadas vx, vy, y vz

en el espacio de velocidades cuya longitud es igual a la rapidez o módulo de la

velocidad (v), ecuación (5.27).

Figura 5.7. Ilustración del espacio de velocidades. Las componentes cartesianas de

la velocidad de las partículas, , vienen dadas por vx, vy y vz. La capa esférica

representa un elemento de volumen diferencial del espacio de las velocidades,

cuyo volumen es 4πv2dv.

La distribución del módulo de la velocidad de las partículas F(v) se define en

términos de las distribuciones de velocidad unidimensional según cada dirección,

ecuación (5.26), como sigue:

A%1+ R%1RPQR%1+++

g cGH

⁄ (X>F GH⁄ h g cGH

⁄ (XUF GH⁄ h

5 g cGH

⁄ (XVF GH⁄ h +++

cGH

N ⁄ (iXP>F_UF_VFQj GH⁄ +++ (5.28)

La distribución del módulo de la velocidad en la ecuación (5.28) está definida en

términos de las componentes cartesianas del vector velocidad. Esto conduce a

expresar los factores que implican al vector velocidad en términos del módulo de

la velocidad para así obtener F(v)dv. Para lograr esto, de forma similar a la

transformación de coordenadas cartesianas en coordenadas esféricas, se

transforma el elemento infinitesimal de volumen en el espacio de las velocidades,

dvxdvydvz (Figura 5.7), en el elemento volumen de velocidad, 4π2dv, después de la

integración respecto a las variables angulares, quedando únicamente una

dependencia con v. Además, sustituyendo vx2 + vy

2 + vz2 en (5.28) por v2, ecuación

(5.27), se obtiene que:

A%1+ 4l cGH

N ⁄ (XF GH⁄ + (5.29)

La ecuación (5.29) está expresada en términos de la masa de una partícula

individual de gas. Como la masa molar M es igual a NA × m, donde NA es el número

de Avogadro y m es la masa de la partícula, y R = NA × k, la ecuación (5.29) se puede

escribir también en términos de M como:

A%1+ 4l fcKH

N ⁄ (XfF KH⁄ + (5.30)

Las ecuaciones (5.29) y (5.30) son las llamadas distribuciones de velocidad de

Maxwell y representan la distribución de probabilidad de que una molécula tenga

una velocidad entre v y v+dv. La comparación de esta distribución con la

distribución de velocidades unidimensionales de la ecuación (5.26) revela muchas

similitudes siendo la principal diferencia la dependencia con que ahora aparece v2

en el factor pre-exponencial de la ecuación (5.30). Una segunda diferencia es el

rango de la distribución. A diferencia de las componentes de la velocidad, donde

los valores negativos son posibles ya que la partícula puede moverse en la

dirección contraria con respecto a una coordenada dada, la rapidez o módulo dela

velocidad de la partícula debe ser mayor que cero, de forma que la distribución va

de cero hasta infinito.

Figura 5.8. Representación de la distribución de velocidad para Ar a dos

temperaturas (298 K, línea roja, y 1000 K, línea amarilla).

La Figura 5.8 recoge la variación de la distribución de la velocidad de Maxwell con

la temperatura para Ar. A diferencia de la distribución de velocidades de la

ecuación (5.26), la distribución de la rapidez no es simétrica. Esto es debido a que

el aumento inicial de la probabilidad se debe al factor v2 de las ecuaciones (5.29) o

(5.30), pero para valores mayores de rapidez la probabilidad decae

exponencialmente. Segundo, conforme la temperatura crece, se hacen evidentes

dos tendencias. El máximo de la distribución se desplaza a alta rapidez conforme la

temperatura crece. Esto es de esperar porque un aumento de la temperatura

corresponde a un incremento de la energía cinética y subsecuentemente un

crecimiento de la rapidez de las partículas. Sin embargo, no es la distribución

completa la que se desplaza simplemente hacia velocidades mayores. En lugar de

ello, la curvatura de distribución cambia, con este comportamiento muy

pronunciado en la parte de alta rapidez ya que un incremento de kT aumenta la

probabilidad de ocupar los estados traslacionales de energía elevada.

Figura 5.9. Representación de la distribución de velocidad para Kr (línea roja,

masa molar = 83,8 g mol−1), Ar (línea amarilla, masa molar = 39,9 g mol−1) y Ne

(línea azul, masa molar = 20,2 g mol−1) a 298 K.

La Figura 5.9 presenta una comparación de las distribuciones de rapidez de Ne, Ar

y Kr, a 298 K. Los picos de la distribución de rapidez se desplazan hacia menores

valores de la rapidez, conforme aumenta la masa atómica. Este comportamiento se

debe a que la energía cinética media es 3/2 kT, una cantidad que sólo depende de

la temperatura. Como la energía cinética es igual a 1/2 mv2, un aumento de masa

debe compensarse con una reducción de la raíz cuadrática media de la rapidez.

Esta conducta se refleja en las distribuciones presentadas en la Figura 5.9.

Figura 5.10. Esquema de un aparato experimental usado para verificar la

distribución de rapidez de Maxwell. Las moléculas se emiten desde un horno y

pasan a través de ventanas para producir un haz de moléculas. Este haz alcanza un

selector de velocidad que consta de dos discos rotantes con ranuras en cada uno.

Después de pasar el primer disco, las moléculas alcanzan el segundo que ha rotado

un ángulo θ. Sólo las moléculas para las que la velocidad es igual a ωx/θ, donde ω

es la velocidad angular del disco y x es la separación entre los discos, pasarán a

través del segundo disco y alcanzarán el detector.

Una de las primeras comprobaciones experimentales de la ley de distribución de

Maxwell se debe a Miller y Kusch en 1955 [Phys. Rev. 99 (1955), 1314]. En la Figura

5.10 se presenta un esquema del aparato empleado en este estudio. Se usó un

horno para crear un gas a temperatura conocida, y se practicó un orificio en una

cara del horno a través de la cual podía emerger el gas. El chorro de moléculas de

gas que escapaban del horno se dirigió a través de aberturas espaciales para crear

un haz de partículas, que se dirigió hacia el selector de velocidad. Cambiando la

rapidez rotacional de selector de velocidad, se varió la velocidad del gas requerida

para pasar a través del cilindro. Entonces se mide el número de partículas de gas

que pasan a través del cilindro en función de la rapidez rotacional para determinar

la distribución de la rapidez del gas. Los resultados de este experimento para el

potasio en un horno a una temperatura de 466 ± 2 K se presentan en la Figura

5.11. La comparación entre el número de partículas con una cierta rapidez medida

experimentalmente y a la predicción teórica de una distribución de Maxwell es

excelente.

Figura 5.11. Comparación de la distribución experimental de la velocidad de las

partículas de potasio gaseoso a 466 ± 2 K (en círculo) frente a la distribución de

velocidad de Maxwell esperada (línea roja).

Valores comparativos de la distribución de velocidad vmed, vmp y vrms

La distribución de rapidez (o módulo de velocidad) de Maxwell describe la

probabilidad de observar una partícula en un rango de rapidez; sin embargo a

menudo se requiere el conocimiento de la distribución entera cuando se comparan

las propiedades de los gases. En lugar de ello, suelen ser más útiles las cantidades

representativas de esta distribución al indicar cómo cambia la distribución en

función de la masa o la temperatura. Por ejemplo, en la Figura 5.9 se ve claro que

las distribuciones de rapidez del Ne, Ar y Kr son diferentes, pero se puede alcanzar

el mismo resultado sin representar la distribución entera al comparar sólo ciertas

medidas de la distribución, tales como la rapidez a la que la distribución es máxima

o la rapidez media.

El primer valor comparativo que consideramos es la rapidez más probable, vmp,

que es igual a la rapidez a la que F(v) tiene el máximo. Esta cantidad se determina

calculando la derivada de F(v) con respecto a la rapidez:

%1

g4l cGH

N ⁄ (XF GH⁄ h

4l cGH

N ⁄ P(X

F GH⁄ Q

4l cGH

N ⁄ (XF GH⁄ 2 − mGH (5.31)

La rapidez más probable es la rapidez a la que dF(v)/dv es igual a cero, que se dará

cuando el factor contenido en el corchete de la ecuación (5.31) sea igual a cero. En

tal caso, vmp está dada por

2 − nomGH 0

bGH bKHf (5.32)

La velocidad media, vmed, se puede determinar usando la distribución de velocidad

de Maxwell y la definición de valor medio dado en la Lección 1:

q ⟨⟩ ^ A%1+`r

^ g4l cGH

N ⁄ (XF GH⁄ h +`r

4l cGH

N ⁄ ^ N(XF GH⁄ +`r

4l cGH

N ⁄ GH

q sGHc ⁄ sKHcf

⁄ (5.33)

La cantidad final a comparar es la raíz cuadrada de la rapidez cuadrática media,

vrms. Esta cantidad es igual a <v2>1/2 o simplemente la raíz cuadrada del segundo

momento de la distribución:

t⟨⟩u ⁄ NGH ⁄ NKHf ⁄ (5.34)

La ecuación (5.34) es igual a la predicción de la teoría cinética de los gases dada

por la ecuación (5.10). Las posiciones de vmed, vmp y vrms relativas a la distribución

de rapidez para el Ar a 298 K se muestran en la Figura 5.12. Comparando las

ecuaciones (5.32), (5.33) y (5.34) se encuentra que las únicas diferencias entre los

valores son las constantes, lo que se pone de manifiesto cuando se consideran las

relaciones entre esas cantidades. Concretamente, la relación de vrms/vmp= (3/2)1/2 y

vmed/vmp = (4/π)1/2 de forma que vrms > vmed > vmp. Se observa también que los tres

valores de referencia muestran la misma dependencia con T y con la masa de las

partículas: aumentan con la raíz cuadrada de T y decrecen con la raíz cuadrada de

M.

Figura 5.12. Comparación entre velocidad más probable (vmp), velocidad media

(vmed) y velocidad raíz cuadrática media (vrms) para Ar a 298 K.

Efusión de un gas

En los experimentos que verificaron la precisión de la distribución de rapidez de

Maxwell se utilizó el escape de un gas a través de un orificio en la pared del horno

que lo contenía (véase la Figura 5.10). En esta técnica, el gas confinado en la caja

está a una presión finita y separado del vacío por una pared fina del horno que

presenta una abertura. La presión del gas y el tamaño del orificio es tal que las

moléculas no sufren colisiones cuando pasan a través o cerca de la misma. El

proceso en el que un gas pasa a través de una abertura en estas condiciones se

denomina efusión y se emplea para producir un “haz” de partículas de gas. Esta

técnica se usa, por ejemplo, para crear haces atómicos o moleculares que pueden

colisionar con haces de otras moléculas en aras de estudiar la dinámica de las

reacciones químicas. La velocidad con la que escapan las partículas de gas a través

del orificio de un área dada se puede relacionar con la velocidad a la que las

partículas golpean un área de la cara de la caja u horno. Para deducir la velocidad

de efusión del gas, procedemos de forma análoga a como hicimos para deducir la

presión. Sea dNc el número de partículas que golpean la pared del recipiente y

dNc/dt la velocidad de colisión, es decir, el número de colisiones con la pared por

unidad de tiempo. Esta última cantidad es proporcional al área golpeada, A.

Además, la velocidad de colisión dependerá de la velocidad de las partículas de

modo que de un aumento de velocidad resultará un aumento de la velocidad de las

colisiones. Finalmente, la velocidad de colisión será directamente proporcional a la

densidad de partículas, 78, definida como el número de partículas por unidad de

volumen. Según lo anterior, se puede escribir que:

:v 783^ `

r R%1+ (5.35)

La integral de la ecuación (5.35) es la velocidad media de las partículas en la

dirección x de la colisión con el área de interés. Evaluando dicha integral desde

cero a infinito se obtiene:

:v 783^ `

r cGH

⁄ (X>F GH⁄ +

783 cGH

⁄ ^ `r (X>F GH⁄ +

783 cGH

⁄ GH 783 GHc

⁄

:v 783

w q (5.36)

En el paso final, se ha usado la definición de rapidez media, vmed, proporcionada

por la ecuación (5.33). Definiendo el flujo de colisiones, Zc, como el número de

colisiones por unidad de tiempo y por unidad de área, se llega a que:

x" :v ⁄

w78q (5.37)

A veces es más conveniente expresar el flujo de colisiones en términos de la

presión del gas. Para ello, se tiene en cuenta que:

78 :< 9:;

< yGH (5.38)

de modo que Zc se transforma en:

x" y%cGH1z/F y:;

%cfKH1z/F (5.39)

donde m es la masa de la partícula (en kg) y M es la masa molar (en kg mol−1).

La efusión produce un decrecimiento de la presión del gas en función del tiempo.

El cambio de presión está relacionado con el cambio del número de partículas del

recipiente, N, como sigue:

y :|H< GH

<: (5.40)

La cantidad dN/dt se puede relacionar con la velocidad de colisiones, ecuación

(5.39), considerando lo siguiente: primero, si el espacio fuera del recipiente está a

una presión significativamente más baja que el recipiente y escapa una partícula

del recipiente, no retornará. Segundo, cada colisión corresponde a una partícula

que golpea el área del orificio, de forma que el número de colisiones con el área de

la abertura es igual al número de moléculas perdidas, resultando que Nc = N en la

ecuación (5.37) y

: −x"3 Xy

%cGH1z/F (5.41)

donde el signo negativo es consistente con que el número de partículas del

recipiente decrecerá conforme la efusión procede. Sustituyendo el resultado

precedente en la ecuación (5.40), el cambio de presión en función del tiempo es

y G

< Xy%cGH1z/F (5.42)

La integración de la ecuación (5.42) da lugar a la siguiente expresión para la

presión del recipiente en función del tiempo:

r(5 g− < GH

c/h (5.43)

siendo P0 la presión inicial del recipiente. Este resultado demuestra que la efusión

produce un decrecimiento exponencial de la presión del recipiente en función del

tiempo.

Colisiones moleculares

Desde el punto de visto químico el mayor interés de la teoría cinética de gases se

centra en el cálculo de los choques que tienen lugar entre las moléculas, los cuales,

son el paso inicial de cualquier proceso reactivo. Para considerar las colisiones

moleculares se tratarán las partículas del gas como esferas rígidas impenetrables,

caracterizadas por un cierto diámetro. Supongamos que la partícula de interés se

mueve y que todas las demás partículas están quietas. En esta descripción, la

partícula de interés barre un volumen cilíndrico, lo que determina el número de

colisiones que la partícula sufre por unidad de tiempo. En la Figura 5.13 se

describe este cilindro. Las colisiones tienen lugar entre la partícula de interés y las

demás partículas que están posicionadas en el cilindro. El área de la base del

cilindro de colisiones o área de colisión, σ, es dependiente del radio de las

partículas de gas, r, del siguiente modo:

l%) )1 (5.44)

Los subíndices 1 y 2 de la ecuación (5.44) denotan a la pareja de partículas que

colisionan, que pueden ser o no de la misma especie. La longitud del cilindro está

dada por el producto del intervalo de tiempo (dt) y vmed. Por tanto, el volumen del

cilindro total es igual a σvmed(dt) como se describe en la Figura 5.13.

Figura 5.13. Esquema de las colisiones entre esferas rígidas.

Esta deducción del volumen del cilindro no es exactamente correcta, debido a que

las otras moléculas no están estacionarias. Para incorporar el movimiento de las

demás moléculas en la deducción, se introduce el concepto de velocidad efectiva.

Para ilustrar este concepto, imagine dos partículas moviéndose con la rapidez

media descrita en la Figura 5.14. La rapidez efectiva a la que se aproximan las dos

partículas es dependiente de la dirección relativa del movimiento de las partículas.

El primer caso descrito en la Figura 5.14 es el de dos partículas que viajan en la

misma dirección, de modo que <v12>=<v1>-<v2>. Si las partículas fueran idénticas,

la rapidez efectiva sería cero, ya que las moléculas viajarían con una separación

constante y nunca colisionarían. El caso opuesto aparece recogido en el centro de

Figura 5.14. Descripción de la rapidez efectiva en una colisión de dos partículas.

de la figura, donde las partículas viajan en sentidos contrarios y la rapidez efectiva

es <v1>+<v2>. Si las partículas fueran idénticas, entonces <v12>=2<v1>. Una

deducción completa de la rapidez efectiva es complicada y de una forma intuitiva

resulta lo que describe el tercer caso de la Figura 5.14. En este tercer caso, el

ángulo medio de aproximación es 90° y, usando el teorema de Pitágoras, la rapidez

efectiva es igual a

⟨⟩ %⟨⟩ ⟨⟩1 gd8IJle d8IJl

eh

sGHc z

F

zF sGHc

/ (5.45)

donde

Con la rapidez efectiva definida en la ecuación (5.45), definimos ahora el volumen

del cilindro de colisiones. El número de parejas que colisionan en el cilindro es

igual al producto de la densidad en número de partículas de la especie 2 (N2/V) y el

volumen del cilindro, Vcil=σvmeddt (Figura 5.13). Definiendo ahora la frecuencia de

colisión de una partícula, z12, como el número de colisiones que sufre una molécula

individual (denotada por el subíndice 1) con las demás parejas de colisión

(denotadas por el subíndice 2) por unidad de tiempo (dt), z12 es igual al número de

parejas que colisionan divididas por dt:

:F< <vE :F

< n :F< sGHc /

(5.46)

Si el gas está compuesto por un sólo tipo de partículas, µ=m1/2 y la ecuación (5.46)

se convierte en:

:z< √2 sGHcz

/ yz:;KH √2 sKHcfz/

(5.47)

La frecuencia de colisiones total vendrá dada por el número total de colisiones que

tienen lugar entre todas las partículas de gas. La frecuencia de colisiones total para

una colección de dos tipos de moléculas de gas, Z12, está dada por z12 veces la

densidad en número de la especie 1:

x :z< :z

<:F< sGHc

/ yz:;KH yF:;KH sGHc /

(5.48)

Las unidades de Z12 son colisiones por metro cúbico, o número de colisiones por

unidad de volumen. La correspondiente frecuencia de colisiones de un gas que

consta sólo de un tipo de partículas, es

x :z<

√ :z<

sGHcz/

√ yz:;KH

sKHcfz/

(5.49)

El factor 1/2 que aparece en la ecuación (5.49) asegura que cada colisión se cuenta

solamente una vez. La evaluación de las ecuaciones (5.46)-(5.49) requiere el

conocimiento de las secciones eficaces de colisión que a su vez dependen de los

radios de las esferas rígidas efectivas. Como veremos en la próxima lección, estos

valores se pueden determinar midiendo varias propiedades del gas. La Tabla 5.1

proporciona los radios de las esferas rígidas de una variedad de gases comunes

determinados a partir de medidas experimentales. Generalmente, para gases

monoatómicos y moléculas pequeñas los radios son del orden de 0.2 nm.

Tabla 5.1. Parámetros de colisión de varios gases.

Como puede observarse en las ecuaciones (5.48) y (5.49), la frecuencia total de

colisión por unidad de volumen depende del producto de la concentración de las

moléculas implicadas en la colisión. Aquí se puede encontrar el origen

microscópico de que en las leyes de velocidad de una etapa elemental aparezca el

producto de las concentraciones de las especies reactivas.

Recorrido libre medio

Un concepto relacionado con la frecuencia de colisión y que resulta muy útil a la

hora de entender el comportamiento de los gases es el recorrido libre medio, el

cual se define como la distancia media que, en término medio, recorre una

partícula de un gas entre dos colisiones sucesivas. En un intervalo de tiempo dado,

dt, la distancia que una partícula recorre es igual a vmeddt donde vmed es la velocidad

media de la partícula. Además, el número de colisiones que sufre la partícula viene

dado por (z11 + z12)dt, donde se incluyen las frecuencias de cualquier tipo de

colisión en la mezcla binaria. Dadas estas cantidades, el recorrido libre medio, λ,

está dado por la distancia media viajada dividida por el número de colisiones:

n%zz_zF1

n%zz_zF1 (5.50)

Para un gas con un único tipo de partículas, N2 = 0 resultando z12 = 0 y el recorrido

libre medio es

nzz n

z √n KH

yz:;√ (5.51)

La ecuación (5.51) demuestra que el recorrido libre medio disminuye si la presión

o la sección eficaz de colisión de la partícula aumentan. Este comportamiento tiene

un significado intuitivo. Conforme aumente la densidad de partículas (es decir,

conforme la presión aumente), esperamos que la partícula recorra una distancia

menor entre colisiones. También, conforme aumente el tamaño de la partícula es

de esperar que la probabilidad de colisiones aumente, reduciendo, por tanto, el

recorrido libre medio. Una de las suposiciones de la teoría cinética es que la

distancia entre las partículas es grande comparada con sus tamaños. ¿Es

consistente el recorrido libre medio con esta suposición? Para responder a esta

cuestión, volvemos al primer ejemplo proporcionado en esta lección, Ar a una

presión de 1 atm y temperatura de 298 K, para el que el recorrido libre medio es

d J7e1√2 7,98510Xs ≈ 80&

Comparado con el diámetro de 0,29 nm de Ar, el recorrido libre medio demuestra

que un átomo de Ar recorre entre colisión y colisión una distancia media igual a

∼275 veces su diámetro. Por tanto, esta diferencia en las escalas de longitud es

consistente con las suposiciones de la teoría cinética. Para profundizar en el

comportamiento de una colección de partículas gaseosas, la frecuencia de

colisiones se puede usar para determinar la escala de tiempo entre colisiones,

como sigue:

1

%7,98510Xs1%3970X1 2,01510Xr0

Un picosegundo es igual a 10−12 s; por tanto, un átomo de Ar individual sufre, en

promedio, una colisión cada 200 ps. Como veremos más adelante, la descripción

física del movimiento de las partículas de un gas esbozada aquí es crítica para la

comprensión de aspectos importantes de la Química Física como las propiedades

de transporte de los gases y la dinámica de las reacciones químicas.



1. Determínese la expresión de la densidad de probabilidad para la componente x de la velocidad de una muestra de moléculas de O2 a 300 K. Represéntese la función de distribución resultante en el intervalo 0< |vx| <1000 ms-1. 2. Calcúlese la probabilidad de que la componente x de la velocidad de un átomo de neón, en una muestra gaseosa de dicho átomo a 300K, tenga valores inferiores a 500 m s-1. 3. Calcúlese el número de átomos de argón que, en una muestra gaseosa de 1 mol de átomos de argón a 273,15 K, tiene una componente x de la velocidad entre 450 y 460 m s-1. 4. Calcúlese la fracción de moléculas que, en una muestra gaseosa de O2 a 300 K, tienen una velocidad tal que sus componentes se encuentran en los siguientes intervalos: 500,0 < vx < 502,0; 370,0 < vy < 375,0; 420,0 < vz < 423,0. 5. Determínese la densidad de probabilidad para la velocidad de una muestra de moléculas de O2 a 300 K en el intervalo 0 < v < 1000 m s-1. Represéntese la función de distribución resultante. 6. Calcúlese, para el O2 a 15 °C y 1 atm, el cociente de la probabilidad de que una molécula tenga su velocidad en un intervalo infinitesimal dv localizado a 500 m s-1 y la probabilidad de que esté en un intervalo infinitesimal dv localizado a 1500 m s-1. ¿A qué temperatura tendrá el O2(g) la misma densidad de probabilidad de velocidad para v=500 m s-1 y v=1500 m s-1? 7. Calcúlese el porcentaje de moléculas que, en una muestra de O2 a 300 K, tienen velocidades entre (a) 200 y 400 m s-1, (b) 400 y 600 m s-1. 8. ¿Cuál es la proporción de moléculas gaseosas con velocidades menores que la raíz de la velocidad cuadrática media? ¿Cuál es la proporción con velocidades menores que la velocidad media? 9. Un vehículo espacial con un volumen interno de 3,0 m3 choca con un meteorito originándose un orificio de 0,1 mm de radio. Si la presión del oxígeno dentro del vehículo es inicialmente de 0,8 atm y su temperatura es de 298K, ¿cuánto tiempo tardará la presión en reducirse a 0.7atm? 10. Un recipiente que contiene escandio sólido en equilibrio con su vapor a 1690 K, experimenta una pérdida de peso de 10,5 mg en 49,5 minutos, a través de un agujero circular de 0,1763 cm de diámetro. Calcúlese la presión de vapor del Sc a 1690 k en torr. 11. La temperatura media de la superficie de Marte es 220 K y la presión es 4.7 torr. La atmósfera marciana está compuesta principalmente por CO2 y N2, con pequeñas cantidades de Ar, O2, CO, H2O y Ne. Considerando sólo los dos componentes principales, se puede aproximar la composición de la atmósfera marciana como x(CO2) ≈ 0,97 y x(N2) ≈ 0,03. Los diámetros de colisión son 4,6 Å para el CO2 y 3,7 Å para el N2. Para la atmósfera de la superficie marciana, calcúlese: (a) la frecuencia de colisión de una determinada molécula de CO2 con otras moléculas de CO2; (b) la frecuencia de colisión de una determinada molécula de N2 con moléculas de CO2; (c) el número de colisiones por segundo de una determinada molécula de N2; (d) el número de colisiones CO2-N2 por segundo en 1,0 cm3; (e) el número total de colisiones por segundo en 1 cm3. 12. Calcúlese el recorrido libre medio de una molécula de O2 en una muestra de aire a 298 K y 1,00 bar. Supóngase que las fracciones molares de N2 y O2 en el aire son 0,79 y 0,21, respectivamente, y que σ(N2)=0,373 nm y σ(O2)=0,353 nm.

13.* Calcúlese el porcentaje de moléculas de una muestra de H2 que tiene velocidades en el intervalo 200 < v < 600 m s-1 a 300 y 500 K. 14.* La presión de vapor de la plata a 2000 °C es de 170 torr. Calcúlense los gramos de Ag que colisionan por unidad de área (cm2) y de tiempo (s) con las paredes de un recipiente que contiene plata en equilibrio con su vapor a 2000 °C.


15.* Calcúlese el número total de colisiones por segundo y por m3 en la atmósfera terrestre a 25 °C y 1 atm entre:

a) Moléculas de oxígeno. b) Moléculas de nitrógeno. c) Moléculas de oxígeno y de nitrógeno.

Utilícense los siguientes radios moleculares r(O2) = 178 pm y r(N2) = 185 pm. 16.* En un recipiente cúbico de 30 cm de lado se tiene a 300 K y 1 atm de presión una mezcla equimolar de nitrógeno (σ = 3,7 Å) y dióxido de carbono (σ = 4,6Å).

a) Obténgase el recorrido libre medio de las moléculas de CO2. b) En un momento dado se practica en el centro de una de las caras un agujero circular

de 0,2 mm de radio mientras el exterior está vacío. Calcúlese la velocidad inicial de efusión de ambos gases como número de moléculas que se escapan por unidad de tiempo.

c) Calcúlese el tiempo necesario que debe de transcurrir para que en el interior del recipiente quede una mezcla de gases en la proporción molar 40:60.

Lección 6: FENÓMENOS DE TRANSPORTE

Concepto de transporte. Transporte de masa: difusión. Evolución temporal de un

gradiente de concentración. Visión estadística de la difusión. Conducción térmica.

Viscosidad de los gases. Medida de la viscosidad. Difusión y viscosidad en líquidos.

Conducción iónica.

Concepto de transporte

Hasta aquí nos hemos ocupado de la descripción de las propiedades de un sistema

en equilibrio. Sin embargo, ahora consideraremos la aplicación de una

perturbación externa a un sistema de forma que una de sus propiedades se

desplaza fuera del equilibrio. Una vez que la perturbación externa se elimina, el

sistema evolucionará para restablecer la distribución de equilibrio de la propiedad.

Por ejemplo, consideremos una colección de partículas de gas en las que la

distribución espacial de equilibrio de las partículas corresponde a una densidad en

número homogénea en el recipiente. Si la densidad en número de las partículas

fuera mayor en una cara del recipiente que en la otra, entonces las partículas de

gas se trasladarán a través del recipiente para restablecer una densidad en número

homogénea. Esto es, el sistema evoluciona para restablecer una distribución de la

propiedad del sistema que sea consistente con el equilibrio. Los fenómenos de transporte implican la evolución de una propiedad del sistema en respuesta a una

distribución de no equilibrio de la misma. En la Tabla 6.1 se dan las propiedades

del sistema de interés, y cada propiedad se relaciona con los procesos de

transporte correspondientes.

Tabla 6.1. Propiedad transportada y fenómenos de transporte correspondientes.

Un concepto central en los fenómenos de transporte es el flujo, que se define como

la cantidad transferida a través de un área dada en una cantidad de tiempo. El flujo

es una consecuencia del gradiente de una propiedad del sistema y aparecerá en

sentido opuesto a ese gradiente. En el ejemplo anterior, si dividimos el recipiente

Figura 6.1. Representación gráfica del flujo. El flujo de partículas de gas, Jx, se

opone al gradiente de la densidad en número de partículas .

en dos partes con una partición y contamos el número de partículas que se mueven

desde una mitad del recipiente hacia la otra (véase Figura 6.1). El flujo en este caso

es igual al número de partículas que pasan a través de la partición por unidad de

tiempo. La base teórica de todos los procesos de transporte relacionados en la

Tabla 6.1 implica al flujo y el hecho de que el gradiente espacial de una propiedad

del sistema dará lugar al correspondiente flujo. La relación más básica entre el

flujo y el gradiente espacial de la propiedad transportada es:

(6.1)

donde Jx es el flujo expresado en unidades de (área de la propiedad)-1 tiempo-1. La

derivada de la ecuación (6.1) representa el gradiente espacial de la cantidad de

interés (masa, energía, etc.). La relación lineal entre el flujo y el gradiente espacial

de la propiedad es razonable cuando el desplazamiento con respecto al equilibrio

es modesto. De aquí en adelante, supondremos que el desplazamiento de la

propiedad del sistema con respecto al equilibrio es moderado. El signo negativo de

la ecuación (6.1) indica que el flujo tiene lugar en el sentido opuesto al gradiente;

por tanto, el flujo producirá una reducción del gradiente si no se realiza una acción

externa para mantenerlo. Si se mantiene externamente el gradiente en un valor

constante, el flujo también permanecerá constante. De nuevo, consideremos la

Figura 6.1, que presenta un ejemplo gráfico de la relación entre gradiente y flujo.

La densidad del gas es mayor en la parte izquierda del recipiente, de forma que la

densidad de partículas aumenta al ir de la parte derecha a la izquierda del

recipiente. De acuerdo con la ecuación (6.1), el flujo de partículas tiene lugar

oponiéndose al gradiente de la densidad en número, en un intento de hacer la

densidad de partículas espacialmente homogénea. La cantidad final de interés en la

ecuación (6.1) es la constante de proporcionalidad α, denominada coeficiente de transporte. En las secciones siguientes, determinaremos los coeficientes de

transporte para los procesos incluidos en la Tabla 6.1 y deduciremos las

expresiones del flujo implicado en los diversos fenómenos de transporte.

Transporte de masa: difusión

La difusión es el proceso mediante el que la densidad de partículas evoluciona en

respuesta a un gradiente espacial de concentración. Primero consideraremos el

caso de la difusión de un gas ideal y después la difusión en líquidos.

Figura 6.2. Modelo empleado para describir la difusión del gas. El gradiente de la

densidad en número produce la difusión de partículas desde −x a +x. El flujo de

partículas en respuesta al gradiente (el plano de flujo) se ha calculado en el plano

localizado en x = 0. Se consideran dos planos, localizados a la distancia del

recorrido libre medio (±λ), con partículas moviéndose desde esos planos al plano

de flujo.

Consideremos un gradiente de densidad en número de partículas de gas, , como

se describe en la Figura 6.2. Según la ecuación (6.1), habrá un flujo de partículas de

gas opuesto al gradiente que se puede determinar cuantificando el flujo de

partículas por unidad de tiempo que atraviesa un plano imaginario de área A en

x=0 llamado plano de flujo. Consideremos también otros dos planos a ambos lados

del plano de flujo a distancias iguales al recorrido libre medio ±λ. El flujo neto

vendrá, por tanto, de las partículas que se mueven desde cualquiera de estos dos

planos al plano de flujo. Según la Figura 6.2, existe un gradiente de densidad en

número de partículas en la dirección x de forma que:

0 (6.2)

Si el gradiente de fuera igual a cero, el flujo Jx sería igual a cero por la ecuación

(6.1). Sin embargo, esto no significaría que las partículas estuviesen estacionarias.

En lugar de ello, Jx = 0 indica que el flujo a través del plano de flujo de izquierda a

derecha está exactamente equilibrado por el flujo de partículas de derecha a

izquierda. Por tanto, el flujo expresado en la ecuación (6.1) representa el flujo neto,

o suma del flujo en cada dirección a través del plano de flujo y será proporcional al

gradiente espacial de . Para determinar la constante de proporcionalidad de este

problema de transporte de masa, consideremos la densidad en número de

partículas en los planos ±λ:

0 (6.3)

0 + (6.4)

Estas expresiones establecen que el valor de más allá de x = 0 es igual al valor de en x = 0 más un segundo término que representa el cambio de concentración

conforme uno se desplaza hacia los planos ±λ. El proceso de difusión se puede

interpretar como una efusión de partículas a través de un plano o apertura de un

área A. Procediendo de forma similar que en el estudio de la efusión de gases, el

número de partículas, N, que golpean un área dada por unidad de tiempo, es igual a

(6.5)

El flujo de partículas que se trasladan desde el plano –λ al plano de flujo (véase

Figura 6.2), es decir, el número de partículas que se mueven en la dirección +x y

golpean el plano de flujo por unidad de tiempo está dado por:

! (6.6)

"#$%&' #⁄ )*"+,- #⁄ %& !

%&#$"' #⁄

. "

En esta ecuación, hemos empleado la definición de vmed dada en la lección anterior.

Sustituyendo las ecuaciones (6.3) y (6.4) en (6.6) para Jx, el flujo desde los planos -

λ y +λ viene dado por:

*/, '. " '. " 10 2 (6.7)

/, '. " '. " 10 + 2 (6.8)

El flujo total a través del plano de flujo es simplemente la diferencia de flujo entre

los planos ±λ:

3 */, /, '. " 12 2 (6.9)

'# "

Las partículas se mueven desde los planos ±λ hacia el plano de flujo según el eje x.

La Figura 6.3 indica que si la trayectoria de la partícula no está alineada con el eje

x, la partícula no alcanzará el plano de flujo tras recorrer el recorrido libre medio.

En tal caso, pueden darse colisiones con otras partículas, provocando que se aleje

del plano de flujo; por tanto, estas partículas no contribuyen al flujo. La inclusión

de estas trayectorias requiere tomar el promedio de la orientación del recorrido

libre medio, lo que produce una reducción del flujo total en un factor de 2/3,

respecto al dado en la ecuación (6.9). Por ello, el flujo total es

3 '5 " (6.10)

Figura 6.3. Las trayectorias de las partículas alineadas con el eje x (línea de trazos)

hacen que las partículas se trasladen entre los planos sin colisionar. Sin embargo,

las trayectorias no alineadas con el eje x (línea sólida) provocan que la partícula no

alcance el plano de flujo antes de que tenga lugar una colisión con otra partícula.

Esta colisión puede provocar que la partícula se separe del plano de flujo.

Comparando la ecuación (6.10) con la (6.1), vemos que el coeficiente de difusión,

es:

6 '5 " (6.11)

El coeficiente de difusión tiene unidades m2 s-1 en el sistema internacional. Con

esta definición de coeficiente de difusión, la ecuación (6.10) se convierte en:

3 6 (6.12)

Esta ecuación es la llamada primera ley de Fick de la difusión. Puede verse que el

coeficiente de difusión se define usando parámetros deducidos mediante la teoría

cinética de gases como la rapidez media del gas y el recorrido libre medio. Este

último depende de la sección eficaz de colisión. Una crítica a esta aproximación es

que parámetros tales como la velocidad media se deducen usando una distribución

de equilibrio, y esos conceptos ahora se aplican en un contexto de no equilibrio

cuando se discuten los fenómenos de transporte. El desarrollo que se presenta

aquí se lleva a cabo con la suposición de que el desplazamiento del sistema con

respecto al equilibrio es moderado; por tanto, las cantidades basadas en el

equilibrio siguen siendo relevantes. Los fenómenos de transporte también se

pueden describir usando distribuciones de no equilibrio; sin embargo, la

complejidad matemática de esta aproximación se sitúa más allá del objetivo de

este asignatura.

A partir de la expresión del coeficiente de difusión, ecuación (6.11), está clara la

relación entre esta cantidad y los detalles de las partículas del gas. Esta relación

sugiere que se pueden emplear las propiedades de transporte, tales como la

difusión, para determinar parámetros de las partículas, tales como el tamaño

efectivo que describe la sección eficaz de colisión.

Según vimos en la lección anterior la sección eficaz de colisión para un gas puro es

igual a πd2 donde d es el diámetro de la partícula de gas. La ratio de secciones

eficaces de colisión determinadas usando los coeficientes de difusión, es

consistente con un diámetro de He que es un factor 0,89 menor que el de Ar. Sin

embargo, el diámetro de Ar, proporcionado en tablas de radios atómicos, es

aproximadamente 2,5 veces mayor que el de He. El origen de esta discrepancia se

puede remontar a la aproximación de esferas rígidas de las interacciones entre

partículas.

Evolución temporal de un gradiente de concentración

A partir de la ecuación de difusión pueden determinarse cuestiones importantes

como la escala de tiempo de la difusión y el espacio que recorre una partícula en

un tiempo dado mientras difunde. Según la primera ley de Fick, el flujo de

partículas viene dado por

6 (6.13)

Figura 6.4. Descripción del flujo a través de dos planos separados. Si Jx = Jx+dx,

entonces la concentración entre los planos no cambia. Sin embargo, si los flujos no

son iguales, entonces la concentración cambiará con el tiempo.

La cantidad Jx de la ecuación (6.13) es el flujo a través del plano x como se ilustra

en la Figura 6.4. El flujo en el plano x + dx también se puede escribir usando la

primera ley de Fick como:

7 6 7 (6.14)

La densidad de partículas en (x+dx) está relacionada con el correspondiente valor

en x como sigue:

8 + 8 8 + 8 (6.15)

Sustituyendo la ecuación (6.15) en (6.14), el flujo a través del plano (x + dx) es

7 6 1 + -- 82 (6.16)

El cambio de densidad en número de partículas entre los dos planos de flujo de la

Figura 6.4 depende de la diferencia de flujo a través de los dos planos. Si los flujos

son idénticos, la densidad de partículas permanece constante en el tiempo. Sin

embargo, la variación de la densidad en número de partículas con el tiempo

producirá una diferencia de flujo. El flujo es igual al número de partículas que

pasan a través de un área dada por unidad de tiempo. Si el área de los dos planos

de flujo es equivalente, entonces la diferencia de flujo es directamente

proporcional a la diferencia de la densidad en número de partículas. Esto puede

expresarse matemáticamente como:

, 9,*9,:;,

<6 , =6>, + ?-- 8@ABC

, 6 -,- (6.17)

Esta ecuación recibe el nombre de segunda ley de difusión de Fick y ahora

depende tanto de la posición x como del tiempo t. Esta ecuación demuestra que la

evolución con el tiempo del gradiente de concentración es proporcional a la

derivada del gradiente espacial de la concentración. Es decir, a mayor “curvatura”

del gradiente de concentración, relajación más rápida. La resolución de la ecuación

diferencial (6.17) conduce a que:

8, D E#F$GH -⁄ )*- .G⁄ (6.18)

En esta expresión, N0 representa el número inicial de moléculas confinadas en el

plano t=0, A es el área de este plano, x es la distancia al plano y D es el coeficiente

de difusión. La ecuación (6.18) se puede ver como una función de distribución que

describe la probabilidad de encontrar una partícula después de un tiempo t en un

plano situado a una distancia x del plano inicial t=0. En la Figura 6.5 se muestra un

ejemplo de la variación de con el tiempo para especies con D = 10−5 m2 s−1,

aproximadamente equivalente al coeficiente de difusión de Ar a 298 K y 1 atm. La

figura refleja que al aumentar el tiempo, crece a distancias más alejadas del

plano inicial (situado a 0 m).

Figura 6.5. Variación de la densidad en número de partículas, 8, D, en función

del tiempo. Esta densidad en número está definida con respecto a =N0/A, el

número de partículas confinadas en el plano x = 0 de área A (D = 10-5 m2 s-1, valor

típico para un gas a 1 atm y 298 K). Se indica también el correspondiente tiempo

de difusión para un perfil de concentración dado.

De forma similar a otras funciones de distribución encontradas hasta ahora, es más

conveniente usar una medida de la distribución de 8, D en vez de la distribución

entera. Normalmente, se utiliza la raíz del desplazamiento cuadrático medio (xrms),

en la dirección x que se determina como sigue:

8"I ⟨8#⟩' #⁄ 1 FE 8#8, D 8!*! 2' #⁄

1 '#$GH -⁄ 8#)*- .G⁄ 8!*! 2' #⁄

8"I √26D (6.19)

Es decir, el desplazamiento xrms aumenta con la raíz cuadrada del coeficiente de

difusión y del tiempo. Para la difusión en tres dimensiones, el correspondiente

término, rrms, se puede determinar usando el teorema de Pitágoras con la

suposición de que la difusión es equivalente en las tres dimensiones:

M"I √66D (6.20)

Visión estadística de la difusión

El proceso de difusión puede describirse desde un punto de vista estadístico

modelizando el movimiento de las partículas como una serie de desplazamientos

discretos o pasos, de modo que la dirección de un paso no está correlacionada con

la del paso previo (véase Figura 6.6(a)). Es decir, una vez que la partícula ha

efectuado un paso, la dirección del siguiente paso es al azar. Una secuencia de estos

pasos se denomina paseo al azar.

Figura 6.6. (a) Ilustración de un paseo al azar. La difusión de la partícula se

modeliza mediante una serie de pasos discretos (flechas); la longitud de cada paso

es igual, pero la dirección del paso es al azar. (b) Ilustración de un modelo de paseo

al azar unidimensional.

Consideremos una partícula que experimenta un paseo al azar en una única

dimensión x, de forma que la partícula se mueve un paso en la dirección +x o en la

−x (Figura 6.6(b)). Después de un cierto número de pasos, la partícula habrá

efectuado un número total de pasos igual a ∆. Llamando ∆− y ∆+ a los pasos

realizados en las direcciones −x y +x, respectivamente, la probabilidad de que la

partícula se haya desplazado una distancia X desde el origen está relacionada con

el peso asociado a esa distancia según la expresión:

O ∆!∆:!∆R! ∆!∆:!∆*∆:! (6.21)

Esta ecuación es idéntica al peso asociado con la observación de obtener un cierto

número de caras tras el lanzamiento de una moneda ∆ veces. Esta semejanza no es

fortuita porque el modelo de paseo al azar en una dimensión es muy parecido al

lanzamiento de una moneda. Cada resultado de un lanzamiento de moneda es

independiente del resultado previo y sólo es posible uno de dos resultados por

lanzamiento. La evaluación de la ecuación (6.21) requiere expresar ∆+ en términos

de ∆. Esta relación puede deducirse si asumimos que X es igual a la diferencia del

número de pasos en la dirección +x y −x:

S ∆7 ∆* ∆7 ∆ ∆7 2∆7 ∆ (6.22)

T7∆# ∆7

Con esta definición de ∆+, la expresión de W se convierte en

O ∆!U:∆- !∆*U:∆- ! ∆!∆:U- !∆RU- ! (6.23)

La probabilidad de que la partícula se encuentre a la distancia X del origen viene

dada por el peso asociado a esta distancia dividido por el peso total, 2∆, de forma

que:

V WWXYXZ[ W#∆ ∝ )*T- #∆⁄ (6.24)

La constante de proporcionalidad puede deducirse por medio de la evaluación de

la ecuación (6.23) usando la aproximación de Stirling. Como la distancia con la que

se aleja una partícula que se difunde desde el origen es también proporcional a un

término exponencial:

8, D ∝ )*- .G⁄ (6.25)

siendo x la distancia de difusión real, D el coeficiente de difusión y t el tiempo. Para

que estas dos descripciones de la difusión (ecuaciones (6.24) y (6.25)) den lugar al

mismo resultado físico, los exponentes deben ser iguales, de forma que:

-.G T-

#∆ (6.26)

El número total de pasos del paseo al azar, ∆, puede expresarse como el tiempo de

difusión total, t, dividido por el tiempo de un paso del paseo al azar, τ,

∆ ] (6.27)

y x se puede relacionar con el desplazamiento del paseo al azar X usando una

constante de proporcionalidad, xo, que representa la distancia media en el espacio

físico que recorre una partícula entre colisiones,

8 S8 (6.28)

Con estas definiciones de ∆ y X, la sustitución en la ecuación (6.26) conduce a la

siguiente definición de D:

6 E-#] (6.29)

La ecuación (6.29) recibe el nombre de ecuación de Einstein–Smoluchowski. La

importancia de esta ecuación es que relaciona una cantidad macroscópica, D, con

aspectos microscópicos de la difusión, como se describe en el modelo del paseo al

azar. Para reacciones en disolución, xo se toma generalmente como el diámetro de

la partícula. Usando esta definición y el valor experimental de D, se puede

determinar la escala de tiempo asociada a cada paseo al azar.

La ecuación de Einstein–Smoluchowski se puede relacionar con la difusión del gas

descrita previamente. Si igualamos xo con el recorrido libre medio y definimos el

tiempo por paso, como el tiempo medio que invierte una partícula de gas para

trasladarse un recorrido libre medio λ/vmed, entonces el coeficiente de difusión

viene dado por

6 /-#^ _`ab;c '# " (6.30)

Esta es la misma expresión de D obtenida a partir de la teoría cinética de gases en

ausencia de la corrección 2/3 de la trayectoria de las partículas, como se discutió

anteriormente. Por tanto, los puntos de vista estadístico y de la teoría cinética de la

difusión proporcionan descripciones equivalentes de la difusión de un gas.

Conducción térmica

La conducción térmica es el proceso de transporte mediante el que la energía

evoluciona en respuesta a un gradiente de temperatura. La Figura 6.7 describe una

colección de partículas de gas idénticas entre las que sólo existe un gradiente de

temperatura, ya que la densidad del número de partículas es la misma a través de

la caja. El equilibrio se alcanzará cuando el sistema tenga una temperatura idéntica

en todas las regiones de la caja. Como la temperatura y la energía cinética están

relacionadas, la evolución hacia el equilibrio implicará un transporte de energía

cinética desde la zona de la caja de temperatura a la de temperatura baja.

Figura 6.7. Gradiente de temperatura de una colección de partículas de gas (rojo:

regiones con partículas de energía cinética elevada, azul: regiones de energía

cinética baja). Se indican los sentidos del gradiente de energía cinética (y, por

tanto, de temperatura) y del flujo de energía respuesta a este gradiente, Jx.

Supongamos que la conducción térmica sólo se produce mediante una

transferencia de energía debida a las colisiones entre las partículas y que se

establece el equilibrio con el gradiente de energía tras cada colisión, asegurando,

por tanto, que las partículas están en equilibrio con el gradiente tras cada colisión.

De igual modo a como hicimos para la difusión, comenzamos considerando la

transferencia de energía en un gas monoatómico ideal. Recordemos de la Mecánica

Estadística y la Termodinámica que la energía de traslación media de una partícula

de gas monoatómico es 3/2kT. Además de la energía traslacional, las moléculas

diatómicas y poliatómicas pueden transportar más energía en los grados de

libertad rotacional y vibracional, y nuestro tratamiento se extiende brevemente a

esas moléculas más complejas. La energía cinética se transfiere cuando las

partículas golpean una de las caras del plano de flujo. En esta colisión, la energía se

Figura 6.8. Modelo usado para determinar la conductividad térmica de un gas. El

gradiente de temperatura produce la transferencia de energía cinética desde las

regiones de temperatura alta (plano rojo) a las de temperatura temperatura (plano

azul).

transmite desde una de las partes del plano de flujo a la otra. El transporte de

energía y la relajación hacia el equilibrio térmico se consiguen mediante las

colisiones moleculares, no por la difusión ya que la densidad en el número de

partículas es homogénea. Teniendo en cuenta la Figura 6.8, la energía en los planos

±λ con respecto al plano de flujo viene dada por las expresiones:

d d0 e (6.31)

d d0 + e (6.32)

El flujo desde el plano –λ al plano de flujo es:

d8 ! '.d8" (6.33)

donde es la densidad en número de las partículas de gas, que es constante (no

hay gradiente de densidad en número, sólo de energía). Substituyendo (6.31) y

(6.32) en la ecuación (6.33) llegamos a que el flujo de energía desde los planos

±λ al plano de flujo es:

*/, '.d" (6.34)

/, '.d" (6.35)

de modo que el flujo de energía total es:

3 */, /, '."fd dg (6.36)

'." 12 e2

'#" h?i-%& @j

5. k" &

Multiplicando el flujo total por 2/3 del promedio según la orientación de las

trayectorias de las partículas, la expresión del flujo total a través del plano de flujo

se convierte en

3 '# k" & (6.37)

Esta expresión da cuenta del flujo de energía total de un gas monoatómico ideal,

donde la energía transferida por colisión es 3/2kT. La expresión para el flujo total

se puede definir en términos de la capacidad calorífica molar, l+, admitiendo que la

capacidad calorífica molar a volumen constante de un gas monoatómico es 3/2R,

por tanto:

no 5# k (6.38)

Con esta sustitución, el flujo se puede expresar en términos de l+ para las especies

de interés y no está restringido a especies monoatómicas. Sustituyendo (6.38) en la

ecuación (6.39) tenemos que:

3 '5 no" & (6.39)

La comparación de (6.38) con la relación general entre el flujo y el gradiente de la

ecuación (6.1) implica que la constante de proporcionalidad para la transferencia

de energía, llamada conductividad térmica, p& , está dada por

p& '5 no" (6.40)

El análisis de las unidades de la ecuación (6.40) revela que p& tiene unidades de J

K−1 m−1 s−1. Cada factor de la expresión de la conductividad térmica se conoce de la

termodinámica o de la teoría cinética de gases. La presencia del recorrido libre

medio en la ecuación (6.40) demuestra que de forma similar al coeficiente de

difusión, la conductividad térmica se puede utilizar para estimar el radio de esferas

rígidas de gases.

Viscosidad de los gases

Consideremos el flujo de un gas a través de una tubería bajo presión. Algunos gases

fluyen más fácilmente que otros, y la propiedad que caracteriza la resistencia del

flujo es la viscosidad (η). La Figura 6.9 proporciona una vista de un corte del flujo

de un gas entre dos placas. Se puede demostrar experimentalmente que la

velocidad del gas, vx, es mayor en el medio de las dos placas y disminuye conforme

el gas se aproxima a cualquiera de ellas, hasta llegar alcanzar el valor de vx = 0 en el

límite de la placa. Por tanto, hay un gradiente de vx y, en consecuencia, del

momento lineal correspondiente mvx según la coordenada perpendicular a la

dirección del flujo (z en la Figura 6.9).

Figura 6.9. Sección transversal de un fluido que fluye entre dos placas. El fluido

está representado por el área azul que hay entre las placas y la longitud de las

flechas representa la rapidez del fluido.

Figura 6.10. Modelo de caja usado para deducir la viscosidad (planos azules:

planos de velocidad de partículas idénticas con la magnitud de la velocidad dada

por las flechas). El gradiente de momento lineal produce una transferencia de

momento desde las regiones de momento lineal alto (plano azul oscuro) a las de

momento lineal bajo (plano de azul claro). El plano z = 0 es la posición en la que se

determina el flujo del momento lineal en respuesta al gradiente.

Supongamos que el flujo de gas es un flujo laminar, es decir, que el gas se puede

descomponer en capas de rapidez constante, como se recoge en la Figura 6.9. Este

régimen se da en la mayoría de los gases y en algunos líquidos para los que la

velocidad de flujo no es demasiado elevada. A velocidades de flujo elevadas, se

alcanza el régimen de flujo turbulento donde las capas se entremezclan de forma

que no se puede llevar a cabo una disección clara del gas en términos de capas de

la misma rapidez. Aquí nos limitaremos a las condiciones de flujo laminar.

La Figura 6.9 muestra un gradiente del momento lineal en la dirección z; por tanto,

los planos de igual momento lineal son paralelos a la dirección del flujo del fluido,

como se recoge en la Figura 6.10. La transferencia de momento lineal tiene lugar

porque una partícula de una capa de momento colisiona con el plano de flujo y, por

tanto, le transfiere su momento a la capa adyacente. Por analogía con la difusión y

la conductividad térmica, el momento lineal, p, en los planos ±λ está dado por

q q0 rr (6.41)

q q0 + rr (6.42)

El flujo de momento lineal desde los planos ±λ al plano de flujo es:

*/, '.q" (6.43)

/, '.q" (6.44)

De modo que el flujo total viene a ser:

3 '." 12 rr2 (6.45)

'#" 1"+,r r2

'#s" +,r r

Multiplicando la ecuación (6.45) por el factor 2/3 procedente del promedio

orientacional de las trayectorias de las partículas, se obtiene que:

3 '5s" +,r (6.46)

Comparando (6.46) y (6.1), se obtiene que la constante de proporcionalidad entre

el flujo y el gradiente de velocidad está definida como

t '5s" (6.47)

donde la viscosidad del gas, η, aparece en términos de los parámetros deducidos a

partir de la teoría cinética de los gases. Las unidades de viscosidad son el Poise (P)

o 0,1 kg m−1 s−1. Las viscosidades generalmente se dan en µP (10−6 P) para los

gases y cP (10−2 P) para los líquidos.

Medida de la viscosidad

Teniendo en cuenta que la viscosidad es una medida de la resistencia de un fluido a

fluir, se acostumbra a medir la viscosidad de gases y líquidos controlando el flujo

de un fluido a través de un tubo. Para el flujo de un líquido a través de un tubo

redondo en condiciones de flujo laminar, Poiseuille encontró que:

uvu $wxy z-*zH-*H (6.48)

En esta ecuación conocida como ley de Poiseuille, ∆V/∆t representa el volumen de

fluido, ∆V, que pasa a través del tubo en una cantidad específica de tiempo, ∆t; r es

el radio del tubo a través del cual fluye el fluido; η es la viscosidad del fluido; y el

factor entre paréntesis representa el gradiente de presión macroscópico en la

longitud del tubo. La velocidad del flujo es directamente proporcional al radio del

tubo e inversamente proporcional a la viscosidad del fluido, lo que confirma que a

más viscosidad del fluido menor velocidad de flujo. El flujo de un gas ideal a través

de un tubo viene dado por

uvu $w'y|zE V## V'# (6.49)

donde L es la longitud del tubo, P2 y P1 son las presiones a la entrada y salida del

tubo, respectivamente, y P0 es la presión a la que se mide el volumen (P0 es igual a

P1 si el volumen se mide al final del tubo).

Figura 6.11. Viscosímetro de Ostwald.

La viscosidad de los líquidos puede medirse con un viscosímetro de Ostwald

(Figura 6.11). Para ello, se mide el tiempo que transcurre desde que el líquido baje

desde la marca de nivel “alto” a la marca de nivel “bajo” y el fluido fluya a través de

un capilar fino que asegura el flujo laminar. La presión que dirige el líquido a

través del capilar es ρgh, donde ρ es la densidad del fluido, g es la aceleración de la

gravedad y h es la diferencia de niveles del líquido en las dos secciones del

viscosímetro de la Figura 6.11. La diferencia de altura entre los dos niveles del

fluido variará a medida que el líquido fluya, por lo que h representa una altura

media. Como ρgh es la presión que genera el flujo, la ecuación (6.48) se puede

reescribir como sigue:

uvu $wxy ~-*H $wxy ~3 (6.50)

donde l es la longitud del capilar. Esta ecuación se puede reagrupar como:

t $wx ~uv3 ΔD + IΔD (6.51)

siendo + I la constante del viscosímetro que depende de la geometría del mismo.

Todos los parámetros del viscosímetro se pueden determinar a través de la medida

cuidadosa de las dimensiones del mismo; sin embargo, la constante del

viscosímetro se determina generalmente mediante calibración usando un fluido de

densidad y viscosidad conocidas.

Difusión y viscosidad en líquidos

En 1827 Robert Brown demostró por medio de experimentos de microscopía el

movimiento al azar de la difusión de partículas. En la Figura 6.12 se muestra una

partícula de masa m y radio r dentro de un líquido con viscosidadη. El movimiento

de esta partícula está dirigido por las colisiones con las partículas de líquido, que

proporcionan una fuerza que varía con el tiempo, F(t). Descomponiendo F(t) en sus

componentes cartesianas y centrándonos en la componente x, Fx(t), el movimiento

de la partícula en dicha dirección producirá una fuerza de fricción, Ffr,x, debida a la

viscosidad del líquido:

, (6.52)

Figura 6.12. Ilustración del movimiento browniano donde r es el radio de una

partícula esférica que se encuentra dentro de un líquido de viscosidad η y F(t) es la

fuerza que inicia el movimiento por colisión de la bola roja con la partícula de radio

r. El movimiento de la partícula se opone a la fuerza de fricción que es dependiente

de la viscosidad del disolvente.

El signo negativo de la ecuación (6.52) indica que la fuerza friccional se opone a la

dirección del movimiento y f es el coeficiente de fricción, que depende de la

geometría de la partícula y la viscosidad del fluido. La fuerza total sobre la

partícula es la suma de las fuerzas de colisión y fricción:

3, D + ,

s -- D (6.53)

Einstein estudió la ecuación diferencial (6.53) y demostró en 1905 que cuando se

promedia para numerosas colisiones de partículas de fluido, el desplazamiento

cuadrático medio de la partícula en una cantidad específica de tiempo, t, viene

dado por

⟨8#⟩ #%& (6.54)

donde k es la constante de Boltzmann y T es la temperatura. Si la partícula que

sufre difusión es esférica, el coeficiente de fricción está dado por

6tM (6.55)

de modo que

⟨8#⟩ 2 %&$y D (6.56)

La comparación de este resultado con el valor de <x2> determinado a partir de la

ecuación de difusión (6.19) impone que el término entre paréntesis es el

coeficiente de difusión, D, dado por

6 %&$y (6.57)

La ecuación (6.57) es la ecuación de Stokes–Einstein para la difusión de una

partícula esférica y establece que el coeficiente de difusión depende de la

viscosidad del medio, el tamaño de la partícula y la temperatura. Esta forma de la

ecuación de Stokes–Einstein es aplicable a la difusión en disolución, cuando el

radio de la partícula que se difunde es significativamente mayor que el radio de las

partículas del líquido. Para la difusión de una partícula en un fluido de tamaño

similar, los datos experimentales demuestran que la ecuación (6.57) es:

6 %&.$y (6.58)

Esta ecuación se puede usar también para la autodifusión, en la que tiene lugar la

difusión de una molécula de disolvente en el seno del propio disolvente.

A diferencia de los gases, la dependencia de la viscosidad del fluido con la

temperatura es difícil de explicar teóricamente. La principal razón de esta

dificultad es que, en promedio, la distancia entre las partículas de un líquido es

pequeña, y las interacciones intermoleculares llegan a ser importantes cuando se

describen las interacciones entre partículas. Como regla general, a mayor

interacción intermolecular en el líquido mayor viscosidad del líquido. Con respecto

a la temperatura, las viscosidades de los líquidos aumentan conforme la

temperatura disminuye. La razón de este comportamiento es que conforme se

reduce la temperatura, la energía cinética de las partículas también se reduce, y las

partículas tienen menor energía cinética para superar la energía potencial que

proviene de las interacciones intermoleculares, resultando que el fluido es más

resistente al flujo.

Conductividad iónica

La conducción iónica es el fenómeno de transporte mediante el que la carga

eléctrica en forma de iones se desplaza bajo la influencia de un potencial eléctrico.

La cantidad de carga que se mueve es igual a la corriente eléctrica, I, que se define

como la carga, Q, que se desplaza en un intervalo de tiempo dado:

(6.59)

La unidad usada para la corriente es el Amperio (A), que es igual a un culombio (C)

de carga por segundo (s), es decir, 1 A = 1 C s-1. Como la carga de un electrón es

1.602 x 10-19 C, 1,00 A de corriente corresponde al flujo de 6,25 x 1018 electrones

por segundo. La corriente también se puede cuantificar por la densidad de

corriente, j, definida como la cantidad de corriente que fluye a través de un

conductor con una sección transversal de área Área (Figura 6.13):

Á (6.60)

El transporte de carga se inicia por la presencia de una fuerza eléctrica, creada por

un campo eléctrico. En la Figura 6.13, el campo eléctrico que atraviesa el conductor

se genera usando una batería. La densidad de corriente es proporcional a la

magnitud del campo eléctrico, E, y la constante de proporcionalidad se conoce

como conductividad eléctrica, κ:

p (6.61)

Figura 6.13. Sección transversal de un conductor que transporta corriente. Se

muestra además la dirección del campo eléctrico aplicado, Ex, creado por la batería.

La conductividad eléctrica tiene unidades de siemens (S) por metro (m), o S m-1,

donde 1 S es igual a 1 ohm-1. Finalmente, la resistividad, ρ, de un material es la

inversa de la conductividad eléctrica:

' (6.62)

La resistividad se expresa en unidades de Ω m. En la Figura 6.19 se aplica un

campo eléctrico E a un conductor cilíndrico con una sección transversal Área y una

longitud l. Si el cilindro es de composición homogénea, el campo eléctrico y la

densidad de corriente serán equivalentes a través del conductor, de modo que:

v3 (6.63)

Á (6.64)

En la ecuación (6.63), V es la magnitud del potencial eléctrico o diferencia de

potencial entre los extremos del conductor, comúnmente llamado voltaje.

Sustituyendo las ecuaciones (6.63) y (6.64) en la expresión de la resistividad,

ecuación (6.62), se llega a la expresión siguiente:

' v F3 F3 (6.65)

En la ecuación (6.65), se usó la ley de Ohm para reescribir V/I como R, la

resistencia. Esta ecuación demuestra que la resistividad es proporcional a la

resistencia del material, R, en unidades de Ω con una constante de

proporcionalidad que es igual al área, Área, de la sección transversal del conductor

dividida por la longitud del mismo l. La aplicación de una batería a un conductor

(véase Figura 6.13) producirá un campo eléctrico dentro del conductor cuya

dirección se toma en la dirección x. El campo eléctrico está relacionado con el

gradiente del potencial eléctrico según la expresión:

(6.66)

Con esta definición, la ecuación (6.61) se convierte en

'F p (6.67)

El primer miembro de la ecuación (6.67) es el flujo de carga a través del conductor

en respuesta al gradiente de potencial eléctrico. La comparación de la ecuación

(6.67) con la ecuación (6.1) pone de manifiesto que la conductividad iónica se

describe como otro proceso de transporte. La constante de proporcionalidad de

este proceso de transporte es la conductividad eléctrica. Se puede profundizar en

la naturaleza del transporte de carga en disolución mediante la medida de la

conductividad de las disoluciones iónicas. Las medidas se llevan a cabo

usualmente, empleando una célula de conductividad, que es un recipiente en el que

Figura 6.14. Esquema de un circuito eléctrico usado para llevar a cabo medidas de

conductividad eléctrica.

se colocan dos electrodos de área y separación bien definidos y en el que se añade

una disolución de electrolito (Figura 6.14). La resistencia de la célula de

conductividad se mide generalmente usando corrientes alternas para limitar la

aparición de productos de la electrolisis en los electrodos. La resistencia de la

célula se mide usando un puente de Wheatstone como se ilustra en la Figura 6.14.

El principio operativo de este circuito es que cuando los dos “brazos” del puente

tienen igual resistencia, no fluye corriente entre los puntos A y B. En el

experimento, se varía la resistencia R3 hasta que ocurre esto. En estas condiciones,

la resistencia de la célula viene dada por

é33 -iH (6.68)

Si se mide la resistencia de la célula, la conductividad eléctrica de la disolución se

puede determinar usando la ecuación (6.68). La conductividad eléctrica de una

disolución depende del número de iones presentes. La conductividad de las

disoluciones iónicas se expresa como la conductividad molar, Λm, que se define

como:

Λ" (6.69)

donde c es la concentración molar de electrolito. La conductividad molar tiene

unidades de S m2 mol-1. Si κ es linealmente proporcional a la concentración de

electrolito, la conductividad molar será independiente de la concentración. La

Figura 6.15 presenta la conductividad molar medida para una variedad de

electrolitos en función de la concentración en agua a 25°C. Dos tendencias pueden

observarse: primero, ninguno de los electrolitos muestra una conductividad molar

independiente de la concentración; segundo, la dependencia con la concentración

de las diferentes especies indica que los electrolitos se pueden dividir en clasificar

en electrolitos fuertes y débiles. Los electrolitos fuertes como HCl, NaCl, KCl y

CuSO4 presentan una disminución moderada de la conductividad molar con el

aumento de la concentración. Los electrolitos débiles, representados por

CH3COOH, muestran que la conductividad molar es comparable a la de un

electrolito fuerte de concentración baja, pero decrece rápidamente con el aumento

de la concentración.

Figura 6.15. Conductividad molar, Λm, de varios compuestos en función de la

concentración, c. Las medidas se llevaron a cabo en agua a 25°C.

Electrolitos fuertes

La diferencia principal entre electrolitos fuertes y débiles es el grado de formación

de iones en disolución. Los electrolitos fuertes tales como los sólidos iónicos (KCl,

Na2SO4, etc.) y los ácidos y bases fuertes (HCl, NaOH, etc.) existen como especies

iónicas en disolución y su concentración está directamente relacionada con la

concentración de las especies iónicas en la disolución.

En 1900, Kohlrausch demostró que la dependencia de la conductividad molar de

los electrolitos fuertes está bien descrita por la siguiente ecuación:

Λ" Λ" E (6.70)

Esta ecuación, conocida como ley de Kohlrausch, establece que la conductividad

molar de los electrolitos fuertes disminuye linealmente con la raíz cuadrada de la

concentración, con una pendiente dada por la constante b. La pendiente depende

más de la estequiometría de los electrolitos (AB, AB2, etc.) que de la composición.

En la ecuación (6.70), Λ" es la conductividad molar a dilución infinita, es decir, la

conductividad molar esperada si las interacciones interiónicas estuvieran

enteramente ausentes. Es imposible llevar a cabo cualquier medida a dilución

“infinita”; sin embargo, la ley de Kohlrausch refleja que se puede determinar

realmente Λ" por medio de una representación gráfica de Λ" frente a la raíz

cuadrada de la concentración (referida a una concentración estándar, c0,

generalmente 1 M), y extrapolación a c = 0. La Figura 6.16 recoge la conductividad

molar de HCl, KCl y NaCl, inicialmente presentada en la Figura 6.15, pero ahora

muestra la representación de Λ" en función de (c/c0)1/2. La línea continua es un

ajuste de los datos usando la ley de Kohlrausch, y pone de manifiesto la capacidad

de esta ecuación para reproducir la dependencia de la concentración de Λ" para

electrolitos fuertes.

Figura 6.16. Variación de la conductividad molar frente a la raíz cuadrada de la

concentración para tres electrolitos fuertes: HCl, KCl y NaCl. Las líneas continuas

son los ajustes de la ley de Kohlrausch, ecuación (6.70).

Tabla 6.2. Valores de la conductancia molar iónica de iones representativos.

Ion 7 (S m2 mol-1) Ion * (S m2 mol-1)

H+ 0,0350 OH- 0,0199

Na+ 0,0050 Cl- 0,0076

K+ 0,0074 Br- 0,0078

Mg2+ 0,0106 F- 0,0054

Cu2+ 0,0107 NO3- 0,0071

Ca2+ 0,0119 CO32- 0,0139

Kohlrausch demostró también que para los electrolitos fuertes, la conductividad

molar a dilución infinita se puede describir en términos de contribuciones de los

constituyentes iónicos individuales, como sigue:

" 77 + ** (6.71)

En la ecuación (6.71),7y * son el número de especies cargadas positiva y

negativamente, respectivamente, en la fórmula empírica de un electrolito. Por

ejemplo, 7 = * =1 para el NaCl, que está constituido por Na+ y Cl−. La

conductividad molar iónica de los cationes y aniones se denota mediante 7 y *,

respectivamente, y representa la conductividad de un constituyente iónico

individual del electrolito. La ecuación (6.71) se conoce como ley de migración independiente de los iones y establece que en condiciones diluidas la

conductividad molecular de un electrolito es igual a la suma de las conductividades

de sus constituyentes iónicos. La Tabla 6.2 proporciona las conductividades

molares de varios iones en disolución acuosa.

Electrolitos débiles

Los electrolitos débiles sufren sólo una conversión fraccionaria en sus

constituyentes iónicos en disolución. El ácido acético es un ejemplo clásico de

electrolito débil. Los ácidos débiles se caracterizan por una conversión incompleta

a H3O+ y la base conjugada. La dependencia de Λ" con la concentración de un

electrolito débil se puede comprender considerando el grado de ionización. Para

un ácido débil (HA) que se disocia en agua para formar H3O+ y la base conjugada

(A−), la ionización incompleta se puede factorizar en las concentraciones iónica y

electrolítica del modo:

f57g f*g (6.72)

fg 1 (6.73)

donde α es el grado de ionización y c es la concentración inicial de electrolito.

Sustituyendo las ecuaciones (6.72) y (6.73) en la expresión de la constante de

equilibrio de un ácido débil se obtiene:

fi :gfFRgfFg ¡-'*¡ (6.74)

Resolviendo la ecuación (6.74) para α se obtiene

¢£# ?1 + .¢£' #¤ 1@ (6.75)

La conductividad molar de un electrolito débil a una concentración de electrolito

dada, Λm, se relaciona con la conductividad molar a dilución infinita, Λ¥ , por

Λ¥ Λ¥ (6.76)

Usando las ecuaciones (6.75) y (6.76), se puede determinar la dependencia con la

concentración de la conductividad molar y compararla con el experimento. La

relación entre Λm y c para un electrolito débil viene descrita por la ley de dilución de Ostwald:

'¦§ '¦§E + ¦§¢£¨¦§E ©- (6.77)

La Figura 6.17 muestra la comparación del comportamiento predicho por la

ecuación (6.77) con el experimento para el ácido acético (Kc = 1,8 x 10-5, Λ¥ =

0,03957 S m-2 mol-1), observándose un excelente acuerdo. La ley de dilución de

Ostwald se puede usar para determinar la conductividad molar a dilución infinita

para un ácido débil.

Figura 6.17. Comparación de la conductividad experimental y predicha para el

ácido acético (CH3COOH) en función de la concentración, usando la ley de dilución

de Ostwald de la ecuación (6.77). La ordenada en el origen, es igual a 1/Λ¥ .


1. El coeficiente de difusión de Xe a 273 K y 1 atm es 0,5 × 10−5 m2 s−1. (a) ¿Cuál es el área de

colisión de Xe? (b) En las mismas condiciones de presión y temperatura, ¿cuál es el área de

colisión del N2 si su coeficiente de difusión es tres veces mayor que el de Xe?

2. La conductividad térmica del Ar a 300 K y 1 atm es 0,0177 J K-1 m-1 s-1. ¿Cuál es el diámetro

de colisión de un átomo de Ar suponiendo que se comporta como un gas ideal?

3. La viscosidad y la densidad de la sangre humana a la temperatura del cuerpo son 4 cP y 1,0

g cm-3, respectivamente. El flujo de la sangre desde el corazón a través de la aorta es 5 L min-1

en un cuerpo humano en reposo. El diámetro de la aorta es típicamente de 2,5 cm. Calcúlese:

(a) el gradiente de presión a lo largo de la aorta; (b) la velocidad media de la sangre.

4. Calcúlese la distancia cuadrática media recorrida por una molécula de glucosa en agua a 25

°C en 30 minutos. Supóngase que las moléculas de glucosa se difunden a partir de (a) una capa

depositada en el fondo del vaso y (b) un pequeño terrón suspendido en el seno del agua.

¿Cuánto tiempo tardarán las moléculas de glucosa en recorrer una distancia de 1 mm y 1 cm

desde su punto de partida en el caso a? El coeficiente de difusión de la glucosa en agua a 25 °C

es 0,673 x 10-9 m2 s-1.

5. Dos tubos de cobre, cada uno de 3 m de longitud, con un diámetro interno el primero de 2,6

cm y de 1,3 cm el segundo, se conectan en serie. Se establece una presión de 5 atm en el

extremo abierto del tubo más ancho, y del extremo más estrecho sale aceite a una presión de

1 atm. Para el aceite, η = 0,114 Pa s a 15 °C. (a) Calcúlese la presión en el punto en que se unen

los dos tubos. (b) ¿Cuántos litros por minuto pueden obtenerse mediante esta combinación?

6. Los cilindros de gas CO2 se venden en función del peso de CO2. Un cilindro contiene 22,7 kg

de CO2. ¿Cuánto durará este cilindro en un experimento que requiere un flujo de CO2 a 293 K

(η =146 µP) a través de un tubo de 1,00 m de largo y 0,75 de diámetro con una presión de

entrada de 1,05 atm y una presión de salida de 1,00 atm? El flujo se mide a la salida del tubo.

7. Calcúlese la velocidad final de caída de una bola de acero de 1,00 mm de diámetro y 4 mg de

masa, en agua a 25 °C. Repítase el cálculo para glicerina (ρ = 1,25 g cm-3). Las viscosidades del

agua y de la glicerina a 25 °C y 1 atm son 0,89 y 954 cP, respectivamente.

8. El hidrógeno gaseoso se difunde a través de una lámina de paladio de 0,0050 cm de

espesor. Del lado izquierdo de la lámina, el hidrógeno se mantiene a 25 °C y una presión de

750 mm, mientras que del lado derecho se mantiene un buen vacío. Después de 24 h, el

volumen de hidrógeno en el compartimento de la izquierda disminuye en 14,1 cm3. Si el área

de la lámina a través de la cual ocurre la difusión es 0,743 cm2. ¿Cuál es el coeficiente de

difusión del hidrógeno en el paladio?

9. La hemoglobina es una proteína responsable del transporte de oxígeno. El coeficiente de

difusión de la hemoglobina humana en agua a 298 K (η = 0.891 cP) es 6,9 x 10−11 m2 s−1.

Suponiendo que esta proteína se puede aproximar como esférica, ¿cuál es el radio de la

hemoglobina?

10. En un experimento de conductividad se han obtenido los siguientes datos de

conductividad molar frente a concentración molar para un electrolito:

c (M) 0,0005 0,001 0,005 0,01 0,02 0,05 0,1

Λm (S m2 mol-1) 0,01245 0,01237 0,01207 0,01185 0,01158 0,01111 0,01067

Determínese si el electrolito es fuerte o débil y la conductividad molar del electrolito a

dilución infinita.

Lección 7: CINÉTICA QUÍMICA Conceptos básicos: velocidad de reacción, constante de velocidad, ecuación cinética, orden parcial y orden total de reacción. Integración de las ecuaciones cinéticas. Mecanismos de reacción. Influencia de la temperatura en las velocidades de reacción.

La Cinética Química trata esencialmente de las velocidades con que se llevan a cabo las reacciones y de los caminos que éstas siguen. Del estudio de la velocidad de una reacción y de las variables de que depende (concentración, temperatura, presión, etc.) se pueden sacar conclusiones sobre el camino por el que ésta transcurre, es decir, sobre el mecanismo de reacción.

Conceptos básicos: velocidad de reacción, constante de velocidad, ecuación cinética, orden parcial y orden total de reacción Consideremos la reacción homogénea A + B +⋯→ E + F +⋯ (7.1) donde a, b, …, e, f, … son los coeficientes estequiométricos y A, B, …, E, F, … las especies químicas, y supongamos que la reacción se realiza en un sistema cerrado. La velocidad a la cual cualquier reactivo se consume es proporcional a su coeficiente estequiométrico; por tanto,

/ / =

y =

(7.2)

donde t es el tiempo y nA y nB los números de moles de A y B, respectivamente. La velocidad de conversión J para la reacción (7.1) se define como

≡ − = −

= ⋯ =

=

= ⋯ (7.3)

Dado que A desaparece, dnA/dt es negativo y J es positivo. En el equilibrio, J=0. La velocidad de conversión, J, es una magnitud extensiva y, por tanto, depende del tamaño del sistema. La velocidad de conversión por unidad de volumen, J/V, se denomina velocidad de reacción, r:

≡ !" =

" #− $ = ⋯ (7.4)

r es una magnitud intensiva y depende de T, P y de la concentración en el sistema homogéneo. En la mayoría de los sistemas estudiados el sistema es constante o cambia en una cantidad despreciable. Cuando V es esencialmente constante, tenemos

" = %&

= ' = ()*

(7.5)

donde cA≡[A] es la concentración molar de A. Por tanto, para la reacción (7.1)

= − ()* = −

(+* = ⋯ =

(,* =

(-* = ⋯ .constante (7.6)

Las unidades de r son mol dm-3 s-1 y mol cm-3 s-1. Para muchas reacciones se ha encontrado experimentalmente que la forma de r a un tiempo t está relacionada con las concentraciones de las especies presentes en ese tiempo t mediante una expresión del tipo = 6(A*7(B*8 ··· (L*; (7.7) en donde los exponentes α, β, …, λ, llamados órdenes parciales de reacción son, en general, números enteros o semienteros (1/2, 3/2, …). Se dice que la reacción tiene orden α respecto a A, orden β respecto a B, etc. La suma α + β + ··· + λ = n es el orden total (o simplemente el orden) de la reacción. La constante de proporcionalidad k, denominada constante cinética o coeficiente de velocidad, depende de la temperatura y de la presión. La dependencia de k con la presión es pequeña y generalmente no se tiene en cuenta. Puesto que r tiene unidades de concentración dividida por el tiempo, las unidades de k en (7.7) son concentración1-n tiempo-1. En general, k suele expresarse en (dm3/mol)n-1 s-1. La expresión de r en función de las concentraciones, a una temperatura dada, se denomina ecuación cinética. Una ecuación cinética tiene la forma r=f([A], [B], …) para una temperatura dada, en donde f es función de las concentraciones. En la Tabla 7.1 se recogen algunas ecuaciones cinéticas observadas para reacciones homogéneas son: Tabla 7.1. Ejemplos de reacciones químicas homogéneas junto con sus respectivas ecuaciones cinéticas observadas.

(1) H2 + Br2 → 2HBr = 6(H=*(Br=*/=1 + @(HBr*/(Br=* (2) 2N2O5 → 4NO2 + O2 = 6(N=OC* (3) H2 + I2 → 2HI = 6(H=*(I=* (4) 2NO + O2 → 2NO2 = 6(NO*=(O=* (5) CH3CHO → CH4 + CO = 6(CHFCHO*F/= (7.8)

(6) 2SO2 + O2 GHIJ 2SO3 = 6(O=*(NO*=

(7) H2O2 + 2I- + 2H+ → 2H2O + I2 = 6(H=O=*(IK* + 6=(H=O=*(IK*(HL* (8) Hg22+ + Tl3+ → 2Hg2+ + Tl+ = 6 (Hg==L*(TlFL*(Hg=L*

donde los valores de k dependen apreciablemente de la temperatura y difieren de una reacción a otra; en la reacción (1), j es una constante. Las reacciones (1)-(6) transcurren en fase gaseosa; la (7) y la (8) ocurren en disolución acuosa. Para la reacción (1), el concepto de orden es inaplicable. En la reacción (7) cada uno de los dos términos de la ecuación cinética tiene un orden, pero la velocidad de reacción no tiene ninguno. La reacción (5) tiene un orden 3/7. En la reacción (6), el compuesto NO acelera la reacción, pero no aparece en la ecuación química neta, siendo, por consiguiente, un catalizador. En la reacción (8), el orden de reacción con respecto a Hg2+ es -1. Hay que hacer constar también que en las ecuaciones (1), (2), (5), (6), (7) y (8) los exponentes de las ecuaciones cinéticas pueden diferir de los coeficientes de la ecuación química ajustada. Por ejemplo, la reacción (1) tiene una estequiometría muy sencilla, pero su ecuación cinética es complicada. En algunos casos como las reacciones (2) y (3), la ecuación cinética sí refleja la estequiometría de la reacción, pero éste no es el caso general: las ecuaciones cinéticas han de determinarse a partir de medidas de velocidades de reacción y no pueden deducirse a partir de la estequiometría. Estos hechos apuntan a tres problemas. Primero, hay que ver cómo se llega a la ecuación cinética, y al valor de la constante de velocidad, a partir de los datos experimentales. Segundo, hay que ver cómo construir mecanismos de reacción que sean compatibles con la ecuación cinética. Tercero, hay que explicar los valores de las constantes de velocidad y su dependencia con respecto a la temperatura. Integración de las ecuaciones cinéticas

En los experimentos de Cinética Química se miden las concentraciones de las sustancias en tiempos diferentes. El problema es encontrar la ecuación cinética que gobierna la reacción, es decir, la expresión matemática que relaciona la velocidad con las concentraciones. Esto puede resolverse empezando por integrar una ecuación cinética que se supone aplicable para obtener una relación entre las concentraciones y el tiempo que, después, se compara con los datos experimentales. Si no hay acuerdo se prueba otra ecuación cinética y así sucesivamente hasta encontrar la que más se ajusta a los experimentos cinéticos. Veamos, a continuación, la integración de las ecuaciones cinéticas más frecuentes, empezando por las sencillas para luego comentar algunas más complejas. En todos los casos, supondremos que la reacción transcurre a temperatura y volumen constantes. La primera suposición implica que la constante de velocidad sólo depende de la temperatura y la segunda implica que la velocidad de reacción viene dada por la ecuación (7.6). I. Reacciones simples a) Reacciones de primer orden Supongamos que la reacción aA → productos es de primer orden. A partir de las ecuaciones (7.6) y (7.7) puede deducirse que la ecuación cinética para este caso es

= − ()* = 6(A* (7.9)

Esta ecuación diferencial se puede integrar separando variables y teniendo en cuenta que los límites de integración son [A] = [A]0 para t = 0 y [A] = [A] para t = t, respectivamente:

− P ()*

()*()*()*Q = 6 P RS

T (7.10)

− UVW(A*X()*Q()* = 6(S*T (7.11)

VW(A* = VW(A*T − 6S (7.12)

(A* = (A*TKY (7.13) Por tanto, para una reacción de primer orden, [A] decrece exponencialmente con respecto al tiempo y según la ecuación (7.12), una representación de ln[A] frente a t da una línea recta cuya pendiente nos permite conocer el valor de aK. Este producto es una constante cinética que se refiere a la velocidad del cambio de concentración de A. La reacción de descomposición 2N2O5(g) → 4NO2(g) + O2(g) es un ejemplo de reacción de primer orden. La Figura 7.1 recoge la variación experimental de la concentración de las sustancias N2O5, NO2 y O2 con el tiempo. El avance del tiempo trae consigo un aumento de la concentración de los productos y, en consonancia con una cinética de primer orden, se produce una disminución exponencial de la concentración del reactivo.

Figura 7.1. Variación de la concentración de N2O5 (línea roja), NO2 (línea verde) y O2 (línea azul) con el tiempo para la reacción de descomposición 2N2O5(g) → 4NO2(g) + O2(g) a 25 °C. La representación gráfica del ln[N2O5] frente t en la Figura 7.2 refleja un ajuste excelente (R2=0.9999) de los datos experimentales a la ecuación integrada lineal de una reacción de primer orden. La comparación de la recta de ajuste mostrada en la Figura 7.2 con la ecuación (7.12) en la que sustituimos [A], [A]0 y a por [N2O5],

0,00

0,01

0,02

0,03

0 100 200 300 400 500 600 700 800

Co

nce

ntr

ació

n (

M)

t (s)

[N2O5]0 y 2, respectivamente, lleva a deducir que -2k=-0,0017 s-1 y, por tanto, la constante cinética de la reacción tiene un valor de 8,5 x 10-4 s-1.

Figura 7.2. Variación de la concentración de N2O5 con el tiempo para la reacción de descomposición 2N2O5(g) → 4NO2(g) + O2(g) a 25 °C. Para indicar la rapidez de los procesos cinéticos, los químicos utilizan a menudo el concepto de periodo de semirreacción, t1/7. Se define como el tiempo necesario para que una reacción transcurra hasta la mitad del total para completarse. Por tanto, si la concentración inicial de la sustancia original es [A]0, transcurrido t1/2, la concentración ha disminuido hasta [A]0/7. Para una reacción de primer orden, sustituyendo [A] = [A]0/2 y t = t1/2 en (7.12), t1/2 es igual 0,693/(ak). Es decir, el periodo de semirreacción sólo depende de la constante cinética de primer orden y no depende de la concentración inicial. Una magnitud relacionada con t1/2, pero diferente es el tiempo de vida media, τ, de una molécula de reactivo, es decir, la media de los tiempos de vida de todas las moléculas que experimentan la reacción. Si la concentración de estas moléculas para un tiempo cualquiera t es [A], entonces el tiempo de vida media es

Z = P ([*\Q ()*Q (7.14)

Para una reacción de primer orden, sustituyendo (7.13) en (7.14) e integrando se obtiene que τ es igual a 1/(ak). Por consiguiente, t1/2 = 0,693τ. b) Reacciones de segundo orden Las dos formas más comunes de ecuaciones cinéticas de segundo orden son r = k[A]2 y r = k[A][B], donde A y B son dos reactivos diferentes. Supongamos que la reacción aA → productos es de segundo orden con r = k[A]7. Entonces:

= − ()* = 6(A*= (7.15)

ln [N2O5] = -0,0017t - 3,9128R² = 0,9999

-5,50

-5,00

-4,50

-4,00

-3,50

0 200 400 600 800

ln[N

2O

5]

t (s)

Procediendo de una forma similar a la cinética de primer orden deducimos que:

− P ()*

()*]()*()*Q = 6 P RS

T (7.16)

− ^−

()*_()*Q()* = 6(S*T (7.17)

()* =

()*Q + 6S (7.18)

A partir de (7.18), una representación de 1/[A] frente a t da una línea recta de pendiente ak, si r = k[A]7. El periodo de semirreacción para esta reacción de segundo orden es igual a (1/[A]0)ak. Es decir, que t1/2 depende de la concentración inicial de A, a diferencia de lo que sucedía con las reacciones de primer orden. Supongamos ahora que la reacción aA + bB → productos es de segundo orden con r = k[A][B]. Entonces, basándonos en las ecuaciones (7.6) y (7.7) se obtiene que:

− ()* = 6(A*(B* (7.19)

La ecuación anterior presenta tres variables, [A], [B] y t. Por ello, para integrar (7.19) debemos expresar [B] en términos de [A]. Las cantidades de B y A que reaccionan son proporcionales a sus coeficientes estequiométricos b y a, de forma que según las relaciones matemáticas (7.2) tenemos que:

∆a∆b =

(7.20)

Dividiendo por el volumen llegamos a que:

∆(c*∆([* =

(7.21)

Sustituyendo ∆[B] y ∆[A] por ([B]-[B]0) y ([A]-[A]0), respectivamente, y despejando [B] en (7.21) deducimos que:

(B* = (B*T + (A* − (A*T (7.22)

Sustituyendo (7.22) en (7.18), separando [A] y t e integrando, llegamos a las expresiones siguientes:

− P

()*#(+*QKde()*QLd

e()*$= R(A* = 6 P RS=

(7.23)

#(+*QKd

e()*Q$fVW (+*QKd

e()*QLde()*()* g

== 6 S= − S (7.24)

Utilizando (7.22) en (7.24) da

(+*QK()*Q ^VW

(+*()*_

= = 6 S= − S (7.25)

(+*QK()*Q VW

(+*/(+*Q()*/()*Q = 6S (7.26)

En (7.26), [A] y [B] son las concentraciones en el tiempo t y [A]0 y [B]0 las concentraciones en el tiempo 0. La representación del término izquierdo de (7.26) frente al tiempo da una línea recta de pendiente k. El concepto de periodo de semirreacción no es aplicable aquí, ya que cuando [B] = [B]0/2, [A] no es igual a [A]0/2, a menos que los reactivos sean mezclados en proporciones estequiométricas. Un ejemplo de una reacción de segundo orden es la descomposición 2NO2(g) → NO(g) + O2(g). Así, la Figura 7.3(a) pone de manifiesto que la representación gráfica de 1/[NO2] frente a t conduce a una recta de ajuste excelente (R2 = 1), lo que no sucede (R2 = 0,9737) cuando se representan frente al tiempo los valores de ln[NO2] (véase Figura 7.3(b)). (a)

(b)

Figura 7.3. Representación gráfica de (a) 1/[NO2] y (b) ln[NO2] frente al tiempo a partir de un estudio cinético de la reacción de 2NO2(g) → NO(g) + O2(g).

1/[NO2] = 0,5408t + 124,97R² = 1

100

150

200

250

300

350

400

0 100 200 300 400 500

1/[

NO

2]

(M-1

)

t (s)

ln[NO2] = -0,0023t - 4,9333

R² = 0,9737

-6,50

-6,00

-5,50

-5,00

-4,50

0 100 200 300 400 500

ln[N

O2]

t (s)

c) Reacciones de orden n Consideremos sólo una de las muchas posibles ecuaciones cinéticas de orden n.

= − ()* = 6(A* (7.27)

La integración entre [A] = [A]0 para t = 0 y [A] = [A] para t = t da

− P ()*

()*%()*()*Q = 6 P RS

T (7.28)

()*h%ijK()*Qh%ij

KL = −6S para n ≠ 1 (7.29)

()*%hj =

()*Q%hj + W − 16S para n ≠ 1 (7.30)

Sustituyendo [A] = [A]0/2 y t = t1/2 en (7.30), se obtiene como periodo de semirreacción

S/= = =%hjK KY()*Q%hj para n ≠ 1 (7.31)

Las ecuaciones (7.30) y (7.31) valen para todos los valores de n excepto para 1. Tomando logaritmos neperianos en (7.31), se llega a que

VW S/= = VW =%hjK KY − W − 1VW(A*T (7.32)

Una representación de ln(t1/2) frente a ln[A]0 ha de dar una recta con pendiente igual a (n-1). Por tanto, un procedimiento a seguir para determinar el orden de reacción consiste en determinar si el tiempo de vida media cambia o no con la concentración. En el caso de que t1/2 sea constante, la reacción es de primer orden; pero en caso contrario, entonces se representa ln(t1/2) frente a ln[A]0 y de la pendiente de la recta de ajuste obtenida se calcula n. II. Reacciones complejas En la práctica, la mayoría de las reacciones no transcurren según alguno de los procesos sencillos vistos anteriormente, sino por combinaciones de ellos. Tales reacciones se llaman complejas, y aunque no existe un método general para estudiarlas, hay, sin embargo, tres casos relativamente simples que trataremos a continuación. Por combinación de estos casos se pueden explicar muchos mecanismos de reacciones complejas. a) Reacciones reversibles Son aquellas en las cuales los productos de reacción se combinan entre sí para volver a dar los reactivos. Estudiaremos aquí el caso más sencillo en que tanto la reacción directa (reactivos → productos) como la inversa (productos → reactivos) son de primer orden y que los coeficientes estequiométricos son la unidad. Consideremos la reacción reversible

A66lC (7.33)

La velocidad de variación de [A] tiene dos contribuciones: disminuye por la reacción directa a una velocidad kd[A] y aumenta en la reacción inversa a una velocidad ki[C]. Por tanto, la velocidad neta de cambio es

()* = −6(A* + 6l(C* (7.34)

Tenemos que ∆[C] = -∆[A], por lo que [C]-[C]0 = -([A]-[A]0). Sustituyendo [C] = [C]0 + [A]0 - [A] en (7.34) se obtiene

()* = 6l(A*T+6l(C*T − 6+6l(A* (7.35)

En el límite t → ∞, el sistema alcanza el equilibrio, es decir, las velocidades de las reacciones directa e inversa se hacen iguales. En esta situación, la concentración de cada especie es constante y d[A]/dt es 0. Sea [A]eq la concentración de A en el equilibrio. Haciendo d[A]/dt = 0 y [A] = [A]eq en (7.35), obtenemos 6l(A*T+6l(C*T = 6+6l(A*mn (7.36)

Usando (7.35) en (7.34) llegamos a que

()* = 6+6lo(A*mn − (A*p (7.37)

Integrando (7.37), obtenemos

VW ()*K()*qr()*QK()*qr = − 6+6lS (7.38)

(A* − (A*mn = o(A*T − (A*mnpKs (7.39)

siendo j = kd + ki y donde [A]eq puede calcularse a partir de (7.36). La ecuación (7.39) recuerda la (7.13), obtenida para una reacción irreversible de primer orden, tomando [A]eq = 0 y ki = 0. La dependencia temporal de [A] y [C] para la reacción (7.33) con kd/ki igual a 2 se representa en la Figura 7.4. En el equilibrio (t → ∞), al cumplirse que [C]eq + [A]eq = [C]0 + [A]0, entonces (7.36) se transforma en

(t*qr()*qr = Yu

Yv = w (7.40)

donde K es la constante de equilibrio de la reacción reversible.

Figura 7.4. Concentraciones frente al tiempo para la reacción reversible de primer orden A C para el caso kd/ki = 7. b) Reacciones consecutivas Son aquellas en las que el producto de una reacción es el reactivo de la siguiente. El caso más simple corresponde al esquema

A Yj→ B Y]→ C (7.41)

donde por simplicidad consideraremos que ambas reacciones son de primer orden y que los coeficientes estequiométricos son la unidad. Por tanto, las velocidades de las reacciones primera y segunda son, respectivamente, r1 = k1[A] y r2 = k2[B]. Las velocidades con las que varía [B] debido a las reacciones primera y segunda son, respectivamente, (d[B]/dt)1 = k1[A] y (d[B]/dt)2 = -k2[B]. Por tanto,

(+* = 6(A* − 6=(B* (7.42)

Tenemos que

()* = −6(A*,(+* = 6(A* − 6=(B*,(t* = 6=(B* (7.43)

Suponiendo que para t = 0 sólo existe A en el sistema:

(A*T y 0,(B*T = 0,(C*T = 0 (7.44)

Tenemos tres ecuaciones diferenciales acopladas. La primera en (7.43) es la misma que (7.13), y teniendo en cuenta (7.16), se obtiene

(A* = (A*TKYj (7.45)

Sustituyendo (7.45) en la segunda ecuación de (7.43), resulta

(+* = 6(A*TKYj − 6=(B* (7.46)

La integración de esta ecuación conduce a

(B* = Yj()*QY]KYj KYj − KY] (7.47)

Para calcular [C], lo más sencillo es considerar la conservación de la materia. El número de total de moles presentes es constante en el tiempo, de modo que [A] + B] +[C] = [A]0. Utilizando (7.45) y (7.47), resulta

(C* = (A*T #1 − Y]Y]KYj KYj + Yj

Y]KYj KY]$ (7.48)

Figura 7.5. Variación de la concentración con el tiempo para las reacciones consecutivas A → B → C con constantes cinéticas a) k2 = 6k1 y b) k2 = (1/6)k7. La Figura 7.5 muestra curvas típicas de variación de la concentración de A, B y C en función del tiempo para los casos k1 >> k2 y k1 << k7. El caso k1 << k2 es típico de reacciones en las que intervienen especies intermedias inestables como radicales libres. En estas reacciones la velocidad de producción del intermedio es lenta, pero una vez que éste se forma desaparece prácticamente de forma instantánea para dar lugar a productos. En este caso, la concentración de B es pequeña a lo largo de la reacción (Figura 7.5b). En el otro caso, sin embargo, la reacción de B es grande y hay un periodo de inducción para la aparición de C. Cuando d[B]/dt = 0, la [B] alcanza su valor máximo (véase Figura 7.5). El tiempo correspondiente a ese máximo se denomina periodo de inducción, tind, y viene dado por tind =

[ln(k2/k1)]/(k2-k1). Por tanto, el periodo de inducción dependerá de los valores relativos de las constantes cinéticas k1 y k7. c) Reacciones competitivas Las reacciones competitivas, también llamadas paralelas, son aquellas en las que dos o más procesos compiten en la desaparición de un determinado reactivo o en la aparición de un determinado producto. Por ejemplo, la nitración del tolueno puede tener lugar en la posición orto, meta o para. Consideremos el caso más simple, el de dos reacciones irreversibles competitivas de primer orden y con coeficientes estequiométricos igual a 1:

A Yj→ CyA Y]→| (7.49) La ecuación cinética es

()* = −6(A* − 6=(A* = − 6 + 6=(A* (7.50)

Esta ecuación es la misma que (7.13) con k = k1 + k7. Por tanto, (7.17) da

(A* = (A*TK YjLY] (7.51)

Para C tenemos

(t* = 6(A* = 6(A*TK YjLY] (7.52)

de modo que separando variables e integrando desde t = 0 y [C] = 0 hasta t = t y [C] = [C], se obtiene

(C* = Yj()*QYjLY] o1 − K YjLY]p (7.53)

De igual forma, la integración de , d[D]/dt = k2[A] da

(D* = Y]()*QYjLY] o1 − K YjLY]p (7.54)

La suma de las constantes cinéticas k1+ k2 aparece en las expresiones para [C] y [D]. La Figura 7.6 representa [A], [C] y [D] frente al tiempo para k1 = 2k7. En cualquier instante de la reacción se obtiene, dividiendo (7.53) por (7.54):

(t*(~* = Yj

Y] (7.55)

Las cantidades de C y D obtenidas dependen de la velocidad relativa de las dos reacciones competitivas. La relación [C]/[D] nos permite determinar k1/k7.

Mecanismos de reacción

La ecuación química (7.1) nos da la estequiometría global de la reacción, pero no informa acerca del proceso o mecanismo por el que transcurre. Por ejemplo, se ha propuesto que la oxidación de SO2 catalizada por NO, reacción (6) en Tabla 7.1:

2SO2 + O2 GHIJ 2SO3 = 6(O=*(NO*=

transcurre a través del siguiente proceso

O2 + 2NO → 2NO2

NO2 + SO2 → NO + SO3

Como en el primer proceso se producen dos moléculas de NO2, el segundo proceso debe darse dos veces cada vez que ocurra el primero. Sumando dos veces el segundo proceso al primero se obtiene la reacción global 2SO2 + O2 → 2SO3. La reacción global no incluye la especie intermedia NO2 ni el catalizador NO (el cual se gasta en el primer proceso y se regenera en el segundo). Las especies como NO2 se denominan intermedios de reacción. Cada etapa en el mecanismo de reacción recibe el nombre de reacción elemental. Una reacción simple contiene una sola etapa. Una reacción compleja (o compuesta) contiene dos o más etapas elementales. Cualquier mecanismo de reacción que se proponga debe cumplir la ecuación cinética observada. Generalmente, no es posible una deducción exacta de la ecuación cinética a partir de las ecuaciones diferenciales de un mecanismo de reacción que consta de varias etapas, a causa de la dificultad matemática para tratar sistemas de varias ecuaciones diferenciales acopladas. Por ello, se recurre en general a la utilización de aproximaciones. Los métodos aproximados más utilizados son la aproximación de la etapa limitante y aproximación del estado estacionario.

1. Aproximación de la etapa determinante En todo mecanismo de reacción existirán etapas más rápidas y otras más lentas. En la aproximación de la etapa determinante de la velocidad (también llamada de la etapa limitante o aproximación de equilibrio) se supone que el mecanismo de reacción consta de una o más ecuaciones reversibles que permanecen cercanas al equilibrio durante la mayor parte de la reacción, seguidas por una etapa relativamente lenta, la cual, a su vez es seguida por una o más reacciones rápidas. En casos especiales, puede que no existan etapas del equilibrio antes de la etapa limitante o reacciones rápidas después de la misma. Consideremos, por ejemplo, el siguiente mecanismo

A 66KB 6=6K=

C 6F6KF

D (7.56)

donde se supone que la etapa 2 es la limitante. Para que esta suposición sea válida debe cumplirse que k-1 >> k2. La velocidad lenta de B → C comparada con B → A asegura que la mayoría de las moléculas de B se reconvierten en A, antes que den C, asegurando así que la etapa 1 permanece cercana al equilibrio. Además de esto, deberá cumplirse que k3 >> k2 y k3 >> k-2 para asegurar que la etapa 2 actúa como un cuello de botella y que el producto D se forma rápidamente a partir de C. La reacción global viene entonces controlada por la etapa limitante B → C. Dado que estamos examinando la velocidad de la reacción directa A → D, suponemos además que k2[B] >> k-2[C]. Durante los primeros instantes de la reacción, la concentración de C será baja comparada con la de B, cumpliéndose la condición anterior. Así, despreciamos la reacción inversa en la etapa 2. Puesto que la etapa que controla la velocidad se ha considerado esencialmente irreversible, es irrelevante que las etapas rápidas después de la limitante sean reversibles o no. La ecuación cinética observada dependerá sólo de la naturaleza del equilibrio que precede a la etapa limitante y de esta propia etapa. La magnitud relativa de k1, comparada con k2[B] >> k-2, es irrelevante para la validez de la aproximación de la etapa de la velocidad limitante. Por tanto, la constante cinética con k2 de la etapa limitante podría ser mayor que con k1. Sin embargo, la velocidad r2 = k2[B] de la etapa limitante debe ser mucho más pequeña que la velocidad r1 = k1[A] de la primera etapa. Esto se deduce a partir de k2 << k-1 y k1/k-1 ≈ [B]/[A]. Para la reacción global inversa, la etapa limitante es la inversa de la reacción directa. Por ejemplo, para la ecuación inversa de (7.56) la etapa limitante es C → B. Esto se desprende de la desigualdad anterior k-2 << k3 (que establece que la tercera etapa está en equilibrio) y k-1 >> k2 (que indica que B → A es rápida). A modo de ejemplo, apliquemos la aproximación de la etapa determinante a la reacción

HL + HNO= + CHCNH= +hIJCHCN=L + 2H=O (7.57) cuya ecuación cinética observada es

= 6(HL*(HNO=*(BrK* (7.58)

y teniendo en cuenta el mecanismo propuesto siguiente:

HL + HNO= 66K

H=NO=L equilibrio rápido

H=NO=L +BrK Y]→ ONBr + H=O lenta (7.59)

ONBr + CHCNH=Y→CHCN=L + H=O +BrK rápida

La segunda etapa del mecanismo de reacción (7.59) es la etapa determinante de la velocidad de reacción. Como la tercera etapa es mucho más rápida que la segunda, podemos tomar la velocidad de desaparición de ONBr en la tercera etapa, es decir, la velocidad de formación de CHCN=L igual a la velocidad de formación de ONBr en la segunda etapa. Por tanto, la velocidad de reacción es:

= 6=(H=NO=L*(BrK* (7.60)

Teniendo en cuenta que la primera etapa está cerca del equilibrio:

YjYhj = ]GH]i

(i*(GH]* (7.61)

de modo que:

(H=NO=L* = # YjYhj$ (HL*(HNO=* (7.62)

Sustituyendo la ecuación (7.62) en (7.60), se obtiene la ecuación (7.58), confirmando así el mecanismo de reacción propuesto. 2. Aproximación del estado estacionario Este método es particularmente útil cuando en el mecanismo de la reacción participan intermedios muy reactivos, que están presentes en muy pequeñas cantidades durante la reacción. En esos casos, suele ser una buena aproximación considerar que la variación de la concentración de estos intermedios con el tiempo es despreciable en comparación con el resto de especies participantes en la reacción global. De hecho, estos intermedios no aparecerán en la reacción global, aunque sí participen en dos o más de las etapas de las que está constituido el mecanismo. Matemáticamente, la condición del estado estacionario para el intermedio I se puede expresar como

(* ≈ 0 (7.63)

siendo [I] la concentración de dicho intermedio. Esta aproximación supone que (después del periodo de inducción) la velocidad de formación de un intermedio de reacción coincide esencialmente con su velocidad de desaparición, consiguiéndose así que éste se mantenga en una concentración próxima a un valor constante. Para aplicar la aproximación del estado estacionario: (a) se toma la velocidad de reacción r igual a la velocidad de formación de los productos de la última etapa; (b) se elimina la concentración de cualquier intermedio de reacción que aparezca en la ecuación cinética obtenida en (a) usando (7.63) para cada intermedio (c) si en el paso (b) aparecen concentraciones de otros intermedios, se aplica (7.63) a éstos para eliminar sus concentraciones.

Con el fin de demostrar el uso de la aproximación del estado estacionario, utilicemos de nuevo el mecanismo (7.59), propuesto para la reacción (7.57), sin tener en cuenta las suposiciones de que la primera etapa está próxima al equilibrio y que la segunda etapa es lenta. Tenemos, entonces, que:

= tG]i = 6F(ONBr*(CHCNH=* (7.64)

Los intermedios de reacción son ONBr y H=NO=L. Para eliminar el intermedio ONBr de la ecuación (7.64), aplicamos la aproximación del estacionario a esta especie, de modo que:

(HG+*

= 0 = 6=(H=NO=L*(BrK* − 6F(ONBr*(CHCNH=* (7.65)

Despejando (ONBr* en la ecuación (7.65), se obtiene:

(ONBr* = Y]]GH]i(+h*Y(tG]* (7.66)

Sustituyendo la ecuación (7.66) en (7.64), llegamos a que:

= 6=(H=NO=L*(BrK* (7.67)

Para eliminar H=NO=L de la ecuación (7.67), aplicamos la aproximación del estado estacionario a esta especie, de modo que:

]GH]i

= 0 = 6(HL*(HNO=* − 6K(H=NO=L* − 6=(H=NO=L*(BrK* (7.68)

(H=NO=L* = Yj(i*(GH]* YhjLY](+h* (7.69)

Sustituyendo la ecuación (7.69) en (7.67), se obtiene que:

= YjY](i*(GH]*(+h*YhjLY](+h* (7.70)

Suponiendo que 6K>> 6=(BrK*, la ecuación (7.70) se reduce a la ecuación (7.58). Esto equivale a suponer que la velocidad del proceso inverso de la primera etapa es mucho mayor que la velocidad de la segunda etapa, es decir, que la primera etapa está cercana al equilibrio, al igual que en la aproximación de la etapa de la velocidad determinate.

Influencia de la temperatura en las velocidades de reacción

La velocidad de la mayoría de las reacciones es muy sensible a la temperatura, observándose experimentalmente que dicha velocidad aumenta con la temperatura. Se ha observado experimentalmente también que los órdenes de reacción no dependen de la temperatura ni tampoco las concentraciones de los reactivos o productos de reacción. Es, por tanto, la constante de velocidad de reacción la magnitud que varía con la temperatura (véase Figura 7.6(a)) y, en mucha menor cuantía, con la presión. Una regla aproximada, válida para muchas reacciones en disolución, es que cerca de la temperatura ambiente, k se duplica o triplica por cada aumento de temperatura de 10 °C. En 1889, Arrhenius demostró que los datos de la constante k(T) para muchas reacciones podían ajustarse a la expresión 6 = Ke ⁄ (7.71)

donde A y Ea son constantes características de la reacción y R es la constante de los gases; Ea es la llamada energía de activación de Arrhenius y A es el factor pre-exponencial o factor de Arrhenius. Las unidades de A son las mismas que las de k. Las de Ea son las mismas que las de RT, es decir, energía por mol; Ea generalmente se expresa en kcal/mol o kJ/mol. Arrhenius llegó a (7.71) considerando que la influencia de la temperatura en la constante de velocidad sería del mismo tipo que en las constantes de equilibrio y por analogía escribió,

Y = e

] (7.72)

que al integrar da (7.73), suponiendo que Ea es independiente de T.

VW 6 = VW − e o V 6 = V − e

=,FTF (7.73)

Es decir, si la ecuación de Arrhenius se cumple, una representación de log k en función de 1/T ha de dar una línea recta de pendiente -Ea/2,303R y ordenada en el origen log A (véase Figura 7.6(b)). Esto nos permite obtener, respectivamente, Ea y A. El error típico experimental en Ea es 1 kcal/mol y en A es un factor de 3. La ecuación de Arrhenius (7.73) resulta satisfactoria para casi todas las reacciones homogéneas elementales y muchas reacciones complejas. El parámetro de energía de activación introducido por Arrhenius goza de plena vigencia hoy en día. Dicho término caracteriza la influencia de la temperatura en la velocidad de reacción. Una energía de activación pequeña significa poca pendiente en la representación de Arrhenius y que la reacción es tan rápida que poca aceleración o activación se logra elevando la temperatura. Por el contrario, una energía de activación grande significa una reacción lenta, gran pendiente en la representación tipo Arrhenius, y que por tanto se activará sustancialmente al elevar la temperatura. Fue también el propio Arrhenius quien asoció esta energía de activación a la idea de que dos moléculas que colisionan requieren una cantidad mínima en su energía relativa para romper el enlace apropiado y que pueda formarse el nuevo compuesto. Para

Figura 7.6. (a) Variación de la constante de velocidad con la temperatura para la reacción de descomposición de primer orden 2N2O5 → 4NO2 + O2. (b) Representación gráfica de Arrhenius del log k frente al inverso de la temperatura para dicha reacción. una reacción unimolecular se necesita una energía mínima para isomerizar o descomponer la molécula; la fuente de esa energía son las colisiones. La ley de distribución de Maxwell-Boltzmann contiene el factor e-ε/RT, y se encuentra que la fracción de colisiones donde la energía cinética relativa de las moléculas a lo largo de la línea que une sus centros excede el valor εa es igual a e-εa/kBT= e-Ea/RT, siendo Ea=NAεa la energía cinética molecular molar. El aumento rápido de la constante cinética con la temperatura se debe, por tanto, principalmente al aumento en el número de colisiones cuya energía excede la energía de activación (véase Figura 7.7).

(a) (b)

Figura 7.7. Variación de la fracción de colisiones con energía superior a la energía de activación frente a (a) la temperatura y (b) la energía de activación.

La definición general de energía de activación Ea para cualquier proceso cinético, tanto si es función o no de la temperatura, es:

= = Y (7.74)

Si Ea es independiente de T, la integración de (7.74) da (7.71), en donde A es también independiente de T. Tanto si Ea depende o no de T el factor pre-exponencial A para cualquier proceso cinético se define análogamente a (7.71) como: = 6Ke ⁄ (7.75) Las energías de activación empíricas caen en el intervalo de 0 a 80 kcal/mol (330 kJ/mol) para la mayoría de las reacciones químicas elementales y tienden a ser más bajas para reacciones bimoleculares que unimoleculares. Las descomposiciones unimoleculares de compuestos con enlaces covalentes fuertes tienen valores de Ea altos; por ejemplo, para la descomposición gaseosa del CO2 → CO + O, Ea vale 100 kcal/mol. Un límite superior sobre los valores de Ea viene establecido por el hecho de que reacciones con energías de activación muy grandes son demasiado lentas para ser observadas. En reacciones unimoleculares, A suele valer de 1012 a 1015 s-1. En las bimoleculares suele ser normalmente del orden de 108 a 1013 dm3 mol-1 s-1. La recombinación de dos radicales para formar una molécula poliatómica estable no requiere la ruptura de enlaces y la mayoría de dichas reacciones en fase gaseosa tienen una energía de activación nula. Algunos ejemplos son 2CH3 → C2H6 y CH3 + Cl → CH3Cl. Cuando la energía de activación es nula, la constante cinética es esencialmente independiente de T. Las velocidades de muchos procesos fisiológicos varían con T de acuerdo a la ecuación de Arrhenius. Entre otros ejemplos, pueden citarse la velocidad del chirrido de los grillos (Ea = 12 kcal/mol), la velocidad de los destellos de luz de la luciérnaga (Ea = 12 kcal/mol) y la frecuencia de las ondas alfa del cerebro humano (Ea = 7 kcal/mol). Si una reacción tiene lugar mediante dos mecanismos competitivos la constante de velocidad global no tiene por qué obedecer la ecuación de Arrhenius. Supongamos, por ejemplo, que la reacción A → C presenta el mecanismo siguiente:

A Yj→ CyA Y]→ D Y→ C (7.76) en donde el primer paso del segundo mecanismo (A → D) es la etapa limitante del mismo. Entonces

= − ()* = 6(A* + 6=(A* = 6 + 6=(A* (7.77)

y la constante cinética global es 6 = 6 + 6= = Ke,j ⁄ + =Ke,] ⁄ (7.78) que no es del tipo Arrhenius (7.71) a menos que Ea,1 y Ea,2 sean iguales (un mecanismo competitivo para una reacción en fase gaseosa puede ser una reacción heterogénea catalizada por las paredes del recinto). A temperaturas bajas, el mecanismo con menor energía de activación predominará; a temperaturas intermedias ambos mecanismos contribuirán; a temperaturas altas el mecanismo con mayor energía de activación predominará (suponiendo que tiene un factor pre-exponencial sustancialmente alto). Las energías de activación de cada mecanismo pueden obtenerse a partir de las pendientes a altas y bajas temperaturas.



1. Si la reacción N2 + 3H2 → 2NH3 tiene

= -0,006 mol L-1 s-1. ¿Cuánto valdrá en ese mismo

instante

? ¿y

?

2. La constante cinética de la reacción en fase gaseosa 2NO2 + F2 → 2NO2F vale 38 L mol-1 s-1 a 27 0C. La reacción es de primer orden en NO2 y F2. a) Calcúlese el número de moles de NO2, F2 y NO2F presentes después de 10,0 s si se mezclan 2,00 moles de NO2 con 3,00 moles de F2 en un recipiente de 400 L a 27 0C. b) Para las condiciones del apartado a) calcúlese la velocidad de reacción inicial y la velocidad después de 10,0 s. 3. La reacción A + B → C transcurre de acuerdo con una cinetica 1+1. En el curso de un experimento realizado con unas concentraciones iniciales de [A]0=31,4 x 10-3 M, [B]0=21,0 x 10-3 M y [C]0=0, se han medido las siguientes concentraciones de producto en función del tiempo:

103[C]/M 4,45 7,55 11,57 14,04 15,69 16,85 18,62 19,56 20,43 t/min 1 2 4 6 8 10 15 20 30

Determínese la constante de velocidad de la reacción. 4. La constante de velocidad de la reacción en fase gaseosa 2N2O5 → 4NO2 + O2 vale 1,73 x 10-5 s-1 a 25 0C. Su ecuación cinética es r=k[N2O5]. Calcúlese: a) el tiempo de semirreacción para la descomposición del N2O5 a 25 0C, b) la concentración del reactivo una vez transcurridas 24,0 horas si el sistema reactivo se prepara con 0,010 mol/L a 25 0C. 5. La velocidad de reacción de la descomposición de ozono a oxígeno molecular 2O3 → 3O2 es r=k[O3]2/[O2]. El mecanismo propuesto para este proceso es:

O O + O

O + O →2O

Dedúzcase la ecuación de velocidad correspondiente a este mecanismo. ¿En qué condiciones la ecuación cinética experimental y la deducida a partir del mecanismo coinciden? Explíquese por qué disminuye la velocidad de la reacción cuando aumenta la concentración de O2. 6. La ecuación cinética observada para la reacción catalizada por Br- es:

H+ + HNO2 + C6H5NH2

C6H5N2+ + 2H2O r=k[H+][HNO2][Br-] y un mecanismo propuesto es:

1) H + HNO H NO

equilibrio rápido

2) H NO + Br!

→ ONBr + H O lenta

3) ONBr + C#H$NH

→H O + Br! + C#H$N

rápida Dedúzcase la ecuación cinética para este mecanismo y relaciónese la constante cinética observada con las constantes cinéticas del mecanismo propuesto. 7. Calcúlese la energía de activación de la reacción global para una reacción que tiene el siguiente mecanismo:

1) A + B C + D equilibrio rápido Ea,1=120 kJ/mol y Ea,-1=96 kJ/mol 2) 2C → G + H lenta Ea,2=196 kJ/mol

8. Los valores de k para la reacción 2 HI → H2 + I2, son 1,2 x 10-3 y 3,0 x 10-5 M-1 s-1 a 700 y 629 K, respectivamente. Calcúlense Ea y A. 9. Calcúlese, a través de la teoría de colisiones, la constante de velocidad para la reacción H2 + I2 → 2HI a 700 K; utilizando un diámetro de colisión de 4,5 Å y una energía de activación de 40 kcal mol-1. Estímese el factor estérico sabiendo que el valor experimental de la constante de velocidad es 6,42 x 10-2 L mol-1 s-1.


10. Para la reacción entre el isocianato de m-tolueno y el alcohol n-butílico se han obtenido las siguientes constantes de velocidad de segundo orden:

T(0C) 0,0 7,0 15,0 25,0 105k (L mol-1 s-1) 4,04 7,72 12,9 25,0

Calcúlese la energía de activación y el factor de frecuencia. Usando la teoría del estado de transición (TET), calcúlese la entropía de activación a 298 K. 11. Calcúlese, por medio de la TET, la constante de velocidad de la reacción de intercambio D + H2 → DH + H a T=450 K y compárese con el valor experimental k=9 x 109 cm3 mol-1 s-1. Datos:

Reactivos Estructura de Transición parámetros H-H D [H-----H----D]≠

d(H-H)/Å 0,741 0,930 d(H-D)/ Å 0,930 &/cm-1 4400 1764 (1), 870 (2)

M/g mol-1 2,0156 2,0014 4,0297 I/g cm2 4,5945 x 10-41 3,9788 x 10-40

La diferencia de energía entre los estados electrónicos fundamentales de los reactivos y el estado de transición, ∆ε0≠, es 8,33 kcal/mol, es decir, 5,79 x 10-20 J. 12. La reacción de substitución nucleofílica en fase gas entre el fluoruro de metilo y el anión cloruro transcurre desde un complejo ion-dipolo (un solo reactivo) hasta productos a través de un estado de transición, tal y como se expresa a continuación:

F-CH3--------Cl- → [(F---CH3---Cl)-]≠ Mediante cálculos teóricos se han determinado las siguientes propiedades del complejo reactivo y del estado de transición a 298 K:

complejo reactivo estado de transición M (uma) 69,5 69,5

qrot 1,393 x 104 1,082 x 104 qvib 23,51 3,703

energía potencial (kcal/mol) 0,0 27,01 energía del punto cero (kcal/mol) 24,93 23,66

entalpía (kcal/mol) 0,0 25,32 a) Calcúlese, mediante la teoría del estado de transición, la constante de velocidad a 298 K, en unidades del sistema internacional. Supóngase que no existen estados electrónicos de baja energía ni en el complejo reactivo ni en el estado de transición. b) Calcúlese la entalpía, entropía y energía libre de activación, así como el factor pre-exponencial y la energía de activación a 298 K.

13.* Algunos datos de la dimerización 2A →A2 de un cierto óxido de nitrilo (compuesto A) en una disolución de etanol a 40 0C son:

[A]/M 68,0 50,2 40,3 33,1 28,4 22,3 18,7 14,5 t/min 0 40 80 120 160 240 300 420

Calcúlese el orden de reacción y la constante cinética usando el método del tiempo de semireacción. 14.* Para la reacción A + B → C + D, en un experimento con [A]0 =400 mmol L-1 y [B]0=0,400 mmol L-1 se obtuvieron los resultados siguientes:

104[C]/M 0 2,00 3,00 3,50 4,00 t/s 0 120 240 360 ∞

y en un experimento con [A]0 =0,400 mmol L-1 y [B]0 =1000 mmol L-1 dio: 104[C]/M 0 2,00 3,00 3,50 4,00 10-3t/s 0 69 208 485360 ∞

Determínese la ecuación cinética y la constante cinética.


15.* El cerio (IV) oxida al talio (I) en disolución según la reacción Tl+ + 2Ce4+ → Tl3+ + 2Ce3+. Las etapas elementales correspondientes a un mecanismo propuesto son:

1) Ce4+ + Mn2+ → Ce3+ + Mn3+ 2) Ce4+ + Mn3+ → Ce3+ + Mn4+ 3) Tl+ + Mn4+ → Tl3+ + Mn2+

a) Identifíquese el catalizador, los intermedios y la etapa limitante si la ecuación de velocidad experimental es r=k[Ce4+][Mn2+]. Exprésese la constante de velocidad experimental en función de las constantes de velocidad de las etapas elementales del mecanismo de reacción propuesto. b) Dedúzcase la ecuación cinética correspondiente a ese mecanismo si no se conociera la etapa limitante. 16.* Los datos siguientes corresponden a la reacción 2H2(g) + 2NO(g) → 2H2O(g) + N2(g):

experimento [H2]/M [NO]/M r0/M s-1 1 0,010 0,025 2,4 x 10-6 2 0,0050 0,025 1,2 x 10-6 3 0,010 0,0125 0,60 x 10-6

a) Determínese la ecuación de velocidad de la reacción. b) Calcúlese la constante de velocidad de la reacción c) Propóngase un mecanismo de reacción que concuerde con la ecuación cinética (supóngase que el átomo de O es un intermedio). d) Estudios más minuciosos de la reacción mostraron que la ecuación cinética era:

( =)*NO H

1 + ) H

¿Qué sucede con la ecuación cinética a concentraciones de hidrógeno muy altas o muy bajas? 17.* A partir de los valores de la constante de velocidad para la descomposición térmica monomolecular en fase gas del hexodiciclopentadieno, calcúlense los parámetros de Arrhenius así como la entalpía y entropía de activación a 543,6 K.

T (K) 473,7 494,8 516,2 536,5 600,3 628,1 104r (s-1) 0,947 4,50 27,2 116,0 5640 17430

18.* Calcúlese la energía libre de Gibbs, la entalpía y la entropía de activación para la reacción de hidrogenación del eteno a 628 K sabiendo que A=1,24 x 106 M-1 s-1 y Ea=180 kJmol-1.

Lección 8: ASPECTOS TEÓRICOS EN CINÉTICA QUÍMICA

Teoría de colisiones. Teoría del estado de transición. Formulación termodinámica

de la teoría del estado de transición. Reacciones químicas en disolución.

En esta lección se aporta una descripción teórica de las constantes de velocidad de

reacción en fase gaseosa. Algunos de estos resultados se extenderán al caso de

reacciones en disolución.

Teoría de colisiones

La Teoría de Colisiones fue desarrollada hacia 1920 y parte de las siguientes

suposiciones para encontrar una expresión de la constante de velocidad para una

reacción elemental bimolecular en fase gaseosa (B + C → Productos):

a) Las moléculas se tratan como esferas rígidas, caracterizadas por un diámetro d.

b) Para que se produzca una reacción entre las moléculas B y C debe producirse

una colisión entre ambas moléculas.

c) No todos los choques dan lugar a la reacción; la reacción sólo se produce si, y

sólo si, la energía cinética traslacional relativa a lo largo de la línea que une los

centros de las moléculas que colisionan supera una cierta energía umbral ε0.

d) Durante la reacción se mantiene en todo momento la distribución de equilibrio

de Maxwell-Boltzmann para las velocidades moleculares.

Según la Teoría Cinética de Gases, el número de colisiones entre moléculas de B y C

por unidad de tiempo y volumen es:

= =

⟨⟩ =

/ (8.1)

donde NB y NC son el número de moléculas de B y C, respectivamente, V es el

volumen, σ es el área o sección de colisión, k es la constante de Boltzmann, T es la

temperatura y µ es la masa reducida.

Si cada colisión produjera una transformación de B y C en productos (es decir, si

todas las colisiones fueran eficaces), entonces el número de moléculas de tipo C

que desaparecerían por unidad de tiempo y volumen sería igual a ZBC,

−

= = ⟨⟩

(8.2)

que expresada en moles (ni) resulta:

−

= ⟨⟩

(8.3)

donde NA es el número de Avogadro. En consecuencia, la velocidad de reacción a

volumen constante valdría:

− ! = ⟨⟩ "! #! (8.4)

de modo que:

$% = ⟨⟩ = / (8.5)

La ecuación (8.4) logra explicar la dependencia observada experimentalmente de

la velocidad de reacción con el producto de las concentraciones de B y C. Sin

embargo, la ecuación (8.5) muestra una dependencia errónea de la constante de

velocidad con la temperatura y, además, conduce a sobreestimaciones

significativas de las velocidades de reacción. Por ejemplo, para la reacción entre H2

e I2 para dar ioduro de hidrógeno, la densidad de frecuencia de colisiones en una

mezcla equimolecular en condiciones estándar es aproximadamente igual a 1035 m-

3 s-1, lo que conduce a una velocidad del orden de 108 mol L-1 s-1, es decir, que

reaccionarían 100 millones de moles por litro y segundo.

La experiencia demuestra que no todas las colisiones son reactivas, sino que para

que esto ocurra se deben cumplir otros requisitos. Entre ellos, uno de los más

importantes es el llamado requisito energético que refleja la necesidad de que las

moléculas para reaccionar tengan que sobrepasar una barrera energética. Sólo las

colisiones cuya energía supere el valor umbral ε0 darán origen a la reacción

química. La fracción de colisiones efectivas desde el punto de vista energético

viene determinado por el factor exp(-ε0/kT), de modo que la constante de

velocidad predicha por la teoría de colisiones para una reacción bimolecular es:

$% = &'() / *+,-/ = &'()

/ *+.-// (8.6)

Recordando que Ea=RT2(dlnkr/dT), llegamos a que:

01 = 02 + 45 = 62 +

45 (8.7)

7 = &'() / */ (8.8)

Como (1/2)RT es pequeño, la energía umbral de esferas rígidas es prácticamente

igual a la energía de activación. La teoría de colisiones no proporciona ningún

método para calcular la energía umbral, sino que da únicamente el factor de

Arrhenius. Teniendo en cuenta las simplificaciones de esta teoría, no debe tomarse

muy en serio la dependencia de A con T1/2.

Para la mayoría de las reacciones, los valores calculados de A son mucho mayores

que los observados. Por eso, en la década de 1920 se modificó la teoría de

colisiones de esferas rígidas añadiendo un factor p en el término derecho de la

ecuación (8.6). El factor p se denomina factor estérico y su justificación se basa en

que las moléculas que chocan deben estar orientadas de forma adecuada para que

la colisión de lugar a la reacción. Se supone que p (cuyos valores oscilan entre 0 y

1) representa la fracción de colisiones en las cuales las moléculas tienen la

orientación adecuada. Por ejemplo, la reacción CO + O2 → CO2 + O sólo puede tener

lugar si la molécula de oxígeno colisiona con la de monóxido de carbono por el lado

del átomo de carbono, no si lo hace por el lado del átomo de oxígeno. La teoría de

colisiones no aporta ninguna forma de calcular p teóricamente. Por el contrario, p

se determina a partir de la relación entre el valor experimental de A y el de la

teoría de colisiones. De esta forma, para la reacción anterior, p=0,0043. Con esta

aproximación, p es únicamente un factor sin significado físico que hace que la

teoría coincida con los datos experimentales y, por tanto, la teoría de colisiones no

tiene un valor predictivo. A pesar de esto, esta teoría tiene la ventaja de que

permite dar una interpretación sencilla e intuitiva de lo que constituye la esencia

de la reacción química: es el resultado de una colisión entre moléculas de reactivos

que se produce con la energía y orientación adecuadas.

La teoría de colisiones puede mejorarse considerando en el modelo la estructura

de las moléculas (enlaces, vibraciones,…) y las interacciones intermoleculares. Un

ejemplo claro para ilustrar la importancia de las interacciones intermoleculares es

la reacción K + Br2 → KBr + Br. En este caso, la teoría de colisiones predice un

factor pre-exponencial menor que el experimental, lo que lleva a un factor estérico

mayor que la unidad (p=4,8). La razón de este comportamiento es que algunas

trayectorias que en principio serían no reactivas (factor de impacto mayor que el

diámetro de colisión) pueden dar lugar finalmente a colisión por la aparición de

fuertes interacciones atractivas. Efectivamente, un electrón del potasio puede

saltar hasta la molécula de bromo, quedando ambas especies cargadas (K+ y Br2-).

Esto da lugar a la aparición de una fuerza electrostática que puede conducir a la

colisión entre las dos moléculas.

Teoría del estado de transición

La Teoría del estado de transición (TET) o también llamada Teoría del complejo

activado (TCA) fue desarrollada en 1935 por Eyring, por una parte, y por Evans y

Polanyi, por la otra. El punto de partida de dicha teoría considera el cambio de

energía potencial a medida que los reactivos de una reacción bimolecular se

aproximan. Dicha evolución se representa mediante el denominado perfil

energético de reacción mostrado en la Figura 8.1. Tal y como puede verse, a

medida que las dos especies reactivas se acercan, la energía potencial aumenta

alcanzando un máximo tras el cual vuelve a descender hasta la zona de los

productos. En el máximo de la curva, se define una superficie que separa la región

de los reactivos de la de los productos. Esta superficie se llama superficie divisoria

o superficie crítica (véase Figura 8.2). Cualquier estructura situada a una distancia

arbitrariamente pequeña (δ) de la superficie divisoria se denomina complejo

activado. El conjunto de todos los complejos activados se llama estado de

transición, por analogía con el estado de reactivos o de productos. De todo el

conjunto de estructuras de la superficie crítica la de menor energía es la de la

estructura de transición o punto de silla de primer orden.

La versión canónica de la TET, que es la que trataremos aquí, se aplica en el caso de

que los reactivos de la reacción que se van a estudiar estén en equilibrio térmico.

Figura 8.1. Variación de la energía potencial con la coordenada de reacción

(distancia Ha-Hb) para la reacción Ha + HbHc → HaHb + Hc.

(a) (b)

Figura 8.2. Representación esquemática de la superficie divisoria o crítica, que

divide la superficie de energía potencial en una zona de reactivos y otra de

productos.

Se puede obtener una expresión de la constante de velocidad partiendo de las

siguientes suposiciones:

a) Todos los reactivos que cruzan la superficie crítica hacia los productos no

pueden volver hacia atrás.

b) Los reactivos mantienen una distribución de equilibrio de Boltzmann

correspondiente a la temperatura del sistema, durante toda la reacción. Las

moléculas de reactivos que superan una determinada energía son las que pueden

convertirse en productos, y por tanto sus niveles energéticos se despoblarían. No

obstante, se supondrá que la frecuencia de colisión con las paredes y con otras

moléculas es lo suficientemente alta como para recuperar rápidamente la

distribución de equilibrio en todos los grados de libertad moleculares.

c) Las moléculas que alcanzan la superficie crítica mantienen también una

distribución de Boltzmann correspondiente a la misma temperatura que los

reactivos. Un complejo activado tiene vida media muy corto (del orden de los

femtosegundos), es decir, no tiene tiempo suficiente para experimentar colisiones,

rotaciones, etc. y así redistribuir su energía y alcanzar el equilibrio térmico. Sin

embargo, el conjunto de todos los complejos activados que aparecen durante la

reacción sí que responde a una distribución de equilibrio. Esto significa que,

considerados en conjunto como la estructura de transición la de menor energía de

todos los complejos activados, habrá una mayor probabilidad de que el complejo

activado presente una geometría más cercana a él que a la de cualquier otro punto.

d) El movimiento de los reactivos a lo largo de la coordenada de reacción cuando

atraviesan la superficie divisoria puede ser separado de los demás grados de

libertad y tratado clásicamente. Existe una limitación en reacciones con átomos

ligeros (p.e. H) que tiene efectos cuánticos importantes.

Aplicando estas suposiciones a la reacción elemental bimolecular B + C →

Productos, se puede expresar esta ecuación como:

B + C Xǂ → Productos (8.9)

donde Xǂ representa el complejo activado y la doble flecha no indica un equilibrio

en sentido químico (el complejo activado no es una especie aislable y mensurable,

excepto en períodos de femtosegundos), sino que, de acuerdo con las hipótesis b) y

c), indica que estas especies se mantendrán con la distribución que corresponda al

equilibrio térmico entre ellas.

Según lo comentado hasta aquí, una molécula de producto se forma, o una de

reactivo desaparece, cuando un complejo activado cruza la superficie divisoria

hacia la región de los productos. Por tanto, la velocidad de reacción, en términos de

moléculas por unidad de tiempo, puede expresarse como el número de moléculas

de complejo activado (Nǂ) que atraviesan la superficie divisoria por unidad de

tiempo:

− = 9:;<=>?;@

= ‡B (8.10)

siendo τ el tiempo de vida medio que un complejo activado tarda en atravesar la

superficie divisoria. Este tiempo puede calcularse sabiendo la velocidad con la que

se mueve el complejo activado a lo largo de la coordenada de reacción (c.r.) y el

espesor (δ) de la superficie divisoria.

C = D⟨E>:⟩ (8.11)

Sustituyendo la ecuación (8.11) en (8.10) se llega a que:

− = 9:;<=>?;@

= ‡⟨E>:⟩D (8.12)

y, por tanto,

− ! = F%GHIGJ!

=

‡⟨E>:⟩D = K‡! ⟨E>:⟩

D (8.13)

donde K‡! es la concentración de complejo activado.

Teniendo en cuenta la hipótesis de equilibrio térmico entre reactivos y complejo

activado y recordando la expresión de la constante de equilibrio obtenida en la

lección de Termodinámica Estadística, llegamos a que:

‡

= L‡LL *+MN-‡OP (8.14)

donde qB, qC y Q‡ representan las funciones de partición de los reactivos B y C, y del

estado de transición. Δ62‡ es la diferencia de energía, a cero grados Kelvin, entre

reactivos y estado de transición, es decir, 62SXǂV − S62&B) + 62&C)V. Esta cantidad

ha de estimarse a partir de la energía del punto cero asociada a los niveles

vibracionales fundamentales de reactivos y estado de transición. La ecuación

(8.14) puede expresarse también en términos de concentraciones, dividiendo por

el número de Avogadro y el volumen:

YZ‡[

! ! = \ ]‡^_`

\ ]^_`\ ]^_` *+MN-‡OP (8.15)

El cálculo de las funciones de partición de las especies reactivas B y C se hace

teniendo en cuenta las distintas contribuciones a la energía: traslacional,

rotacional, vibracional y electrónica. Para el estado de transición se aplicará el

mismo tratamiento, aunque debe tenerse en cuenta que uno de los grados de

libertad corresponde a la coordenada de reacción. En efecto, una de las vibraciones

de la estructura de transición, el vector de transición, corresponde a la coordenada

que transforma reactivos en productos. Por ejemplo, para la reacción H + H2, el

vector de transición es la tensión antisimétrica Hbbc − −Hdbb − −Hbbc. Como los grados de

libertad los consideramos independientes, para calcular la función de partición del

estado de transición vamos a separar esta contribución (qcr), de modo que:

Q‡ = Q%1J‡ Q%G‡ QEef‡ QghgI‡ = QI%‡ YQ%1J‡ Q%G‡ QiEef‡ QghgI‡ [ = QI%‡ Qi‡ (8.16)

donde Qi‡ indica la función de partición para todos los grados de libertad excepto

para el movimiento (de vibración) a lo largo de la coordenada de reacción. El

cálculo de q‡ no implica ningún problema adicional a las funciones de partición de

los reactivos. Sin embargo, el cálculo de QI%‡ supone una novedad respecto a lo visto

hasta ahora. Efectivamente este grado de libertad corresponde a una vibración

pero con el pozo invertido. La estructura de transición es un máximo en esta

coordenada y, formalmente, este caso correspondería a un movimiento vibracional

con la constante de fuerza (kF) negativa, ya que la energía disminuye cuando nos

desplazamos del punto de silla. La frecuencia que podríamos calcular a partir de

esta constante de fuerza sería por tanto imaginaria:

j = k l

m>:‡ (8.17)

donde nI%‡ es la masa reducida asociada al movimiento a lo largo de la coordenada

de reacción. Así pues, no podemos emplear las fórmulas habituales basadas en el

oscilador armónico para el cálculo de la función de partición vibracional. Para

tratar este movimiento, puesto que en el punto de silla las derivadas de la energía

respecto a cualquier coordenada son cero, podremos suponer que en el entorno

inmediato la energía apenas cambia. Trataremos por lo tanto el movimiento del

complejo activado a lo largo de la coordenada de reacción como un movimiento de

traslación de una partícula en una caja unidimensional cuyo tamaño viene dado

por el espesor de la superficie divisoria δ. Por tanto, asumiendo el límite clásico

(separación entre niveles << kT), la expresión para la función de partición

traslacional asociada al movimiento a lo largo de la coordenada de reacción puede

escribirse como:

QI%‡ = \m>:‡ op `/ q (8.18)

En consecuencia, la ecuación (8.15), despejando K‡!, quedaría como sigue

K‡! = \m>:‡ op `/ q \ ]r‡

^_`\ ]^_`\ ]^_` *+MN-‡OP "! #! (8.19)

Para el cálculo de la velocidad media a lo largo de la coordenada de reacción

podemos usar la distribución de Maxwell-Boltzmann para una componente de la

velocidad (supuestos c) y d) de la TET):

s&I%) = \ m>:‡`

⁄ *+m>:‡ E>:p ⁄ (8.20)

Puesto que estamos calculando el proceso directo de conversión de reactivos en

productos, para calcular el valor medio de esta componente de la velocidad sólo

tomaremos los valores positivos (o negativos). Los valores negativos (o positivos)

corresponderían al proceso inverso:

⟨I%⟩ = u I%v2 s&I%)(I% = u I% \ m>:‡

` ⁄ *+m>:‡ E>:p ⁄ v

2 (I% = \ m>:‡

` ⁄ (8.21)

Sustituyendo las ecuaciones (8.19) y (8.21) en la ecuación (8.13), se obtiene la

expresión que proporciona la TET para la ley de velocidad:

− ! = K‡! ⟨E>:⟩

D =

= D \

m>:‡` ⁄ \m>:‡

op `/ q \ ]r‡^_`

\ ]^_`\ ]^_` *+MN-‡OP "! #! (8.22)

Simplificando el resultado obtenido nos queda:

− ! =

o \ ]r‡^_`

\ ]^_`\ ]^_` *+MN-‡OP "! #! (8.23)

Esta expresión refleja correctamente la dependencia de la velocidad con el

producto de las concentraciones. Comparando con la ley de velocidad

experimental para la reacción elemental bimolecular entre B y C, la constante de

velocidad en la TET es igual a:

$% = o \ ]r‡

^_`\ ]^_`\ ]^_` *+MN-‡OP (8.24)

Según la ecuación (8.24), para determinar la constante de velocidad necesitamos

conocer las funciones de partición de reactivos y del estado de transición, así como

la diferencia de energía entre los estados fundamentales. La información de los

reactivos puede obtenerse experimentalmente. De momento, para el estado de

transición la información necesaria para obtener su energía y función de partición

(masa, geometría, frecuencias, estados electrónicos,…) debe de obtenerse

mediante cálculos de mecánica cuántica. El conocimiento de la energía potencial, al

menos alrededor de reactivos y estructura de transición nos proporciona los datos

necesarios. Sin embargo, el reciente desarrollo de la espectroscopía de

femtosegundos está empezando a cambiar este hecho, al permitir la observación

del estado de transición.

Formulación termodinámica de la teoría del estado de transición

Para interpretar la expresión de la constante de velocidad que proporciona la TET,

ecuación (8.24), se puede acudir a la llamada formulación termodinámica de la

TET. En la ecuación (8.24), se puede apreciar que, aparte del factor kT/h, el resto

se parece mucho a la constante de equilibrio entre el complejo activado y los

reactivos. En efecto, la ecuación (8.15) es una relación entre las concentraciones de

estado de transición y reactivos. Si dividimos todas las concentraciones de esa

ecuación por la concentración estándar 1M (C0) resulta la constante de equilibrio

en la escala de concentraciones:

wI = xyz‡- |

!- !

- = #2 YZ‡[ ! ! = #2 \ ]‡

^_`\ ]^_`\ ]^_` *+MN-‡OP (8.25)

La expresión de la constante de velocidad (8.24) es igual a la (8.25) excepto por el

hecho de que la función de partición del estado de transición no contiene la

contribución de la coordenada de reacción. A la constante de equilibrio calculada

sin este término se la denominará wI‡ con lo que la expresión de la constante de

velocidad según la TET se escribe como:

$% = o

>‡- (8.26)

Por tanto, la constante de velocidad puede verse como un término de equilibrio

entre los reactivos y el estado de transición, en donde se descuenta la contribución

de la coordenada de reacción en el estado de transición, y otro término (kT/h) que

proviene de la contribución de la coordenada de reacción. Este término da la

frecuencia del movimiento de los complejos activados a lo largo de la coordenada

de reacción y como tal se expresa en s-1.

Recordando la relación entre constantes de equilibrio y energía libre de Gibbs,

podemos escribir en nuestro caso que:

∆I2‡ = ∆I2‡ − 5∆I2‡ = −45wI‡ (8.27)

siendo ∆I2‡ la energía libre de activación estándar en la escala de concentraciones

y, ∆I2‡ y ∆I2‡

la entalpía y la entropía de activación estándar, respectivamente. L

energía libre se calcula como diferencia entre las energías libres del estado de

transición y reactivos, utilizando las expresiones vistas en la lección 4 sobre

Termodinámica Estadística. Para esto, hay que tener en cuenta, que no se debe

contar el grado de libertad asociado a la coordenada de reacción. Es decir, si el

sistema químico contiene un total de N átomos, en lugar de 3 traslaciones, 3

rotaciones (2 si fuera lineal) y 3N-6 vibraciones (3N-5 si fuera lineal), para el

cálculo de la energía libre del estado de transición se contarían 3 traslaciones, 3

rotaciones (2 si fuera lineal) y 3N-7 vibraciones (3N-6 si fuera lineal). La vibración

que se deja fuera es la correspondiente al vector de transición, la que presenta una

constante de fuerza negativa. Utilizando las ecuaciones (8.26) y (8.27), la constante

de velocidad queda:

$% = o

- *+∆>-‡

P = o

- *+∆>-‡

P * ∆>-‡ (8.28)

Las ecuaciones (8.25)-(8.28) están basadas en la selección del estado estándar 1M.

Para gases, sin embargo, muchas veces se prefiere el estado estándar P0 = 1 bar.

Asumiendo un comportamiento ideal para los gases,

wI = xyz‡- |

!- !

- = #2 x9z‡P |

9P9P = -/F-

x9z‡9- |

99-99- (8.29)

resultando

>- = /

F- w (8.30)

de modo que

$% = o

/F- w =

o/F- *+∆-‡

P = o

/F- *+∆-‡

P *∆-‡ (8.31)

Hay que tener en cuenta que si hubiera n reactivos en lugar de dos, entonces el

factor RT/P0 o 1/C0 de las expresiones anteriores aparecería elevado a n-1 en lugar

de a 1.

A partir de la expresión (8.31) y procediendo de forma análoga a como hicimos en

el caso de la teoría de colisiones, se obtiene que los parámetros de Arrhenius para

una reacción elemental bimolecular son:

01 = 245 + ∆2‡ (8.32)

7 = o

/F- ** ∆-‡

(8.33)

Estas expresiones de la TET permiten dar interpretaciones más acertadas tanto de

la energía de activación como del factor de Arrhenius.

Reacciones químicas en disolución

Debido a las fuertes interacciones intermoleculares en el estado líquido, la teoría

de las reacciones en disolución está mucho menos desarrollada que la de las

reacciones en fase gaseosa. En general, no es posible calcular velocidades de

reacción en disolución a partir de propiedades moleculares, exceptuando las

reacciones controladas por la difusión.

Las reacciones químicas en disolución pueden dividirse en: (a) reacciones

controladas químicamente, donde la velocidad de reacción química entre las

moléculas B y C en un disolvente es mucho menor que la velocidad de difusión de B

y C a través del disolvente; (b) reacciones controladas por difusión, en las que la

velocidad de difusión es mucho menor que la velocidad de reacción química; (c)

reacciones de control mixto, donde la velocidad de difusión y de reacción química

tienen el mismo orden de magnitud. Veamos, a continuación, las expresiones que

aporta la TET a estas situaciones de reacciones químicas en disolución.

- Reacciones controladas químicamente:

Siguiendo el mismo planteamiento que en el caso de reacciones en fase gaseosa,

B + C Xǂ → Productos (8.34)

La velocidad de reacción a la cual los complejos activados cruzan la superficie

divisoria viene dada por:

= K‡! ⟨E>:⟩D (8.35)

Para determinar K‡!, modificamos la ecuación (8.15) para permitir la no

idealidad. Para lograr esto, utilizamos actividades en vez de concentraciones, de

modo que:

w1 = 1‡11 = ‡

xyz‡

- | !- !

- (8.36)

Todas las actividades (a) y coeficientes de actividad () están referidos a la escala

de concentraciones; por lo que, se sobreentiende un subíndice c en las a y .

Despejando K‡! en la ecuación (8.36) y sustituyendo el resultado obtenido en la

ecuación (8.35) se llega a que:

= ‡ \

m>:‡` ⁄

D- "! #! (8.37)

en donde se ha sustituido, la velocidad media del complejo activado cuando

atraviesa la superficie divisoria por el resultado (8.21). Por analogía con el caso del

sistema ideal:

w1‡ = w1 \m>:‡ op `+/

D (8.38)

de modo que la constante de velocidad viene expresada ahora por:

$% = o

‡

‡- (8.39)

que sólo difiere de la encontrada para el caso de la reacción en fase gaseosa por la

presencia de los coeficientes de actividad.

Las fuertes interacciones moleculares en la disolución no permiten expresar las

constantes de actividad en términos de funciones de partición individuales sobre

los reactivos y el estado de transición. Las constantes de equilibrio w1‡ y Ka son

funciones de la temperatura, presión y disolvente, pero son independientes de la

concentración del soluto. A dilución infinita, todos los coeficientes de actividad de

la ecuación (8.39) se convierten en 1 y la ecuación (8.39) se transforma en:

$%v = o

‡- (8.40)

donde $%ves la constante de velocidad en el límite de dilución infinita. Para una

temperatura, presión y disolvente fijos, la ecuación (8.39) de la TET puede

escribirse como:

$% = ‡ $%v (8.41)

Esta ecuación recibe el nombre de ecuación de Brønsted-Bjerrum y predice que la

constante de velocidad variará con las concentraciones de los reactivos, puesto que

los coeficientes de actividad cambian con el cambio en la composición de la

disolución. La pequeña exactitud de la mayor parte de los datos cinéticos hace que

este efecto no tenga una importancia significativa, excepto para reacciones iónicas.

Las disoluciones iónicas son altamente no ideales, aun a bajas concentraciones.

Consideremos la reacción iónica elemental bimolecular siguiente:

" + # → K‡&) → ( (8.42)

El logaritmo decimal de la ecuación (8.41) da:

log $% = log $%v + log + log − log ‡ (8.43)

Para fuerzas iónicas hasta 0,1 mol/dm3, en el caso de disoluciones acuosas a 25 0C

y 1 atm:

log = −0,51 /p /p − 0,30¢ (8.44)

con I=Ic/c0 e ¢I = ∑ eee (Ic es la fuerza iónica en la escala de concentraciones).

Procediendo de forma análoga para las demás especies de la reacción (8.42),

llegamos a que

log $% = log $%v + 1,02 /p /p − 0,30¢ (8.45)

Para muchas reacciones iónicas en disolución con fuerzas iónicas de hasta 0,1

mol/dm3 se ha encontrado un buen ajuste con la ecuación (8.45).

Por analogía con la ecuación (8.27), definimos ∆12‡, para una reacción en

disolución, por:

∆12‡ = ∆12‡ − 5∆12‡ = −45w1‡ (8.46)

La ecuación (8.39) se convierte en:

$% = o

‡

- *+∆-‡

P = o

- *+∆-‡

P *∆-‡ (8.47)

Para reacciones no iónicas en disoluciones diluidas, los coeficientes de actividad

tienen valores cercanos a 1 y (dada la inexactitud de la mayoría de los datos

cinéticos) pueden despreciarse:

$% ≈ o

- *+∆-‡

P = o *+∆-‡

P * ∆-‡ (8.48)

Esta ecuación resulta útil para racionalizar los cambios observados en las

constantes de velocidad, para una serie de reacciones en función de la variación de

las entropías y entalpías de activación en su estado normal. La solvatación de los

reactivos y del complejo activado debe tenerse en cuenta al estudiar las

variaciones de entropía y de entalpía de activación.

Mediante la definición de los parámetros de Arrhenius (Ea y A), dada en la lección

anterior, en términos de la variación del logaritmo neperiano de la constante de

velocidad con la temperatura, puede observarse que en el caso de reacciones no

iónicas en disoluciones diluidas:

01 ≈ 45 + ∆12‡ (8.49)

7 ≈ o

g- * ∆-‡

(8.50)

Las ecuaciones (8.49) y (8.50) permiten el cálculo de la variación de entalpía de

activación estándar y de la variación de entropía de activación estándar a partir de

los valores experimentales de Ea y A, respectivamente.

- Reacciones controladas químicamente y de control mixto:

La ecuación (8.39) de la TET no es aplicable para las reacciones controladas por

difusión o de control mixto, puesto que su velocidad está gobernada, al menos en

parte, por la velocidad a la que los reactivos pueden difundirse a través del

disolvente para encontrarse entre sí. Considerando, de nuevo, la reacción

elemental bimolecular B + C → Productos, al principio de las reacciones muy

rápidas, las especies B y C están distribuidas al azar en disolución. Poco tiempo

después la reacción comienza, muchos pares de moléculas de B y C que

inicialmente estaban próximas unas a otras se encontrarán y reaccionarán. Las

moléculas de B que queden serán probablemente la mayor parte de las moléculas

de B para las que no hubo moléculas de C en la vecindad inmediata. Si la difusión

no es suficientemente rápida para restablecer una distribución al azar, la región

alrededor de una molécula B dada estará algo vacía de moléculas C (y viceversa).

Sea R la distancia desde una molécula B dada. Cuando R aumenta, la concentración

media de C aumenta, alcanzando su valor en la disolución para un valore grande de

R, que llamaremos infinito. Hay un gradiente de concentración de C en la región

alrededor de una molécula B dada. Suponiendo que muy poco después de que la

reacción comienza se alcanza un estado estacionario, en el cual la velocidad de

difusión de C hacia B es igual a la velocidad de reacción de C con B.

La primera ley de Fick de la difusión (véase Lección 6) da la velocidad de difusión

de las moléculas B a través del disolvente (S). Para encontrar la velocidad a la cual

las moléculas B y C se difunden una hacia otra debemos usar un coeficiente de

difusión, que es la suma de los coeficientes de difusión de B y C en el disolvente S.

Suponiendo que la disolución es diluida, entonces pueden usarse los coeficientes

de difusión a dilución infinita. De esta forma,

¥ = &¦v + ¦v)§ !

(8.51)

donde ( , es el número de moles de C que en un tiempo dt atraviesan una

superficie esférica de área §=4πR2, rodeando una molécula B dada, y ¦v y ¦v son,

respectivamente, los coeficientes de difusión a dilución infinita de B y C en el

disolvente S. La utilización del símbolo prima evita la confusión de la cantidad

(8.51), que se refiere a la difusión de C hacia una molécula B particular, con la

velocidad de desaparición de C en la disolución. Tenemos d[C]/dR > 0 y

consideraremos (/dt positivo; por tanto, en (8.51) se usa el signo positivo.

Supongamos que B y C son moléculas esféricas con radios rB y rC, respectivamente.

Para una estado estacionario, (/dt es una constante. La integración de la

ecuación (8.51) entre los límites R=rB+rC (moléculas de B y C en contacto) y R=∞

(la disolución) da:

#!/©%% = #! − ¥

Sª«ª«V¬&%%) (8.52)

donde [C]=[C]R=∞ es la concentración de C en la disolución.

Sea r=kr[B][C] la velocidad de reacción por unidad de volumen observada, donde la

constante de velocidad observada kr combina los efectos de la velocidad de

difusión y la velocidad de reacción química. La condición del estado estacionario es

que la velocidad a la cual C se difunde hacia una molécula B dada es igual a la

velocidad de reacción entre C y la molécula B. La multiplicación de r por el

volumen de la disolución V da la velocidad de reacción total en la disolución. La

velocidad de reacción para una molécula particular B es, entonces, rV/NB, donde NB

es el número de moléculas B en la disolución. La condición del estado estacionario

da, entonces, (/dt= rV/NB= r/NA[B]=kr[C]/NA, de modo que la ecuación (8.52) se

convierte en:

#!/©%% = #! \1 − :Sª«ª«V¬&%%)` = #! \1 − :

<®` (8.53)

siendo

$e¯ = &¦v + ¦v)4'& + ) (8.54)

Sea kq la constante de velocidad para la reacción química entre B y C en un

disolvente. La aproximación del estado estacionario permite expresar r como:

r=kq[B] #!/©%% (8.55)

Comparando la ecuación (8.55) con r=kr[B][C], tenemos que kq= kr #!/©%%/[C].

Aplicando la ecuación (8.53) da kr=kq(1- kr/kdif). Despejando kr, tenemos como

resultado final:

: =

<® + ] (8.56)

Para el límite kq→∞, la reacción está controlada por difusión y la ecuación (8.54)

se convierte en kr=kdif. Por lo tanto, kdif en la ecuación (8.54) es la constante de

velocidad para la reacción controlada por difusión. Para el límite kdif→∞ (o, más

precisamente, kdif >> kq), la ecuación (8.56) se convierte en kr=kq. La reacción es

controlada químicamente. La constante de velocidad kq está dada por la ecuación

(8.39). Cuando kdif y kq son del mismo orden de magnitud, las cinéticas están

mezcladas y kr está dada por (8.56).

La existencia de un gradiente de concentración alrededor de cada molécula

reactiva es una desviación de la distribución de Boltzmann, la cual predeciría una

distribución uniforme en ausencia de campos eléctricos y gravitatorios.

Para reacciones iónicas rápidas, la velocidad a la cual B y C se difunden entre sí

está afectada por la atracción o repulsión de Coulomb.

Date post:	21-Aug-2020
Category:	Documents
Upload:	others
View:	10 times
Download:	0 times

Lección 1: PROBABILIDAD - FisicoQuímica · (1) en cualquier experimento es 1/50. Condición: El...

Documents