METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA · Metodología de la superficie de respuesta (RSM) y f...

transcript

METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA

Parte 4: Metodología de la superficie de respuesta (RSM)

Héctor Goicoechea E-mail: hgoico@fbcb.unl.edu.ar

http://www.fbcb.unl.edu.ar/laboratorios/ladaq/

Conocer el funcionamiento de un sistema o

proceso.

Encontrar las condiciones óptimas de

funcionamiento.

Mejoras en costo, tiempo, eficiencia,

productividad y /o calidad.

Metodología de la superficie

de respuesta (RSM)

Objetivos

• Desarrollo teórico y primeras aplicaciones (década del 90) o Box y Draper (1987)

o Cornell (1991)

o Montgomery y Myers (1996)

o Araujo y Brereton (1996)

• Aplicaciones en expansión.

Aparición de programas comerciales o Procesos de fabricación industrial

oQuímica

oFarmacéutica

oBiotecnologica

JMP-IN

MINITAB

STATISTICA

STATGRAPHICS

UNSCRUMBLER

R - MATLAB

DESIGN-EXPERT oAlimenticia

oMetalúrgica

oElectrónica

• Originada por el trabajo de Box y Wilson (1951) Box, G. E. P., Wilson, K. G. (1951),“On the experimental attainment of optimum

conditions”, Journal of the Royal Statistical Society, B 13, 1-45

Metodología de la superficie de

respuesta (RSM)

),( 21 xxfy

respuesta

Analizar el

comportamiento

de una

Conjunto de técnicas

matemáticas y estadísticas

modelo

Construir un

experimentales

Niveles de las

variables

Optimizar Diseño de

experimentos

respuesta

Encontrar el

Óptimo

Representación gráfica del modelo

),( 21 xxfy

respuesta

Graficas de contorno y superficie de respuesta

Gráficos

Cada línea de contorno está formada por todas las

combinaciones de los factores que producen una misma

respuesta: líneas de isorespuesta

Gráficos

Graficas de contorno y superficie de respuesta

Design-Expert® Software

RendimientoDesign Points55.1

X1 = A: TemperaturaX2 = B: Tiempo

20.00 27.50 35.00 42.50 50.00

Rendimiento

A: Temperatura

38.4 44.3

Gráfica de contorno

Gráficos

Gráfica de contornos

Superficie de respuesta

Líneas de isorespuesta

Óptimo de la respuesta

Niveles óptimos

de las variables

Gráficos

Producción

Surfactante

Factores significativos

1 Temperatura 20- 60 ºC

2 Tiempo de incubación 24-48 hs

¡Optimizar el rendimiento!

Rangos

Experimentos exploratorios

Selección de factores

Buscando las mejores condiciones… Experimento parecido a lo que vimos en la competencia

organizada por el rey

T (°C) Tpo Hs) R (g/L)

20 24 20.6

24 24 26.1

28 24 32.0

32 24 36.3

36 24 39.2

40 24 42.0

44 24 42.9

48 24 43.8

52 24 42.5

56 24 41.2

Variaciones de temperatura

Condiciones óptimas de

temperatura

T= 48° R= 43.8 g/L

Temperatura (ºC)

Grafica de respuesta univariada

Valor óptimo de

temperatura

Sección transversal de la

superficie de respuesta

Estrategia “OVAT”

Optimización univariada

T (°C) Tpo

R (g/L)

48 24 43.8

48 28 47.8

48 32 50.6

48 36 50.8

48 40 49.2

48 44 45.6

Variaciones de tiempo

R= 50.8 g/L

Condiciones óptimas de

tiempo a 48ºC

Tpo= 36 hs Tiempo (horas)

Grafica de respuesta univariada

Valor óptimo de

tiempo

Estrategia “OVAT”

Sección transversal de

la superficie de

respuesta

Optimización univariada

Variaciones simultáneas de tiempo y

temperatura con un diseño experimental

estadístico

Experimento

(combinación)

Tiempo

(horas)

Respuesta

1 20 24 20.6

2 20 36 44.9

3 20 48 51.0

4 35 24 36.9

5 35 36 54.9

6 35 48 52.1

7 50 24 43.0

8 50 36 49.1

9 50 48 37.0

Predicción del óptimo por modelado:

Rendimiento = 56.2 g/L Temp.= 34°C, Tiempo= 40 hs

Valor óptimo de

tiempo y temperatura

9 experimentos

menor trabajo

Variaciones simultáneas de tiempo y

temperatura con un diseño experimental

estadístico: RSM

RendimientoDesign Points55.1

X1 = A: TemperaturaX2 = B: Tiempo

20.00 27.50 35.00 42.50 50.00

Rendimiento

A: Temperatura

38.4 44.3

mínimo

máximo

Design-Expert® Softw are

Area NAPRO

2.17954E+006

1.18672E+006

X1 = A: pH muestra

X2 = B: Stirring rate

Actual Factor

C: adición sal = 0.94

2.00 3.25 4.50 5.75 7.00

900.00

1000.00

1100.00

1200.00

1300.00Area NAPRO

1.25639E+006

1.5569E+006

1.85741E+006

2.15791E+006

2.45842E+006

1.62857E+006

1.72323E+006

1.41702E+006

Grafica de contorno

Temperatura (ºC)

T (A)1.51

X1 = B: pHX2 = C: Temp

Actual FactorsA: Apareante = 15.00D: Acetato = 60.00

Optimización univariada Sólo llegaría al óptimo si la relación es lineal sin

interacciones

X 1 X 3

X 1 constante

X 1 X 2

X 2 constante X 3 constante

),....,( 1 kxxfy

Una misma respuesta puede depender de más de dos

factores

Técnicas de optimización

¿Cuál es el óptimo?

RSM y optimización

Area SUL

513107

333539

X2 = C: adición sal

Actual Factor

A: pH muestra = 7.00

900.00 1000.00 1100.00 1200.00 1300.00

2.00Area SUL

320153

369177

418200

467223

516246

10.965

15.847

Area CBZ

Design Points

205584

153080

X1 = A: pH muestra

Actual Factor

C: adición sal = 1.66

1.00 2.75 4.50 6.25 8.00

800.00

950.00

1100.00

1250.00

1400.00

187103

190356

193610

196863

20011680.61

Area PIR

239736

163579

X1 = A: pH muestra

X2 = C: adición sal

Actual Factor

B: Stirring rate = 1116.22

2.00 3.25 4.50 5.75 7.00

2.00Area PIR

168276

183461

198646

213831

229016160.09

120.74

El comportamiento óptimo de un sistema puede

depender de más de una respuesta

Respuesta 1 Respuesta 3 Respuesta 2

Técnicas de optimización de respuestas múltiples

¿Cuál es el óptimo global?

Requerimientos y

pasos para la

aplicación

• Creación de un diseño de experimentos

• Ajuste de un modelo

• Utilización de una técnica de optimización

Explorar el modelo para obtener información

sobre el óptimo

Requerimientos de la RSM

No se le puede exigir al diseño más información de la que puede brindar

• Para construir un modelo se necesitan como mínimo la misma cantidad de

puntos experimentales diferentes que coeficientes a estimar.

• Para evaluar la falta de ajuste se deben incluir repeticiones de un punto

del diseño

22 121222110 xxxy

22 + pcentral

22 + pcentral +

paxiales

curvaturaxxxy 121222110

111121222110 xxxxxy

? o ¿ 2

111 xx

Diseños y modelos matemáticos

usados

CONSTRUCCIÓN DE UN MODELO

Experimentos para optimizar la extracción de un alcaloide

pH (X1)

Temperatura (X2)

mg/g (y)

0 -1 43

-1 1 65

1 0 49

0 1 69

-1 -1 21

1 -1 43

1 1 62

-1 0 45

0 0 57

0 0 54

0 0 61

0 0 57

Lineal y= 52.2 + 3.8 x1

+ 14.8 x2

Lineal con Interacción y= 52.2 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

Cuadrático y= 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2

- 0.2 (x2)2

Construcción del modelo

Modelo SC gl MC F0 p (Ft >F0) R2aj

LINEAL 0.70

Regresión 1408 2 704.2 13.6 0.001 significativa

Error Residual 465.3 9 51.7

FAj 440.6 6 73.4 8.9 0.039 significativa

INTERACCION 0.77

Regresión 1565 3 521.5 13.5 0.002 significativa

FAj 284.3 5 56.87 6.8 0.070 en el límite

CUADRATICO 0.95

Regresión 1826 5 365.2 46.0 <0.001 significativa

FAj 22.8 3 761 0.91 0.526 no significativa

Error Puro 24.8 3 8.2

Elegir Modelo: mayor F0 de regresión menor F0 de Falta Ajuste mayor R2

Evaluación del modelo (ANOVA)

Pruebas de hipótesis para los coeficientes del modelo

Modelo cuadrático completo

y = 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2

- 0.2 (x2)2

¿Son significativos todos los

términos?

Las hipótesis que hay que probar son: 0 i 1 iH : 0 H : 0

0 0.05,k,n k 1

Significancia del coeficiente:

Evaluación de los coeficientes

Modelo completo

Utilizar el modelo más

simple que describa el

comportamiento del sistema

MODELO CUADRÁTICO

SC gl MC F0 p (Ft >F0)

Regresión 1826 5 365.2 46.0 <0.001

x1 88.2 1 88.2 11.1 0.016

x2 1320 1 1320 166 <0.001

x1 x2 156 1 156 19.7 0.004

(x1)2 228 1 228 28.8 0.002

(x2)2 0.17 1 0.17 0.02 0.889

Residual 47.9 6 7.9

LOF 22.8 3 761 0.91 0.526

Error Puro 24.8 3 8.2

Variable no

significativa

Eliminar del

modelo

Evaluación del los coeficientes

Principio de parsimonia

• Manual

• Eliminación backward:

Modelo completo Modelo depurado

• Adición forward:

Modelo reducido Modelo depurado

Técnicas para depurar los modelos

y = 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2

- 0.2 (x2)2

CATEGORÍA DE LOS MODELOS

Modelo completo Modelo jerárquico Modelo reducido

y = 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2

y = 38.9 + 13.3 x1

- 0.3 x2

+ 0.1 x1 x2

- 9.2 (x1)2

- 1.2 (x2)2

y = 38.9 + 13.3 x1

- 9.2 (x1)2

- 1.2 (x2)2

y = 38.9 + 13.3 x1

- 0.3 x2

- 9.2 (x1)2 - 1.2 (x2)2

Modelo jerárquico: contiene todos los términos más

simples que componen los términos de mayor orden que

están en el modelo. Comportamiento más estable

Se conserva el

término de

primer orden

Categoría de los modelos

Modelo lineal o de primer orden Design-Expert® Software

T (A)1.51

X1 = B: pHX2 = C: Temp

Actual FactorsA: Apareante = 15.00D: Acetato = 60.00

Para dos factores

este modelo tiene 3

términos

Modelos matemáticos para la RSM

Puede verse como X2 tiene igual

comportamiento según X1 (líneas

paralelas)

i i ij i ji i j

y x x x

Modelo lineal con interacción

Para dos factores

este modelo tiene 4

términos

R (A)13.232

X1 = A: ApareanteX2 = D: Acetato

Actual FactorsB: pH = 3.500C: Temp = 32.50

0.0000

Puede verse como X2

tiene distinto

comportamiento según

Modelos matemáticos para la MSR

i i ii i ij i ji i i j

y x x x x

Modelo cuadrático o de segundo orden

Para dos factores

este modelo tiene 6

términos

Dureza5.56

X1 = A: % ManitolX2 = B: %Camphor

-1.00 -0.50

0.00 0.50

A: % Manitol

B: %Camphor

Modelo cúbico o de tercer orden

Para dos factores

este modelo tiene 10

términos

X1 = A: AX2 = B: B

Actual FactorC: C = 0.00

A: A B: B

111211222110

xxxxxxxxy

1 Definir los objetivos de la optimización.

2 Seleccionar los factores que resultan significativos.

Plantear adecuadamente el PROBLEMA a resolver y seleccionar la

RESPUESTA a evaluar.

3 Establecer la región de operabilidad.

Considerar las posibilidades instrumentales y la información sobre el

sistema.

4 Seleccionar un entorno experimental. Definir la región del espacio de los factores en donde vamos a planear los

experimentos.

Pasos seguidos para aplicar la RSM

6 Elaborar un modelo matemático.

Obtener la SUPERFICIE DE RESPUESTA y evaluar resultados.

7 Localizar el óptimo (punto o región) buscado para la

respuesta.

Utilizar herramientas gráficas y/o matemáticas para predecirlo.

8 Verificar experimentalmente. Confirmar el valor de la respuesta utilizando los niveles óptimos de los

factores.

5 Construir un diseño experimental de optimización.

Medir datos experimentales.

Repetir los pasos 4 , 5 y 6 si fuera necesario.

Pasos seguidos para aplicar la RSM

Si conocemos poco del sistema, el punto óptimo puede

encontrarse fuera del entorno experimental inicial.

Región de operabilidad

Condiciones en donde el

proceso o equipo puede ser

operado

Entorno experimental

Limitado por los niveles

seleccionados para los factores

El entorno experimental debe moverse hacia la localización del

óptimo.

Región de operabilidad y entorno

experimental

Aproximación al

óptimo con diseños de

primer orden

Aplicar experimentos que permitan moverse rápidamente a las

proximidades del óptimo buscado para la respuesta.

Técnica de

escalamiento ascendente o descendente

Aproximación al óptimo: cuando no se conoce

a priori en que zona se encuentra el óptimo

Modelos de primer orden

Simplex: figura geométrica con

k + 1 vértices (k: nº de factores)

Diseño SIMPLEX

factor 1

Factorial en dos niveles: se

estudian todas las combinaciones

de los factores en +1 y -1

factor 1

Diseños para superficie de respuesta

de primer orden

Diseño SIMPLEX

Paso 1

Simplex Inicial: experimentos 1, 2 y 3

La peor respuesta es la del experimento 3 Buscar un opuesto

Método de escalamiento ascendente

sin ajustar modelo: Simplex

Paso 2

Segundo Simplex : experimentos 1, 2 y 4

sin ajustar modelo

Paso 3

Tercer Simplex : experimentos 1, 4 y 5

sin ajustar modelo

Paso 4

Cuarto Simplex : experimentos 4, 5 y 6

Las peores respuestas son las 4 y 5

sin ajustar modelo

Buscar opuestos

Paso 5

Quinto Simplex : experimentos 5, 6 y 7

Sexto Simplex : experimentos 4, 6 y 8

sin ajustar modelo

Mejor respuesta: 6

Seleccionar un entorno experimental para un

diseño de segundo orden que permita

localizar el óptimo

sin ajustar modelo

Paso 6

Se recorre secuencialmente una trayectoria en

sentido de su máxima pendiente, es decir, del mayor

incremento o decremento de la respuesta

ascenso

descenso

Superficie ajustada con un modelo de

primer orden

Método de la máxima pendiente

Un interesante y simple ejemplo de literatura

Factores con efecto significativo sobre 2-CP removal:

Glucose concentration (0.0189), Yeast extract (0.0013)

and spore inoculum size (0.0476)

Punto central de los factores que influyen usando modelo de

primer orden

Gradiente considerando ascenso (coeficiente positivo) o

descenso (coeficiente negativo)

Zona de máxima predicción (podría contener al óptimo)

Zona seleccionada para construir un modelo más complejo

Diseños de segundo

1- Proporcionar una distribución razonable de puntos

de datos en el entorno experimental.

N min= 1 + 2k + k (k-1)/2

2- Generar datos que permitan el ajuste de un

modelo matemático de segundo orden:

• Estudiar cada factor en al menos tres niveles para análisis

de curvatura.

• Tener una cantidad de puntos que permitan estimar todos

los términos del modelo cuadrático.

Diseños experimentales para modelos

de segundo orden: Objetivos

k = 3 (tres variables o factores)

• Factores principales: x1 x2 x3

• Interacciones dobles: x1x2 x1x3 x2 x3

• Interacción triple: x1x2x3

• Cuadraturas: x12 x2

N min= 1 + 2k + k (k-1)/2 = 1 + 2×3 + 3×(3-1)/2 = 10

Cálculo de número mínimo de

experimentos para 3 factores

3- Posibilitar el estudio de la idoneidad del

modelo y la falta de ajuste.

Repeticiones del punto central o de otro punto (4-6).

N = N min + Co

4- Ser eficiente para el cumplir con el objetivo

propuesto sin requerir demasiados puntos

experimentales.

5- Minimizar la varianza de los coeficientes de

regresión del modelo: Ortogonalidad

A B A x B

-1 1 -1

1 -1 -1

-1 -1 1

A con B:

[1×1]+[(-1) ×1]+[1× (-1)]+(-1) ×(-1) = 0

6- Posibilitar la realización de experimentos en

bloques:

• Cuando es necesario bloquear el diseño, es

importante mantener la ortogonalidad de los

bloques.

• El punto central debe distribuirse por igual entre los

bloques.

Error estándar del modelo: leverage

7- Proporcionar un error de predicción estable en

el entorno experimental: Rotabilidad

8- Permitir la creación secuencial a partir de diseños

de primer orden:

9- Posibilitar la obtención de diseños aumentados: 2k 3k

3k D-Optimal

Diseños

simétricos

Dos factores Tres factores

Punto central

• Combinaciones de todos los niveles de los factores.

• Número de experimentos (N= 3k ).

• El número de experimentos crece rápidamente con el

número de factores.

3 niveles por factor (-1, 0 , +1)

Diseño factorial completo a 3 niveles

Diseño cúbico, que responde al diseño factorial completo 2k

Punto central

Diseño estrella, a una distancia del centro.

Compuesto por:

5 niveles por factor (-α, -1, 0, +1, +α)

• Número de experimentos

(N = 2k +2k + C0)

Diseño central compuesto

Puede generarse a partir de un diseño factorial de

primer orden anterior cuando se observa curvatura y

quiere estudiarse mejor esta región del espacio

experimental.

Diseño inicial Aumento del diseño

curvatura

Factorial en dos niveles: 2k + Co Estrella: 2k+ Co

Bloque 2 Bloque 1

•Centrado en las caras

•Circunscripto

o Rotable

o Esférico

o Práctico

Los puntos estrella o puntos axiales pueden tomar

distintas ubicaciones en el entorno experimental, a una

distancia α del centro del diseño.

4factn

Entorno experimental

esférico

Puntos axiales posibles

experimentalmente

Cuasi-Rotables

Diseño central compuesto centrado

en las caras

α = 1.0 Se transforma en un

diseño de tres niveles.

El entorno experimental

es más acotado.

Es útil cuando en la

práctica no se pueden

modificar fácilmente los

niveles de los factores.

Diseño esférico Diseño rotable Diseño práctico

k Valor de alfa

2 1.414 1.414 1.189

3 1.732 1.682 1.316

4 2.000 2.000 1.414

5 2.236 2.378 1.495

Diseño central compuesto: tabla

Punto central

• Combinación de diseños factoriales a dos niveles

con diseños de bloques incompletos.

• Número de experimentos: N = 2k (k−1) + C0 )

• Puede aplicarse sólo si k ≥ 3

Tres factores

3 niveles por factor (-1, 0 , +1)

Diseño Box-Behnken

Diseño Box-Behnken: tabla

• Los puntos experimentales son equidistantes entre si.

• Los factores varían en diferente número de niveles

cada uno. Para un diseño de 3 factores: 3, 5 y 7.

• Número de experimentos: N= k2+k+Co)

0 0.5 -0.5 1.0 -1.0

Matriz de Doherlet

Central compuesto (CC)

N = 2k +2k + C0

Factorial completo (FC)

N = 3k

Box-Behnken (BB)

N = 2k (k−1) + C0

Diseño más eficiente

Factores Coeficientes Puntos experimentales (N) Eficiencia (E) (modelo cuadrático) (1 punto central)

BB CC FC BB CC FC

Cociente entre el número de coeficientes estimados por

el modelo y el numero total de puntos experimentales.

Eficiencia de los diseños

Diseños no simétricos:

D-optimal

Son diseños NO simétricos, logrados mediante

algoritmos computacionales cuyo fin es satisfacer

condiciones establecidas por el operador, tales

• Cantidad de puntos experimentales.

• Tipo de modelo a ajustar.

• Rangos de las variables.

• Regiones no posibles de ensayo.

Diseños optimal

1- Región experimental irregular.

2- Falta de ajuste de modelo cuadrático.

3- Necesidad de reducir la cantidad de puntos

experimentales.

• Se dividen en distintos tipos, nombrados por las

letras del alfabeto.

• El tipo de diseño óptimo se refiere a la

propiedad o criterio que se pondera en el diseño.

Diseños optimal

Es un diseño basado en el criterio de proporcionar una

buena estimación de los parámetros de regresión para

el modelo seleccionado.

11 Puntos Experimentales distintos

Se pierde rotabilidad

Diseño D-optimal

Se crean ecuaciones para

restringir el área donde el

sistema genera

combinaciones no favorables.

Región de alta presión

1.0 2.0

Flujo (mL/min)

Región

favorable

Se seleccionan puntos

experimentales con una

distribución óptima desde el

punto de vista estadístico.

Diseño D-optimal con restricciones

Puntos seleccionados

Determinante de

XTX máximo

Selección de puntos experimentales en

dominio asimétrico

Buena estimación de

coeficientes y error

de predicción más o

menos estable.

Diseño D-optimal con restricciones

Zonas restringidas: efecto en el error

estándar en un diseño central compuesto

estándar en un diseño D-optimal

Localización del

óptimo

• Localización del punto estacionario o

región óptima de trabajo (robustez).

• Diseños experimentales de segundo

orden.

• Modelo de segundo orden con buen

ajuste y R2aj mayor a 70%

• Hacer las predicciones con ese modelo.

La optimización implica tener:

Es el punto del espacio de los factores en el cual el plano

tangente a la superficie tiene pendiente igual a cero y es

un “candidato al óptimo”

Punto estacionario

Punto de respuesta

máxima Punto de respuesta

mínima

Punto silla

Loma Valle Silla de montar

0ˆ......ˆˆ21 kxyxyxy

i i ii i ij i ji i i j

y x x x x

Paso 1 Ajustar un modelo de segundo orden con niveles

codificados:

Paso 2 Verificar el tipo de superficie de respuesta obtenida

Análisis gráfico

Análisis canónico

Paso 3 Obtener el punto estacionario

Punto estacionario

Bxx bxTT

0ˆˆ y

En donde:

Es el vector que

contiene un valor

dado de los

factores

Es el vector

conteniendo los

coeficientes de

regresión de primer

Es una matriz simétrica cuya

diagonal principal está formada

por los coeficientes de los

términos cuadráticos puros

Punto estacionario

La derivada de la función respecto al vector x igualada

a cero es:

bBx -1

de donde puede calcularse el punto estacionario:

La respuesta predicha para el punto estacionario estará

dada por:

¿Qué tipo de punto

estacionario es?

¿Es el óptimo que buscamos?

Punto estacionario

R155.1

X1 = A: AX2 = B: B

-0.50 0.13 0.75 1.38 2.00

28.828.835.4

R155.1

X1 = A: AX2 = B: B

A: A B: B

Loma ascendente

¿Qué hacemos en este caso?

Seguimos experimentando en el sentido del óptimo,

siempre que lo permitan las condiciones de operación

del sistema.

X1 = A: AX2 = B: B

-1.00 -0.50 0.00 0.50 1.00

X1 = A: AX2 = B: B

A: A B: B

Cordillera estacionaria

¿Qué hacemos en este caso?

Podemos seleccionar el mejor punto desde el punto de

vista operacional que de una respuesta satisfactoria.

Habrá muchas soluciones posibles al problema y

podemos decidir sobre la conveniencia del nivel de los

factores.

• El error de predicción de la respuesta es

función del modelo postulado, el

diseño y ubicación del punto.

• Para estar seguros de haber

encontrado un óptimo confiable para

nuestro sistema debemos tener en

cuenta el error en la predicción.

Error de predicción

• Está dado por el producto del Leverage en ese

punto de la superficie, multiplicado por la

variancia experimental.

expˆ VxLyV

• El intervalo de confianza para la respuesta

predicha puede calcularse a partir de su

desviación estándar.

yy stICˆ)05.0(ˆ

¿Como es una salida de D Expert?

LsVxLys

expexp

yy stICˆ)05.0(ˆ

StdErr of Design1.5

X1 = A: AX2 = B: B

Actual FactorC: C = 0.00

A: A B: B

Leverage: función del diseño y del modelo ajustado

Design-Expert® SoftwareR1

Color points by value ofR1:

Run Number

Leverage vs. Run

1 3 5 7 9 11 13 15 17

Design-Expert® SoftwareR1

Color points by value ofR1:

Run Number

Leverage vs. Run

1 3 5 7 9 11 13 15 17

Modelo Lineal Modelo Cuadrático

puntos centrales

puntos axiales

Con las repeticiones del punto central se puede

calcular la variancia experimental:

Sexp = 0.57, Vexp = 0.32

Error de predicción: ejemplo

• Con las repeticiones se puede calcular la varianza

experimental:

Sexp = 0.57, Vexp = 0.32

• El leverage en el punto de predicción es

aproximadamente igual a 0.4 (se puede ver la gráfica)

Vypred = L ×Vexp = 0.13

sypred = 0.36

IC = t(0.05, 19) × sypred = 1.73 × 0.36 = 0.62

• Intervalo: 2.57 - 0.62 = 1.95 (D.Expert: 1.73)

2.57 + 0.62 = 3.19 (D.Expert: 3.42)

Error de predicción: ejemplo

Diseños

de mezclas

• En los casos estudiados hasta ahora

se trabajó con variables

independientes.

• Cada variable podía tomar cualquier

valor dentro de su rango,

independientemente del valor

tomado por las otras variables.

Diseños de mezclas

• En una mezcla se tiene una

restricción: la suma de todos los

componentes debe ser igual a 1

(100%).

• Es decir, no pueden ser variados

independientemente, ya que al

hacerlo se puede pasar el porcentaje

de 100.

0 S = 0

Diseños de mezclas

Consecuencia:

No es posible aplicar los

diseños vistos a los problemas

de mezclas.

¿Cuando es necesario realizar diseños de

mezclas? Ejemplos:

• Composición de azúcares (u otro nutriente) de un

medio de cultivo que exige que se cumpla cierto valor

de osmolaridad.

• Mezcla de solventes en un proceso extractivo

(diferentes polaridades para diferentes compuestos a

extraer).

• Composición de fases en cromatografía.

• Diferentes ligandos de un comprimido farmacéutico.

• Constituyentes de un alimento.

• Otros.

• El espacio experimental es una figura que tiene

tantos vértices como componentes, en un espacio

cuya dimensionalidad es igual al número de

componentes menos uno.

• La respuesta es una función de las proporciones

de los componentes.

Diseños de mezclas

Tres componentes

• Espacio experimental: triángulo

(cada vértice corresponde a un

componente puro).

• Dimensionalidad: 2

X1+x2 = 1 Dos componentes

• Espacio experimental: segmento

de recta (cada extremo corresponde

a 100 % un componente).

Diseños de mezclas

Cuatro componentes

• Espacio experimental: pirámide

(cada vértice corresponde a un

componente)

Diseños de mezclas

Modelo clásico para un sistema lineal de 2

componentes:

y = b0 + b1 x1 + b2 x2

y = X b + e = ypred + e

(XTX)-1XT y = (XTX)-1XTX b

b = (XTX)-1XT y b = [b0 b1 b2 ]

Modelo clásico

ypred = X (XTX)-1XT y ypred = H y (H es conocida como matriz “hat” por sombrero)

Xb = X(XTX)-1XT y

Pero XTX es singular en un diseño de

mezclas

ya que x1+ x2 = 1

Modelo clásico

y = b0 + b1 x1 + b2 x2 + e

Si (x1+ x2= 1), podemos hacer:

ypred = b0 (x1+ x2)+ b1 x1 + b2 x2 (la suma no se altera)

ypred = (b0 + b1) x1 + (b0 + b2) x2

ypred = b1* x1 + b2* x2

Si x1 = 1, x2 = 0, entonces y = b1*

Si x2 = 1, x1 = 0, entonces y = b2*

Con sólo dos experimentos se pueden calcular fácilmente los

coeficientes del “modelo lineal para dos componentes”

Diseños de mezclas: modelo

Reemplazando: x12 = x1 (1- x2 ) y x2

2 = x2 (1- x1 ), se llega a :

ypred = b1* x1 + b2* x2 + b1-2* x1 x2

Modelo cuadrático para dos componentes

De manera similar se puede llegar a:

ypred = b1* x1 + b2* x2 + b3* x3 + b1-2* x1 x2 + b1-3* x1 x3 +

+ b2-3* x2 x3

Modelo cuadrático para tres componentes

ypred = b1* x1 + b2* x2 + b3* x3 + b1-2* x1 x2 + b1-3* x1 x3 +

+ b2-3* x2 x3 + b1-2-3* x1 x2 x3

Modelo cúbico especial para tres componentes

Modelo cuadrático clásico:

yi = o + 1 x1 + 2 x2 + 1-2 x1 x2 + 1-1 x12 + 2-2 x2

kjiijkjiijii xxxxxxy1

Modelo de Scheffé:

Henry Scheffé (1907-1977)

Simplex lattice Simplex centroid

D-optimal

Diseños utilizados

Diseños de mezclas

Ejemplo # 1 Formulación del un comprimido

en que se busca la mejor mezcla de los tres

ligandos (90.8% del total):

Alfa-lactosa monohidratada (x1), beta-lactosa anhidra

(x2) y almidón de arroz modificado (x3).

Respuestas: fuerza que hay que hacer para romper la

tableta (y1), y la velocidad de disolución (y2).

R. Leardi / Analytica Chimica Acta 652 (2009) 161–172

Diseños de mezclas

Diseños de mezclas. Ejemplo # 1

• Los coeficientes de los términos lineales

corresponden a la respuesta obtenida

con el componente puro.

Modelo obtenido para la primer respuesta:

Si X2 y X3 = 0 → X1 = 1

• Los coeficientes de las interacciones dobles

indican el efecto sinérgico. En el ejemplo, si no

hubiera interacción, el valor debería ser el promedio de los

coeficientes para X1 y X2, es decir 72 [(31+113)/2]. Pero

es 120/4 (así se calcula el efecto en las interacciones

dobles, dividiendo por cuatro), es decir 30, o sea 42

unidades menos.

• Los coeficientes de las interacciones triples se

calculan dividiendo por 27

• En la figura puede verse que X2 tiene el mayor efecto sobre

Y1 y éste es positivo (pasa de 39 a 113).

• X1 tiene menor efecto, pero negativo (pasa de 70 a 31).

• X3 es el componente con menor efecto (pasa de 42 a 38).

¡Observar que estos efectos no se corresponden con los

valores de los coeficientes como en los modelos clásicos!

Y1 = 39 (X2 = 0)

Y1 = 113

(X2 = 100%) Y1 = 70 (X1 = 0)

Y1 = 31

(X1 = 100%)

Y1 = 42 (X3 = 0)

Y1 = 38

(X3 = 100%)

Modelo obtenido para la segunda respuesta:

respuesta para

la combinación

de ambos

factores

Formulación de un comprimido

en el cual hay 20% de droga y el resto

corresponde a una mezcla de 3

excipientes:

1- Lactosa

2- Avicel PH 101 (una celulosa microcristalina)

3- Hidroximetilpropilcelulosa (HMPC)

Comprehensive Chemometrics. Vol 1, página 431

Se mide una propiedad:

Fuerza de rotura (kg) <1.30

Se quiere ajustar un modelo

cúbico especial

Ajuste de la respuesta Fuerza de rotura

La ‘interacción’ BC se debe mantener para que el

modelo sea jerárquico

Gráfica de trazas: “Trace”

• Es una especie de silueta de la superficie de respuesta.

• Representa el efecto de cambiar cada componente en una línea imaginaria a

partir de una mezcla referencia (el centroide)

Gráfica de trazas para el ejemplo # 1

(Leardi)

Es un análisis similar al realizado anteriormente

Diseños de mezclas: uso de restricciones

Ejemplo: es necesario

que los tres

componentes estén

siempre

Diseños de mezclas: a veces es necesario

que nunca estén en forma pura

Diseños de mezclas: Ejemplo # 3

Formulación de un detergente

midiendo dos respuestas:

viscosidad y turbidez

Restricciones:

• 3% ≤ A (agua) ≤ 8%

•2% ≤ B (alcohol) ≤ 4%

•2% ≤ C (urea) ≤ 4%

A+B+C=9%

Tutorial Design Expert

Propiedades del diseño

Los vértices ya no son puros

Efluente de la

industria lechera

Efluente de la

industria

cervecera

Efluente de la

industria

azucarera

Optimization of the Bacillus thuringiensis var. kurstaki HD-1 d-endotoxins production by using experimental mixture design

and artificial neural networks. GA Moreira, GA Micheloud, AJ Beccaria, HC Goicoechea, Biochem. Eng. J., 2007, 35, 48-55.

Diseños de mezclas: Ejemplo # 4

Uso de efluentes industriales para un

medio de cultivo

Modelos mixtos

Mezcla-Proceso Mezcla-Mezcla

Modelo mixto

Lineal x Lineal

Cuadrático x Cuadrático

y = f (x) x g (z)

y = (f1 x1 + f2 x2 + f3 x3) x (g1 z1 + g2 z2 + g3 z3)

y = (f1 x1 + f2 x2 + f3 x3) x g1 z1 + (f1 x1 + f2 x2 + f3 x3) x g2 z2 + (f1 x1 +

f2 x2 + f3 x3) x g3 z3

y = f1 x1 g1 z1 + f2 x2 g1 z1 + f3 x3 g1 z1 + f1 x1 g2 z2 + f2 x2 g2 z2 + f3 x3

g3 z3 + f1 x1 g3 z3 + f2 x2 g3 z3 + f3 x3 g3 z3

zxbzxbzxb

zxbzxbzxbzxbzxbzxby

Modelo lineal mixto de mezclas

cruzadas para tres componentes

Ejemplo # 5: optimización de un medio de cultivo

para la producción de una proteína recombinante

C. Didier, M. Etcheverrigaray, R. Kratjie, H.C. Goicoechea, Chemom. Intell. Laborat. Syst. 86 (2007) 1

Modelo mixto Mezcla-Mezcla

N sources C sources

Constrains

Optimización por

sectores

Commercial product

of high price

Developed product of

low price

Response Modelo F p Adj. R2 p-LOF

IVC QxQ 6.46 < 0.0001 0.722 0.307

qprot QxQ 8.39 < 0.0001 0.781 0.013

BA QxQ 11.04 < 0.0001 0.832 0.052

qlact QxQ 5.46 < 0.0001 0.679 0.233

qamo QxQ 2.85 0.0055 0.500 0.005

• Técnica versátil que permite usar

diferentes diseños experimentales y

herramientas estadísticas para optimizar

procesos.

• Puede aplicarse a una o a de varias

respuestas simultáneamente.

Conclusiones

• Requiere buen criterio del operador y el

correcto uso de la metodología.

• Importante realizar la confirmación

experimental.

Conclusiones

METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA · Metodología de la superficie de respuesta (RSM) y f...

Documents