Post on 08-Oct-2020
transcript
METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA
Parte 4: Metodología de la superficie de respuesta (RSM)
Héctor Goicoechea E-mail: hgoico@fbcb.unl.edu.ar
http://www.fbcb.unl.edu.ar/laboratorios/ladaq/
Conocer el funcionamiento de un sistema o
proceso.
Encontrar las condiciones óptimas de
funcionamiento.
Mejoras en costo, tiempo, eficiencia,
productividad y /o calidad.
Metodología de la superficie
de respuesta (RSM)
Objetivos
• Desarrollo teórico y primeras aplicaciones (década del 90) o Box y Draper (1987)
o Cornell (1991)
o Montgomery y Myers (1996)
o Araujo y Brereton (1996)
• Aplicaciones en expansión.
Aparición de programas comerciales o Procesos de fabricación industrial
oQuímica
oFarmacéutica
oBiotecnologica
JMP-IN
MINITAB
STATISTICA
STATGRAPHICS
UNSCRUMBLER
R - MATLAB
DESIGN-EXPERT oAlimenticia
oMetalúrgica
oElectrónica
• Originada por el trabajo de Box y Wilson (1951) Box, G. E. P., Wilson, K. G. (1951),“On the experimental attainment of optimum
conditions”, Journal of the Royal Statistical Society, B 13, 1-45
Metodología de la superficie de
respuesta (RSM)
),( 21 xxfy
respuesta
Analizar el
comportamiento
de una
Conjunto de técnicas
matemáticas y estadísticas
modelo
Construir un
Datos
experimentales
Niveles de las
variables
Optimizar Diseño de
experimentos
Metodología de la superficie de
respuesta
Encontrar el
Óptimo
Representación gráfica del modelo
),( 21 xxfy
Metodología de la superficie de
respuesta
Graficas de contorno y superficie de respuesta
Pro
du
cció
n d
e alm
en
dra
s
Gráficos
Pro
du
cció
n d
e alm
end
ras
Cada línea de contorno está formada por todas las
combinaciones de los factores que producen una misma
respuesta: líneas de isorespuesta
Gráficos
Graficas de contorno y superficie de respuesta
Design-Expert® Software
RendimientoDesign Points55.1
20.6
X1 = A: TemperaturaX2 = B: Tiempo
20.00 27.50 35.00 42.50 50.00
24.00
30.00
36.00
42.00
48.00
Rendimiento
A: Temperatura
B: T
iem
po
26.6
32.5
38.4 44.3
44.3
50.2
54.6
56.1
Gráfica de contorno
Gráficos
Gráfica de contornos
Superficie de respuesta
Líneas de isorespuesta
Óptimo de la respuesta
Niveles óptimos
de las variables
Gráficos
Producción
Surfactante
Factores significativos
1 Temperatura 20- 60 ºC
2 Tiempo de incubación 24-48 hs
¡Optimizar el rendimiento!
Rangos
Experimentos exploratorios
Selección de factores
Buscando las mejores condiciones… Experimento parecido a lo que vimos en la competencia
organizada por el rey
T (°C) Tpo Hs) R (g/L)
20 24 20.6
24 24 26.1
28 24 32.0
32 24 36.3
36 24 39.2
40 24 42.0
44 24 42.9
48 24 43.8
52 24 42.5
56 24 41.2
Variaciones de temperatura
Condiciones óptimas de
temperatura
T= 48° R= 43.8 g/L
Temperatura (ºC)
Ren
dim
iento
Grafica de respuesta univariada
Valor óptimo de
temperatura
Sección transversal de la
superficie de respuesta
Estrategia “OVAT”
Optimización univariada
T (°C) Tpo
(Hs)
R (g/L)
48 24 43.8
48 28 47.8
48 32 50.6
48 36 50.8
48 40 49.2
48 44 45.6
Variaciones de tiempo
R= 50.8 g/L
Condiciones óptimas de
tiempo a 48ºC
Tpo= 36 hs Tiempo (horas)
Ren
dim
iento
Grafica de respuesta univariada
Valor óptimo de
tiempo
Estrategia “OVAT”
Sección transversal de
la superficie de
respuesta
Optimización univariada
Variaciones simultáneas de tiempo y
temperatura con un diseño experimental
estadístico
Experimento
(combinación)
Temp.
(°C)
Tiempo
(horas)
Respuesta
(g/L)
1 20 24 20.6
2 20 36 44.9
3 20 48 51.0
4 35 24 36.9
5 35 36 54.9
6 35 48 52.1
7 50 24 43.0
8 50 36 49.1
9 50 48 37.0
Predicción del óptimo por modelado:
Rendimiento = 56.2 g/L Temp.= 34°C, Tiempo= 40 hs
Ren
dim
iento
Valor óptimo de
tiempo y temperatura
9 experimentos
menor trabajo
Variaciones simultáneas de tiempo y
temperatura con un diseño experimental
estadístico: RSM
Design-Expert® Software
RendimientoDesign Points55.1
20.6
X1 = A: TemperaturaX2 = B: Tiempo
20.00 27.50 35.00 42.50 50.00
24.00
30.00
36.00
42.00
48.00
Rendimiento
A: Temperatura
B: T
iem
po
26.6
32.5
38.4 44.3
44.3
50.2
54.6
56.1
mínimo
máximo
Design-Expert® Softw are
Area NAPRO
2.17954E+006
1.18672E+006
X1 = A: pH muestra
X2 = B: Stirring rate
Actual Factor
C: adición sal = 0.94
2.00 3.25 4.50 5.75 7.00
900.00
1000.00
1100.00
1200.00
1300.00Area NAPRO
1.25639E+006
1.25639E+006
1.5569E+006
1.5569E+006
1.85741E+006
1.85741E+006
2.15791E+006
2.45842E+006
1.62857E+006
1.62857E+006
1.72323E+006
1.72323E+006
1.41702E+006
1.41702E+006
Tie
mp
o (h
ora
s)
Grafica de contorno
Temperatura (ºC)
Design-Expert® Software
T (A)1.51
0.77
X1 = B: pHX2 = C: Temp
Actual FactorsA: Apareante = 15.00D: Acetato = 60.00
3.000
3.250
3.500
3.750
4.000
25.00
28.75
32.50
36.25
40.00
1.090
1.123
1.155
1.188
1.220
R
esp
ue
sta
X2 X1
Optimización univariada Sólo llegaría al óptimo si la relación es lineal sin
interacciones
X 1 X 3
X 2
X 1 constante
X 1 X 2
X 3
X 2 constante X 3 constante
),....,( 1 kxxfy
Una misma respuesta puede depender de más de dos
factores
Técnicas de optimización
¿Cuál es el óptimo?
RSM y optimización
Design-Expert® Softw are
Area SUL
513107
333539
X1 = B: Stirring rate
X2 = C: adición sal
Actual Factor
A: pH muestra = 7.00
900.00 1000.00 1100.00 1200.00 1300.00
0.18
0.63
1.09
1.55
2.00Area SUL
320153
369177
418200
467223
516246
10.965
15.847
9.732
7.921
5.396
Design-Expert® Softw are
Area CBZ
Design Points
205584
153080
X1 = A: pH muestra
X2 = B: Stirring rate
Actual Factor
C: adición sal = 1.66
1.00 2.75 4.50 6.25 8.00
800.00
950.00
1100.00
1250.00
1400.00
187103
190356
193610
196863
20011680.61
60.20
45.89
30.94
15.53
Design-Expert® Softw are
Area PIR
239736
163579
X1 = A: pH muestra
X2 = C: adición sal
Actual Factor
B: Stirring rate = 1116.22
2.00 3.25 4.50 5.75 7.00
0.18
0.63
1.09
1.55
2.00Area PIR
168276
183461
198646
213831
229016160.09
120.74
89.61
59.75
30.84
El comportamiento óptimo de un sistema puede
depender de más de una respuesta
Respuesta 1 Respuesta 3 Respuesta 2
Técnicas de optimización de respuestas múltiples
¿Cuál es el óptimo global?
Requerimientos y
pasos para la
aplicación
• Creación de un diseño de experimentos
• Ajuste de un modelo
• Utilización de una técnica de optimización
Explorar el modelo para obtener información
sobre el óptimo
Requerimientos de la RSM
No se le puede exigir al diseño más información de la que puede brindar
• Para construir un modelo se necesitan como mínimo la misma cantidad de
puntos experimentales diferentes que coeficientes a estimar.
• Para evaluar la falta de ajuste se deben incluir repeticiones de un punto
del diseño
22 121222110 xxxy
22 + pcentral
22 + pcentral +
paxiales
curvaturaxxxy 121222110
2
222
2
111121222110 xxxxxy
? o ¿ 2
222
2
111 xx
Diseños y modelos matemáticos
usados
CONSTRUCCIÓN DE UN MODELO
Experimentos para optimizar la extracción de un alcaloide
pH (X1)
Temperatura (X2)
mg/g (y)
0 -1 43
-1 1 65
1 0 49
0 1 69
-1 -1 21
1 -1 43
1 1 62
-1 0 45
0 0 57
0 0 54
0 0 61
0 0 57
Lineal y= 52.2 + 3.8 x1
+ 14.8 x2
Lineal con Interacción y= 52.2 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
Cuadrático y= 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
- 0.2 (x2)2
Construcción del modelo
Modelo SC gl MC F0 p (Ft >F0) R2aj
LINEAL 0.70
Regresión 1408 2 704.2 13.6 0.001 significativa
Error Residual 465.3 9 51.7
FAj 440.6 6 73.4 8.9 0.039 significativa
INTERACCION 0.77
Regresión 1565 3 521.5 13.5 0.002 significativa
Error Residual 309.1 8 38.6
FAj 284.3 5 56.87 6.8 0.070 en el límite
CUADRATICO 0.95
Regresión 1826 5 365.2 46.0 <0.001 significativa
Error Residual 47.9 6 7.9
FAj 22.8 3 761 0.91 0.526 no significativa
Error Puro 24.8 3 8.2
Elegir Modelo: mayor F0 de regresión menor F0 de Falta Ajuste mayor R2
aj
Evaluación del modelo (ANOVA)
Pruebas de hipótesis para los coeficientes del modelo
Modelo cuadrático completo
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
- 0.2 (x2)2
¿Son significativos todos los
términos?
Las hipótesis que hay que probar son: 0 i 1 iH : 0 H : 0
i
0 0.05,k,n k 1
E
CMF F
CM
Significancia del coeficiente:
Evaluación de los coeficientes
Modelo completo
Utilizar el modelo más
simple que describa el
comportamiento del sistema
MODELO CUADRÁTICO
SC gl MC F0 p (Ft >F0)
Regresión 1826 5 365.2 46.0 <0.001
x1 88.2 1 88.2 11.1 0.016
x2 1320 1 1320 166 <0.001
x1 x2 156 1 156 19.7 0.004
(x1)2 228 1 228 28.8 0.002
(x2)2 0.17 1 0.17 0.02 0.889
Residual 47.9 6 7.9
LOF 22.8 3 761 0.91 0.526
Error Puro 24.8 3 8.2
Variable no
significativa
Eliminar del
modelo
Evaluación del los coeficientes
Principio de parsimonia
• Manual
• Eliminación backward:
Modelo completo Modelo depurado
• Adición forward:
Modelo reducido Modelo depurado
Técnicas para depurar los modelos
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
- 0.2 (x2)2
CATEGORÍA DE LOS MODELOS
Modelo completo Modelo jerárquico Modelo reducido
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
y = 38.9 + 13.3 x1
- 0.3 x2
+ 0.1 x1 x2
- 9.2 (x1)2
- 1.2 (x2)2
y = 38.9 + 13.3 x1
- 9.2 (x1)2
- 1.2 (x2)2
y = 38.9 + 13.3 x1
- 0.3 x2
- 9.2 (x1)2 - 1.2 (x2)2
Modelo jerárquico: contiene todos los términos más
simples que componen los términos de mayor orden que
están en el modelo. Comportamiento más estable
Se conserva el
término de
primer orden
Categoría de los modelos
00
k
i ii
y x
Modelo lineal o de primer orden Design-Expert® Software
T (A)1.51
0.77
X1 = B: pHX2 = C: Temp
Actual FactorsA: Apareante = 15.00D: Acetato = 60.00
3.000
3.250
3.500
3.750
4.000
25.00
28.75
32.50
36.25
40.00
1.090
1.123
1.155
1.188
1.220
R
esp
ue
sta
X2 X1
Para dos factores
este modelo tiene 3
términos
Modelos matemáticos para la RSM
Puede verse como X2 tiene igual
comportamiento según X1 (líneas
paralelas)
00
k
i i ij i ji i j
y x x x
Modelo lineal con interacción
Para dos factores
este modelo tiene 4
términos
Design-Expert® Software
R (A)13.232
0.985
X1 = A: ApareanteX2 = D: Acetato
Actual FactorsB: pH = 3.500C: Temp = 32.50
12.00
16.50
21.00
25.50
30.00
20.00
52.50
85.00
117.5
150.0
0.0000
6.250
12.50
18.75
25.00
R
esp
ue
sta
X2 X1
Puede verse como X2
tiene distinto
comportamiento según
X1
Modelos matemáticos para la MSR
2
00 1
k k
i i ii i ij i ji i i j
y x x x x
Modelo cuadrático o de segundo orden
Para dos factores
este modelo tiene 6
términos
Design-Expert® Software
Dureza5.56
2.09
X1 = A: % ManitolX2 = B: %Camphor
-1.00
-0.50
0.00
0.50
1.00
-1.00 -0.50
0.00 0.50
1.00
2
2.925
3.85
4.775
5.7
D
ure
za
A: % Manitol
B: %Camphor
Modelos matemáticos para la MSR
Modelo cúbico o de tercer orden
Para dos factores
este modelo tiene 10
términos
Design-Expert® Software
R382
1.33
X1 = A: AX2 = B: B
Actual FactorC: C = 0.00
-1.00
-0.50
0.00
0.50
1.00
-1.00
-0.50
0.00
0.50
1.00
-8
10.75
29.5
48.25
67
R
3
A: A B: B
1
2
22212
2
1112
3
2222
3
1111
2
222
2
111211222110
xxxx
xxxxxxxxy
Modelos matemáticos para la MSR
1 Definir los objetivos de la optimización.
2 Seleccionar los factores que resultan significativos.
Plantear adecuadamente el PROBLEMA a resolver y seleccionar la
RESPUESTA a evaluar.
3 Establecer la región de operabilidad.
Considerar las posibilidades instrumentales y la información sobre el
sistema.
4 Seleccionar un entorno experimental. Definir la región del espacio de los factores en donde vamos a planear los
experimentos.
Pasos seguidos para aplicar la RSM
6 Elaborar un modelo matemático.
Obtener la SUPERFICIE DE RESPUESTA y evaluar resultados.
7 Localizar el óptimo (punto o región) buscado para la
respuesta.
Utilizar herramientas gráficas y/o matemáticas para predecirlo.
8 Verificar experimentalmente. Confirmar el valor de la respuesta utilizando los niveles óptimos de los
factores.
5 Construir un diseño experimental de optimización.
Medir datos experimentales.
Repetir los pasos 4 , 5 y 6 si fuera necesario.
Pasos seguidos para aplicar la RSM
Si conocemos poco del sistema, el punto óptimo puede
encontrarse fuera del entorno experimental inicial.
Región de operabilidad
Condiciones en donde el
proceso o equipo puede ser
operado
Entorno experimental
Limitado por los niveles
seleccionados para los factores
X1
X2
X3
El entorno experimental debe moverse hacia la localización del
óptimo.
Región de operabilidad y entorno
experimental
Aproximación al
óptimo con diseños de
primer orden
Aplicar experimentos que permitan moverse rápidamente a las
proximidades del óptimo buscado para la respuesta.
Técnica de
escalamiento ascendente o descendente
Aproximación al óptimo: cuando no se conoce
a priori en que zona se encuentra el óptimo
Modelos de primer orden
Simplex: figura geométrica con
k + 1 vértices (k: nº de factores)
Diseño SIMPLEX
factor 1
fact
or
2
factor 1
fact
or
2
factor 1
fact
or
2
Factorial en dos niveles: se
estudian todas las combinaciones
de los factores en +1 y -1
factor 1
fact
or
2
Diseños para superficie de respuesta
de primer orden
Diseño SIMPLEX
Paso 1
Simplex Inicial: experimentos 1, 2 y 3
La peor respuesta es la del experimento 3 Buscar un opuesto
Método de escalamiento ascendente
sin ajustar modelo: Simplex
Paso 2
Segundo Simplex : experimentos 1, 2 y 4
La peor respuesta es la del experimento 2 Buscar un opuesto
Método de escalamiento ascendente
sin ajustar modelo
Paso 3
Tercer Simplex : experimentos 1, 4 y 5
La peor respuesta es la del experimento 1 Buscar un opuesto
Método de escalamiento ascendente
sin ajustar modelo
Paso 4
Cuarto Simplex : experimentos 4, 5 y 6
Las peores respuestas son las 4 y 5
Método de escalamiento ascendente
sin ajustar modelo
Buscar opuestos
Paso 5
Quinto Simplex : experimentos 5, 6 y 7
Sexto Simplex : experimentos 4, 6 y 8
Método de escalamiento ascendente
sin ajustar modelo
Mejor respuesta: 6
Seleccionar un entorno experimental para un
diseño de segundo orden que permita
localizar el óptimo
Método de escalamiento ascendente
sin ajustar modelo
Paso 6
Se recorre secuencialmente una trayectoria en
sentido de su máxima pendiente, es decir, del mayor
incremento o decremento de la respuesta
ascenso
descenso
00
k
i ii
y x
Superficie ajustada con un modelo de
primer orden
Método de la máxima pendiente
Un interesante y simple ejemplo de literatura
Un interesante y simple ejemplo de literatura
Factores con efecto significativo sobre 2-CP removal:
Glucose concentration (0.0189), Yeast extract (0.0013)
and spore inoculum size (0.0476)
Punto central de los factores que influyen usando modelo de
primer orden
Gradiente considerando ascenso (coeficiente positivo) o
descenso (coeficiente negativo)
Zona de máxima predicción (podría contener al óptimo)
Zona seleccionada para construir un modelo más complejo
Diseños de segundo
orden
1- Proporcionar una distribución razonable de puntos
de datos en el entorno experimental.
N min= 1 + 2k + k (k-1)/2
2- Generar datos que permitan el ajuste de un
modelo matemático de segundo orden:
• Estudiar cada factor en al menos tres niveles para análisis
de curvatura.
• Tener una cantidad de puntos que permitan estimar todos
los términos del modelo cuadrático.
Diseños experimentales para modelos
de segundo orden: Objetivos
k = 3 (tres variables o factores)
• Factores principales: x1 x2 x3
• Interacciones dobles: x1x2 x1x3 x2 x3
• Interacción triple: x1x2x3
• Cuadraturas: x12 x2
2 x32
N min= 1 + 2k + k (k-1)/2 = 1 + 2×3 + 3×(3-1)/2 = 10
Cálculo de número mínimo de
experimentos para 3 factores
3- Posibilitar el estudio de la idoneidad del
modelo y la falta de ajuste.
Repeticiones del punto central o de otro punto (4-6).
N = N min + Co
4- Ser eficiente para el cumplir con el objetivo
propuesto sin requerir demasiados puntos
experimentales.
Diseños experimentales para modelos
de segundo orden: Objetivos
5- Minimizar la varianza de los coeficientes de
regresión del modelo: Ortogonalidad
A B A x B
1 1 1
-1 1 -1
1 -1 -1
-1 -1 1
A con B:
[1×1]+[(-1) ×1]+[1× (-1)]+(-1) ×(-1) = 0
Diseños experimentales para modelos
de segundo orden: Objetivos
6- Posibilitar la realización de experimentos en
bloques:
• Cuando es necesario bloquear el diseño, es
importante mantener la ortogonalidad de los
bloques.
• El punto central debe distribuirse por igual entre los
bloques.
Diseños experimentales para modelos
de segundo orden: Objetivos
0.437
0.437
Error estándar del modelo: leverage
7- Proporcionar un error de predicción estable en
el entorno experimental: Rotabilidad
Diseños experimentales para modelos
de segundo orden: Objetivos
8- Permitir la creación secuencial a partir de diseños
de primer orden:
9- Posibilitar la obtención de diseños aumentados: 2k 3k
3k D-Optimal
Diseños experimentales para modelos
de segundo orden: Objetivos
Diseños
simétricos
Dos factores Tres factores
Punto central
• Combinaciones de todos los niveles de los factores.
• Número de experimentos (N= 3k ).
• El número de experimentos crece rápidamente con el
número de factores.
3 niveles por factor (-1, 0 , +1)
Diseño factorial completo a 3 niveles
Diseño cúbico, que responde al diseño factorial completo 2k
Punto central
Diseño estrella, a una distancia del centro.
Compuesto por:
5 niveles por factor (-α, -1, 0, +1, +α)
• Número de experimentos
(N = 2k +2k + C0)
Diseño central compuesto
Puede generarse a partir de un diseño factorial de
primer orden anterior cuando se observa curvatura y
quiere estudiarse mejor esta región del espacio
experimental.
Diseño inicial Aumento del diseño
curvatura
Factorial en dos niveles: 2k + Co Estrella: 2k+ Co
Bloque 2 Bloque 1
Diseño central compuesto
•Centrado en las caras
•Circunscripto
o Rotable
o Esférico
o Práctico
Los puntos estrella o puntos axiales pueden tomar
distintas ubicaciones en el entorno experimental, a una
distancia α del centro del diseño.
4factn
1
1
k
4 k
Entorno experimental
esférico
Puntos axiales posibles
experimentalmente
Cuasi-Rotables
5k
Diseño central compuesto
Diseño central compuesto centrado
en las caras
α = 1.0 Se transforma en un
diseño de tres niveles.
El entorno experimental
es más acotado.
Es útil cuando en la
práctica no se pueden
modificar fácilmente los
niveles de los factores.
Diseño esférico Diseño rotable Diseño práctico
k Valor de alfa
2 1.414 1.414 1.189
3 1.732 1.682 1.316
4 2.000 2.000 1.414
5 2.236 2.378 1.495
Diseño central compuesto
Diseño central compuesto: tabla
Punto central
• Combinación de diseños factoriales a dos niveles
con diseños de bloques incompletos.
• Número de experimentos: N = 2k (k−1) + C0 )
• Puede aplicarse sólo si k ≥ 3
Tres factores
3 niveles por factor (-1, 0 , +1)
Diseño Box-Behnken
Diseño Box-Behnken: tabla
• Los puntos experimentales son equidistantes entre si.
• Los factores varían en diferente número de niveles
cada uno. Para un diseño de 3 factores: 3, 5 y 7.
x2
• Número de experimentos: N= k2+k+Co)
0 0.5 -0.5 1.0 -1.0
0
1.0
-1.0
x1
Matriz de Doherlet
Central compuesto (CC)
N = 2k +2k + C0
Factorial completo (FC)
N = 3k
2
3
4
5
6
7
Box-Behnken (BB)
N = 2k (k−1) + C0
Diseño más eficiente
Factores Coeficientes Puntos experimentales (N) Eficiencia (E) (modelo cuadrático) (1 punto central)
6
10
15
21
28
36
9
15
25
43
77
143
9
27
81
243
729
2187
-
13
25
41
49
57
0.67
0.67
0.60
0.49
0.36
0.25
-
0.77
0.60
0.51
0.57
0.63
BB CC FC BB CC FC
0.67
0.37
0.18
0.08
0.04
0.02
Cociente entre el número de coeficientes estimados por
el modelo y el numero total de puntos experimentales.
Eficiencia de los diseños
Diseños no simétricos:
D-optimal
Son diseños NO simétricos, logrados mediante
algoritmos computacionales cuyo fin es satisfacer
condiciones establecidas por el operador, tales
como:
• Cantidad de puntos experimentales.
• Tipo de modelo a ajustar.
• Rangos de las variables.
• Regiones no posibles de ensayo.
Diseños optimal
1- Región experimental irregular.
2- Falta de ajuste de modelo cuadrático.
3- Necesidad de reducir la cantidad de puntos
experimentales.
• Se dividen en distintos tipos, nombrados por las
letras del alfabeto.
• El tipo de diseño óptimo se refiere a la
propiedad o criterio que se pondera en el diseño.
Diseños optimal
Es un diseño basado en el criterio de proporcionar una
buena estimación de los parámetros de regresión para
el modelo seleccionado.
11 Puntos Experimentales distintos
Se pierde rotabilidad
Diseño D-optimal
Se crean ecuaciones para
restringir el área donde el
sistema genera
combinaciones no favorables.
Región de alta presión
1.0 2.0
20.0
40.0
Flujo (mL/min)
%
Met
OH
Región
favorable
Se seleccionan puntos
experimentales con una
distribución óptima desde el
punto de vista estadístico.
Diseño D-optimal con restricciones
Puntos seleccionados
Determinante de
XTX máximo
Selección de puntos experimentales en
dominio asimétrico
Buena estimación de
coeficientes y error
de predicción más o
menos estable.
Diseño D-optimal con restricciones
Zonas restringidas: efecto en el error
estándar en un diseño central compuesto
Zonas restringidas: efecto en el error
estándar en un diseño central compuesto
Zonas restringidas: efecto en el error
estándar en un diseño D-optimal
Localización del
óptimo
• Localización del punto estacionario o
región óptima de trabajo (robustez).
• Diseños experimentales de segundo
orden.
• Modelo de segundo orden con buen
ajuste y R2aj mayor a 70%
• Hacer las predicciones con ese modelo.
La optimización implica tener:
Es el punto del espacio de los factores en el cual el plano
tangente a la superficie tiene pendiente igual a cero y es
un “candidato al óptimo”
Punto estacionario
Punto de respuesta
máxima Punto de respuesta
mínima
Punto silla
Loma Valle Silla de montar
0ˆ......ˆˆ21 kxyxyxy
2
00 1
k k
i i ii i ij i ji i i j
y x x x x
Paso 1 Ajustar un modelo de segundo orden con niveles
codificados:
Paso 2 Verificar el tipo de superficie de respuesta obtenida
Análisis gráfico
Análisis canónico
Paso 3 Obtener el punto estacionario
Punto estacionario
Bxx bxTT
0ˆˆ y
En donde:
ˆ
ˆ
ˆ
b
x
1
2
k
1
2
k
x
x
x
β
β
β
Es el vector que
contiene un valor
dado de los
factores
Es el vector
conteniendo los
coeficientes de
regresión de primer
orden
Es una matriz simétrica cuya
diagonal principal está formada
por los coeficientes de los
términos cuadráticos puros
B =
Punto estacionario
La derivada de la función respecto al vector x igualada
a cero es:
02ˆ
Bx b
x
y
bBx -1
02
1-
de donde puede calcularse el punto estacionario:
La respuesta predicha para el punto estacionario estará
dada por:
0 o
1ˆy2
ox b
¿Qué tipo de punto
estacionario es?
¿Es el óptimo que buscamos?
Punto estacionario
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-0.50 0.13 0.75 1.38 2.00
-1.50
-1.13
-0.75
-0.38
0.00
R1
A: AB
: B
22.2
28.828.835.4
42
48.6
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-0.50
0.13
0.75
1.38
2.00
-1.50
-1.13
-0.75
-0.38
0.00
0
14
28
42
56
R
1
A: A B: B
Loma ascendente
¿Qué hacemos en este caso?
Seguimos experimentando en el sentido del óptimo,
siempre que lo permitan las condiciones de operación
del sistema.
Design-Expert® Software
R110
3
X1 = A: AX2 = B: B
-1.00 -0.50 0.00 0.50 1.00
-1.50
-0.75
0.00
0.75
1.50
R1
A: A
B: B
2.42
2.42
3.94
3.94
5.45
5.45
6.97
6.97
8.48
8.48
Design-Expert® Software
R110
3
X1 = A: AX2 = B: B
-1.00
-0.50
0.00
0.50
1.00
-1.50
-0.75
0.00
0.75
1.50
0
2.5
5
7.5
10
R
1
A: A B: B
Cordillera estacionaria
¿Qué hacemos en este caso?
Podemos seleccionar el mejor punto desde el punto de
vista operacional que de una respuesta satisfactoria.
Habrá muchas soluciones posibles al problema y
podemos decidir sobre la conveniencia del nivel de los
factores.
• El error de predicción de la respuesta es
función del modelo postulado, el
diseño y ubicación del punto.
• Para estar seguros de haber
encontrado un óptimo confiable para
nuestro sistema debemos tener en
cuenta el error en la predicción.
Error de predicción
• Está dado por el producto del Leverage en ese
punto de la superficie, multiplicado por la
variancia experimental.
expˆ VxLyV
• El intervalo de confianza para la respuesta
predicha puede calcularse a partir de su
desviación estándar.
yy stICˆ)05.0(ˆ
Error de predicción
¿Como es una salida de D Expert?
Error de predicción
Error de predicción
LsVxLys
VxLyV
expexp
exp
ˆ
ˆ
yy stICˆ)05.0(ˆ
Error de predicción
Design-Expert® Software
StdErr of Design1.5
0.5
X1 = A: AX2 = B: B
Actual FactorC: C = 0.00
-1.00
-0.50
0.00
0.50
1.00
-1.00
-0.50
0.00
0.50
1.00
0.000
0.250
0.500
0.750
1.000
S
tdE
rr o
f D
esi
gn
A: A B: B
Leverage: función del diseño y del modelo ajustado
Design-Expert® SoftwareR1
Color points by value ofR1:
795.8
1
Run Number
Le
vera
ge
Leverage vs. Run
0.00
0.25
0.50
0.75
1.00
1 3 5 7 9 11 13 15 17
Design-Expert® SoftwareR1
Color points by value ofR1:
795.8
1
Run Number
Le
vera
ge
Leverage vs. Run
0.00
0.25
0.50
0.75
1.00
1 3 5 7 9 11 13 15 17
DCC
Modelo Lineal Modelo Cuadrático
puntos centrales
puntos axiales
Error de predicción
Con las repeticiones del punto central se puede
calcular la variancia experimental:
Sexp = 0.57, Vexp = 0.32
Error de predicción: ejemplo
• Con las repeticiones se puede calcular la varianza
experimental:
Sexp = 0.57, Vexp = 0.32
• El leverage en el punto de predicción es
aproximadamente igual a 0.4 (se puede ver la gráfica)
Vypred = L ×Vexp = 0.13
sypred = 0.36
IC = t(0.05, 19) × sypred = 1.73 × 0.36 = 0.62
• Intervalo: 2.57 - 0.62 = 1.95 (D.Expert: 1.73)
2.57 + 0.62 = 3.19 (D.Expert: 3.42)
Error de predicción: ejemplo
Diseños
de mezclas
• En los casos estudiados hasta ahora
se trabajó con variables
independientes.
• Cada variable podía tomar cualquier
valor dentro de su rango,
independientemente del valor
tomado por las otras variables.
Diseños de mezclas
• En una mezcla se tiene una
restricción: la suma de todos los
componentes debe ser igual a 1
(100%).
• Es decir, no pueden ser variados
independientemente, ya que al
hacerlo se puede pasar el porcentaje
de 100.
1
1
0
0 S = 0
S = 1
S = 1
S = 2
S = 1
Diseños de mezclas
Consecuencia:
No es posible aplicar los
diseños vistos a los problemas
de mezclas.
¿Cuando es necesario realizar diseños de
mezclas? Ejemplos:
• Composición de azúcares (u otro nutriente) de un
medio de cultivo que exige que se cumpla cierto valor
de osmolaridad.
• Mezcla de solventes en un proceso extractivo
(diferentes polaridades para diferentes compuestos a
extraer).
• Composición de fases en cromatografía.
• Diferentes ligandos de un comprimido farmacéutico.
• Constituyentes de un alimento.
• Otros.
• El espacio experimental es una figura que tiene
tantos vértices como componentes, en un espacio
cuya dimensionalidad es igual al número de
componentes menos uno.
• La respuesta es una función de las proporciones
de los componentes.
Diseños de mezclas
Tres componentes
• Espacio experimental: triángulo
(cada vértice corresponde a un
componente puro).
• Dimensionalidad: 2
0 x1
1
0
x
2
1
X1+x2 = 1 Dos componentes
• Espacio experimental: segmento
de recta (cada extremo corresponde
a 100 % un componente).
• Dimensionalidad: 1
Diseños de mezclas
1
0.5
0.33
0
Diseños de mezclas
Cuatro componentes
• Espacio experimental: pirámide
(cada vértice corresponde a un
componente)
• Dimensionalidad: 3
Diseños de mezclas
Modelo clásico para un sistema lineal de 2
componentes:
y = b0 + b1 x1 + b2 x2
y = X b + e = ypred + e
=
(XTX)-1XT y = (XTX)-1XTX b
b = (XTX)-1XT y b = [b0 b1 b2 ]
Modelo clásico
ypred = X (XTX)-1XT y ypred = H y (H es conocida como matriz “hat” por sombrero)
Xb = X(XTX)-1XT y
Pero XTX es singular en un diseño de
mezclas
ya que x1+ x2 = 1
Modelo clásico
y = b0 + b1 x1 + b2 x2 + e
Si (x1+ x2= 1), podemos hacer:
ypred = b0 (x1+ x2)+ b1 x1 + b2 x2 (la suma no se altera)
ypred = (b0 + b1) x1 + (b0 + b2) x2
ypred = b1* x1 + b2* x2
Si x1 = 1, x2 = 0, entonces y = b1*
Si x2 = 1, x1 = 0, entonces y = b2*
Con sólo dos experimentos se pueden calcular fácilmente los
coeficientes del “modelo lineal para dos componentes”
Diseños de mezclas: modelo
Reemplazando: x12 = x1 (1- x2 ) y x2
2 = x2 (1- x1 ), se llega a :
ypred = b1* x1 + b2* x2 + b1-2* x1 x2
Modelo cuadrático para dos componentes
De manera similar se puede llegar a:
ypred = b1* x1 + b2* x2 + b3* x3 + b1-2* x1 x2 + b1-3* x1 x3 +
+ b2-3* x2 x3
Modelo cuadrático para tres componentes
ypred = b1* x1 + b2* x2 + b3* x3 + b1-2* x1 x2 + b1-3* x1 x3 +
+ b2-3* x2 x3 + b1-2-3* x1 x2 x3
Modelo cúbico especial para tres componentes
Diseños de mezclas: modelo
Modelo cuadrático clásico:
yi = o + 1 x1 + 2 x2 + 1-2 x1 x2 + 1-1 x12 + 2-2 x2
2 + i
q
i
q
kji
kjiijkjiijii xxxxxxy1
Modelo de Scheffé:
Henry Scheffé (1907-1977)
Diseños de mezclas: modelo
Simplex lattice Simplex centroid
D-optimal
Diseños utilizados
Diseños de mezclas
Ejemplo # 1 Formulación del un comprimido
en que se busca la mejor mezcla de los tres
ligandos (90.8% del total):
Alfa-lactosa monohidratada (x1), beta-lactosa anhidra
(x2) y almidón de arroz modificado (x3).
Respuestas: fuerza que hay que hacer para romper la
tableta (y1), y la velocidad de disolución (y2).
R. Leardi / Analytica Chimica Acta 652 (2009) 161–172
Diseños de mezclas
Diseños de mezclas. Ejemplo # 1
• Los coeficientes de los términos lineales
corresponden a la respuesta obtenida
con el componente puro.
Modelo obtenido para la primer respuesta:
Si X2 y X3 = 0 → X1 = 1
Diseños de mezclas. Ejemplo # 1
• Los coeficientes de las interacciones dobles
indican el efecto sinérgico. En el ejemplo, si no
hubiera interacción, el valor debería ser el promedio de los
coeficientes para X1 y X2, es decir 72 [(31+113)/2]. Pero
es 120/4 (así se calcula el efecto en las interacciones
dobles, dividiendo por cuatro), es decir 30, o sea 42
unidades menos.
• Los coeficientes de las interacciones triples se
calculan dividiendo por 27
Diseños de mezclas. Ejemplo # 1
• En la figura puede verse que X2 tiene el mayor efecto sobre
Y1 y éste es positivo (pasa de 39 a 113).
• X1 tiene menor efecto, pero negativo (pasa de 70 a 31).
• X3 es el componente con menor efecto (pasa de 42 a 38).
¡Observar que estos efectos no se corresponden con los
valores de los coeficientes como en los modelos clásicos!
Y1 = 39 (X2 = 0)
Y1 = 113
(X2 = 100%) Y1 = 70 (X1 = 0)
Y1 = 31
(X1 = 100%)
Y1 = 42 (X3 = 0)
Y1 = 38
(X3 = 100%)
Diseños de mezclas. Ejemplo # 1
Modelo obtenido para la segunda respuesta:
Mayor
respuesta para
la combinación
de ambos
factores
Diseños de mezclas. Ejemplo # 1
Diseños de mezclas. Ejemplo # 2
Formulación de un comprimido
en el cual hay 20% de droga y el resto
corresponde a una mezcla de 3
excipientes:
1- Lactosa
2- Avicel PH 101 (una celulosa microcristalina)
3- Hidroximetilpropilcelulosa (HMPC)
Comprehensive Chemometrics. Vol 1, página 431
Se mide una propiedad:
Fuerza de rotura (kg) <1.30
Diseños de mezclas. Ejemplo # 2
Se quiere ajustar un modelo
cúbico especial
Diseños de mezclas. Ejemplo # 2
Diseños de mezclas. Ejemplo # 2
Ajuste de la respuesta Fuerza de rotura
Diseños de mezclas. Ejemplo # 2
Diseños de mezclas. Ejemplo # 2
La ‘interacción’ BC se debe mantener para que el
modelo sea jerárquico
Diseños de mezclas. Ejemplo # 2
Gráfica de trazas: “Trace”
• Es una especie de silueta de la superficie de respuesta.
• Representa el efecto de cambiar cada componente en una línea imaginaria a
partir de una mezcla referencia (el centroide)
Gráfica de trazas para el ejemplo # 1
(Leardi)
Es un análisis similar al realizado anteriormente
Diseños de mezclas: uso de restricciones
Ejemplo: es necesario
que los tres
componentes estén
siempre
Diseños de mezclas: a veces es necesario
que nunca estén en forma pura
Diseños de mezclas: Ejemplo # 3
Formulación de un detergente
midiendo dos respuestas:
viscosidad y turbidez
Restricciones:
• 3% ≤ A (agua) ≤ 8%
•2% ≤ B (alcohol) ≤ 4%
•2% ≤ C (urea) ≤ 4%
A+B+C=9%
Tutorial Design Expert
Diseños de mezclas. Ejemplo # 3
Propiedades del diseño
Diseños de mezclas. Ejemplo # 2
Los vértices ya no son puros
Diseños de mezclas. Ejemplo # 2
Efluente de la
industria lechera
Efluente de la
industria
cervecera
Efluente de la
industria
azucarera
Optimization of the Bacillus thuringiensis var. kurstaki HD-1 d-endotoxins production by using experimental mixture design
and artificial neural networks. GA Moreira, GA Micheloud, AJ Beccaria, HC Goicoechea, Biochem. Eng. J., 2007, 35, 48-55.
Diseños de mezclas: Ejemplo # 4
Uso de efluentes industriales para un
medio de cultivo
Modelos mixtos
Mezcla-Proceso Mezcla-Mezcla
x1
x2
x3 x1
x2
x3
x1
x2
x3
x1
x2
x3 x1
x2
x3
z1
z2
x1
x2
x3
z1
z2
z3
z1
z2
z3
z1
z2
z3 z1
z2
z3
Modelo mixto
Lineal x Lineal
Cuadrático x Cuadrático
y = f (x) x g (z)
y = (f1 x1 + f2 x2 + f3 x3) x (g1 z1 + g2 z2 + g3 z3)
y = (f1 x1 + f2 x2 + f3 x3) x g1 z1 + (f1 x1 + f2 x2 + f3 x3) x g2 z2 + (f1 x1 +
f2 x2 + f3 x3) x g3 z3
y = f1 x1 g1 z1 + f2 x2 g1 z1 + f3 x3 g1 z1 + f1 x1 g2 z2 + f2 x2 g2 z2 + f3 x3
g3 z3 + f1 x1 g3 z3 + f2 x2 g3 z3 + f3 x3 g3 z3
33
3
332
3
231
3
1
23
2
322
2
221
2
113
1
312
1
211
1
1
zxbzxbzxb
zxbzxbzxbzxbzxbzxby
Modelo lineal mixto de mezclas
cruzadas para tres componentes
Ejemplo # 5: optimización de un medio de cultivo
para la producción de una proteína recombinante
C. Didier, M. Etcheverrigaray, R. Kratjie, H.C. Goicoechea, Chemom. Intell. Laborat. Syst. 86 (2007) 1
Modelo mixto Mezcla-Mezcla
N sources C sources
Constrains
Modelo mixto Mezcla-Mezcla
Optimización por
sectores
Modelo mixto Mezcla-Mezcla
Commercial product
of high price
Developed product of
low price
Response Modelo F p Adj. R2 p-LOF
IVC QxQ 6.46 < 0.0001 0.722 0.307
qprot QxQ 8.39 < 0.0001 0.781 0.013
BA QxQ 11.04 < 0.0001 0.832 0.052
qlact QxQ 5.46 < 0.0001 0.679 0.233
qamo QxQ 2.85 0.0055 0.500 0.005
Modelo mixto Mezcla-Mezcla
RSM
• Técnica versátil que permite usar
diferentes diseños experimentales y
herramientas estadísticas para optimizar
procesos.
• Puede aplicarse a una o a de varias
respuestas simultáneamente.
Conclusiones
RSM
• Requiere buen criterio del operador y el
correcto uso de la metodología.
• Importante realizar la confirmación
experimental.
Conclusiones
140