Date post: | 26-Jun-2015 |
Category: |
Documents |
Upload: | raffaello-giuliano-ch |
View: | 1,024 times |
Download: | 0 times |
[Escribir el nombre de la compañía]
Noviembre 2010
MODELOS ESPECIALES Diseño de Experimentos Rafael Chacolla Huaringa A00807654 Mariana Elizondo García A00795431 Roberto Portillo Lara A00806031
1. Diseños anidados
1.1 Introducción
El diseño de experimentos se refiere a la forma en la que el experimento se llevará a cabo, particularmente, la forma en la que los tratamientos serán administrados a los sujetos. Estos tratamientos pueden ser vistos como niveles cualitativa o cuantitativamente distintos dentro del ensayo. El tipo de análisis o prueba de hipótesis utilizada dependo del diseño experimental que se empleé. A grandes rasgos, existen dos principales tipos de diseño de experimentos: cruzado y anidado. En un experimento cruzado, cada sujeto es expuesto a más de una condición o tratamiento. La característica principal de este tipo de diseño es que cada sujeto tendrá más de un puntaje correspondiente a los tratamientos. Los efectos observados, si existen, ocurren dentro de cada individuo. Si bien este tipo de diseño ofrece muchas ventajas, como el hecho de requerir menos sujetos de experimentación debido a que cada uno es usado más de una vez en el ensayo, también presenta desventajas como la influencia de efectos acumulados.En un experimento de tipo jerarquizado o “anidado”, cada sujeto recibe un solo nivel de la condición experimental. A su vez, la principal característica de este tipo de diseño es que cada sujeto presenta un solo puntaje que corresponde a un solo tratamiento. Los efectos observados nuevamente, si existen, ocurren entre los sujetos. Las ventajas y desventajas de este diseño son opuestas a los del diseño cruzado. Por una parte la acumulación de efectos no es un factor a considerar, sin embargo, se requiere un número mayor de sujetos de experimentación. En resumen, un factor cruzado contiene niveles que presentan una propiedad física o fundamental que es la misma para todos los niveles de los demás factores incluidos en el experimento. Frecuentemente distintas situaciones experimentales requieren que niveles únicos de un factor ocurran dentro de cada nivel de un segundo factor. Esta jerarquización de factores puede surgir también cuando un procedimiento experimental restringe la aleatorización de combinaciones factor-nivel. Considere un experimento que será conducido utilizando tres muestras de material obtenidas de dos proveedores. En este escenario no existe ninguna relación física o fundamental entre las muestras marcadas 1, 2 y 3 de cada vendedor. En terminología de diseño experimental se dice que el factor “muestras” se encuentra anidado dentro del factor “proveedor”. Este es un diseño anidado de dos factores. Experimentos llevados a cabo para diagnosticar fuentes de variabilidad en procesos de manufactura o en métodos de laboratorio utilizan a menudo diseños anidados. Los diseños anidados jerárquicos son apropiados cuando cada uno de los factores en un experimentos esta progresivamente anidado dentro del factor precedente. La construcción de este tipo de diseños se puede resumir de la siguiente manera:
1. Listar los factores a incluir en el experimento. 2. Determinar la jerarquía de los factores. 3. Seleccionar, aleatoriamente si es posible, un número igual de niveles para cada
factor dentro de los niveles del factor precedente. 4. Aleatorizar el orden de los ensayos o la asignación de las combinaciones factor-
nivel a las unidades experimentales.
1.2 Análisis Estadístico
El modelo estadístico linear para un diseño anidado de dos factores es el siguiente:
Donde, existen a niveles para el factor A, b niveles para el factor B anidado debajo de cada nivel A, y n replicas. El subíndice j(i)indica que el nivel j del factor B se encuentra anidado debajo del nivel i del factor A. Es adecuado considerar a las réplicas como anidadas dentro de las combinaciones de los niveles A y B; de esta forma, el subíndice (ij)k se utiliza para el término del error. Este es un diseño anidado balanceado debido a que existe un igual número de niveles de B dentro de cada nivel de A y un igual número de réplicas. Debido a que no todos los niveles del factor B aparecen dentro de cada nivel del factor A, no puede existir ninguna interacción entre A y B. La suma de cuadrados total puede escribirse como:
Expandiendo el lado derecho de la ecuación anterior se obtiene que:
Esto debido a que los tres términos de productos cruzados son cero. La ecuación anterior indica que el total de la suma de cuadrados puede ser particionada en una suma de cuadrados debido al factor A, una suma de cuadrados debido al factor B debajo de los niveles de A y una suma de cuadrados debido al error. Simbólicamente, esto equivale a:
Se tienen grados de libertad para , grados de libertad para ,
grados de libertad para y grados de libertad para el error.
Nótese que . Si los errores son , se puede dividir cada suma de cuadrados a la derecha de la ecuación anterior entre sus grados de libertad para obtener cuadrados medios independientemente distribuidos de forma que el ratio de cualquier par de cuadrados medios se distribuya como una F. El análisis estadístico apropiado para probar los efectos del factor A y B depende de si A y B son factores fijos o aleatorios. Si los factores A y B son fijos, asumimos que
y . Esto es que los A efectos de los
tratamientos suman cero y que los B efectos de los tratamientos suman cero dentro de cada nivel de A. Alternativamente, si A y B son aleatorios, asumimos que es
y es . Modelos mezclados con A fijos y B aleatorios también
con ampliamente utilizados. Los cuadrados medios esperados pueden ser determinados de la siguiente forma:
En la tabla anterior se indica que si los niveles de A y B son fijos, se demuestra mediante MSA/MSB y se demuestra mediante MSB(A)/MSE. Si A
es un factor fijo y B es aleatorio, entonces se demuestra mediante MSA/MSB(A) y se demuestra mediante MSB(A)/MSE. Finalmente, si ambos
factores A y B son aleatorios, se demuestra que se demuestra mediante MSA/MSB(A) y se demuestra mediante MSB(A)/MSE.
Las sumas de cuadrados pueden expresarse de la siguiente forma:
E(MS) A Fijo A Fijo A Aleatorio B Fijo B Aleatorio B Fijo
E(MSA)
E(MSB(A))
E(MSE)
El procedimiento de la prueba esta resumido en la siguiente tabla de análisis de varianza
Fuente de Suma de cuadrados Grados de Cuadrados Variación libertad medios
A MSA
B dentro de A MSB(A)
Error MSE
Total
La ecuación para la SSB(A) puede ser escrita como:
(2.9)
Esto expresa la idea de que SSB(A) es la suma de cuadrados entre los niveles de B por cada nivel de A, sumados a través de todos los niveles de A.
1.3 Aplicaciones y variaciones al modelo Existen variaciones al modelo de factores anidados que modifican la forma en la que los sujetos de experimentación se anidan en el factor precedente. Ocasionalmente en un experimento multifactorial, algunos factores son organizados en una disposición factorial y otros son anidados. Estos diseños son llamados diseños anidados-factoriales. Un potencial problema en la aplicación de diseños anidados es que algunas veces, para obtener un número razonable de grados de libertad en el nivel más altos, se puede terminar con demasiados grados de libertad en los niveles más bajos. Una forma de evitar esto es utilizando un tipo particular de diseño anidado no balanceado llamado diseño anidado escalonado. Este es un modelo parcialmente replicado que usualmente resulta en un experimento más pequeño que el original, siempre y cuando se balanceé la información adecuadamente.
En términos generales, un ANOVA anidado se utiliza cuando se tiene una variable de medición y dos o más variables nominales. Las variables nominales se encuentran anidadas, esto significa que cada valor de una variable nominal (los subgrupos) se encuentra en combinación con un solo valor de la variable nominal precedente. La variable superior nominal puede ser de dos tipos: modelo I o modelo II. El modelo II es un ANOVA anidado de efectos aleatorios: todos los efectos en los distintos niveles son aleatorios. El modelo I es un ANOVA mezclado, donde el primer nivel tiene efectos mezclados, por ejemplo diferentes drogas o tratamientos. Todos los subgrupos, subsubgrupos, etc., en un ANOVA anidado se basan en distinciones sin un interés inherente, del tipo analizado en un ANOVA de una vía Modelo II. Los grupos en el nivel superior también pueden carecer de un interés inherente, en este caso se trata de un ANOVA anidado Modelo II puro. Esto se ve comúnmente en estudios de genética cuantitativa. Si los niveles superiores son de interés para el estudio, del tipo analizado en un ANOVA Modelo I de una vía, entonces se trata de un ANOVA anidado de modelo mezclado. Keon y Muir (2002) diseñaron un estudio mediante el cual pretendían determinar si el tipo de hábitat afectaba la tasa de crecimiento del liquen UsneaLongissima. Los trasplantes fueron pesados y ubicados en 12 sitios, los cuales consistieron de 3 réplicas para cuatro tipos distintos de hábitats en el estado de Oregon, EEUU. 90 trasplantes fueron colocados en cada hábitat (n=360). Un año después, se recolectaron los líquenes, se pesaron de nuevo y se calculó el cambio en el peso. En este experimento se manejaron dos variables nominales (tipo de hábitat y sitio del trasplante). El factor “sitio” se encuentra anidado debajo de “tipo de hábitat”. El crecimiento fue determinado como el cambio en la biomasa y la longitud después de un año. Los resultados del ANOVA anidado de modelo mezclado indicaron que existe una variación significativa entre los sitios dentro de los hábitats (F8, 200=8.11, P=1.8 x 10-9) y una variación significativa entre hábitats (F3, 8=8.29, P=0.008).En la figura1.1 se muestra un resumen de los resultados mencionados.
Figura 1.1Diferencia entre hábitats en la tasa de crecimiento utilizando un ANOVA anidado.
Otro ejemplo sobre la aplicación de este tipo de diseño viene del campo de la proteómica. La proteómica es el estudio de la totalidad del complemento proteico expresado por un genoma en una determinada célula o tejido. En la actualidad, el desarrollo de esta tecnología conlleva numerosas dificultades tanto experimentales como analíticas. En particular parece existir un cierto nivel de confusión en la comunidad científica acerca de la naturaleza de la replicación. Las réplicas en este tipo de experimentos pueden ser de dos tipos. Réplicas técnicas que son medidas repetidas de la misma muestra biológica y réplicas biológicas que son diferentes muestras provenientes de un grupo con el mismo tratamiento. El tipo de réplica utilizado afecta
el tipo de análisis estadístico que puede ser llevado a cabo y las conclusiones que se pueden obtener. Karp y colaboradores (2005) elaboraron un estudio sobre los tipos de réplicas que provee además algunas guías para el análisis de datos de proteómica. En este caso, las pruebas estadísticas dependen de la suposición de que cada medida corresponde a una muestra independiente. Sin embargo, las réplicas técnicas provienen de la misma muestra biológica, por lo tanto no son independientes y tienden a arrojar medidas similares. En este trabajo se propone una prueba estadística alternativa basada en el análisis de varianza y se demuestra que la utilización del método incorrecto de análisis conlleva a la sobrevaloración de los niveles de significancia obtenidos. Una alternativa apropiada al ANOVA de una sola vía usado tradicionalmente es un ANOVA del tipo anidado.
Figura 1.2Estructura de las réplicas para los dos tipos de ANOVA utilizados
En este tipo de diseño se puede emplear una serie de réplicas técnicas y biológicas. Esta prueba puede tomar en consideración la relación que existe entre las réplicas técnicas obtenidas a partir de la misma muestra biológica al buscar cambios significativos. La figura 3.2 provee una representación gráfica de la jerarquía considerada en el ANOVA de una sola vía versus el ANOVA anidado. Los resultados de este estudio demuestran que el ANOVA de una sola vía sobreestima el significado de la mayoría de las muestras procesadas dado que resultó en valores p menores. Entonces, el ANOVA de una sola vía sobreestima el nivel de significancia de las diferencias entre los grupos. La diferencia en los valores p observados depende de la diferencia en la varianza técnica y biológica. Mientras más similar sea la varianza biológica de la técnica, menor será la diferencia en los valores p. Este estudio demuestra que mezclar tipos de réplicas sin el análisis apropiado conlleva usualmente a la obtención de resultados falsos positivos.
2. Diseños Split Plot
2.1 Introducción En los experimentos factoriales, a veces, un factor requiere más material experimental para su evaluación que otro factor. En las pruebas de campo en agronomía y horticultura, un factor como los métodos de cultivo puede requerir el uso de algún tipo de equipo que es más adecuado en parcelas grandes; mientras que otro factor, como nivel de fertilidad, se puede aplicar con facilidad a una parcela mucho más pequeña. La parcela de tratamiento de métodos de cultivo más grande, la parcela completa, se divide en sub-parcelas más pequeñas a las que se les aplican distintos tratamientos de cultivo o fertilidad. Esto se conoce como diseño de parcelas divididas y este ejemplo particular tiene dos unidades experimentales de diferente tamaño.
Bloque 1
Bloque 2 A3 A1 A2 A4
A4 A2 A1 A3
B3 B2 B1 B1
B1 B1 B2 B3
B2 B1 B2 B3
B3 B2 B1 B2
B1 B3 B3 B2
B2 B3 B3 B1
2.2 Usos y aplicaciones
Cuando uno de los factores, por su naturaleza, exige parcelas relativamente grandes, por ejemplo, sistemas de labranza, de irrigación, distancias entre surcos, niveles de luz o de temperatura; mientras que el otro factor permite su aplicación sobre unidades experimentales más pequeñas como variedades, distancia entre plantas, dosis de fertilizantes, etc. Cuando en un experimento se toman varias mediciones sobre la misma unidad experimental a través del tiempo y tales mediciones son independientes, puede considerarse el conjunto de las mediciones realizadas sobre una misma unidad experimental como la Unidad Principal, y cada una de las lecturas realizadas en el tiempo como las subunidades. El análisis es análogo al de un diseño Parcelas Divididas (en el espacio), por lo que se le designa a este diseño como Parcelas Divididas en el Tiempo. Si luego de iniciado el experimento se desea incluir otro factor —y su naturaleza lo permite—, pueden dividirse las unidades experimentales y realizar la aleatorización de los niveles del segundo factor en las subunidades resultantes.
2.3 Modelo matemático y análisis Estadístico
Como el análisis estadístico debe tomar en cuenta la presencia de dos tipos o tamaños diferentes de unidades experimentales en el experimento, los efectos del factor A se estiman a partir de las parcelas completas, mientras que los efectos del factor B y de la interacción AB se estiman a partir de las sub-parcelas para el factor B. Como las parcelas completas y sub-parcelas son unidades experimentales de distintos tamaños o tipos, tienen diferente precisión, lo que debe considerarse para hacer comparaciones entre las medias de tratamiento. La consideración de dos errores separados es consecuencia del hecho de que las observaciones de distintas subparceles en la misma parcela pueden tener una correlación positiva. La correlación refleja la naturaleza de las unidades experimentales que responden de manera similar cuando son adyacentes, como las subparcelas vecinas, los estudiantes en un salón de clase, los cultivos en una cámara de cultivo o las unidades del mismo lote de materia prima en un experimento industrial. Como consecuencia de estas diferencias en los errores asociados con las comparaciones de parcelas completas y sub-parcelas de tratamientos, la partición de la suma de cuadrados en el análisis de varianza se altera un poco con respecto a la partición para el diseño factorial de dos factores. Las particiones para los efectos del factor y los factores de bloque permanecen igual que los diseños factoriales usuales, pero el error experimental se divide en dos componentes. Una componente del error experimental se asocia con el factor de tratamiento de la parcela completa y la otra con el factor de tratamiento de la sub-parcela y la interacción. Para diseñar parcelas divididas se usa una formulación de modelo mixto que refleje las distintas varianzas del error experimental para las sub-parcelas y la parcela completa, lo que incluye los efectos del error aleatorio por separado para ambas. Si el factor de tratamiento de la parcela completa se coloca en un diseño de bloques totalmente aleatorizado el modelo lineal es:
Donde es la media general, i es el efecto del i-ésimo bloque, j es el efecto del j-ésimo nivel del factor A, ij es el error aleatorio de la parcela completa, k es el efecto del k-ésimo nivel del factor B, las interacciones entre los factores y ijk es el error aleatorio de la sub-parcela. Se supone que los errores de la parcela completa y la sub-parcela son errores aleatorios independientes con distribución normal con media 0 y varianzas respectivas. La asignación aleatoria de los tratamientos a las unidades experimentales justifica la suposición de independencia para los dos errores aleatorios y la correlación igual entre los errores de las unidades en la sub-parcelas dentro de una misma parcela completa.
Parcela Completa “ Wholeplot “
Sub-parcela “Split-plot “
El analisis de varianza puede ser extendido a un diseño de bloques completamente aleatorizado. El procedimiento usa una suma de cuadrados que se descompone en tres componentes.
Simbólicamente
Los valores esperados de las medias de cuadrados son:
Finalmente para realizar el análisis usamos las siguientes formulas:
2.4 Ejemplo
Se estudió el rendimiento forrajero del ramio en función de diferentes frecuencias de corte y niveles de fertilizante. Los niveles de fertilizante se asignaron a las parcelas grandes con base en un diseño de bloques completos al azar (tipos de suelo) con 3 repeticiones; las frecuencias de corte se asignaron a las sub-parcelas. 0 kg/ha (a0)
Fertilizante (a) 100 kg/ha (a1)
200 kg/ha (a 2) 38 días (b1)
Frecuencias de corte (b) 57 días (b2) 76 días (b3) A continuación se presenta un posible esquema de aleatorización:
Bloque 1
Bloque 2
Bloque 2
A1 B3 B1 B2
A0 B1 B2 B3
A2 B3 B2 B1
A2 B2 B3 B1
A1 B3 B2 B1
A0 B3 B1 B2
A0 B1 B2 B3
A2 B3 B1 B2
A1 B1 B2 B3 La siguiente tabla contiene el rendimiento en kilogramos de forraje verde por parcela, registrado durante un ciclo de producción de 228 días. Tratamientos Bloques I II III Yij. a0b1 78.9 72.5 78.6 230.0 a0b2 68.1 66.1 69.3 203.5 a0b3 56.9 57.1 53.9 167.9 Y0.k 203.9 195.7 201.8 601.4 a1b1 84.3 99.3 72.9 256.5 a1b2 86.8 108.9 86.6 282.3 a1b3 73.1 73.4 61.7 208.2 Y1.k 244.2 281.6 221.2 747.0 a2b1 95.6 95.2 96.9 287.7 a2b2 97.8 108.1 99.2 305.1 a2b3 90.3 121.4 97.6 309.3 Y2.k 283.7 324.7 293.7 902.1 Y..k 731.8 802.0 716.7 Y…=2250.5 Con el fin de ilustrar el proceso de análisis, éste se desglosa en dos partes: el análisis de las Parcelas Principales y el análisis de las Sub-parcelas. Se inicia con la parte correspondiente a las Parcelas Principales.
Bloque I Bloque II Bloque III
a1 a0 a2
a2 a1 a0
a0 a2 a1
Se hacen particiones tanto de las sumas de cuadrados como de los grados de libertad correspondientes a las parcelas grandes, acorde con el esquema de aleatorización usado para el factor principal.
Es importante anotar que cuando el factor asignado a las Parcelas Principales se distribuye con base en un Diseño Completamente al Azar, la suma de cuadrados y los grados de libertad de las Parcelas Principales se particiona sólo entre el efecto principal del factor a y el Error a.
Totales de las Parcelas Grandes (Combinaciones Bloques*a) (Yi.k)
I II II Yi..
a0 203.9 195.7 201.8 601.4 a1 244.2 281.6 221.2 747.0 a2 283.7 324.7 293.7 902.1
Y..k 731.8 802.0 716.7 2250.5 Las Parcelas Grandes están conformadas por las combinaciones Bloques*a (por las combinaciones r*a, en un DCA)
SC (Combinaciones Bloques*a) SC (Parcelas Grandes)
TC= Término de corrección
Antes de pasar al análisis de las sub-parcelas, es importante analizar el esquema completo que ilustra la forma en que se particionan tanto las sumas de cuadrados como los grados de libertad. Bloques
(r-1)=2
Parcelas Grandes (a*r)-1=8
A (a-1)=2
Error a (r-1)(a-1)=4
Total (a*b*r)-1=26
Tratamientos (a*b-1)=8
B (b-1)=2
Sub-parcelas a*r(b-1)=18
AB (a-1)(b-1)=4
Error b a(r-1)(b-1)=12
Se inicia el análisis de las Sub-parcelas con la partición de las sumas de cuadrados de los tratamientos.
Totales de las Combinaciones ab (tratamientos)(Yij.)
b1 b2 b3 a0 230 203.5 167.9 a1 256.5 282.3 208.2 a2 287.7 305.1 309.3 Y.j. 774.2 790.9 685.4
A Tratamientos B AB
Tabla del Análisis de Varianza
Fuentes de Variación DF Sumas de
Cuadrados CuadradosMedios
F F0.05(gln,
gld)
ParcelasPrincipales
Bloque 2 460.45 230.225 1.935 A 2 5025.03 2512.515 21.119 6.94 Error a 4 475.86 118.965
Subparcelas
B 2 714.62 357.310 9.268 3.88 AB 4 963.42 240.855 6.247 3.26 Error b 12 462.61 38.550
Total 26 8101.99 El efecto principal del factor a (A) se evalúa con el Error a; mientras que el efecto principal del factor b (B) y la interacción AB se evalúan con el Error b. En caso de tener más de dos factores, las interacciones entre factores asignados a las parcelas principales se evalúan con el Error a; las interacciones entre factores asignados a las sub-parcelas o interacciones de éstos con algún factor asignado a las parcelas principales se evalúan con el Error b. En este caso, puesto que la interacción resultó significativa el siguiente análisis debería ser la evaluación de los efectos simples. No obstante, debido a que en este diseño se generan errores estándar distintos para cada uno de los diferentes grupos de comparaciones, se ilustran las diferentes posibilidades de comparación de medias.
2.5Ventajas y desventajas del modelo Split-plot
Ya se ha mencionado la ventaja principal de las parcelas divididas: cuando un factor requiere una mayor cantidad de material experimental que otro factor, como en los estudios de agronomía, o cuando existe la oportunidad de estudiar respuestas de un segundo factor, mientras que se da un uso eficiente de los recursos, como en los estudios en cámaras de cultivo.
Las principales desventajas del diseño de parcelas divididas incluyen la posible pérdida en la precisión de las comparaciones de tratamientos y un incremento en la complejidad del análisis estadístico. El análisis de varianza y la estimación de los errores estándar para los distintos tipos de comparaciones de tratamientos requieren de más cálculos.
Eficiencia relativa de las comparaciones de sub-parcelas y parcelas completas
Es común atribuir, la eficiencia relativa de un diseño de experimento a la eficiencia como resultado del uso de bloques mediante algún factor y la de ignorar el factor de bloque. Con los diseños de parcelas divididas, es revelador considerar la eficiencia relativa al usarlos en lugar de diseñar el mismo experimento sin la característica de las parcelas divididas. Por ejemplo, cuando el factor de tratamiento de la parcela completa se arregla en un diseño de bloques totalmente aleatorizado, es posible determinar cuál de los diseños es más eficiente en las comparaciones de tratamientos de parcelas completas y de interacción. Existe una relación entre el incremento en la precisión de las medias de tratamiento en las subparcelas y la disminución en la precisión de las medias de tratamiento de las parcelas completas.
Eficiencia de las comparaciones en la sub-parcelas
Federer (1955) muestra que la eficiencia del diseño de parcelas divididas con respecto al diseño de bloques totalmente aleatorizado para las comparaciones en las subparcelas es:
f1 = a(b - l)(r - l), los grados de libertad para el error en la subparcela CME(2), y f2 = (ab - l)(r - l), los grados de libertad para el error experimental del bloque totalmente aleatorizado.
Eficiencia de las comparaciones de parcelas completas
La eficiencia relativa de los diseños de parcelas divididas con respecto al diseño de bloques totalmente aleatorizado para las parcelas completas es:
con f1 = (a - l)(r - 1) para el error de la parcela completa CME(1).
3. Diseños de mezclas
3.1 Introducción En los experimentos con mezclas, los factores son componentes o ingredientes de una mezcla y, por consiguiente, sus niveles no son independientes. Por ejemplo, si x1, x2, …, xp denota las proporciones de p componentes de una mezcla, entonces
3.2 Usos y aplicaciones
Los experimentos con mezclas pueden ser utilizados en: 1) Mezclas de harina de pan consistentes en trigo y varios aditivos. 2) Fertilizantes consistentes en mezclas de químicos. 3) Vinos mezclados de diferentes tipos de uvas. 4) Pinturas y colorantes. 5) Aleaciones. 6) Fármacos. 7) Gasolina con aditivos que mejoran su rendimiento.
3.3 Región de experimentación
Mezclas con dos componentes
Para dos componentes, el espacio de los factores del diseño incluye todos los valores de los dos componentes que están sobre el segmento de recta x1 + x2 = 1, con cada componente siendo acotado por 0 y 1 (Figura 3.1).
Figura 3.1 Espacio de los factores restringidos para una mezcla con p=2 componentes.
Mezclas con tres componentes
Con tres componentes, el espacio de la mezcla es un triángulo con vértices que corresponden a las formulaciones que son mezclas puras (mezclas que son 100% de un solo componente) (Figura 2).
Figura 3.2Espacio de los factores restringidos para una mezcla con p= 3 componentes.
3.4 Diseño de experimentos con mezclas
Diseñosímplex reticular
Un diseño símplex reticular p, m (Figura 3.3) para p componentes consta de los puntos definidos por los siguientes arreglos de las coordenadas: las proporciones asumidas por cada componente toman los m + 1 valores que están separados por una distancia igual de 0 a 1,
y se usan todas las combinaciones posibles (mezclas) de las proporciones de la ecuación. El número de puntos en un diseño símplex reticular p, m es:
El diseño símplex reticular solo proporciona suficientes puntos de diseño para un arreglo exacto a un polinomio de orden m.
Figura 3.3Algunos ejemplos de símplex reticular p, m .
Diseño símplexde centroide
Una alternativa del diseño símplex reticular es el diseño símplex de centroide(Figura 4). En un diseño símplex de centroide con p componentes, hay 2p-1 puntos, que corresponden a las p permutacionesde , las
permutaciones de , las permutaciones de ,…, y
el centroide global .Estos puntos son los vértices y los centroides de los
símplex de dos dimensiones, tres dimensiones, …, p dimensiones encontrados en el espacio de la mezcla original.
Figura 4 Diseños símplex de centroide con a) p = 3 componentes y b) p = 4 componentes.
Diseño símplex aumentado
Los diseños símplex reticular y símplex de centroide son diseños de punto frontera. Si el experimentador quiere hacer predicciones acerca de las propiedades de mezclas completas, es necesario contar con más corridas en el interior del símplex, por lo que se recomienda aumentar los diseños símplex ordinarios con corridas axiales y el centroide global (si el centroide no es ya un punto del diseño) (Figura 3.5). Para posicionar los puntos axiales, se debe considerar que el eje del componente i es la recta que une un vértice con el centroide de la cara opuesta y que la longitud del eje del componente es una unidad.Los puntos axiales se sitúan sobre los ejes de los componentes a una distancia Δ. El valor máximo de Δ es(p-1)/p.
Se recomienda que las corridas axiales se coloquen a la mitad entre el centroide del diseño símplex y cada vértice para que Δ=(p-1)/2p. En ocasiones a estos puntos se les llama mezclas de verificación axial, porque es una práctica común excluirlas cuando se ajusta el modelo preliminar de la mezcla y usar después las respuestas en estos puntos axiales para verificar la adecuación del ajuste del modelo preliminar.
Figura 3.5 Diseño símplex centroide aumentado con p=3 componentes.
3.4 Análisis Estadístico Las formas estándares de los modelos matemáticos para mezclas que se usan ampliamente son:
Lineal
Cuadrático
Cúbico completo
Cúbico especial
En las ecuaciones anteriores, el parámetro representa la respuesta esperada para la mezcla pura xi=1 y xj=0 cuando j ≠ i. A la porción
se le llama proporción de mezcla lineal. Cuando hay curvatura derivada de
una mezcla no lineal entre pares de componentes, los parámetros βij representan una mezcla sinérgica o bien antagónica. Los términos de órdenes superiores suelen ser necesarios en los modelos para mezclas porque:
1) Los fenómenos estudiados pueden ser complejos. 2) La región experimental con frecuencia es la región de operabilidad
completa y, en consecuencia, es grande y requiere un modelo elaborado.
3.5 Regiones restringidas En algunos experimentos con mezclas surgen restricciones sobre los componentes individuales, como:
1) Restricciones sobre la frontera inferior. 2) Restricciones sobre la frontera superior. 3) Restricciones en ambas fronteras.
Restricciones sobre la frontera inferior
Las restricciones sobre la frontera inferior de la forma
son muy comunes. Cuando sólo están presentes restricciones sobre la frontera inferior, la región factible del diseño sigue siendo un diseño símplex, pero se inscribe dentro de la región del símplex original (Figura 3.6). Esta situación puede simplificarse mediante la introducción de pseudocomponentes, definidos como:
con . Entonces,
por lo que el uso de pseudocomponentes permite utilizar diseños tipo símplex cuando las fronteras inferiores forman parte de la situación experimental. Las formulaciones especificadas por el diseño símplex para los pseudocomponentes se transforma en formulaciones para los componentes originales invirtiendo la transformación de la ecuación. Es decir, si xi’ es el valor asignado al pseudocomponente i-ésimo en una de las corridas del experimento, el componente i-ésimo de la mezcla original es:
Figura 3.6Ejemplo de un experimento con restricciones sobre la frontera superior.
Restricciones sobre la frontera superior
Las restricciones sobre la frontera superior de la forma
por lo regular no son diseños símplex o son símplex invertidos con respecto a la región del símplex original (Figura 3.7).
En este caso también se utilizan pseudocomponentes, ahora definidos como:
con . Entonces,
Debido a que el símplex tiene una orientación inversa al símplex original, el signo de los coeficientes lineales en el modelo matemático será opuesto.
Figura 3.7 Ejemplo de un experimento con restricciones sobre la frontera superior.
Restricciones en ambas fronteras
Cuando los componentes tienen restricciones tanto sobre la frontera superior como la inferior, la región factible deja de ser un diseño símplex; será en cambio, un politopo irregular (Figura 3.8). Puesto que la región experimental no tiene una forma “estándar”, los diseños se hacen mediante vértices extremos y su análisis no es símplex sino D-Optimal.
Figura 3.8Ejemplo de un experimento con restricciones sobre ambas fronteras.
3.6 Ejemplo
Mixed Culture Optimization for Marigold Flower Ensilage via Experimental Design
and Response Surface Methodology
Efecto simbiótico o antagonista. Diseño de cultivos mixtos.
Para explorar la existencia de una relación simbiótica o antagonista entre diferentes microorganismos en lo que se refiere a su producción enzimática, los autores de este artículo plantearon un diseño símplex de centroide. Ellos utilizaron el extracto enzimático crudo (є) de tres microorganismos [Flavo bacteriumIIb (C1), A. anitratus (C2) y R. nigricans (H1)], los cuales había mostrado tener una actividad enzimática alta en estudios anteriores. En cada experimento evaluaron la actividad
como el cambio en la viscosidad a una solución CMC, obteniendo los siguientes resultados:
Figura 3.9 Diseño de experimentos para cultivos mixtos con el microorganismo de mayor actividad de celulasa.
El análisis de los datos sugirió un modelo especial cúbico (el ajuste se realizó utilizando mínimos cuadrados):
En este modelo, el coeficiente para el extracto crudo de H1 ( ) es significativamente
diferente que el de los otros términos, indicando que el extracto enzimático de este microorganismo fue más efectivo en la degradación de celulosa. El coeficiente de los términos no lineales que involucran C1C2 es positivo; por lo tanto, el extracto mixto tuvo un efecto sinérgico. En la Figura 3.10 se muestran los contornos de la viscosidad graficados, lo cual puede ser de utilidad para interpretar los resultados. En las Figuras 3.9 y 3.10 que presentan los autores, se observó que la mezcla de los extractos crudos de C1 y C2 no redujo la viscosidad como los extractos crudos de cada uno de los microorganismos. Los coeficientes no lineares restantes en el modelo especial cúbico son negativos, lo cual indicó interacciones antagónicas. A partir de estas Figuras también se concluyó que el extracto crudo de H1 resultó tener la mayor reducción en la viscosidad de la solución CMC.
Figura 3.10 Contornos de la superficie de respuesta estimada para el modelo especial cúbico.
El modelo ajustado se representa gráficamente en la Figura 3.10. La localización de los puntos óptimos fue calculada por medio de técnicas de optimización estándar limitada basadas en el método de Newton-Raphson. Las limitaciones son las siguientes.
La solución del sistema dio un extracto crudo óptimo con composición: ,
, . Un extracto con esta composición maximizará la actividad
de la celulasa, medida por medio de la reducción de la viscosidad de una solución de referencia a CMC.
4. Conclusión
El diseño estándar factorial tiene dos características principales, cada nivel de cada factor ocurre con todos los niveles de los demás factores y además es posible examinar la interacción entre ellos. Esta característica evita la necesidad de la utilización de un número grande de unidades experimentales. En el caso de los diseños anidados los niveles de un factor son diferentes para los niveles del otro factor. Debido a esto los efectos de los factores experimentales pueden ser observados con mayor claridad; sin embargo, esto requiere la utilización de un mayor número de unidades experimentales, con respecto al diseño factorial estándar. A diferencia de los diseños anidados y factoriales, en el diseño Split-Plot uno de los factores experimentales (factor principal) es común en todos los bloques. Debido a esto, este tipo de diseños son útiles en situaciones donde uno de los factores experimentales es intrínsecamente difícil de modificar entre corridas. Otra particularidad de los diseños Split-Plot es que debido a la utilización de dos clases de unidades experimentales, existe la necesidad de calcular dos tipos de errores experimentales. Particularmente, los diseños de mezclas están definidos para problemas de mezclas físicas de componentes donde no existe total independencia entre los factores, que en este caso son las proporciones de los ingredientes de una formulación dada. Los diseños de experimentos de modelos especiales son ampliamente usados en diversos campos de la investigación. La correcta implementación de este tipo de diseños permite una reducción en los costos y recursos necesarios para realizar una investigación. El diseño de experimentos es una herramienta importante en la planeación, organización y desarrollo de la investigación científica. La implementación de un adecuado esquema experimental permite la economización de materiales, tiempo, y capital. Debido a que la minimización de recursos es primordial en áreas como la industria y la investigación científica, el diseño de experimentos es indispensable para obtener resultados confiables en escenarios restringidos.
5. Referencias
1. Keon Dylan B., Muir Patricia S. “Growth of Usnealongissima Across a Variety of Habitats in the Oregon Coast Range”. The Bryologist. 105(2):233-242. 2002.
2. Mason Robert L., Gunst Richard F., Hess James L. Statistical Design and Analysis of Experiments with Applications to Engineering and Science. EEUU: Wiley. 1989.
3. Montgomery Douglas C. Design and analysis of experiments. EEUU: Wiley. 2005.
4. Stockburguer David. Introductory Statistics: Concepts, Models, and Applications. EEUU: Atomic Dog Publishing. 2001.
5. Candolfi A., Massart D.L., Heuerding S. “Investigation of sources of variance which contribute to NIR-spectroscopic measurement of pharmaceutical formulations”. AnalyticaChimicaActa. 345: 185-196. 1997.
6. Karp Natasha A., Spencer Matthew, Lindsay Helen, O’Dell Kevin , Lilley Kathrin S. “Impact of Replicate Types on Proteomic Expression Analysis”. Journal of proteome research. 4: 1867-1871. 2005.
7. Casella, G. Statistical Design. En G. Casella (Ed), Split Plot Designs. New York: Springer Texts in Statistics. 2008.
8. Kuehl, R. O. Diseño de experimentos: Principios estadísticos de diseño y análisis de investigación. The University of Arizona: Thomson Learning. 2001.
9. Snedecor, G. W. y Cochran, W. G. Statistical Methods. En G. W. Snedecor y W. G. Cochran (Eds), Factorial Experiments. EEUU: Blackwell Publishing. 1989.
10. Arnau, J., Blanco, A. y Losada, J. L. “Estimación de la precisión de un diseño multivariable de medidas repetidas”. Anales de Psicología, Universidad de Barcelona. 7(1): 85-104. 1991.
11. Box, George E. P.; Draper, Norman R. Response Surfaces, Mixtures, and Ridge Analyses. Second Edition. EEUU: John Wiley & Sons. 2007.
12. Gozálvez J. M., García-Díaz J. C. “Mixture Design Experiments Applied to the Formulation of Colorant Solutions”. Journal of Chemical Education. 83(4): 647-650. 2006.
13. Navarrete-Bolaños J. L., Jiménez-Islas H., Botello-Álvarez E., Rico-Martínez R. “Mixed Culture Optimization for Marigold Flower Ensilage via Experimental Design and Response Surface Methodology”. J. Agric. Food Chem. 51:2206-2211. 2003.
14. Yang C. H., Li Y. J., Wen T. C. “Mixture Design Approach to PEG-PPG-PTMG Ternary Polyol-Based Westernborne Polyurethanes”. Ind. Eng. Chem. Res. 36: 1614-1621. 1997.