miércoles, 22 de abril de 2020

4.3. y 4.4 Muestras preliminares de los proyectos aprobados en 3.4

4.4 Características estadísticas del estimador lider 
Hay una serie de características deseables en los estimadores para que éstos constituyan una buena aproximación a los respectivos parámetros. Se trata de rasgos que podrían entenderse como criterios de calidad de los estimadores.
1. Carencia de sesgo. Se dice que un estimador es insesgado si el valor esperado de su distribución de probabilidad es igual al parámetro. Es decir, si es igual a Ө la media de los valores Ê calculados en cada una de las muestras aleatorias posibles del mismo tamaño. Si el estadístico Ê es utilizado como estimador del parámetro Ө, ese estimador carece de sesgo cuando E(Ê) = Ө Por ejemplo, la media [D] es un estimador insesgado de µ, puesto que se cumple, tal y como vimos en el capítulo anterior al estudiar la distribución muestral del estadístico media, que E( [D]) = µ En el caso de la varianza, suelen manejarse habitualmente dos estimadores: [D] o bien, [D]. Para cada uno de ellos, el valor esperado resulta ser: [D] El segundo de los estimadores posee la característica de ser un estimador insesgado de σ2 , razón por la que suele emplearse con más frecuencia que el primero a la hora de estimar el parámetro varianza poblacional. Cuando E(Ê) ≠ Ө, decimos que el estimador sesgado tiene un sesgo positivo si E(Ê) > Ө, o que tiene un sesgo negativo si E(Ê) < Ө. Un estimador sesgado tenderá a ofrecer sistemáticamente valores que se alejan en un sentido u otro del parámetro, aunque la muestra sea elegida aleatoriamente.
2. Consistencia. Un estimador Ê es consistente si, además de carecer de sesgo, se aproxima cada vez más al valor del parámetro a medida que aumenta el tamaño de la muestra. Si el tamaño n se hace indefinidamente grande, los valores de Ê se concentran cada vez más en torno al valor del parámetro, hasta que con un tamaño 2. muestral infinito obtenemos una varianza del estimador nula.
Por tanto, un estimador es consistente si cuando n tiende a infinito se cumple E(Ê) = Ө; var(Ê) = 0 La media es un estimador consistente del parámetro µ, puesto que se verifican las condiciones anteriores. Es decir. [D] También se comprueba que los dos estimadores de la varianza, presentados en el apartado anterior, resultan ser estimadores consistentes de σ2 .
3. Eficiencia. La eficiencia de un estimador está vinculada a su varianza muestral. Así, para un mismo parámetro Ө, se dice que el estimador Ê1 es más eficiente que el estimador Ê2 si se cumple var(Ê1) < var(Ê2) Por tanto, si un estadístico es más eficiente que otro, significa que varía menos de unas muestras a otras. Se demuestra que la media es un estimador del parámetro µ más eficiente que la mediana. Del mismo modo, la varianza Sn-12 es un estimador de σ2 más eficiente que Sn 2 .
4. Suficiencia. Un estimador es suficiente cuando en su cálculo se emplea toda la información de la muestra. Por ejemplo, al calcular el estimador [D] del correspondiente parámetro poblacional, utilizamos la fórmula: [D] para cuyo cálculo se tienen en cuenta todas las puntuaciones Xi. Otro tanto ocurre con los estimadores Sn-12 y Sn 2 de la varianza. Todos ellos pueden ser considerados estimadores suficientes de los respectivos parámetros.

4.2. Identificación del estimador determinante (estimador líder) del tamaño de la simulación.


4.2. Identificación del estimador determinante (estimador líder) del tamaño de la simulación.
Por definición, el valor de una variable cambia conforme avanza la simulación, aunque se le debe dar un valor inicial. Cabe recordar que el valor de un parámetro permanece constante; sin embargo, puede cambiar conforme se estudian diferentes alternativas en otras simulaciones. Determinación de condiciones iniciales La determinación de condiciones iniciales para las variables es una decisión táctica importante en la simulación. Lo anterior se debe a que el modelo se sesga por una serie de valores iniciales hasta que el modelo llega a un estado estable. Para manejar este problema, los analistas han seguido varios planteamientos como:
1) Descartar los datos generados durante las primeras partes de la ejecución,
2) Seleccionar las condiciones iniciales que reducen la duración del periodo de calentamiento.
3) Seleccionar las condiciones iniciales que eliminan el sesgo. Sin embargo, para emplear cualquiera de estas alternativas, el analista debe tener una idea del margen de datos de salida esperado. Por lo tanto, en cierto sentido, el analistas esta los resultados. Por otro lado, una de las únicas características de la simulación es que permite la crítica en el diseño y análisis de la simulación; por lo que si el analista tiene cierta información que alberga un problema, se debe incluir. 
Quizás el planteamiento más común sea continuar la simulación hasta lograr un equilibrio. En el ejemplo del mercado de pescado, significaría que las ventas simuladas de pescado corresponden a sus frecuencias relativas históricas. Otro planteamiento es ejecutar la simulación durante un periodo establecido como 1 mes, 1 año o una década y ver si las condiciones al final del periodo son razonables. Un tercer planteamiento es establecer la duración de la ejecución de modo que se obtenga una muestra suficientemente grande para efectos de pruebas de hipótesis estadística. Esta alternativa se considera en la siguiente sección. En la mayoría de las situaciones, el análisis tiene más información disponible con la cual comparar los resultados de simulación: datos operativos antiguos del sistema real, datos operativos del desempeño de sistemas semejantes y la percepción del analista de la operación del sistema real. Sin embargo, se debe admitir que la información obtenida de estas fuentes probablemente no sea suficiente para validar las conclusiones derivadas de la simulación. Por lo tanto, la única prueba real de una simulación es qué tan bien se desempeña el sistema real después de haber implantado los resultados del estudio.

4.1. Lista de estimadores a obtener de la simulación

4.1. Lista de estimadores a obtener de la simulación.
Hasta ahora hemos estudiado cómo simular probabilidades de elección pero no hemos estudiado las propiedades de los estimadores de los parámetros que se basan en estas probabilidades simuladas. En los casos que hemos presentado, simplemente hemos insertado las probabilidades simuladas en la función log-verosimilitud y hemos maximizada dicha función, de la misma forma que lo habríamos hecho si las probabilidades hubieran sido exactas. Este procedimiento parece intuitivamente razonable. Sin embargo, no hemos mostrado realmente, al menos hasta ahora, que el estimador resultante tenga propiedades deseables, como consistencia, normalidad asintótica o eficiencia. Tampoco hemos explorado la posibilidad de que otras formas de estimación puedan ser preferibles cuando usamos simulación, en lugar de las probabilidades exactas. El propósito de este capítulo es examinar varios métodos de estimación en el contexto de la simulación. Derivaremos las propiedades de estos estimadores y mostraremos las condiciones en las que cada estimador es consistente y asintóticamente equivalente al estimador que obtendríamos si usásemos valores exactos en lugar de simulación. Estas condiciones proporcionan una guía al investigador sobre cómo debe llevarse a cabo la simulación para obtener estimadores con propiedades deseables. El análisis también pone en evidencia las ventajas y limitaciones de cada forma de estimación, facilitando así la elección del investigador entre los diferentes métodos. Las técnicas de simulación en estadística, como son los métodos de Monte Carlo, y los procedimientos de re muestreo conocidos como bootstrap, son de gran utilidad cuando no tenemos expresiones cerradas para calcular medidas de incertidumbre como son la desviación estándar de estimadores y los intervalos de confianza. Estos métodos de simulación permiten obtener estimaciones con menores supuestos que los métodos analíticos, a cambio de un trabajo computacional más intenso. La disponibilidad creciente de los recursos computacionales, hacen de las técnicas de simulación una herramienta de uso creciente. En este trabajo se discuten estas técnicas de simulación, y se ilustran con ejemplos sencillos. En el contexto estadístico, entendemos por simulación, la técnica de muestreo estadístico controlado, que se utiliza conjuntamente con un modelo, para obtener respuestas aproximadas a preguntas que surgen en problemas complejos de tipo probabilista. En metrología, el proceso de medición es de naturaleza probabilística y los modelos de medición con frecuencia son complejos [1]. Estas dos características del proceso de medición, complejidad y aleatoriedad, hacen del análisis de datos de medición un área de oportunidad natural para los métodos de simulación.
4.1.1 Instrumentos de medición
El análisis de la literatura existente arroja un resultado de 17 instrumentos de medida de las actitudes y la ansiedad hacia la estadística. Exceptuando dos instrumentos elaborados a partir de escalas bipolares, a la manera del diferencial semántico de Osgood (Birenbaum y Eylath,1994; Green, 1993), todos los instrumentos revisados son escalas tipo Likert. En lo que sigue vamos a describir breve mente estos cuestionarios, poniendo un mayor énfasis en aquellos que han sido usados más frecuentemente.
4.1.2 Medios de registro de datos
La elección del método depende de la estrategia de recopilación de datos, el tipo de variable, la precisión necesaria, el punto de recopilación y la formación del encuestador. Las vínculos entre


una variable, su origen y los métodos prácticos para su recopilación. Pueden ayudar a escoger métodos apropiados. Los principales métodos de recopilación de datos son:

Registros: los registros y licencias son particularmente valiosos para los censos completos, pero se limitan a variables que cambian lentamente, como el número de embarcaciones pesqueras y sus características.

Cuestionarios: formularios que los encuestados devuelven cumplimentados. Un método poco costoso que resulta útil cuando los índices de alfabetización son altos y los encuestados colaboran.

Entrevistas: formularios que se cumplimentan a lo largo de una entrevista con el encuestado. Más caros que los cuestionarios, pero mejores para preguntas más complejas, y cuando se dan unos índices de alfabetización bajos o se encuentra menos colaboración.

Observaciones directas: la realización de mediciones directas es el método más preciso para todas las variables, como las capturas, pero a menudo resulta caro. Muchos métodos, como los programas de observación, se limitan a la pesca industrial.

Presentación de informes: la principal alternativa a la realización de mediciones directas consiste en pedir a los pescadores y a terceros que presenten informes de sus actividades. La preparación de informes presupone la alfabetización y requiere espíritu de colaboración, pero ello puede reforzarse mediante una obligación legal y mediciones directas. Las técnicas de recogida de la información no son un fin en si mismo, sino que dependen de:
a- El tipo de investigación que se esté haciendo.
b- El tipo de análisis de datos que vamos a utilizar posteriormente.
c- El problema que queramos estudiar.
d- Los objetivos que pretendamos alcanzar con la investigación.
Algunas técnicas se pueden utilizar en distintos diseños, por ejemplo la entrevista se puede utilizar en: investigación acción, en estudios de caso, en investigación etnográfica, etc.