miércoles, 13 de noviembre de 2013

Cómo obtener una estimación de densidades multivariado

Imagine la situación en la que usted tiene un conjunto de datos que es multivariado Aún parcelas como grueso, distribución rígida. Este resultado no es ideal, ya que es difícil de describir tal distribución matemáticamente. La solución a este problema es multivarianteestimación de la densidad. Este método permite que usted utilice su distribución multivariante bloques para estimar una versión suave que probablemente corresponde a la distribución real detrás de los datos incluidos en la muestra. En este método, se aplica un tipo específico de la función, llamada núcleo, a los datos originales, dando así una nueva distribución, más suave que puede describir los datos.

 

DENSIDAD MULTIVARIADO

 

Lo que necesita

Software estadístico

 

Ponga sus datos en el software estadístico de elección. Al hacer esto, se debe etiquetar claramente cada variable aleatoria en los datos, como datos multivariados estimación requiere marginar a los datos (es decir, se tendrá que dividir sus datos en múltiples conjuntos de datos univariantes). Mientras introduce sus datos en la forma de una matriz, no habrá problemas. Por ejemplo, en el software estadístico R, es posible que primero poner los datos en un archivo csv de Excel, y luego leer los datos con los datos de los comandos -. Read.csv (data.csv).

 

Decida qué kernel que se aplicará a los datos. El kernel de Gauss tiene fines más prácticos. Sin embargo, los paquetes de software más estadísticas ofrecen una variedad de granos para los usuarios con fines particulares. Por ejemplo, R ofrece casi una docena de granos, incluyendo triangular, rectangular y coseno. También es posible programar su propio núcleo, siempre y cuando usted está familiarizado con el programa en su paquete de software de su elección. En caso de duda en cuanto a qué kernel usar, elija el kernel de Gauss.

 

Decidir sobre el ancho de banda para la densidad de estimación. El ancho de banda, en definitiva, es el equivalente a la desviación estándar para el proceso de alisado. No existe un método estándar de la elección de un ancho de banda para multivariante densidad de estimación. Ten en cuenta que pequeños anchos de banda son menos sesgados, pero llevar a mayores niveles de variación, mientras anchos de banda más grandes tienen una menor variación, pero son más sesgadas. Es posible que desee volver a este paso varias veces, experimentando con diferentes anchos de banda para su estimación de la densidad.

 

Lleve a cabo la estimación de la densidad multivariante. Utilice los datos, ancho de banda y el núcleo ha seleccionado anteriormente. La mayoría de los paquetes de software estadísticos utilizan una llamada de una línea para esta tarea, pidiendo sólo los parámetros necesarios (datos, ancho de banda y el kernel). En R, se llama a esta función con la densidad (datos, ancho de banda, kernel). El resultado (la salida) será la estimación de la densidad multivariante.

 

 

No hay comentarios:

Publicar un comentario