lunes, 8 de septiembre de 2014

LA ESTADÍSTICA Y SUS CONCEPTOS



ESTADÍSTICA


La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos. En otras palabras es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.


Kendall y Buckland  definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.

"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.






POBLACIÓN 

es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Población es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).





TIPOS DE POBLACIÓN    



En población estadística podemos encontrar dos tipos:

Población Finita: es el conjunto compuesto por una cantidad limitada de elementos, como el número de especies, el numero de estudiantes, el número de obreros.

Población Infinita: es la que tiene un número extremadamente grande de componentes, como el conjunto de especies que tiene el reino animal.


MUESTRA 


La muestra es una representación significativa de las características de una población, que bajo, la asunción de un error (generalmente no superior al 5%) estudiamos las características de un conjunto población mucho menor que la población global.
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubín (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).



Una muestra estadística es un subconjunto 
de casos o individuos de una población 
estadística. Las muestras, se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir, esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste.







ESTADISTICA  DESCRIPTIVA

La estadística descriptiva es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.

por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc. y trata de extraer conclusiones sobre el comportamiento de estas variables.


ESTADÍSTICA INFERENCIAL 

Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modela-miento de relaciones entre variables (análisis de regresión). Otras técnicas de modela-miento incluyen series de tiempo y minería de datos.

PROBABILIDAD 


La probabilidad es un método por el cual se obtiene la frecuencia de un acontecimiento determinado mediante la realización de un experimento aleatorio, del que se conocen todos los resultados posibles,bajo condiciones suficientemente estables.


La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, las ciencias y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos, por lo tanto es la rama de las matemáticas que estudia, mide o determina a los experimentos o fenómenos aleatorios.


DATO


El dato es una representación simbólica (numérica, alfabética, algorítmica, etc) de un atributo o variable cuantitativa o cualitativa. Los datos describen hechos empíricos, sucesos y entidades. Es un valor o referente que recibe el computador por diferentes medios, los datos representan la información que el programador manipula en la construcción de una solución o en el desarrollo de un algoritmo.

Los datos aisladamente pueden no contener información humanamente relevante. Sólo cuando un conjunto de datos se examina conjuntamente a la luz de un enfoque, hipótesis o teoría se puede apreciar la información contenida en dichos datos. Los datos pueden consistir en números, estadísticas o proposiciones descriptivas. Los datos convenientemente agrupados, estructurados e interpretados se consideran que son la base de la información humanamente relevante que se pueden utilizar en la toma de decisiones, la reducción de la incertidumbre o la realización de cálculos. Es de empleo muy común en el ámbito informático y, en general, prácticamente en cualquier investigación científica.



VARIABLE

Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren valor para la investigación cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de una teoría. En este caso se les denomina constructos o construcciones hipotéticas.
Existen diferentes tipos de variables:

VARIABLES CUALITATIVAS

Son el tipo de variables que como su nombre lo indica expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores.

VARIABLES CUANTITATIVAS 

Son las variables que toman como argumentocantidades numéricas, son variables matemáticas.

 Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).    

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,..), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que exista un valor entre dos variables.

FENÓMENO

La aleatoriedad se asocia a todo proceso cuyo resultado no es previsible más que en razón de la intervención del azar. El resultado de todo suceso aleatorio no puede determinarse en ningún caso antes de que este se produzca. El estudio de los fenómenos aleatorios queda dentro del ámbito de la teoría de la probabilidad y, en un marco más amplio, en el de la estadística. 
Todo experimento que puede repetirse indefinidamente, para el cual existe un intervalo de resultados definidos que se dan de manera aleatoria, es decir, impredecible. Cada repetición del experimento se denomina experiencia o prueba. Ejemplo de fenómenos estadísticos son el lanzamiento de una moneda o el tiro de un dado.

FENÓMENO DETERMINISTA 

En estadística, un suceso determinista es un experimento o fenómeno que da lugar a un resultado cierto o seguro, es decir, cuando partiendo de unas mismas condiciones iniciales tenemos la certeza de lo que va a suceder. La relación causa-efecto se conoce en su totalidad.

FENÓMENO ALEATORIO 

En teoría de la probabilidad un experimento aleatorio es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir o reproducir el resultado exacto de cada experiencia particular.
Este tipo de fenómeno es opuesto al fenómeno determinista, en el que conocer todos los factores de un experimento nos hace predecir exactamente el resultado del mismo. Por ejemplo, conociendo la altura desde la que se arroja un móvil es posible saber exactamente el tiempo que tardará en llegar al suelo en condiciones de vacío.

PARÁMETRO ESTADÍSTICO 

En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población. 
Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.
Por ejemplo, suele ofrecerse como resumen de la juventud de una población la media aritmética de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal población.

ESCALA NOMINAL

El nivel nominal de medición, de la palabra latina común (nombre) describe variables de naturaleza categórica que difieren en cualidad más que en cantidad. Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta en función de los deseos o conveniencia del investigador. Este nivel de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.
Esta escala comprende variables categóricas que se identifican por atributos o cualidades. Las variables de este tipo nombran e identifican distintas categorías sin seguir un orden. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número es para identificar. Un número no tiene mayor valor que otro. Un ejemplo son los números de las camisetas de los jugadores de un equipo de béisbol. El número mayor no significa que tiene el mayor atributo que el número menor, es aleatorio o de capricho personal a quien otorga el número. también encontramos escala de altura, escala de perspectiva, escala de anchura, escala de profundidad Para el procesamiento de datos, los nombres pueden ser remplazados por números, pero en ese caso el valor numérico de los números dados es irrelevante. El único tipo de comparaciones que se pueden hacer con este tipo de variables es el de igualdad o diferencia. Las comparaciones “mayor que”o “menor que” no existen entre nombres, así como tampoco operaciones tales como la adición, la sustracción, etc.

ESCALA ORDINAL

El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los valores. En este caso las variables no sólo se asignan a grupos sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos. 

En esta clasificación, los números asignados a los objetos representan el orden o rango de las entidades medidas. Los números se denominan ordinales, las variables se denominan ordinales o variables de rango. Se pueden hacer comparaciones como “mayor que”, “menor que”, además de las comparaciones de igualdad o diferencia. Las operaciones aritméticas como la sustracción a la adición no tienen sentido en este tipo de variables.


MÉTODO CIENTÍFICO

El método científico es un método de investigación usado principalmente en la producción de conocimiento en las ciencias. Para ser llamado científico, un método de investigación debe basarse en la empírica y en la medición, sujeto a los principios específicos de las pruebas de razonamiento. Según el Oxford English Dictionary, el método científico es: un método o procedimiento que ha caracterizado a la ciencia natural desde el siglo XVII, que consiste en la observación sistemática, medición, experimentación, la formulación, análisis y modificación de las hipótesis.
El método científico está sustentado por dos pilares fundamentales. El primero de ellos es la reproducibilidad,es decir, la capacidad de repetir un determinado experimento, en cualquier lugar y por cualquier persona. Este pilar se basa, esencialmente, en la comunicación y publicidad de los resultados obtenidos.El segundo pilar es la refutabilidad. Es decir, que toda proposición científica tiene que ser susceptible de ser falsada o refutada (falsacionismo). Ello nos conduce tratar de sistematizar las distintas ramas dentro del campo del método científico.

DESARROLLO DEL MÉTODO CIENTÍFICO

Por proceso o "método científico" se entiende aquellas prácticas utilizadas y ratificadas por la comunidad científica como válidas a la hora de proceder con el fin de exponer y confirmar sus teorías. Las teorías científicas, destinadas a explicar de alguna manera los fenómenos que observamos, pueden apoyarse o no en experimentos que certifiquen su validez.  

  1. Observación: Es aplicar atentamente los sentidos a un objeto o a un fenómeno, para estudiarlos tal como se presentan en realidad, puede ser ocasional o causalmente.
  2. Inducción: La acción y efecto de extraer, a partir de determinadas observaciones o experiencias particulares, el principio particular de cada una de ellas.
  3. Hipótesis: Consiste en elaborar una explicación provisional de los hechos observados y de sus posibles causas.
  4. Probar la hipótesis por experimentación.
  5. Demostración o refutación (antítesis) de la hipótesis.
  6. Tesis o teoría científica.

Por otra parte, existen ciencias no incluidas en las ciencias naturales, especialmente en el caso de las ciencias humanas y sociales, donde los fenómenos no sólo no se pueden repetir controlada y artificialmente (que es en lo que consiste un experimento), sino que son, por su esencia, irrepetibles, por ejemplo la historia. De forma que el concepto de método científico ha de ser repensado, acercándose más a una definición como la siguiente: "proceso de conocimiento caracterizado por el uso constante e irrestricto de la capacidad crítica de la razón, que busca establecer la explicación de un fenómeno ateniéndose a lo previamente conocido, resultando una explicación plenamente congruente con los datos de la observación".
Así, por método o proceso científico se entiende aquellas prácticas utilizadas y ratificadas por la comunidad científica como válidas a la hora de proceder con el fin de exponer y confirmar sus teorías, como por ejemplo los Postulados de Koch para la microbiología. Las teorías científicas, destinadas a explicar de alguna manera los fenómenos que observamos, pueden apoyarse o no en experimentos que certifiquen su validez.



RELACIÓN DEL MÉTODO CIENTÍFICO Y LA ESTADÍSTICA 

Podemos definir Estadística como la ciencia de los datos. La palabra ciencia viene del latín “scientia” que significa conocimiento. El método científico es un conjunto de principios y procedimientos para la búsqueda sistemática del conocimiento.
El método científico está compuesto por los siguientes pasos:
1.- Formula una teoría (problema).
2.- Recoger datos para probar la teoría.
3.- Analizar los datos.
4.- Interpretar los resultados y tomar una decisión.

El método científico es un procedimiento iterativo de aprendizaje. No podemos tener certeza.

LA ESTADÍSTICA NO ES ALGO QUE SE LE PUEDA ATRIBUIR COMO ALGO AISLADO DE LAS DIFERENTES ÁREAS DE APLICACIÓN DE LA CIENCIA, MAS BIEN ES EL CONJUNTO DE TÉCNICAS QUE EN CONJUNTO CON EL MÉTODO CIENTÍFICO CONTRIBUYEN A QUE TOMEMOS DECISIONES EN BASE A UN ESTUDIO ANALÍTICO.



CORRELACION LINEAL 

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están cor-relacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad

FUERZA, SENTIDO Y FORMA DE LA CORRELACION
La relación entre dos variables cuantitativas queda representada mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:
  • La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil.
  • El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relación es directa (pendiente positiva); si al crecer los valores de A disminuyen los de B, la relación es inversa (pendiente negativa).
  • La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva monotónica o la curva no monotónica



coeficientes de correlación 
Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos variables entre el producto de sus desviaciones estándar. Otros coeficientes son:


COEFICIENTE DE PEARSON
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.



INTERPRETACIÓN


El valor del índice de correlación varía en el intervalo [-1,1]:
  • Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
  • Si 0 < r < 1, existe una correlación positiva.
  • Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
  • Si -1 < r < 0, existe una correlación negativa.
  • Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.




1 comentario: