Cuando los investigadores de negocios analizan los datos, a menudo confían en suposiciones para ayudar a sentirse sobre lo que encuentran. Pero como cualquier otra persona, pueden encontrar muchos problemas si estos supuestos no aparecen en línea, lo que puede suceder con más frecuencia de lo que entienden. Encontramos esto en un estudio reciente para ver datos financieros de aproximadamente mil empresas estadounidenses principales.
Uno de los supuestos más comunes en el análisis de datos es que los números seguirán la distribución normal: el concepto central en las estadísticas a menudo conocidas como campanas. Si alguna vez has mirado la altura de las personas, has visto esta curva: la mayoría de las personas son clúster cerca del medio, con menos en los extremos. Es simétrico y predecible y a menudo se da por sentado en la investigación.
Introducción de un minuto en el concepto de Curve Bell Tower.
Pero, ¿qué sucede cuando los datos del mundo real no siguen esa curva ordenada?
Somos profesores que estudian el trabajo y, en nuestro nuevo estudio, hemos visto datos financieros de empresas públicas en empresas públicas, cosas como el valor de mercado de la empresa, la cuota de mercado, los activos totales y las medidas y proporciones financieras similares. Los investigadores a menudo analizan este tipo de datos para comprender cómo las empresas trabajan y toman decisiones.
Descubrimos que estos números a menudo no siguen la campana. En algunos casos, encontramos forajidos extremos, como varias grandes empresas, miles de veces el tamaño de otras compañías más pequeñas. También observamos las distribuciones que son “de giro derecho”, lo que significa que los datos estaban encorvados en el lado izquierdo de la tabla. En otras palabras, los valores están en el extremo inferior, pero hay varios números realmente altos que estiran el promedio hacia arriba. Esto tiene sentido, porque en muchos casos de métricas financieras puede ser positivo; por ejemplo, no encontrará una empresa con un número negativo de empleados, por ejemplo.
¿Por qué es importante?
Si los investigadores comerciales confían en los supuestos equivocados, sus conclusiones, sobre el valor de la empresa, por ejemplo, podría estar equivocado. Estos errores pueden romperse hacia afuera, afectar las decisiones comerciales, las estrategias de los inversores o incluso las políticas públicas.
Por ejemplo, tome su reembolso de reanudación. Si el estudio supone que se devuelven generalmente distribuye, pero en realidad están distorsionados o llenos de medidos, los resultados pueden distorsionarse. Los inversores esperan usar esa investigación podría ser seducida.
Los investigadores saben que su trabajo tiene consecuencias en la vida real, por lo que a menudo llevan a cabo años gastando el estudio, recopilando comentarios y revisando un artículo antes de revisarse y prepararse para su publicación. Pero si no verifican si los datos generalmente se distribuyen, pueden perder a un hombre serio. Esto puede socavar incluso estudios bien diseñados.
A la luz de esto, alentaríamos a los investigadores a configurar: ¿Entiendo los métodos estadísticos que uso? ¿Reviso mis suposiciones, o supongo que están bien?
Que aún se desconoce
A pesar de la importancia de los supuestos de datos, muchos estudios no informan las pruebas de normalidad. Como resultado, no está claro cuántos hallazgos en financiamiento y investigación contable se basan tremientemente en una base estadística. Necesitamos más trabajo para comprender qué tan comunes son estos problemas y para alentar las mejores prácticas en las pruebas y corrigiéndoles.
Aunque cada investigador no tiene que ser un estadístico, todos los que usan datos serían sabios para preguntar: ¿qué tan normal es?
Descubre más desde USA Today
Suscríbete y recibe las últimas entradas en tu correo electrónico.