Home » Finance » How Stratified Random Sampling Works With Examples

How Stratified Random Sampling Works With Examples

Qu’est-ce que l’échantillonnage aléatoire stratifié ?

L’échantillonnage aléatoire stratifié est une méthode d’échantillonnage qui implique la division d’une population en sous-groupes plus petits appelés strates. Dans l’échantillonnage aléatoire stratifié, ou stratification, les strates sont formées en fonction des attributs ou caractéristiques partagés des membres, tels que le revenu ou le niveau d’instruction. L’échantillonnage aléatoire stratifié a de nombreuses applications et avantages, tels que l’étude de la démographie de la population et espérance de vie.

L’échantillonnage aléatoire stratifié est également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire par quota.

Points clés à retenir

  • L’échantillonnage aléatoire stratifié permet aux chercheurs d’obtenir un échantillon de population qui représente le mieux l’ensemble de la population étudiée.
  • L’échantillonnage implique une inférence statistique faite à l’aide d’un sous-ensemble d’une population.
  • L’échantillonnage aléatoire stratifié est réalisé en divisant l’ensemble de la population en groupes homogènes appelés strates.
  • L’échantillonnage aléatoire stratifié proportionnel consiste à prélever des échantillons aléatoires dans des groupes stratifiés, proportionnellement à la population. Dans un échantillonnage disproportionné, les strates ne sont pas proportionnelles à l’occurrence de la population.
  • L’échantillonnage aléatoire stratifié diffère de l’échantillonnage aléatoire simple, qui implique la sélection aléatoire de données à partir d’une population entière, de sorte que chaque échantillon possible a la même probabilité de se produire.

Échantillonnage aléatoire stratifié

Comment fonctionne l’échantillonnage aléatoire stratifié

Lorsqu’il effectue une analyse ou une recherche sur un groupe d’entités présentant des caractéristiques similaires, un chercheur peut constater que taille de la population est trop grand pour effectuer des recherches à ce sujet. Pour gagner du temps et de l’argent, un analyste peut adopter une approche plus réalisable en sélectionnant un petit groupe de la population. Le petit groupe est appelé un taille de l’échantillon, qui est un sous-ensemble de la population utilisé pour représenter l’ensemble de la population. Un échantillon peut être sélectionné à partir d’une population de plusieurs manières, dont l’une est la méthode d’échantillonnage aléatoire stratifié.

L’échantillonnage aléatoire stratifié consiste à diviser l’ensemble de la population en groupes homogènes appelés couches (pluriel pour strate). Des échantillons aléatoires sont ensuite sélectionnés dans chaque strate. Par exemple, considérons un chercheur universitaire qui aimerait connaître le nombre d’étudiants MBA en 2021 qui ont reçu une offre d’emploi dans les trois mois suivant l’obtention de leur diplôme.

Le chercheur constatera bientôt qu’il y avait près de 200 000 diplômés du MBA pour l’année. Ils pourraient décider de prendre un simple échantillon aléatoire de 50 000 diplômés et de mener une enquête. Mieux encore, ils pourraient diviser la population en strates et tirer un échantillon aléatoire de ces strates. Pour ce faire, ils créeraient des groupes de population basés sur le sexe, la tranche d’âge, la race, le pays de nationalité et le parcours professionnel. Un échantillon aléatoire de chaque strate est prélevé en nombre proportionnel à la taille de la strate par rapport à la population. Ces sous-ensembles de strates sont ensuite regroupés pour former un échantillon aléatoire.

L’échantillonnage stratifié est utilisé pour mettre en évidence les différences entre les groupes d’une population, par opposition à l’échantillonnage aléatoire simple, qui traite tous les membres d’une population comme égaux, avec une probabilité égale d’être échantillonnés.

Exemple d’échantillonnage aléatoire stratifié

Supposons qu’une équipe de recherche veuille déterminer la moyenne pondérée cumulative (GPA) des étudiants universitaires à travers les États-Unis. L’équipe de recherche a du mal à collecter des données auprès des 21 millions d’étudiants universitaires. il décide de prendre un échantillon aléatoire de la population en utilisant 4 000 étudiants.

Supposons maintenant que l’équipe examine les différents attributs des participants de l’échantillon et se demande s’il existe des différences dans les GPA et les majeures des étudiants. Supposons qu’il trouve que 560 étudiants sont des majors en anglais, 1 135 sont des majors en sciences, 800 sont des majors en informatique, 1 090 sont des majors en ingénierie et 415 sont des majors en mathématiques. L’équipe veut utiliser un échantillon aléatoire stratifié proportionnel où la strate de l’échantillon est proportionnelle à l’échantillon aléatoire dans la population.

Supposons que l’équipe recherche démographie des étudiants universitaires aux États-Unis et trouve le pourcentage de ce que les étudiants se spécialisent : 12 % en anglais, 28 % en sciences, 24 % en informatique, 21 % en ingénierie et 15 % en mathématiques. Ainsi, cinq strates sont créées à partir du processus d’échantillonnage aléatoire stratifié.

L’équipe doit ensuite confirmer que la strate de la population est proportionnelle à la strate de l’échantillon ; cependant, ils trouvent que les proportions ne sont pas égales. L’équipe doit ensuite rééchantillonner 4 000 étudiants de la population et sélectionner au hasard 480 étudiants en anglais, 1 120 en sciences, 960 en informatique, 840 en génie et 600 en mathématiques.

Avec ces groupes, il dispose d’un échantillon aléatoire stratifié proportionné d’étudiants universitaires, ce qui fournit une meilleure représentation des majors universitaires des étudiants aux États-Unis. Les chercheurs peuvent ensuite mettre en évidence une strate spécifique, observer les différents types d’études des étudiants américains et observer les différents moyennes pondérées.

Échantillons aléatoires simples ou stratifiés

Échantillons aléatoires simples et les échantillons aléatoires stratifiés sont tous deux des outils de mesure statistique. Un échantillon aléatoire simple est utilisé pour représenter l’ensemble de la population de données. Un échantillon aléatoire stratifié divise la population en petits groupes, ou strates, en fonction de caractéristiques communes. Cependant, l’échantillonnage stratifié est plus compliqué, prend du temps et peut-être plus cher à réaliser que l’échantillonnage aléatoire simplifié.

L’échantillon aléatoire simple est souvent utilisé lorsqu’il y a très peu d’informations disponibles sur la population de données, lorsque la population de données présente beaucoup trop de différences pour être divisée en différents sous-ensembles, ou lorsqu’il n’y a qu’une seule caractéristique distincte parmi la population de données.

Par exemple, une entreprise de confiseries peut souhaiter étudier les habitudes d’achat de ses clients afin de déterminer l’avenir de sa gamme de produits. S’il y a 10 000 clients, il peut choisir 100 de ces clients comme échantillon aléatoire. Il peut ensuite appliquer ce qu’il trouve auprès de ces 100 clients au reste de sa base. Contrairement à la stratificationil échantillonnera 100 membres de manière purement aléatoire sans tenir compte de leurs caractéristiques individuelles.

Stratification proportionnelle et disproportionnée

L’échantillonnage aléatoire stratifié garantit que chaque sous-groupe d’une population donnée est adéquatement représenté dans l’ensemble de l’échantillon de population d’une étude de recherche. La stratification peut être proportionnée ou disproportionnée. Dans une méthode stratifiée proportionnelle, la taille de l’échantillon de chaque strate est proportionnelle à la taille de la population de la strate. Ce type d’échantillonnage aléatoire stratifié est souvent une mesure plus précise car il s’agit d’une meilleure représentation de la population globale.

Par exemple, si le chercheur voulait un échantillon de 50 000 diplômés en utilisant la tranche d’âge, l’échantillon aléatoire stratifié proportionné sera obtenu en utilisant cette formule : (taille de l’échantillon/taille de la population) x taille de la strate. Le tableau ci-dessous suppose une taille de population de 180 000 diplômés MBA par an.

Tranche d’âge 24-28 29-33 34-37 Total
Nombre de personnes dans la strate 90 000 60 000 30 000 180 000
Taille de l’échantillon des strates 25 000 16 667 8 333 50 000

La taille de l’échantillon de strates pour Diplômés MBA dans la tranche d’âge de 24 à 28 ans est calculé comme (50 000/180 000) x 90 000 = 25 000. La même méthode est utilisée pour les autres tranches d’âge. Maintenant que la taille de l’échantillon des strates est connue, le chercheur peut effectuer un échantillonnage aléatoire simple dans chaque strate pour sélectionner ses participants à l’enquête. Autrement dit, 25 000 diplômés de la tranche d’âge 24-28 ans seront tirés au sort parmi l’ensemble de la population, 16 667 diplômés de la tranche d’âge 29-33 ans seront tirés au sort parmi la population, etc.

Dans un échantillon stratifié disproportionné, la taille de chaque strate n’est pas proportionnelle à sa taille dans la population. Le chercheur peut décider d’échantillonner la moitié des diplômés de la tranche d’âge des 34 à 37 ans et un tiers des diplômés de la tranche d’âge des 29 à 33 ans.

Il est important de noter qu’une personne ne peut pas appartenir à plusieurs strates. Chaque entité ne doit correspondre qu’à une seule strate. Le fait d’avoir des sous-groupes qui se chevauchent signifie que certaines personnes auront plus de chances d’être sélectionnées pour l’enquête, ce qui nie complètement le concept d’échantillonnage stratifié en tant que type d’échantillonnage probabiliste.

Les gestionnaires de portefeuille peuvent utiliser un échantillonnage aléatoire stratifié pour créer des portefeuilles en reproduisant un indice tel qu’un indice obligataire.

Avantages de l’échantillonnage aléatoire stratifié

Le principal avantage de l’échantillonnage aléatoire stratifié est qu’il saisit les principales caractéristiques de la population dans l’échantillon. Semblable à une moyenne pondérée, cette méthode d’échantillonnage produit des caractéristiques dans l’échantillon qui sont proportionnelles à la population globale. L’échantillonnage aléatoire stratifié fonctionne bien pour les populations avec une variété d’attributs, mais est autrement inefficace si des sous-groupes ne peuvent pas être formés.

La stratification donne un plus petit erreur d’estimation et une plus grande précision que la méthode d’échantillonnage aléatoire simple. Plus les différences entre les strates sont importantes, plus le gain en précision est important.

Inconvénients de l’échantillonnage aléatoire stratifié

Malheureusement, cette méthode de recherche ne peut pas être utilisée dans toutes les études. L’inconvénient de la méthode est que plusieurs conditions doivent être remplies pour qu’elle soit utilisée correctement. Les chercheurs doivent identifier chaque membre d’une population étudiée et classer chacun d’eux en une et une seule sous-population. En conséquence, l’échantillonnage aléatoire stratifié est désavantageux lorsque les chercheurs ne peuvent pas classer en toute confiance chaque membre de la population dans un sous-groupe. Aussi, trouver une liste exhaustive et définitive de toute une population peut être difficile.

Le chevauchement peut être un problème s’il y a des sujets qui appartiennent à plusieurs sous-groupes. Lorsqu’un échantillonnage aléatoire simple est effectué, ceux qui appartiennent à plusieurs sous-groupes sont plus susceptibles d’être choisis. Le résultat pourrait être une fausse représentation ou un reflet inexact de la population.

Les exemples ci-dessus facilitent la tâche : premier cycle, cycles supérieurs, hommes et femmes sont des groupes clairement définis. Dans d’autres situations, cependant, cela pourrait être beaucoup plus difficile. Imaginez incorporer des caractéristiques telles que la race, l’origine ethnique ou la religion. Le processus de tri devient plus difficile, faisant de l’échantillonnage aléatoire stratifié une méthode inefficace et loin d’être idéale.

Quand utiliseriez-vous l’échantillonnage aléatoire stratifié ?

L’échantillonnage aléatoire stratifié est souvent utilisé lorsque les chercheurs veulent connaître différents sous-groupes ou strates en fonction de l’ensemble de la population étudiée. Par exemple, si l’on s’intéresse aux différences entre les groupes en fonction de la race, du sexe ou de l’éducation.

Quelle méthode d’échantillonnage est la meilleure ?

La meilleure méthode d’échantillonnage à utiliser dépendra de la nature de l’analyse et des données utilisées. En général, l’échantillonnage aléatoire simple est souvent le plus simple et le moins cher, mais l’échantillonnage stratifié peut produire un échantillon plus précis par rapport à la population étudiée.

Quels sont les deux types d’échantillonnage aléatoire stratifié ?

L’échantillonnage proportionnel prend chaque strate de l’échantillon proportionnelle à la taille de la population de la strate. Dans un échantillonnage disproportionné, l’analyste suréchantillonnera ou sous-échantillonnera certaines strates en fonction de la question de recherche ou de la conception de l’étude qu’il utilise. Par exemple, ceux qui s’intéressent aux résultats scolaires de l’enfance peuvent suréchantillonner les enfants d’âge scolaire et ceux en début de vie professionnelle tout en sous-échantillonnant les strates plus jeunes et plus âgées.

Comment les strates sont-elles choisies pour l’échantillonnage aléatoire stratifié ?

Les strates dépendront des sous-groupes qui vous intéressent et qui apparaissent dans votre population. Ces sous-groupes sont basés sur des différences communes entre les caractéristiques des participants telles que le sexe, la race, le niveau d’instruction, l’emplacement géographique ou le groupe d’âge.

Related Posts