Accade spesso che sia necessario analizzare un fenomeno sociale specifico e ottenere informazioni su di esso. Tali compiti si presentano spesso nelle statistiche e negli studi statistici. Controllare un fenomeno sociale completamente definito è spesso impossibile. Ad esempio, come scoprire l'opinione della popolazione o di tutti i residenti di una città in merito a qualsiasi problema? Chiedere assolutamente a tutti è quasi impossibile e molto laborioso. In questi casi, abbiamo bisogno di un campione. Questo è esattamente il concetto su cui si basano praticamente tutte le ricerche e le analisi.
Quando si analizza un fenomeno sociale specifico, è necessario ottenere informazioni a riguardo. Se studi, puoi vedere che non tutte le unità dell'oggetto di studio sono soggette a ricerche e analisi. Viene presa in considerazione solo una certa parte dell'intero aggregato. Questo processo è un campionamento: quando vengono esaminate solo alcune unità del set.
Certo, molto dipende dal tipo di campione. Ma ci sono delle regole di base. Il più importante di questi stati è che la selezione dall'aggregato dovrebbe essere completamente casuale. Le unità dell'aggregato da utilizzare non dovrebbero essere scelte a causa di alcun criterio. In parole povere, se è necessario raccogliere un aggregato della popolazione di una determinata città e selezionare solo uomini, allora ci sarà un errore nello studio, perché la selezione non è casuale, ma selezionata su base di genere. Praticamente tutti i metodi di campionamento sono basati su questa regola.
Affinché la popolazione selezionata rifletta le qualità di base dell'intero fenomeno, deve essere costruita in base a leggi specifiche, in cui l'attenzione dovrebbe essere concentrata sulle seguenti categorie:
Le caratteristiche del campionamento e campionamento sono le seguenti:
Selettiva: si tratta di un'osservazione statistica in cui lo studio non è soggetto all'intero set di studi, ma solo una parte di esso viene selezionata in un certo modo, ei risultati dello studio di questa parte si applicano all'intero insieme. Questa parte è chiamata set di esempio. Questo è l'unico modo per studiare una vasta gamma di oggetti di studio.
Ma l'osservazione selettiva può essere utilizzata solo nei casi in cui è necessario indagare solo su un piccolo gruppo di unità. Ad esempio, quando si esamina il rapporto tra uomini e donne nel mondo, verrà utilizzata l'osservazione selettiva. Per ovvi motivi - è impossibile prendere in considerazione ogni abitante del nostro pianeta.
Ma con lo stesso studio, ma non tutti gli abitanti della terra, ma una certa classe "A" in una particolare scuola, una certa città, un certo paese, possono fare a meno dell'osservazione selettiva. Dopo tutto, è abbastanza possibile analizzare l'intero array dell'oggetto di studio. È necessario contare i ragazzi e le ragazze di questa classe - questo sarà il rapporto.
In realtà, tutto non è così difficile come sembra. In ogni oggetto di studio ci sono due sistemi: l'aggregato generale e selettivo. Cos'è questo? Tutte le unità appartengono al generale. E al campione - quelle unità della popolazione totale, che sono state prese per il campione. Se tutto è fatto correttamente, la parte selezionata sarà un layout ridotto dell'intera popolazione (generale).
Se parliamo della popolazione generale, possiamo distinguere solo due delle sue varietà: una popolazione generale definita e indefinita. Dipende dal fatto se il numero totale di unità di questo sistema è noto o meno. Se si tratta di una popolazione specifica, il campione sarà reso più semplice perché è noto quale percentuale del numero totale di unità sarà un campione.
Questo momento è molto necessario nella ricerca. Ad esempio, se è necessario esaminare la percentuale di prodotti dolciari di scarsa qualità in un determinato stabilimento. Supponiamo che la popolazione sia già definita. È noto che questa impresa produce 1000 dolciumi all'anno. Se fai un campione di 100 prodotti caseari di pasticceria da questo migliaio e li mandi per un esame, allora l'errore sarà minimo. In parole povere, il 10% di tutti i prodotti sono stati oggetto di ricerca e, in base ai risultati, tenendo conto dell'errore di rappresentatività, possiamo parlare della scarsa qualità di tutti i prodotti.
E se assaggi 100 prodotti dolciari da una popolazione generale incerta, dove in realtà erano, ad esempio, 1 milione di unità, il risultato del campione e lo stesso studio saranno criticamente non plausibili e imprecisi. Senti la differenza? Pertanto, la certezza della popolazione generale nella maggior parte dei casi è estremamente importante e influenza notevolmente il risultato dello studio.
Quindi, ora una delle domande più importanti - quale dovrebbe essere il campione? Questo è il punto principale dello studio. A questo punto, è necessario calcolare il campione e selezionare le unità dal numero totale in esso. L'aggregato è stato selezionato correttamente se alcune caratteristiche e caratteristiche della popolazione generale rimangono nel campione. Questo è chiamato rappresentatività.
In altre parole, se dopo la selezione una parte mantiene le stesse tendenze e caratteristiche dell'intera quantità studiata, allora un tale insieme è chiamato rappresentante. Ma non tutti i campioni specifici possono essere selezionati da un set rappresentativo. Esistono anche questi oggetti di ricerca, il cui campionamento semplicemente non può essere rappresentativo. È qui che sorge la nozione di errore di rappresentatività. Ma parliamo di questo più in dettaglio un po 'di più.
Quindi, per massimizzare la rappresentatività, ci sono tre regole base per il campionamento:
La caratteristica principale della qualità del campione selezionato è la nozione di "margine di errore". Cos'è questo? Queste sono alcune discrepanze tra gli indicatori di osservazione selettiva e continua. In termini di errore, la rappresentatività è divisa in affidabile, ordinario e approssimativo. In altre parole, sono ammesse deviazioni fino al 3%, dal 3 al 10% e dal 10 al 20% rispettivamente. Sebbene in statistica è auspicabile che l'errore non superi il 5-6%. Altrimenti, c'è motivo di parlare della mancanza di rappresentatività del campione. Per calcolare l'errore di rappresentatività e il modo in cui influenza il campione o la popolazione generale, vengono presi in considerazione molti fattori:
Negli studi specificatamente specificati, l'errore percentuale del valore medio viene solitamente fornito dallo stesso ricercatore sulla base del programma di osservazione e in base ai dati di studi precedenti. Di norma, l'errore di campionamento marginale (errore di rappresentatività) è considerato compreso tra il 3-5%.
Vale anche la pena ricordare che la cosa principale nell'organizzazione dell'osservazione selettiva è di portare il suo volume ad un minimo accettabile. In questo caso, non ci si dovrebbe sforzare di ridurre eccessivamente i limiti dell'errore di campionamento, poiché ciò potrebbe comportare un aumento ingiustificato della quantità di dati campione e, di conseguenza, un aumento del costo del campionamento.
Allo stesso tempo, non è possibile aumentare eccessivamente la dimensione dell'errore di rappresentatività. Infatti, in questo caso, anche se ci sarà una diminuzione del volume del campione, ciò porterà ad un deterioramento nell'affidabilità dei risultati ottenuti.
Qualsiasi studio, se condotto, è per qualche scopo e per ottenere alcuni risultati. Quando si effettua uno studio selettivo, di norma vengono poste le domande iniziali:
Non tutti i campioni sono rappresentativi. A volte lo stesso segno è espresso in modo diverso nel suo insieme e nella sua parte. Per raggiungere i requisiti di rappresentatività, è consigliabile utilizzare varie tecniche di campionamento. Inoltre, l'uso dell'uno o dell'altro metodo dipende dalle circostanze specifiche. Tra questi metodi di creazione di un campione ci sono:
Il campionamento casuale è un sistema di misure volte al campionamento casuale di unità di popolazione, quando la probabilità di entrare nel campione è uguale per tutte le unità della popolazione generale. Questa tecnica è appropriata per applicare solo nel caso di omogeneità e un piccolo numero di caratteristiche intrinseche. Altrimenti, alcune caratteristiche sono a rischio di non essere riflesse nel campione. I segni di selezione casuale sono alla base di tutti gli altri metodi di campionamento.
Quando la selezione meccanica delle unità viene effettuata ad un certo intervallo. Se è necessario formare un campione di reati specifici, ogni 5 °, 10 ° o 15 ° carta può essere ritirata da tutti i registri statistici di reati registrati, a seconda del numero totale e delle dimensioni del campione disponibili. Lo svantaggio di questo metodo è che prima del campionamento è necessario avere un resoconto completo delle unità aggregate, quindi è necessario eseguire una classifica e solo dopo è possibile eseguire un campione a un certo intervallo. Questo metodo richiede molto tempo, quindi non viene spesso utilizzato.
Una selezione tipica (suddivisa in zone) è un tipo di campionamento, in cui la popolazione generale è divisa in gruppi omogenei in base a un determinato attributo. A volte i ricercatori usano al posto di "gruppi" altri termini: "aree" e "zone". Quindi da ciascun gruppo in ordine casuale viene selezionato un certo numero di unità in proporzione al peso del gruppo nella popolazione totale. Una selezione tipica viene spesso eseguita in più fasi.
La selezione seriale è un metodo in cui la selezione delle unità viene effettuata in gruppi (serie) e tutte le unità del gruppo selezionato (serie) sono soggette a esame. Il vantaggio di questo metodo è che a volte è più difficile selezionare singole unità rispetto a una serie, ad esempio, quando si studia una persona che sta scontando una frase. All'interno delle aree selezionate, si applica lo studio di tutte le unità senza eccezione, ad esempio lo studio di tutte le persone che scontano una pena in un particolare istituto.