Un buon progetto di ricerca per sondaggi cerca di ridurre l'errore di campionamento
Cos'è un intervallo di confidenza?
Un intervallo di confidenza è il margine di errore che un ricercatore sperimenterebbe se potesse porre una particolare domanda di ricerca , ad esempio, di ogni membro della popolazione target e ricevere la stessa risposta che i membri del campione hanno fornito nel sondaggio.
Ad esempio, se il ricercatore ha utilizzato un intervallo di confidenza del 4 e 60% dei partecipanti al sondaggio, il campione ha risposto "Consiglierebbe agli amici", potrebbe essere sicuro che tra il 54% e il 64% dei membri dell'intera popolazione target sarebbe anche dire "Consiglierei agli amici" quando viene posta la stessa domanda. L'intervallo di confidenza, in questo caso, è +/- 4.
Che cos'è un livello di fiducia?
Un livello di confidenza è un'espressione di quanto possa essere fiducioso un ricercatore dei dati ottenuti da un campione. I livelli di confidenza sono espressi in percentuale e indicano la frequenza con cui tale percentuale della popolazione target darebbe una risposta entro l'intervallo di confidenza. Il livello di confidenza più comunemente usato è del 95%. Un concetto correlato è chiamato significato statistico.
La fiducia di un ricercatore nella probabilità che il suo campione sia realmente rappresentativo della popolazione target è influenzata da una serie di fattori.
La fiducia di un ricercatore nella progettazione e nell'attuazione dello studio - e una consapevolezza dei suoi limiti - si basa in gran parte su tre variabili importanti: dimensioni del campione, frequenza di risposta e dimensioni della popolazione. I ricercatori hanno da tempo concordato sul fatto che queste variabili debbano essere attentamente considerate durante la fase di pianificazione della ricerca.
- Dimensione del campione In generale, campioni più grandi forniscono dati che riflettono veramente la popolazione target. Un ampio intervallo di confidenza è indicativo di una minore confidenza nei dati perché esiste un margine di errore maggiore. Un ampio intervallo di confidenza è come coprire le tue scommesse. Sebbene esista una relazione tra intervallo di confidenza e dimensione del campione, ma non è una relazione lineare . Un ricercatore non può dimezzare un livello di fiducia raddoppiando la dimensione del campione.
- Frequenza della risposta L'accuratezza con cui i dati campionari riflettono la popolazione target dipende anche dalla percentuale di rispondenti che hanno dato una risposta specifica o hanno risposto in modo specifico . Maggiore è il numero di intervistati che hanno dato una risposta particolare, ad esempio "Molto felice", più sicuro sarà il ricercatore di quella risposta. Ci sarà una certa variabilità nella percentuale nelle aree centrali della curva normale. Cioè, se un ricercatore è sicuro al 50% che i membri della popolazione target risponderanno (entro un intervallo di confidenza) come membri della popolazione campione, è probabile che ci sia qualche variazione rispetto a quel livello del 50%.
È bene ricordare che i valori anomali (dati che si trovano all'estremità o code della curva normale) hanno maggiori probabilità di verificarsi all'incirca nella stessa percentuale della popolazione rispetto a un campione - qui c'è meno variabilità , perché c'è una frequenza più bassa. (Considera come le palle di un Galton Box tendano a impilare al centro alla mostra del Pacific Science Center? Solo alcune palline rimbalzano nella coda.) Per questo motivo, è più facile essere sicuri della frequenza delle risposte estreme .
- La dimensione della popolazione non è un fattore importante nella dimensione del campione, a meno che un ricercatore non stia lavorando con una popolazione molto piccola e nota a lui o lei (ad esempio, abbastanza piccola in modo che tutti i membri della popolazione possano essere identificati dal ricercatore).
Creative Research Systems sottolinea che:
La matematica della probabilità dimostra che la dimensione della popolazione è irrilevante a meno che la dimensione del campione superi la percentuale minima della popolazione totale che si sta esaminando. Ciò significa che un campione di 500 persone è ugualmente utile nell'esaminare le opinioni di uno stato di 15.000.000 come sarebbe una città di 100.000.
Generare un campione rappresentativo può essere un processo costoso e dispendioso in termini di tempo. I ricercatori devono sempre affrontare un compromesso tra il livello di fiducia che vorrebbero ottenere - o il grado di accuratezza che devono raggiungere - e il livello di confidenza che possono permettersi.
Dimensione del campione nella ricerca sui sondaggi qualitativi
La ricerca qualitativa è di tipo esplorativo o descrittivo e non si concentra su numeri o misure. Tuttavia, le preoccupazioni relative all'errore di campionamento nella ricerca di indagini qualitative sono ancora valide. Come regola generale, se un campione è rappresentativo dell'universo obiettivo, i temi o gli schemi che emergono dalla ricerca rifletteranno la popolazione più ampia che interessa al ricercatore. Se il campione è sia rappresentativo che costituito da una grande percentuale della popolazione target, allora la fiducia nell'accuratezza dei dati derivati da quel campione tenderà ad essere elevata.
Determinazione della dimensione del campione nella ricerca sui sondaggi
Regole diverse si applicano alla ricerca quantitativa e alla ricerca qualitativa quando si tratta di determinare la dimensione del campione. In generale, per essere certi dei dati generati dalla ricerca qualitativa del sondaggio, un ricercatore deve avere un'idea chiara di come verranno utilizzati i dati. I dati possono costituire la base per una descrizione descrittiva (come in un caso di studio o in una ricerca etnografica) o può servire in modo esplorativo per identificare le variabili rilevanti che potrebbero essere successivamente testate per le correlazioni in uno studio quantitativo.
Dimensione del campione nella ricerca sui sondaggi quantitativi
La ricerca quantitativa spesso implica confronti tra segmenti di mercato o sottogruppi di un mercato di riferimento. Poiché la ricerca quantitativa è guidata dai numeri, determinare un campione confortevole può essere abbastanza facile: per ogni gruppo o segmento importante in uno studio, un ricercatore spera di poter esaminare 100 partecipanti. Questo numero è una raccomandazione e non un assoluto. Un ricercatore di mercato prenderà in considerazione un numero di variabili rilevanti per determinare le dimensioni di un campione nella ricerca di indagini.
Nel condurre ricerche di mercato, l'obiettivo è di dedurre dal campione ciò che è probabile che sia vero dell'universo di destinazione. Un campione fornisce dati che possono essere osservati o conosciuti. Da questi dati osservati o noti, un ricercatore può stimare il grado in cui un valore o parametro sconosciuto può essere trovato in una popolazione target.
La ricerca per indagini quantitative si basa sulla nozione di una curva normale , simmetrica che rappresenta, nella mente del ricercatore, l'universo obiettivo - la popolazione su cui il ricercatore deve stimare piuttosto che conoscere effettivamente i parametri. Un campione rappresentativo consente a un ricercatore di calcolare - dai dati campione - un intervallo stimato di valori che potrebbero includere il valore sconosciuto o il parametro che è di interesse. Questo intervallo di valori stimati rappresenta un'area sulla curva normale ed è generalmente espressa come decimale o percentuale.
La curva normale e probabilità
Una curva normale e simmetrica è un'espressione visiva di probabilità. Diamo un'occhiata a una semplice euristica: un'attività in un centro scientifico lascia cadere un gran numero di palline tra due fogli di acrilico, uno alla volta. Ogni palla cade attraverso la stessa apertura nella parte superiore del display e poi cade tra uno qualsiasi dei divisori paralleli verticali che separano le pile di palle una volta che si fermano. Dopo diverse ore, le sfere hanno formato la forma di una curva normale. La curva cambia un po 'quando ogni pallina introdotta colpisce la massa di palle che è arrivata per prima. Ma nel complesso, la curva simmetrica è evidente e si è verificata naturalmente, indipendentemente da qualsiasi azione da parte degli osservatori o del personale del Centro scientifico. La forma curva che forma le palline riflette la probabilità che la maggior parte delle palle cada al centro e rimanga lì. Meno palle lo faranno in fondo alla curva - alcune inevitabilmente lo faranno, ma sono poche di numero.
Questa curva normale è simile al concetto di un campione. Ogni volta che il display viene svuotato e le palle ancora una volta possono cadere nella scatola Galton, la configurazione delle pile di palle sarà solo leggermente diversa. Ma nel tempo, la forma della curva non cambierà molto e il pattern rimarrà vero.