Analisi di correlazione e regressione: applicazione, fasi principali

24/03/2019

Il concetto di un'analisi di regressione di correlazione implica una serie di operazioni, vale a dire la determinazione della vicinanza della relazione, la sua direzione e la definizione di un'equazione che descrive la forma della relazione. Questo tipo di analisi contiene due componenti separati: correlazione e analisi di regressione.

Il valore e le principali fasi del processo di correlazione e analisi di regressione dei fenomeni economici

L'analisi della correlazione e della regressione è uno dei modi per risolvere i problemi e cercare informazioni. Permette di determinare l'influenza congiunta di molti segni correlati e simultanei, nonché l'influenza separata di ciascun attributo su un fenomeno economico (processo). Grazie a questo tipo di analisi, è possibile valutare il grado di interrelazione tra diverse caratteristiche, tra le caratteristiche e il risultato ottenuto, nonché modellare l'equazione di regressione che descrive la forma di interrelazione. analisi di regressione della correlazione

Fasi di analisi

L'analisi della correlazione e della regressione dei processi economici è suddivisa in diverse fasi:

  1. Definizione degli argomenti e elaborazione preliminare delle informazioni condizionali.
  2. Definizione di vicinanza e forme di interrelazione tra più segni.
  3. Modellizzazione del processo economico presentato e analisi del modello risultante.
  4. Applicazione dei risultati finali per migliorare la pianificazione e la gestione del modello.

L'omogeneità dell'informazione statistica può essere determinata utilizzando due tecniche. Per cominciare, è necessario determinare e scartare il valore di fattori che differiscono nettamente da tutte le quantità. Quindi uno studio statistico di omogeneità viene effettuato controllando l'indipendenza del campione e la sua appartenenza a un singolo insieme con una distribuzione normale. esempio di analisi di regressione della correlazione

Il modello di regressione è determinato attraverso il metodo dei minimi quadrati, che fornisce la migliore approssimazione della stima del risultato, determinata attraverso l'equazione di regressione, ai suoi fattori.

Analisi di correlazione e regressione: i parametri del modello creato

I fattori più importanti che determinano le caratteristiche del modello sono considerati:

  • I coefficienti di correlazione coppia (dimostrare la forza della relazione di due fattori).
  • Il coefficiente di correlazione multipla (determina la relazione tra il risultato e i fattori).
  • I coefficienti di determinazione privata (mostrano l'effetto della variazione dell'argomento sulla variazione del tratto desiderato).
  • Il coefficiente di determinazione multipla (mostra la proporzione di tutti gli argomenti sulla variazione della caratteristica desiderata).
  • privato coefficienti di elasticità (caratterizza l'influenza dei fattori sul risultato, espressa in una scala singola in percentuale).

Metodo di analisi della regressione della correlazione

Scopo dell'analisi

I compiti principali dell'analisi di correlazione-regressione sono l'identificazione di fattori che influenzano in modo significativo l'esito economico di un fenomeno o processo e l'uso delle informazioni ottenute per migliorare la pianificazione di un processo o fenomeno economico.

Ad

Metodi di analisi parametrica

Tutti i processi produttivi sono strettamente correlati. Questa relazione è stocastica (il risultato dipende da molti fattori) e funzionale (il risultato cambia della stessa quantità del fattore). La dipendenza stocastica è spesso correlativa in natura, cioè il valore di un fattore corrisponde simultaneamente a diversi valori del risultato, avendo direzioni completamente diverse.

analisi di regressione della correlazione dei problemi

Griglia di correlazione

La relazione di correlazione può avere uno o più segni-fattori, avere una direzionalità positiva o negativa, essere dritta o curvilinea (a seconda dell'espressione). È possibile determinare quale tipo di relazione è correlata utilizzando il reticolo di correlazione. È costruito all'interno degli assi rettangolari delle coordinate.

Ad

Le frequenze posizionate vicino alle diagonali indicano un'elevata correlazione dei segni. Le frequenze posizionate vicino alla diagonale che passa attraverso gli angoli superiori sinistro e destro superiore indicano la direzione positiva, mentre quelle che passano attraverso l'angolo superiore sinistro e destro inferiore indicano la direzione opposta. Le frequenze che si trovano nella forma di un arco indicano una relazione curvilinea, e casualmente sparse, sull'assenza di una relazione.

Il metodo di base dell'analisi di correlazione è lineare. coefficiente di correlazione. Può assumere valori da -1 a +1. Più il valore è vicino a 1, più forte è il collegamento tra il fattore e il risultato. I valori positivi indicano una relazione diretta, mentre i valori negativi indicano un'inversa. Il coefficiente assume il valore "zero" se non c'è alcuna relazione tra i segni.

Ad

analisi di regressione della correlazione nelle statistiche

Metodi di analisi non parametrici

Un certo numero di metodi consente di valutare la relazione dei fenomeni senza un'espressione quantitativa di un tratto e, di conseguenza, i parametri di distribuzione. Sono chiamati non parametrici. Tra questi ci sono:

  • Kendall coefficiente di correlazione di rango (determina la relazione tra i valori quantitativi e qualitativi degli indicatori, se sono soggetti alla classificazione).
  • Il coefficiente di correlazione di ranghi di Spearman (assegna ranghi a ciascun argomento e risultato, in base al quale vengono determinate le differenze e viene calcolato l'indicatore).
  • Il coefficiente di correlazione dei segni di Fechner (determina il numero di coincidenze e disallineamenti tra le deviazioni degli argomenti e i risultati del loro valore medio).
  • Un altro importante metodo di correlazione e analisi di regressione è il metodo dei minimi quadrati, che consente di determinare l'espressione analitica della relazione del tratto risultante e del suo fattore. Consiste nella costruzione di un sistema di equazioni e nella determinazione dei parametri di queste equazioni.

nozione di analisi di regressione della correlazione

Analisi di correlazione e regressione: un esempio

Un'ampia varietà di tipi e oggetti di analisi sono usati in statistica ed economia. I metodi statistici di analisi sono finalizzati allo studio di processi ripetitivi al fine di effettuare previsioni a lungo termine del comportamento dei fenomeni economici.

Ad

Ad esempio, per analizzare lo sviluppo socio-economico di un territorio, è necessario studiare gli indicatori del tenore di vita della popolazione. La correlazione e l'analisi di regressione nelle statistiche ti permettono di creare equazione di regressione e identificare i coefficienti di correlazione che dimostrano la relazione tra il tenore di vita e lo sviluppo del territorio. Il tenore di vita è determinato dal reddito e la principale fonte di reddito è il salario. In questo caso, il fattore è il livello dei salari e il risultato è la popolazione con redditi bassi.

Software di analisi

Per facilitare i calcoli, è possibile condurre analisi di correlazione in Excel. In questo programma, ci sono una serie di strumenti per facilitare i calcoli. Tra questi, la funzione "Correlazione", che consente di formare una matrice di coefficienti e parametri diversi. È raffigurata sotto forma di tavolo. I coefficienti di correlazione sono usati come colonne e righe. Sulla base dei dati ottenuti nella tabella, sarà necessario condurre un'analisi di correlazione. Un esempio della sequenza di analisi:

Ad

  1. Nel comando "Servizio" selezionare "Analisi dati".
  2. Come strumento per l'analisi, seleziona la voce "Correlazione".
  3. Nella finestra che appare, nella riga "Intervallo di input", specificare l'intervallo dei dati analizzati, selezionare la voce "Raggruppamento" nella riga "Parametri di output", inserire l'intervallo di output dei risultati e fare clic su "OK".

Il risultato è una matrice di correlazione situata nell'intervallo di output. All'interno, verrà indicato il coefficiente di correlazione lineare, valutando la tenuta e la forma della relazione tra gli indicatori.

metodo di analisi della correlazione

Analisi in Excel

In MS Excel, la funzione "Correlazione" viene utilizzata per eseguire analisi di correlazione e regressione. Un esempio del calcolo dei coefficienti sarà considerato in seguito. Questa funzione forma una matrice con i coefficienti di vicinanza della relazione tra diversi parametri. Di conseguenza, viene creata una tabella quadrata contenente i coefficienti di correlazione all'intersezione di righe e colonne.

Per l'analisi sarà necessario eseguire una serie di azioni specifiche:

  1. Aprire il comando "Servizio" e in esso l'elemento "Analisi dati".
  2. Nella finestra visualizzata, specificare l'elemento "Correlazione" nell'elenco "Strumenti di analisi".
  3. Nella finestra "Correlazione" che si apre, specificare l'intervallo di input come intervallo di celle contenenti le informazioni analizzate (dovrebbe essere almeno due colonne), selezionare l'opzione "Raggruppamento" e nel campo Parametri di output selezionare la cella in alto a sinistra dove matrice di correlazione.
  4. Fai clic sul pulsante OK.

Come risultato dei calcoli, apparirà una tabella quadrata con coefficienti di correlazione.

Analisi della regressione in MS Excel

Per calcolare equazione lineare Regressioni che descrivono la relazione tra fattori e il risultato, in MS Excel, viene utilizzata la funzione statistica "lineare". Per poterlo utilizzare, devi:

  1. Selezionare un'area vuota in cui verranno visualizzati i risultati dell'analisi.
  2. Aprire il "Master of Functions", in esso trovare la categoria "Statistical", e in esso la funzione "Lineine" e fare clic su OK.
  3. Nel campo "Valori noti di y ", inserisci l'intervallo dei risultati analizzati, nel campo "Valori x conosciuti" - l'intervallo di fattori analizzati.
  4. Il campo "Costante" indica la presenza di un termine libero nell'equazione (1 - sì, 0 - no), e nel campo "Statistiche" - la necessità di visualizzare informazioni aggiuntive (1 - appariranno informazioni aggiuntive, 0 - appariranno solo le stime dei parametri). Per impostazione predefinita, è possibile specificare in entrambi i campi 1.
  5. Clicca OK.

Nella parte superiore dell'area precedentemente selezionata, apparirà l'elemento iniziale della tabella. Per visualizzare tutti i dati, è necessario premere F2, quindi contemporaneamente la combinazione di tasti Ctrl + Maiusc + Invio.

Di conseguenza, le informazioni di regressione verranno visualizzate come una tabella di due colonne e cinque righe:

Colonna 1

Colonna 2

Linea 1

Coefficiente b

Coefficiente a

Linea 2

Deviazione standard b

Deviazione standard a

Linea 3

Coefficiente di determinazione

Deviazione standard y

Linea 4

F-statistica

Il numero di gradi di libertà

Linea 5

Regressione Somma dei quadrati

Somma residua dei quadrati

I risultati dovrebbero essere sostituiti nell'equazione di regressione lineare, che assomiglia a questa: y = a + bx. Il valore dalla cella all'intersezione della riga 1 e della colonna 2 viene sostituito dal coefficiente a. Il valore all'intersezione della riga 1 e della colonna 1 viene utilizzato come coefficiente b.

Il coefficiente di determinazione indica quale parte del risultato viene spiegata con l'aiuto del fattore studiato. La parte restante dei risultati è determinata da fattori che non sono presenti nel modello lineare.