Frequenza accumulata
La frequenza è il numero di volte che un evento si ripete in un dato periodo di tempo. Accumulato, invece, è la somma, la raccolta o l'insieme di elementi diversi.
Per quanto riguarda l'idea di frequenza cumulativa, il concetto si confronta nel campo della statistica, dove la frequenza è definita come il numero di volte in cui un dato evento si ripete in una campagna o in un esperimento.
Questo numero di ripetizioni è conosciuto come la frequenza assoluta. Se la frequenza assoluta viene divisa per la dimensione del file campione, otteniamo il file di frequenza relativa.
Da questi dati possiamo calcolare due tipi di frequenza cumulativa: frequenza assoluta cumulativa e frequenza relativa cumulativa.
La frequenza assoluta cumulativa (talvolta chiamata semplicemente frequenza cumulativa) indica il numero di frequenze assolute per tutti gli eventi che, in una lista ordinata, sono inferiori o uguali a un certo valore.
Prendiamo il caso dei gol indicati da un calciatore in cinque anni. Questi dati costituiscono il campione statistico:
14, 12, 14, 14, 11, 15
La frequenza assoluta di 14, per esempio, è 2 volte che 14 appare 2 volte nel campione. Ciò significa che l'atleta ha segnato 14 obiettivi in 2 stagioni diverse negli ultimi cinque anni. Il calcolo della frequenza assoluta cumulativa per quel valore (14) è ' 4: ci sono 4 valori nel campo uguali o inferiori a 14.
Un'altra frequenza cumulativa che possiamo calcolare è la frequenza relativa cumulativa. In questo caso, dobbiamo dividere la frequenza totale accumulata per il campione totale. Tornando all'esempio precedente, poiché la frequenza assoluta accumulata di 14 è 4 e il numero totale di numeri nel campo statistico è 5, la frequenza relativa cumulativa è 0,8.
Per formulare la distribuzione di questo concetto in un'equazione matematica senza ricadere nell'uso di una tabella, è possibile adattarla a quella che si chiama una distribuzione cumulativa di probabilità. Nel campo della statistica e della probabilità, la distribuzione di probabilità si riferisce a un file di funzioni che viene applicato a una variabile e dà agli eventi che sono definiti da essa diverse probabilità che vengono verificate.
Grazie all'uso di un file di equazione matematica piuttosto che una tabella, è anche più facile interpolare ed estrapolare valori. Si intende per interpolazioneNell'analisi numerica, il processo che risulta in una serie di punti da un insieme discreto di punti. Riguardo a estrapolazioneD'altra parte, è la stima che supera i limiti dell'osservazione, cioè è più incerta dell'interpolazione e comporta un maggior rischio di fallimento.
È importante notare che quando si estrapola un file distribuzione Possono verificarsi errori di frequenza acumulati come il mancato rispetto della distribuzione di probabilità una volta superato l'intervallo osservato. In questo quadro abbiamo diversi metodi per realizzare lo stesso processo, come la distribuzione normale, la distribuzione spontanea, la distribuzione di Gumbel e la distribuzione di Pareto.
Un'ulteriore opzione è quella di introdurre discontinuità tra i file di dati, che può essere molto vantaggiosa se i valori stretti e la coda della distribuzione sono lontani dalla massa mediana. Una delle applicazioni di questo metodo è nell'analisi delle precipitazioni quando il clima cambia comportamento in base all'influenza delle correnti.
Detto questo, è chiaro che lo sviluppo di un file di previsione basato sulla distribuzione di frequenza cumulativa, presenta un certo margine di errore che non è sempre accettabile. Per ridurre al minimo i risultati inutilizzabili, si raccomanda di evitare quei casi in cui le condizioni degli intervalli di dati da confrontare sono molto diverse.