I formati audio sono tipi di file che memorizzano dati audio digitali in un sistema informatico. I dati audio bitmap (ad eccezione dei metadati) sono chiamati formati di codifica audio e potrebbero non essere compressi o compressi. La compressione viene utilizzata per ridurre la dimensione del file, che viene spesso associata alla perdita di qualità del suono. Il suono può anche essere un flusso di bit grezzo nel formato di codifica audio, ma di solito è incorporato nel formato di dati audio con uno specifico livello di archiviazione.
Un file audio è un insieme di informazioni costituito da dati relativi alla frequenza e all'ampiezza del suono, salvati per la successiva riproduzione.
I formati audio possono svolgere il ruolo di contenitore per i dati grezzi e utilizzare i codec audio. Spesso questi concetti sono confusi e confusi.
Il codec codifica e decodifica i dati audio non elaborati, mentre i dati codificati vengono solitamente memorizzati in un file contenitore. Sebbene la maggior parte dei formati di file audio supportino solo un tipo di dati di codifica audio (creati con un codificatore audio), un formato contenitore multimediale (ad esempio Matroska o AVI) può supportare diversi tipi di dati audio e video.
Formati di file audio può essere diviso nei seguenti gruppi:
1. Non compresso - come WAV, AIFF, AU o PCM non elaborato senza intestazioni.
2. Formati con compressione senza perdita di dati, ad esempio FLAC, AudioMonkey (estensione file .ape), WavPack (estensione file .wv), TTA, ATRAC AdvancedLossless, ALAC (estensione file .m4a), MPEG-4 SLS, MPEG- 4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA senza perdita) e Shorten (SHN).
3. Formati con compressione con perdita - ad esempio, Opus, MP3, Vorbis, Musepack, AAC, ATRAC e Windows Media Audio Lossy (WMA compresso).
Uno dei principali formati audio non compressi è LPCM. Essenzialmente, è un tipo di PCM ed è simile al Digital Audio (formato CD audio). È il tipo più utilizzato dalle API di basso livello e dai convertitori digitale-analogico. Sebbene LPCM possa essere memorizzato su un computer come formato audio non formattato, di solito si trova in un file WAV di Windows o in .aiff su macOS.
Il formato audio digitale AIFF è basato sul formato di scambio di file (IFF) e WAV si basa su un tipo simile di file di scambio di risorse (RIFF). WAV e AIFF sono progettati per archiviare una vasta gamma di formati audio, sia lossless che lossy. Semplicemente aggiungono una piccola intestazione contenente metadati davanti al componente audio per indicare il formato audio (ad esempio, LPCM con una frequenza di campionamento specifica, profondità di bit, numeri di sequenza e numero di canali). Poiché WAV e AIFF sono ampiamente supportati e possono memorizzare LPCM, sono formati di file adatti per archiviare e archiviare la registrazione originale.
BWF (Broadcast Wave Format) è un formato audio standard creato dalla European Broadcasting Union come successore di WAV. Ha molti miglioramenti, inclusa la possibilità di memorizzare metadati più affidabili in un file. Questo è il formato di registrazione principale utilizzato in molte workstation professionali nell'industria televisiva e cinematografica. I file BWF includono un timestamp standardizzato che semplifica la sincronizzazione dell'audio con un singolo elemento dell'immagine. I registratori autonomi multi-traccia AETA, Sound Devices, Zaxcom, HHB Communications Ltd, Fostex, Nagra, Aaton e TASCAM utilizzano sempre BWF come formato preferito.
Questo tipo di dati salva i dati in un volume più piccolo senza perdere informazioni. I dati originali possono essere ricreati da questa versione.
I formati audio non compressi codificano suono e silenzio con lo stesso numero di bit per unità di tempo. La codifica dei minuti di silenzio assoluto crea un file delle stesse dimensioni dei minuti di musica. Tuttavia, in un formato compresso, la musica occuperà un file più piccolo rispetto alla registrazione originale e il silenzio non occuperà quasi nessuno spazio.
I formati di file audio di questo tipo includono FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Forniscono un rapporto di compressione di circa 2: 1 (ovvero, i file occupano metà dello spazio PCM). Lo sviluppo in formati di compressione senza perdite ha lo scopo di ridurre i tempi di elaborazione mantenendo una buona qualità del suono.
Ciò consente di ridurre ulteriormente le dimensioni del file, rimuovere parte delle informazioni audio e semplificare i dati. Questo, ovviamente, porta al fatto che la qualità dei formati audio peggiora molto. Utilizza vari metodi (spesso attraverso l'uso della psicoacustica) per rimuovere parti del suono che influiscono meno sulla qualità percepita e ridurre al minimo la quantità di rumore udibile aggiunto durante il processo di compressione. Il popolare formato MP3 è forse l'esempio più famoso. Inoltre, AAC, che può essere trovato in iTunesMusicStore, è anche ampiamente distribuito. La maggior parte dei formati offre una gamma diversa. rapporto di compressione di solito misurato in bit rate. Minore è la velocità, minore è il file e maggiore è la perdita di qualità.
.3GP è un formato contenitore multimediale che può contenere i propri formati AMR, AMR-WB o AMR-WB +, nonché alcune versioni aperte.
.AAC (Advanced Audio Coding) - basato sugli standard MPEG-2 e MPEG-4. I file AAC sono in genere ADTS o contenitori ADIF.
.AAX (Audible.com) è un formato di audiolibro che è un file M4B con un bit rate variabile (che fornisce alta qualità), crittografato tramite DRM. MPB contiene audio codificato AAC o ALAC in un contenitore MPEG-4.
.AIFF è il formato di file audio standard utilizzato da Apple. Può essere considerato l'equivalente di WAV.
.AMR (AMR-NB) è un tipo di audio utilizzato principalmente per la registrazione vocale.
.APE (Ashland Monkey's) - formato audio con compressione senza perdita di qualità.
.M4A è l'audio MPEG-4 utilizzato da Apple per la musica non protetta scaricata da iTunes Music Store. L'audio in un file M4A è solitamente codificato con AAC, sebbene l'ALAC possa anche essere usato senza perdita di qualità.
.M4P è una versione Apple di AAC con gestione proprietaria dei diritti digitali sviluppata da Apple per l'utilizzo nella musica scaricata da iTunes Music Store.
.MMF - La vista audio di Samsung utilizzata in una suoneria. È stato sviluppato da Yamaha ed è un formato di dati multimediali.
. Audio MPEG Layer III in formato MP3. Questo è il tipo più comune di file audio usato oggi. Conosciuto anche come MPEG-1 o MPEG-2, è un formato di codifica audio peculiare per l'audio digitale. Utilizza una forma di compressione dei dati con perdita per informazioni sulla codifica utilizzando approssimazioni imprecise e scartando i dati parziali. Tutto ciò al fine di ridurre la dimensione dei file, in genere 10 volte, rispetto a un CD. Allo stesso tempo, la qualità del suono è paragonabile a quella non compressa. Rispetto alla qualità del CD audio digitale, la qualità della compressione MP3 di solito raggiunge il 75-95% in termini di riduzione delle dimensioni. Pertanto, i file di questo tipo vanno da 1/4 a 1/20 della dimensione del flusso audio digitale originale. Questo è importante per garantire il trasferimento e l'archiviazione dei file, soprattutto ai nostri giorni, quando lo scambio di informazioni è molto diffuso. La base per questo confronto è il formato del CD audio digitale, che richiede 1411200 bps. Un'impostazione di codifica MP3 comunemente utilizzata è di 128 kbps CBR, risultando in un file 1/11 (= 9%) delle dimensioni del file di qualità del CD originale, ovvero con una compressione del 91%.
La compressione MP3 senza perdita di dati riduce la precisione (o approssimativa) di alcune parti dell'audio continuo che sono considerate inaccessibili alla risoluzione audio della maggior parte delle persone. Questo metodo viene comunemente chiamato codifica percettiva o "psicoacustica". Usa i modelli psicoacustici per scartare o ridurre l'accuratezza dei componenti che sono meno udibili dall'udito umano, quindi registra le informazioni rimanenti in modo efficace.
.MPC (precedentemente noto come MPEGplus, MPEG + o MP +) è un codec audio open source specificamente ottimizzato per la compressione stereo / audio trasparente con un bit rate di 160-180 Kbps.
Il formato .OGG, .OGA, MOGG è un tipo di contenitore aperto gratuito che supporta molti altri tipi, il più popolare dei quali è il formato audio Vorbis. Offre compressione simile a MP3, ma meno popolare. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) è un formato di file OGG multi-canale o multi-traccia.
.WAV è un formato di file audio standard utilizzato principalmente su PC Windows. Solitamente viene utilizzato per archiviare file audio non compressi (PCM) di qualità CD, il che significa che possono essere di grandi dimensioni - circa 10 MB al minuto. Questi file possono contenere anche dati codificati con codec diversi per ridurre le dimensioni (ad esempio, il trasferimento in formato GSM o MP3). I file WAV utilizzano una struttura RIFF. Questo formato preserva la qualità dei file nel modo migliore.
.WMA è un formato Microsoft Windows Media Audio. Progettato con funzionalità di gestione dei diritti digitali (DRM) per la protezione da copia. In precedenza era distribuito in tutto il formato OGG o MP3.
.WV è un formato creato per il video HTML5.
.AOT Audible.com è un contenitore di audiolibri a basso bitrate con DRM contenente audio codificato come un codec vocale MP3 o ACELP.
.M4B è un'estensione per audiolibri / podcast con codifica AAC o ALAC in un contenitore MPEG-4. Entrambi i formati possono contenere metadati, inclusi marcatori di capitoli, immagini e collegamenti ipertestuali. Inoltre, M4B consente "segnalibri" (ricordando l'ultima posizione di ascolto), mentre M4A no.
.ACT è un formato audio ADPCM compresso fino a 8 kbps. Registra dalla maggior parte dei lettori MP3 e MP4 e dei dittafoni.
.AU è il formato di file audio standard utilizzato da Sun, Unix e Java. L'audio nei file AU può essere sotto forma di PCM o compresso utilizzando i codec μ-law, a-law o G729.
.AWB (AMR-WB) - audio utilizzato principalmente per il parlato, simile alla specifica ITU-T G.722.2.
.DCT: viene utilizzato dal software NCH. Questo è un formato codec variabile destinato alla dettatura. Ha informazioni sull'intestazione della dettatura e può essere crittografato (come richiesto dalle leggi sulla privacy medica). Si può anche dire che questo è il formato proprietario del software NCH.
.DSS - I file Olympus DSS sono formati proprietari di Olympus. Questo è un codec piuttosto vecchio e cattivo. GSM o MP3, di regola, è preferibile se possono essere utilizzati da un registratore. Ciò rende possibile memorizzare ulteriori dati nell'intestazione del file.
.DVF è il formato di file vocale compresso proprietario di Sony, comunemente usato dai registratori vocali di questa azienda.
.GSM - progettato per l'uso in telefonia in Europa. Questo è il miglior formato audio per la voce della qualità del suono sul telefono. Un buon compromesso tra dimensione del file e qualità. Vale anche la pena notare che i file wav possono talvolta essere codificati utilizzando il codec GSM.
.MSV è il formato proprietario di Sony per i file Memory Stick vocali compressi.
.FLAC - formato di file per Free Lossless Audio Codec, codec di compressione audio senza perdita di dati.
.IKLAX è un formato audio digitale multitraccia che consente di eseguire varie azioni su dati musicali, come quando si miscelano e si compongono i volumi.
.IVS è una versione proprietaria di Digital Rights Management sviluppata da 3D Solar UK Ltd per l'utilizzo nella musica scaricata dal negozio di musica Tronme, nonché per i lettori di musica e video interattivi.
.OPUS (Internet Engineering Task Force) è un formato di compressione audio con perdita di qualità sviluppato dal gruppo di lavoro Internet Engineering Task Force (IETF) e progettato specificamente per applicazioni interattive in tempo reale su Internet. Presentato come un tipo aperto, standardizzato utilizzando RFC 6716, la sua implementazione di riferimento viene fornita in conformità con la licenza BSD per 3 sezioni.
.RA, .RM - formato Real Audio, progettato per lo streaming audio su Internet. Allo stesso tempo .RA ti consente di archiviare i file offline sul computer con tutti i dati audio contenuti nel file stesso. I programmi per formati audio di questo tipo sono ora considerati obsoleti.
.RAW: il file raw può contenere audio in qualsiasi formato, ma viene solitamente utilizzato con dati audio PCM. È usato raramente, ad eccezione dei test tecnici.
.SLN è un formato PCM lineare approvato utilizzato da Asterisk. Prima della versione v.10, i tipi di audio standard erano firmati a 16 bit.
.Vox - il più delle volte utilizza il codec Dialogic ADPCM (Adaptive Differential Code Modulation). Come altri formati ADPCM, comprime i dati a 4 bit. I file Vox sono simili ai file wave, tranne che non contengono informazioni sul file stesso, quindi i formati audio potrebbero essere diversi. Per fare ciò, devi prima specificare la frequenza di campionamento del codec e il numero di canali.