10 de nov. de 2014

A tecnologia do processamento digital (Parte 1).

Esse artigo vai abordar um dos assuntos mais controversos e "dogmáticos" dos instrumentos elétricos. Aqui serão explicados conceitos como DSP, Profilers, VSTs e assuntos relacionados, como funcionam e porque podemos esperar grandes coisas dessas maravilhas tecnológicas assim que conseguirmos vencer o preconceito causado pela palavra "digital" nesse meio de viciados em equipamentos valvulados, true bypass, germânio, analógicos, vintage e tradicionais.


Tradição VS Progresso:
Vários milênios antes da invenção da guitarra alguns macacos rechaçaram seus companheiros que desceram das árvores dizendo que era de fato uma má idéia e posteriormente alguns desse mesmo grupo se sentiram desconfortáveis em ver alguns de seus companheiros resolverem andar sobre duas patas. Inventaram o fogo, a roda e os relógios digitais, e apesar de até hoje termos dissidentes que dizem que os relógios digitais jamais terão o mesmo timbre de "tic tac" dos analógicos, é inútil comparar o erro de 1 segundo a cada 300 milhões de anos (do NIST-F2) com o fato de relógios analógicos serem ajustados diáriamente (e ironicamente, usando os digitais como referência).
Como aficcionado por tecnologia eu admiro a engenharia por trás dos relógios analógicos, os mecanismos de compensação e equilíbrio e todas as tentativas de torna-los precisos com "o que se tinha". Isso é muito mais "mágico" do que ter um oscilador de vários MHz e um divisor que converta isso em 1Hz (um pulso por segundo) e baixe o erro para um nível risível, mas usar um desses é uma questão de tradição e gosto, não de custo ou funcionalidade.
Tópicos como "true bypass VS buffer", "valvula VS transistor" e "digital VS analógico" sempre foram abordados por guitarristas dogmáticos e apaixonados e poucas vezes o método científico foi utilizado. Hoje vamos nos limitar a entender o DSP e compara-lo às tecnologias de processamento analógico usando análises ao invés de suposições.


Dividindo em estágios:
Placas de audio, pedaleiras, pedais digitais e demais processadores de efeito usam pelo menos cinco "blocos" entre a entrada e a saída do sinal e cada um deles determina caracteristicas bem específicas do equipamento.

(1) Preamplificador: Garante a integridade e o nível do sinal antes da conversão, a ideia aqui é manter o sinal o mais linear possível e entrega-lo ao próximo estágio na máxima intensidade possível antes de "clippar" para tirar o melhor da conversão posteriormente.

(2) ADC: Conversor analógico-digital. Aqui duas coisas são realmente importantes, a resolução e a taxa de amostragem. Na coversão, os valores de 0 a 1V RMS (mudo até 0dB) se tornam variáveis de 0 a um número inteiro determinado pela resolução, um ADC de 10 bits escala de 0 a 1023 passos, enquanto um de 24 bits escala de 0 a 16.777.215 passos para a mesma variação de intensidade na entrada. A taxa de amostragem indica quantas vezes o sinal é analisado em um período de tempo, por exemplo, 44.1Khz significa 44.100 amostragens em um segundo, enquanto 96Khz indicam 96 mil amostragens. Esses dois fatores indicam o nível de detalhe obtido do áudio analógico e quanto maiores são, mais preciso o conversor se torna e mais "rico" e semelhante ao analógico o audio digital se torna.

(3) Processador: Nesse setor que são adicionados os efeitos ao áudio, algorítmos tratam a tempestade de bits que vimos anteriormente em tempo real para modificar a informação antes de ela ser convertida novamente em sinal analógico. Se os conversores determinam a qualidade do audio, esse estágio determina a qualidade do efeito em si. Algoritmos complexos (geralmente) significam efeitos melhores mas exigem mais poder de processamento da CPU e isso significa um dos dois: usar menos efeitos simultâneos ou usar uma CPU melhor. A POD HD500 é um exemplo. Ela recebeu um feedback negativo por ter efeitos excelentes mas chegar ao limite da CPU com poucos deles funcionando simultaneamente, em breve foi lançado um modelo novo, a HD500X, com maior poder de processamento. Os outros 4 estágios continuam idênticos, os algoritmos são os mesmos, mas o processador foi trocado por um mais poderoso.

(4) DAC: Conversor Digital-Analógico. Fazendo o caminho inverso mas usando os mesmos princípios de resolução e taxa de amostragem, o sinal é modulado para se tornar analógico novamente.

(5) Filtro e buffer: Todo sinal modulado digitalmente sofre um "ripple" (lembram do artigo de fontes?), apesar da frequência estar acima do limite da audição humana há sub-harmônicos que podem vir a se manifestar é de boa prática filtra-los, amplificar o sinal até o nível de linha e casar a impedância de saída com o próximo equipamento da cadeia.


Sample Rate e fatores biológicos:
Existe um motivo biológico por trás do sample rate mais comum ser de 44.1Khz. Nossa audição ao nascer vai de 20Hz a 20Khz e pelo teorema Nyquist-Shannon um sinal só pode ser sampleado sem degradação e filtrado posteriormente se sampleado com o dobro da frequência máxima de banda a ser utilizada, nesse caso, 40Khz seriam suficientes.
Como detalhe adicional, saiba que já aos 18 anos sem nenhum fator externo como ruído ou doença envolvido, apenas pela idade! Aos 25-30 grande parte de nós já vai ter uma deficiência séria a partir dos 15Khz, e nem vai nota-la caso não faça um exame de audiometria, porque é uma mudança gradual, lenta e progressiva.
Concluimos que 44.1Khz é mais do que o bastante para não haver nenhuma mudança audível para nós ainda que o sample rate seja maior, uma vez que toda a informação adicional, de frequências superiores, simplesmente não vai ser "captada pelos nossos sensores".

Compactação:
Chegada a era do MP3 e músicas que ocupam 1Mb por minuto de audio em boa qualidade, ainda temos pessoas que só baixam arquivos em FLAC ou mídias com "lossless compression", mas pra que comprimir e qual a diferença?
O audio WAV, bem como AIFF, AU ou RAW são formatos PCM, um tipo não comprimido de audio, e o custo de manter a integridade do arquivo intacta é o tamanho gigantesco que gravações de poucos minutos podem ter. Isso explica o motivo da compressão.
Comprimir significa usar algorítmos avançados de modelagens estatísticas que não serão discutidos aqui, e que podem ser adaptativos ou fixos. A ideia é basicamente converter trechos repetitivos de dados que aparecem nos arquivos (redundancias) em trechos menores a serem interpretados pelo CODEC, como uma letra de música onde só se escreve o refrão uma vez e (refrão) ao invés do parágrafo todo das próximas vezes.
A compressão "lossless" significa que todos os dados são reorganizados e nada é deixado de lado, apenas reescrito de maneira a ocupar menos espaço, e é usada em arquivos como FLAC, ALAC e Dolby TrueHD.
A compressão "lossy" significa que algorítmos trabalham detectando e eliminando trechos de dados que não são críticos para a qualidade do audio, geralmente os que representam frequências acima da audição humana ou dinamicamente inaudíveis usando princípios da "psicoacústica" que discutiremos em outro artigo. Os arquivos são mais comprimidos ao custo de possivelmente sacrificar trechos importantes por imprecisão no algorítmo usado e possivelmente baixar a qualidade de maneira perceptível.


Curiosidade:
Nos studios é prática comum é gravar no limite do equipamento, geralmente 24 bits / 96Khz ou qualidade superior e só baixar para a qualidade de CD (16 bits / 44Khz) ou DVD (16 bits / 48 Khz) depois de tudo estar mixado, editado e pronto para a master. A justificativa é manter a qualidade no nível mais alto possível para preservar detalhes que se perderiam durante a edição caso ela fosse feita no mesmo padrão da master.
Ao lado a foto da Solidyne 922 primeira placa de audio capaz de reproduzir arquivos em formato compactado, em 1990.

Considerações finais:
A área de compressão de dados e de psicoacústica são extremamente complexas e merecem o seu próprio tópico de discussão, e os paralelos aqui traçados foram feitos para tentar tornar alguns conceitos mais compreensíveis. Deixo claro que os métodos de compressão, assim como o assunto, se extendem muito além do que foi apresentado aqui.
A parte 1 foi usada para explicar o audio digital em si e na parte 2 apresentarei algumas das técnicas e algorítmos de modelagem e traçarei um paralelo com o analógico.

Nenhum comentário:

Postar um comentário