O grande mito do áudio: por que você não precisa desse DAC de 32 bits

Autor: Randy Alexander
Data De Criação: 1 Abril 2021
Data De Atualização: 1 Julho 2024
Anonim
O grande mito do áudio: por que você não precisa desse DAC de 32 bits - Tecnologias
O grande mito do áudio: por que você não precisa desse DAC de 32 bits - Tecnologias

Contente


Como você já deve ter notado, há uma nova tendência no setor de smartphones de incluir chips de áudio de "qualidade de estúdio" nos smartphones modernos. Enquanto um DAC de 32 bits (conversor digital para analógico) com suporte a áudio de 192kHz certamente parece bom na folha de especificações, simplesmente não há nenhum benefício em aumentar o tamanho de nossas coleções de áudio.

Estou aqui para explicar por que essa profundidade de bits e a taxa de amostragem são apenas mais uma instância da indústria de áudio que tira proveito da falta de conhecimento do consumidor e até mesmo do audiófilo sobre o assunto. Vista seus nerds, vamos abordar alguns pontos seriamente técnicos para explicar os meandros do áudio profissional. E espero também provar a você por que você deve ignorar a maior parte do hype do marketing.

Você ouviu isso?

Antes de começarmos, este primeiro segmento oferece algumas informações básicas necessárias sobre os dois principais conceitos de áudio digital, profundidade de bits e taxa de amostragem.


A taxa de amostragem refere-se à frequência com que capturaremos ou reproduziremos informações de amplitude sobre um sinal. Essencialmente, dividimos uma forma de onda em várias pequenas partes para aprender mais sobre ela em um ponto específico no tempo. O Teorema de Nyquist afirma que a maior frequência possível que pode ser capturada ou reproduzida é exatamente metade da taxa de amostragem. Isso é bastante simples de imaginar, pois precisamos das amplitudes para a parte superior e inferior da forma de onda (o que exigiria duas amostras) para conhecer com precisão sua frequência.

Aumentar a taxa de amostragem (superior) resulta em amostras adicionais por segundo, enquanto uma profundidade de bits maior (inferior) fornece mais valores possíveis para registrar a amostra.

Para o áudio, estamos preocupados apenas com o que podemos ouvir e a grande maioria das pessoas começa a ouvir pouco antes de 20kHz. Agora que conhecemos o Teorema de Nyquist, podemos entender por que 44,1 e Hz a 48 kHz são frequências de amostragem comuns, uma vez que têm pouco mais de duas vezes a frequência máxima que podemos ouvir. A adoção dos padrões de qualidade de estúdio de 96kHz e 192kHz não tem nada a ver com a captura de dados de frequência mais alta, isso seria inútil. Mas vamos mergulhar em mais disso em um minuto.


Como observamos amplitudes ao longo do tempo, a profundidade de bits se refere simplesmente à resolução ou ao número de pontos disponíveis para armazenar esses dados de amplitude. Por exemplo, 8 bits nos oferece 256 pontos diferentes para arredondar para, resultados de 16 bits em 65.534 pontos e dados de 32 bits no valor fornecem 4.294.967.294 pontos de dados. Embora, obviamente, isso aumente muito o tamanho de qualquer arquivo.

Pode ser fácil pensar imediatamente na profundidade de bits em termos de precisão de amplitude, mas os conceitos mais importantes a serem entendidos aqui são os de ruído e distorção. Com uma resolução muito baixa, provavelmente perderemos pedaços de informações de menor amplitude ou cortaremos as partes superiores das formas de onda, o que introduz imprecisão e distorção (erros de quantização). Curiosamente, isso geralmente soa como ruído se você reproduzir um arquivo de baixa resolução, porque aumentamos efetivamente o tamanho do menor sinal possível que pode ser capturado e reproduzido. É exatamente o mesmo que adicionar uma fonte de ruído à nossa forma de onda. Em outras palavras, diminuir a profundidade de bits também diminui o nível de ruído. Também pode ajudar a pensar nisso em termos de uma amostra binária, onde o bit menos significativo representa o nível de ruído.

Portanto, uma profundidade de bits mais alta nos proporciona um nível de ruído maior, mas há um limite finito para a praticidade disso no mundo real. Infelizmente, há ruídos de fundo em todos os lugares, e não quero dizer o ônibus passando na rua. De cabos a fones de ouvido, transistores em um amplificador e até os ouvidos dentro de sua cabeça, a taxa máxima de sinal para ruído no mundo real é de cerca de 124dB, o que resulta em dados de aproximadamente 21 bits.Buster de jargão:

DAC- Um conversor de digital para analógico coleta dados de áudio digital e os transforma em um sinal analógico para enviar para fones de ouvido ou alto-falantes.

Taxa de amostragem- Medido em Hertz (Hz), é o número de amostras de dados digitais capturadas a cada segundo.

SNR- A relação sinal / ruído é a diferença entre o sinal desejado e o ruído do sistema em segundo plano. Em um sistema digital, isso é vinculado diretamente à profundidade de bits.

Para comparação, a captura de 16 bits oferece uma relação sinal / ruído (a diferença entre o sinal e o ruído de fundo) de 96,33dB, enquanto a de 24 bits oferece 144,49dB, o que excede os limites de captura de hardware e percepção humana. Portanto, seu DAC de 32 bits na verdade só poderá produzir no máximo 21 bits de dados úteis e os outros bits serão mascarados pelo ruído do circuito. Na realidade, porém, os equipamentos com preços mais moderados completam um SNR de 100 a 110dB, pois a maioria dos outros elementos do circuito apresenta seu próprio ruído. Claramente, os arquivos de 32 bits já parecem bastante redundantes.

Agora que entendemos o básico do áudio digital, vamos para alguns dos pontos mais técnicos.

Escada para o céu

A maioria das questões que envolvem o entendimento e a concepção errônea de áudio está relacionada à maneira pela qual os recursos e empresas educacionais tentam explicar os benefícios usando pistas visuais. Você provavelmente já viu o áudio representado como uma série de degraus para linhas com profundidade de bits e linhas retangulares para a taxa de amostragem. Isso certamente não parece muito bom quando você o compara a uma forma de onda analógica de aparência suave, por isso é fácil traçar escadas mais suaves e "suaves" para representar uma forma de onda de saída mais precisa.

Embora possa ser uma venda fácil para o público, essa analogia comum da precisão das “escadas” é um enorme desvio de sentido e falha em apreciar como o áudio digital realmente funciona. Ignore isto.

No entanto, essa representação visual deturpa como o áudio funciona. Embora possa parecer confuso, matematicamente os dados abaixo da frequência de Nyquist, que é metade da taxa de amostragem, foram capturados perfeitamente e podem ser reproduzidos perfeitamente. Imagine isso, mesmo na frequência de Nyquist, que geralmente pode ser representada como uma onda quadrada em vez de uma onda senoidal suave, temos dados precisos para a amplitude em um ponto específico no tempo, e é tudo o que precisamos. Nós, humanos, frequentemente olhamos erroneamente o espaço entre as amostras, mas um sistema digital não opera da mesma maneira.

A profundidade de bits costuma estar ligada à precisão, mas na verdade define o desempenho do ruído do sistema. Em outras palavras, o menor sinal detectável ou reproduzível.

Quando se trata de reprodução, isso pode ser um pouco mais complicado, devido ao conceito fácil de entender dos DACs de “ordem zero”, que simplesmente alternam entre valores a uma taxa de amostragem definida, produzindo um resultado escalonado. Na verdade, essa não é uma representação justa de como os DACs de áudio funcionam, mas enquanto estamos aqui, podemos usar este exemplo para provar que você não deve se preocupar com essas escadas de qualquer maneira.

Um fato importante a ser observado é que todas as formas de onda podem ser expressas como a soma de várias ondas senoidais, uma frequência fundamental e componentes adicionais em múltiplos harmônicos. Uma onda triangular (ou um degrau da escada) consiste em harmônicos ímpares em amplitudes decrescentes. Portanto, se ocorrerem muitas etapas muito pequenas na nossa taxa de amostragem, podemos dizer que há algum conteúdo harmônico extra adicionado, mas ocorre o dobro de nossa frequência audível (Nyquist) e provavelmente alguns harmônicos além disso, então vencemos seja capaz de ouvi-los de qualquer maneira. Além disso, seria muito simples filtrar usando alguns componentes.

Se separarmos as amostras do DAC, podemos facilmente ver que o sinal desejado é perfeitamente representado, juntamente com uma forma de onda adicional na taxa de amostragem do DAC.

Se isso for verdade, poderemos observar isso com um experimento rápido. Vamos pegar uma saída diretamente de um DAC básico de ordem zero e também alimentar o sinal através de um 2 muito simples.nd solicite um filtro passa-baixo ajustado à metade da taxa de amostragem. Na verdade, só usei um sinal de 6 bits aqui, apenas para que possamos ver a saída em um osciloscópio. Um arquivo de áudio de 16 ou 24 bits teria muito menos ruído no sinal antes e depois da filtragem.

Um exemplo bastante grosseiro, mas isso prova que os dados de áudio são recriados perfeitamente dentro dessa escada bagunçada.

E como se por mágica, os degraus da escada desaparecessem quase completamente e a saída fosse "suavizada", apenas usando um filtro passa-baixo que não interfere com a saída de onda senoidal. Na realidade, tudo o que fizemos foi filtrar partes do sinal que você nunca ouviria. Isso realmente não é um resultado ruim para quatro componentes extras que são basicamente livres (dois capacitores e dois resistores custam menos de 5 centavos), mas na verdade existem técnicas mais sofisticadas que podemos usar para reduzir ainda mais esse ruído. Melhor ainda, eles são incluídos como padrão na maioria dos DACs de boa qualidade.

Lidando com um exemplo mais realista, qualquer DAC para uso com áudio também apresentará um filtro de interpolação, também conhecido como up-sampling. A interpolação é simplesmente uma maneira de calcular pontos intermediários entre duas amostras, de modo que o seu DAC está realizando muito esse "alisamento" por conta própria e muito mais do que duplicar ou quadruplicar a taxa de amostragem. Melhor ainda, não ocupa espaço extra no arquivo.

Os filtros de interpolação comumente encontrados em qualquer DAC que se preze são uma solução muito melhor do que carregar arquivos com taxas de amostragem mais altas.

Os métodos para fazer isso podem ser bastante complexos, mas essencialmente o seu DAC está alterando seu valor de saída com muito mais frequência do que a frequência de amostra do seu arquivo de áudio sugere. Isso empurra os harmônicos inaudíveis do degrau para fora da frequência de amostragem, permitindo o uso de filtros mais lentos e mais fáceis de alcançar que têm menos ondulações, preservando, portanto, os bits que realmente queremos ouvir.

Se você está curioso para saber por que queremos remover esse conteúdo que não podemos ouvir, a simples razão é que a reprodução desses dados extras na cadeia de sinal, digamos em um amplificador, gastaria energia. Além disso, dependendo de outros componentes do sistema, esse conteúdo "ultra-sônico" de frequência mais alta pode realmente levar a quantidades maiores de distorção de intermodulação em componentes de largura de banda limitados. Portanto, seu arquivo de 192 kHz provavelmente causaria mais danos do que benefícios, se houvesse realmente algum conteúdo ultrassônico contido nesses arquivos.

Se mais alguma prova for necessária, também mostrarei uma saída de um DAC de alta qualidade usando o Circus Logic CS4272 (foto na parte superior). O CS4272 possui uma seção de interpolação e um filtro de saída embutido íngreme. Tudo o que estamos fazendo para esse teste é usar um microcontrolador para alimentar o DAC com duas amostras de alta e baixa de 16 bits a 48kHz, fornecendo a forma de onda de saída máxima possível a 24kHz. Não há outros componentes de filtragem usados, essa saída vem diretamente do DAC.

O sinal de saída de 24kHz (em cima) deste componente DAC de nível de estúdio certamente não se parece com a forma de onda retangular associada ao material de marketing usual. A taxa de amostragem (Fs) é exibida na parte inferior do osciloscópio.

Observe como a onda senoidal de saída (superior) é exatamente metade da velocidade do relógio de frequência (inferior). Não há degraus perceptíveis nas escadas e essa forma de onda de frequência muito alta parece quase uma onda senoidal perfeita, não uma onda quadrada com aparência de blocos que o material de marketing ou mesmo um vislumbre ocasional dos dados de saída sugeririam. Isso mostra que, mesmo com apenas duas amostras, a teoria de Nyquist funciona perfeitamente na prática e podemos recriar uma onda senoidal pura, ausente de qualquer conteúdo harmônico adicional, sem uma enorme profundidade de bits ou taxa de amostragem.

A verdade sobre 32 bits e 192 kHz

Como na maioria das coisas, há alguma verdade escondida por trás de todo o jargão e o áudio de 32 bits e 192 kHz é algo que tem um uso prático, mas não na palma da sua mão. Esses atributos digitais são realmente úteis quando você está em um ambiente de estúdio, daí as reivindicações de trazer "áudio de qualidade de estúdio para celular", mas essas regras simplesmente não se aplicam quando você deseja colocar a faixa final no seu bolso.

Primeiro, vamos começar com a taxa de amostragem. Um benefício frequentemente elogiado pelo áudio de alta resolução é a retenção de dados ultrassônicos que você não pode ouvir, mas afeta a música. Lixo, a maioria dos instrumentos cai bem antes dos limites de frequência da nossa audição, o microfone usado para capturar um espaço reduzido no máximo em torno de 20kHz e os fones de ouvido que você está usando certamente também não se estenderão tão longe. Mesmo que pudessem, seus ouvidos simplesmente não conseguem detectá-lo.

A sensibilidade auditiva humana típica atinge o pico de 3kHz e rapidamente começa a diminuir após 16kHz.

No entanto, a amostragem de 192 kHz é bastante útil para reduzir o ruído (essa palavra-chave mais uma vez) ao coletar dados, permite a construção mais simples de filtros de entrada essenciais e também é importante para o efeito digital de alta velocidade. A superamostragem acima do espectro audível nos permite calcular a média do sinal para pressionar o piso de ruído. Você verá que a maioria dos bons ADCs (conversores analógico para digital) hoje em dia vem com uma sobre-amostragem de 64 bits ou mais.

Todo ADC também precisa remover frequências acima do seu limite de Nyquist, ou você acabará com um pseudônimo de som horrível, à medida que frequências mais altas são "dobradas" para baixo no espectro audível. Ter um espaço maior entre a frequência de canto do filtro de 20 kHz e a taxa máxima de amostra é mais adaptável aos filtros do mundo real, que simplesmente não podem ser tão íngremes e estáveis ​​quanto os filtros teóricos necessários. O mesmo ocorre no final do DAC, mas, como discutimos, a intermodulação pode efetivamente elevar esse ruído a frequências mais altas para facilitar a filtragem.

Quanto mais inclinado o filtro, mais ondulações na banda passante. Aumentar a taxa de amostragem permite o uso de filtros "mais lentos", o que ajuda a preservar uma resposta de frequência plana na banda passante audível.

No domínio digital, regras semelhantes se aplicam aos filtros que são frequentemente usados ​​no processo de mixagem do estúdio. Taxas de amostragem mais altas permitem filtros de ação mais íngreme e mais rápido que exigem dados adicionais para funcionar corretamente. Nada disso é necessário quando se trata de reprodução e DACs, pois somos interessantes apenas no que você pode realmente ouvir.

Passando para 32 bits, qualquer pessoa que já tenha tentado codificar qualquer matemática remotamente complexa entenderá a importância da profundidade de bits, tanto com dados inteiros quanto com ponto flutuante. Como discutimos, quanto mais bits, menos ruído e isso se torna mais importante quando começamos a dividir ou subtrair sinais no domínio digital devido a erros de arredondamento e para evitar erros de recorte ao multiplicar ou adicionar.

A profundidade de bits adicional é importante para preservar a integridade de um sinal ao executar operações matemáticas, como dentro do software de áudio de estúdio. Mas podemos jogar fora esses dados extras quando a masterização terminar.

Aqui está um exemplo, digamos que pegamos uma amostra de 4 bits e nossa amostra atual é 13, que é 1101 em binário. Agora tente dividir isso por quatro e ficaremos com 0011, ou simplesmente 3. Perdemos 0,25 extra e isso representará um erro se tentarmos fazer cálculos adicionais ou transformar nosso sinal novamente em uma forma de onda analógica.

Esses erros de arredondamento se manifestam como quantidades muito pequenas de distorção ou ruído, que podem se acumular em um grande número de funções matemáticas. No entanto, se estendermos essa amostra de 4 bits com bits adicionais de informações para usar como facção ou ponto decimal, poderemos continuar a dividir, adicionar e multiplicar por muito mais tempo, graças aos pontos de dados extras. Portanto, no mundo real, amostrar em 16 ou 24 bits e depois converter esses dados em um formato de 32 bits para processamento novamente ajuda a economizar ruído e distorção. Como já dissemos, 32 bits são muitos pontos de precisão.

Agora, o que é igualmente importante reconhecer é que não precisamos desse espaço extra quando voltamos ao domínio analógico. Como já discutimos, cerca de 20 bits de dados (-120dB de ruído) são o máximo absoluto que é possível detectar, para que possamos converter novamente em um tamanho de arquivo mais razoável sem afetar a qualidade do áudio, apesar do fato de os "audiófilos" serem provavelmente lamentando esses dados perdidos.

No entanto, inevitavelmente, introduziremos alguns erros de arredondamento ao passar para uma profundidade de bits mais baixa, para que sempre haja uma quantidade muito pequena de distorção extra, pois esses erros nem sempre ocorrem aleatoriamente. Embora esse não seja um problema com o áudio de 24 bits, já que se estende muito além do piso de ruído analógico, uma técnica chamada "pontilhamento" resolve com perfeição esse problema para arquivos de 16 bits.

Um exemplo de comparação da distorção introduzida pelo truncamento e pontilhamento.

Isso é feito aleatoriamente o bit menos significativo da amostra de áudio, eliminando erros de distorção, mas introduzindo um ruído de fundo aleatório muito silencioso que se espalha por frequências. Embora a introdução de ruído possa parecer contra-intuitiva, isso na verdade reduz a quantidade de distorção audível por causa da aleatoriedade. Além disso, usando padrões especiais de pontilhamento em forma de ruído que abusam da resposta de freqüência do ouvido humano, o áudio pontilhado de 16 bits pode reter um ruído percebido muito próximo a 120 dB, exatamente nos limites de nossa percepção.

Dados de 32 bits e taxas de amostragem de 192kHz têm benefícios notáveis ​​no estúdio, mas as mesmas regras não se aplicam à reprodução.

Simplificando, deixe os estúdios entupir seus discos rígidos com este conteúdo de alta resolução, simplesmente não precisamos de todos esses dados supérfluos quando se trata de reprodução de alta qualidade.

Embrulhar

Se você ainda estiver comigo, não interprete este artigo como uma dispensa completa dos esforços para melhorar os componentes de áudio do smartphone. Embora o número de divulgações possa ser inútil, componentes de maior qualidade e melhor design de circuitos ainda são um excelente desenvolvimento no mercado móvel, precisamos apenas garantir que os fabricantes concentrem sua atenção nas coisas certas. O DAC de 32 bits no LG V10, por exemplo, parece incrível, mas você não precisa se preocupar com grandes tamanhos de arquivos de áudio para tirar proveito dele.

A capacidade de acionar fones de ouvido de baixa impedância, preservar um piso de baixo ruído do DAC ao conector e oferecer distorção mínima são características muito mais importantes para o áudio do smartphone do que a profundidade de bits ou a taxa de amostragem teoricamente suportadas, e esperamos poder mergulhar nesses pontos com mais detalhes no futuro.

LG G8 ThinQ com câmera tripla, LG G8 com câmera duplaEm termo de epecificaçõe, o LG G8 ThinQ recebe o napdragon 855 oC topo de linha, aim como o G8. ua tela OLED FullViion de 6,2 p...

A LG lançou um anúncio relacionado ao celular para a IFA 2019, ugerido como um martphone da érie V com um gabinete econd creen. Agora, nova renderizaçõe urgiram on-line, corte...

Mais Detalhes