GPU Arm Mali-G77 - os detalhes completos

Autor: Randy Alexander
Data De Criação: 3 Abril 2021
Data De Atualização: 1 Julho 2024
Anonim
X3 Pro RGB A95X F3 2nd Android | Ubuntu | CoreELEC | Xmrig Ready
Vídeo: X3 Pro RGB A95X F3 2nd Android | Ubuntu | CoreELEC | Xmrig Ready

Contente


Juntamente com o novo núcleo de CPU Cortex-A77, a Arm apresentou uma GPU de última geração destinada aos SoCs de smartphones da próxima geração. O Mali-G77, que não deve ser confundido com o novo processador de vídeo Mali-D77, marca a partida da arquitetura Bifrost da Arm e a mudança para Valhall.

Nós entraremos em detalhes da nova arquitetura em um momento. Primeiro, abordaremos o que os usuários devem esperar em termos de ganhos de desempenho.

Visão geral do desempenho do Mali-G77

O Arm possui um aumento de até 40% no desempenho gráfico dos dispositivos Mali-G77 da próxima geração, em comparação com os modelos Mali-G76 de hoje. Esse número está levando em consideração o processo e as melhorias arquiteturais. O Mali-G77 é configurável de 7 a 16 núcleos shader, e cada núcleo tem quase exatamente o mesmo tamanho que o núcleo G76. Isso significa que os smartphones de última geração provavelmente serão fornecidos com contagens principais de GPU semelhantes às de hoje - em algum momento na adolescência. Com facilidade, isso nos permite fazer algumas avaliações especulativas de desempenho em relação aos chipsets existentes.


Olhando para o popular benchmark Manhattan GFXBench, um aumento de 40% no desempenho abre uma vantagem considerável em relação ao hardware da geração atual. O chip Adreno de próxima geração da Qualcomm precisará de seu próprio aprimoramento de desempenho significativo para manter o nível de concorrência. As mesas parecem estar virando a favor de Arm.

Em termos de arquitetura, o desempenho dos jogos aumenta de 20 a 40%, enquanto o aprendizado de máquina ganha um aumento de 60%

Com base nesse campo de jogo bastante grosseiro, um Mali-G77 de 10 núcleos (uma configuração que geralmente vemos na Huawei) parece praticamente superar o hardware gráfico móvel de última geração desta geração. Uma configuração de 12 núcleos, normalmente vista no Exynos da Samsung, fornece uma grande vantagem para a mais recente GPU da Arm. Obviamente, os benchmarks reais dependerão de outros fatores, incluindo nó do processo, memória cache da GPU, configuração da memória LPDDR e o tipo de aplicativo que você está testando. Então, pegue o gráfico acima com uma grande dose de sal.


Somente em termos de nova arquitetura, Arm afirma que o Mali-G77 oferece uma melhoria média de 30% na eficiência energética e na densidade de desempenho. Também há um grande aumento de 60% nos aplicativos de aprendizado de máquina, graças ao suporte ao produto com pontos INT8. As expectativas de desempenho dos jogos são definidas entre 20 e 40% de aumento, dependendo do título e do tipo de carga de trabalho gráfica oferecida.

Para entender exatamente como a Arm alcançou essa melhoria de desempenho, vamos aprofundar a arquitetura.

Conheça Valhall, sucessor da Bifrost

Vahall é a arquitetura de GPU escalar de segunda geração da Arm. É um mecanismo de execução com 16 warp de largura, o que significa essencialmente que a GPU executa 16 instruções em paralelo por ciclo, por unidade de processamento e por núcleo. Isso é de 4 e 8 de largura no Bifrost.

Outros novos recursos arquitetônicos incluem o agendamento dinâmico de instruções gerenciado inteiramente em hardware e um novo conjunto de instruções que mantém a equivalência operacional do Bifrost. Outros incluem suporte para o formato de compressão AFBC1.3 da Arm, destinos de renderização FP16, renderização em camadas e saídas de sombreamento de vértice.

O Mali-G77 faz 33% mais matemática em paralelo que o G76.

As chaves para entender as principais mudanças arquiteturais são encontradas examinando a unidade de execução dentro do núcleo. Esta parte da GPU é responsável pelo processamento de números.

Dentro do mecanismo de execução

No Bifrost, cada núcleo de GPU continha três mecanismos de execução ou dois no caso de alguns projetos Mali-G52 de extremidade inferior. Cada mecanismo contém um i-cache, arquivo de registro e unidade de controle de distorção. No Mali-G72, cada mecanismo lida com 4 instruções por ciclo, que aumentaram para 8 no Mali-G76 do ano passado. A distribuição entre esses três núcleos permite instruções de 12 e 24 de ponto flutuante de 32 bits (FP32) fundido de multiplicar e acumular (FMA) por ciclo.

Com Valhall e o Mali-G77, há apenas um único mecanismo de execução dentro de cada núcleo de GPU. Como antes, esse mecanismo abriga a unidade de controle de warp, o register e o icache, que agora são compartilhados entre duas unidades de processamento. Cada unidade de processamento processa 16 instruções de distorção por ciclo, para um rendimento total de 32 instruções FP32 FMA por núcleo. Isso representa um aumento de 33% na taxa de transferência de instruções no Mali-G76.

A Arm passou de três para apenas uma unidade de execução por núcleo de GPU, mas agora existem duas unidades de processamento em um núcleo G77.

Além disso, cada uma dessas unidades de processamento contém dois novos blocos de funções matemáticas. A nova unidade de conversão (CVT) lida com instruções básicas de número inteiro, lógica, ramificação e conversão. A unidade de função especial (SFU) acelera a multiplicação inteira, divisões, raiz quadrada, logaritmos e outras funções inteiras complexas.

A unidade FMA padrão sofreu alguns ajustes, suportando 16 instruções FP32 por ciclo, 32 instruções FP16 ou 64 pontos do produto INT8. Essas otimizações produzem 60% de aumento no desempenho em aplicativos de aprendizado de máquina.

O mapeador de textura Quad

A outra mudança importante no Mali-G77 é a introdução de um mapeador de texturas quad, acima de um mapeador de texturas duplo na geração anterior. O mapeador de texturas é responsável por mapear os polígonos 3D em uma cena na representação 2D que você vê na tela. Ele é responsável pela amostragem, interpolação e filtragem para suavizar o conteúdo angular e em movimento para evitar arestas duras e de baixa qualidade.

O anti-aliasing de baixo custo permanece em vigor para ajudar na qualidade da imagem, mas a duplicação do desempenho da textura é o principal benefício aqui. A unidade de textura agora processa 4 texels bilineares por relógio em comparação com 2 anteriormente, 2 texteis trilineares por relógio e processa a filtragem mais rápida dos FP16 e FP32.

O mapeador de textura quad é dividido em dois caminhos, fornecendo um pipeline mais curto para threads que atingem o conteúdo no cache. O caminho de falha, que lida com conversão de formato e descompressão de textura, apresenta uma interface mais ampla para o cache L2. Isso também é útil para cargas de trabalho de aprendizado de máquina que frequentemente precisam extrair novos dados da memória.

Reunindo tudo no Mali-G77

Arm fez vários outros ajustes no Mali-G77 para coincidir com as principais mudanças na arquitetura do Valhall. O bloco de controle é simplificado graças ao design da unidade de execução única, enquanto o planejador dinâmico interno permite realmente uma emissão de instruções mais flexível dentro de cada núcleo. Com uma taxa de transferência mais alta em cada núcleo, o caminho de dados também é mais curto e mais baixo em latência, chegando a apenas 4 ciclos de 8 anteriormente.

O novo design também está melhor alinhado com a API Vulkan, simplificando os descritores do driver para reduzir a sobrecarga do driver para melhorar o desempenho "ao metal".

Em resumo, o Mali-G72 e Valhall fazem mudanças importantes em relação ao Bifrost, que prometem aumentos significativos de desempenho para aplicativos de jogos e aprendizado de máquina. É importante ressaltar que o design se encaixa nos mesmos orçamentos de energia e área que o Bifrost, garantindo que os dispositivos móveis possam oferecer mais desempenho de pico sem se preocupar com os custos de calor, energia e silício. Com base nas projeções de desempenho, o Mali-G77 deve dar ao Adreno da próxima geração da Qualcomm uma boa corrida pelo seu dinheiro.

O Garmin Forerunner 935 é uma opção fantática para corredore, nadadore, ciclita e triatleta. Ele fornece dinâmica avançada para ajudá-lo a melhorar ua execuç...

Quando penamo no aplicativo de navegação, normalmente penamo no Google Map. É o que a maioria da peoa recomenda. Também acontece para obter atualizaçõe frequente. O Goog...

Selecione Administração