Qualcomm nian DSP Hexagon, no agora, NPU – Xip no Quezu

Photo of author

By naroman

Telemóvel sira tenki trata komunikasaun no prosesamentu áudio-visual ho maximiza vida batería. Processador Sinal Digítal, ka DSP, uza hardware espesifiku atu halo karregamentu tarefas sira ne’e husi CPU, ne’ebé reduz konsumu enerjia. Husi apresentasaun Qualcomm nian kona-ba Snapdragon 800, hamosu evolusaun Hexagon nian. Rekorda bloku boot L2/TCM SRAM ne’ebé boot iha Qualcomm Hexagon. Qualcomm Hexagon iha istória naruk hodi trata prosesamentu sinal iha produtu Snapdragon nian. Atu rezolve aplikasaun aprendizajen mákina ne’ebé sa’e ona, Qualcomm adisiona kapasidade multiplikasaun matriz ba Hexagon. Ami agradese ba Qualcomm tanba hala’o apresentasaun Hot Chips ne’ebé di’ak liu kona-ba Hexagon. Apresentasaun ne’e la detalla espesifika arkitetura, tanba ne’e ami sei komplementa ho dokumentasaun públiku, asumindo katak detallus ne’ebé falta iha apresentasaun hala’o laiha mudansa. Hexagon nivel altu ne’e processador palavra instrusaun (VLIW) ho ordem, ho kapasidade espesializadu hodi trata prosesamentu sinal. Uza SMT atu aproveita paralelismu nivel fio ho fó la’ós latensia. Hexagon uza modelu co-prosessor ba sira nia unidade vektor no tensor, no fornese produtividade ne’ebé masivu iha kada kllok. Esketu Hexagon nia kontestu uza kuaduwayu SMT, DSP Qualcomm nian halo tuir iha dala barak ho GPU ho 12/16 fio per SMSP/SIMD, no CPU ne’ebé la’ós normalmente uza 2-way SMT. Fio Hexagon nian hotu hetan kontestu eskalar hanesan moris, maibé tenki husu aksesu atu uza co-prosesador fio ka tensor. Pré-diksaun Frekuentemente, pré-diksaun bazeia ba CPU sira ne’ebé boot. Maibé, Qualcomm deside implementa pré-diksaun ba Hexagon, nu’udar evidénsia husi eventu monitorizasaun desempenyu ba BTB no kalkulasaun retornu stack. Deskrisaun eventu sugere katak maioria pré-diksaun bele halo iha latensia rua nain, no klaru la’o iha latensia tolu. Iha kazu latensia tolu, BTB provavelmente la iha alvu katuan ba ramu, no dekodór halo kalkulasaun ba destinasaun. Se sim, kaché instrusaun nian sei iha latensia tolu. Eventu monitorizasaun balun husi v73 PRM Pré-diksaun direksaun provavelmente utiliza kalkuladora bimodal simples, ho mekanizmu ne’ebé simila ho Pentium orijinal. Pré-diksaun simples tanba koneha, hatudu katak Hexagon bele hala’o di’ak tanpa presiza depende paralelismu nivel fio. Buska no Dekodifika Hodi hetan alvu endereçu husi pré-diksaun, Hexagon buska lote VLIW 128-bit husi kaché instrusaun. Qualcomm la klarifika boot kaché instrusaun Hexagon nian nia dahuluk, maibé edisaun ohin ne’ebé boot iha boot 16 KB. Ha’u la surprende se Hexagon mantein kaché instrusaun ida-ne’e tanba aplikasaun sira ne’ebé limita tenki iha instrusaun ki’ik. Husi Hexagon V73 Programmer’s Reference Manual Kada lote VLIW iha to’o instrusaun haat, ne’ebé halo ha’u la hatene tanba ne’e naran “Hexagon” hili. “Qualcomm Quadrilateral” maka naran ne’ebé bele hili, no hanesan di’ak liu. Lote VLIW permite eksekusaun superscalar ho hardware simples. Dekodór baratu tanba posisaun VLIW espesífiku nian de’it iha parte instrusaun sira. Hardware rezolusaun hazard nian read-after-write no write-after-write la presiza, tanba instrusaun sira ida-idak iha lote VLIW tenki independente, no la’ós bele halo tulun ba rejistu destinos. Logika seleksaun tubu eksekusaun liu hosi lote VLIW, tanba kada posisaun lote VLIW korresponde ho tubu eksekusaun ida. Depois de instrusaun sira hetan husi buska no dekodifika, sira hato’o ba unidade, ka co-prosessor, ne’ebé hakarak hala’o. Eskalar Inteiru Eksekusaun Hexagon iha unidade eskalar 32-bit ho rejistu 32 iha kontestu fio ida. Ne’ebé la’ós hanesan unidade eskalar iha AMD nia GCN ka RDNA, ne’ebé liu-liu halo kargamentu operasaun fluxu kontrolu no jenerasaun endereçu husi unidade vektor, unidade eskalar Hexagon nian di’ak tebes no bele trata tarefa DSP legeru liu. Nia bele kompletu instrusaun haat liu tiha ona, liu husi VLIW paketizasaun, no kada instrusaun bele reprezenta servisu ida ne’ebé barak. Iha instrusaun espesializadu ba soma diferensia absolutu (SAD), maniplulasaun bitfield, no kódigu binariu aritmétika adaptativa (CABAC) ba H.264 decode. Unidade “eskalar” bele halo mós operasaun vektor. Elementu byte ka metade (16-bit) bele paketiza iha rejistu 32-bit. Rejistu 32-bit adjasente bele trate hanesan rejistu 64-bit, permiti operasaun hanesan rejistu ne’ebé nia largura vektor boot, inklui 2 x 32-bit. Ne’ebé tuir filaun eskalar nian bele trata mós operasaun númeru ho puntu fixu. Hanesan Intel nia MMX, maibé rejistu vektor sira ne’e bele usa mós hanesan rejistu propósitu jerál. Registu kontrolu espesializadu fó suporta ba loke hardware, maibé hardware loke mós bele halo pré-diksaun kontra se loops ki’ik tebes. Hardware loke no halo halo buffer ajuda melhora densidade instrusaun no uzu rekursu rejistu. Hamutuk loop to’o no rejistu konta ne’ebé hamosu kada uma fornece suporta ba hardware loke, liberta rejistu propósitu jerál atu taka dadus seluk. Hardware loke bele ajuda pré-diksaun branch, maibé bele mos halo pré-diksaun erruhoop ho loops ki’ik ho numeru iterasaun rua ka menus. Buffernian halo pré-diksaun hardware mós hetan suporta. Kada registo CS0 no CS1 guarda baze buffer, no komprimentu buffer iha registo M0 ka M1. Entaun programa bele uza buffer sirkular ho la halo verifikasaun limitasaun ba kada inkrementu ponteiru. Registu “ponteiru global” espesial bele uza ho modu ponteiru global relativa, ajuda asesu ba dadus global ka estátiku. Mekanismus sira ne’e bele redús pressaun ba rekursu rejistu. Aksesu memoria iha parte eskalar atende husi kaché L1 ne’ebé la klarifika boot rezultadu, maibé Hexagon uza ona L1D 32 KB iha pasadu. Unidade loke/guarda rezolve kazu espesial sira hanesan dependénsia memoria, travessa página, enxe kaché armazena, no konflitu banku kaché liu husi replai. L1 iha falta atende husi kaché L2. Novamente, Qualcomm la fo informasaun kona-ba kaché nia dahuluk, maibé Hexagon DSP Snapdragon 820 uza L2 512 KB. Snapdragon 800 ohin uza L21 256 KB, entaun DSP sira nian ohin bele uza L2 1 MB ka boot. v73 PRM refere ba L2 scoreboard ho 32 entrada, entaun kaché L2 bele atende pedidu 32 ne’ebé falta. Eksekusaun Vektor (HVX) Hexagon Vector Ekstensaun, ka HVX, fó potensia boot ba tarefa DSP ne’ebé barak. HVX fó 32 rejistu vektor 1024-bit no konjuntu tubu eksekusaun ne’ebé hanesan kompila ninia posisaun VLIW. DSP Hexagon boot iha kontestu vektor menus ne’ebé

Tetun Translator

FREE
VIEW