Lossless compressie-algoritme en architectuur voor verminderde geheugenbandbreedtevereiste met verbeterde voorspelling op basis van het meervoudige DPCM Golomb-Rice-algoritme

Jun 19, 2024

Abstract

In een computeromgeving vereisen hogere resoluties over het algemeen meer geheugenbandbreedte, wat onvermijdelijk leidt tot meer energieverbruik.

Dit kan van cruciaal belang worden voor de algehele prestaties van mobiele apparaten en grafische processoreenheden met grotere hoeveelheden geheugentoegang en geheugenbandbreedte.

Er bestaat een nauwe relatie tussen omgeving en geheugen. De omgeving waarin mensen leven en werken zal de fysieke en mentale gezondheid en de ontwikkeling en prestatie van het geheugen beïnvloeden.

In de eerste plaats kan een goede omgeving de ontwikkeling van het denk- en waarnemingsvermogen van mensen bevorderen. De werk- en leeromgeving moet stil, opgeruimd, warm en comfortabel zijn om de aandacht en concentratie van mensen effectief te verbeteren, waardoor het gemakkelijker wordt voor mensen om zich te concentreren op denken en herinneren. Als de omgeving luidruchtig, chaotisch of druk is, raakt het menselijk brein verstoord, wat het effect van leren en geheugen beïnvloedt.

Ten tweede kan een positieve omgeving de vorming van een positieve mentaliteit en positieve emoties bevorderen. Een positieve mentale toestand zal het bewustzijn en de cognitie van mensen effectief verbeteren, en de creativiteit en het geheugen van mensen verbeteren. Integendeel, een negatieve en deprimerende omgeving zal ervoor zorgen dat mensen positieve emoties en zelfvertrouwen verliezen, waardoor de geheugenfunctie van mensen wordt aangetast.

Ten slotte kan een veilige en gezonde omgeving de gezondheid van het lichaam en de hersenen van mensen garanderen, waardoor het geheugen effectief wordt verbeterd. Lichaam en geest moeten voldoende rust en beweging krijgen om de energie en ondersteuning van de geheugenfunctie beter te kunnen leveren. Tegelijkertijd zullen vervuiling en gifstoffen in het milieu rechtstreeks van invloed zijn op de fysieke en hersengezondheid van mensen en de achteruitgang van het geheugen versnellen.

Kortom: een goede omgeving is voor ons een belangrijke voorwaarde om ons geheugen te ontwikkelen. Een aangepaste leer- en werkomgeving, een positieve en gezonde mentaliteit en emoties, en een gezonde en veilige leefomgeving kunnen de ontwikkeling en verbetering van het geheugen van mensen actief bevorderen. Het is duidelijk dat we het geheugen moeten verbeteren, en Cistanche kan het geheugen aanzienlijk verbeteren omdat Cistanche ook de balans van neurotransmitters kan reguleren, zoals het verhogen van de niveaus van acetylcholine en groeifactoren, die erg belangrijk zijn voor het geheugen en het leren. Bovendien kan Cistanche ook de bloedstroom verbeteren en de zuurstoftoevoer bevorderen, wat ervoor kan zorgen dat de hersenen voldoende voeding en energie krijgen, waardoor de vitaliteit en het uithoudingsvermogen van de hersenen worden verbeterd.

increase brain power

Klik op manieren kennen om de hersenfunctie te verbeteren

Dit artikel stelt een verliesvrij compressie-algoritme voor met een meervoudige differentiële pulscodemodulatie variabele tekencode Golomb-Rice om de vereiste geheugenbandbreedte te verminderen. De efficiëntie van de voorgestelde meervoudige differentiële pulscodemodulatie wordt verbeterd door het selecteren van de optimale differentiële pulscodemodulatiemodus.

De experimentele resultaten laten een compressieverhouding van 1,99 zien voor zeer efficiënte videocoderingsbeeldsequenties en dat de voorgestelde verliesvrije compressiehardware de vereiste busbandbreedte kan verminderen.

Trefwoorden: verliesloze beeldcompressie, hardware-architectuur, reductie van geheugenbandbreedte.

1 Inleiding

Naarmate de resolutie van de nieuwste mobiele apparaten en grafische processoreenheden (GPU's) snel toeneemt, neemt ook de geheugenbandbreedte die nodig is om toegang te krijgen tot de afbeeldingen die zijn opgeslagen in de framebuffer toe.

Deze grotere hoeveelheid geheugentoegang beïnvloedt de algehele prestaties en het energieverbruik [1, 2, 9–11], evenals het gebruik van de geheugenbandbreedte [3, 12]. Voor dit doel zouden verliesloze framebuffercompressie en geheugenbandbreedtereductiemethoden effectieve manieren kunnen zijn om een ​​krachtige bus als IP uit te rusten.

Voor dit doel zijn veel onderzoeken uitgevoerd [4–6]; het losslesscompressie-algoritme met differentiële pulscodemodulatieGolomb-Rice-codering (DDPCM-GR), het verliesloze beeldcompressie-algoritme met hoge doorvoer met differentiële pulscodemodulatie variabele signcode GR-codering (DPCM-VSC GR), en het hercompressie-algoritme met meerdere DPCM-modusgemiddelden semi-vaste lengtecodering (MDA-SFL) werd respectievelijk voorgesteld in [4, 5] en [6].

Dit artikel stelt een verliesvrij compressie-algoritme voor met een meervoudige DPCM (MDPCM) variabele tekencode GR om de vereiste geheugenbandbreedte te verminderen. Het algoritme gebruikt MDPCM voor voorspelling en variabele signcode (VSC) GR voor entropiecodering [5]. De structuur van het artikel is als volgt. Hoofdstuk 2 geeft een overzicht van eerdere onderzoeken met betrekking tot het onderwerp van dit werk.

Sectie 3 introduceert het voorgestelde MDPCM-GR-algoritme. Hoofdstuk 4 presenteert de voorgestelde hardwarearchitectuur zonder verlies van compressie. Hoofdstuk 5 presenteert de voorgestelde resultaten van de verificatie van algoritmen en hardwareprestaties. De conclusie wordt gegeven in hoofdstuk 6.

2 Achtergrond

In deze sectie bespreken we werken die verband houden met ons voorgestelde algoritme en hardware-architectuur. Alle opgenomen onderzoeken suggereren dat ze de prestaties hebben verbeterd op basis van het DPCM-algoritme.

2.1 DPCM-algoritme

DPCM [7] is een algemeen toegepast algoritme voor omkeerbare datacompressie. Het bestaat uit de voorspellingsfase en entropiecodering van voorspellingsfoutresultaten. De grootte van de gegevens van de invoerpixels kan worden verminderd met behulp van de ruimtelijke lokaliteitskenmerken van het beeld.

DDPCM [8] is het door ATI voorgestelde algoritme om de grootte van Z-gegevens in 3D-afbeeldingen te verkleinen door de DPCM te verbeteren. Het DDPCM-algoritme berekent de differentiële waarden voor de x-as- en y-asrichtingen op basis van de resultaten van het DPCM-algoritme.

improve your memory

2.2 DDPCM-GR

DDPCM-GR [4] is het verliesvrije compressie-algoritme dat DDPCM uitvoert als voorspellingsfunctie en GR-codering voor entropiecodering forfixed-k, waarbij k 2 is. Voor het verwerkingsblok in het originele beeld wordt DDPCCM toegepast.

Voor de foutgegevens van DDPCM wordt GR-codering uitgevoerd. GR-codering is een entropiecoderingsmethode die unaire codering toepast in quotiënt q, waarbij invoerwaarde N wordt gedeeld door parameter M, en de restr wordt opgeslagen als binaire gegevens.

2.3 DPCM-VSC GR

DPCM-VSC GR [5] is het compressie-algoritme met hoge doorvoer dat DPCM uitvoert als voorspellingsfunctie en VSC GR-codering voor entropiecodering. Voor het verwerkingsblok in het originele beeld wordt 2D DPCM toegepast.

De quotiëntwaarde wordt berekend door de resulterende waarde van DPCM te delen door de waarde $ 2 ∧ k $, waarbij k=0, 1, 2, 3. VSC-waarden en unaire codewaarden worden verkregen door GR-codering en VSC uit te voeren.

De lengtes van de gecomprimeerde gegevens en het originele blok worden vergeleken nadat alle fasen zijn voltooid. Als de lengte van de gecomprimeerde gegevens kleiner is dan de lengte van het originele blok, worden gecomprimeerde gegevens gegenereerd door alle gerelateerde gegevens in te pakken.

De gerelateerde gegevens bestaan ​​uit de K-waarde, de DPCM-moduswaarde, de eerste-factorwaarde, de resterende waarde, de unaire gegevenswaarde en de variabele gegevens voor een teken. Als het oorspronkelijke blok langer is dan de gecomprimeerde gegevens, worden de gecomprimeerde gegevens niet gebruikt en blijft het oorspronkelijke blok behouden.

3 Voorgesteld verliesvrij compressiealgoritme

In deze sectie wordt de uitvoeringsstroom geïntroduceerd van het voorgestelde algoritme met meerdere DPCMGR (MDPCM-GR) voor compressie en decompressie.

3.1 Algemeen proces van het voorgestelde compressie- en decompressie-algoritme

Het voorgestelde MDPCM-GR-algoritme bestaat uit een compressor die de originele gegevens comprimeert en een decompressor die de gecomprimeerde gegevens herstelt. Het compressieproces verloopt als volgt.

Eerst wordt MDPCM uitgevoerd op basis van de originele blokgegevens, waarna de DPCM-modus met de laagste kosten wordt geselecteerd uit de berekende DPCM-kosten. Ten slotte wordt VSC GR [5]-codering uitgevoerd op de foutwaarden van MDPCM. Decompressie volgt het omgekeerde proces van compressie. Figuur 1 toont diagrammen van deze processen.

3.2 Meerdere DPCM-algoritmen

Het voorgestelde MDPCM-algoritme kan een DPCM-modus selecteren met minimale kosten door vier verschillende directionele DPCM's uit te voeren; zoals horizontale en verticale DPCM en DDPCM.

boost memory

De voorgestelde MDPCM maakt gebruik van verticale en horizontale DDPCM, die worden uitgevoerd op basis van respectievelijk verticale en horizontale DPCM. Bij het uitvoeren van DDPCM wordt de optimale voorspellingsfunctie geselecteerd als het resultaat van de voorspellingsfunctie, en worden de entropiecoderingskosten voor het resultaat van de voorspellingsfunctie berekend op basis van de som van de absolute waarden van de DPCM-resultaten.

De voordelen van de voorgestelde MDPCM zijn als volgt. Ten eerste, omdat de DPCM en DDPCM zowel horizontaal als verticaal worden toegepast, wordt dit voorspeld voor beelden met zowel horizontale als verticale ruimtelijke locaties.

Ten tweede, omdat de DDPCM, die een extra DPCM uitvoert, wordt toegepast op het voorgestelde algoritme, wordt deze voorspeld voor het beeld met een snel pixelverschil. Ten slotte bedraagt ​​de overhead voor het toepassen van MDPCM slechts 2 bits, wat erg laag is.

4 Voorgestelde hardware-architectuur voor verliesloze compressie

In deze sectie wordt de voorgestelde verliesvrije hardwarearchitectuur voor compressie geïntroduceerd en wordt elke module van de configuratie en de operationele stroom gedetailleerd beschreven.

4.1 Algemene hardwarearchitectuur van de voorgestelde LosslessCompression

Zoals weergegeven in figuur 2 bestaat de voorgestelde verliesvrije hardware-architectuur voor compressie uit de volgende eenheden: een MDPCM-eenheid voor MDPCM-uitvoering; een tekenomzettereenheid voor het omzetten van een negatieve waarde van de DPCM-resultaten in een positieve waarde; een gegevensverpakkingseenheid voor het verpakken van gecomprimeerde gegevens; parallelVSC-coderingseenheid; een K-splittereenheid; een kostenberekeningseenheid voor het resultaat van het delen van K-waarden; en een parallelle GR-encodereenheid voor parallelle GR-codering.

10 ways to improve memory

4.2 Algemene hardwarearchitectuur van de voorgestelde verliesloze decompressie

Figuur 3 toont de algehele voorgestelde hardwarearchitectuur voor verliesloze decompressie, die uit de volgende eenheden bestaat: een parallelle InvMDPCM-eenheid voor het uitvoeren van parallelle inverse MDPCM; een tekenomzettereenheid voor tekenconversie via tekengegevens en magnitudegegevens; een parallelle GR-decodereenheid voor parallelle GR-decodering; een nuldetectoreenheid om te controleren of de DPCMerror-waarde 0 is; een parallelle VSC-decodeereenheid voor het parallel uitvoeren van VSC-decodering; een gegevensuitpakeenheid die de gecomprimeerde gegevens decomprimeert; en een variabele unaire/VSC-splittereenheid die VSC- en unaire gegevens splitst. De hardware van de voorgestelde verliesvrije decompressie wordt als volgt uitgevoerd.

Om de gecomprimeerde gegevens te decomprimeren, pakt de gegevensuitpakeenheid eerst de invoergegevens uit. De niet-gesplitste unaire VSC-gegevens die worden ontvangen van de uitpakeenheid worden gesplitst in unaire gegevens en VSC-gegevens in de unaire VSC-splitseenheid.

De gesplitste unaire data worden verzonden naar de parallelle GR-decodereenheid en de nuldetectoreenheid, terwijl gesplitste VSC-data worden verzonden naar de parallelle VSC-decodereenheid.

De nuldetectoreenheid controleert of de DPCM-foutwaarde nul is, gebaseerd op de unaire gegevens en de restgegevens. Het nuldetectieresultaat wordt geleverd aan het parallelle VSC-decodeerapparaat, dat de ondertekende gegevens reconstrueert via het ontvangen nuldetectieresultaat en de VSC decodeert. De unaire gegevens worden parallel gedecodeerd door de parallelle GR-decodereenheid om de quotiëntgegevens te herstellen.

De magnitudegegevens worden hersteld op basis van de opgeslagen quotiëntgegevens en de restgegevens. Wanneer de teken- en magnitudegegevens zijn hersteld, reconstrueert de tekenomzettereenheid de DPCM-foutwaarde. Ten slotte werkt de parallelle InvMDPCM-eenheid parallel aan de DPCM-modus op basis van kiem- en DPCM-foutwaarden om de pixelgegevens te reconstrueren.

short term memory how to improve

5 experimentele resultaten

In deze sectie worden de simulatieresultaten van het voorgestelde algoritme en de hardwarearchitectuur samengevat. De prestaties worden gemeten aan de hand van de compressiesnelheid van het algoritme en de busbandbreedte in de hardwarestructuur.

5.1 Compressieverhouding

In dit artikel meten we de compressieverhouding (CR) van gecomprimeerde afbeeldingen om de efficiëntie van het verliesvrije compressie-algoritme te verifiëren. CR verwijst naar de gecomprimeerde afbeeldingsgrootte per originele afbeeldingsgrootte en hoe hoger de CR, hoe efficiënter het compressie-algoritme is. De vergelijking voor de CR is als volgt.

CR =Originele afbeeldingsgrootteGecomprimeerde afbeeldingsgrootte(3)

improving brain function

Zeven beeldreeksen in klasse A en B van benchmarks voor hoogefficiënte videocodering (HEVC) werden gebruikt om CR-metingen te verkrijgen in het voorgestelde verliesvrije compressie-algoritme en hardware-architectuur.

Het voorgestelde verliesvrije compressie-algoritme werd vergeleken met de algoritmen ontwikkeld in [4, 5] en [6]. Tabel 1 toont de gemiddelde CR van het voorgestelde algoritme en van [4, 5] en [6] voor alle frames van de HEVC-beeldreeksen .

De experimentele resultaten voor de HEVC-beeldreeksen laten zien dat de gemiddelde CR-waarden respectievelijk 1,99, 1,63, 1,92 en 1,91 zijn voor het voorgestelde verliesvrije compressie-algoritme [4, 5] en [6].

Het voorgestelde verliesvrije compressiealgoritme bereikt een hogere CR in alle HEVC-beeldreeksen dan de andere algoritmen. Het voorgestelde MDPCM-algoritme heeft een 2-bit overheadvereiste om informatie over de DPCM-modus op te slaan. Zoals blijkt uit de experimentele resultaten van Tabel 1 is het duidelijk dat de verhoogde compressiesnelheid van de voorspellingsfunctieresultaten van het voorgestelde MDPCM-algoritme voldoende is om aan de overheadvereiste te voldoen.

ways to improve memory

5.2 Prestatieanalyse voor busbandbreedte

De CR van het voorgestelde compressiealgoritme kan worden beperkt door de busbandbreedte, omdat de gegevens die via de bus worden verzonden, op één lijn moeten worden gebracht met de breedte ervan. Daarom kunnen de via de bus verzonden gegevens de CR verliezen met evenveel bandbreedte als de uitgelijnde gegevens.

Om dit te analyseren hebben we de werkelijke gemiddelde CR van de verkeerssituatie gemeten met vijf verschillende busbandbreedtes van 8, 16, 32, 64 en 128 bits. Figuur 4 toont de experimentele resultaten van de daadwerkelijke CR's daarop.

Hier is de feitelijkeCR beperkt tot een busbreedte van 128-bit, de meest gebruikelijke bandbreedte. De feitelijke CR op de 8-bit-busbreedte is echter vergelijkbaar met het ideale geval van de 1-bitone, wat betekent dat de prestaties van de voorgestelde verliesvrije compressiehardware goed zijn op de 8-bit bandbreedte van de bus. Bijgevolg kan de voorgestelde verliesvrije compressiehardware de busbandbreedtevereisten verminderen.

memory enhancement

6 Conclusie

In dit artikel worden een verliesvrij compressie-algoritme en hardware-architectuur voorgesteld om de vereisten voor geheugenbandbreedte te verminderen. De voorgestelde hardwarearchitectuur heeft een hoge verwerkingssnelheid omdat de compressie- en decompressiestappen parallel kunnen worden uitgevoerd.

Bovendien werd een hoge CR bereikt door de voorspellingsfunctie van het bestaande algoritme te verbeteren. De voorspellingsfunctie heeft ook verbeterde prestaties, wat de voordelen van zowel DPCM als DDPCM weerspiegelt. We gebruikten de HEVC-beeldreeks als benchmark om de prestaties van het voorgestelde algoritme en de hardwarearchitectuur te verifiëren.

Als resultaat van het experiment bereikten we een gemiddelde CR van 1,99 in de klassen A en B van de HEVC-beeldreeks. Hierdoor werd geverifieerd dat de voorgestelde verliesloze compressiearchitectuur een hogere CR bereikte dan de vergelijkingsalgoritmen. Omdat het algoritme van dit onderzoek een hoge CR bereikt, kan de voorgestelde verliesvrije compressiehardware bovendien de busbandbreedtevereisten verminderen.

De voorgestelde verliesvrije compressiehardware is dus geschikt voor toepassingen die een hoge geheugenbandbreedte en geheugentoegang vereisen, zoals GPU's en videoprocessors met hoge resolutie.

Erkenning

Dit onderzoek werd gedeeltelijk ondersteund door het MOTIE (Ministerie van Handel, Industrie en Energie) (10080568, Ontwikkeling van de Embedded GP-GPU voor op Deep Learning gebaseerde Circumstances Recognition) en KSRC (KoreaSemiconductor Research Consortium) ondersteuningsprogramma voor de ontwikkeling van het toekomstige halfgeleiderapparaat . De EDA-tool werd ondersteund door het ICDesign Education Center (IDEC), Korea.

supplements to boost memory


Referenties

[1] D. Burger, JR Goodman, A. Kagi, 'Beperkte bandbreedte om het processorontwerp te beïnvloeden', IEEE Micro, vol. 17, nee. 6, blz. 55-62, november 1997.

[2] H. David, E. Gorbatov, UR Hanebutte, R. Khanna, C. Le, 'RAPL: memory power estimation and capping', In 2010 ACM/IEEE International Symposium on Low-Power Electronics and Design (ISLPED), blz. 189–194, augustus 2010.

[3] ARM Mali GPU OpenGL ES Application Optimization Guide, beschikbaar op.https://developer.arm.com/docs/dui0555/b/optimization-checklist/the-checklist/reduce-memory-bandwidth-usage

[4] H.-S. Kim, J.-H. Lee, H.-J. Kim, S.-H. Kang, W.-C. Park, 'Een architectuur voor compressie van kleuren zonder verlies met behulp van een parallelle Golomb-Rice-hardwarecodec', IEEE Transactions on Circuits and Systems for VideoTechnology, vol. 21, nee. 11, blz. 1581–1587, november 2011.

[5] J. Lee, J. Yun, J. Lee, I. Hwang, D. Hong, Y. Kim, CG Kim, W.-C. Park, 'Een effectief algoritme en architectuur voor de verliesloze compressie met hoge doorvoer van afbeeldingen met hoge resolutie', IEEEAccess, Vol. 7, nummer 1, blz. 138803–138815. september 2019.

[6] L. Guo, D. Zhou, S. Goto, 'Een nieuw referentieframe-recompressiealgoritme en zijn VLSI-architectuur voor UHD TV-videocodec', IEEETransactions on Multimedia, vol. 16, blz. 2323–2332, december 2014.

[7] AD Mitra, PK Srimani, 'Differentiële pulscodemodulatie', Int. J.Elektron., vol. 46, blz. 633-637, juni 1972.

[8] S. Morein, 'ATI Radeon hypertechnologie', In Proceedings of theGraphics Hardware, 2000.

[9] D. Silveira, G. Povala, L. Amaral, B. Zatt, L. Agostini, M. Proto, 'Efficiënt referentieframecompressieschema voor videocoderingssysteem: algoritme en VLSI-ontwerp', Journal of Real-Time Image Verwerking 16,pp. 391–411, 2019.

[10] Yu-Hsuan Lee, Tzu-Chieh Chen, Hsuan-Chi Liang, Jian-Xiang Liao, 'Algoritme en architectuurontwerp van FAST-C Image Corner DetectionEngine', Very Large Scale Integration (VLSI) systeem IEEE Transactionon, vol. 29, nee. 4, blz. 788–799, 2021.

[11] Sungchul Yoon, Sungho Jun, Yongkwon Cho, Kilwhan Lee, HyukjaeJang, Tae Hee Han, 'Geoptimaliseerde verliesloze ingebedde compressie voor mobiele multimediatoepassingen', Electronics, vol. 9, blz. 868, 2020.

[12] Yu-Hsuan Lee, Cheng-Hung Kuei, Yue-Zhan Kao, Shih-Song Fan Jiang, 'Algorithm and VLSI Architecture Designs of A Lossless Embedded Compression Encoder for HD Video Coding Systems', Journal ofCircuits, Systems, and Computers , 2020.


For more information:1950477648nn@gmail.com


Misschien vind je dit ook leuk