八核真比四核好嗎 手機GPU指標參數(shù)詳解

作者: 郭自侗  2014-04-14 10:37 [查查吧]:m.uabf.cn

  八核真比四核好嗎?

  現(xiàn)在市面上智能手機都已走進雙核四核八核時代,多核手機處理器,這通常指移動處理器的多核CPU,其中包括異步多核(aSMP)和同步多核(SMP)兩種結(jié)構(gòu)。八核手機深刻影響整個移動終端的產(chǎn)業(yè)鏈,它改變的不僅僅是手機,包括整個智能生活圈。

  下面,我們就來看看手機GPU指標參數(shù)詳解。

  高級圖形處理器在進行推廣時通常比較多個低級別性能指標。例如,Imagination PowerVR GPU比較常用的比較指標為GFLOPS (測量計算吞吐量) ,每秒三角形生成數(shù)量(測量幾何吞吐量),每秒像素數(shù)填充和每秒紋理數(shù)(測量填充率) 。

  除了這些較為傳統(tǒng)的指標,企業(yè)開始按照產(chǎn)品中所包含的內(nèi)核數(shù)量來說明架構(gòu)已經(jīng)較為常見。盡管按照既定狀況來說,內(nèi)核數(shù)量的含義已經(jīng)被GPU市場曲解。也就是說,這個詞語具有延展性,經(jīng)過一段時間這個詞語在反映常見功能方面已經(jīng)有所更新。我來說明內(nèi)核數(shù)量的常見意義。

  什么是內(nèi)核?

  這要依據(jù)實際情況而定。內(nèi)核數(shù)量的意義在以前是表示處理器前端的數(shù)量。內(nèi)核并不復雜,前端的作用是調(diào)度執(zhí)行線程。幾乎所有高級GPU都已經(jīng)簡化設(shè)計,在計算資源前端設(shè)置多個調(diào)度器和相關(guān)調(diào)度邏輯,執(zhí)行預訂的任務。

  每個調(diào)度器跟蹤數(shù)個需要執(zhí)行的線程,在單個時鐘周期中運行單個程序的單一指令。單個指令指標的作用是在一組算資源上運行程序,不考慮線程數(shù)量或者計算資源的共享方式,這是內(nèi)核的通常定義。

  但是,我們也用這個內(nèi)核來說明Series5 SGX GPU的整個狀況。例如在SGX544MP3中,共有SGX544MP3的3個完整例程—可以復用所有GPU資源,我們稱之為MP3配置,或者叫3核 GPU。

  多核的誤區(qū)

  因此,隨著高級移動系統(tǒng)中CPU內(nèi)核數(shù)量迅速增加, GPU廠商要表達的信息是GPU也是多核設(shè)計,我們的許多競爭對手將獨立的ALU流水線視作內(nèi)核以強調(diào)其優(yōu)勢。但這些ALU流水線不能實現(xiàn)完全獨立的相互 調(diào)度,這些流水線與SIMD模式中的流水線一樣每個時鐘周期運行同一指令。并未出現(xiàn)我們所指的獨立前端或獨立指令指針,但盡管如此市場依然稱其為一個內(nèi)核。

  我們按照同樣的方式從基本的構(gòu)建模塊---統(tǒng)一著色器集群(Unified Shading Cluster,USC)到獨立流水線來說明PowerVR Rogue,來看一下如何計算內(nèi)核數(shù)量。

  PowerVR Rogue USC

  Rogue的架構(gòu)是由多個模塊構(gòu)建而成,這些模塊稱為統(tǒng)一著色器集群,簡稱USC。我們擴展這個架構(gòu)來滿足客戶對GPU的需求,以支持系統(tǒng)級芯片及專門的細分市場,我們將數(shù)個USC以及其他相關(guān)資源連接在一起后集成在整個GPU IP上。

  打開USC,您會發(fā)現(xiàn)用于分析數(shù)據(jù)并得出結(jié)果的是數(shù)個ALU流水線。我們并行設(shè)置這些流水線,每個USC設(shè)置16個流水線。這樣設(shè)置的原因是, 圖像 呈并行處理,其中多個相關(guān)的數(shù)據(jù),通常是矢量或像素同時運行。事實上,高級像素著色的屬性驅(qū)動相關(guān)像素是并行的,因此有必要同時運行這些高級像素。

  標量SIMD執(zhí)行和矢量低效

  USC的關(guān)鍵屬性是按照標量模式處理數(shù)據(jù)。也就是說對于給定的工作項目,例如一個象素,USC不是在同一時鐘周期內(nèi)的同一獨立管道上同時執(zhí)行 紅、 綠、藍和透明度的矢量。相反, USC在一個時鐘周期內(nèi)執(zhí)行一個紅色組件,接下來執(zhí)行藍色組件,以此類推,直到執(zhí)行完所有組件。為實現(xiàn)矢量基準單位的峰值吞吐量,標量SIMD單元并行處 理多個工作項目。例如,每個時鐘周期內(nèi)處理一個像素的4-wide矢量的峰值吞吐量相當于4-wide 標量SIMD單元,可在每個時鐘周期內(nèi)處理四個像素。 ?

發(fā)表評論

熱門關(guān)注

醫(yī)療健康