手機CPU雙核知多少?

來源:本站原創 專業IT吐槽 超過1,050 views圍觀 0條評論

四大主流雙核CPU全比拼

現今市面上究竟有多少款雙核心手機?拋開黑莓惠普這些國內見得少的牌子不說,單是Android一家,同一個時期內就有數十家廠商上百款產品充斥市面,頗有當年大煉鋼鐵趕英超美的氣勢。大家都號稱自己是雙核心手機,這就帶來了一個問題:究竟選哪個好呢?或者換個說法,都是“雙核心”,它們之間難道就真的沒有區別嗎?為了幫助大家更好的理解市面上雙核處理器的異同,以便作出自己的選擇,本文將從多個角度帶領大家對目前市場中的雙核產品做一次較為全面的了解。

參賽選手亮相

首先,讓我們來看看市面上有哪些雙核心手機處理器。

提到雙核,可能大家首先想到的就是nVIDIA的Tegra 2。作為業界新人,nVIDIA必須要有一些別人不具備的優勢,才能站穩腳跟,而nVIDIA選擇的優勢就是速度。Tegra 2是一款早在2010年1月就發布的雙核手機處理器,為nVIDIA賺足了眼球,甚至儼然成了雙核的代名詞。

clip_image001

Tegra 2是nVIDIA在ARM SoC領域的第二款作品,由于第一款Tegra表現并不好,nVIDIA很早就開始設計Tegra 2,最終成為了移動消費領域第一款量產型雙核ARM處理器,也正是靠這點,諸多廠家為了能趕在蘋果之前推出雙核產品,紛紛下單采購。因此大家便看到了今年年初MWC2011上雙核設備的密集發布。這些雙核機型成功從蘋果手里搶走了“業界首款雙核”的名頭,直接導致蘋果不得不在iPad2發布會上退而將A5稱為第一款量產的雙核處理器——盡管大家都知道,當iPad2發布的時候,搭載Tegra 2的手機和平板已經開賣多時了。

Tegra 2的CPU部分采用的是雙核ARM Cortex A9 MP,圖形芯片(GPU)則是NV自有的GeForce ULP。它由TSMC以40nm工藝制造,預設工作頻率為1GHz。相對于單核時代的Cortex A8而言,Cortex A9是ARM公司性能更強、功能更多,并且支持多核心配置的新核心。關于它的特性,在后面的文章中會詳細解釋,這里就先不詳述了。在Tegra 2上,nVIDIA為每一個核心配備了32KB+32KB的一級緩存,以及累計1MB的二級緩存,但是在內存子系統上最高只支持到DDR2 667或LPDDR2 600,而且僅支持單通道內存。當然,隨著現代手機對于多媒體功能,例如視頻回放的需求,Tegra 2也引入了諸多格式最大1080p分辨率的硬件視頻解碼能力。

在nVIDIA宣布雙核Tegra 2后僅僅一個月,另一家老牌半導體公司德州儀器也宣布了自己的OMAP4雙核心平臺,包含了OMAP4430、OMAP4460與2011年初發布的 OMAP4470三個型號。與Tegra 2相同,OMAP4也搭載了Cortex A9 MP架構的雙核心,緩存資料不詳,而GPU采用的則是PowerVR SGX540(不包括OMAP4470在內,下面的介紹僅指4430/4460)??赡苡行┳x者能看出,這顆GPU與單核時代的三星蜂鳥處理器是一樣的, 為此,德州儀器將這顆GPU的頻率提升了50%,達到了300MHz,希望借此提升性能以拉開與單核處理器的差距。

clip_image003

OMAP4系列均采用45nm工藝制造,OMAP4430設計頻率為1GHz,OMAP4460則設置為1.5GHz,因此可以認為前者是針對手機平臺設計的,而后者是針對平板機設計的。值得一提的是,與Tegra 2不同的是,OMAP4支持雙通道內存,內部具備兩個完全一樣的內存控制器,這點在后面的文章中也可以看到。至于內存規格,OMAP4430最高至支持 LPDDR2 1066,在頻率上也要比Tegra 2高了幾乎一倍。

另一家單核時代的主流供應商高通,則在2010年6月宣布了自家的雙核產品規劃,其中主頻高達1.2GHz的MSM8x60是最吸引眼球的。這是第一款針對手機,且設計頻率達到1.2GHz的 雙核處理器,但與之前兩家不同的是,高通在自家雙核處理器上并沒有采用類似于Cortex A9 MP的核心,而繼續采用了與其單核處理器類似的Scorpion內核。

clip_image004

MSM8x60的內存支持能力與OMAP4430處于同一水平既LPDDR2 1066,但是對于是否支持雙通道內存我們不得而知。GPU依然是高通自有的Adreno系列,當然型號升級到了更高級的Adreno220,高通號稱可 以提供前一代兩倍的性能。雖然高通不止一次提到自己將用28nm工藝生產ARM處理器,但MSM8x60采用的還是45nm工藝,一級緩存與Cortex A9一樣,但二級緩存卻只有512KB,比標準的Cortex A9 MP少了一半。多媒體支持級別與主流雙核一樣,也是1080p級別的視頻回放。

與這些廠家的積極表現不同,作為三巨頭之一三星在雙核方案上似乎顯得有些低調,一直到2010年9月才發布自家的雙核平臺,即大家熟知的代號獵戶座的雙核心處理器,量產型號為Exynos 4210。作為一款最晚發布的產品,獵戶座在規格上也是最高的,不僅CPU配備了設計頻率同樣高達1.2GHz的雙核Cortex A9 MP, GPU也使用了ARM自行設計的Mali400多核心GPU,而且不僅整合的是最高端的4核心設計,還大幅提高了工作頻率——三星官方宣稱獵戶座的3D填充率高達32億像素每秒,這個數字要遠遠超過競爭。

clip_image005

視頻解碼是三星的傳統優勢,在獵戶座身上這個優勢依然得到了保持,對各種格式的硬件編解碼都達到了1080p級別。至于內存,獵戶座提供了獨一無二的DDR3支持,這點是其它競爭對手所不具備的,而對于DDR2的支持也達到了最頂級的LPDDR2 1066,并且同樣支持雙通道。

為了方便對比,讓我們來列一個表格:

clip_image006

好,這些就是即將上陣的選手了。下面我們會依次考量它們在諸多方面的表現,看看究竟哪個雙核名副其實,哪個雙核浪得虛名。

較量項目一:處理器核心架構

作為執行計算任務的最終單位,處理器核心本身的架構無疑是非常重要的一部分。從ARM11到Cortex A8,同樣頻率下性能的提升可以達到 2~5倍,這無疑就是核心的優勢。在這四款雙核處理器中,Tegra 2、OMAP4430、Exynos 4210均采用了Cortex A9 MP內核,而MSM8x60采用的則是Scorpion MP核心,它們之間有什么差距?要解釋這個問題,我們先要回頭看看Cortex A8和Cortex A9的區別。

clip_image001[4]

在單核時代,Cortex A8架構是絕對的主流。作為ARM官方設計的產品,雖然Cortex A8和Cortex A9都基于ARM v7指令 集架構,但是它們之間依然有很多的不同點,其中最重要,也是用戶最能感覺到的,是一項叫做亂序執行的功能。雖然Cortex A8和Cortex A9都支持同時執行兩條指令,但是只有Cortex A9支持亂序執行能力,這個功能究竟是什么意思?

我們知道,計算機程序,都是由一條一條的指令組成的。這些指令有很多種功能,有的是把數據從一個地方復制到另一個地方,有的是做數學運算,有的負責判斷某一個條件,有的負責從一處跳轉到另一處。編譯器會把所程序員寫出的程序編譯成一條一條順序的指令,就像電器的使用指南一樣,讓處理器遵照它去做。為了方便理解,我們假設一個程序的內容是做一份考試卷,執行的過程是先做完選擇題,再做完問答題;做選擇題的條件是要有鉛筆去涂答題卡,而做問答題的條件則是要有鋼筆去寫答題紙。

clip_image002

如果你忘了帶鉛筆,那么為了完成考卷,就必須要等到鄰座的做完了選擇題,你找他借來鉛筆,才能繼續自己的考卷,這樣就耽誤了時間。對于一顆標準處理器而言,很多時候都會遇到這類“沒有帶鉛筆”的情況,比如需要訪問的數據在內存里,這就需要處理器通知內存管理器,讓內存管理器去把數據調入處理器,才能繼續執行這一條指令。由于處理器內部的時鐘延遲是納秒級別,而內存的運行頻率則有數十納秒的延遲,兩者之間差了許多倍,因此處理器一般需要消耗很長的等待時間,才能繼續開始工作,最終的結果就是性能下降。

這時候,亂序執行就派上用場了。一個程序的指令都是有嚴格的邏輯順序的,但是所謂的亂序執行,就可以打破這種原本的指令順序,在邏輯允許的范圍內以一種新的順序去執行程序。如果繼續用考試的例子,那就是這樣:

clip_image003[4]

雖然編譯器生成的考試指南告訴你,要先做完選擇題,再去做問答題,但懂得變通的人會在沒有鉛筆的時候先去做問答題,這樣就節省了大量的時間。支持亂序執行的處理器也懂得這樣去“變通”,在遇到需要等待的指令時,如果后面的指令并不需要等待這條指令的結果,那么就可以先跳過這條指令,去執行后面的指令,大大節約等待時間,提升程序性能。當然,亂序執行并不是沒有條件的,它要求被亂序的指令之間不存在嚴格的相關性。例如假設問答題里需要選擇題的結果,那么你就不能跳過選擇題去做問答題,只能老老實實去等鄰座的鉛筆了。

clip_image004[4]

亂序執行能有效節省時間

那么回頭來看看Scorpion核心。這個核心是高通在單核時代設計出來的,雖然也是基于ARM v7指令集架構,但在具體設計上屬于高通自己的實現,與Cortex A8相比有很多區別,其中最重要的就是高通為Scorpion核心引入了部分的亂序執行能力。所謂部分的,就是說在某些特定指令序列下,Scorpion可以實現亂序的效果,Cortex A8則不行。在單核時代正是由于這點,高通的處理器核心在很多測試中的表現都要稍好于Cortex A8,但是當雙核時代來臨后,大家都升級到了支持完整的亂序執行的Cortex A9核心,而高通則依然沿用老舊的Scorpion核心,當年的優勢就成為了現在的劣勢。

不僅如此,在純執行能力上,Scorpion面對Cortex A9也處于劣勢。根據高通提供的數據,同樣在1000MHz的頻率下,Cortex A8的執行能力為2000DMIPS(可以簡單認為是每1周期執行兩條指令),Scorpion比它要高一些,為2100DMIPS,但是Cortex A9則高達2500DMIPS,領先Scorpion接近20%。雖然高通試圖通過超頻20%的方式彌補這個差距,但是在單線程性能上,還是被競爭對手甩開了不小的距離,畢竟亂序執行的能力在很多應用中可以獲得的性能提升遠遠不是這200MHz的頻率可以彌補的,而且更高的頻率也會抵消Scorpion核心在省電上的特點。這點在后面的測試里也可以看出來。

當然,Scorpion核心也不是沒有自己的優勢。作為高通自行設計的核心實現,它在一些方面有著超出ARM官方Cortex A系列的地方,例如它的二級緩存是直接連在兩顆CPU上,而不是通過AXI總線共享的,在帶寬和延遲上有著自己的優勢。但是整體而言,Scorpion作為上一代核心,在新一代Cortex A9雙核的面前還是顯得比較孱弱的。

最后,我們給這些處理器的核心架構作個評分(考慮到默認頻率):

Tegra 2 ★★★★

OMAP4430 ★★★★

MSM8x60 ★★★

Exynos 4210 ★★★★★

較量項目二:處理器核心的協同作戰能力

可能多處理器架構這個詞對于不少讀者而言都是很陌生的,很多人可能從來都沒注意到過這方面的東西。所謂多處理器架構,就是說多顆處理器以何種模式共同運行,以怎樣的方式合作執行程序。在PC領域,這個概念并不重要,因為大家看到的多處理器(多核心處理器也可以看作制作在一個芯片上的多處理器),在邏輯架構上都是一樣的,那就是同步多處理器,英文為Synchronous Multi-Processors,縮寫為SMP(不是對稱多處理器的那個SMP)。但是在多處理器體系剛剛出現的階段,曾經也有過很多不同的邏輯架構, 而在目前的手機市場上就恰恰存在著不采用SMP架構的多處理器,那就是高通的MSM8x60。

與SMP不同,高通所采用的架構名為ASMP,即異步多處理器架構。所謂同步和異步,差距并不是簡單的兩個字,在具體實現上的區別非常大。但是在此我們并不需要了解它們之間學術上的區別,我們只從最粗略的角度來看一下這兩種架構的工作方式。

所謂同步多處理器,顧名思義就是同步的,即多枚處理器運行在同樣的時鐘頻率,共享同樣的緩存數據,協同工作。簡單來說,同步多處理器系統在工作的時候,每當一個任務完成后,空閑的處理器會立刻尋找下一個新的任務,對于外部而言,這兩顆處理器是一個整體,共同完成同一個工作。

而異步多處理器則更接近于若干個獨立工作的處理器,它們之間可以運行在不同的頻率下,每個處理器維護自己私有的緩存數據,最重要的是,它們之間會利用一種仲裁機制,以輪流工作的方式執行任務。它們更像是一些互不干擾的獨立處理器,各自完成各自的事情,輪流執行不同的工作。

看到這兒,相信大家也看出來了,同步和異步最大的區別就在于輪流工作這四個字。具體而言,就是在同一時間,只有一顆處理器可以接受任務,另一顆不論是否繁忙,都不能接受新任務??赡芄饪课淖终f明還不是那么生動,下面我們就來看幾張圖,了解一下相對于同步多處理器“誰空閑誰接單“的工作模式而言,這種輪流工作到底是怎樣進行的,又會導致怎樣的結果。

圖中每一橫行代表一個時鐘周期,我們用紅色的方塊代表正在讀取任務,綠色的方塊代表正在執行任務,方塊中的數字代表不同的任務,而空白代表著空閑狀態。在第一張圖里,我們假設任何任務只需要一個周期就可以執行完畢。

clip_image001[6]

異步多核心和同步多核心運行狀況:單周期指令

可以看到,在每一個周期內,異步多處理器架構最多只能有一個核心接受任務,而如果兩個處理器都空閑,就會有一個消極怠工。如圖所示,執行四條指令,異步多處理器用了5個周期,同步多處理器用了4個周期,異步多處理器慢了25%。

那么如果指令執行時間是兩個周期呢?

clip_image002[4]

異步多核心和同步多核心運行狀況:雙周期指令

當指令執行長度為2周期時,新問題就出現了。由于ASMP架構中,處理器1只能在奇數周期接受任務,處理器2只能在偶數周期接受任務,雖然ASMP 中的處理器1在第3個周期的時候結束了當前的任務,但隨之而來的第4個周期卻只有處理器2可以接受任務。因為處理器2此時正忙于上一個任務,因此對于外部程序而言,在第4個周期上處理器會處于不可用狀態,等到第5個周期到來以后才能繼續接受新任務。因此SMP架構只需要6個周期就能完成的任務,ASMP卻消耗了8個周期,慢了33%。

這就是為什么ASMP目前采用的越來越少的緣故。雖然ASMP存在著設計簡單、結構清晰、耗電較低的優勢,但是由于性能不足,在PC領域從來都沒有成為過主流。而在移動領域,高通認為手機對于耗電的要求要大于性能,又希望可以在雙核時代繼續沿用單核時代的核心架構而不需要徹底重新研發,因此采用了ASMP架構。但是事實證明,高通在這點上可能有些耍小聰明之嫌,因為既然消費者決定購買雙核,那么就一定是沖著性能去的,并且對功耗也已經做好了心理準備。

根據高通的官方數據,其1.2GHz的MSM8x60芯片組在滿負荷工作的時候,僅處理器部分就要消耗大約1.2瓦特的功率,這相對于單核時代不到500毫瓦的功耗而言,也已經是非常高的數值了,這證明了不管怎么去省電,雙核都依然是雙核,既然如此,去追求雙核應有的性能顯然應該比如何去節省那么一點點的電更加重要。換一個方面說,性能足夠強的話,系統可以以更短的時間完成任務,進而更多地進入低功耗的狀態。高通通過ASMP也許節約了一定的耗電, 但是其最大33%的性能損失會導致系統多出33%的時間處于高功耗狀態,消耗的功率可能抵消甚至反超節約的,讓高通的如意算盤打空。

回到話題上來,可能有些讀者會認為,單獨來看,可能ASMP和SMP的差距也并不是那么巨大,在之前圖中的極限狀況下也就相差33%而已,在實際運行中的差距很難達到這個數字。但是不要忘記,之前的文章中我們討論過亂序執行的重要性,那么如果我們將指令等待也引入到之前的圖中,那么會發生什么情況呢?

在此,我們用灰色的方塊代表需要等待的指令,而等待時間為兩個周期。

clip_image003[6]

異步多核心和同步多核心運行狀況:帶等待的指令

可以看到,一旦引入指令等待,將亂序執行與多核架構結合起來以后,不支持亂序執行的ASMP架構(Scorpion@MSM8x60)需要10個周期才能完成的工作,支持亂序執行的SMP架構(Cortex A9 MP@其它主流雙核方案)只需要6個周期,相對于支持亂序執行的SMP而言,不支持亂序執行的ASMP架構慢了66%。這就是MSM8x60面對其它雙核Cortex A9的情況。雖然由于實際運行中指令的執行長度可能會更長,以至于減小輪流工作的影響,但由于Scorpion核心對亂序執行的支持并不完善,因此漫長的指令等待依然可能會導致高通的處理器浪費大量的時間,最終性能變慢。這點,我們也會在后續的測試中加以體現。

同樣,讓我們也來針對多處理器架構,給四款雙核一個評分:

Tegra 2 ★★★★★

OMAP4430 ★★★★★

MSM8x60 ★★★★

Exynos 4210 ★★★★★

較量項目三:通訊總線

智能手機所采用的主芯片早已不能簡單稱之為處理器,而是一套復雜得多的系統,包含了處理器、顯示加速芯片、內存控制器、視頻解碼核心、標準總線控制器等等,有些甚至還包含了數字信號處理器,它們被合起來稱之為片上系統(SoC)。實際上一顆ARM SoC中,CPU所占據的硅片面積可能都不到總面積的二十分之一,而其中很大的一部分面積,都被各種各樣的互聯結構占用了。其實這也很好理解,片上系統就像一個大城市,如果交通不暢,整個城市的運行就會陷入癱瘓。在片上系統里有各種各樣的總線,內部的、外部的,私有的、公用的。在這其中有一條最為重要的外部總線,連接著幾乎所有的內部設備,那就是AXI。

更重要的是,內存控制器也是通過AXI連接到處理器,這就意味著不論你的內存顆粒或者內存控制器可以提供多大的帶寬,處理器能夠獲得的帶寬都直接且僅取決于總線帶寬。因此這個總線的寬度,決定了整個系統內部最大的內存帶寬,同時也在某些情況下決定了諸如3D GPU這些對內存帶寬需求巨大的模塊的性能。正如城市的發展需要高速交通一樣,隨著片上系統的復雜化,內部互聯的帶寬也要求越來越大。

由于總線方面的信息不屬于一般用戶所理解的范疇,因此廠家往往也不會對此做出詳細的說明,所以每一款芯片究竟總線寬度多少也是不容易查證的。這點上nVIDIA相對而言做的最好,因為他們曾經直接把AXI總線位寬標在了網頁上:32bit,類型為AMBA-3(這個參數在現在的網頁上已經找不到了, 原因未知)。這個數字是相當“驚悚”的,因為如果總線寬度真的是32bit,那么意味著Tegra 2的內部總線位寬只是ARM11級別的。因此nVIDIA在Tegra 2的內部,很可能采用了與標準ARM不同的總線配置方式,但是不論如何,Tegra 2的總線帶寬都是難以置信的小,即便AXI頻率達到300甚至400MHz,帶寬最多也只能達到Cortex A8的水平。根據測試,Tegra 2的內存復制成績大約只能達到1GB/s左右,這也基本符合其帶寬的表現。

再來看看德州儀器的OMAP4430。與Tegra 2上的諸多猜測不同,德州儀器提供了OMAP4430的完整技術手冊,因此各方面的資料非常容易獲取。在OMAP4430中,互連結構分為若干級別和層次,但是就最主要的而言,是L3互聯。德州儀器并沒有采用ARM的AMBA AXI總線,而是在芯片內部的主互聯上采用了Arteris公司的產品:

clip_image001[8]

從圖中可以看出,OMAP4430的L3互聯寬度為128bit,是Tegra 2的四倍,因此即便工作頻率為200MHz,總帶寬也可以輕易達到3.2GB/s,遠遠超過Cortex A8和Tegra 2。說實話,這才是雙核Cortex A9 MP應有的水準。當然,由于各家SoC的內部體系都不太一樣,在此也不能100%確定Tegra 2的實際情況。這點我們也會在后面的測試中繼續研究。值得注意的是,OMAP4430的兩個內存控制器在搭配LPDDR2 1066的時候可以提供的最大總帶寬可以超過8GB/s,但由于總線帶寬緣故,實際效果可能并不會有對應的提升,這也是ARM體系中一個比較頭疼的問題之 一。

言歸正傳,下面繼續來看看MSM8x60。一直以來,高通對于自家芯片的技術資料都守口如瓶。這維護了高通的知識產權,但是卻苦了這樣的人,因為根本無從查證芯片的詳細參數,因此只能靠猜測了。一方面,MSM8x60基本上就是“雙核版”的MSM8x55,另一方面在后續測試中也可以看出 MSM8x60在內存方面的性能并不是很突出,因此在此猜測MSM8x60的內部互聯可能和單核時代一樣,即64bit、200MHz,總帶寬 1.6GB/s。各位讀者如果有詳細的信息,也不妨告知。

最后我們來看看Exynos 4210。三星和高通在這個方面有一定的相似性,也不肯公開提供芯片的技術手冊。但是我們在三星自己的Exynos 4210宣傳資料中還是可以發現一些端倪的。

clip_image002[6]

在圖中可以明顯看出Exynos 4210同樣支持雙通道內存(DRAMC0與DRAMC1),而在之前的關鍵技術列表中,三星赫然寫出了內存帶寬6.4GB/s的數字。由于Exynos 4210是一顆幾乎全以ARM公司產品打造的芯片,因此這個數字就意味著Exynos 4210的內部總線寬度可能是驚人的256bit,只有這樣才可以在200MHz的頻率下達到6.4GB/s的內存帶寬。這個數字已經遠遠的甩開了單核 Cortex A8、Tegra 2和MSM8x60,甚至比OMAP4430還要高出一倍,在雙核時代的SoC中顯然是傲視群雄的。

關于總線的研究就到此為止了,依然按照慣例,最后給一個分數:

Tegra 2 ★

OMAP4430 ★★★

MSM8x60 ★★

Exynos 4210 ★★★★★

較量項目四:多媒體

作為一臺智能手機,多媒體功能是不可或缺的。早在15年前PC處理器巨頭Intel就高瞻遠矚,為大家帶來了一款叫Pentium MMX的產品,其最大的特色就是引入了名為多媒體擴展(Multi Media eXtension,MMX)的擴展指令集。

何謂多媒體擴展指令集?由于原理復雜堅澀,簡單的打個比方:廠商們分析平時處理器干哪些事情最慢、又最經常用到,然后把這些最消耗時間的事情固化成電路,做成一個額外的部分,和處理器集成到一起。使用的時候,只通過一條指令,就能夠訪問和計算多組數據,把最消耗時間的事情盡快做完。在計算機詞匯里,這種指令集叫做SIMD(Single Instruction Multiple Data,單指令多數據)指令集。

回到手機上,在ARM的世界里,由于日益增長的多媒體計需求,也出現了屬于ARM自己的多媒體擴展指令集,它的名字叫做NEON。它可以幫助處理器加速任何格式視頻的編解碼,幫助顯示芯片加速矢量數據的解析和打包,也可以讓系統可以更快的處理幾百萬像素的圖片。它所能帶來的性能提升根據應用的不同,可以從比較明顯的50%,到難以置信的8000%。

長期以來NEON指令集都是各種高端ARM SoC的標配,從ARM11到Cortex A8,基本上所有高端SoC都包含了對應版本的NEON指令集。而在Cortex A9時代,它更是像是理所應當一樣,作為一個基本而不可或缺的功能,出現在各大廠商最高端SoC的藍圖中。

在德州儀器的OMAP4430和三星的Exynos 4210中,每一個Cortex A9核心都擁有自己專屬的NEON協處理器,擁有專用的32個64位寄存器,以多通道操作的方式,加速系統的多媒體計算性能。而在MSM8x60中,高通甚至把它的NEON協處理器的位寬增加到了128bit,兩倍于標準的ARM實現,讓NEON協處理器可以一次性處理兩倍的數據,帶來更大的加速效果。

那么Tegra 2呢?令人感到意外的是,不知道出于何種原因或者考慮,Tegra 2沒有搭配NEON協處理器。這對于一顆定位于頂級的雙核SoC而言是十分不可理解的,因為NEON可以為幾乎所有的多媒體過程提供明顯的加速特性,而 nVIDIA卻選擇了放棄??赡苡凶x者會說,Tegra 2有強大的顯示芯片,不需要NEON的加速,但是不要忘記,顯示芯片是不能完全獨立處理所有的3D運算過程的,其中諸如數據解包和組合這種操作還是需要 CPU來完成,由于沒有NEON,處理器必須要花費幾倍于對手的時間才能“喂飽”顯示核心,最終的結果就是性能無法發揮。

而在視頻解碼方面,Tegra 2也會因為不具備NEON協處理器而受到很大的影響。因為我們知道,Tegra 2雖然號稱可以支持諸多格式的1080p全高清解碼,但是它對視頻的編碼格式有著非常嚴格的要求,例如Tegra 2的視頻解碼核心只能硬件解碼Main Profile的H.264視頻,而對于其它的就只能靠處理器來進行軟件解壓。這時沒有NEON協處理器的幫助,視頻解壓就很難高效的進行,最終導致Tegra 2的多媒體特性縮水。

也許nVIDIA是認為NEON協處理器的授權價格過于昂貴,或者可能因為規模太大而提升制造成本,而最終選擇了放棄,但作為消費者而言,不具備NEON指令集的Tegra 2無疑會在多媒體方面的競爭中被對手遠遠甩開。好了,關于多媒體的比拼也要告一段落了,最后我們照例為每個處理器給出評分。

Tegra 2 ★

OMAP4430 ★★★★

MSM8x60 ★★★★★

Exynos 4210 ★★★★

較量項目五:3D加速

說到3D加速,這個概念哪怕放在區區5年前,對于手機而言都幾乎是可有可無的。但是這幾年隨著iOS的崛起,與Android的飛速發展,3D加速一夜之間變成了高端手機必備的特性,甚至成為了整個手機用戶體驗的決定性因素。

而在新一代雙核Cortex A9 MP SoC中,圖形處理器(GPU)的競爭徹底進入了白熱化階段。從結構而言,四家的CPU好歹是一個藍本(大家所采用的都是ARM v7架構),但四家的GPU卻選擇了四種完全不同的方案,這的確從另一方面印證了GPU的重要性與競爭的激烈性。

nVIDIA作為PC領域圖形技術的領導者,在這方面是有著先天的巨大優勢。Tegra 2所采用的GPU是nVIDIA自行研發的GeForce Ultra Low Power,縮寫為GeForce ULP。它擁有四個頂點處理器,四個像素處理器,支持OpenGL ES 1.1/2.0、OpenVG等主流標準。在Tegra 2發布的時候,這枚GeForce ULP就是nVIDIA的宣傳重點,因此消費者對于它的性能也有著極大的期待。

而作為曾經參與桌面競爭、當下專注嵌入式GPU的Imagination公司,自然不愿意讓出嵌入式獨立GPU市場的性能領導地位。在 OMAP4430上,我們看到的就是這家公司設計的PowerVR SGX540。這是一顆大家很熟悉的GPU,因為早在單核Cortex A8時代,三星就在代號蜂鳥的處理器中采用了這顆GPU,它強大的性能也讓采用蜂鳥處理器的機型在單核時代傲視群雄。與GeForce ULP不同的是,PowerVR SGX540內并沒有單獨的頂點處理器或者像素處理器,而是包含了四組通用處理器。這種類似于桌面顯示核心統一渲染器的設計結構可以讓PowerVR GPU用最少的硬件獲取最大的性能,從而節約成本和功耗。值得一提的是,也正是由于通用處理器的設計,PowerVR SGX540成為了當前唯一一顆支持OpenCL通用運算標準的GPU。

clip_image003[8]

而在高通MSM8x60上,GPU則不出意外的是高通自行設計的Adreno。這是高通從前ATi公司收購而來并自行發展的圖形架構,經過四代的發展,來到了最新的Adreno 220。相對于單核時代主流的Adreno 205,這顆GPU可以達到前者兩倍的性能,從而得以參與到雙核時代的GPU爭奪戰之中。當然,由于高通的“優良傳統”,Adreno系列的架構一直不得而知,詳細參數也很難查明,但是考慮到這是從ATi收購而來的架構,因此猜測應該也是基于分離的頂點處理器和像素處理器,只是各自的數量依然不甚明確。

而四大雙核里最后登場的Exynos 4210,它在GPU上的選擇也是最為有趣的,因為它所搭載的是由ARM官方設計的Mali400圖形核心。這是一顆相對而言比較陌生的顯示核心,因為這還是它第一次在頂級SoC中露面。

clip_image004[6]

從架構上而言,Mali400也基于分離的頂點處理器與像素處理器,從邏輯角度而言要比PowerVR SGX540落后一些,也不支持OpenCL通用運算標準。但是這樣的結構在目前的應用需求下,性能也未必會顯得落后。標準的Mali400 GPU包含一組頂點處理器,而像素處理器則可以在一組到四組之間自由搭配,取決于你愿意支付多少授權費和制造成本。由于Exynos 4210是三星最頂級的ARM SoC,因此三星也當仁不讓的選擇了完整的四像素渲染器配置,即Mali400MP4。稍微岔開一下話題,雖然ARM宣稱Mali400的這種設計是“多 核心”架構,但Mali400的“MP”與蘋果A5處理器所采用的PowerVR SGX543MP2的多核是不一樣的,后者才是真正的多核心,而前者只能稱之為像素處理器可變而已。

那么這四顆GPU的基礎性能參數是怎樣的呢?我們來看下面這張表格:

clip_image005[4]

可以看到,在規格指標方面,Exynos 4210是遙遙領先的,而Tegra 2緊隨其后。至于具體的性能表現,我們在后面的測試中將簡單介紹。值得注意的是,上表中的參數未必是最終的實際性能,理論參數一般都會受到實際應用環境的強烈影響。

不過不管怎樣,我們還是要打個分的,暫時按照物理參數吧。

Tegra 2 ★★★★

OMAP4430 ★★★

MSM8x60 ★★

Exynos 4210 ★★★★★

 

誰是純爺們?四款雙核大混戰

經過上述炫目的技術分析,相信大家都累了。下面就讓我們從一些性能測試中一窺這幾顆處理器在實際產品中的表現吧。首先介紹一下采用了這四顆芯片的實際產品。

需要注意的是,下面的測試并不是每一個產品都可能會有數據,也許某些測試只會有一部分的產品參與,而由于各個手機的分辨率不同,所以在3D測試里也 需要加以考慮,不能只看原始數據。有些測試因為太老,進入雙核時代后大家的性能都受限于垂直同步而導致沒有足夠的差異性,例如Neocore,因此這里就不列成績了。

作為對比,我們額外引入單核的Nexus S,方便大家查看性能區別。

clip_image001[10]

下面的測試對比就將在這五款機器中展開。首先讓我們來看看Smartphone Benchmark 2011的結果。成績來源為獨立第三方手機性能測試網站Smartphone Benchmarks的官網首頁,選擇分數的標準為能確認的原始頻率下最高的得分。

clip_image002[8]

游戲,即GPU方面,可以看到Mali400MP4、SGX540、GeForce ULP得分相近。而生產力,即CPU方面,則是Exynos 4210一枝獨秀。當然這也有一部分原因在于它的默認頻率為1.2GHz。但是可以看到的是MSM8x60不論是GPU還是CPU,都被遠遠的甩在了后面,甚至還不如單核的S5PC110,其原因不外乎老舊的處理器核心與異步多核心架構。

然后我們來看看NenaMark 2.0。成績來源依然是官網,所有型號的成績取平均值:

clip_image003[10]

在這個測試中,Exynos 4210的成績遙遙領先與所有對手,而Tegra 2也許是因為較低的內存帶寬,導致成績反而不如MSM8x60,甚至和上一代的單核也相去不多。當然,Galaxy S II的分辨率只有800×480,這里需要再一次強調。

下面再來看看另一款測試,名叫Electopia。這是一款游戲內建的測試,成績為論壇收集:

clip_image004[8]

同樣,Exynos 4210依然遙遙領先,而在這項測試中Tegra 2依然墊底,甚至不如上一代S5PC110,而且落后MSM8x60的比例比之前更大。

最后我們再來看看GLBenchmark的測試。這是一款以3D為主的測試軟件,我們選取其中的Egypt場景作為對比,接著再來看看處理器性能。成績來源為官網。由于此測試歷史久遠,參測機型固件版本眾多,導致平均值參考意義不大,因此各自機型取最大值。

clip_image005[6]

再一次,Exynos 4210取得了壓倒性的優勢,性能幾乎是第二名的兩倍。而MSM8x60的Adreno 220甚至還比不過上一代的PowerVR SGX540,不論是單核的S5PC110還是雙核的OMAP4430。和上一個測試一樣,Tegra 2再次墊底,原因可能也是因為帶寬不足。

下面再來看看四款雙核的處理器性能:

clip_image006[4]

在這次測試中我們又一次看到了Cortex A9對Scorpion的壓倒性優勢。由于高通依然沿用了上一代的架構,因此不論是整數性能還是浮點性能都遠不如Cortex A9??上У氖荗MAP4430沒有測試成績,不過應該和其余兩款Cortex A9 MP相去不大。

最后再讓我們來看一個不算測試的測試:AndroZip解壓。成績來源為網站測試,內容為1.2MB的壓縮包解壓,成績為耗時,參與機型只有Galaxy S II與Sensation。

clip_image007

可以看到,同樣的頻率下,MSM8x60所花費的時間為Exynos 4210的300%多,這樣的差距足以說明在某些應用下,架構的區別可以帶來多大的差距。

看完了上面的測試,各位對這四大雙核應該也能有一個概念了??傮w而言,三星沒有食言,Exynos 4210不論在任何方面,都是雙核中最強的,領先第二名的程度都非常明顯。而OMAP4430則靠著各方面穩定而平均的表現,成為了雙核時代另外一個理想的選擇。高通的MSM8x60在3D測試中體現出了一定的實力,但由于架構和核心原因,在牽涉到CPU性能的測試中均潰敗給了所有對手,實際表現和單核并沒有太大差別,認為追求雙核性能的用戶選擇高通平臺并不合適。

至于Tegra 2,作為世界上第一款雙核心ARM A9處理器,我們只能說它光榮的完成了雙核心的鋪路石作用。由于NV太過節省成本,Tegra 2的內存帶寬和多媒體指令集都未能完善,導致實際使用中的體驗下降,最終得分和高通MSM8x60一起墊底。作為回顧,我們看看四款處理器都得到了多少顆星:

clip_image008

它們也很重要:功耗和成本

看完上述評測,也許很多人會覺得,為什么Tegra 2如此之差? nVIDIA果然還是這方面的菜鳥啊!如果這樣想你就錯了,因為在這些芯片的背后,還有一些重要的參數和取舍,之前的文章里我們并沒有提到,那就是成本。

眾所周知,芯片是從硅晶圓上切割出來的,一塊300毫米的晶圓價格高達數十萬美元。所以,就像切蛋糕一樣,芯片面積越小,能切出來的芯片越多,成本自然也就越低了。

但是芯片的面積又取決于晶體管的數量,而晶體管的數量往往正比于性能,因此這是個取舍的過程。值得注意的是高通的SoC因為內置基帶處理器,相對于其他的SoC而言多出了幾個模塊,在考慮尺寸的時候需要注意一下。

網上查到的資料畢竟是粗略的,因此在此也不能保證絕對的準確性,請各位讀者原諒。

clip_image009

作為對比,我們加入了Apple A5的數據??梢钥吹降氖?,雖然大家在參數上看差不多,但是面積方面相差卻非常巨大,最小的Tegra 2核心面積甚至不到最大的Apple A5的一半,這意味著一片晶圓可以切割出的Tegra 2數量是A5的兩倍以上,前者的成本也要大大低于后者。這都是廠商在設計芯片時的選擇問題,到底時傾向于成本,還是傾向于性能,nVIDIA的選擇顯然是前者,而事實上也是如此。

對比蘋果A5處理器我們會發現,單單是PowerVR SGX543MP2這一顆GPU,占據的芯片面積就幾乎和整顆Tegra 2一樣大。從這個角度而言,Tegra 2是成功的,因為它的GPU只用了對手不到八分之一的面積,就實現了幾乎一半的性能,性能成本比無疑非??捎^。

Tegra 2的OEM報價只需要15~25美元,而作為對比,上一代三星單核蜂鳥處理器的報價就已經達到了20美元,而雙核時代的獵戶座必然要貴很多,因為獵戶座的核心面積也超過了Tegra 2的兩倍。與價格相同,芯片面積越多、晶體管規模越大,滿載時的功耗就也更大,因此Tegra 2在滿載時的功耗有可能會比其他產品小。但問題是Tegra 2為了降低成本而去掉的特性太多、砍掉的性能太狠,很多時候反而得不償失。喪失了成本與性能的平衡點,這也許才是nVIDIA犯下的最大的錯誤。

而三星則試圖追求最大的內部互聯帶寬,我們也看到了,Exynos 4210可能是唯一一顆采用了256bit內部總線的SoC,而這個總線無疑也會占據相當大的硅片面積。而OMAP4430在各方面都較為平庸,因此芯片面積也居于中等水平??梢哉f,廠家的側重各有不同,導致最終產品之間的巨大差異,在這方面,德州儀器做的無疑是最好的,不論是成本、功耗還是性能都是一個很適中的檔次,而Exynos 4210與Apple A5則走在了性能的極端,實際上可以說忽略了成本與功耗的表現。而最悲劇的依然是Tegra 2,nVIDIA片面追求低成本,導致性能方面慘不忍睹,這可能是nVIDIA在Tegra 2上需要學到的最大的教訓。

寫在最后:被透支的未來

好了,我們的文章至此也要結束了,如果你仔細閱讀了我們的內容,相信你對市面上的各種雙核心手機已經心中有數。雙核大戰,四大巨頭,看起來很熱鬧,不是嗎?但是在這片繁榮的背后,看到的是我們被透支的未來。

2007年,手機硬件升級大戰第一把火由蘋果燃起,緊隨其后的Android的發展,把拼硬件之風成功發揚光大。而到了2011年,以nVIDIA為代表的PC企業的介入,更是把拼硬件的速度與力度提到了史無前例的地步,一代手機的生命周期往往只有12個月。

clip_image010

NV奉行的是“性能每年翻一番”的策略

性能在翻倍,功能在增加,隨之而來的卻是越來越高的功耗,越來越大的發熱,一天比一天重的電池,和一天比一天短的續航。根據高通提供的數據,工作在1.2GHz的MSM8x60,僅CPU部分的功耗竟高達1.2瓦,再加上顯示核心,功耗更是不可想象。

其實,哪怕我們把時間推回到短短5年前的ARM11時代,續航、功耗,都不是用戶需要去關心的問題,但自從進入雙核時代,高端手機的續航時間就已經開始以半天甚至小時作為單位,而滿載時外殼高達50度的巨大發熱,也在不斷考驗著用戶的忍耐極限。每個人都應該問自己,這真是我們需要的手機嗎?

相信有很多人會說不是。但廠家可不會理會這點。因為硬件升級是一場軍備競賽,誰也不愿意落在后面。于是,我們在NV的路線圖上看到了2011年底推出的四核心芯片,看到了28納米將首先用于制造ARM芯片。

再過半年多,新一代的Cortex A15又將扛起新一輪拼硬件的大旗,而頻率會直沖2GHz。在這樣恐怖的速度背后,我們還有多少資本可以支撐現在的發展速度?半導體工藝是有物理極限的,業界迄今為止都對線寬10納米以下的超大規模集成電路束手無策,移動計算市場這輛由廠家和消費者共同催動的火車,已經能看到近在咫尺的懸崖。

clip_image011

NV的路線圖寫得很清楚:2011年底要推出4核心手機處理器Tegra 3

幾年后,當人們手里拿著的都是裝著散熱器、風扇呼呼響的“手機”,終于意識到這樣不行的時候,卻發現已經無路可退;當人們終于開始懷念聊天看書發短信,充電一次管一周的手機時,卻發現這樣做的企業已經倒在了硬件大戰滾滾洪流之中,這才是移動產業的悲劇。

文章出自:CCIE那點事 http://www.61384694.buzz/ 版權所有。本站文章除注明出處外,皆為作者原創文章,可自由引用,但請注明來源。 禁止全文轉載。
本文鏈接:http://www.61384694.buzz/?p=1791轉載請注明轉自CCIE那點事
如果喜歡:點此訂閱本站
  • 相關文章
  • 為您推薦
  • 各種觀點
?
暫時還木有人評論,坐等沙發!
發表評論

您必須 [ 登錄 ] 才能發表留言!

?
?
上下分麻将平台 光头强公式规律一码 (★^O^★)MG八宝一后游戏规则 (*^▽^*)MG樱桃之恋官网 爱彩网新快3 (^ω^)MG宝石之轮爆分技巧 哪些是正规彩票平台 15选5兑奖时间 广西快乐双彩开奖公告开奖 白小姐玄机图片彩图 六肖中特期期准王中王一 (★^O^★)MG龙龙龙巨额大奖视频 (^ω^)MG华丽剧场援彩金 上海快3最新开奖结果今天 (^ω^)MG富豪生活新手攻略 (^ω^)MG老虎月亮怎么玩 2020年彩票停售有什么影响