PC用 CPU & MPU
 マイクロ・プロセッサ ( PC & PDA用 MPU & CPU ) 関係のページ

◆ 他のホームページは Google で検索して下さい、弊社のページはそれぞれのボタン、又はリンク先をクリックして下さい。

 http://www.google.co.jp


PowerPC関係
意味のないベンチマークテスト
IA32アーキテクチャの限界 ?
ARM関連
組込みMPU関係
Pentium関係
CPUダイサイズ・消費電力の比較
CPUの同時実行命令数と実行ユニット

 リンクページ

弊社の製品一覧
弊社のソフト関係
弊社のハードとファームウェア関係
マルチ・プロセッサ自動制御装置
自動制御システム開発
生産&治具システム開発
計測自動制御装置
PID 自動御制ボード
腕時計サイズ制御ボード
ZigBee計測制御ボード
測画像処理制御ボード
ロボット制御ボード & ソフト
コイン・サイズのマイコンボード
マルチCPU高精度データロガー装置
タッチスクリーン DSP ボード
人口知能 AI 自動制御計測ボード
スマートフォン無線計測ソフト
WiFi自動制御計測Web遠隔監視System

 他リンクページ

量子コンピュータと自動制御
Linux上で組込関係ソフト開発利用
Python組込み関係利用の問題点
人工知能・組み込み制御と自動制御
デジタル制御やDCS制御のページ
Linux&FreeBSDでのSCADA,HMI
SoftPLC & LinuxPLC
制御関係コンピュータのページ
実践的な制御の基礎
自動制御装置用SH-2 ボード
PowerPC関係のページ
MacOS Xのソフト開発環境関係ページ
MacOS X でのH8&SHソフト開発環境
H8S/2238組込み計測装置開発
MacOS XでのVerilogHDL & VHDL開発
制御システムエンジニア・マイコン集い
自動制御システム・自動制御装置
OS関係& Trusted OSのページ
PC & PDA用CPU 関係
PDA (Palm)関係
組み込みMPU 関係のページ
組み込みマルチ・コア関係のページ
おもちゃマイコンのページ
クラスター 関係のページ
CPU Board & マルチCPUボード関係
Linux関係のページ
MacOS X & X serve 関係
OS関係& Trusted OSのページ
マイクロカーネルMach &RT-Mach
BeOS関係のページ
トップページ

 自動制御システム構築や制御ネットワーク構築などで困っておられましたら是非とも弊社にご連絡下さればご相談は無料で受け付けております。

 弊社では、自動制御システムのハードとソフト関係で約32年の経験があります。

 このページについて皆様からのご意見、或いはご要望などがありましたら、是非下記へメールでご連絡下さい。

▼ このページでは、パソコン ( PC ) 用、及びPDA用CPU , MPU関係の情報について掲示しております、近年マイクロプロセッサの市場では競争がそれぞれメーカで激化とているものと思われます。

 マイクロ・プロセッサ関係の新しいはページはこちらです。


◆ 古典的なノイマン型コンピュータの限界 2018.12.02

 最近、高性能なCPUチツプは微細化加工技術も限界に達しているようであり、そのプロセス加工技術が数ナノメートル(nm)となっいるが性能が格段向上していない、マルチ・コア技術が向上したが劇的な性能向上と低消費電力なプロセッサ・チツプになっていない。
 近年、量子コンピュータ・チップ人口知能チップが注目されている。


◆ 汎用CPUよりもGPGPUが高性能 2010.06.18

 最近の高性能なGPGPUの話題と多くなっている。性能的には汎用のIntel系CPUも限界か・・・、古いアーキテクチァーの汎用CPUのSSE処理よりもGPGPUのほうが高性能である。計算処理はCore 2 Duo よりもGPGPUのほうが数十倍〜数百倍高性能とのベッチマーク結果が公開されている。また、ARMデュアル・コアとGPGPUコアとのワンチップCPUが製品化されており、その8コアのTegra 2は 1GHz で約0.5Wと低消費電力であり、Intel系Atom よりも数十倍以上高性能と言う情報もある。実際、Atom搭載のWindows PC を使用すると明らかに遅い、画面の表示にもたつきが感じられる。Tegra 2 を搭載したAndroidタブレットPCが発表されている。遂に、インテル社の独占状態も終わりか・・・。


 PC用のプロセッサはIntel 社のCPU独占  2010.05.30

 PC関係のプロセッサは、事実上 Intel x86コアの独占状態であり、新しさがない、購入する側からすれば、色々なPCがあった方がよく、独占状態はよくないと思う。x86コアとWindows一色となってはどうなのかと思う・・・。


 Intel 社のCPU独占も終わりか ?  '08.02.22

 遂に、MicroSoft社がWindowsの技術情報を一部分無料公開すると発表しました。EU欧州連合の独禁法違反で制裁金800億円支払いの影響であろう。LinuxやMacOS Xか新しいOSなどでWindows互換性のAPIを他のメーカが開発することを期待したい・・・。

 欧州委はインテルの独ミュヘン事務所をEU競争法(独占禁止法)の疑いで調査中との情報もあり、アメリカと国内でも独禁法の抵触で調査されたことがある。

 Apple社はMacのCPUをPowerPCからx86へ移行したため、PCは事実上Intel x86が独占しているようなものであり、国際的な競争で独占状態は経済の停滞となり好ましくない。次は、米Intel社がCPU技術情報を公開し、x86互換性のCPUメーカに対し圧力をかけないでフェアーに競争すべきであろう・・・。Intel社はCPUのクロックを4GHz以上突破できず、もたもたしている。他のメーカに期待したほうがよいのである。消費者にとっては低価格で色々なCPUを搭載したPCを選べたほうがよい。


▼ 最新のCPUベンチマークと消費電力  '07.02.03

 米Intelからはクァッド・コア ( Quad Core ) Xeon 5355 2.66GHzが発表されたので、そのCPUを搭載したPCやサーバが発売されるであろう。Xeon 5355の消費電力は120Wであるので、CPU2個だけでなんと240Wにもなってしまうのである。

 Xeon 5160 3GHzのLapackベンチマークテストでは、2〜3GFLOP/sであり、キャシュがヒットした時のピークでも9 GFLOP/sである。最新のCore 2 Duo 2.66GHzのLapackベンチマークテストでは1〜3GFLOP/s程度である。ピークでも8GFLOP/sであり、Lapackベンチマークはメモリアクセスが頻繁に発生するため共有キャシュではその性能を発揮できないようである。昨年、米Apple社は発表したIntel MacがPowerPCに対し4〜5倍の劇的な性能向上とはほど遠い。ちなみにコア1個のPowerPC 970 2.0 GHzはピーク 8 GFLOP/sと高性能である。

 最近の米Apple社の発表によると最新Intel クァッド・コア ( Quad Core ) Xeon5355 2.66GHzを2個搭載したコア8個の試作Macをベンチマークテストした結果では、2個コア x 2に対しかずか1.1〜1.2倍程度であるそうである。やはり、1個の8MB共有キャシュメモリを4個のコアが同時にアクセスできないので、必ず、1個のコアがアクセス中は他のコアが待たされる。限界か・・・。相変わらず、某メーカのCPUは性能が向上しない電力を食うヒータ半導体か・・・。


▼ 新しいアーキテクチャーのCPU  '06.04.15

 最近、動的再構成プロセッサ ( Dynamically Reconfigurable Processor:DRP )が話題なっており、その性能には、ビックリしてしまう、なんとPentium-4 / 3GHzと比較し最大50倍の性能を発揮すると言う。現状のアーキテクチャーでは限界となっているクロックアップでも消費電力の増大や熱発生の問題があり、その解決や性能面でも大幅に向上が可能のようである。リコンフィギュラブル・プロセッサは低クロックで現状のPC用のCPUの性能を大幅に向上できるので、PDAや携帯電話、手のひらサイズPCなどに応用されるであろう。時代遅れな古いアーキテクチャーCISC+RISCでは通用しない、もうIntel CPUは必要ない、プロセッサ技術も進歩するのである。ヒータのように電力を食いまくるCPUは必要ないのである。


▼ 最近のCPUは低消費電力 ? '06.03.19

 最近、低消費電力の65nmプロセス製造のCPUデバイスが製造されているが、はたして本当に低消費電力となったのか疑問である。
 デュアルコアCore Duo 2.16GHzのT2600はTDP=31W、アイドルサイクルで1GHz/13w、シングルコアの1.66GHz/T1300はTDP=27wと決して低消費電力とはいえないのである。
 バッテリーの容量は増大する一方であり、B5サイズのノートPCでは6.6Ah( 49wh )のものがあり、低消費電力と言われているB5サイズPentium-M/900MHzのバッテリー駆動時間はJEITA測定法で約9時間(メーカ発表値)であり、実際の駆動時間は6割程度であるから、約4時間である。つまり、約12whとなる。
 その12wからノース・サウスブリッジLSI や周辺LSIの消費電力約3w, ビデオチップの消費電力約1w, HDDの消費電力約 2wなどを差し引くとCPUの消費電力は6w程度となる。CPUの消費電力が半分程度占める。
 世代の古いノートPCの消費電力はP-3/750MHzで10wh程度、バッテリー10.8v/1760mAh駆動時間約2Hr, Celeron/450MHzでも10wh、バッテリー10.8v/2600mAh駆動間約3Hrである。その低消費電力と言われている最新のノートPCの消費電力は15〜30whにも達するのである。果たして低消費電力と言えるのであろうか・・・。


▼ やはりPentium4は性能が低かった '06.02.25

 やはりPentium4は早くなかった。
 geekpatrolのベンチマークテストでは、Pentium4 2.4GHzやAthlon 64 2.2GHzの性能が低く、Intel Core DuoでPowerPC G5になみとなったのである。つまりPentium4の性能が低かったのである。
 高性能と言われているXeon Dualもそれほど高性能でもないのである。メモリデータ転送性能やストリーム演算性能などはPowerPC G5 Dual Coreほうが性能が高い。但しIntel Core Duoは低いクロックでPentium4よりもかなり性能を上げたので評価できる。


▼ 低消費電力のTM5800, TM8800 '06.03.12

 約3Wの低消費電力タイプのTM8800は8命令同時実行128bits CPUコア1.6GHz, L2キャシュ1MBであるが、残念なことにトランスメタ社はCPUデバイス関係から撤退を発表しました。TM8800関係は製造を継続しTM5800関係は他の企業に売却しそのメーカが製造を継続するようです。
 TM5800を採用している手のひらサイズで重さわずか400gのウルトラPCのOQO model01は、TM5800/1GHz, VGA LCD, メモリ256MB, HDD 30GB, USB v1.1, Bluetooth, FireWire, サイズ124 x 86 x 23mm, 重さ396g, バッテリー駆動 約 3時間, キーボード付きと言うスペックは驚きです。OSはLinux, NetBSD, OpenBSD, WindowsXPがインストール可能である。

 TM5800は1GHz, L2キャシュ512KBが実装されているので、PDA用の低速なARM系よりも高性能です。TM5800は4命令同時実行128bits CPUコア、ノース・サウスブリッジ、グラフィクス・コントローラを内蔵して消費電力がわずか3.6〜7WとインテルのCPUよりも低消費電力である。


 PowerPC関連

 米IBM社では、PowerPC 970が2.5GHzに達したことを発表しました、SingleChip CPUで20GFLOPSの性能は最速となることは間違いなさそうです、Pentium-4 / 2.8GHzの約4倍の性能となります、DualChip CPUであれば40GFLOPSの性能ですからIntel社のCPUを大きく凌駕しそうです。 '03.3.21
 PowerPC603やPowerPC604e, PowerPC G3, PowerPC G4などはレーザープリンターや通信関係、他の制御関係の組み込みCPUとして利用されており、米IBM社では既に2001年までに約4,000万個以上出荷したそうです、PowerPCはMac専用のCPUではない訳です。
 PowerPC関係のページはこちらです。


▼ 理解し易いCPUの基礎的なページ
 進化する多機能・高性能で低価格な組込み用マイクロ・プロセッサMPU関係のページはこちらです。


▼ PC関係CPUを遥かに凌駕するCell '05.03.13

 新しい発想のCPUのCellはPentium 4のSIMDが3.4GHzで約7GFLOPSを遥かに凌駕する約30倍以上の256GFLOPSの性能です。


 CPUの同時命令実行数と実行ユニットの比較

 PC関係のCPU内部命令同時実行数と実行ユニット数の関係を下記の表のとおり比較してみました。

CPUタイプ 命令同時
実行数
命令同時実行
ユニット数
命令キュー
Port数 ※-1
ステージ数
PowerPC 970 5 ( 8 ※-3 ) 12 ( SIMD含む ) 12 16〜23
PowerPC 7457 4 ( 6 ※-2 ) 10 ( SIMD含む ) 6 7
PowerPC 750 3 5 5 5
Pentium-4 3 7 ( SSE ※-4 ) 4 20〜31
Pentium-2 3 8 5 10
Pentium 2 4 4 5
Hammer(AMD) 4 9 4 20 ?

 ※-1 : PowerPC-7457, 7455, 7450 / (G4), 750 (G3)では、ディスパッチ(Dispatch)数。

 ※-2 : MPC-7457,7455,7450のSIMDは4個の命令を同時にDispatchするため、同時に32bit浮動少数点演算1+4個の演算可能、同時実行演算数6個(SIMD含み)。

 ※-3 : SIMDに最適化すれば、1+4(SIMD)=5個の浮動少数点演算も可能、同時命令実行数の合計は8個。

 ※-4 : SSEのPort-0は1個であり、ALUとSSEを同時に実行できない、Port-1の演算ユニットとの同時実行のみ可能。

 Pentium-4 / 3GHzでは、高クロックとするため、パイプライン数を20段まで上げました、しかし、実行のためのPortが4個あっても実際のuOPコードのキューイング数は最高3個であるため、単純なコードの同時実行命令数は3個であり、複雑なコードでは1個です、PowerPC 970(G5)のキューイング数10個であり、5個の同時命令実行数と比較しPentium-4の性能の低さが目立ちます。

 Pentuim-4では、20段のパイプラインの内、CISC命令のx86コードをRISC風のuOPコードに変換、つまりデコード( Decode:解読 )処理のために約半分のパイプライン数を必要とします、これは大変大きな処理の無駄となる訳です、3GHzであってもRISC相当で1.5GHz程度となってしまう訳であり、x86コードが複雑で古典的なCISCコードのため当然でしょう。

CPUタイプ CISC命令変換 FPU,SIMD
切替
整数演算 FPU浮動
少数点演算
PowerPC 970 RISCコードであり
変換なし
切替なし CPU
クロック
CPU
クロック
Pentium-4 x86コードから
uOPコード変換
FPU,MMX,SSE
切替あり※-2
倍速 ※-1 CPUクロック
の半分
Pentium-2 x86コードから
uOPコード変換
FPU,MMX,SSE
切替あり
CPU
クロック
CPU
クロック
Hammer x86コードから
RISCコード ? に
デコード
? CPU
クロック
CPU
クロック

 ※-1 : 加減算(+,-)のみが倍速、乗算・除算( *, / )はCPUクロック。

 ※-2 : FPUとMMX, 及びALUとSSEが同一のポート(キュー)に割り付け ? であるため同時実行ができない。

 Pentium-4の浮動少数点演算ユニットは1個であり、且つCPUクロックの半速であるため、PowerPCと比較すると性能が低くなります、又整数演算でも加減算ユニットのみ倍速であり乗算・除算演算はCPUクロックであり、演算性能はクロックに見合った性能とはなっていないようです。

 MMXやSIMDとしてのSSEのポートは、整数演算ユニット(ALU)のポートと共用であるためALUと同時には動作しません、同時にPort-0,Port-1によりキューイングし、ALU&ALU, ALU&MMX, SSE&ALU, ALU&FPU, SSE&MMXなどのいずれかの演算ユニット2個までの同時動作であり、従って浮動少数点演算では、SSEやFPUとの併用したスパースカラ(SuperScalar)としての同時3個動作以上の並列演算の効果が期待できません。

 PowerPC G4では、SIMDに4個のDispatchが割り当てられており、FPUとSIMDで同時に1+4個(32bitsの場合)の浮動少数点演算が同時に可能です、PowerPC 970でも整数演算ユニットx2個 /キュー x 2個, FPUx2個 / キュー x 2個, SIMDx1個 / キュー x 2個と別々の12個のキューで構成されているため同時に5個までの演算ユニットを実行可能です、更にSIMDに最適化すれば4+4(SIMD)=8個の浮動少数点演算の同時実行も可能なはずです。

 AMD社のHammer では、ALUとFPUが3個ずつあり、且つ3個の演算スケジューラで同時に3個までの演算ユニットを実行可能であり、Pentium-4と比較しても格段に演算性能が優れています。

 以上から言える事は、Pentiumは高クロックしなければ、他のCPUと同等の性能が得られないことになるのです、つまり、IA32のアーキテクチャの限界が見えており無駄なデコードとスケジューリングと言わざるを得ないのでしょう・・・。

 x86系では、AMD社に軍配が上がり、64bit / CPUのItanium-2は32bitモードで稼動させると性能低下が著しいと言われており、64bit / CPUのHammerとOpteronが、Pentium-4を遥かに凌駕したことでしょう・・・。

 ベンチマーク・テストでもPentium-4に対しHammerとOpteronの優位性が明らかであり、又PowerPC 970でもPowerMac G5 Dual 2GHzの優位性が明らかです・・・。

 PowerPC G4では、1個のSIMDに4個のDispatchで構成されているため、浮動少数点演算がPentium-4よりも低いクロックでも高い性能となっています、この事はアプリケーション・ソフトでのベンチマーク・テストでも明らかです。

 高クロック・イコール・高性能と言う図式は既に成り立たなくなり、更に高クロックとしパイプライン数を増やしてもそれに見合った性能向上とはならず、残念ながら限界が見えています・・・。'03.09.09


 製造プロセス0.09um ( 90nm ) のCPUが発表されましたが、Pentium-4 / 3.4GHzは31段パイプライン、消費電力がなんと103Wとヘビー級なCPUとなりました。反面PowerPC 970FXは2.0GHz / 25Wと低消費電力です、性能もPentium-4よりも高速です。'04.02.26

▼ CPUのダイサイズや消費電力の比較 '03.07.20 

 最近、微細加工技術で高性能な64bit RISC CPUが発表され、そのダイサイズや消費電力をそれぞれのCPUを比較し考察してみました。

 近年、CPUのクロックが高周波数のほうが高性能なように掲示しているホームページや雑誌が増えてまいりました、本当に高クロックが高性能なのでしょうか・・・、CPU内部の論理回路が全て高クロックで稼動している訳でないことが理解されていないようです。

 スパーコンピュータのCPUのクロックは1GHz以下、500MHz程度のスパコンさえ存在します、Pentium-4 / 3GHzなどの性能がスパコンの足下にも及びません、それは高段数のパイプライン処理ではなく、ベクトル演算が高度に並列処理され、且つメインメモリとのデータ転送速度を向上させるなどに重点が置かれており、低クロックでも高性能となるよう工夫されています。

 残念ながらPentium-4 / 3HGzなどは高クロックに見合った性能が出ていません、今後更に高いクロックとしても一部演算ユニットのみ高クロックとなるため、それほどの性能向上には至らないでしょう・・・。

 トランジスタ数が4億個を超えるチップも現れました、その消費電力も130Wを超過すると言う半導体電子部品の範疇とは思えない電力半導体素子的なチップも存在します。

 超低消費電力と言われているPentium-Mもトランジスタ数7,700万個に達し、その消費電力が1.6GHz / 25Wと大きく超低消費電力とは言えません、PowerPC 750GXはL2キャッシュ 1MB内蔵していてもわずか 8W / 1GHzとPentium-Mの3分の1です。

 PowerPC G4関係はMPC-7457 / 1GHzでも7W程度と低消費電力です、トランジスタ数が5,800万個程度とそれほど大きくないロジックで高性能な処理を実現しており、Pentuim系はCISCのx86コードをRISCコードに変換しRISCコードとして高段数のパイプライン処理すると言う複雑なアーキテクチャがネックなのでしょう・・・。

 PowerPC 970 (G5)とAMD社のOpteronは64bit RISC CPUであるためダイサイズが大きくなることは極当たり前でしょう・・・、Pentium-4はPowerPC G4と比較してもダイサイズが製造プロセス0.18umの場合約2倍の217mm2と大きいため消費電力が高くなることはごく自然なことでしょう・・・。

 Crusoe TM5800は、256bit VLIWコアとメモリコントローラとしてのノースブリッジ内蔵してダイサイズが55um2と大変小さく消費電力も6Wと言う低消費電力です、このことはノート型PCでその実力を発揮しており、バッテリー駆動時間がPentium搭載のノート型と比較し3倍以上の6〜7時間と長時間使用可能です。

 型 番 周波数

(GHz)

ダイ

サイズ

(mm2)

トランジ

スタ数

(万個)

消費

電力(W)

L2

キャッシュ

(KB)

PowerPC 970FX 2.0

64bit

62mm2

90nm

5,800 25 (2.0GHz) 512
PowerPC 970 2.0

64bit

118mm2

0.13um

5,800 42 (1.8GHz) 512
PowerPC 7457 1.3 98mm2

0.13um

5,800 7.5 (1.0GHz) 512
PowerPC 750GX 1.1 52mm2

0.13um

5,500 ? 8 (1GHz) 1MB
PowerPC 750FX 1.0 37mm2

0.13um

3,900 5.4(800MHz) 512
PowerPC 7455 1.25 106mm2

0.18um

3,300 20 (1GHz) 256
 型 番 周波数

(GHz)

ダイ

サイズ

(mm2)

トランジ

スタ数

(万個)

消費

電力(W)

L2

キャッシュ

(KB)

Pentium-4 3.4 ? mm2

90nm

? 103 (3.4GHz) 512
Crusoe

TM5600

667MHz

128bit

88mm2

0.18um

?

VLIW

7 512
Crusoe

TM5800

1.0

256bit

55mm2

0.13um

? 6 (1GHz) L1=128

L2=512

Pentium-4 2.0 217mm2

0.18um

4,200 65 (1.5GHz) 256
Pentium-4 3.0 140 mm2

0.13um

5,500 80 (3GHz) 512
Itanium-2 1〜1.5

64bit

421mm2

0.18um

2億2,100 130 ? 1.5〜

3MB

Itanium-2 1.5 374mm2

0.13um

4億1,000 130 ? 3〜

6MB

Pentium4-M 2.4 131mm2

0.13um

4,300 ? 35〜40 512
Pentium-M 1.6 150mm2

0.13um

7,700 25 (1.6GHz) 1MB
Athlon 1.4 120mm2

0.18um

3,700 ? 256
Artlon-XP 2.1 84mm2

0.13um

3,700 ? 256
Opteron

242

1.6GHz

64bit

193mm2

0.13um

1億590 85 1MB
Pentium-3 1.0 106mm2

0.18um

2,800 30 256



▼ 国内では、日立のSHシリーズがラインナップされており、特にSH-2シリーズのワンチップCPUは利用価値があります、制御関係や組込み製品に多く利用されています、詳細はこちらのページを参照。

 コンピュータと制御関係のページ
     制御関係のComputerページ
      トップページへ戻り

 このページに情報を掲示されたい方はどうぞお気軽にご連絡下さい、無料で掲示致します。又ご希望があれば御社、貴殿のページへリンク致します。

 
このページへはご自由にリンクして下さい、その際Eメールでご感想などをご連絡戴ければと思います。
     


▼ Pentium-4 / 2GHZは遅い・・・?

 Pentium-4は高速化するためパイプランを20ステージまで上げており、パイプランの並列処理は予測分岐が外れなければよいが、外れた場合には最悪時20ステージ分の実行した命令コードを戻らなければならないことになる、そのためのCPU内処理にクロックを要する、又一次キャシュを空にしなければならず、高速化するどころか低速となる可能性もあります。

 米Intel社は予測分岐の効率を上げたと言っているが、わずか1〜2%程度である、Windows OSやWindowsアプリ・ソフトは未だにx86コードが大半であるためPentium-4内部では、x86コード ( CISC ) をRISCコードへの変換処理が必要であるため、予測分岐との絡みでx86の古いアーキテクチャーを混在させて増々Pentium-4内部が複雑化すると言うアーキテクチャなのです。'02/6/30

 事実、一般的なベンチマークテストでも
Pentium-4 / 1.7GHZ はAthlon / 1.3GHZよりも10〜20%程度遅いのである、これは上記のパイプランの予測分岐処理の問題と一次キャシュが12kuOP / 8kBと小さいためであろうと思われる、通常のソフトは分岐命令が多数存在するのが当たり前であり、分岐命令がないなどと言うソフトは存在しません。


▼ IA32アーキテクチャの限界 '03.07.07

 Pentuum-4 のバス構造と大幅に替わったAMD社の疎結合型マルチプロセッサOpteronやAthlon( Claw Hammer : クローハマー )はメモリコントローラを内蔵しており、クローハマーのメモリ・レイテンシ( 遅延 )は約12nsとPentium-4 約140ns に対し高速であり、データ転送もPentuim-4に対し約2.5倍の性能を実現しており、高クロック・イコール・高性能と言う図式が崩れつつあります。

 Athlonの内部アーキテクチャは、Pentuim-4とはまったくの別物です、x86コードを実行可能なアーキテクチャであるがPentium-4 / 3GHzのダイサイズ140mm2に対しAthlon XPのダイサイズ84mm2と約40%も小さいことには深い意味があります、Pentium-4のように複雑な論理回路ではなく論理回路は無駄が少ないと言えます。

 Hammerには、ALU x3個、FPU x1個、MMX, SSE, SSE2, 3DNow演算ユニットを内蔵しており、内蔵のメモリコントローラはキュー・クロスバーとメモリコントローラがCPUクロックと同速で動作するので、Petium-4のようにバスユニット-->FSB-->ノースブリッジ-->バスユニット-->DRAMコントローラ-->DRAMの構成に対しHammerでは高速でないノースブリッジ関係が不要であるため高性能となります。



▼ PowerPC G4とPentium-3のアーキテクチャの大きな相違はスーパー・コンピュータでも採用されているベクトル演算であり、このベクトル演算による性能向上はクロック・アップよりも格段に上がりますが、クロック・アップによる性能向上は周波数が倍で性能向上が倍となることはあり得ません。これに対しベクトル演算はワンクロックでデータ処理を最大16個処理できるので、その性能向上は大きくなります。又Pentium-3ではベクトル演算であるSSEはMMX・浮動小数点演算と切り替えなければならず、その切替え処理でのボトルネックが生じて当然性能面での向上はそれほど期待できません。この点はIntel 社とApple社公式発表のベンチマーク結果(Intel社はベンチマークのページを削除してしまったが・・・)を見れば明らかであり、六種類のベンチマーク結果では、PowerPC G4がPentium-3に対し1.5〜6.4倍、平均で約3倍となっています。

 最新鋭のCPUであるPowerPC G4とPentium-3の機能・性能を比較表

 意味のないベンチマークテスト・・・

 最近、意味のないCPUベンチマークテストを公開しているページが増えてまいりました、特にx86系のPentium関係ではSPECcpu2000のベンチマークテストを利用するようであるが、ベンチマークテストのプログラム自体が二次キャッシュメモリに格納できてしまうため、CPUのクロックと同等の速度で動作するので当然CPUが高クロックであれば良い数値がでるのは当たり前です、しかし、一般のアプリケーションプログラムのサイズは数MB以上と言うのは一般的であり、小さい512Kバイト二次キャッシュメモリに格納されることはあり得ず低速なRAMのメモリに格納されるためベンチマークテストのような良い結果はでないのです。

 TclTkでのベンチマークテストはこちらのページ


▼ Pentium-4はマルチ・プロセッサに対応していないので、上位機種XeonのCPUでマルチ・プロセッサを実現しなければならず、又Xeonはサーバ・マシン用であるため高価なためMacのように低価格なデュアルCPUのマシンをDOS / Vメーカは販売できないでしょう・・・。'02/6/30

▼ Pentium-3はAMD社のAthlonにも性能面で追いこされてしまい、PC関係では遅い部類のCPUとなってしまいました、AthlonはPentium-3に対し約1.2倍の性能向上です。クロック・アップだけによる性能向上はそれぼと期待できず3GHz等と言ってもあまり意味のないことであり、次世代CPUは更なるベクトル演算、或いはマルチ・プロセッサーなどの進化がキーでしょう。もうコンピュータ関係は高価な大型コンピュータ等を使用する時代は終わりを告げています、未だに大手企業は大型コンピュータに巨額の投資を行いその付けを製品等に付加しており、コストダウンに対する意識がまるでありません、当然そのような企業は競争で淘汰されるべきであり、日本は国際的にも競争力が低下し努力しているのは殆どが中小企業であると言えます。



▼ PowerPC G4のアーキテクチャはスーパー・コンピュータのアーキテクチャに近い構造となっており、完全なRISC ( Redeuced Instruction Set Computerd 縮小命令セット・コンピュータ ) です。これに対しPentium3は第一世代前のCPUであるCISC( Complex Instruction Set Computer 複雑命令セットコンピュータ) とRISCが共存しており、これはWindows95 / 98のDOSソフトの互換性を維持するためx86 の16Bitbコードをエミュレートしなければならず、この点はボトルネックとなり性能面でも不利となります。ちなみにMacでは、第一世代CPUであった68KシリーズからPowerPCへの移行時OS側ソフトでエミュレートし互換性を維持したため、OS側でPowerPCネイティブ・コードに最適化すれば良く、殆ど最適化が完了しています。

▼ ARM関連

 ARM関係のCPUも最近アーム社との活発に提携する企業が増えております、世界中で既に40社程度の企業が提携しているそうです、ARM7系は既にPDAなどに利用されていますが、最新のARMはJavaコードを高率よく実行できる機能を追加したため、Intel社のPentiumの同クロックの5〜6倍の性能でJavaコードを実行できるそうです。PDAでも現状のPC相当の性能となることもそう遠くはありません。'01/6/7

 ARM7関係のCPUでは、米CirrusLogic社のワンチップCPUはLCDコントローラやMMUなど周辺回路を内臓し、且つ数十mWと低消費電力でり、某有名なPC用の電力を膨大に消費すCPUとは雲泥の差です。'01/6/7

 米CirrusLogic社のEP9312のARM7内臓ChipはLCD I/FやEIDE I/F ,USB Host ,Memory I/F ,Ethernet MACなどの周辺回路を内臓し200MHZで動作するので、応用分野は多いと思います。'01/6/7

 ARM1020は6ステージ・パイプラインを拡張し400MHZで500MIPSの性能をたたき出し、それでも消費電力は300mW以下と言う凄いCPUも登場しております。'01/6/7

 米Motorola社でもPalm用CPUで有名なDragonBall ( MC68328 ) のCPUコアをARMコアとして新型CPU Chipを開発中であるとのことです。'01/6/7

 米Intelもx86系Pentiumのコア以外のARMコア内臓のStrongARM ( SA-1110 ) やXscale ( 80200 / 733MHZ ) , PXA-210(200MHz), PXA-250(400MHz)を製造しています、残念ながらARM7 & 9 の性能はベンチマークでも他のCPUと比較しあまり早いとは言えません、Intel社はPentiumで十分利益を上げており、この組込みCPU分野へ参入せずともいいような気がしますが・・・。'03/1/20

 他メーカからもLCD,USB,DSPを拡張したARMコア内臓のCPU Chipが多数ありますので、組み込み装置への利用が可能です。'01/6/7


▼ 最新鋭のCPUであるPowerPC G4とPentium-3の機能・性能を比較してみました。
  下記の表はその機能と性能を示します。'99/11/20
(表示するまで若干時間がかかります、又フラッシュ形式ですのフラッシュのプラグイン・ソフトをインストールして下さい。)
 注 ) : 下記のPowerPC G4のプロセス幅0.15umは0.23umと訂正します。