◆ マイクロ・プロセッサ ( PC & PDA用 MPU & CPU ) 関係のページ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
◆ 他のホームページは Google で検索して下さい、弊社のページはそれぞれのボタン、又はリンク先をクリックして下さい。 ◆ PowerPC関係 ◆ リンクページ ◆ 弊社の製品一覧 ◆ 他リンクページ ◆ 量子コンピュータと自動制御 ◆ 自動制御システム構築や制御ネットワーク構築などで困っておられましたら是非とも弊社にご連絡下さればご相談は無料で受け付けております。 ◆ 弊社では、自動制御システムのハードとソフト関係で約32年の経験があります。 ◆ このページについて皆様からのご意見、或いはご要望などがありましたら、是非下記へメールでご連絡下さい。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
▼ このページでは、パソコン ( PC ) 用、及びPDA用CPU , MPU関係の情報について掲示しております、近年マイクロプロセッサの市場では競争がそれぞれメーカで激化とているものと思われます。 マイクロ・プロセッサ関係の新しいはページはこちらです。 ◆ 古典的なノイマン型コンピュータの限界 2018.12.02 最近、高性能なCPUチツプは微細化加工技術も限界に達しているようであり、そのプロセス加工技術が数ナノメートル(nm)となっいるが性能が格段向上していない、マルチ・コア技術が向上したが劇的な性能向上と低消費電力なプロセッサ・チツプになっていない。 ◆ 汎用CPUよりもGPGPUが高性能 2010.06.18 最近の高性能なGPGPUの話題と多くなっている。性能的には汎用のIntel系CPUも限界か・・・、古いアーキテクチァーの汎用CPUのSSE処理よりもGPGPUのほうが高性能である。計算処理はCore 2 Duo よりもGPGPUのほうが数十倍〜数百倍高性能とのベッチマーク結果が公開されている。また、ARMデュアル・コアとGPGPUコアとのワンチップCPUが製品化されており、その8コアのTegra 2は 1GHz で約0.5Wと低消費電力であり、Intel系Atom よりも数十倍以上高性能と言う情報もある。実際、Atom搭載のWindows PC を使用すると明らかに遅い、画面の表示にもたつきが感じられる。Tegra 2 を搭載したAndroidタブレットPCが発表されている。遂に、インテル社の独占状態も終わりか・・・。 ◆ PC用のプロセッサはIntel 社のCPU独占 2010.05.30 PC関係のプロセッサは、事実上 Intel x86コアの独占状態であり、新しさがない、購入する側からすれば、色々なPCがあった方がよく、独占状態はよくないと思う。x86コアとWindows一色となってはどうなのかと思う・・・。 ◆ Intel 社のCPU独占も終わりか ? '08.02.22 遂に、MicroSoft社がWindowsの技術情報を一部分無料公開すると発表しました。EU欧州連合の独禁法違反で制裁金800億円支払いの影響であろう。LinuxやMacOS Xか新しいOSなどでWindows互換性のAPIを他のメーカが開発することを期待したい・・・。 欧州委はインテルの独ミュヘン事務所をEU競争法(独占禁止法)の疑いで調査中との情報もあり、アメリカと国内でも独禁法の抵触で調査されたことがある。 Apple社はMacのCPUをPowerPCからx86へ移行したため、PCは事実上Intel x86が独占しているようなものであり、国際的な競争で独占状態は経済の停滞となり好ましくない。次は、米Intel社がCPU技術情報を公開し、x86互換性のCPUメーカに対し圧力をかけないでフェアーに競争すべきであろう・・・。Intel社はCPUのクロックを4GHz以上突破できず、もたもたしている。他のメーカに期待したほうがよいのである。消費者にとっては低価格で色々なCPUを搭載したPCを選べたほうがよい。 ▼ 最新のCPUベンチマークと消費電力 '07.02.03 米Intelからはクァッド・コア ( Quad Core ) Xeon 5355 2.66GHzが発表されたので、そのCPUを搭載したPCやサーバが発売されるであろう。Xeon 5355の消費電力は120Wであるので、CPU2個だけでなんと240Wにもなってしまうのである。 Xeon 5160 3GHzのLapackベンチマークテストでは、2〜3GFLOP/sであり、キャシュがヒットした時のピークでも9 GFLOP/sである。最新のCore 2 Duo 2.66GHzのLapackベンチマークテストでは1〜3GFLOP/s程度である。ピークでも8GFLOP/sであり、Lapackベンチマークはメモリアクセスが頻繁に発生するため共有キャシュではその性能を発揮できないようである。昨年、米Apple社は発表したIntel MacがPowerPCに対し4〜5倍の劇的な性能向上とはほど遠い。ちなみにコア1個のPowerPC 970 2.0 GHzはピーク 8 GFLOP/sと高性能である。 最近の米Apple社の発表によると最新Intel クァッド・コア ( Quad Core ) Xeon5355 2.66GHzを2個搭載したコア8個の試作Macをベンチマークテストした結果では、2個コア x 2に対しかずか1.1〜1.2倍程度であるそうである。やはり、1個の8MB共有キャシュメモリを4個のコアが同時にアクセスできないので、必ず、1個のコアがアクセス中は他のコアが待たされる。限界か・・・。相変わらず、某メーカのCPUは性能が向上しない電力を食うヒータ半導体か・・・。 ▼ 新しいアーキテクチャーのCPU '06.04.15 最近、動的再構成プロセッサ ( Dynamically Reconfigurable Processor:DRP )が話題なっており、その性能には、ビックリしてしまう、なんとPentium-4 / 3GHzと比較し最大50倍の性能を発揮すると言う。現状のアーキテクチャーでは限界となっているクロックアップでも消費電力の増大や熱発生の問題があり、その解決や性能面でも大幅に向上が可能のようである。リコンフィギュラブル・プロセッサは低クロックで現状のPC用のCPUの性能を大幅に向上できるので、PDAや携帯電話、手のひらサイズPCなどに応用されるであろう。時代遅れな古いアーキテクチャーCISC+RISCでは通用しない、もうIntel CPUは必要ない、プロセッサ技術も進歩するのである。ヒータのように電力を食いまくるCPUは必要ないのである。 ▼ 最近のCPUは低消費電力 ? '06.03.19 最近、低消費電力の65nmプロセス製造のCPUデバイスが製造されているが、はたして本当に低消費電力となったのか疑問である。 ▼ やはりPentium4は性能が低かった '06.02.25 やはりPentium4は早くなかった。 ▼ 低消費電力のTM5800, TM8800 '06.03.12 約3Wの低消費電力タイプのTM8800は8命令同時実行128bits CPUコア1.6GHz, L2キャシュ1MBであるが、残念なことにトランスメタ社はCPUデバイス関係から撤退を発表しました。TM8800関係は製造を継続しTM5800関係は他の企業に売却しそのメーカが製造を継続するようです。 TM5800は1GHz, L2キャシュ512KBが実装されているので、PDA用の低速なARM系よりも高性能です。TM5800は4命令同時実行128bits CPUコア、ノース・サウスブリッジ、グラフィクス・コントローラを内蔵して消費電力がわずか3.6〜7WとインテルのCPUよりも低消費電力である。 米IBM社では、PowerPC 970が2.5GHzに達したことを発表しました、SingleChip CPUで20GFLOPSの性能は最速となることは間違いなさそうです、Pentium-4 / 2.8GHzの約4倍の性能となります、DualChip CPUであれば40GFLOPSの性能ですからIntel社のCPUを大きく凌駕しそうです。 '03.3.21 ▼ 理解し易いCPUの基礎的なページ。 ▼ PC関係CPUを遥かに凌駕するCell '05.03.13 新しい発想のCPUのCellはPentium 4のSIMDが3.4GHzで約7GFLOPSを遥かに凌駕する約30倍以上の256GFLOPSの性能です。 PC関係のCPU内部命令同時実行数と実行ユニット数の関係を下記の表のとおり比較してみました。
※-1 : PowerPC-7457, 7455, 7450 / (G4), 750 (G3)では、ディスパッチ(Dispatch)数。 ※-2 : MPC-7457,7455,7450のSIMDは4個の命令を同時にDispatchするため、同時に32bit浮動少数点演算1+4個の演算可能、同時実行演算数6個(SIMD含み)。 ※-3 : SIMDに最適化すれば、1+4(SIMD)=5個の浮動少数点演算も可能、同時命令実行数の合計は8個。 ※-4 : SSEのPort-0は1個であり、ALUとSSEを同時に実行できない、Port-1の演算ユニットとの同時実行のみ可能。 Pentium-4 / 3GHzでは、高クロックとするため、パイプライン数を20段まで上げました、しかし、実行のためのPortが4個あっても実際のuOPコードのキューイング数は最高3個であるため、単純なコードの同時実行命令数は3個であり、複雑なコードでは1個です、PowerPC 970(G5)のキューイング数10個であり、5個の同時命令実行数と比較しPentium-4の性能の低さが目立ちます。 Pentuim-4では、20段のパイプラインの内、CISC命令のx86コードをRISC風のuOPコードに変換、つまりデコード( Decode:解読 )処理のために約半分のパイプライン数を必要とします、これは大変大きな処理の無駄となる訳です、3GHzであってもRISC相当で1.5GHz程度となってしまう訳であり、x86コードが複雑で古典的なCISCコードのため当然でしょう。
※-1 : 加減算(+,-)のみが倍速、乗算・除算( *, / )はCPUクロック。 ※-2 : FPUとMMX, 及びALUとSSEが同一のポート(キュー)に割り付け ? であるため同時実行ができない。 Pentium-4の浮動少数点演算ユニットは1個であり、且つCPUクロックの半速であるため、PowerPCと比較すると性能が低くなります、又整数演算でも加減算ユニットのみ倍速であり乗算・除算演算はCPUクロックであり、演算性能はクロックに見合った性能とはなっていないようです。 MMXやSIMDとしてのSSEのポートは、整数演算ユニット(ALU)のポートと共用であるためALUと同時には動作しません、同時にPort-0,Port-1によりキューイングし、ALU&ALU, ALU&MMX, SSE&ALU, ALU&FPU, SSE&MMXなどのいずれかの演算ユニット2個までの同時動作であり、従って浮動少数点演算では、SSEやFPUとの併用したスパースカラ(SuperScalar)としての同時3個動作以上の並列演算の効果が期待できません。 PowerPC G4では、SIMDに4個のDispatchが割り当てられており、FPUとSIMDで同時に1+4個(32bitsの場合)の浮動少数点演算が同時に可能です、PowerPC 970でも整数演算ユニットx2個 /キュー x 2個, FPUx2個 / キュー x 2個, SIMDx1個 / キュー x 2個と別々の12個のキューで構成されているため同時に5個までの演算ユニットを実行可能です、更にSIMDに最適化すれば4+4(SIMD)=8個の浮動少数点演算の同時実行も可能なはずです。 AMD社のHammer では、ALUとFPUが3個ずつあり、且つ3個の演算スケジューラで同時に3個までの演算ユニットを実行可能であり、Pentium-4と比較しても格段に演算性能が優れています。 以上から言える事は、Pentiumは高クロックしなければ、他のCPUと同等の性能が得られないことになるのです、つまり、IA32のアーキテクチャの限界が見えており無駄なデコードとスケジューリングと言わざるを得ないのでしょう・・・。 x86系では、AMD社に軍配が上がり、64bit / CPUのItanium-2は32bitモードで稼動させると性能低下が著しいと言われており、64bit / CPUのHammerとOpteronが、Pentium-4を遥かに凌駕したことでしょう・・・。 ベンチマーク・テストでもPentium-4に対しHammerとOpteronの優位性が明らかであり、又PowerPC 970でもPowerMac G5 Dual 2GHzの優位性が明らかです・・・。 PowerPC G4では、1個のSIMDに4個のDispatchで構成されているため、浮動少数点演算がPentium-4よりも低いクロックでも高い性能となっています、この事はアプリケーション・ソフトでのベンチマーク・テストでも明らかです。 高クロック・イコール・高性能と言う図式は既に成り立たなくなり、更に高クロックとしパイプライン数を増やしてもそれに見合った性能向上とはならず、残念ながら限界が見えています・・・。'03.09.09 製造プロセス0.09um ( 90nm ) のCPUが発表されましたが、Pentium-4 / 3.4GHzは31段パイプライン、消費電力がなんと103Wとヘビー級なCPUとなりました。反面PowerPC 970FXは2.0GHz / 25Wと低消費電力です、性能もPentium-4よりも高速です。'04.02.26 最近、微細加工技術で高性能な64bit RISC CPUが発表され、そのダイサイズや消費電力をそれぞれのCPUを比較し考察してみました。
▼ 国内では、日立のSHシリーズがラインナップされており、特にSH-2シリーズのワンチップCPUは利用価値があります、制御関係や組込み製品に多く利用されています、詳細はこちらのページを参照。 ▼ コンピュータと制御関係のページ |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pentium-4は高速化するためパイプランを20ステージまで上げており、パイプランの並列処理は予測分岐が外れなければよいが、外れた場合には最悪時20ステージ分の実行した命令コードを戻らなければならないことになる、そのためのCPU内処理にクロックを要する、又一次キャシュを空にしなければならず、高速化するどころか低速となる可能性もあります。 米Intel社は予測分岐の効率を上げたと言っているが、わずか1〜2%程度である、Windows OSやWindowsアプリ・ソフトは未だにx86コードが大半であるためPentium-4内部では、x86コード ( CISC ) をRISCコードへの変換処理が必要であるため、予測分岐との絡みでx86の古いアーキテクチャーを混在させて増々Pentium-4内部が複雑化すると言うアーキテクチャなのです。'02/6/30 Pentuum-4 のバス構造と大幅に替わったAMD社の疎結合型マルチプロセッサOpteronやAthlon( Claw Hammer : クローハマー )はメモリコントローラを内蔵しており、クローハマーのメモリ・レイテンシ( 遅延 )は約12nsとPentium-4 約140ns に対し高速であり、データ転送もPentuim-4に対し約2.5倍の性能を実現しており、高クロック・イコール・高性能と言う図式が崩れつつあります。 Athlonの内部アーキテクチャは、Pentuim-4とはまったくの別物です、x86コードを実行可能なアーキテクチャであるがPentium-4 / 3GHzのダイサイズ140mm2に対しAthlon XPのダイサイズ84mm2と約40%も小さいことには深い意味があります、Pentium-4のように複雑な論理回路ではなく論理回路は無駄が少ないと言えます。 Hammerには、ALU x3個、FPU x1個、MMX, SSE, SSE2, 3DNow演算ユニットを内蔵しており、内蔵のメモリコントローラはキュー・クロスバーとメモリコントローラがCPUクロックと同速で動作するので、Petium-4のようにバスユニット-->FSB-->ノースブリッジ-->バスユニット-->DRAMコントローラ-->DRAMの構成に対しHammerでは高速でないノースブリッジ関係が不要であるため高性能となります。 ▼ PowerPC G4とPentium-3のアーキテクチャの大きな相違はスーパー・コンピュータでも採用されているベクトル演算であり、このベクトル演算による性能向上はクロック・アップよりも格段に上がりますが、クロック・アップによる性能向上は周波数が倍で性能向上が倍となることはあり得ません。これに対しベクトル演算はワンクロックでデータ処理を最大16個処理できるので、その性能向上は大きくなります。又Pentium-3ではベクトル演算であるSSEはMMX・浮動小数点演算と切り替えなければならず、その切替え処理でのボトルネックが生じて当然性能面での向上はそれほど期待できません。この点はIntel 社とApple社公式発表のベンチマーク結果(Intel社はベンチマークのページを削除してしまったが・・・)を見れば明らかであり、六種類のベンチマーク結果では、PowerPC G4がPentium-3に対し1.5〜6.4倍、平均で約3倍となっています。 最新鋭のCPUであるPowerPC G4とPentium-3の機能・性能を比較表。 最近、意味のないCPUベンチマークテストを公開しているページが増えてまいりました、特にx86系のPentium関係ではSPECcpu2000のベンチマークテストを利用するようであるが、ベンチマークテストのプログラム自体が二次キャッシュメモリに格納できてしまうため、CPUのクロックと同等の速度で動作するので当然CPUが高クロックであれば良い数値がでるのは当たり前です、しかし、一般のアプリケーションプログラムのサイズは数MB以上と言うのは一般的であり、小さい512Kバイト二次キャッシュメモリに格納されることはあり得ず低速なRAMのメモリに格納されるためベンチマークテストのような良い結果はでないのです。 TclTkでのベンチマークテストはこちらのページ。 ▼ Pentium-4はマルチ・プロセッサに対応していないので、上位機種XeonのCPUでマルチ・プロセッサを実現しなければならず、又Xeonはサーバ・マシン用であるため高価なためMacのように低価格なデュアルCPUのマシンをDOS / Vメーカは販売できないでしょう・・・。'02/6/30 ▼ PowerPC G4のアーキテクチャはスーパー・コンピュータのアーキテクチャに近い構造となっており、完全なRISC ( Redeuced Instruction Set Computerd 縮小命令セット・コンピュータ ) です。これに対しPentium3は第一世代前のCPUであるCISC( Complex Instruction Set Computer 複雑命令セットコンピュータ) とRISCが共存しており、これはWindows95 / 98のDOSソフトの互換性を維持するためx86 の16Bitbコードをエミュレートしなければならず、この点はボトルネックとなり性能面でも不利となります。ちなみにMacでは、第一世代CPUであった68KシリーズからPowerPCへの移行時OS側ソフトでエミュレートし互換性を維持したため、OS側でPowerPCネイティブ・コードに最適化すれば良く、殆ど最適化が完了しています。 ARM関係のCPUも最近アーム社との活発に提携する企業が増えております、世界中で既に40社程度の企業が提携しているそうです、ARM7系は既にPDAなどに利用されていますが、最新のARMはJavaコードを高率よく実行できる機能を追加したため、Intel社のPentiumの同クロックの5〜6倍の性能でJavaコードを実行できるそうです。PDAでも現状のPC相当の性能となることもそう遠くはありません。'01/6/7 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
▼ 最新鋭のCPUであるPowerPC G4とPentium-3の機能・性能を比較してみました。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||