◆ 組み込み用マルチ・ コア ( Multi Core ) & マルチ・スレッド・プロセッサー 2024.06.09 更新 | ||||||||
◆ 他のホームページは Google で検索して下さい、弊社のページはそれぞれのボタン、又はリンク先をクリックして下さい。 ◆ リンクページ ◆ 弊社の製品一覧 ◆ 他リンクページ ◆ リスクファィブ(RISC-V)関係 ◆ 自動制御システム構築や制御ネットワーク構築などで困っておられましたら是非とも弊社にご連絡下さればご相談は無料で受け付けております。
E-Mail :こちらをクリックして下さい。 ◆ 弊社では、自動制御システムのハードとソフト関係で約32年の経験があります。 ◆ このページについて皆様からのご意見、或いはご要望などがありましたら、是非下記へメールでご連絡下さい。
|
||||||||
Whetstoneによる浮動小数点演算ベンチマーク・テストはこちらのページです。 ◆ 新ARMコアの Cortex-X925 2024.06.09 新ARMコアのCortex-X925はCortex-X925 / 3.8GHz, Cortex-A725 , Cortex-A520, GPU G925( シェダーコア Max. 24 )の構成です。プロセス製造が 3nm であり、Cortex-X4 よりも高性能であるようです。遂にARMコアもApple とCualcomm社以外でも4GHz台で動作する SoC が発売されそうです。 2024.06.09 ◆ 新ARMコアが高性能 2024.03.03 昨年末にCualcomm社はPC用の4nmプロセスで製造したSnapdragon X Elite を発表しました、その仕様はOryon コア x 12、動作周波数 3.8GHz ブースト4.3GHzとARM系では最高となり、GPUの性能4.6TFLPOs、 NPUの性能 45TOPsとApple社のM2コア ? よりも高性能なようです。 ◆ 新アーキテクチャーのCPUコア 2023.04.16 遂にスマートフォン等のCPUは3nmプロセス製造へ移行しており、米国クアルコムのがSnapdragon 8 Gen 3 は動作周波数3.2GHzに達するが、次期Snapdragon 8 Gen 4はNuvia社のOryon Coreを採用するようであり、ARM互換性なのか新しいアーキテクチャーなのか詳細な仕様が不明である。 ◆ 新アーキテクチャーのニューなCPU 2022.02.25 PCやスマートフォン等のCPUは3nmプロセス製造となっており、そのプロセス製造が1nm以下の100pm代へとなるのであろうか。 ◆ 組込み用途人口知能コンピュータ・システム 2020.07.14 最近、低価格で高性能なGPUコア内蔵のARM系のチップ搭載が製品化されており、その小型ボードはNVIDA社製のJetson NanoやJetson Xavier NXボード等あり、人口知能(AI)を応用した組み込み制御関係の製品を製作できる状況となっております。 ◆ 古典的なノイマン型コンピュータの限界 2018.12.02 最近、高性能なCPUチツプは微細化加工技術も限界に達しているようであり、そのプロセス加工技術が数ナノメートル(nm)となっいるが性能が格段向上していない、マルチ・コア技術が向上したが劇的な性能向上と低消費電力なプロセッサ・チツプになっていない。 ◆ マルチコア・プロセッサはGPUコアの時代へ 2015.01.12 NVIDA社ではTegra X1 64bits Cortex-A53/A57 Octa コア・GPU プロセッサを発表しました。その性能と低消費電力には驚かされます。 ◆ 人工知能技術を組み込み制御や自動制御に応用と利用 2015.01.04 近年、インターネットでのビック・データの活用や人工知能による推論・予測制御の応用が注目されています。こちらのページを参照。 ◆ マルチコア・プロセッサは性能向上と低消費電力が必要 2014.10.26 近年、プロセッサはマルチコアが常識となり、8〜16コアのチップが増えている。其の性能も格段に向上しており、組み込み関係でも利用が可能となりつつある。NVIDIA社のTegra-K1はARMv8互換のDenver コアの性能がインテル系のディスクトップCPUに迫る勢いである。Tegra-K1は192コアのGPUを内蔵していて約5Wと低消費電力であり、最新のインテル系のXeon 3.1GHz 8core E5-2687Wでは約160Wにもなり電力食いである。つまり、インテル系は内部のロジック上で無駄が多いと言うことになる。古いプロセッサ・アーキテクチャーとも言える。Denverコアは詳細な仕様が発表されていないが新しいアーキテクチャーのようである。 ◆ 近年、マルチコア・マルチスレッドコアのプロセッサに性能向上が限界 2014.02.14 近年、クアッド・コアやオクタル・コア、十数個のコアのプロセッサが増えているが、Quad-Core以上ではコア数に比例した性能向上とならない。また、プロセッサの動作周波数の向上も3〜4GHz台で停滞しており、PC用CPU半導体を製造している某大手メーカーが豪語した10GHz や100GHz動作のチップはどうなったのであろうか・・・、既存の半導体製造技術やプロセッサ関係の技術面では限界なのではないかと思える。ノートPCや携帯電話端末、タブレットPC等はバッテリー駆動で長時間の使用に耐えられない。プロセッサの低消費電力が性能向上とともに増えており、残念なことに低消費電力とは言えない。革新的で斬新的なプロセッサを開発できる製造メーカーが存在しない・・・。数十兆円の巨額な内部留保(貯金)を溜め込む某大手自動車メーカーが存在する・・・、その資金を有効に活用すべきであろう。国内の半導体関係製造メーカーの技術を発展させるような国の政策などが必要と思える。 ◆ ルネサスのマルチコア・マイクロコントローラ(R8A7790) 2013.10.23 平成25年3月末頃に9個のコアを内蔵したマルチコア・マイクロコントローラを発表していた。残念なことにSpuerHコアのマルチではなくARM系 Cortex-A15 Quad + Cortex-A7 Quad + SH4A + GPU(PowerVR)で合計9個のコアの構成となっているがGPUがあるので10個のコアとも言える。性能は最速の25,000DMIPsと発表している。 2008年に性能8,640MIPs,33.7GFLOPsのSH4A x 8 コアの低消費電力なチップを試作していたはずであるが、ルネサスはSpuerHコアの性能向上を諦めたのか ? 、国産のコアであるSpuerHコアのチップをもっと開発してほしいのである。 ◆ 危険な方向へ向かっているマイクロコントローラの技術 2013.03.20 昨年末にフリースケール社が発表したクアッドコア・マイクロコントローラQUSARは4個のe200zコアと大容量フラッシュ・メモリ4.75MBと256kBのSRAMを内蔵している。このマイコンはARM系のような単なるMCUではなく、厳しい基準のISO 26262とIEC 61508を満たしている。一般的なMCUでは1つのコアでアプリ制御用の機能と診断・チェック機能を実行しているが、これでは1つのコアが異常な動作となった場合にはシステムがダウンし、最悪な場合には重大な事故に発展する。 原子力発電関係では、ARM系のような単なるMCUでは使い物にならない。本格的で大規模な自動制御システムでは、二重化・三重化された分散マルチプロセッサ・システムが常識であり、1つのコアで全てのアプリケーション・ソフトや診断機能を実行するような愚かなエンジニアはいないであろう。 ◆ 手軽に使えるマルチコア・マイクロコントローラ(MCU) 2012.07.13 手軽に使えるマルチコア・マイクロコントローラが徐々に増えつつあり、MPC5746は動作クロック200MHz、フラッシュ4MB , SRAM 320KB , QFP 176 であり、3個のe200z4コアには DSP とFPUも内蔵しているので、性能としても充分である。内部の回路構成は高機能となっており、デュアル・クロスバー・バスや周辺回路もかなり豪華版となっている。詳しい仕様を知りたい方は、フリースケール社のサイトを参照されたし。 ◆ タスク・スケジューラ機能内蔵 マイクロコントローラ(MCU)の必要性 2011.05.02 組み込み関係の制御装置や計測装置などを設計する立場からは、組み込み用途では高クロックの32bits RISC コアの必要性よりも低消費電力で低クロックの16ビット RISC コアか16ビット CISC コアのSRAMメモリに余裕のあるマルチ・コアMCUのほうが必要性があり、マルチ・コアとマルチ・スレッドで正確な実時間制御が可能であれば高クロックの整数演算処理だけが高性能なMCUの必要性がない。 当然、そのマルチ・コアMCUには、コア間の共有メモリ等やコア間のリンク・バス等でコア間のプログラミングが容易となる機能が必要となるであろう。そのような機能があれば、リアルタイムOSのタスク・スケジューラが必要となくなる。RTOSタスク・スケジューラは正確な実時間制御ができないので使い物にならない。タスク・スケジューラ機能はハード側MCUに内蔵して処理する時代である。 メカニカル制御関係では、数μ秒〜数十μ秒で正確に実時間制御が必要な自動制御装置があり、特殊なLSI やロジックICで構成した特殊な制御することが多いのである。上記のようなタスク・スケジューラ機能内蔵のマルチ・スレッドMCUがあれば制御装置のコスト・ダウンが可能であろう。今時、ARM系のMCUが必要などと言っているエンジニアは度素人であり、そのような技術者は優れた製品の開発ができないであろう。組み込み関係では、同一のコアとする必要性がなく、MCU製造メーカー間の競争があったほうがよい。その競争によってより良いものづくりをすべきである。 ◆ 手軽に使えるPowerPCコア マイクロコントローラ(MCU) 2011.04.22 フリースケール社の e200z6 Dual Coreの PXN20 シリーズはクロック116MHz , 2MB Flash , 592kB SRAM , 128KB Data Flash メモリ , ADC , Timer , SPI , UART , I2C , CAN 等のI/F回路を内蔵した本格的なマイクロ・コントローラです。パッケージがBGA208のみであり、QFP版がなく残念です。 e200z4 デュアル・コアの PXS20 シリーズはクロック120MHz , 1MB Flash , 128kB SRAM メモリ , ADC , Timer , SPI , UART , I2C , CAN 等のI/F回路を内蔵しており、パッケージが LQFP144 もあり、手軽にデュアル・コアのMCU基板を製作できる。その性能は約476 DMIPS(推定)と ARM系 Cortex-M4 の 4 倍程度にもなる。やはり、PowerPC コアであるe200z4 コアは FPU とSIMDを内蔵しているので 強力である。 他にも、MPC5602 〜5604シリーズは、性能はPXS20 シリーズのように高性能ではないが、e200z0h コア , クロック64MHz , Flash 64k 〜512kB , SRAM 12k 〜48kB , 64KB Data Flash , ADC , Timer , SPI , UART , I2C , CAN 等のI/F回路を内蔵している。但し、e200z0 コアは FPU とSIMDを内蔵していないので性能はe200z4やe200z6のように高性能ではない。しかし、そのパッケージは QFP64 があり、QFP100とQFP144もある。PowerPC コアを手軽に使える時代となった。遂にPowerPC も手軽に使えるワンチップ・マイコンとなったのである。 e200z4 デュアル・コアMPC564x シリーズは、クロック120MHz / 300DMIPS , 1.5M〜3MB Flash , 128k〜256kB SRAM メモリ、豊富なI/F回路を内蔵しており、パッケージは LQFP176, LQFP208もある。 e200z7 コアのMPC5674 は、クロック264MHz / 600DMIPS , SIMD(SPE) 搭載 , 4MB Flash , 256kB SRAM メモリ、豊富なI/F回路を内蔵しており、パッケージは LQFP176, LQFP208もある。メカ機構のタイミング制御等を高速に制御できる 200MHz の独立動作可能なタイミング・プロセッサー( eTPU )があり、高性能な処理が可能である。他のARM 系の MCU ではこのような高性能なタイミング処理機能がない・・・。つまり、組み込み関係では、計算処理が早いだけでは使い物にならないと言う事である。 これらの優れたデバイスを利用したくても、残念な事にフリースケール社製のデバイスは少量では入手が困難であり、もっと手軽に購入できるようにしてほしいものである。 ◆ ルネサスがデュアル・コア V850を発表 2010.10.07 ルネサスエレクトロニクス社は2010年8月20日に2MBフラッシュメモリを内蔵したV850 デュアル・コアのMCUを発表していました。このDualCore-V850は200MHzで動作し、その性能は1024MIPSと高性能です。但し、残念ながら、パッケージはBGA 304のみであり、手軽に使えるQFPはない。 ◆ 組み込み用途マルチ・コア MPU 2010.05.28 近年、PCやサーバ・マシンでは技術の進歩によりマルチ・コア ( Multi Core ) のプロセッサを搭載した製品が多くなっておりますが、組み込み関係でも、徐々にデュアル・コアの MPU が製品化されており、自動車の制御用でも採用されています。また、大容量フラッシュ・メモリ内蔵のマルチ・コアのデバイスが登場しております。 組み込み用マイクロプロセッサ MPU でも、マルチ・コアやハードウェアー・マルチ・スレッド・チップが常識となることでしょう。 ◆ ルネサスが8個の SH4A マルチ・コア MPUを発表 2010.05.28 ルネサステクノロジー社は2010年2月8日に家電製品向け画像処理用として SH4A コア8個のプロセッサを発表していました。このプロセッサはヘテロジニアスマルチコアと呼ぶそうです。 そのチップの内部構成には、ビックリです。単なるマルチ・コア・プロセッサではなく、8個のSH4A コアと特定用途向けプロセッサである「FE」を4個、マトリックス型並列プロセッサ「MX-2」を2個で合計 16 個のコアです。クロック周波数は、最大648MHzであり、その消費電力は648MHz動作時に約3.1Wと低消費電力です。某大手メーカーのPC用のプロセッサは相変わらず電力食いであり雲泥の差です。 2年前に、168MHz動作の1,024コアのMPUを発表していました。マトリックス型超並列プロセッサのMX-Gは1個のSH-2Aコアと1,024個のMXコアの構成であり、このMXコアと同等かどうかは不明です。 そのSH4A コア8個のプロセッサの性能は、1個のコアに対し約 15 倍の性能となるそうです。 組み込み関係でも、デュアル・コアではなく複数個のマルチ・コアも常識となりつつあります。 ◆ 手軽に使えるマルチ・コア MCU 2010.05.29 組み込み関係のマイクロ・コントローラ・ユニット(MCU)では、フラッシュメモリ内蔵のデュアル・コアがよい。パッケージは BGA では、扱いずらいので QFP タイプがよい。フラッシュメモリ内蔵のデュアル・コアはフリースケール社製の PowerPC コアの MPC 55xx などがあるが、フリースケール社製のデバイスは少量では入手が困難であり、フリースケール社には、もっと手軽に購入できるようにしてほしいものである。 ルネサステクノロジー社製のSH2A デュアル・コアはフラッシュメモリを内蔵していないので残念である。フラッシュメモリ内蔵のSH2Aデュアル・コア版を早く製品化してほしいものである。 フリースケール社製の HCS12X + XGate もマルチ・コアに属する。フラッシュメモリを内蔵しているので使い勝ってよさそうである。マルチスレッド対応のXMOSのXCoreもよいがフラッシュメモリがなく、SRAM のみであり、メモリ容量が小さいのが残念であり、もっとメモリ容量を増やしたタイプを製品化してほしいものである。 HCS12X + XGate のように、高クロックではなく、手軽に扱える 16bits コアなどで十分であり、XGate はクロック40MHzで80MIPsと高性能である。dsPIC30は30MIPs程度であるから3倍の近い性能となる。HCS12Xコア自体でも約13DMIPSの性能であるので、組込み用途としてのマルチ・コアでは、性能的には十分であろう。なによりも、QFP版があるのが大変よい。 ソフトによるRTOS などのタスク・スケジューラやソフトによるマルチ・スレッディング処理では、反応が遅くなり、実用性がない。組み込み関係では数十μ秒の高速性が必要な場合もある。そう言う意味では、マルチスレッド対応のXMOSのXCoreがよい。ハードウェアーのマルチ・スレッド処理が可能である。それもクロック周波数が 400MHz と高速である。但し、メモリ容量が少ない事が大変残念である。 ▼ マルチ・コアのSH4A( FPUあり ) + 高性能GPU チップ 2010.06.28 ルネサスでは、デュアル・コアSH-4A ( FPU含む ) + グラフィックス・コアPowerVR SGXを搭載した SH7776( SH-Navi3 )を 2009年 4月よりサンプル出荷していいる。その性能は、533MHz で1,920 MIPS 、単精度の浮動小数点演算 7.46 GFLOPsとPCなみの性能である。PowerVR SGXに関しては、携帯端末(携帯電話器)で利用されており、ARMコア単独で非力であり、高性能な GPU がなければ、iPhoneのような反応のよいタッチスクリーンの操作ができない。もちろん、API に関しては、OpenGL ES に対応している。このチップのパッケージは BGA タイプの653 ピンであり、このチップを利用した基板を設計・製作するのは簡単ではないであろう。SH-4Aコアは純国産の SpuerH コアであり、国内では、1番売れている純国産の SpuerH コア・マイコンであると思う。 次期ニンテンドー3DSで話題となっているグラフィックス・コア PICA200(搭載していると推測)とSH-4A とのチップは、豊富なインターフェース回路を内蔵しており、組み込み関係では、コスト低減できる。その性能は、533MHz で960 MIPS 、単精度の浮動小数点演算 3.73 GFLOPsとPCなみの性能である。もちろん、 OpenGL ES1.1に対応しているので、ソフトの開発は容易である。Nintendo 3DS のメイン・チップは、明らかにされていない、もしかして、SH7777チップか・・・。 ◆ ルネサスがマルチ・コアの 8 コア MPUを発表 '08.02.23 ルネサステクノロジ社は8コアのMPUを発表しました。8コアはビックリするようなチップではないが、既に1,024コア・チップも発表されている。ルネサスの8コア試作チップは 600MHz のクロックで 8,640MIPS の性能はPC用のCPUと同程度の性能である。複数のコアを高速で同期する独自の技術が搭載されている。優れたチップであってもそのチップを活かすコンパイラーがなければ使い物にならないのであって、そのコンパイラーは OSCAR ( Optimally Scheduled Advanced Multiprocessor ) が対応している。残念な事にオープン・ソースではない。中小企業では高価なクロス・コンパイラー・ソフトを購入し開発するような余裕がない。公的な補助も投入されているようであり、オープン・ソースとして利用できければありがたいが、フリーとして公開していただたいところである。 ◆ 大容量フラッシュメモリ内蔵のマルチコアMPU '07.11.16 半導体のプロセス製造技術が向上し、組み込み関係も90nmのデバイスが発表されており、FreeScale社はPowerPC e200マルチ・コアのフラッシュ・メモリ3MB, SRAM 96kバイトを内蔵したデバイスを10月に発表しました。大容量のフラッシュ・メモリ3MBは組み込み関係への利用としては、充分な容量でり、当然、ADC, SPI, I2C, SCI などのインターフェース回路も内蔵されるであろう。 既に昨年度発表されいるMPC551xシリーズはPowerPC e200デュアル・コア, フラッシュ・メモリ 1MB, SRAM 64kバイト, ADC, SPI, I2C, SCI, CAN などのインターフェース回路も内蔵しており、パッケージは144QFPもあり、クロックは80MHzであるが、充分な性能である。また、132MHzのMPC5561はSIMDモジュールを内蔵しており、フラッシュ・メモリ 1MB, SRAM 192kバイト, ADC, SPI, SCI, CAN, FlexCANなどのインターフェース回路も内蔵している。 MPC5121eはコア x 3個であり、クロックが400MHz、コアPowerPC e300, Dual IPU, DSP, FPU, 3D Graphics Accelerator, PCI, USB2.0, LCD コントローラなどを内蔵しており、高機能であり、且つ高性能であろう。 SH4A-DualやSH2A-Dual デュアル・コアのデバイス、ARM関係のデュアル・コアのデバイスは、残念なことにフラッシュ・メモリが内蔵されていない。組み込み関係ではあまり歓迎されないタイプのMPUであり、既に128コアのデバイスIMAPCARも製品化されており、他にも数社からマルチ・コアのMPUは多数製品化されているが、残念なことにフラッシュ・メモリが内蔵されていない。また、パッケージがBGAタイプがほとんどであり、試作基板の製作時にコストが高くなる。また、数個の入手が困難である。 PowerPC コアでは、オープン・ソースのGNU C (gcc)コンパイラーを利用できそうであるが、残念な事に、ほとんどのマルチ・コアのMPUはGNU C コンパイラーを利用できない。高価な商用の C コンパイラーを購入してそのデバイスを利用するのは、大企業だけであり、普及することがなく、特定の企業だけが利用するようなデバイスは消滅してしまうであろう。現状の普及しているMPUデバイスは殆どGNU C コンパイラーを利用できる。GNU関係のソフト・ウェアーの開発はLinuxの成功のように役割やその成果が多大である。 ◆ 低消費電力で高性能なCPU & DSP '07.02.03 近年、半導体のプロセス製造技術が向上し、1W以下の高性能なCPU やDSPが発表されています。PowerPC 460は1.0GHz でわずか530mWである。その性能は2,000DMIPsもある。DSPであるADSP-TS201Sは1.0GHzで 4.8GMACs、3.6GFLOP/s の高性能と消費電力がわずか1Wである。また、TMS320C6455は1.0GHzで 8GMACs、6GFLOP/s ? の高性能と消費電力がわずか1.6Wである。ノートPCのCPUの性能を超えているのである。Pentium-M 1.8GHzはピーク性能ではなく、実際の性能では0.6GFLOP/s程度の性能である。最新のデュアルコアのCore 2 Duo 2.66GHzでもピークでも8GFLOP/s程度、Lapackベンチマークテストで1〜3GFLOP/s程度であるから、消費電力に対する性能はダントツDSPが高性能である。某メーカの電力食いのクァッド・コアは比較にならない。 ◆ 組み込み関係でも仮想マシン '06.02.12 最近、仮想化技術とか仮想マシンが話題となっている。マルチコアMPU上で複数のOSを利用する技術であり、また、将来はマルチコアMPU内ハードウェアでOSのスケジューラ・カーネルなどを実行し、スレッド切替えのオーバーヘッドを軽減して効率的に高速にオブジェクトを実行できるようになる。リアルタイムOSのタスク・スケジューラをハードウェアで実行すれば実行効率が上がる。組み込み関係のMPUでも1GHzを超える高性能なものもあり、仮想マシンが必要となるであろう。 ◆ 組み込み系のSH-2も160MHzの高速版発表 '06.02.08 組み込み関係での用途が多い、SH-2系のSH-2A のSH2-7211/160MHzが発表された。内部コアは新しくなっており、2命令同時実行スパースカラなど高速化のために改良されている。内蔵している周辺回路は豊富であり、バス・インターフェースやフラッシュ512KBytes, SRAM 32KBytes, Timer 5Ch., I2C 1Ch., シリアル4Ch.,12bits A/D 8Ch., D/A 2Ch.などと充分である。またSH-2A/200MHzは360MIPSと高性能である。 ◆ 組み込みPowerPC '01.06.07 Motolora社のMPC 5500はPowerPC Core 300MHz, Flash-ROM / 4Mbyte, SRAM / 128kbyte, MMU-I/F, DSP(SIMD), CAN x 2Ch., Timer-Unit, SCI / SPI, ・・・他と大容量メモリであり、Flash-ROMにLinuxのカーネルやRealTime OSを実装できるので、Single Chip MPU Built in Linux等の製品を開発できるでしょう。 米国では、M.COREのCPU Boardが若干発売されていますが、国内では殆ど見かけません、M.COREのMMC2107/CPUは低消費電力で、フラッシュROMやA/D Convertersを内臓するなど多機能であり、是非ともボード・メーカに開発して戴きたいものです。'01/6/7 PowerPC関係のページはこちらです。 ◆ 理解し易いCPUの基礎的なページ。或いはマイコンを理解するページを参照。 本格的で高性能なマルチプロセッサ自動制御装置の詳細な仕様はこちらです。 コンピュータと制御関係のページ 制御関係Computerページ 弊社の製品 弊社の低価格なボード・ソフト製品一覧 ◆ このページに情報を掲示されたい方はどうぞお気軽にご連絡下さい、無料で掲示致します。又ご希望があれば御社、貴殿のページへリンク致します。 このページへはご自由にリンクして下さい、その際Eメールでご感想などをご連絡戴ければと思います。
|
||||||||