CPUの速度とクロック

Athelon がデュアルコアになって最もモデルナンバーの高いCPUは4800+となりました。
実際の動作クロックではなく 処理速度の相対的な評価の数字として4800+という数字があります。これに対してインテルプロセッサーナンバーという区分はありますが 各自の速度が一体どれが速いのかすら解らない位置づけになっています。
まあ、どちらも大した意味は無いのですが と言うのは速度に関して多くのユーザーは既に満足していてさほどの速度差も無いものに 大きな金額を投資できなくなってきています。
いっぱしのPCをOSディスプレイつきで買う金額と、最高峰のCPUを購入する金額とを比べても変わらないのではそうなるのも仕方ないでしょう。
しかし、AMDの評価は巧妙で IntelのCPUがクロック表記を引きずっているので 3.2GHzのCPUに対しての4800+は4.8G数十パーセントも性能が向上したように見えます。
実際には、IntelのCPUは言葉どおり内部の演算装置は3.2Gのクロックで動作しているのに対して、AMDのこのCPUは2.4GのCPUコアを二つ搭載してその速度を稼いでいるかたちになります。
CPUのクロックは最低限の一単位として、一つの処理をCPUがこなす為の単位時間となります。
例えば32bitCPUであれば2の32乗の数値同士の足し算 若しくは引き算にかかる速度が1クロックとなるわけですが、それだけを考えれば 3.2Gに2.4GのCPUが適うはずが無いのです。この例にデュアルコアのCPUを出したのが悪くて逆に解りにくくしているかもしれませんが・・・・
でも、AMDの取ったモデルナンバーは2600+でも 1.3G程のCPUクロックで書いてある性能とクロックとの相関関係がなくなっています。
じゃあ、クロック以上にCPUの速度を比較する物差しがあると考えられます。
さっきのような単純演算を例に取れば、クロックの速度=性能の式に間違いは無いのですが 例えば足し算をする装置がCPU内部に複数個あったらどうなるのでしょう?
単純に、電卓を持った人一人に、10ページの計算用紙の足し算をやってもらうとしましょう。それに対して10人の人と10個の電卓を持って同じ計算を10人で1枚づつに分けて計算した場合 同じ計算であれば 10倍の速度で計算が出来ます。
現在のCPUは 演算ロジックを複数個一つのCPU内に持っています。
いま、簡単に10枚の紙を1枚ずつに振り分けましたが 一つずつ順番に計算を渡されて計算する場合は、結果的には10枚の紙を一人ずつに振り分けて計算するのが速かったのですが 一つづつの計算をこなしている段階では 紙が1枚なのか10枚なのか解りません。なので、きっと10枚に違いないと予測を立ててみんなで分散して計算を行ったりする機能がCPUにはついています。(この例え 幾分矛盾を発生しますが見逃してください)。ところが、所詮予想です。当るも八卦 当らぬも八卦。出来る限りその確立を上げるべくロジックは設計されますが、それでも 予想を外すことはあります。そうすればCPUはせっかくした計算を そのままゴミ箱にぽいする訳です。
これに費やされたエネルギーが、ただの無駄になり地球の環境問題にやさしくないわけです。
このロジックの部分ですが、最適化を優先すれば ロジックが複雑化し、最適化を軽減すれば 無駄な計算が増えるわけです。
では、最適化を優先すれば良いわけですが、ロジックが複雑化すればするほど そのCPUのパターンが複雑化し 複雑になったロジックは熱を発生させて CPUクロックの向上の制限を作ります。
Intelno現在のPentium4のネットバースト(今となってはいいネーミングです)ロジックは、処理ロジックの最適化を計り、クロックの向上こそが速度を向上させる鍵になるという一貫したポリシーで突き進んできました。
どんなに先読みで失敗しても、力任せにばりばりと速度を上げていったのですが・・・
物理的な限界が思いのほか速くやってきました。
このまま、クロックが限界まで来れば、その時にはもっと小さい配線ルールでCPUを作ればダイサイズも小さくなり 配線は短くなり速度を向上させる余地が出来る。また小さくなった分消費電力も下がるはずだったのですが、途中でそれも3Gを越えた頃から失速を始めます。
半導体のコストは、一枚のシリコンの板からいくつ取れるかで多くの部分が決まります。
性能向上の為に徐々に増えてゆくキャッシュのサイズは 製造コストを押し上げ利益を削ってゆくにも拘らずキャッシュを増やして CPUの性能を押し上げる方向性を向けなければならなくなっています。
それに対してAMDは、ロジックが少しぐらい複雑になっても、1クロック当りの性能を上げて実性能で対抗しようと言う物でパイプラインの使い方や、仕事の振り分けでIntelよりも性能は上のようです。
もちろん、これはどちらの技術力が高いとか低いとか言う物ではなく、基本的なポリシーの問題と方向性の問題、そして、AMDが後追いだった為に選択できた結果なのかもしれません。
現に、PentiumMと呼ばれるCPUは消費電力の面では AMDより良好な性能を示し 詳しくはややこしくなりますが クロック当りの処理能力でもAMDに近いものであるかと思います。
もっとも影響を大きく受けたのが、今回のデュアルコア化。
Pentium4のCPUもAMDのCPUも僅かなサイズに二つのCPUコアを搭載する関係上、熱と消費電力の関係である程度以上のクロックに上げられない事情があります。
横並びで2.4G辺りに集まったクロックがそれを示しているでしょう。
同一クロックならAMDが速いと言う図式は既に出来上がっており その結果が現在の状況でしょう。
もちろん、高速のCPUを必要とする処理、マルチメディア系や3D系はMMXと呼ばれる専用の演算機を搭載してカバーしているにせよ その動作速度までクロックに同期している手前落ちてしまうので、Intelにとって苦しい展開になっています。
どちらにしても、既に分子のサイズが認識できるほど配線の太さが細くなり 予想しえた以上の物理法則が壁となってぶつかってきました。
NotePCの売上が デスクトップPCの売上を抜いたそうですが、購買意欲の壁も性能向上を基点とする態勢から大きく変貌してしまったようです。
PDAのCPUもそうで、PXA250が世に出る前200MクラスのPDAが当たり前でPXA250がでて400Mまで一気に駆け上りました。
勿論、動画再生等のCPUのフルパワーを使いきる作業もありますが、全てのCPUパワーを使いきる作業がそんなに多くないことを。
特に現在のPXA270シリーズのPDAを持っている人達は 動画再生も軽くなってきたと感じていると思いますし、実際に多くの人はCPUのクロックを自動にしているので、一般的なMPEG1程度の動画再生であれば 200M以下程度のクロックで動いています。
じゃあと、200M時代のPDAを持ってきて同じ再生をフルパワーモードで行っても決して満足の行く結果にはなりません。
知らない間に、クロックだけの評価では測れない性能評価がPDAの世界にも同様にやってきているんですよね・・・