2011年11月28日月曜日

プロセッサの抱える消費電力の問題

0 コメントする
http://pc.watch.impress.co.jp/docs/column/kaigai/20111128_493449.html?ref=rss
ARMの「big.LITTLE」技術より

ARMやNVIDIAのTegra3が進めるハイパフォーマンスプロセッサ+アイドルプロセッサ

の構成

細かい仕様は異なるものの今までのx86プロセッサでIntelのTurboBoost、AMDのTurboCoreとは異なるアプローチである。

だがしかし、共通する点がある。

それは電力タイムシフトを基準とした発想から来ているという事だ。

上記の記事にもあるように持ち運びを前提とした場合、バッテリーの容量には限りがある。更にバッテリーの進化は年に11%とローペースである。

バッテリーの進化が2倍とすればプロセッサ(CPU・GPU)10倍近以上の進化をしていると私は想像する。

バッテリーの進化が期待出来ないとして、プロセッサの性能を犠牲にする事は出来ない。そこでいかにプロセッサの電力消費を効率良く行うかが課題となる。そこでアイドル時の消費電力を低く抑える必要があるが消費電力を左右する電圧、クロックを下げるには限界がある。

またマルチプロセッサの場合、消費電力もコア数分消費するためアイドル時の消費電力は必然的に上がる。

当然無駄も多い事になる。

intel、AMDのx86系プロセッサの考え方はここまでで止まっている。つまり動作電圧を低く抑えてアイドルの周波数も抑えている。

IntelSpeedStepから始まった初歩的な技術であり、TurboBoostはそれの延長線上にあたる。

つまり平均クロックを3GHzと設定した場合3.4Ghzをピーククロック、1.2GHzをアイドルクロックとする。その場合、ピーククロックは短時間のみ作動し、ある一定時間で区切った場合にその平均が3GHzで動作したとなる。

ARMの考え方はその次のアプローチとして出てきたもの。

上記で説明した通りx86系の考え方の欠点は、あくまで瞬発的な性能向上が必要な場合が多いということに着眼した結果であって、アイドルクロックの下限値は今まであまり大きくは変化していない。また電圧は徐々にであるが下がっているもののここにもまた壁が存在している。

そのため今後はアイドルクロック、電圧ともに下げる事は困難になっている。

そこでARMはその小さなダイサイズをうまく利用し、マルチコアプロセッサとシングルかつ最低限の昨日を備えたプロセッサを用意した。

こうする事でそのプロセッサを動的に変更する事でアイドル時の電力消費を大幅に抑える事に成功している。

ただし、当然のことであるがマルチコアプロセッサがフル稼働した場合は効果はない。

だがモバイル用途においてもそうだが、一般的にフル稼働する機会はあまり多くない。


ならIntelやAMDもそうすればいい

という事になるのだが話はそう簡単にはいかないはずだ。元々の設計が完成しきっているためにメモリ共有などの再設計が必要になる。

またシングルコアプロセッサを内蔵するだけのスペースを用意するのは現状では難しい。

最も現実的な方法でそれを実現するならば、Intelが近い事を行おうとしているがコアをそれぞれ非同期で動かし、必要に応じて段階的にコアを稼働させる事が出来ればARMと近い事が出来ると私は思う。

近い将来そういった製品が出る・・・かも。


そんな事を思ったのでした。

ではでは







2011年11月22日火曜日

大会参加者のパーツ構成

0 コメントする

大会参加者が使用しているパーツ構成情報

文月わらびさん

[CPU]AthlonIIx2 260
[メモリ]CENTURYMICRO DDR3-1333 hynix
[マザーボード]MSI 870A-G54
[CPUクーラー]DEEPCOOL BETA 11
[グラフィックボード]Sapphire Radeon HD3650
[電源]SILVERSTONE 600W

またさん

[CPU]AthlonIIx2 250
[メモリ]G.skill F3-18400CL8D-4GBPIS
[マザーボード]GIGABYTE GA-MA790XT-UD4P
[CPUクーラー]COOLERMASTER Hyper 212Plus
[グラフィックボード]GeforceFX5500
[電源]エナマ MODU+ 625W

Sigmaさん

[CPU]AthlonIIx2 260
[メモリ]CORSAIR CMX4GX3M2A1600C9
[マザーボード]M4A89GTD PRO/USB3
[CPUクーラー]兜
[グラフィックボード]無し
[電源]Antec TP-750AP

コッコさん

[CPU]AthlonIIx2 250
[メモリ]CORSAIR CMZ8GX3M2A1866C9
[マザーボード]MSI 990XAーGD55
[CPUクーラー]スサノオ
[グラフィックボード]HD5450 OC
[電源]KRPW-L3-400W

ていそくさん

[CPU]AthlonⅡX2 255
[メモリ]ADATA-DDR3-2000(Patriotに変更の可能性アリ)
[マザーボード]msi870A-FUZION
[CPUクーラー]Scythe-SCSO1000 スサノヲ
[グラフィックボード]ASUS-HD3450(予定)
[電源]KRPW-L3-600W


あぶそりゅーとさん


[CPU]AthlonⅡX2 260
[メモリ]Corsair CMX4GX3M2A1600C9
[マザーボード]MSI 790fx-gd70
[CPUクーラー]兜
[グラフィックボード]GIGABYTE GV-R575D5-1GD
[電源]KEIAN KTOP-700A-P1


き~やさん

[CPU]AthlonⅡX2 250
[メモリ]CFD W3U1333P-1G DDR3 1GBx2
[マザーボード]AsRock 770DE3L
[CPUクーラー]サイズ KABUTO



情報が入り次第追加予定。




2011年11月18日金曜日

X79とLGA2011とAMD FXな話

0 コメントする
タイトルを見て一体何事と思うかもしれませんが、後々その意味を書くとして。

つい最近出たCPUといえば、両者ハイエンドクラスに位置付けする(?)CPUでした。

なんで(?)かというと両者とも少しばかり問題をかかえているCPUばかりなのです。


[ アーキテクチャの開発が遅れに遅れたAMD FX(Bulldozerアーキテクチャ) ]
上位モデルが11月4日、通常モデルと下位クラスが11月11日に発売になったAMD FX。

まず第一印象はとにかく高クロック。その上マルチコア8スレッド動作で聞こえは非常にいい。

だがしかし、元々このアーキテクチャーは開発が遅れに遅れたアーキテクチャー。本来は2年前ぐらいにリリースする予定だったはずのアーキテクチャーが何故こういう結果になったのか。


・思うように伸びなかった整数演算の性能
まずはアーキテクチャーの本質がどのようなものかを知る必要があるが、このアーキテクチャーは今までの前例にはない変則的な構成をとっている。

このBulldozerアーキテクチャのコアは2コア1モジュール単位で動作している。つまり2の倍数でこのコアは構成される。本来は1コア1コアが独立し、それを増やす事でマルチコアとしてきた。だがしかし、そのまま行くと整数演算ユニット、浮動小数点演算ユニット、L1、L2をそれぞれに設ける必要があるためダイ面積は非常に大きくなる。

そこで、AMDは考えたのが浮動小数点演算ユニットを2コアで出来る限り共通化し、整数演算ユニットを2スレッドに分割しそれぞれにパイプラインを設ける。しかし1スレッドに設けるパイプライン数は減らす。あとは高クロック化でIPC低下分の性能低下をカバーするという仕組みを考えた。いわゆる高クロックで低いIPCをカバーしようとするPentium4的(speed deamon)な考え方だ。(IPC=Instruction-per-Clock クロック当たりの命令実行数 おおよそは演算パイプライン数で決まるが正確な計測方法はないため実計算ではMIPS=Million Instructions Per Secondで比較される

英語版Wikipediaによれば整数演算のベンチマーク結果をクロックサイクルとコア数で割った結果は以下の通り

intel Core i7 2600K→9.43(128,300MIPS)
intel Core i7 3960X→8.89(177,730MIPS)
intel Core i7 875K→7.85(92,100MIPS)
intel Core i7 920→7.7(82,300MIPS)
intel Core i7 980X→7.46(147,600MIPS)

上位がほぼインテルなので以下略

AMD PhenomIIx6 1100T→3.9(78,440MIPS)
AMD FX-8150 →3.78(108,890MIPS)

参考までにゲーム機
XBOX360→2.0(19,200MIPS)
PS3 Cell BE(PPE only)→3.2(10,240MIPS)

ゲーム機は基本的にグラフィックエンジンの方に性能を割り振っているため整数演算で見るとかなり低い数値になる。

また、これだけでCPUの性能を全て測れるわけではなくあくまで参考値になるが、Intelが優勢である事は間違いない。実際ベンチマーク結果を見ていても似た結果が出てくる事からこの結果は正しいといえる。大きな理由としてはHyperThreadingが1コアで2スレッドを用意し、1つの数の多いパイプラインに2つの命令を同時に詰め込み動作させているためでそうする事で1コア当たりで見れば当然数値は高くなる。また、そのパイプラインを休ませることなくデータを処理させる事で常に100%の処理を可能とする。それがHyperThreadingの考え方だ。なのでもし仮にコア数ではなくスレッド数で割るとどうなるか。

2600Kの場合、9.43から更に2を割る。するとおおよそ4.72ぐらい。それでも十分高い数字を出せているのはHyperThreadingの能力向上と巨大なパイプラインとトランジスタ数のおかげだろう。


話をもとに戻すと、ダイの縮小方法が整数演算に響いてしまっているのも事実でこの結果を見てもお世辞にも性能がいいとは言い難い、あくまでコア数分の向上をしただけでAMDの同コア数で比較すれば劣勢に近い。

MIPSの総合値で見ればFX-8150の立ち位置は875K以上2600K以下あくまでインテルのメインストリームの最上位であるCore i7には及ばない。

さらに言えばダイの大きさと消費電力を考えるとやはりintel優勢となる。intelは4コア8スレッドに対してAMDは8コア4モジュールである。ダイの大きさは8コア4モジュールの方が大きくなりやすく、また高クロック化で消費電力も増大する。

総合的にみるとやはり残念なコアと言わざるおえない・・・。ただし、それは現状のコアの話であり今後の進化次第ではおおいに伸びる可能性もある。少なくともOS側がマルチコアを効率よく動かせるようになれば非常に優秀なアーキテクチャーになる可能性を秘めている。更にいえば、これを1モジュールを1コアという単位で見た場合、これは恐ろしい計算能力を持つことになる。つまり8モジュール16コアを同じ大きさに詰め込める事が出来れば凄い事になる。(Opteronがそれにあたる。)

結論としては、現状は苦しい。また2年前に何故実現出来なかったのかといわれれば、確実にそれは高クロック化と消費電力の増大が問題となったためだとわかる。製造プロセスの微細化によりやっと製品化出来るレベルにまで辿り着いたといえるだろう。

また、AMDの考え方はクラスタードアーキテクチャーとしては非常に賢い作りをしているが、本来クラスタードアーキテクチャーはマルチスレッドへの最適化が進みやすいサーバー向きな傾向にあり、上位のサーバー向けにあたるOpteronへの採用を見越しての選択といえる。

以上からしてAMD的にはサーバー向けに効率化させたアーキテクチャーであるといえる。

だがしかし、インテルもサーバー向けにアドバンテージを持たせるべくメニーコアプロセッサを用意しようとしている。

どちらにしてもAMDはアーキテクチャーの改良を早急に行う必要があるだろう。また、一番の問題点は製造上の問題(生産の遅れ、歩留まりの悪さ)がかなり響いている。これを打開しなければ、もともこうもない。


お次はSandyBridgeE。

対してintelの最上位にあたるLGA2011。

intel4004から40周年を記念してなのか年号と同じピン数を採用してきたSandyBridgeE。

そもそも2011もピン数が必要なのはどういう事なのか。

実際にX79のマザーボードを見た時にやはり感じたのはそのプロセッサの占める割合の大きいこと。とても6コア12スレッド納めるだけのソケットには見えない大きさ。それこそ12コア24スレッドぐらい乗るんじゃないかと思うほどである。それぐらいに体感上の大きさがある。

・メインストリームが優秀すぎて現状ではその価値を見いだせないLGA2011
先ほどのAMD FXの比較の時にSandyBridgeEとSandyBridgeも比較にありましたが、それを見る限りSandyBridgeに負けてしまっているのがわかります。果たしてこれの意味はどこにあるのか。


そもそもSandyBridgeEとSandyBridgeの役割を考えるとそれはおのずとわかるのだが、

SandyBridgeE
メインストリームからの差別化を図るためSandyBridgeを拡張する必要がある。ここでの拡張はメモリ周りやPCIe3.0のダイレクト接続などが挙げられる。そのため、試験的な動きを取る事が多い。

SandyBridge
メインストリームとして安定性をとる。SandyBridgeEに対して保守的な動きをとる。

そのためCPUとしての性能だけでは測れない部分がSandyBridgeEにはあるという事になる。

また将来の拡張を見越していることがダイを見てもわかる。

そもそもこのSandyBridgeEはダイを見るかぎり8コア分のダイ面積を持つ。もちろん空いてる2コア分には何もない。いや、正確にはあるのだが無効化されている。

つまり、本当の最上位モデルは8コア16スレッドになる可能性が高い。

またQuadChannelへの対応もコア数が増えればそれ相応に効いてくる可能性は高い。今考えるとLGA1366では6コアでTripleChannelであったことから。8コアでQuadChannelの流れは不思議ではない。

それを考えるとやはりハイエンドである事は間違いないといえる。またPCIe3.0もグラフィックボード2枚挿しでも十分まかなえるレーン数を確保している事からしてもやはりそれ相応といえる。

以上を踏まえるとLGA2011というのはあながち不思議ではない。

ただし、それ以上のピン数を増やした場合、問題となるのはやはりボード面積になる。チップセットが1チップとなったとはいえ、メモリのChannel数の増加でどのみち取れる面積は狭くなる。となると12コア24スレッド6Channelアクセスは難しい。少なくとも1Channelあたり1DIMMに制限される可能性は高そうだ。

実際4Channelでも2DIMMの場合は片面実装メモリでないと動作しないようである。つまりは両面実装であれば1DIMMとなるので実質1Channel1DIMMという事になる。

この辺りはメモリコントローラーの改良が必要となるだろうし、ダイ面積をいかに増やさずにコントロールするかというのも肝となりそうだ。


このあたりはXeonブランド向けにあたるSandyBridgeEPに向けて改良が行われると思われる。


またMICというメニーコアチップも用意されている
Knights Corner accelerator has over 50 cores and delivers 1TFLOPS
このCPUだけで1TFLOPSの演算能力を実現させる。GPGPUよりな50コア以上のx86CPUユニット群という特殊な系統のCPUだ。いわゆるマルチスレッド処理を行うのには有効なので研究用途やサーバーユニットではこれを合わせて使う事が出来る。

ようはこれでAMDのクラスタードアーキタクチャーよりな部分をカバーするという事になる。比較的バランスの取れた構成が作れるということだろう。intelが以前行なっていたメニーコアテストはこれの基礎を作るためだったと推測できる。

というわけでこちらもまだハイエンドとつく割には(?)を付けざる負えない内容となっている。これはAMDの動きを見てというのもあるのだろう。


隠し玉は最後までとっておくintel。それを必死で追うAMD。全てはintelの舞台の上で踊らされているということらしい。


そしてX79、LGA2011とAMD FXの真の意味は「どうしてこうなった」。

X79は開発途中でトラブルをかかえ、ズレ込んだ→どうしてこうなった

LGA2011はそもそもピン数自体が→どうしてこうなった

AMD FXは新たなブランド名を出しいよいよかと期待してた以上に残念な結果→どうしてこうなった

更に言えばintel 3xxx自体もどうしてこうなったなのだが・・・


2011年11月17日木曜日

AthlonII OverClockChallenge 2011

0 コメントする
という事で自作PCの話の前に大会の告知というか、説明というか。基本的には身内話になってしまいますが、AthlonII OverClockChallenge 2011開催します。これはAMDとは一切関係はなくたまたま私の思いつきでやる事になったオーバークロック大会です。

エントリーレベルを考慮した「遊び」としてオーバークロック大会をコンセプトにしています。なので、通常目にするハイレベルなオーバークロック大会とは全く別物です。

まず冷却媒体に液体窒素やドライアイス等は使わず、原始的な空冷のみの大会担っています。

詳細は以下に画像として企画書を用意したので、それを一読していただければ大体の内容がわかると思います。



現状のレギュレーションなので大会前日までレギュレーション変更がある可能性があります。また、参加者はすでに確定しているため参加は出来ませんが、視聴は誰でも出来ます。

ではでは。次はやっとX79のお話。

たまにはGT5の話でも

0 コメントする
久しぶりの更新になります。

今回はGT5の話でもしますね。発売からだいぶ経ったGT5ですが、オンラインでは比較的人はいたりします。オンラインって凄いですね。オンラインに人がいるだけで飽きが中々こない。

という事で、ぼちぼち私もやってたりするわけですが、普段はドリフトメインでオープンロビーにいます。

すると、たまにX1乗って意味不明な行動をしている人がいたりするんですよね。そして体当たりされると・・・。いわゆる荒らしですね。

だいぶそういう人はいなくなったのかなーと思うと意外といるんですよね・・・。まぁ、根本にはたぶん日本に邪魔された外国人がやるケースが目立ってますがw

そして更に元を辿ると回線速度、いわゆるワープ状態が発動するが故に日本人から外国人の入ってくるのが嫌われるケースが多いんですよね。そして相手も相手でそれに気付かないというか・・・。

なので根本にはシステムの問題もあるんですよね。こういった場合、ある一定以上の遅延が発生する場合は警告とか出した方がいいと思うんですよね。

技術的に可能なのかはわかりませんが・・・。



私はほぼ常にBMW Z4 MクーペをミクZ4的な色にして走ってます。エメラルドグリーンみたいな色ですね。ホイールも出来るだけ近いものにして。

最初はネタのつもりで走らせていたのですが

このZ4、NAでパワーはあまりないのですがトラクションのかかり具合が非常によく、ドリフト時の安定感が凄い。更にNAなのも相まってアクセルコントロールがしやすく扱いやすい。

カウンターステアも不安定になりにくくパッドでもバタつきを最小限に抑えやすいという事ですっかりドリフトのメイン車になってしまいましたw

挙動のコントロールもしやすいので相手に合わせるのも比較的ラクです。ただし、直線ではあっさり引き離されてしまいますがw

名前に「fwarabi」といたら私です。まぁ、車も特徴的ではあるので(比較的使っている人が少ない)、だいたいルームにいくと目立ちますw


FT-86のイベント
上位に入ると東京モーターショーの決勝に出場出来るみたいですが、自分が頑張って7400位ぐらいでした・・・orz 真剣にやってるたもりなんですが、アクセルワークが荒っぽくなるとある一定のタイムで止まるんですよね・・・。
2分4秒あたりで確か止まってました。どうも自分のゴーストを見る限り前半セクションより後半セクションの攻略がタイムを縮める鍵になってるのかなーと思いました。

という感じで次は自作PC関連で書きたいと思います。X79も発売されましたし。

2011年11月2日水曜日

録画機のその後、今期のアニメ、今後の予定

0 コメントする
録画機のその後ですが。
そこそこ順調に動作しています。長時間のつきっぱなしでも不安定になる事はなく、録画も失敗する事はないですね。(たまにスクランブルが解除されてないのが見受けられますがw)

ただ、録画が室内アンテナを通してなのでたまにドロップが発生します。
そしてそのドロップが発生したものをエンコードにかけると盛大に音ズレしますw

なのでドロップまたはスクランブル解除を失敗しないようにする必要がありそうです。まぁ・・・室内アンテナである以上無理がありますが・・・。
最終的に室内からマンションのアンテナに変えるので解決しそうですけど。

現状不満に思うことと言ったらそれぐらいですね。動作温度もピークで50度前後と落ち着いてますし。

自動予約もちゃんと動いてるみたいです。Twitter連携もちゃんと動作してるみたい。

QucikSyncVideoを使うという当初の目的は達成出来ませんでしたが、まぁ一段落ついたという事で。

あとはPSPに変換する時、1PASSになってるみたいなので2PASSで綺麗に圧縮したいですね。そのへんは後々する事にしましょう。

あ、あと 時折インターレース解除が出来てないのかインターレース特有の縞々が見える事はありますね。変換しちゃうと気付かないのであまり問題ではありませんが。TSだとそのまま60iで記録しちゃうからなのかな・・・。


今期のアニメ
とりあえず、一通り深夜帯のものを確認していますが、今回は面白いのが多くて困る・・・。

特筆して、ってのはあまりないんですが、全体的にそこそこ面白いですね。

見ているもの。

アイドルマスター

僕は友達が少ない

ベン・トー

真剣で私に恋しなさい!!

マケン姫っ!

UN-GO

ちはやふる

ギルティクラウン

Fate/Zero

境界線上のホライゾン

未来日記

かな。

とりあえず、未来日記・・・((((;゚Д゚))))ガクガクブルブル

ベン・トー4話・・・どっかで聞いたことある曲がwベン・トーの無駄に熱い内容に盛大に笑うw

Fate/Zero OPいいよOPw全体的な作画もこれの右に出るものはないですね。

アイマスは前期に引き続きという感じ。我那覇響と千早がいいねー。あずささん大好きだけどw


マケン姫っ!とまじこいはおっぱいおっぱい!と・・・(ry とにかく色々ひどいw

他も一応見てますが、注目はFate/Zeroとギルティクラウン、ベン・トーですかねぇ。ネタ的にはマケン姫っ!とまじこいもいいのですがwwww


まぁ、今後が楽しみですねぇ。


今後の予定
ビギナー向けオーバークロック大会の開催を予定しています。詳細は後々発表する予定。

あとは、ひっそり音楽の制作も行っていますw

あとは、SCEのハロウィンパーティーで見た蒼姫ラピスが可愛かったのでそのフィギュアの制作を進めています。


あとはDJも年末に向けて再開したいのですが、いかんせんAudio I/Fを用意する資金がないので12月に買えるかなぁ・・・。最近ノートPCの調子も悪いのでどうなることやら・・・。




ということで


ではでは