ASCII24 Top ASCII24 News ASCII24 Review ASCII24 Business Center 携帯24 Mac24 Akiba2GO! デジタル用語辞典 ASCII24 Broadband Center 最新ニュース バックナンバー イベント情報 ASCII24 Top ASCII24 News ASCII24 Review ASCII24 Business Center 携帯24 Mac24 Akiba2GO! デジタル用語辞典 ASCII24 Broadband Center 最新ニュース バックナンバー ASCII24メールサービス blogmag
ASCII24 - [Main Menu] [Menu 2]


  ASCII24 > ニュース > テクノロジー/デバイス
111
記事/用語/ID検索 

最新ニュース
【速報】 待望のiPod shuffleが発売!Apple Storeで実機が触れる(from Mac 24)(2006年11月3日)
【速報】 アップル、 “ホームオーディオを再発見” がテーマのiPod用スピーカー 『iPod Hi-Fi』 を発表――同時にケース2製品も登場(from Mac 24)(2006年3月1日)
【速報】 第3の “Intel Mac” はMac miniだった!――LAN経由で音楽やビデオを配信できる新しい “Front Row” を採用(from Mac 24)(2006年3月1日)
“4倍速い” は本当だった!? ウワサのIntel Macを速攻レビュー(from Mac 24)(2006年2月23日)
アップル、 iPod nanoの1GBモデルを1万7800円で発表――iPod shuffleの価格も改定(from Mac 24)(2006年2月7日)
SARS (重症急性呼吸器症候群) の影響で “Computex Taipei 2003” が延期に!(from Akiba2GO!)(2003年4月30日)
FSBは800MHzの時代へ!Pentium 4-3GHzがアキバで販売開始!(from Akiba2GO!)(2003年4月14日)
NTTグループ、 FOMAとパソコンでのテレビ電話を実現するプラットフォームを発表(from 携帯24)(2003年1月28日)
【集中連載特集・OracleWorld 2002】 “OracleWorld 2002” スペシャルレポート from San Francisco(from ASCII24 Business Center)(2002年11月11日)
アドミラルシステム 『HotBiz』 メーカーインタビュー―― 「ASPにより、 わかりやすく、 運用しやすく、 導入しやすいグループウェアを」 (from ASCII24 Business Center)(2002年8月13日)
「スーパークリエイター=ハッカー」 の世界 - 『ITX 2002 Summer』 レポート(from 日刊アスキー Linux)(2002年6月29日)
【速報】 Netscape最新版公開!! バージョンは7.0! (PR1) (from 日刊アスキー Linux)(2002年5月23日)
JavaOneレポート(from ASCII24 Business Center)(2002年3月29日)
音楽フリーソフトウェアのためのライセンス 「OCPL」 の評価版公開(from 日刊アスキー Linux)(2002年3月5日)
コンパック、 Webサーバアプライアンス 『Compaq TaskSmart W2200』 を発表(from 日刊アスキー Linux)(2001年12月13日)

今週の特集

特集
COMPUTEX TAIPEI 2006レポート
Interop Tokyo 2006レポート
CeBIT 2006レポート
IDF 2006レポート

コラム
過去の記事一覧






Contact Information

[PR]
Printable Version ニュース / テクノロジー/デバイス

東京大学、世界最高速のスーパーコンピューターへの搭載を目的とした高速プロセッサーを開発


2006年11月6日

“2008年までに2ペタFLOPS”を目標に、東京大学などが中心になって研究している、世界最速のスーパーコンピューターの開発プロジェクト“GRAPE-DR”。その成果となる汎用プロセッサーのエンジニアリングサンプルが、6日、報道関係者に公開された。

チップを手にする平木教授
GRAPE-DRプロセッサーを手にする東京大学の平木教授


5000万円で地球シミュレーター並みの性能

GRAPE-DRプロセッサー
GRAPE-DRプロセッサー。プロセスルールは90nmで、台湾TSMCが製造した。17mm角のBGAパッケージとなる。トランジスター数は約3億個。チップのサイズは米AMD社のOpteronプロセッサーとほぼ同等だという

今回公開されたGRAPE-DRプロセッサーは、1チップに512個の要素プロセッサーを搭載し、500MHzの動作速度で、512ギガFLOPS(単精度)/384ギガFLOPS(倍精度)の性能が得られる。現状では、1プロセッサーを搭載したボードしかないが、2006年度中に同チップを4つ搭載可能なプロセッサーボードを開発するという。

1チップあたり512個という要素プロセッサーの数は、米ClearSpeed Technology社のCSX-600(96個)、米IBM社のCyclops(64個)などを大きく上回る世界最高数。チップ当たりの演算性能も、ソニー(株)とIBMが共同開発した“Cell”の256ギガFLOPS(単精度)/25ギガFLOPS(倍精度)、CSX-600の48ギガFLOPS(単/倍精度)、日本電気(株)が開発したSX-8Rの32ギガFLOPS(単/倍精度)、IA32プロセッサーの16ギガFLOPS前後(単/倍精度)などを大きく引き離した性能となっている。

消費電力は最大60W(アイドル時で30W)で、1ワット当たりの演算性能は8.5ギガFLOPS。これもCSX-600の2.5ギガFLOPS、日本電気のSX-8の0.2ギガFLOPSを上回る。開発費に関しても2004年から2008年までの5年間で約15億円とこの種のプロジェクトしては非常に安価に抑えた。

フロアプラン
コアの拡大写真
32個の要素プロセッサーからなるブロックを4×4ブロック配置。各要素プロセッサーは基本的な演算に必要なシンプルなものにした

東京大学 情報理工学系研究科 創造情報学専攻の平木敬(ひらき けい)教授は「“地球シミュレータ”(海洋科学技術センターが保有する、ベクトル型並列スーパーコンピューター)と同程度の性能(約40テラFLOPS)が、100個のGRAPE-DRプロセッサーとラック1本、5000万円の予算、20kWの消費電力で実現できる」と話す。「40テラFLOPSの性能があっても、100人で使えば100分の1の性能になってしまう。しかし、こういったコンピューターはみんなで使わないと意味がないものという矛盾がある。(5000万円という値段であれば)置けない値段ではない」(平木氏)。

低コストを実現できた理由は、インテルアーキテクチャを採用したパソコンへのアクセラレーターとしたため。これにより設計期間の短縮と設計コストの低減が可能になった。また、メモリーバンド幅を有効活用する基本設計を行なっており、メモリーコストを下げられる点も低コストの理由のひとつだという。

GRAPE-DRプロセッサーを搭載したアクセラレーターボードはPCI-X(将来的にはPCI Express)でパソコン(ホストマシン)に装着する。命令やデータは、ホストマシンからFPGAの制御プロセッサーを介してプロセッサーに配布され、その結果がホストマシンのメインメモリーに返される。プロセッサー要素へのデータ分散、プロセッサー要素での計算、結果回収の3フェーズはパイプライン化することが可能。



“ペタFLOPS”を世界最初に実現できるか?

スパコンの性能は今後も伸び続ける
スーパーコンピューターの性能は今後も伸び続け、2011年の段階で世界一になるためには、20ペタFLOPS程度の性能が必要と平木教授

平木教授は「(チップが試作できたことで)世界最初のペタFLOPSを目指すという目標に対して、少なくとも具体的なスケジュールを考えられる段階になった」と語る。

同プロジェクトでは2008年に向け、2ペタFLOPSの“GRAPE-DRシステム”を開発する計画だ。ペタFLOPSクラスの性能を狙った汎用システムとしては、IBMのBlueGene/P、Roadrunner、Cyclops、米クレイ社のBakerなどが研究中で、2008〜2009年にかけて順次登場してくる見込みである。GRAPE-DRシステムは、これらのスーパーコンピューターと世界最速の座を競うことになる。

2ペタFLOPSを実現するために、同システムでは4000個のGRAPE-DRプロセッサーを使用し、512台の汎用クラスタリングサーバーとインターコネクトを約40ラックに収納するという構成を取る。消費電力に関しては500kW程度になる見込み。

また、プロセッサーの開発と並行して、GRAPE-DRに最適化されたコンパイラーも開発中。C言語で記述されたソースを中間言語に変換して、GRAPE-DRコードに変換するプロトタイプが現在動作中だという。

GRAPE-DRの応用分野に関しては、天体多体シミュレーション、分子動力学(MD)、流体シミュレーション(SPH)、Linpack、線形方程式などが演算性能を使い切れる分野として最適。ナノテクノロジーのシミュレーションや量子分子シミュレーション(FMO、RSDFTなど)も有効な分野だという。一方で、メモリーアクセスなどがボトルネックとなる古典的流体シミュレーションやベクトル計算機向けにチューニングされたソフトに関しては苦手な分野になるという。

評価ボード(大)
評価ボード(小)
評価用ボードは現状で2種類。違いはメモリースロットの有無。2006年度中に、4プロセッサーが搭載可能なボードも開発する

また、今後の計画に関して平木教授は、プロセッサーチップを現行の90nmから45nmプロセスにシュリンクすることで、1チップで3〜4テラFLOPS、システム全体で20〜40ペタFLOPSのシステムを“今から始めれば”2010年ごろに実現可能とした。ただし、現状では予算獲得に奔走中という段階で、50億円程度の予算を出してくれるスポンサーを探している段階だという。

(編集部 小林久)


この記事が関連していると思われます


関連記事の検索には汎用連想計算エンジン(GETA)を利用しています。
「汎用連想計算エンジン(GETA)」は、情報処理振興事業協会(IPA)が実施した「独創的情報技術育成事業」の研究成果です。



ASCII24 RealEstate
advertisement



Copyright (C) 1997-2009 ASCII MEDIA WORKS. All Rights Reserved.
No portion of this web site may be reproduced or duplicated without the express written permission of ASCII MEDIA WORKS Inc.
This web site is written in Japanese only.
記事に関するご意見やご質問は、お問い合わせフォームにてお送りください