Skip to content
This repository has been archived by the owner on Oct 30, 2024. It is now read-only.

Latest commit

 

History

History
241 lines (186 loc) · 23.3 KB

arcteam.md

File metadata and controls

241 lines (186 loc) · 23.3 KB

アーキテクチャチーム

アーキテクチャチーム

研究内容

アーキテクチャチームでは,GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や,超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています. 現在の主な研究テーマは以下の通りです.なお,朴及び小林,藤田の3名が共同で適宜指導を行います。朴教授、小林助教、藤田助教の共同募集で募集人数は8名です.

  • FPGAを用いた演算オフローディングと高速通信の融合に関する研究
  • 大規模メニーコアシステムを用いた超並列アプリケーションの実装と最適化に関する研究(朴)
  • FPGAを用いた高速ソーティング回路に関する研究
  • GPUクラスタに向けた並列プログラミング言語に関する研究
  • 次世代スーパーコンピュータの性能予測シミュレータに関する研究

以下に,所属している学生達が行っている研究テーマについて紹介します.

GPU-FPGA複合システムにおけるデバイス間連携機構

キーワード: GPGPU, FPGA, デバイス間連携機構

我々は,高い演算性能とメモリバンド幅を有する GPU (Graphics Processing Unit) に演算通信性能に優れている FPGA (Field Programmable Gate Array) を連携させ,双方を相補的に利用する GPU-FPGA 複合システムに関する研究を進めています. 我々が提案しているAiS(Accelerator in Switch) というコンセプトでは,FPGAを高速通信のできる再構成可能な演算加速装置として捉え,CPU-GPU クラスタ構成である現在のHPC システムの性能を更に向上させる鍵であると考えています.GPUとFPGAを組み合わせた世界初のスーパーコンピュータCygnus (左図) を用いて,実用的なアプリケーションをターゲットにした提案手法の実験を行っています.

右図に AiS コンセプトの概要を示します.各ノードには GPU と FPGA が搭載されており,それらは PCIe バスを介して接続されています.アプリケーションにおける大規模な粗粒度並列処理部分は従来通り GPU が担当しつつ,GPU ではカバーできない並列性の低い演算部分のオフロードおよび高速ノード間通信処理に FPGA を適用することによって,より効率的でレイテンシボトルネックの少ない強スケーリングの実現を目指しています.

高性能なFPGAアクセラレータを利用したアプリケーション開発に関する研究

キーワード: FPGA, OpenCL, FPGAと高性能計算

近年,再構成可能ハードウェアとしてFPGAが注目され,多くの分野で使われるようになってきました.高性能計算においてもその流れがあり,我々は現在利用されているGPUやCPUがどうしても解決できない問題について,FPGAを用いることで高性能化・高速化が行えないか検討しています.また,CPU, GPUに加え,FPGAにおいてもOpenCLプラットフォーム (右図) がサポートされ,FPGAを用いたプログラミングが従来よりも格段に容易になったこともその流れを後押ししています. このOpenCLの記述能力をフルに活用して,プログラミングコストを削減しつつ高性能なFPGAアクセラレータを実現することを目指しています.その一環として,初期宇宙の研究に重要な輻射輸送を解くプログラムで用いられているアルゴリズムをOpenCLで記述してFPGA向けに最適化する研究を本学の計算科学研究センターに所属する宇宙物理の研究者と共同で実施しています.

世界的な活動

朴教授は国際会議における議長やプログラム委員長を務めるなど、世界的に活躍しています.また,小林助教も国際会議のプログラム委員の経験があります.

<iframe width="560" height="315" src="https://www.youtube.com/embed/zT1BKPU8VVk?start=1" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe> <iframe width="560" height="315" src="https://www.youtube.com/embed/RgADPWRNBgM" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe> <iframe width="560" height="315" src="https://www.youtube.com/embed/BDPsa7AP7NA" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>

他チームとの協力

並列プログラミング言語に関する研究はPAチームとの共同研究で,我々のPEACH2をPAチームで開発している並列言語XcalableMPの演算加速装置向け拡張XcalableACCに導入した実績もあります. また,FPGAチームとも協力しFPGAの基礎評価や並列アプリケーションの実装などを行っています.

メンバー

名前 職階 研究内容・メッセージ
朴 泰祐 教授 アクセラレータ, ネットワーク
大規模科学技術計算(計算科学)は,最先端のサイエンスを支える重要な研究であり,我々は本学の計算科学研究センターを始めとする国内外の研究者との共同研究によってこれを実施しています.GPU,FPGA等の計算リソースは今後の同分野の研究推進に重要な要素であり,これらを積極的に用いた大規模計算科学の実質的な成果を目指した研究を日夜進めています.ぜひみなさんの若い力を貸して下さい!
小林 諒平 助教 GPU, FPGA, アクセラレータ, 高性能インターコネクト
FPGAを使って自分だけの高性能ハードウェアを作ってみたい,高性能ハードウェアを簡単に作れる素敵なツールを実装してみたい,FPGAだけじゃなく,CPU, GPUを含めたヘテロジニアスコンピューティングについて探求したいという人は間違いなく当研究室に向いているので,どうぞ見学においで下さい.当研究室は,世界の第一線で活躍されている先生方を多く抱え,かつ学外の一流の研究者とも連携することができ,研究をするにおいてこれ以上無いくらい理想的な環境が用意されています.是非一緒に世界を獲る研究を行っていきましょう!(詳細) (TSUKUBA FUTUREの記事)
藤田 典久 助教 GPU, FPGA, アクセラレータ
大規模な科学技術計算にFPGAを適用する研究をしています。FPGA向けのアプリケーション最適化に関する研究だけでなく、FPGAが持つ高速な外部通信機構を用いて複数のFPGA間で通信し、大規模な問題を複数のFPGAで並列に計算をする研究も行っています。現在のFPGAは開発コストが高く、なかなか一筋縄にはいきませんが、CPUや他のアクセラレータでは実現できない処理がFPGAでは可能であり、将来性のあるデバイスであると考えています。そして何よりも、研究成果が出たときの達成感と喜びは格別です。最近ではフランクフルトで開催された国際会議でHPC in ASIA poster awardを受賞しました。これ以外にも本研究室の研究内容は世界的に評価されているので,「何か凄いことをして世界中の注目を集めてみたい!」とこっそり思っている人にとって本研究室はまさに理想的な環境です。1ミリでも興味を持ったら是非遊びに来て下さい!
佐野 由佳 M2 FPGA, OpenACC
現在は、高性能計算向けに最適化された FPGA でのプログラミングがより簡単になるようなプログラミング環境の研究をしています。自分がやりたい研究があれば、実現のために真摯に向き合ってくださる先生方が数多くいらっしゃいます。高性能プログラミングに興味を持たれた方は是非お越しください。
北爪 開人 M1 FPGA
スーパーコンピュータCygnus上で並列FPGA間通信をより使いやすくするためのフレームワーク改良に取り組んでいます。この研究室は大学内で見てもかなり環境が整っている部類の研究室だと日々感じており、中々手が出ない価格のハイエンドなFPGAやGPUを扱うことができます。「百聞は一見にしかず」かと思いますので、ぜひ一度研究室へ見学にいらしてみてください。
Liang Wentao M1 GPU, FPGA, oneAPI
The supercomputing now is using different kind of accelerator very often, the "traditional" way of using them is by OpenCL. Intel now introduce a new unified programming platform — oneAPI, the platform provided the runtime and library to program different accelerator, including host code. That's a great contribition to heterogeneous computing, and now I'm trying to use it to program both GPU and FPGA.
鈴木 拓実 M1 FPGA
私はHPCの知識がない状態で入り、今は、OpenMP、OpenMPI、Verilog HDL、OpenCLなどのHPCの基本的な言語やライブラリの勉強をしています。先生方がわかりやすく教えて下さり、また、サーバ等の研究設備も整っており、良い環境で学ぶことができます。
堀之内 航 B4 GPU
今年度からArchitectureチームに配属となりました。GPUを使ったアプリケーションの高速化の研究のための勉強をしています。HPCに興味のある方はぜひお越しください。
Guo Zhixuan 研究生 GPU
来年4月からM1になるGuo ZhiXuanです。私の研究はコードをGPU 化し、処理速度を高速化させることです。研究室には優れた教員がおり、充実したリソースと設備も整っています。 HPCの知識を豊富に学ぶことができます。

近年の研究成果

  1. OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA

    • Boku Taisuke, Tsunashima Ryuta, Kobayashi Ryohei, Fujita Norihisa, Lee Seyong, Vetter Jeffrey S, Murai Hitoshi, Nakao Masahiro, Tsuji Miwako, Sato Mitsuhisa
    • ISC High Performance 2023: High Performance Computing, 13999 662-674, Aug, 2023
  2. SYCLに基づく複数の演算加速装置を統一的に扱えるプログラミング手法の提案

    • 藤田 典久, 小林 諒平, Beau Johnston, Narasinga Rao Miniskar, Seyong Lee, Keita Teranishi, Jeffrer S. Vetter, 朴 泰祐
    • 第190回HPC研究発表会, Jul, 2023
  3. NVIDIA H100 GPUにおけるグラフニューラルネットワークの学習精度と実行性能評価

    • 小林 諒平, 藤田 典久, 朴 泰祐, 天笠, 俊之
    • 第190回HPC研究発表会, Jul, 2023
  4. Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs

    • Fujita Norihisa, Kobayashi Ryohei, Yamaguchi Yoshiki, Boku Taisuke
    • Euro-Par 2022: Parallel Processing Workshops, 13835 121-132, May, 2023
  5. HPC利用に向けたFPGA間シリアル通信コントローラKyokkoのIntel FPGAへの実装

    • 北爪 開人, 藤田 典久, 小林 諒平, 朴 泰祐
    • 第189回HPC研究発表会, May, 2023
  6. Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC

    • Kobayashi Ryohei, Fujita Norihisa, Yamaguchi Yoshiki, Boku Taisuke, Yoshikawa Kohji, Abe Makito, Umemura Masayuki
    • PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, 13798 344-358, Apr, 2023
  7. FPGA高位合成における演算性能向上のための空間並列性記述に関する研究

    • 佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐, 佐藤 三久
    • 第188回HPC研究発表会, Mar, 2023
  8. Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs

    • Kikuchi Kohei, Fujita Norihisa, Kobayashi Ryohei, Boku Taisuke
    • HPC Asia '23 Workshops: Proceedings of the HPC Asia 2023 Workshops, 15-23, Feb, 2023
  9. GPU–FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication

    • Kobayashi Ryohei, Fujita Norihisa, Yamaguchi Yoshiki, Boku Taisuke, Yoshikawa Kohji, Abe Makito, Umemura Masayuki
    • HPC Asia '23: Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region, 117-125, Feb, 2023
  10. Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling

    • Boku Taisuke, Fujita Norihisa, Kobayashi Ryohei, Tatebe Osamu
    • ICPP Workshops '22: Workshop Proceedings of the 51st International Conference on Parallel Processing, (8) 1-8, Jan, 2023
  11. 並列FPGA環境における通信システムCIRCUSを用いた集団通信の実装と性能評価

    • 菊池 航平, 藤田 典久, 小林 諒平, 朴 泰祐
    • 第187回HPC研究発表会, Nov, 2022
  12. An Open-source FPGA Library for Data Sorting

    • Kobayashi Ryohei, Miura Kento, Fujita Norihisa, Boku Taisuke, Amagasa Toshiyuki
    • Journal of Information Processing, 30 766-777, Oct, 2022
  13. GPU・FPGA複合型演算加速クラスタを用いた宇宙輻射輸送コードARGOTの多ノード並列化

    • 小林 諒平, 藤田 典久, 山口 佳樹, 朴 泰祐, 吉川 耕司, 安部 牧人, 梅村 雅之
    • 第185回HPC研究発表会, Jul, 2022
  14. Performance Evaluation on GPU-FPGA Accelerated Computing Considering Interconnections between Accelerators

    • Sano Yuka, Kobayashi Ryohei, Fujita Norihisa, Boku Taisuke
    • The Proceedings of the 12th International Symposium on Highly Efficient Accelerators and Reconfigurable Technologies (HEART 2022), 10-16, Jun, 2022
  15. ノードを跨いだGPU・FPGA複合型演算加速による宇宙物理シミュレーションの実装と評価

    • 佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐
    • 第184回HPC研究発表会, May, 2022
  16. HBM2 搭載 FPGA のための Addressable Cache を用いた HPC 向けメモリシステムの性能評価

    • 藤田 典久, 小林 諒平, 山口 佳樹, 朴 泰祐
    • 第183回HPC研究発表会, Mar, 2022
  17. OpenACCによる宇宙物理シミュレーションのGPU+FPGA協調計算の実装

    • 綱島 隆太, 小林 諒平, 藤田 典久, 朴 泰祐, Lee Seyong, Vetter Jeffrey S, 村井 均, 中尾 昌広, 辻 美和子, 佐藤 三久
    • 第183回HPC研究発表会, Mar, 2022
  18. oneAPIを用いたGPU・FPGA混載ノードにおける宇宙物理シミュレーションコードARGOTの実装

    • 柏野 隆太, 小林 諒平, 藤田 典久, 朴 泰祐
    • 第183回HPC研究発表会, Mar, 2022
  19. GPUクラスタを用いた宇宙輻射輸送コードARGOTのOpenACC実装と性能評価

    • 小林 諒平, 藤田 典久, 山口 佳樹, 朴 泰祐, 吉川 耕司, 安部 牧人, 梅村 雅之
    • 第183回HPC研究発表会, Mar, 2022
  20. High resolution of city-level climate simulation by GPU with multi-physical phenomena

    • Watanabe Koei, Kikuchi Kohei, Boku Taisuke, Sato Takuto, Kusaka Hiroyuki
    • Lecture Notes in Computer Science, 13152, Jan, 2022
  21. Multi-hetero Acceleration by GPU and FPGA for Astrophysics Simulation on oneAPI Environment

    • Kashino Ryuta, Kobayashi Ryohei, Fujita Norihisa, Boku Taisuke
    • HPCAsia2022: International Conference on High Performance Computing in Asia-Pacific Region, 84-93, Jan, 2022