B4 Training Overview

約7分で読めます

Part 0:超基礎演習

課題 1:SSH 接続

リモートサーバへの SSH 接続を行い、公開鍵認証によるセキュアなアクセスを設定します。 また、SSH 接続のログを解析し、接続の成功・失敗を確認することで、Linux におけるデバッグの基礎を学びます。

目的: SSH を用いたリモートサーバへの安全な接続方法の習得

手順:

  1. リモートサーバ(例:192.168.XX.XX/24)へ SSH 接続せよ.方式は問わない.

  2. 公開鍵認証による SSH 接続を実現せよ

  3. コンフィグ設定により,ssh {username} で接続できるようにせよ.

  4. 接続のログを確認せよ.わざとパスワードを間違えるなどして失敗ログを生成し,そのログを確認せよ.

レポート要件:

  • SSH と周辺知識の概要
  • エラーが発生した場合,その原因,対処方法および工夫点

課題 2:基礎知識調査

システム管理やネットワークに関する重要な基礎概念について調査・学習を行います。仮想化技術、ネットワーク技術、コンテナ技術など、IT インフラの根幹となる技術について理解を深めます。

必須調査項目:

  1. 仮想化技術とコンテナ技術

    • Docker と VM について,それぞれの比較を説明せよ.
    • 動作原理と,各役割を実装するソフトウェアを図で説明せよ.
    • 使用事例と適用場面についてまとめよ.
  2. ネットワーク基礎用語

    • グローバル IP/プライベート IP
    • アドレス:ネットワーク部とホスト部
    • クラスレス,クラスフル
    • クラス A,B,C
    • DNS の仕組みと役割
    • DHCP/DNS サーバの連携
    • VLAN:Port,Tag
    • OSI  参照モデル
    • Layer の話
    • NAT/NAPT
    • 参考 1
    • 参考 2

レポート形式:

  • LaTeX 使用(必須)
  • 1 項目を選択して詳細レポート作成
  • 図表を効果的に使用すること.
  • ページ数:1 枚
  • ファイル名:0_氏名.pdf
  • 提出期限:5 月 8 日 12:00

Part I:ネットワーク構築演習

課題 1:仮想ネットワーク構築

KVM を用いて複数の仮想マシンからなるネットワークを構築し、基本的なネットワーク通信の確認と分析を行います。実践的なネットワーク管理スキルを習得します。

環境構築:

  • Proxmox GUI を使用して 4 台の仮想マシン(Vm0-Vm3)をクローン image.png

割り当てられた VM の ID を+ 1 した ID を設定すること.(例:はじめに 610 が割り当てられたら 611,612…)

実施項目:

  1. ネットワーク疎通確認

    • VM 間のpingテスト

    • 外部ネットワークとの通信確認

    • traceroute等による経路確認

確認項目:

課題 2:NFS(Network File System)

NFS により,VM 間で好きなディレクトリを共有せよ.

課題 3:LDAP/SSSD 構築

より高度なディレクトリサービスである LDAP と SSSD を用いて、セキュアなユーザ認証システムを構築します。現代的な認証基盤の実装について学びます。

LDAP 設定:

  1. OpenLDAP サーバの構築
    • スキーマ設定
    • SSL/TLS 証明書の生成と設定

SSSD 設定:

  1. クライアント側 SSSD 設定
    • LDAP 認証の設定
    • SSL/TLS 接続の確認
    • NSS/PAM 設定

動作確認:

  • ユーザ認証のテスト
  • セキュアな通信の確認
  • アカウント情報の同期確認

Part II:分散システム構築

課題 1:MPI 環境構築

並列計算の基盤となる MPI 環境を構築し、実際の並列プログラムの実行と性能評価を行います。高性能計算環境の基礎を学びます。

環境構築:

  1. MPI のインストール
    • OpenMPI または MPICH 選択
    • コンパイラの設定

動作確認:

  1. サンプルプログラムの実行
    • Hello World プログラム
    • 並列計算プログラム

検証項目:

  • プロセス間通信の確認
  • 実行ログの解析
  • 性能評価の実施

課題 3:Slurm クラスタ構築

分散システムの管理とジョブスケジューリングを行うためのジョブスケジューラである Slurm を用いて、クラスタ環境を構築します。ジョブスケジューリングの基礎を学びます。

環境構築:

  1. クラスタノードの準備

    • マスタノードとワーカーノードの設定
    • ネットワーク設定
  2. Slurm のインストール

    • ソースコードからのインストール

課題 4:グラファナ

グラファナを用いて、分散システムの構成を可視化します。システムアーキテクチャの理解を深めます。

  1. Prometheus の設定
  2. Node Exporter の設定
  3. Grafana の設定
  4. コアごとの CPU 負荷とメモリ負荷を可視化.
  5. ex: Grafana   GUI から Slurm にジョブ投入する仕組みを実現する.

実施項目:

軍 A 担当分野
学生 A VM・システムソフトウェア
学生 B ALL (AI を除く)
学生 C AI・歯・スケジューリング
学生 D 高速化 2・CB2・スケジューリング
学生 E AI・CB1・スケジューリング
学生 F 高速化 1
学生 G AI

軍 B 担当分野
学生 H CB・VM
学生 I 高速化
学生 J 高速化
学生 K AI
学生 L AI 以外
学生 M 頑張る
学生 N 頑張る

B4 担当分野
高速化
高速化
CB・スケジューリング
AI
AI
VM