Centralized switching networks Computer Architecture AMANO, Hideharu Textbook pp. 92~13 0.

Slides:



Advertisements
Similar presentations
3D Wand による 3 次 元形状計測. 3次元形状計測装置  3D Wand(テクノドリーム 21 社 製)  構成 3D Wand 本体: 7 つの発光ダイオー ドとラインレーザー発光装置が一体となっ た手に持って移動できる電池駆動の装置.
Advertisements

SPSSによるHosmer-Lemeshow検定について
あなたは真夜中に 山の頂上を目指す登山者です
レポート書き方. おしいレポート よく調べてある それぞれの、1文の言っていることは正 しい しかし、全体として、何が言いた いのかわからない 内容の重要だが、全体の構成も重 要である.
7.n次の行列式   一般的な(n次の)行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。
第 3 回 iPhone アプリ開発勉強会 Objective-C 基礎講座 - インスタンスメソッド - 三井 相和.
9.線形写像.
時間的に変化する信号. 普通の正弦波 は豊富な情報を含んでいません これだけではラジオのような複雑な情報 を送れない 振幅 a あるいは角速度 ω を時間的に変化 させて情報を送る.
九州大学 岡村研究室 久保 貴哉 1. 利用中のAPの数の推移 2 横軸:時刻 縦軸:接続要求数 ・深夜では一分間で平均一台、 昼間では平均14台程度の接続 要求をAPが受けている。 ・急にAPの利用者数が増えてく るのは7~8時あたり.
麻雀ゲーム 和島研究室 ソ 小林巧人
5.連立一次方程式.
つくばだいがくについて 芸術専門学群のこと. 筑波大学ってこんなところ 東京教育大学を前身とする大学で、その 創立は日本で最も古い大学のひとつ。 大学の敷地面積は日本で二番目に広い大 学で、やたら坂が多い。移動時間が15分 しかないのに上り坂を三つ超えることがよ くある。
音当て Game 時田 大樹 飛山 雄太郎. 作品の目的 入力として、スイッチを押すと音がスピー カーから流れ、スイッチを離すと、音が止 まる仕組みとなっている。
ノイズ. 雑音とも呼ばれる。(音でなくても、雑 音という) 入力データに含まれる、本来ほしくない 成分.
素数判定法 2011/6/20.
フーリエ係数の性質. どこまで足す? 理想的には無限大であるが、実際に はそれは出来ない これをフーリエ解析してみる.
1章 行列と行列式.
本宮市立白岩小学校. 1 はじめに 2 家庭学習プログラム開発の視点 ① 先行学習(予習)を生かした 確かな学力を形成する授業づく り ② 家庭との連携を図った家庭学習の習慣化.
フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数とい う 比率:
3.エントロピーの性質と各種情報量.
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
Excelによる積分.
1 6.低次の行列式とその応用. 2 行列式とは 行列式とは、正方行列の特徴を表す一つのスカ ラーである。すなわち、行列式は正方行列からスカ ラーに写す写像の一種とみなすこともできる。 正方行列 スカラー(実数) の行列に対する行列式を、 次の行列式という。 行列 の行列式を とも表す。 行列式と行列の記号.
計算のスピードアップ コンピュータでも、sin、cosの計算は大変です 足し算、引き算、掛け算、割り算は早いです
線形符号(10章).
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
複素数.
4.プッシュダウンオートマトンと 文脈自由文法の等価性
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
信号測定. 正弦波 多くの場合正弦波は 0V の上下で振動する しかし、これでは AD 変換器に入れら れないので、オフ セットを調整して データを取った.
1 9.線形写像. 2 ここでは、行列の積によって、写像を 定義できることをみていく。 また、行列の積によって定義される写 像の性質を調べていく。
通信路(7章).
3.プッシュダウンオートマトンと 文脈自由文法
“KING OF POPS” 田口健太郎. 調査  調査内容:マイケ ル・ジャクソンがど のような人生を歩ん できたか  調査方法:インター ネット  問題点:彼の容姿の 変化について、一部 誤解が生じている部 分がある.
6.符号化法(6章).
ビット. 十進数と二進数 十進数  0から9までの数字を使って 0、1、2、3、4、5、6、7、8、9、 10、11、12 と数える 二進数  0と1を使って 0、1、10、11、100、101、11 0、111 と数える.
アルゴリズムとデータ構造 補足資料14-1 「ハッシュ法」
結城諒 司 吉田成 樹 完成予定図 O N! 7セグLE D ランダム表 示 OF F ? 数字が出たら 勝ち!!
3.正方行列(単位行列、逆行列、対称行列、交代行列)
様々な情報源(4章).
論理回路 第1回. 今日の内容 論理回路とは? 本講義の位置づけ,達成目標 講義スケジュールと内容 受講時の注意事項 成績の評価方法.
伝わるスライド 中野研究室 M2 石川 雅 信. どのようなスライドを作れば良 いか 伝えたいこと.
Three-Year Course Orientation International Course.
JPN 311: Conversation and Composition 許可 (permission)
地図に親しむ 「しゅくしゃくのちがう 地図を 使ってきょりを調べよ う1」 小学4年 社会. 山口駅裁判所 県立 美術館 サビエル 記念聖堂 山口市役所 地図で探そう 市民会館 県立 図書館.
方程式を「算木」で 解いてみよう! 愛媛大学 教育学部 平田 浩一.
C言語応用 構造体.
1. 学内や寮への LAN アクセスポイント 設置にともなう接続確認および接続 マニュアルの作成 2. 無線 LAN の Air Station による環境設定 3. 現在進行中の活動 卒業研究中間発表 D1957 河野和宏.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
HKS Analysis Log Jul 2006 Part1 D.Kawama. 第壱部 HKS Sieve Slit Analysis.
1 プログラミング言語論 第5回 手続き呼出し 担当:犬塚. 2 今日の講義 手続きや関数などの呼出しに関わること  手続きの宣言、手続きの定義  名前の束縛とスコープ  ブロック構造  スコープ規則  引数渡し  引数渡しと評価(計算)方式.
8.任意のデータ構造 (グラフの表現とアルゴリズム)
第14回 プログラムの意味論と検証(3) 不動点意味論 担当:犬塚
実験5 規則波 C0XXXX 石黒 ○○ C0XXXX 杉浦 ○○ C0XXXX 大杉 ○○ C0XXXX 高柳 ○○ C0XXXX 岡田 ○○ C0XXXX 藤江 ○○ C0XXXX 尾形 ○○ C0XXXX 足立 ○○
ネットワークの基礎技術と TCP/IP 曹 暁達 ( そう ぎょうたつ ) 国際産業情報学科 2 年 10 月 28 日.
オセロの思考アルゴリズムについて 1103072 岩間 隆浩.
携帯電話でのコミュニ ケーションについて 1班真田 出水 佐伯 堺. 仮説  女性のほうが携帯電話を使ったコミュニ ケーションを重要視する。
小島 肇  Windows ではアンチウイルスソフトウェアは 必須だが、「入れれば安心」というものでは ない  Mac, Linux における費用対効果はかなり低い  現時点ではマルウェアは流行っていないから  Windows を併用している場合は別.
音の変化を視覚化する サウンドプレイヤーの作成
Self-efficacy(自己効力感)について
本文. 考えながら読みましょ う 「いろいろなこと」( 3 行目)は何で すか 「①電話料金はコンビニで支払いをしていま す。いつでも払えますから、便利です。」 「②夕食はコンビニで買います。お弁当やお かずがいろいろありますから。」今、若者に 人気のあるコンビニは、いろいろなことをす るのに非常に便利な場所になった。
Centralized (Indirect) switching networks Computer Architecture AMANO, Hideharu Textbook pp. 92~13 0.
Switches and indirect networks Computer Architecture AMANO, Hideharu Textbook pp. 92~13 0.
Centralized switching networks Computer Architecture AMANO, Hideharu Textbook pp. 92~13 0.
たくさんの人がいっしょに乗れる乗り物を 「公共交通」といいます バスや電車 と 自動車 の よいところ と よくない ところ よいところ と よくない ところ を考えてみよう!
Discrete Optimization (離散最適化) Linear Programming (線形計画) Nonlinear Programming (非線形計画) Network optimization (ネットワーク計画) Mathematical Programming (数理計画)
心臓および肝臓移植会社. 心臓移植は非常に複雑な 手技であり、 zoukiishoku119 は候補者の 評価から手技後のケアま で、各患者の治療に協力 チームアプローチをとっ ています。私たちの多分 野の移植グループには、 心臓専門医、心臓外科医、 看護師、心臓リハビリ専 門家、ソーシャルワー カーが含まれます。これ.
腎臓移植 腎臓移植の前に、ドナー両方の腎臓は機 能的に良好でなければならない。ドナー の両方の腎臓が機能的に健康であること を保証するために、多数の試験が行われ ている。
地球儀と様々な地図. 1 球体としての地球 こうした現象はあることをイ メージすると理解できる。
Ask Have ~ ? / How long ~ ? Answer these questions
Presentation transcript:

Centralized switching networks Computer Architecture AMANO, Hideharu Textbook pp. 92~13 0

Switch connected parallel machines Where the switches are used?  PU-Memory connection: UMA  Node-node connection: NUMA, NORA  Snoop is impossible  Directory based methods or compiler assisted methods are used for UMA/NUMA How to build large scale systems

Switch connected UMA Switch Local Memory CPU Interface Main Memory ........ ….…. Local Memory is sometimes dispensable

Switch connected UMA Blocking Switch Local Memory CPU Interface Main Memory n ........ 1 ….…. 0 1 n 0 Shared Memory

Switch connected UMA Interleaving Switch Local Memory CPU Interface Main Memory n ........ 1 ….…. 0 Shared Memory ….…. ….…. Size: Double word or Cache Line

Switch connected UMA with circular connection Switch CPU Interface Main Memory ........ ….…. Main memory is used as a home memory Interleave is often difficult

Switch connected NUMA Switching Fabrics … Symmetric Multi-Processor Switching Fabrics sometimes become hierarchical structure → Fat Tree Directory based Cache coherent methods are used → CC-NUMA Typical recent high performance server: SUN’s or IBM’s

Switch based network Single stage  Crossbar Multi-stage  Symmetric: Multistage Interconnection Network  Asymmetric: Fat-tree, base-m n-cube → Direct interconnection network

Crossbar switch n m Cross point: small switching element The number of cross points: nxm Extension of the buses

Non-blocking property n m For different destination, conflict free

Head Of Line (HOL) conflict n m X Arbiter is required for each bus The buffer is required The number of cross point is not dominant.

Input buffer switch Crossbar Input buffer One of conflicting packets is selected. Others are stored Into the input buffer

Merit/demerit of Crossbars Non-blocking property Simple structure/Control The hardware for cross-points usually do not limit the system (Fallacy of crossbars) Extension is difficult by the pin-limitation of LSIs  If pins can be used, a large crossbar can be constructed → Earth simulator

Earth Simulator (2002,NEC) Vector Processor … 017 Shared Memory 16GB Vector Processor … 017 Shared Memory 16GB Vector Processor … 017 Shared Memory 16GB …. 639 Inputs crossbar (16GB/s x 2) Node 0 Node 1Node 639 Peak performance 40TFLOPS

SUN T1 Core Crossbar Switch FPU L2 Cache bank Directory L2 Cache bank Directory L2 Cache bank Directory L2 Cache bank Directory Single issue six-stage pipeline RISC with 16KB Instruction cache/ 8KB Data cache for L1 Total 3MB, 64byte Interleaved Memory

Glossary 1 Symmetric: 対象型、どこからでも同じ遅延、手順でアクセス可 能 Asymmetric: 非対象型、遅延、手順が異なる Non-blocking, blocking: 出力ポートが重ならなければ、衝突が起 きないのがノンブロッキング、出力ポートが重ならなくてもス イッチ内部で衝突するのがブロッキング HOL conflict: 出線競合、出力ポートが重なることで起きる衝突 Interleave: インタリーブ、ワード単位など細かいレベルでアド レスを分離して同時アクセスを増やす方法 Multi-stage/Single-stage: スイッチを多段に接続するか、単一段 で接続するかの構成の違い。 Multi-stage Interconnection Network を MIN と呼ぶ

MIN ( Multistage Interconnection Network) Multistage connected switching elements form a large switch. Symmetric Smaller number of cross-points, high degree of expandability Bandwidth is often degraded Latency is stretched

Classification of MIN Blocking network : Conflict may occur for destination is different :NlogN type standard MIN,πnetwork, Re-arrangeable : Conflict free scheduling is possible : Benes network 、 Clos network ( rearrangeable configuration ) Non-blocking : Conflict free without scheduling : Clos network (non-blocking configuration) 、 Batcher-Banyan network

Properties of MIN Throughput for random communication Permutation capability Partition capability Fault tolerance Routing

Blocking Networks Standard NlogN networks  Omega network  Generalized Cube  Baseline Pass through ratio (throughput) is the same. Π network

Omega network The number of switching element (2x2, in this case ) is 1/2 N x LogN

Perfect Shuffle Rotate to left 000 001 010 011 100 101 110 111 000 010 100 110 001 011 101 111 Inverse Shuffle Rotate to right

Destination Routing Check the destination tag from MSB If 0 use upper link, else use lower link. 1→ 3 0 1 1 5→65→6 1 1 0

Blocking Property For different destination, multiple paths conflict X 0→00→0 4→24→2

For using large switching elements ( Delta network ) In the current art of technology, 8x8 (4x4) crossbars are advantageous. 00 01 10 11 20 21 30 31 00 01 10 11 20 21 30 31 01230123 01230123 1 2 Shuffle connection is also used.

Omega network The same connection is used for all stages. Destination routing A lot of useful permutations are available. Problems on partitioning and expandability.

Generalized Cube Links labeled with 1bit distance are connected to the same switching element

Routing in Generalized Cube The source label and destination label is compared (Ex-Or ): Same(0) : Straight Different (1) : Exchange 001→

Partitioning The communication in the upper half never disturbs the lower half.

Expandability A size of network can be used as an element of larger size networks

Generalized Cube Destination routing cannot be applied. The routing tag is generated by exclusive or of source label and destination label. Partitioning Expandability

Baseline Network The area of shuffling is changed bit shuffle2bit shuffle

Destination Routing in Baseline network Just like Omega network 1 1 0

Partitioning in Baseline

Baseline network Providing both benefits of Omega and Generalized Cube  Destination Routing  Partitioning  Expandability Used in NEC’s Cenju

Π network Tandem connection of two Omega networks

Bit reversal permutation (Used in FFT) Conflicts occur in Omega network 0426153704261537 01230123 45674567

Bit reversal permutation in Π network 0426153704261537 0527143605271436 The first Omega : Upper input has priority. The next Omega : Destination Routing Conflict free

Permutation capacity All possible permutation is conflict free = Rearrangeable networks Tree tandem connection of Omega network is rearrangeable. The tandem connection of Omega and Inverse Omega (Baseline and Inverse Baseline) is rearrangeable. Benes network

Benes Network Note that the center of stage is shared. The rearrangeable network with the smallest hardware requirement

Non-blocking network Clos network  m>n1+n2-1 : Non-blocking  m>=n2 : Rearrangeable  Else: Blocking

Clos network... n1xm r1xr2mxn2 r1 m r2r2 m=n1+n2-1 : Non-blocking m=n2 : Rearrangeable m<n2 : Blocking The number of intermediate stage dominates the permutation capability. 3-stage

Batcher network 5704213657042136 5740126357401263 0457632104576321 0123456701234567 Bitonic sorting network

Batcher-Banyan 5704213657042136 5740126357401263 0457632104576321 0123456701234567 Sorted input is conflict free in the banyan network Omega Baseline

Banyan networks Only a path is provided between source and destination. The number of intermediate stages is flexible. Approach from graph theory SW-Banyan , CC-Banyan , Barrel Shifter Irregular structure is allowed.

Batcher-banyan If there are multiple packets to the same destination, the conflict free condition is broken → The other packets may conflict.  The extension of banyan network is required. The number of stages is large. → Large pass through time  The structure of sorting network is simple.

Classification of MINs Omega Baseline Generalized Cube π Benes Clos Batcher Banyan Blocking Rearrageble Nonblocking

Fault tolerant MINs Multiple paths Redundant structure is required. On-the-fly fault recovery is difficult. Improving chip yield.

Extra Stage Cube (ESC) An extra stage + Bypass mechanism X If there is a fault on stages or links, another path is used.

The buffer in switching element Conflicting packets are stored into buffers

Hot spot contention Buffer is saturated in the figure of t ree ( Tree Saturation) Hot spot

Relaxing the hot spot contention Wormhole routing with Virtual channels → Direct network Message Combining  Multiple packets are combining to a packet inside a switching element (IBM RP3)  Implementation is difficult (Implemented in SNAIL)

Other issues in MINs MIN with cache control mechanism  Directory on MIN  Cache Controller on MIN MINs with U-turn path → Fat tree

Glossary 2 Rearrange-able: スケジュールすることにより、出力が重ならな ければ内部で衝突しないようにできる構成 Perfect shuffle: シャッフルは、トランプの札を切る時に使う単語 だが、ここでは、配線のつなぎ方の方式のひとつ。 Inverse shuffle は逆シャッフルと呼ばれ、逆接続方式。 Destination routing :目的地のラベルだけで経路を決める方法 Permutation: 並び替え、順列のことだが、ここでは目的地ラベル が重ならない経路を無衝突で生成することができる能力のこと Partitioning: ネットワークを分離して独立に使える能力のこと Fault tolerance: 耐故障性。一部が故障しても全体がダウンしない ような性質、 Fault tolerant MIN は複数経路を持たせた MIN Expandability: 拡張性、小さなものからサイズを大きくしていくこ とのできる性質 Hot spot contention: 局所的に交信が集中して、これが全体に波 及すること。 Tree saturation: Hot spot contention によりネットワークが木の 形で飽和していく現象。特に MIN で起きる。 Message Combining は、メッセージをくっつけてまとめることによりこれを防止する 方法の一つ

Exercise Every path between source and destination is determined with the destination routing in Omega network. Prove (or explain) the above theory in Omega network with 8-input/output.