45214 Datamaskinarkitektur - Øvinger 1995


Løsning 6


Oppgave 1

a) Minimum-tid (dvs. tid dersom dataavhengigheter ikke eksisterer) = k+(M-1).

Forventet forsinkelse pr. instruksjon gitt at dataavhengighet virkelig eksisterer tex2html_wrap_inline159 .

Forventet forsinkelse pr. instruksjon når det ikke forutsettes noe om hvorvidt den aktuelle instruksjon har dataavhengighet til forgjengere tex2html_wrap_inline161 .

Forventet total forsinkelse tex2html_wrap_inline163 .

Forventet utførelsestid for de M instruksjonene:

displaymath129

displaymath130

Nå er

displaymath131

og

displaymath132

slik at

displaymath133

b)

Ytelsen:

displaymath134

displaymath135

displaymath136

displaymath137

Oppgave 2

a) Vi skal sammenligne hastighetsøkningen for en superpipeline, en superskalar og en superpipeline og superskalar maskin med en skalar maskin med T(1,1) = k + N - 1.

  1. Superpipeline: For en ``super''-samlebåndet (Eng.: superpipelined) prosessor av grad n vil syklustiden for samlebaandet være tex2html_wrap_inline169 av base syklus til den skalare prosessoren.

    Minimum tid som trengs for åutføre N instruksjoner for en super-samlebåndet maskin av grad n med k steg i samlebåndet vil bli:

    displaymath138

    Dermed vil maskimal hastighetsøkning bli:

    displaymath139

    Hastighetsøkningen tex2html_wrap_inline171 , når antall instruksjoner, tex2html_wrap_inline173 .

  2. Superskaler:

    For en ``super''-skaler prosessor, som henter m instruksjoner samtidig, vil ideel utførelsestid være:

    displaymath140

    hvor k er tiden som trengs for åutføre de første m instruksjonene gjennom samlebåndet, og tex2html_wrap_inline175 er tiden for de N-m gjenstå ende instruksjonene, hvor m utføres pr. syklus.

    Den ideelle hastighetsøkningen for dette tilfellet vil bli:

    displaymath141

    Hastighetsøkningen tex2html_wrap_inline177 , når antall instruksjoner, tex2html_wrap_inline173 .

  3. Superpipeline og superskalar:

    For en ``super''-skalar, ``super''-samlebåndet prosessor får vi:

    displaymath142

    Hastighetsøkningen tex2html_wrap_inline181 , når antall instruksjoner, tex2html_wrap_inline173

b) En skalar prosessor på 25 Mhz, henter 1 instruksjon pr. syklus, og har (m,n) = (1,1).

DEC's Alpha prosessor DEC 21064-A, 150 MHZ, henter maskimalt to instruksjoner pr. syklus. Den har en syklustid som er 150Mhz/25MHz = 6 ganger det skalare tilfellet, og får (m,n) = (2,6).

Noe upresist kan vi derfor påstå at DEC's Alpha prosessor er m x n = 2 x 6 = 12 ganger raskere enn en prosessor på 25 Mhz.



Pauline Haddow(pauline@idt.unit.no)
Last modified: Wed May 1 16:43:14 MET DST 1996