Header First

This is a debugging block

Header Second

This is a debugging block

Branding

This is a debugging block

User Bar First

This is a debugging block

User Bar Second

This is a debugging block

Eerste hulp bij computer ongevallen

Content

This is a debugging block

Alle onderstaande informatie is niet meer actueel en correct. Deze pagina bestaat enkel nog voor historische redenen.

Indien je nog vragen hebt die hieronder niet beantwoord worden: toon.verstraelen@UGent.be

1. Algemeen

Management page van de switch: http://molmanag.ugent.be/

loging: root
pass: MolMod

Als de stroom uitgevallen is moet je de poorten herconfigureren. De netwerkkaarten in de p575 nodes "gebruiken een ander protocol dan de meeste andere hardware" om te negotiëren over de link snelheid. (Lees: probleem met firmware op netwerkaarten dat niet opgelost geraakt.) Dit kan je half oplossen door in te loggen op de switch en de poorten 9 t.e.m. 17 in te stellen op 100M Full Duplex.

2. IBM

2.1. Contactgegevens

Dirk Devoghel, GSM: +32 475 94 89 54, Technicus Fitit, Dirk.Devoghel@fitit.be
Wim Uten, GSM: +32 477 60 78 34, Technicus Fitit, Wim.Uten@fitit.be
Joost Delaere, GSM +32 475 33 80 80, Technicus IBM, joost_delaere@be.ibm.com
Centraal nummer bij IBM om een call te openen: 02/225.36.11 of 070/23.33.92

2.2. Hoe een call openen bij IBM

Zorg dat je de volgende gegevens steeds bij de hand hebt:

serie en typenummbers van de machines die een probleem hebben.
Ons IBM klantennummer: 00092839
Als een machine vastloopt: operator panel value noteren en mee doorgeven.
Bellen naar 02/225.36.11 of 070/23.33.92

Referentie code van de Call steeds goed bijhouden. Als het gaat om een zuiver hardware probleem moet je dit duidelijk vermelden. Het vervangen van een onderdeel valt onder de gewone garantie terwijl er voor andere problemen een support contract nodig is.

2.3. Aanschakelen

Je dient de onderstaande stappen in de juiste volgorde uit te voeren.

1) Steek de stekkers in de bijpassende stopcontacten van alle IBM racks. Dit zijn er twee rode en één blauwe.

2) Zet de HMC's aan. Dit zijn de twee machines in de kleine IBM rack die 1 U hoog zijn. De schakelaar is een klein wit toetsje aan de voorkant van de HMC dat je met een balpen moet indrukken.

3) Zet de grote rode schakelaar aan de voorkant van de grote IBM rack op 1.

4) Log in op de één van de HMC's met het hscroot account (paswoord init00). De HMC's bevinden zich in de kleine IBM rack. Om op deze machines te kunnen werken, trek je het scherm en het toetsenbord naar voor en klap je het scherm omhoog. Scherm, toetsenbord en muis zijn met een KVM switch verbonden aan de twee HMC's en de moldyn60. Druk om de 'Print Screen' toets om te wisselen van machine. Met de pijltjes kan je vervolgens een andere machine kiezen en vervolgens druk je op enter. De HMC software start normaal gezien automatisch na het inloggen. Volg in het linkerpaneel van de HMC software de volgende items: 'Management Environment' -> ' Localhost.localdomain' -> 'Server Management'. Nu zie je een lijst met servers in het hoofdpaneel. Klap alle items in de stamboom in het hoofdpaneel open.

5) Klik met de rechterknop op het item 'Server-...' van de moldyn60 en kies uit de popupmenu: 'Power on managed system'. Dit duurt even, ook nadat het dialoogvenster verdwenen is, zie je dat dit nog niet direct klaar is. Wacht tot er bij status iets staat als 'Done' of 'Operating'. Vervolgens klik je op het item 'moldyn60' met de rechterknop en kies je 'Boot partition' (of iets gelijkaardig). Dit duurt weer een tijdje.

6) Pas als de moldyn60 volledig opgestart is, kan je voor de moldyn61, 62, 63, ... deze procedure herhalen. Dit mag tegelijkertijd. Dit gedeelte duurt bijzonder lang.

7) Voer het commando mount /calc uit na het opstarten van een machine.

8) Controleer voor alle zekerheid dat de settings van de switch juist staan. (Zie algemeen)

9) Van zodra alle machines opgestart zijn: start LoadLeveler door het commando llctl -g start uit te voeren vanuit het root account op de moldyn60.

2.4. Uitschakelen

Dit is volledig het omgekeerde van wat hierboven staat, dus ook in de omgekeerde volgorde.

2.5. Serienummers (SN) en Typenummers (TN)

Xeons

  • moldyn47
    SN: KDCZWAY
    TN: 797842G
  • moldyn48
    SN: KDCZWAZ
    TN: 797842G
  • moldyn49
    SN: KDCZWBA
    TN: 797842G
  • moldyn51
    SN: KDCZWAX
    TN: 797842G
  • moldyn52
    SN: KDNTYAK
    TN: 7979B59
  • moldyn53
    SN: KDNTYVC
    TN: 7979B59
  • moldyn54
    SN: KDNTYXR
    TN: 7979B59
  • moldyn55
    SN: KDNTYXV
    TN: 7979B59

p510

  • moldyn60
    SN: 06-8DE7A
    TN: 9110-510

p575

  • moldyn61
    SN: 83-7D2EA
    TN: 9118-575
  • moldyn62
    SN: 83-7D28A
    TN: 9118-575
  • moldyn63
    SN: 83-B64DC
    TN: 9118-575
  • moldyn64
    SN: 83-B64EC
    TN: 9118-575
  • moldyn65
    SN: 83-B64FC
    TN: 9118-575
  • moldyn66
    SN: 02-3CD7F
    TN: 9118-575
  • moldyn67
    SN: 02-3CD8F
    TN: 9118-575
  • moldyn68
    SN: 02-3CD9F
    TN: 9118-575
  • moldyn69
    SN: 02-3CD65
    TN: 9118-575

2.6. LoadLeveler her-configureren

De configuratie file staat op de volgende locatie:

/moldynsoftware/loadl/LoadL_admin

Om deze te kunnen bewerken moet je root worden met het commando su -. De inhoud van de file is self-explaining. Als de file aangepast is, moet de configuratie van LoadLeveler terug ingeladen worden. Dit doe je met het commando llctl -g reconfig. (Lopende jobs zijn niet gevoelig aan deze veranderingen.)

Some more useful commands:

  • Drain a machine: llctl -h moldyn65 drain
  • Resume a drained machine: llctl -h moldyn65 resume
  • 3. SGI

    3.1. Contactgegevens

    Als er een probleem is met de altix machines moet je een case loggen via http://support.sgi.com/ of je kan dit telefonisch doen via de hotline: +32 02 713 01 01. Eens je een case gelogd hebt, zullen de technici van SGI je contacteren om de zaak verder af te handelen. Om aan te geven met welke machine je een probleem hebt, dien je het serienummer te vermelden. Voor onze machines zijn dit:

    • moldyn40: N0000624
    • moldyn50: N0000744

    3.2. Aan- en uitschakelen

    Hiervoor moet je een laptop of een andere machine via de seriële kabel verbinden met een altix. Aan de kant van de altix mag je eender welke seriële poort gebruiken waar CONSOLE boven gedrukt staat. Let er op dat de onderste vier bricks de moldyn40 vormen en de bovenste vier bricks de moldyn50.

    1. De instellingen van de Seriële poort op de laptop. Dit zijn standaard instellingen, behalve voor device. Dat staat standaard meestal op /dev/ttys1 owv historische redenen. Vroeger was de muis verbonden met /dev/ttys0.

    Snelheid [Bps of baud]38400
    Device/dev/ttys0 (analogon van COM1 voor unix)
    Bits8
    ParityNone
    Stopbits1
    (Software) flowcontrolNo
    Hardware flowcontrolYes

    2. Configuratie van minicom op linux (Hyperterminal van windows is te vermijden.) Start eerst minicom in configuratie mode: minicom -s Dit voorkomt dat minicom een modem initialisatie string over de seriële kabel stuurt bij het opstarten. Bovendien wordt meteen ook een configuratie menu gestart. De modem strings zijn hier ongewenst omdat er geen modem aan te pas komt. Deze initialisatiestrings zouden gewoon door de altix ontvangen worden alsof je die zelf ingetikt hebt. Dit is te vermijden, zeker in kritieke situaties zoals een crash. In de configuratie menu stel je de bovenstaande parameters in en verwijder je alle modem strings. Bewaar vervolgens deze instellingen in de default configuratiefile (save configurations as dfl) en kies dan 'Exit minicom'.

    3. Opstarten minicom om verbinding te maken. Voor de analyse achteraf, is het best dat je minicom nu start in capturing mode: minicom -C altix01.cap Druk één maal op enter en dan antwoordt de altix normaal met één of andere command line. Om af te sluiten tik je Ctrl-A en vervolgens Q. Je hoeft minicom niet af te sluiten tijdens het rebooten van de altix. Het is zelfs aangeraden om dit niet te doen! Indien je experimenteert met minicom om alles onder de knie te krijgen, verbind dan de seriële kabel met de gigabit switch die naast de altix staat. Dit is financieel voordeliger als er iets irreversibel misloopt.

    4. Gebruik van de Level1 controller op de altix. De level1 controller is een machine die een aantal basisvoorzieningen zoals de stroomvoorziening en communicatie tussen de nodes regelt. De level1 command prompt kan tijdens een seriële verbinding opgevraagd worden met ctrl-t. Indien je meerdere level1 commando's wil intikken, tik dan eerst het l1 commando in. De level1 controller kan je dan verlaten met ctrl-d. Enkele handige commando's zijn:

    • pwr geeft een overzicht van alle voedingsspanningen.
    • pwr d schakelt de stroom uit voor alle bricks.
    • pwr u schakelt de stroom aan op alle nodes. (Dit doe je pas nadat het besturingssysteem behoorlijk afgesloten is of de machine vastgelopen is.)
    • reset een zachte reset. Dit werkt niet voor de CPU's die vastgelopen zijn!!!
    • help een overzicht van alle level 1 commando's
    • env power off schakelt de controle op de voedingsspanningen uit.
    • log Geeft je een overzicht van alle log messages die de level1 controller heeft bijgehouden. Dit is handig om te controleren of er ooit een voedingsspanning buiten zijn range is geweest.


    5. Aanschakelen

    • Verbind de laptop met een c-brick van de altix
    • Log in via de seriële kabel
    • Ga naar de level1 controller
    • Gebruik het commando * pwr u en verlaat de level1 controller.
    • Het opstarten duurt ongeveer 5 minuten en er is verder geen manuele interventie nodig
    • Let er op dat de EFI-boot-manager 12 CPU's raporteert


    6. Uitschakelen

    • Als root: shutdown -h now Wacht tot dit volledig afgelopen is.
    • Indien nodig kan je op de level1 controller * pwr d intikken.

    3.3. Licentie gegevens

    3.3.1. Intel (enkel moldyn40)

    In principe gebruiken we deze licenties strikt genomen niet. De licentiemanager software (flexlm) is hopeloos slecht en er zijn gratis te gebruiken licenties beschikbaar waar we als academische gebruiker recht op hebben. Voor de volledigheid:

    hostname: moldyn40
    lmhostid: e0000270 (Deze nummer is vast verbonden aan machine. Je kan hem opvragen met het commando lmhostid.)
    Licenties voor compilers zijn floating (met flexlm license server), voor vtune en ipp hebben we fixed licenses

    License files

    l_cpp_06372954.lic

    SERVER moldyn40 e0000270 28518
    VENDOR INTEL
    PACKAGE I0000000000001 INTEL 2005.0128 AFFE5004950F COMPONENTS=CComp \
    OPTIONS=SUITE ck=150 SIGN=4E0C48D83238
    INCREMENT I0000000000001 INTEL 2005.0128 permanent 2 79147A5630F6 \
    VENDOR_STRING=SUPPORT=ACAD HOSTID=ANY PLATFORMS="i86_r \
    it64_lr" DUP_GROUP=UH ck=146 SN=SMSA06372954 SIGN=4AC522AE8EA6

    l_for_94958626.lic

    SERVER moldyn40 e0000270 28518
    VENDOR INTEL
    PACKAGE I0000000000004 INTEL 2007.0128 B4CC47AE417D COMPONENTS=FComp \
    OPTIONS=SUITE ck=127 SIGN=CD1F204219EC
    INCREMENT I0000000000004 INTEL 2007.0128 28-jan-2007 2 945CB81C4224 \
    VENDOR_STRING=SUPPORT=ACAD HOSTID=ANY PLATFORMS="i86_r \
    it64_lr" DUP_GROUP=UH ck=95 SN=SMSA94958626 SIGN=833B0AD80270

    l_vt_89373535.lic

    PACKAGE I0000000008000 INTEL 2005.0128 0B4F3C9442A1 \
    COMPONENTS=PerfAnl OPTIONS=SUITE ck=137 SIGN=F3FB02541804
    FEATURE I0000000008000 INTEL 2005.0128 permanent uncounted \
    CCE0B3DC5C4B VENDOR_STRING=SUPPORT=ACAD HOSTID=ID=07935163 \
    PLATFORMS=i86_r ck=174 SN=SMSA89373535 SIGN=E2544A103170

    l_ipp_90201766.lic

    PACKAGE I0000800000000 INTEL 2005.0128 62B08879D3F2 \
    COMPONENTS=PerfPrim OPTIONS=SUITE ck=109 SIGN=11FFECA86F94
    FEATURE I0000800000000 INTEL 2005.0128 permanent uncounted \
    83230981E2AB VENDOR_STRING=SUPPORT=COM HOSTID=ID=630435326 \
    PLATFORMS="i86_r it64_lr" ck=97 SN=SMSA90201766 \
    SIGN=B8C93ABE1F58

    l_mkl_16318264.lic

    PACKAGE I0000400000000 INTEL 2005.0209 4096A50AE7BE COMPONENTS=MKern \
    OPTIONS=SUITE ck=131 SIGN=FADEF3A49B52
    FEATURE I0000400000000 INTEL 2005.0209 permanent uncounted \
    5C94A1F7EBCF VENDOR_STRING=SUPPORT=ACAD HOSTID=ID=590668568 \
    PLATFORMS="i86_r it64_lr" ck=211 SN=SMSA16318264 \
    SIGN=509F9CFAFCF4

    3.3.2. SGI

    Service: Supportfolio (support.sgi.com)

    * License file E0000270 = moldyn40:/etc/flexlm/license.dat

    FEATURE XVM_PLEX_IPF sgifd 1.000 01-jan-0 0 7D20611C42A6EED21055 \
    HOSTID="E0000270 e000010e ffc0010e ff80010e ff40010e ff00010e fec0010e \
    fe80010e fe40010e fe00010e fdc0010e fd80010e fd40010e fd00010e fcc0010e \
    fc80010e fc40010e fc00010e fbc0010e fb80010e fb40010e fb00010e fac0010e \
    fa80010e fa40010e fa00010e f9c0010e f980010e f940010e f900010e f8c0010e \
    f880010e f840010e f800010e f7c0010e f780010e f740010e f700010e f6c0010e \
    f680010e f640010e f600010e f5c0010e f580010e f540010e f500010e f4c0010e \
    f480010e f440010e f400010e f3c0010e f380010e f340010e f300010e f2c0010e \
    f280010e f240010e f200010e f1c0010e f180010e f140010e f100010e f0c0010e \
    f080010e f040010e" vendor_info="XVM PLEX ALTIX" SN=055323 \
    VENDOR_STRING="16 CPU" ISSUER="Silicon Graphics, Inc." ck=0
    FEATURE XVM_STD_IPF sgifd 1.000 01-jan-0 0 ADF021BC2E3ABA0BE431 \
    HOSTID="E0000270 e000010e ffc0010e ff80010e ff40010e ff00010e fec0010e \
    fe80010e fe40010e fe00010e fdc0010e fd80010e fd40010e fd00010e fcc0010e \
    fc80010e fc40010e fc00010e fbc0010e fb80010e fb40010e fb00010e fac0010e \
    fa80010e fa40010e fa00010e f9c0010e f980010e f940010e f900010e f8c0010e \
    f880010e f840010e f800010e f7c0010e f780010e f740010e f700010e f6c0010e \
    f680010e f640010e f600010e f5c0010e f580010e f540010e f500010e f4c0010e \
    f480010e f440010e f400010e f3c0010e f380010e f340010e f300010e f2c0010e \
    f280010e f240010e f200010e f1c0010e f180010e f140010e f100010e f0c0010e \
    f080010e f040010e" vendor_info="XVM Standalone ALTIX" SN=055716 \
    VENDOR_STRING="16 CPU" ISSUER="Silicon Graphics, Inc." ck=250

    * License file E0000306 = moldyn50:/etc/flexlm/license.dat

    FEATURE XVM_STD_IPF sgifd 1.000 01-jan-0 0 3D50FB36E16A7D31E8AB \
    HOSTID="E0000306 e0000306 ffc00306 ff800306 ff400306 ff000306 fec00306 \
    fe800306 fe400306 fe000306 fdc00306 fd800306 fd400306 fd000306 fcc00306 \
    fc800306 fc400306 fc000306 fbc00306 fb800306 fb400306 fb000306 fac00306 \
    fa800306 fa400306 fa000306 f9c00306 f9800306 f9400306 f9000306 f8c00306 \
    f8800306 f8400306 f8000306 f7c00306 f7800306 f7400306 f7000306 f6c00306 \
    f6800306 f6400306 f6000306 f5c00306 f5800306 f5400306 f5000306 f4c00306 \
    f4800306 f4400306 f4000306 f3c00306 f3800306 f3400306 f3000306 f2c00306 \
    f2800306 f2400306 f2000306 f1c00306 f1800306 f1400306 f1000306 f0c00306 \
    f0800306 f0400306" vendor_info="XVM Standalone ALTIX" SN=044235 \
    VENDOR_STRING="16 CPU" ISSUER="Silicon Graphics, Inc." ck=47
    FEATURE XVM_PLEX_IPF sgifd 1.000 01-jan-0 0 9D706B895462F0AF6BE5 \
    HOSTID=e0000306 vendor_info="XVM PLEX ALTIX" SN=012928 \
    VENDOR_STRING="16 CPU" ISSUER="Silicon Graphics, Inc." ck=245

    Postscript First

    This is a debugging block

    Postscript Second

    This is a debugging block

    Postscript Third

    This is a debugging block

    Preface First

    This is a debugging block

    Preface Second

    This is a debugging block

    Preface Third

    This is a debugging block