Storie dalla Sala Macchine


Home Page | Commenti | Articoli | Faq | Documenti | Ricerca | Archivio | Storie dalla Sala Macchine | Contribuire | Login/Register

Chi Piu' Risparmia...

Ritorniamo a parlare di $noiguardiamolavostrarobba di cui avevo gia' detto abbastanza.

Quando, due anni fa, l'allora SL di belle speranze e di tasche gonfie di soldi prestati dalla banca aveva iniziato la sua ventura, si era deciso di avere due ambienti paralleli, uno per la "produzione" ed uno per il test. In modo da poter provare le cose in maniera piu' o meno veritiera prima di scaraventarle su internet a pigs&dogs. Ora, tutti sanno che il problema dell'avere un ambiente di 'test' veritiero e' il tenerlo il piu' possibile "allineato" con quello di produzione, se i due ambienti si sballano piu' di tanto non ha alcun senso.

Dato che, visti gli ultimi ribaltamenti, SL ed UL hanno deciso di farsi i rilasci da soli, lo stato di tali ambienti e' andato piu' o meno alla deriva per cavoli loro. E dato che hanno deciso di aggiungere altri servers all'ambiente di produzione, per evitare "costi eccessivi", hanno anche deciso di dismettere l'ambiente di test sostenendo che "non e' utile alla funzionalita' del sistema" (cioe' hanno preteso di farsi le prove in casa sulla stessa macchina su cui fanno lo sviluppo). Ovviamente la mia osservazione che un ambiente di test su cui si fa anche lo sviluppo non e' proprio il meglio per fare dei test non e' stata bene accetta.

Comunque sia, dopo i ribaltamenti di cui ho gia' accennato i due sarchiaponi sono andati avanti per cavoli loro. Fino ad oggi, quando, all'alba delle 9.30 ricevo una bella telefonata da SL che vuole sapere quanto e' il "carico" del loro foxxutissimo database server. Probabilmente pure lui ha letto lo stesso articolo di questa gente.

Dopo avergli spiegato pure a lui che il load average non e' il modo migliore di giudicare il carico di un sistema (spiegazione che, come previsto, non e' stata minimamente recepita) il tipo si mette a parlare di come a mezzogiorno vogliono fare un mega-rilascio e quindi sono preoccupati per il carico del database.

SL - ...e quindi vogliamo, se possibile, aggiungere una CPU al nostro databaseserver.
IO - Hummm (guardo lo stato dell'host) In tal caso sarebbe meglio spostare la macchina virtuale su un diverso host dato che quello su cui si trova ha gia' tutte le cpu occupate, mentre quest'altro host ne ha a bizzeffe.
SL - Ma quanto ci vuole a spostare la macchina?
IO - Spegnere la macchina, spostarla da un host all'altro, aggiungere cpu, avviare, aggiornare tools, riavviare... un 10~15 minuti credo.
Urla, gemiti, grida, rantoli di terrore ed orrore, immaginatevi un girone infernale dantesco a caso ed avete una vaga idea della cosa
SL - QUINDICIMINUTI!!! No no,.. troppo tempo, non possiamo avere tutto questo downtime!
IO - Ma non dovete anche fare un mega-rilascio?
SL - Si'.
IO - Con aggiornamento del database?
SL - Si'.
IO - E non fate anche un backup del database prima di aggiornarlo?
Urla, gemiti, grida, rantoli di terrore ed orrore, immaginatevi un girone infernale dantesco a caso ed avete una vaga idea della cosa
SL - No. Non possiamo permetterci tutto questo downtime!
IO - Quindi volete fare un update del database senza una possibilita' di rollback? Vabbe' il server e' il vostro eh...
SL - Comunque, quanto costerebbe aggiungere la CPU?
IO - Hmmm... Bho, momento...

E detto questo gli passo DB per i dettagli monetari. Dopo una mezz'ora DB compare asciugandosi la faccia.

DB - Maronna! SL e' una cosa insopportabile... Quando mia moglie ha fatto il parto cesareo si lamentava di meno...

(mi trattengo dal dirgli che forse sua moglie era anestetizzata)

IO - Quindi che si fa?
DB - Ok per l'aggiunta della cpu.
IO - Con downtime di 15 minuti?
DB - Si' alla fine si e' deciso.

Detto questo vado avanti a fare quello che dovrei fare fino alle 12, quando SL ricompare al telefono con sottofondo di geremiadi per darmi il via per il trasferimento. Eseguo mentre lui ed UL madonnano uno contro l'altro al telefono per installare, copiare ed aggiornare le varie cose nel loro mega-ambientone. Non c'e' bisogno di dire che la nuova macchina virtuale e' in funzione da una mezz'ora prima che questi arrivino al punto di 'aggiornare il database'.

Tanto per divertimento guardo un po' che cosa e' cambiato nel loro megasistema... ed e' cambiato parecchio di sicuro: non funziona piu' un tubo. Dopo una quindicina di minuti mando una mail ad SL domandando se la cosa e' attesa oppure no. Ricevo in risposta una mail che piu' o meno dice "ci stiamo lavorando".

La giornata trascorre con mail ad intervalli randomici che dicono "e' a posto" seguite da "merda non e' a posto per niente". Alcuni dei server vengono riavviati a raffica (apparentemente e' l'unico modo per far funzionare la nuova versione dell'applicazione). La cosa si trascina fino a circa le 8 di sera quando mi becco una telefonata da DB che mi domanda se posso richiamare SL prima che gli venga (a tutti e due) un collasso.

SL - (Urla, gemiti, gri...ok avete capito) E' possibile fare un restore del database?
IO - Quale database? Quello di cui non facciamo piu' i backup perche' avete deciso che costava troppo?
SL - Si' quello...
IO - Mah... l'ultimo backup e' di 1 mese fa... non sono del tutto sicuro se funzioni.
SL - Non c'e' un backup piu' recente?
IO - Se non ne avete fatto uno voi prima di aggiornare no.
SL - No, non ho fatto un backup perche' ci mette troppo tempo e volevamo ridurre il downtime.
IO - (mepensa: e adesso sei ad 8 ore di downtime, bella pensata del ca$$o) E allora non e' che ci sia molto da fare. A meno che voi non possiate rifare l'aggiornamento a rovescio.
SL - Come sarebbe a dire?
IO - Rifare gli stessi aggiornamenti a rovescio, cioe' invece di aggiungere togliere e roba cosi'...
SL - ... non e' che potreste darci una mano?
IO - Alle 8 di sera?

Per farla breve, sono stato fino quasi a mezzanotte per 'rigirare' lo script di aggiornamento e rimuovere selettivamente tutto quello che era stato modificato, certe cose ovviamente non possono essere rimosse (se fai un Update non ho idea di cosa ci fosse nei campi prima) ma a mezzanotte e' sembrato che il loro foxxuto coso comiciasse a funzionare, se non altro non doveva riavviarsi ogni 5 minuti.

Come al solito, quando si cerca di salvare il centesimo si finisce con lo spendere le decine per rimettere a posto i casini. Ci sara' da divertirsi quando SL ricevera' la fattura per interventi straordinari fuori orario d'ufficio.

Davide
21/05/2012 08:00

Precedente Successivo

I commenti sono aggiunti quando e soprattutto se ho il tempo di guardarli e dopo aver eliminato le cagate, spam, tentativi di phishing et similia. Quindi non trattenete il respiro.

9 messaggi this document does not accept new posts
Messer Franz Di Messer Franz - postato il 21/05/2012 08:22

Tu dici

<Ci sara' da divertirsi quando SL ricevera' la fattura per interventi straordinari fuori orario d'ufficio

 

ma io ti correggo: DB (che e' quello che incassa) si divertira'. Tu ( che sei quello che lavora ) piangerai pensando alle ore ( notturne) spese inutilmente per colpa di un pisquano di una ditta di pisquani.

--
Messer Franz


WM@ Messer Franz Di WM - postato il 21/05/2012 09:02

ma io ti correggo: DB (che e' quello che incassa) si divertira'. Tu ( che sei quello che lavora ) piangerai pensando alle ore ( notturne) spese inutilmente per colpa di un pisquano di una ditta di pisquani.

purtroppo concordo

WM

 

 

--
WM


Anonymous coward@ Messer Franz Di Anonymous coward - postato il 21/05/2012 09:41

ma io ti correggo: DB (che e' quello che incassa) si divertira'. Tu ( che sei quello che lavora ) piangerai pensando alle ore ( notturne) spese inutilmente per colpa di un pisquano di una ditta di pisquani.

credo che bigD abbia la sua piccolissima fetta di straordinari. La domanda e': ne vale la pena?

E comunuque: se non ci fossero tutti questi imbecilli, non ci sarebbe tutto questo lavoro per BigD e storie per noi... :\)

 

 

--
Anonymous coward


Anonymous coward@ Messer Franz Di Anonymous coward - postato il 21/05/2012 12:56

Tu ( che sei quello che lavora ) piangerai pensando alle ore ( notturne) spese inutilmente per colpa di un pisquano di una ditta di pisquani.



B... a parte il nervoso per non essere mai ascoltati e quello dovuto al non sentirti dire avevi ragione! Penso comunque che questi lavori vengano anche compensati!

--
Anonymous coward


Anonimo Di Anonimo - postato il 21/05/2012 09:17

Se ero io col cavolo che mi mettevo a rimuovere l'aggiornamento. L'avrei delegato volentieri ai loro programmatroti, tenendoli svegli tutta la notte.

 

Tu D, fai anche troppo...grazie al tuo background di programmatore...(una maledizione a quanto vedo)

--
Anonimo


Anonymous coward Di Anonymous coward - postato il 21/05/2012 09:24

È una lezione che non imparano mai... Di questi tempi mi son ritrovato con

degli amici alla fine della specialistica di economia: han la testa piena

di project management, diagrammi di Gantt, PERT, CMP, ... tante belle sigle

in stile molto USA tutte elaborate con nice -20, la realtà è a 19 e non

c'è proprio verso che il loro cervello riesca a seguirla...



Il problema è dal nostro lato: come sfruttare economicamente con successo

tale situazione :-\)

--
Anonymous coward


Anonymous coward Di Anonymous coward - postato il 21/05/2012 09:37

hanno anche deciso di dismettere l'ambiente di test sostenendo che "non e' utile alla funzionalita' del sistema"

il pericolo e' il loro mestiere? no, semplicemente non sano il loro mestire. Malattia comune tra coloro destinati al fallimento.

SL - QUINDICIMINUTI!!! No no,.. troppo tempo, non possiamo avere tutto questo downtime!

Ma questo imbecille e' il "responsabile" di una ditta che vende calze o del Centro Europeo Di Controllo Traffico Aereo che deve essere "up" 24/24 e 365/365? Ma chi ca**o crede di essere? Ma chi se lo incu** il suo siterello del piffero!

IO - E non fate anche un backup del database prima di aggiornarlo?

Ma fatti i cavoli tuoi! lo sai che ci hai appena privato come minimo di altre 3 storie? E non si fa cosi'!!

IO - Mah... l'ultimo backup e' di 1 mese fa... non sono del tutto sicuro se funzioni.

SL - Non c'e' un backup piu' recente?

IO - Se non ne avete fatto uno voi prima di aggiornare no.

SL - No, non ho fatto un backup perche' ci mette troppo tempo e volevamo ridurre il downtime.

Sto ridendo come un pazzo! Tosse! mi manca il fiato! BWAWHWAHWAH!!!!

Per farla breve, sono stato fino quasi a mezzanotte per 'rigirare' lo script di aggiornamento e rimuovere selettivamente tutto quello che era stato modificato, certe cose ovviamente non

Beh queste storie sono come i film porno: si sa sempre come va a finire e cioe' con BigD che si deve spupazzare il missile padulo :\(

Come al solito, quando si cerca di salvare il centesimo si finisce con lo spendere le decine per rimettere a posto i casini. Ci sara' da divertirsi quando SL ricevera' la fattura per interventi straordinari fuori orario d'ufficio.

Io farei cosi: appena il Clinete dice cosa vuole fare, tu prelari una videoregistrazione con prefiguri quello che succedera', consegni della registrazione ad un notaio che la autentichi (data, ora, etc) poi si chiude in cassafore e si aspetta. Fanno l'aggiornamento, succede il casino, etc etc. Poi alla riunione col Cliente per "capire cosa sia andato storto" tu cacci la busta, rompi i sigilli, avvii la riproduzione e gliela fai guardare. Alla fine, senza dire un a parola, ti alzie e te ne esci dalla sala riunioni.

PS: avrei dato un braccio (di SL ) per essere nel loro ufficio ad assistere al "progettone" di aggiornamento, fallimento, scannamento reciproco sullo stile infantile del "e' colpa tua!" " no, tua!" "non e' vero" etc etc

PS2: ma gli aggiornamenti non andrebbero pianificati, schedulati, etc etc? qui invece siamo al "dopo pranzo ho una mezzora di tempo, faccio l'aggiornamento" seeee...

--
Anonymous coward


Guido Di Guido - postato il 22/05/2012 09:13

la realta' e' che bisogna lasciar fare le cose a chi le sa fare, se chiedi all'idraulico quanto tempo gli ci vuole per farti il lavoro xy ti risponde "ci vuole il tempo che ci vuole", che sembra una tautologia, pero' sicuramente e' la risposta piu' corretta che si possa dare...

Se i due "furboni" avessero lasciato fare ad un vero sistemista probabilmente non si ritroverebbero nei casini... troppo facile giocare a fare il sysadmin e poi venire a piangere quando tutto va a puttonio...

--
salva un albero: mangia un castoro!


Anonymous coward Di Anonymous coward - postato il 22/05/2012 15:10

La cosa si trascina fino a circa le 8 di sera quando mi becco una telefonata da DB che mi domanda se posso richiamare SL prima che gli venga (a tutti e due) un collasso.

risposta: non no posso, siamo gia oltre l'orario, inotre sono in ritardo gia' di mezz'ora all'appuntamento con due bionde bisex che mi hanno prenotato per stasera. Come, non te lo avevo detto? Faccio il Gigolo' part-time. Ciao, ci si deve domattina.

--
Anonymous coward


9 messaggi this document does not accept new posts

Precedente Successivo


Il presente sito e' frutto del sudore della mia fronte (e delle mie dita), se siete interessati a ripubblicare uno degli articoli, documenti o qualunque altra cosa presente in questo sito per cortesia datemene comunicazione (o all'autore dell'articolo se non sono io), cosi' il giorno che faccio delle aggiunte potro' avvisarvi e magari mandarvi il testo aggiornato.


Questo sito era composto con VIM, ora e' composto con VIM ed il famosissimo CMS FdT.

Questo sito non e' ottimizzato per la visione con nessun browser particolare, ne' richiede l'uso di font particolari o risoluzioni speciali. Siete liberi di vederlo come vi pare e piace, o come disse qualcuno: "Finalmente uno dei POCHI siti che ancora funzionano con IE5 dentro Windows 3.1".

Web Interoperability Pleadge Support This Project
Powered By Gort