Άκουσα πρόσφατα για το έργο αναβάθμισης ενός πολύπλοκου πληροφοριακού συστήματος σε μια μεγάλη εταιρία, το οποίο παρά το δυναμικό του ξεκίνημα παρουσίασε προβλήματα και δυσλειτουργίες με αποτέλεσμα την καθυστέρηση ολοκλήρωσης κατά οχτώ μήνες. Καταλαβαίνετε βέβαια το κόστος τόσο επιχειρησιακά για τον ένα οργανισμό όσο και επιχειρηματικά για τον άλλο. Φυσικά το φαινόμενο δεν είναι σπάνιο, θα αναφερθώ λοιπόν σε μερικά χρήσιμα στοιχεία και σημεία που πιστεύω θα βοηθήσουν να αποφύγουμε δύσκολες καταστάσεις.
- Στο ITIL υπάρχει ένα ολόκληρο βιβλίο/κύκλος ζωής, το Service Transition (Μετάβαση Υπηρεσιών) αφιερωμένο στο θέμα αυτό. Το νόημα είναι πως προσεγγίζουμε μια νέα εγκατάσταση/αναβάθμιση/έκδοση ως αλλαγή που πρέπει να διαχειριστούμε αρκετά νωρίς και όχι ως μόνο μια σειρά από βήματα που εκτελούμε στα πλαίσια ενός έργου.
- Καταγράψτε τα πιθανά ρίσκα, μοιραστείτε τα με την ομάδα σας και γιατί όχι και με τους πελάτες ή χρήστες σας. Χτίσετε από κοινού σενάρια αντιμετώπισης διαφόρων καταστάσεων που μπορεί να προκύψουν.
- Εστιάστε σε ένα πράγμα τη φορά. Σίγουρα έχετε πολλά πράγματα να κάνετε αλλά επικεντρωθείτε σε μια συγκεκριμένη εργασία τη φορά μέχρι το ρίσκο η τα θέματά της να είναι ελεγχόμενα. Άλλωστε αυτός είναι ο λόγος που το Kanban έγινε δημοφιλές.
- Κρατήστε απερίσπαστους τους βασικούς σας πόρους. Φροντίστε οι άνθρωποί κλειδιά να μην δουλεύουν σε πολλά πράγματα ταυτόχρονα, ειδικότερα όταν υπάρχει κάποιο θέμα κρατήστε εσείς όλα τα «επικοινωνιακά» καθήκοντα και αφήστε τους να δουλεύουν την επίλυση απερίσπαστοι. Από μόνο του αυτό δημιουργεί μια πολύτιμη κουλτούρα.
- Η γνώση είναι δύναμη! φροντίστε να τη μοιράζεστε. Τα knowledgebase συστήματα σίγουρα βοηθούν, αλλά το μυστικό είναι στην κουλτούρα. Εδώ βέβαια θα βοηθούσε ιδιαίτερα μια κίνηση του PMI για μια ανοιχτή βάση από Lessons Learned.
- Go agile. Η παραδοσιακή προσέγγιση του καταρράκτη (waterfall) σπάνια είναι αποδοτική και έχει μεγάλα ρίσκα. Επικεντρωθείτε σε ένα κομμάτι, αναπτύξτε το, δοκιμάστε το, διορθώστε το, βάλτε το επόμενο κομμάτι, δοκιμάστε τα μαζί… ειδικότερα αν έχετε διασυνδέσεις (interfaces) με άλλα συστήματα.
Eχουμε αναφερθεί σε προηγούμενα άρθρα στην επίλυση Προβλημάτων, στην προσέγγιση του blameless post mortem για τον εντοπισμό των λαθών αλλά και στη μέθοδο των “5 whys” του Root Cause Analysis.
Θα ήθελα βέβαια να σας επισημάνω και την άποψη, την οποία υποστηρίζω και προσωπικά, πως πολύ σπάνια υπάρχει ένα και μόνο ριζικό αίτιο (Root Cause) για μια βλάβη. Συνήθως υπάρχουν πολλαπλές, ίσως και επαναλαμβανόμενες, αστοχίες, βλάβες η/και παρατυπίες που οδηγούν σε ένα καταστροφικό περιστατικό. Αν έχετε παρακολουθήσει στην τηλεόραση τη σειρά MayDay, η οποια αναλύει αεροπορικά ατυχήματα, τα πολλαπλά αίτια ως γεγονός θα σας είναι αρκετά οικείο.
O Richard Cook σε μια πολύ ενδιαφέρουσα μελέτη του Cognitive Technologies Laboratory University of Chicago με τίτλο «How Complex Systems Fail», προσεγγίζοντας γενικά το θέμα των πολύπλοκων συστημάτων, υποστηρίζει πως αυτά λειτουργούν πάντα με βλάβη! Θεωρεί πως ακριβώς λόγω της πολυπλοκότητας τους, κρύβουν μια σειρά από βλάβες, κάθε μία εκ των οποίων από μόνη της δεν είναι ικανή να προκαλέσει καθολική πτώση του συστήματος. Το redundancy και οι διαχειριστές συστημάτων τα κρατάνε σε λειτουργεία παρά τα προβλήματα που υπάρχουν. Υποστηρίζει πως η προσπάθεια να βρεθεί μία μοναδική «ριζική» αιτία είναι λανθασμένη και συνήθως οδηγείται από (αντι)κοινωνικές συμπεριφορές και την ανάγκη να ρίξουμε το φταίξιμο κάπου η σε κάποιον.
Προσωπικά συμφωνώ πως όταν αναλύουμε σοβαρές βλάβες, θα πρέπει να έχουμε στόχο να βρούμε όχι ένα μοναδικό αλλά το συνδυασμό των πρωταρχικών αιτιών που τις προκάλεσαν. Είναι λογικό για λόγους οικονομικούς ή χρονικών περιορισμών να δώσουμε προτεραιότητα στην αντιμετώπιση μιας αιτίας, αλλά πρέπει είμαστε σαφείς ότι απευθυνόμαστε μία από τις πολλές αιτίες.
Εάν ένα εξάρτημα χάλασε, γιατί χάλασε; Γιατί δεν είχε προβλεφθεί τακτική συντήρηση ή αντικατάσταση; Γιατί δεν υπήρχε redundancy; γιατί δεν είδαμε προειδοποιητικά σημάδια;
Ο ανθρώπινος παράγοντας σίγουρα κυριαρχεί στα αίτια αλλά πρίν ξεκινήσετε κυνήγι μαγισσών, βεβαιωθήτε ότι η εκπαίδευση είναι πλήρης, ελέγξτε τις διαδικασίες και την εφαρμογή τους και εισάγετε ένα πρόγραμμα συνεχούς ελέγχου και βελτίωσης συστημάτων και ανθρώπων.