CIO如何成功渡過宕機(jī)危機(jī)
來(lái)源:塔塔 更新時(shí)間:2013-09-17
在IT工作中遇到系統(tǒng)運(yùn)行中斷現(xiàn)象幾乎在所難免,不管是電子郵件、互聯(lián)網(wǎng)接入、電話系統(tǒng)還是業(yè)務(wù)流程,任何一個(gè)至關(guān)重要的環(huán)節(jié)出現(xiàn)問題,CIO都必須要盡快修復(fù)它。CIO如何應(yīng)對(duì)系統(tǒng)宕機(jī)的方式將決定職業(yè)生涯道路的走向。雖然宕機(jī)之后接下來(lái)的幾分鐘或者是幾小時(shí)內(nèi)可能會(huì)想噩夢(mèng)一般,但是CIO的不同反應(yīng)就意味著截然不同的結(jié)果。
以下是10個(gè)技巧來(lái)幫助CIO成功渡過宕機(jī)危機(jī)。
1、不要驚慌
即使問題是CIO自己造成的,那么也不應(yīng)該把時(shí)間浪費(fèi)在考慮到底帶來(lái)了多大麻煩,或是哪位高層會(huì)大發(fā)雷霆上。這也許會(huì)給CIO的職業(yè)生涯畫上句號(hào),但是眼下不能擔(dān)心這么多。CIO最好的機(jī)會(huì)是去糾正錯(cuò)誤,所能做到的就是保持一個(gè)技術(shù)清醒的頭腦,而不要讓情緒占上風(fēng)。這不是生死攸關(guān)的事,先解決問題,再想別的。
2、通過各種方法通知用戶
CIO需要盡早告知用戶和上級(jí)內(nèi)部IT系統(tǒng)出現(xiàn)故障了。當(dāng)然,主要的溝通方式,包括給公司內(nèi)部電子郵件,或是使用即時(shí)通訊工具,聯(lián)系部門負(fù)責(zé)人,讓他們通知員工,這樣就可以傳遞出一種“系統(tǒng)有故障了,馬上就解決”的信號(hào)。
3、找到一個(gè)“擋箭牌”
通知用戶是第一步。找人來(lái)幫忙回答用戶的問題是第二步。CIO宣布知道了解這個(gè)事件,會(huì)讓那些只是想確保CIO意識(shí)到問題所在的人滿意,但是更高級(jí)別的高管則會(huì)詢問更新的狀態(tài)和修復(fù)完成的時(shí)間點(diǎn),這需要另外的人來(lái)應(yīng)付這種情況了。有人出面回答問題,而CIO就可以安心地解決問題。即使是接待人員或者人力資源部門實(shí)習(xí)生,也必須在CIO和這些人群之間有一個(gè)緩沖,至少是要等事態(tài)穩(wěn)定了以后。
4、為面對(duì)公司內(nèi)的人際關(guān)系做好心理準(zhǔn)備
CIO已經(jīng)通知了用戶并找到了一個(gè)能“穿針引線”的人,在CIO進(jìn)入戰(zhàn)備狀態(tài)之前還需要知道一件事——接下來(lái)將看到誰(shuí)是真正的朋友。某些人可能看上去很挑剔,也許只是露個(gè)臉,冷靜地詢問他能提供什么幫助或者計(jì)劃出一個(gè)備選方案。你也許認(rèn)為這種傲慢的同事會(huì)在CIO困難的時(shí)候采取不正當(dāng)?shù)氖侄巫屍涑鲷?,但也許最后他卻變成了最同情CIO的人。而另一位副總裁可能會(huì)突然變成蓋世太保一樣的可怕嘴臉,走過來(lái)說,“你知道這個(gè)事情有多嚴(yán)重嗎?”
如果發(fā)生這種情況,不要放在心上:他們很不高興看到故障出現(xiàn),此時(shí)此刻CIO就是眾矢之的。你不能控制他們的想法,但是CIO可以控制自己的情緒。他們生氣是可以理解的——錢是最重要的。不過不要將這演變成一場(chǎng)沖突。對(duì)嘲諷視而不見,并禮貌地告訴他們:“我們可以找出問題出在哪里以及這是誰(shuí)的責(zé)任,但是我需要這個(gè)時(shí)候集中精力去解決它?!比缓?,一切就都安靜了。盡量不要把每分每秒的進(jìn)度都向管理層匯報(bào),這只會(huì)增加自己的壓力,并分散精力導(dǎo)致技術(shù)能力被削弱。
5、記錄下所有事情
上面已經(jīng)談了四個(gè)技巧,但是沒有一條是關(guān)于如何解決問題的。這是因?yàn)镃IO需要以盡可能最好的方式和環(huán)境來(lái)為解決問題鋪平道路。
花些時(shí)間來(lái)記錄到底發(fā)生了什么:自己當(dāng)時(shí)正在做什么,運(yùn)行了什么命令,發(fā)生了什么事情,包括所有錯(cuò)誤相關(guān)的消息。因?yàn)橥ǔT谶@種情況下,CIO的記憶會(huì)變得一塌糊涂。
隨著CIO不斷地試圖解決問題,記錄下發(fā)現(xiàn)的事情以及為了修復(fù)所作出的所有嘗試,是十分有必要的。重啟服務(wù)了嗎?重啟設(shè)備了嗎?升級(jí)注冊(cè)密鑰了嗎?所有這些都應(yīng)當(dāng)記錄下來(lái)。這個(gè)過程會(huì)救了CIO和整個(gè)公司。因?yàn)楫?dāng)某些嘗試不起作用的時(shí)候,CIO還可以根據(jù)記錄倒退回去,這樣就不會(huì)在后面出現(xiàn)更多的錯(cuò)誤。
6、記錄下出現(xiàn)情況的所有事實(shí)
不管最初的問題是否是CIO自己所導(dǎo)致,其都會(huì)發(fā)現(xiàn)自己不得不處于十分忙亂的狀態(tài)下。這是可以理解的,作為IT管理者,人們會(huì)在出現(xiàn)故障之后將矛頭全都指向CIO。“你到底干了什么?”這通常是在緊急情況之后最終用戶們所問的第一個(gè)問題。CIO可能會(huì)被視為要為“沒有預(yù)計(jì)到要發(fā)生的事情”而負(fù)責(zé)。無(wú)論如何,一定不要在嘗試解決問題的時(shí)候去試圖掩飾什么,這只能讓情況變得更糟。另外,上級(jí)高管或是其他高級(jí)別的最終用戶很可能會(huì)仔細(xì)地閱讀CIO的報(bào)告,看看究竟發(fā)生了什么事情。系統(tǒng)記錄事件、保留日志文件,并在某些情況下審核IT管理員的操作行為??傆惺裁词虑閷?dǎo)致了故障的發(fā)生,所以放一顆煙霧彈對(duì)誰(shuí)都是沒有好處的。一旦事實(shí)真相被揭露,那才真是“問題嚴(yán)重了”。
7、不要在無(wú)效的方案上重復(fù)多次
每個(gè)人都有在第一次嘗試不奏效時(shí)會(huì)再重復(fù)一次的傾向。這就像有人在人行橫道上使勁不停地按綠燈按鈕一樣。這也是為什么一旦卡紙問題解決之后打印機(jī)會(huì)吐出許許多多相同的文件副本。有人甚至?xí)耄喝绻麊螕?6次“打印文件”不管用之后,那么第17次肯定會(huì)管用……
在系統(tǒng)宕機(jī)期間,CIO希望系統(tǒng)能快速運(yùn)轉(zhuǎn)起來(lái)。但是,如果同時(shí)有四個(gè)方案可以嘗試的話,不要試圖一次性完成所有的嘗試。無(wú)論短期內(nèi)是否會(huì)松一口氣,如果一次性嘗試起作用的話,那么之后就會(huì)感到很內(nèi)疚,因?yàn)椴僮髡咂鋵?shí)并不知道究竟是哪一步解決了這個(gè)問題,那么下一次出現(xiàn)同樣問題時(shí)仍是十分麻煩的。CIO必須準(zhǔn)確找出真正解決問題的那個(gè)方法。
8、尋求幫助
當(dāng)CIO使出渾身解數(shù)發(fā)現(xiàn)問題不是那么能輕易被解決時(shí),不要猶豫,趕快尋求幫助。求助對(duì)象可以是產(chǎn)品供應(yīng)商,也可以是其他人。這可能意味著CIO需要暫停手頭的工作來(lái)等著回復(fù)。即使只是覺得可能需要額外的支持,但最終也許真的就起到關(guān)鍵作用了。
有些IT管理者寧愿瘋狂地在Google上尋找答案,焦急地嘗試著A建議、B建議、C建議,也不愿意想供應(yīng)商尋求幫助,因?yàn)楣?yīng)商可能要求多支付額外的259美元。某些論壇上充斥的業(yè)余愛好者們的幫助建議,也許是有用的但一定不如對(duì)產(chǎn)品知根知底的專業(yè)人士,可能需要多花10倍的時(shí)間,甚至有可能在這期間最佳解決方案已經(jīng)出現(xiàn)了但CIO卻并不知道。
9、做好事后報(bào)告
假如CIO及時(shí)發(fā)現(xiàn)問題并且一切都恢復(fù)了,那么所有人的工作都恢復(fù)正常,大家開始返回工作崗位,整個(gè)過程只是一場(chǎng)噩夢(mèng),對(duì)吧?
實(shí)際上,這并沒有這么快結(jié)束。這時(shí)候CIO可不能想著松口氣,而是需要繼續(xù)保持警惕,把所有記錄下來(lái)的東西收集并整理好。通知所有有關(guān)的人,發(fā)生了什么,通過什么方法修復(fù)了問題,如何確保不會(huì)再發(fā)生故障。
CIO還要設(shè)置警報(bào)或者程序以便更好地提前通知此類情況的發(fā)生。制定一項(xiàng)應(yīng)急計(jì)劃在最糟糕的情況下也能保證問題得到解決。如果是停電了,那么事后的報(bào)告中就包括如果系統(tǒng)恢復(fù)正常需要做的,以及問題沒有解決需要做的事情。這是任何一位真正明智的CEO所希望看的。
10、不要對(duì)自己失去信心
人們常常說,當(dāng)計(jì)算機(jī)工作正常的時(shí)候,用戶是不會(huì)打電話給服務(wù)臺(tái)的。但CIO在IT部門工作,系統(tǒng)中斷可能是對(duì)IT專家們信心的一個(gè)重大打擊,即使他們已經(jīng)取得了一系列的成功。嘗試換個(gè)角度想問題,如果剛剛遇到了5個(gè)小時(shí)的電子郵件中斷,那么上一次遇到這個(gè)問題是在5年之前,那么平均每年電子郵件中斷一個(gè)小時(shí)已經(jīng)是一個(gè)相當(dāng)不錯(cuò)的紀(jì)錄了。
保持積極的態(tài)度。畢竟已經(jīng)完成了任務(wù)。當(dāng)回到家的時(shí)候,不要質(zhì)疑自己的才華和能力。正如在第9點(diǎn)中提到的,想一想從這件事中自己學(xué)到了什么。關(guān)于這個(gè)故障自己還可以做多少更多的研究,以便以后更好的應(yīng)對(duì)類似的事件。建立良好的同事關(guān)系,這樣在緊急情況下就能有些“靠山”可以指望得上。
永遠(yuǎn)記住,IT專家的工作是維護(hù)正常IT秩序。CIO要保持堅(jiān)定的態(tài)度,這樣就可以很好地對(duì)付下一次系統(tǒng)宕機(jī)。