說起銀行,可能大家最熟悉的在日常生活中,享受著他們提供的存貸款、行內(nèi)外轉(zhuǎn)賬、快捷支付等種種便利的金融服務(wù)。對(duì)于使用者來講感知到這些金融服務(wù)的好壞,很大程度上取決于自己在使用這些服務(wù)過程中的主觀體驗(yàn),這些看似簡(jiǎn)單的金融服務(wù)實(shí)際上已經(jīng)隨著祖國(guó)的高速發(fā)展走過了30年(1989-2019)的崢嶸歲月,而銀行業(yè)IT也是在所有金融行業(yè)中投入規(guī)模最大、要求標(biāo)準(zhǔn)最高的行業(yè),接下來我們一起粗略探究下這個(gè)神秘且錯(cuò)綜復(fù)雜的IT世界。
穩(wěn)定可靠安全
雖然說今天國(guó)內(nèi)大大小小的銀行有4千多家,但是在國(guó)內(nèi)干銀行這個(gè)生意從來都不是件簡(jiǎn)單的事,權(quán)且不說起步資金、牌照的問題,光是這兩年,銀保監(jiān)會(huì)出臺(tái)的各類防范金融風(fēng)險(xiǎn)的管理要求,都能堆起一層樓那么高。在防風(fēng)險(xiǎn)的行業(yè)大背景下,那對(duì)外提供的金融服務(wù)就必須是穩(wěn)定、可靠、安全,這就需要銀行籌建各類業(yè)務(wù)系統(tǒng)來共同保障支撐,按照銀行常規(guī)的分類大致包含渠道整合類、客戶服務(wù)類、應(yīng)用集成類、產(chǎn)品服務(wù)類、管理分析類等各維度的業(yè)務(wù)系統(tǒng),這些系統(tǒng)通常又會(huì)被集中在銀行諸多自建數(shù)據(jù)中心進(jìn)行統(tǒng)一運(yùn)維管理。雖然這樣做的成本非常高,但在國(guó)內(nèi)稍微上規(guī)模的銀行,基本都是采用自建數(shù)據(jù)中心的方式來保障數(shù)據(jù)安全。
拿我們接觸比較多的手機(jī)銀行來說,一筆行內(nèi)轉(zhuǎn)賬動(dòng)作,都至少會(huì)涉及好幾套業(yè)務(wù)系統(tǒng)共同配合完成(跨行轉(zhuǎn)賬更復(fù)雜),每套業(yè)務(wù)系統(tǒng)之間的訪問鏈路一般稱之為交易路徑,每套業(yè)務(wù)系統(tǒng)內(nèi)都包含很多邏輯應(yīng)用模塊、軟件/應(yīng)用實(shí)例、相關(guān)系統(tǒng)/處理單元等邏輯節(jié)點(diǎn),這些還通常都是軟件部分,它們又被部署在不同數(shù)據(jù)中心不同機(jī)房的基礎(chǔ)架構(gòu)/通用資源、設(shè)備環(huán)境基礎(chǔ)設(shè)施上,只有同時(shí)保證所有與之相關(guān)IT軟硬件的穩(wěn)定、可靠、安全運(yùn)行,才能保障轉(zhuǎn)賬這個(gè)動(dòng)作可以正常運(yùn)行。
至于每筆轉(zhuǎn)賬是否真正成功還需要考慮是否金額大小、雙方賬戶金額增減一致、雙方賬戶是否被標(biāo)記老賴、受法律約束人員以及法規(guī)安全類系統(tǒng)進(jìn)一步檢驗(yàn)。
這一切看起來異常的復(fù)雜,隨著規(guī)模和復(fù)雜度的攀升,靠人肉來運(yùn)維保障肯定不現(xiàn)實(shí),因此采用適當(dāng)?shù)墓ぞ咛娲巳馐潜剡x之路,而這些工具體現(xiàn)在IT層面上大致分為:面向機(jī)房基礎(chǔ)環(huán)境運(yùn)維管理、網(wǎng)絡(luò)資源運(yùn)維管理、系統(tǒng)資源運(yùn)維管理以及應(yīng)用資源運(yùn)維管理四部分。由于每部分工作內(nèi)容差異較大,在數(shù)據(jù)中心中也通常會(huì)被劃分在不同的部門獨(dú)立開展,當(dāng)然數(shù)據(jù)中心還有其它非常多的職能部門來共同保障銀行業(yè)務(wù)的正常運(yùn)行,本次我們重點(diǎn)先聊下這四部分比較通用運(yùn)維管理工作內(nèi)容及其使用的工具。
機(jī)房基礎(chǔ)環(huán)境
數(shù)據(jù)中心的機(jī)房基礎(chǔ)環(huán)境是業(yè)務(wù)系統(tǒng)、IT設(shè)備安身立命的地方,也是每家銀行在前期重點(diǎn)投資的地方,其主要包含機(jī)柜、空調(diào)、消防、安防、弱電、UPS等最基礎(chǔ)的機(jī)房環(huán)境設(shè)施,在數(shù)據(jù)中心通常由設(shè)備管理/基礎(chǔ)設(shè)施部門負(fù)責(zé)管理,他們的目標(biāo)是保障機(jī)房環(huán)境及硬件系統(tǒng)可用性、可靠性和可維護(hù)性,因此工作內(nèi)容大致會(huì)涉及:
數(shù)據(jù)中心機(jī)房環(huán)境規(guī)劃建設(shè)(機(jī)房、機(jī)柜、服務(wù)器和網(wǎng)絡(luò)設(shè)備、綜合布線等),制定相關(guān)的管理原則、方案和實(shí)施流程;
負(fù)責(zé)機(jī)房基礎(chǔ)環(huán)境(風(fēng)火水電、溫濕度、視頻等各類硬件設(shè)備)及系統(tǒng)的建設(shè)、運(yùn)維和管理;
負(fù)責(zé)各類計(jì)算機(jī)設(shè)備、基礎(chǔ)環(huán)境設(shè)備出入機(jī)房審批登記及各類硬件設(shè)備的擴(kuò)容升級(jí)、微碼升級(jí)、老化更新、故障修復(fù)、維修配件及耗品需求管理;
負(fù)責(zé)機(jī)房環(huán)境日常管理,進(jìn)出入機(jī)房?jī)?nèi)/外部人員進(jìn)行授權(quán)和審批登記管理、日常巡檢等;
其他雜項(xiàng)工作,如機(jī)房?jī)?nèi)部環(huán)境,是否有易燃易爆物體,需要及時(shí)清理。
為了實(shí)現(xiàn)日常運(yùn)維管理工作高效運(yùn)轉(zhuǎn),他們通常會(huì)采購大量不同門類的系統(tǒng),其中包括安防類系統(tǒng)(園區(qū)樓宇的安全防護(hù),門禁,視頻等監(jiān)控)、消防類系統(tǒng)(機(jī)房?jī)?nèi)煙霧探測(cè)器,滅火設(shè)施等管理)、環(huán)境檢測(cè)類(機(jī)房?jī)?nèi)溫濕度、漏水、氣體等檢測(cè))、供電設(shè)施類(機(jī)房?jī)?nèi)配電設(shè)備,發(fā)電機(jī)、UPS、機(jī)柜PDU管理)、散熱類系統(tǒng)(空調(diào)設(shè)備,新風(fēng)及冷水機(jī)組等監(jiān)控)、資產(chǎn)管理類系統(tǒng)(機(jī)房?jī)?nèi)軟硬件基礎(chǔ)設(shè)施、資源生命周期監(jiān)控管理)等諸多與基礎(chǔ)設(shè)施相關(guān)的運(yùn)維管理工具。
隨著新興技術(shù)的革新,又催生出一批基于RFID的資產(chǎn)管理、人員定位系統(tǒng),基于激光雷達(dá)圖像識(shí)別的智能巡檢機(jī)器人以及基于數(shù)字孿生技術(shù)構(gòu)建出立體式、可視化的新一代數(shù)據(jù)中心管理軟件,這些新型工具與過往傳統(tǒng)工具相互銜接配合,目前已經(jīng)基本可以讓管理人員足不出戶就能實(shí)時(shí)掌控機(jī)房基礎(chǔ)環(huán)境中的各類有效信息,大大提升管理效率。
網(wǎng)絡(luò)運(yùn)維管理
如果把機(jī)房基礎(chǔ)環(huán)境當(dāng)做一個(gè)人的身體,那數(shù)據(jù)中心網(wǎng)絡(luò)則相當(dāng)于人身體的骨骼和神經(jīng),負(fù)責(zé)維系各肢體的有序運(yùn)行,也是數(shù)據(jù)中心建設(shè)前期重點(diǎn)投資的地方,其主要包含網(wǎng)關(guān)、路由器、交換機(jī)、防火墻、負(fù)載均衡、入侵檢測(cè)、AC控制器、光傳輸設(shè)備、域名解析等最基礎(chǔ)的網(wǎng)絡(luò)通信設(shè)備,在數(shù)據(jù)中心通常由網(wǎng)絡(luò)通訊/網(wǎng)絡(luò)管理部門負(fù)責(zé)管理。由于網(wǎng)絡(luò)運(yùn)行的質(zhì)量、穩(wěn)定性會(huì)受到傳輸、交換和終端等諸多不確定因素干擾,時(shí)常成為運(yùn)維故障中的背鍋俠,但是他們也是能人輩出的地方,從他們的工作內(nèi)容大致也能看出一些端倪:
負(fù)責(zé)建立全行網(wǎng)絡(luò)建設(shè)總體架構(gòu)規(guī)劃、網(wǎng)絡(luò)運(yùn)維管理流程和工作機(jī)制制定;
負(fù)責(zé)各類基礎(chǔ)網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)安全設(shè)備、網(wǎng)絡(luò)管理工具以及網(wǎng)絡(luò)通訊線路等的實(shí)施、運(yùn)維和管理;
負(fù)責(zé)定制全行網(wǎng)絡(luò)設(shè)備擴(kuò)容升級(jí)、老化更新以及網(wǎng)絡(luò)通訊線路開通、關(guān)閉,軟件版本升級(jí)、VLAN/Zone劃分和監(jiān)控運(yùn)維管理;
負(fù)責(zé)全行骨干、外聯(lián)、局域、園區(qū)網(wǎng)絡(luò)訪問可用性和訪問質(zhì)量保障、網(wǎng)絡(luò)性能優(yōu)化、策略管理、故障排查、網(wǎng)絡(luò)病毒查殺和網(wǎng)絡(luò)安全防護(hù);
不僅負(fù)責(zé)數(shù)據(jù)中心內(nèi)部局域網(wǎng)的運(yùn)維管理,還會(huì)涉及總部終端網(wǎng)絡(luò)接入&重點(diǎn)線路保障、數(shù)據(jù)中心和各一級(jí)分行、海外分行的骨干網(wǎng)絡(luò)、第三方合作單位的外聯(lián)線路質(zhì)量保障。
這么復(fù)雜紛繁交織的網(wǎng)絡(luò)設(shè)備、線路管理依靠人肉來運(yùn)維肯定是行不通的,因此在數(shù)據(jù)中心發(fā)展初期,最不能或缺的就是網(wǎng)管工具,時(shí)至今日還有一些城商行依然維持著一套網(wǎng)管工具包打天下的局面,但是隨著數(shù)據(jù)中心的規(guī)模和復(fù)雜度的不斷攀升,需要更加精細(xì)化的網(wǎng)絡(luò)運(yùn)維管理,因此出現(xiàn)了資產(chǎn)管理類系統(tǒng)(設(shè)備、端口、線路、IP等資產(chǎn)資源管理工具)、配置管理類系統(tǒng)(對(duì)設(shè)備運(yùn)行參數(shù)、業(yè)務(wù)策略配置工具,由于各品牌設(shè)備可能存在自身的私有協(xié)議,因此可能涉及多套各廠商配置管理工具)、流量分析類系統(tǒng)(抓包解包、協(xié)議分析等工具)、故障管理類系統(tǒng)(采集、分析、告警上報(bào)工具)、性能管理類系統(tǒng)(網(wǎng)絡(luò)性能、設(shè)備性能、終端性能、組件性能工具)、維護(hù)類系統(tǒng)(告警處置、工單流轉(zhuǎn)、知識(shí)庫、運(yùn)維文檔等工具)、安全管理類系統(tǒng)(入侵防護(hù)、態(tài)勢(shì)分析、用戶行為分析、日志分析等工具)等諸多與網(wǎng)絡(luò)相關(guān)的運(yùn)維管理工具,隨著傳統(tǒng)網(wǎng)絡(luò)開始逐步向SDN轉(zhuǎn)變又會(huì)帶來一系列新的運(yùn)維管理工具。下圖是我們?cè)谀硞€(gè)客戶項(xiàng)目中需要對(duì)接到很小一部分工具列表。
看到網(wǎng)絡(luò)團(tuán)隊(duì)內(nèi)這么多零零散散的工具,于是很多小伙伴會(huì)問他們?cè)趺茨苡玫倪^來?是的,這也是整個(gè)網(wǎng)絡(luò)運(yùn)維中大家比較頭疼的事情,雖然說購買了如此多的工具,但是這些工具直接又相互隔離分散,從OpenView出現(xiàn)那個(gè)年代如何打通設(shè)備、端口、線路之間的銜接關(guān)系,再疊加上告警、性能、日志等信息及自動(dòng)化操作一直是網(wǎng)管工具的夢(mèng)想,只是當(dāng)時(shí)受限于技術(shù)門檻一直遲遲未能實(shí)現(xiàn),目前來看市場(chǎng)上已經(jīng)有國(guó)產(chǎn)軟件實(shí)現(xiàn)這一目標(biāo),正在以一種新的運(yùn)維模式改善現(xiàn)狀。
系統(tǒng)運(yùn)維管理
如果說機(jī)房基礎(chǔ)環(huán)境相當(dāng)于人的身體,網(wǎng)絡(luò)相當(dāng)于骨干和神經(jīng),那系統(tǒng)恐怕就是人的各種器官了,回顧整個(gè)IT發(fā)展歷程,計(jì)算存儲(chǔ)都占有舉足輕重的地位,比如當(dāng)初IBM的大機(jī)不僅自帶網(wǎng)絡(luò)、存儲(chǔ)還會(huì)配備終端,屬于一站式對(duì)外提供服務(wù)。隨著開放平臺(tái)和X86的興起,在此基礎(chǔ)上又衍生出來了計(jì)算、存儲(chǔ)虛擬化、云化資源等供給模式。計(jì)算存儲(chǔ)資源由于是所有軟件和服務(wù)的直接載體,數(shù)據(jù)中心每年在此都投入巨大,雖然不同銀行會(huì)根據(jù)系統(tǒng)規(guī)模劃分出形式各異的運(yùn)維部門,但他們的工作內(nèi)容卻相差無幾,主要涉及:
1.負(fù)責(zé)數(shù)據(jù)中心主機(jī)系統(tǒng)(包括操作系統(tǒng)、主機(jī)通訊、主機(jī)存儲(chǔ)、主機(jī)帶庫、中間件、數(shù)據(jù)庫等子系統(tǒng))的環(huán)境建設(shè),開放平臺(tái)系統(tǒng)(包括操作系統(tǒng)、中間件、數(shù)據(jù)庫、開放存儲(chǔ)等子系統(tǒng))的環(huán)境建設(shè),X86平臺(tái)系統(tǒng)(包括操作系統(tǒng)、中間件、數(shù)據(jù)庫、存儲(chǔ)等子系統(tǒng))參數(shù)配置及性能優(yōu)化,建立各平臺(tái)系統(tǒng)的運(yùn)維管理流程和工作機(jī)制,一般對(duì)于大中型銀行來說這些可能是分散在不同部門來分別運(yùn)維;
2.負(fù)責(zé)實(shí)施主機(jī)系統(tǒng)、開放平臺(tái)、X86平臺(tái)的技術(shù)支持,包括系統(tǒng)環(huán)境及存儲(chǔ)的需求受理、環(huán)境搭建、資源配置實(shí)施、性能優(yōu)化、生產(chǎn)變更和日常維護(hù)等工作;
3.負(fù)責(zé)主機(jī)系統(tǒng)、開放平臺(tái)、X86平臺(tái)系統(tǒng)的日常維護(hù)和管理,包括例行維護(hù)、事件處理、問題解決、系統(tǒng)版本升級(jí)、應(yīng)急方案制定和演練、系統(tǒng)運(yùn)行狀況跟蹤和分析、評(píng)估資源使用情況等工作;
4.負(fù)責(zé)同城備份中心及異地災(zāi)備中心計(jì)算和存儲(chǔ)資源的容量配置實(shí)施確保同城備份中心及災(zāi)備中心所承載系統(tǒng)環(huán)境的安全、可靠;
5.負(fù)責(zé)全行防病毒工作,制定全行防病毒整體方案、架構(gòu)和策略并組織實(shí)施。
不難看出由于銀行數(shù)據(jù)中心可能同時(shí)出現(xiàn)多種系統(tǒng)平臺(tái)以及傳統(tǒng)數(shù)據(jù)中心和云化數(shù)據(jù)中心并行的現(xiàn)象,因此會(huì)涉及很多功能相似但適用范圍不同的系統(tǒng),例如計(jì)算存儲(chǔ)資源類系統(tǒng)(資產(chǎn)管理、云化資源池管理及存儲(chǔ)管理等工具)、基礎(chǔ)軟件類系統(tǒng)(不同操作系統(tǒng)、不同中間件、不同數(shù)據(jù)庫的管理工具)、監(jiān)控類系統(tǒng)(硬件、軟件、存儲(chǔ)類監(jiān)控工具)、虛擬化系統(tǒng)(服務(wù)器虛擬化、存儲(chǔ)虛擬化等工具)、自動(dòng)化類系統(tǒng)(資源調(diào)度、軟件安裝、日常跑批等工具)、維護(hù)類系統(tǒng)(告警處置、工單流轉(zhuǎn)、數(shù)據(jù)備份、知識(shí)庫、運(yùn)維文檔等工具)等諸多與系統(tǒng)相關(guān)的運(yùn)維管理工具。
拿手機(jī)銀行系統(tǒng)來說,其WEB可能部署在X86平臺(tái),APP、DB可能部署在開放平臺(tái),如果大家按照不同系統(tǒng)平臺(tái)來劃分,以上工具各買一套,獨(dú)立維護(hù)就會(huì)造成工具豎井現(xiàn)象出現(xiàn),但是如果按照計(jì)算存儲(chǔ)資源和基礎(chǔ)軟件進(jìn)行劃分,就需要實(shí)現(xiàn)跨平臺(tái)工具能力整合,如何能在一套系統(tǒng)中看到所有運(yùn)維信息就變得尤為重要,這也是很多新型運(yùn)維軟件試圖解決的問題。
應(yīng)用維護(hù)管理
如果說機(jī)房基礎(chǔ)環(huán)境相當(dāng)于人的身體,網(wǎng)絡(luò)相當(dāng)于骨干和神經(jīng),系統(tǒng)是人的各種器官,那業(yè)務(wù)系統(tǒng)恐怕就是人的靈魂意識(shí)了,這塊也是銀行正常經(jīng)營(yíng)之本,可謂重中之重,因此銀行基于信息安全考慮都會(huì)獨(dú)立設(shè)置一個(gè)與數(shù)據(jù)中心平級(jí)的軟件中心,來專門負(fù)責(zé)籌建自己的業(yè)務(wù)系統(tǒng),而在數(shù)據(jù)中心通常也會(huì)有一個(gè)應(yīng)用維護(hù)部門與其對(duì)接,每當(dāng)應(yīng)用系統(tǒng)批次投產(chǎn)或重大變更上線時(shí),軟件中心通常會(huì)跟應(yīng)用維護(hù)部門共同承擔(dān)一部分工作,上線完成后再交由應(yīng)用維護(hù)部門做后續(xù)維護(hù)工作,因此大致會(huì)涉及工作內(nèi)容:
負(fù)責(zé)維護(hù)應(yīng)用系統(tǒng)各項(xiàng)生產(chǎn)活動(dòng),包括應(yīng)用投產(chǎn)環(huán)境(含生產(chǎn)、準(zhǔn)生產(chǎn)、投產(chǎn)演練和災(zāi)備環(huán)境)準(zhǔn)備、準(zhǔn)入控制、系統(tǒng)升級(jí)、系統(tǒng)下線、災(zāi)備切換及應(yīng)急演練等相關(guān)工作,確保生產(chǎn)變更的安全性和有效性;
負(fù)責(zé)配合進(jìn)行應(yīng)用投產(chǎn)測(cè)試、運(yùn)行風(fēng)險(xiǎn)評(píng)估,協(xié)調(diào)落實(shí)內(nèi)外部與應(yīng)用系統(tǒng)測(cè)試任務(wù)相關(guān)的基礎(chǔ)環(huán)境、計(jì)算存儲(chǔ)和基礎(chǔ)軟件環(huán)境、測(cè)試數(shù)據(jù)及相關(guān)技術(shù)支持等工作;
負(fù)責(zé)收集和整理應(yīng)用系統(tǒng)運(yùn)行信息,編制統(tǒng)計(jì)分析報(bào)告、定期對(duì)應(yīng)用系統(tǒng)進(jìn)行數(shù)據(jù)備份、介質(zhì)管理和數(shù)據(jù)恢復(fù)等工作,確保業(yè)務(wù)數(shù)據(jù)的完整性、保密性和可用性;
負(fù)責(zé)應(yīng)用系統(tǒng)24小時(shí)生產(chǎn)運(yùn)行監(jiān)控,承擔(dān)各應(yīng)用系統(tǒng)的聯(lián)機(jī)開啟、關(guān)閉及批量運(yùn)行;
負(fù)責(zé)應(yīng)用系統(tǒng)軟件、硬件及系統(tǒng)日常維護(hù)、事件處理等工作,當(dāng)應(yīng)用出現(xiàn)嚴(yán)重問題,及時(shí)協(xié)調(diào)各專業(yè)團(tuán)隊(duì)和軟件中心進(jìn)行解決,做好問題記錄。
應(yīng)用維護(hù)在數(shù)據(jù)中心是最接近銀行業(yè)務(wù)的部門,也是運(yùn)維復(fù)雜度最高的部門,而且還受監(jiān)管要求,為了避免受到監(jiān)管處罰及早于服務(wù)臺(tái)投訴,因此在日常運(yùn)維中更加依賴工具來響應(yīng)處理分析應(yīng)用系統(tǒng)當(dāng)前狀況,例如從如何加快應(yīng)用上線部署類系統(tǒng)(配置管理、自動(dòng)化平臺(tái)、服務(wù)開通等工具),到觀測(cè)應(yīng)用系統(tǒng)運(yùn)行狀態(tài)的監(jiān)控類系統(tǒng)(日志、監(jiān)控告警分析等工具)和性能類系統(tǒng)(業(yè)務(wù)可用性、業(yè)務(wù)關(guān)鍵績(jī)效指標(biāo)、應(yīng)用性能、真實(shí)用戶體驗(yàn)、業(yè)務(wù)仿真等監(jiān)控工具),再到出了問題快速有效的容災(zāi)類系統(tǒng)(應(yīng)急管理、災(zāi)備切換等工具),以及日常維護(hù)類系統(tǒng)(告警處置、工單流轉(zhuǎn)、數(shù)據(jù)備份、知識(shí)庫、運(yùn)維文檔等相關(guān)工具)等諸多與應(yīng)用相關(guān)的運(yùn)維管理工具。
但是在實(shí)際上應(yīng)用系統(tǒng)出故障的因素太多,涉及范圍太廣,當(dāng)故障發(fā)生時(shí)就特別需要根據(jù)交易代碼/交易流水號(hào)/錯(cuò)誤碼快速生成故障點(diǎn)的上下游交易鏈路,再把業(yè)務(wù)性能監(jiān)控?cái)?shù)據(jù)、等信息進(jìn)行疊加進(jìn)行可視化呈現(xiàn),幫助運(yùn)維人員進(jìn)行故障定界,指導(dǎo)各專業(yè)部門協(xié)同排查,而這個(gè)時(shí)間可謂分秒必爭(zhēng),因此面向業(yè)務(wù)運(yùn)維的工具在當(dāng)前市場(chǎng)上都是炙手可熱的工具。
運(yùn)維管理的轉(zhuǎn)身
從現(xiàn)實(shí)來看機(jī)房基礎(chǔ)環(huán)境、網(wǎng)絡(luò)、系統(tǒng)、應(yīng)用這些工作,目前都強(qiáng)依賴使用各種不同專業(yè)工具進(jìn)行維護(hù),而這些工具在國(guó)內(nèi)基本已是紅海市場(chǎng),同質(zhì)化產(chǎn)品嚴(yán)重??蛻粲袝r(shí)只是想要一個(gè)小功能卻不得不又購買一個(gè)能力相近的工具,再加上每家銀行又有一定的獨(dú)特性,會(huì)根據(jù)自己的習(xí)慣和管理流程自主研發(fā)很多小工具輔助提升運(yùn)維效率,因此一家銀行有百十套運(yùn)維管理工具就不足為奇了。隨著數(shù)據(jù)中心基礎(chǔ)設(shè)施迭代更新,IT架構(gòu)轉(zhuǎn)型升級(jí),在實(shí)際過程中對(duì)應(yīng)的產(chǎn)品工具也會(huì)越來越多,而且如何解決跨專業(yè)的故障排查,尤其是當(dāng)某個(gè)業(yè)務(wù)系統(tǒng)或某支交易發(fā)生故障時(shí),排查起來就異常的困難,因此隨著數(shù)據(jù)中心運(yùn)維管理工具的逐漸累積,這種部門墻和工具墻就會(huì)被愈發(fā)的放大,如何實(shí)現(xiàn)跨專業(yè)故障排查就越來越迫切。
因此早在2010年前后,各大銀行已經(jīng)開始從整個(gè)數(shù)據(jù)中心角度去思考整合運(yùn)維管理工具,比較典型的就是當(dāng)時(shí)行業(yè)大佬圍繞配置管理提出”監(jiān)”、“管”、“控“運(yùn)維體系架構(gòu)。
近些年銀行業(yè)隨著數(shù)字化轉(zhuǎn)型和業(yè)務(wù)優(yōu)先上云戰(zhàn)略的逐步落地,銀行IT逐步轉(zhuǎn)變?yōu)橐钥蛻魹橹行奶峁﹥?yōu)質(zhì)金融服務(wù)的使命。隨著客戶個(gè)性化需求的增長(zhǎng),銀行IT對(duì)外提供的應(yīng)用和服務(wù)也愈發(fā)的多樣化,傳統(tǒng)的IT服務(wù)管理也從最初的軟硬件維護(hù)、故障排查、保證業(yè)務(wù)系統(tǒng)“穩(wěn)定、可靠、安全”運(yùn)行,逐步被面向業(yè)務(wù)交付成果的目標(biāo)所取代,因此銀行IT將更加關(guān)注“體驗(yàn)、效率、效益”為主題的IT運(yùn)營(yíng)。而Gartner預(yù)測(cè)這一轉(zhuǎn)型將在2025年實(shí)現(xiàn)。
同時(shí)Gartner認(rèn)為未來5年銀行IT建設(shè)更多圍繞用戶體驗(yàn)、持續(xù)交付和性能分析來重新調(diào)整構(gòu)建IT運(yùn)營(yíng)管理工具,以更好地適應(yīng)用戶在數(shù)字化銀行方面不斷增長(zhǎng)的需求,并給出至少應(yīng)當(dāng)建設(shè)的3大類工具圖譜。
而在我們理解這些工具之間應(yīng)該更加緊密的銜接起來,結(jié)合各種運(yùn)營(yíng)場(chǎng)景實(shí)現(xiàn)工具間資源優(yōu)化整合,逐步形成一套新的運(yùn)營(yíng)體系架構(gòu)圖譜。
這個(gè)架構(gòu)圖譜相當(dāng)于把之前的運(yùn)維工具重新優(yōu)化整合劃分為6個(gè)維度:
**? ? ??1.底層專業(yè)管理工具**
該維度屬于運(yùn)維基礎(chǔ)數(shù)據(jù)的抓手,將原先各專業(yè)分門別類的監(jiān)控采集能力進(jìn)行匯總,形成面向不同使用場(chǎng)景的監(jiān)控管理工具體系,實(shí)現(xiàn)對(duì)IT環(huán)境的各類基礎(chǔ)資源對(duì)象進(jìn)行管理,比如硬件資源監(jiān)控管理、通用軟件資源監(jiān)控管理、應(yīng)用資源監(jiān)控管理、用戶操作體驗(yàn)管理等;
**? ? ??2.自動(dòng)化管理工具**
自動(dòng)化主要是為了補(bǔ)充或增強(qiáng)運(yùn)維人員手動(dòng)過程,包括可以使用腳本實(shí)現(xiàn)對(duì)系統(tǒng)軟硬件進(jìn)行更改,也可以提供編排機(jī)制來集成不同系統(tǒng)和管理工具,以執(zhí)行單個(gè)或多個(gè)流程工作流。由于傳統(tǒng)數(shù)據(jù)中心和云化數(shù)據(jù)中心在銀行業(yè)還要同時(shí)存在好多年,因此目前基本包含一套面向傳統(tǒng)的自動(dòng)化管理工具和另一套云化自動(dòng)化管理工具;
**? ? ??3.配置管理工具**
配置管理作為銀行IT運(yùn)維的數(shù)據(jù)中臺(tái),也是運(yùn)維中永恒的老話題,不僅作為各領(lǐng)域運(yùn)維支撐工具的數(shù)據(jù)共享服務(wù)平臺(tái),而且還肩負(fù)著IT運(yùn)維標(biāo)準(zhǔn)化和自動(dòng)化的重任,因此這是銀行IT轉(zhuǎn)型升級(jí)的必備工具;
**? ? ??4.大數(shù)據(jù)分析工具**
該領(lǐng)域工具通過對(duì)日常運(yùn)維中各種結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行集中收集,再結(jié)合機(jī)器學(xué)習(xí)和智能算法在特定場(chǎng)景下進(jìn)行分析預(yù)測(cè),從而在故障發(fā)生之前做到預(yù)測(cè)隔離,降低解決問題所需的時(shí)間和精力,提高業(yè)務(wù)響應(yīng)和客戶體驗(yàn),比如預(yù)測(cè)伴隨業(yè)務(wù)增長(zhǎng)對(duì)依賴IT基礎(chǔ)資源的可用性和性能要求,以實(shí)現(xiàn)優(yōu)化成本的目的;
**? ? ??5.可視化運(yùn)營(yíng)管理工具**
可視化作為幫助人們降低理解和消費(fèi)數(shù)據(jù)的門檻的重要手段,諸多復(fù)雜分散的服務(wù)管理工具有了可視化的加持不僅可以讓運(yùn)營(yíng)支撐管理過程可見、可管、可理解,而且也是用戶、管理者、員工喜聞樂見的,因?yàn)橛脩趔w驗(yàn)好了、運(yùn)維好掌控了、企業(yè)就效率高了;
**? ? ??6.服務(wù)管理和安全管理工具**
在對(duì)IT環(huán)境的基礎(chǔ)資源進(jìn)行有效監(jiān)控管理之后,此時(shí)IT運(yùn)維工作已經(jīng)基本可控。為了實(shí)現(xiàn)精細(xì)化運(yùn)維,讓運(yùn)維工作從“活著”轉(zhuǎn)變到“活得好”,通常都會(huì)考慮對(duì)業(yè)務(wù)、組織、工具間相互協(xié)作進(jìn)行資源合理優(yōu)化,主要包括服務(wù)目錄管理和運(yùn)營(yíng)自服務(wù)管理還有安全管理這個(gè)永遠(yuǎn)說不完的話題。
隨著云計(jì)算、大數(shù)據(jù)、人工智能這些新一代信息技術(shù)的興起,銀行業(yè)在去IOE進(jìn)程上也走到了最后的攻堅(jiān)階段,互聯(lián)網(wǎng)企業(yè)也開始在銀行業(yè)攻城略地,新一代國(guó)產(chǎn)運(yùn)維管理軟件也逐步嶄露頭角,開始在銀行中逐步替代"4Big",諸王紛爭(zhēng)序幕已經(jīng)拉開,相信國(guó)產(chǎn)軟件的春天已來。
