日韩有码亚洲专区|国产探花在线播放|亚洲色图双飞成人|不卡 二区 视频|东京热av网一区|玖玖视频在线播放|AV人人爽人人片|安全无毒成人网站|久久高清免费视频|人人人人人超碰在线

首頁 > 文章中心 > 正文

略說地震數(shù)據(jù)庫維護現(xiàn)狀分析及對策

前言:本站為你精心整理了略說地震數(shù)據(jù)庫維護現(xiàn)狀分析及對策范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

略說地震數(shù)據(jù)庫維護現(xiàn)狀分析及對策

1現(xiàn)狀

目前,Oracle數(shù)據(jù)庫系統(tǒng)主要集中分布在國家中心、41個區(qū)域中心、33個應急中心、300個縣節(jié)點、300個臺站,其中雙機系統(tǒng)79套,單機系統(tǒng)600套。而支撐行業(yè)數(shù)據(jù)庫運行的硬件平臺多樣,部署方式復雜,具體表現(xiàn)在以下幾個方面。數(shù)據(jù)庫系統(tǒng)的部署環(huán)境多樣復雜。雙機數(shù)據(jù)庫IT環(huán)境涉及到IBM服務器、曙光服務器和SUN服務器系統(tǒng),以及數(shù)據(jù)存儲系統(tǒng)EMC與HDS。數(shù)據(jù)庫系統(tǒng)的技術結構復雜,管理難度高。系統(tǒng)大多采用Unix和Linux系統(tǒng),數(shù)據(jù)庫使用Oracle10gRAC,存儲使用OracleASM管理。數(shù)據(jù)庫系統(tǒng)地域分散。主要集中分布在國家中心、41個區(qū)域中心、33個應急中心、300個縣節(jié)點和300個臺站。系統(tǒng)管理分散。各級節(jié)點自行管理維護。在部分節(jié)點內部,服務器和操作系統(tǒng)一般按照業(yè)務應用分多個運行維護小組,各自管理維護。以上特點決定了地震行業(yè)數(shù)據(jù)庫運行維護是一個復雜而艱巨的任務,需要總結多年來數(shù)據(jù)庫運維過程中出現(xiàn)的問題,制定合理的運行維護策略,以保證數(shù)據(jù)庫系統(tǒng)的正常運行。

2運行維護事件分析

為了更好地分析數(shù)據(jù)庫運行維護過程中出現(xiàn)的問題,作者分析整理了近4年來數(shù)據(jù)庫運行維護過程中出現(xiàn)的各類問題,其中系統(tǒng)故障6類、存儲故障5類、網(wǎng)絡故障3類、ASM故障11類、CRS故障8類、數(shù)據(jù)庫本身故障12類及其它故障4類進一步對表1中7大類故障進行分析,可以看出存在以下問題:操作系統(tǒng)平臺存在兼容性問題如部分省局數(shù)據(jù)庫運行在曙光服務器上,操作系統(tǒng)為SUSE,操作系統(tǒng)與后臺存儲系統(tǒng)之間的銜接容易出故障。而采用IBM和SUN硬件平臺的節(jié)點數(shù)據(jù)庫系統(tǒng)就沒有類似問題的發(fā)生。存儲系統(tǒng)平臺存在兼容性問題如應急數(shù)據(jù)庫系統(tǒng)部署在HDS之上,HDS經(jīng)常容易發(fā)生數(shù)據(jù)壞塊的情況,造成數(shù)據(jù)庫故障,如:表1中的存儲故障;ASM故障的;CRS故障的等。日常維護存在問題在操作系統(tǒng)和存儲系統(tǒng)軟硬件平臺不出現(xiàn)問題的情況下,需要維護人員每天、每周和每月定時做很多工作,如:查看磁盤空間使用情況、數(shù)據(jù)庫告警日志等。而目前缺乏統(tǒng)一的規(guī)章制度與規(guī)范,督促維護人員完成這些日常工作,維護工作的好壞基本上取決于維護人員的責任心。再者,運行維護人員的水平較低,一些基本的數(shù)據(jù)庫維護工作難以很好的完成。如果有一套健全的規(guī)章制度與規(guī)范,同時還有一批具有較高數(shù)據(jù)庫運行維護經(jīng)驗的管理人員,那么上述7大類故障中的大多數(shù)故障是可以提前預防的。數(shù)據(jù)庫管理和維護缺乏科學依據(jù)缺乏一套有效的數(shù)據(jù)庫監(jiān)控系統(tǒng)來對數(shù)據(jù)庫運行狀態(tài)的各關鍵指標信息進行數(shù)據(jù)搜集和統(tǒng)計,完成如日常性能監(jiān)控、每月性能評估、數(shù)據(jù)庫審計等人工工作量大,難以完成的工作,將數(shù)據(jù)庫隱患消滅在萌芽狀態(tài)。而在數(shù)據(jù)庫運行維護中凸顯出來的主要問題有:運行維護管理制度不健全。目前Oracle數(shù)據(jù)庫管理被動、分散、管理規(guī)范不完善,如:缺乏統(tǒng)一的備份與管理策略、安全策略、管理流程等。運行維護人員技術水平較低。相對于專業(yè)的Oracle數(shù)據(jù)庫運行維護人員而言,目前行業(yè)內的技術人員在數(shù)據(jù)庫方面的運行維護技能水平較低,技術人員相對不固定。雖然技術人員通過了每年的技術培訓,但在提高運行維護的能力方面還有待進一步提高。運行維護技術平臺亟待建立。缺乏數(shù)據(jù)庫基礎運行環(huán)境(操作系統(tǒng)、存儲系統(tǒng)和網(wǎng)絡)的統(tǒng)一故障預警及故障監(jiān)測機制。管理員對系統(tǒng)故障的反應速度無法提高,一般是在出現(xiàn)問題以后才進行查找及處理,難以充分保障關鍵業(yè)務系統(tǒng)的可用性,無法做到“主動式”系統(tǒng)管理。

3對策與建議

完善行業(yè)數(shù)據(jù)庫運行管理制度以提高數(shù)據(jù)庫運行水平和管理能力為目標,建立一套完整的流程管理規(guī)范,同時結合必要的工具管理軟件,使主機、存儲和數(shù)據(jù)庫系統(tǒng)得到責任保障,保證數(shù)據(jù)庫系統(tǒng)連續(xù)穩(wěn)定運行。加強人員培訓一般來說,地震行業(yè)比較注重硬件平臺建設,而對流程和人員的軟平臺建設有所忽略。由于當前人員的技術水平還較低,再加之相關培訓的不足,因此解決實際問題的能力和效率較低。為此需要開展相關的技術培訓,以提高地震系統(tǒng)數(shù)據(jù)庫的運行和維護技能。建立數(shù)據(jù)庫運行維護技術支撐平臺應建立數(shù)據(jù)庫基礎運行環(huán)境(操作系統(tǒng)、存儲系統(tǒng)和網(wǎng)絡)的統(tǒng)一故障預警及故障監(jiān)測機制,由過去的“被動式”管理轉變?yōu)椤爸鲃邮健惫芾?,以提高?shù)據(jù)庫管理人員對系統(tǒng)故障的反應速度,保障關鍵業(yè)務系統(tǒng)的可用性。建立數(shù)據(jù)庫運行維護知識庫開展數(shù)據(jù)庫知識轉移工作,建立一套持續(xù)機制,確保維護知識和技能的傳承。將數(shù)據(jù)庫運行維護中的每次事件、故障或者問題解決過程中所獲得的解決方法和維護經(jīng)驗都記錄下來,建立一個知識庫,以提高對出現(xiàn)的事件及問題的處理效率。

4結語

本文僅針對目前存在的問題提出了一些方向上的解決辦法。在未來的發(fā)展中,還需要將成熟的管理理論與具體的需求及目標結合起來,以探求出解決具體問題的方案。Oracle數(shù)據(jù)庫系統(tǒng)的運行維護是一個需要長期面對的研究課題,應結合IT行業(yè)運行維護的相關管理理論,進行不斷的開發(fā)和完善。

作者:周娜李永紅李曉京張蕾單位:中國地震臺網(wǎng)中心