VMware 無法做Online Clone的解法(非標準)

近來發現有部分的機器都無法 Clone,這些機器都是在 vSphere 4.1 底下建立的Windows 2008 Server R2,每次都會發生以下的錯誤訊息:

Cannot create a quiesced snapshot because the create snapshot operation exceeded the time limit for holding off I/O in the frozen virtual machine,經過重新註冊 VSS,移除 VMWare Tools 後重裝,都還是遇到相同的問題,搜尋了很多網頁,終於在 VMWare 本身的討論區看到替代的解法。

首先這個問題應該是 vShpere 的 bug,跟Windows 2008 R2 不是很相容,個人的經驗在 vSphere 5.0 建立的VM就沒有這個問題,但是把這些有問題的VM migrate 到 5.0 的平台,Clone還是會有同樣的問題,依照以下這個討論串的解法,倒是可以完成 Online 的 Clone,但是是否能百分百功能還原成功還沒有測試過喔,我只有做到先斷開網路連線,然後是可以開機成功。

以下是調整的過程:

  • 對問題的 VM 按右鍵選擇 Edit Settings,選擇 Options -> General

VMWare Guest OS Options

VMWare Guest OS Options
閱讀全文 VMware 無法做Online Clone的解法(非標準)

異地備援結論-產品更新

之前因公司需求有評估過異地備援的方案, 雖然因為預算問題被暫停執行, (請參考: 異地備援方案最終建議), 不過先前評估過的廠商還是有繼續做資料的更新, 首先 Dell 的 EqualLogic 新增了 PS4000 系列, 取代原先評估的 PS5000, 功能仍然大同小異只支援 iSCSI, 其他的通通不支援, 在使用彈性上還是有受限, 在定價上比原先的 PS5000 還要在便宜一些, 有興趣的人可以參考 Dell 的網頁: PS4000 系列說明

無獨有偶, NetApp 也推出了 FAS2040 的產品, 預備取代先前評估的 FAS2050 系列, 在 CPU 及 RAM 的方面都比 FAS2050 等級要高一點, 但價格更低同時 出貨時就會多給一個通訊協定及一個管理程式的版權, 同樣的請參考 NetApp 的網頁: FAS2040 產品說明

Ps1. NetApp 沒有中文的網頁.
Ps2. 我不是上述兩家的 Sales 所以詳情請自行跟經銷商聯絡喔.

如何做到便宜的異地備份的方案

除了利用 FreeNAS 主機外, 還有另一種方式也可以做到相同的功能, 首先假設在外點需要除了要一份完整備份外, 期望能把每天的異動資料也能存放下來, 萬一有需要回覆的時候, 可以直接當場執行.

同時在總部這邊架設一台電腦, 利用 FastCopy 或相同的軟體去做自動同步的功能, 讓總部這邊隨時都有一份即時資料; 等資料收集完畢後, 總部自己也可以把資料備份到磁帶或備份硬碟上, 也能達到儲存異動資料的目的.

如何做到便宜的異地備份的方案
如何做到便宜的異地備份的方案

以上的作法就不適合跨過 Internet 執行, 除了同步時所產生的大量資料傳輸外, 通常同步軟體都是未經過加密處理的, 在公網上傳輸風險要自負喔.

簡易版異地備援方案

由於最近的不景氣, 在電腦投資上經費有所縮減, 原先提出的異地備援方案暫緩, 但又想要改變目前的備份方式, 只好另行規劃其他的方案, 先前分享的幾種同步的軟體其實就是為了找替代方案做測試, 想要找出最節省經費的情況下達到類似的功能, 同時也因為採取不同的方式, 原先資料損失的時間由最多2小時, 延長到 1 天, 未來在因需求分階段來建置.

此次規劃的目標:
1. 解決本地端的備份
2. 最多損失一天資料
3. 備份主機使用率提高
4. 資料最後集中至總公司收集後, 備份到磁帶備查

經過測試與評估後, 發現以下的方式比較符合公司目前的需求:
(a) 購買備份用主機, 虛擬主機軟體, 預計在上面可跑 Freenas, Windows Domain Controller (含DNS服務), Windows Update services, 測試用的 Windows server 等, 發揮一機多用的目的, 減少資源的重複投資.
(b) 購買磁帶櫃主機及磁帶, 放置於總公司內, 透過網路同步而來的分點資料統一備份.
(c) 採用免費的 VMWare ESX 版本, 作為備份主機的主要 OS, 上面在架設其他系統.
(d) 採用免費的 FreeNas 軟體, 達到遠地端同步傳輸有加密並透過壓縮減少頻寬的用量, 同時可利用 CIFS 功能作為檔案分享的立即備案使用.
(e) 採用免費的 FastCopy 作為 File Server 與 FreeNas 同步的機制.

閱讀全文 簡易版異地備援方案

DeltaCopy包覆Rsync的同步程式

趁著測試 VMWare ESX 的機會, 順便結合上次測試的 FreeNAS iSCSI 的功能, 來做日常備份的還原測試, 其測試環境設定如下:

VMWare ESX 主機, 上面安裝 Windows 2003 Server (測試版), 安裝 iSCSI initiator, 在FreeNas 主機上安裝 320G HDD 做軟體的 RAID5, 畫出一個 320G 的檔案給 iSCSI Target 使用, 由w2k3 server 掛載進來變成一個 HDD, 之後再由Server 上執行 NTBackup 讀取另外一台主機上面的完整備份檔案 (檔案放置在外接式硬碟上, 靠網路分享功能讀取).

所以該機制資料會由 Production Server 讀取本機的 USB 外接硬碟, 傳輸到 VMWare ESX 上面建置的 W2k3 測試 Server 上面解開後, 回存到FreeNAS iSCSI 服務上, 速度不盡理想, 不過 FreeNAS 的網路流量約在 40M ~ 60M BPS 左右, 效能換成 RAID0 或許還會在提昇一點.

由於該備份檔案約略有 250G 以上的容量, 所以光光ReStore 的時間就必須要花費 22 小時以上, 真正遇到需要還原的話可能會被使用者罵到臭頭, 所以還是需要重新考量其備份的方式, 以還原速度來看還是以檔案同步最快, 備份之後再還原都必須要花費數十個小時以上的時間, 對公司的影響甚深.

針對以上的缺點重新思考其備份策略, 原來想要用 Rsync for windows 的程式, 讓 Windows 的路徑可以直接跟 FreeNas 同步, 後來找到了 DeltaCopy 這個程式 , 該程式是把 RSync 包裝起來直接可以在 Windows 上面執行, 換言之就可以藉由這套程式來做到同步的功能.

當然在市面上有很多程式都可以做到這個部分, 那 DeltaCopy 有何特別之處呢?
1. 她是 OpenSource 所以沒有版權上面的問題
2. 核心是使用 RSync 還可以在傳輸的時候加上 SSH 加密, 防止封包備擷取
3. 傳輸前可以預先壓縮, 等到收到那方才解開, 減少網路流量
4. 最神奇的是他可以只傳輸檔案實際被異動的部份
閱讀全文 DeltaCopy包覆Rsync的同步程式

FreeNas 測試 (VI)

FreeNas 也有支援 iSCSI Target, 先前測試的幾個「高階」Storage 都有支援, 所以也來設定FreeNas 順便測試一下效率

首先到 服務 -> iSCSI 目標, 就可以看到以下的設定畫面, 第一步要設定一個 Extent, 這個 Extent 可以是一個或多個檔案 (如 Netap iSCSI 的方式), 也可以是一整個硬碟, 這邊使用檔案的方式做範例.
iSCSI Test

增加的畫面, Path 的欄位就是指定檔案存在的路徑及檔名, 這邊設定成 4G 大小.
iSCSI Test
閱讀全文 FreeNas 測試 (VI)

備援方案結論

在測試了數個不同的備援機制之後,廠商的報價實在是很高, 在目前的景氣不確定的環境下只好先行暫停,等待景氣回暖後再來提案.

不過還是要把手邊整理出來的資料來做個總結,也方便下次如果要採購建置的話可以免除作比較的工作.

備援的目標包括有公司檔案分享( Windows Shares), Oracle DB 及MS-SQL, 所有的平台都是建置在Windows 環境上,測試的標準如下:

測試項目 說明 測試方式
檔案複製(1) 檔案複製到 TP Server 能正常的複製到 DR
Server
複製檔案到 TP -> TPE-O, 資料要能在 DR
開啟
檔案複製(2) 檔案複製到 DR Server 能正常的複製到 TP
Server
複製檔案到 TP -> DR-P, 資料要能由 TP
開啟
容錯測試(1) 檔案複製到 TP Server 時,
中斷 DR Server 連線,
網路重新連線上時能重新傳送資料
複製檔案到 TP -> TPE-O, 中斷網路連線,
重新同步完畢後, 資料要能在 DR
開啟
容錯測試(2) 檔案複製到 TP Server 時,
重新啟動 DR Server, 網路重新連線上時能重新傳送資料
複製檔案到 TP -> TPE-O, 重新啟動 DR,
重新同步完畢後, 資料要能在 DR
開啟
容錯測試(3) 大量複製檔案到 TP Server, 當 TP
還在跟 DR 同步時,
重新啟動 TP, 系統開啟後可以繼續傳送資料
複製檔案到 TP -> TPE-O, 重新啟動 TP,
重新同步完畢後, 資料要能在 DR
開啟
容錯測試(4) 大量複製檔案到 TP Server, 當 TP
還在跟 DR 同步時,
切斷電源並確認 DR 端檔案是否能被開啟
複製檔案到 TP -> TPE-O, 拔掉 TP
電源, 至 DR
電腦檢查同步中的檔案, 檔案必須要維持能正常開啟的狀態.
ACL權限設定 確認在做檔案同步連帶 AD 的 ACL
權限設定會跟著一起移轉
在兩台機器設定帳號及權限對應關係, 觀察到另一台伺服器是否有帶過去
Oracle
資料庫測試(1)
未啟動資料庫檔案可以正常的同步 Shutdown
DB, 中斷連線,
在另一端開啟
Oracle
資料庫測試(2)
開啟資料庫少量更新後, 並下 Commit
指令
中斷連線, 並在另一端利用同步的檔案重新啟動
Oracle
資料庫測試(3)
開啟資料庫後更新資料, 並於更新途中立即關閉主機 中斷連線, 並在另一端利用同步的檔案重新啟動
iSCSI功能 讓其他主機可以利用 ISCSI 功能分享本主機的空間 在主機分享出 iSCSI 資源,
可以在其他主機上安裝 Initiator 變成本機硬碟
Oracle
Over iSCSI

Oracle 可以安裝在網路磁碟機

iSCSI 分享出來的硬碟上面安裝 Oracle Datafile
SQL
備份備援
(1)
未啟動資料庫檔案可以正常的同步 Shutdown
DB, 中斷連線,
在另一端開啟
SQL
備份備援(2)
開啟資料庫少量更新後, 並下 Commit
指令
中斷連線, 並在另一端利用同步的檔案重新啟動
SQL
備份備援
(3)
開啟資料庫後更新資料, 並於更新途中立即關閉主機 中斷連線, 並在另一端利用同步的檔案重新啟動

(註)TP Server 代表主要機房的所在地點, DR Server 則代表 DR-Site

閱讀全文 備援方案結論

測試 Dell EqualLogic iSCSI Storage (VI)

Dell EqualLogic 支援 MS-SQL Server 就比較強一點, 該產品直接有 UI 介面可以來操作, 同時製作 SnapShot 等動作都可以直接操作或排程, 甚至於復原都可以在一分鐘內完成.

Ps. MS-SQL 必須要上到 Service Pack 2 以上.

程式於安裝完畢後就會產生一個 Auto-SnapShot Manager, 其實是一個 MMC 的管理介面.
Dell EqualLogic

長得像是這樣子
Dell EqualLogic
閱讀全文 測試 Dell EqualLogic iSCSI Storage (VI)

測試 Dell EqualLogic iSCSI Storage (V)

測試 Oracle Database

上次借側的 Dell EqualLogic 還沒有測試完成, 接下來要測試 Dell 如何利用 Oracle 的備份機制, 加上 Storage 本身的 SnapShot 功能達到立即備份的目標.

首先在測試電腦安裝 Oracle 10g for Windows, 然後 Mount 一個 EqualLogic 所產生出來的 iSCSI 分享 Volume, 設定成 o:, 之後利用 Oracle 內建的 dbca (Database create assist) 軟體把資料庫建立在 O:oradata 內.

新增一個 Table 叫 EEE, 只有一個欄位就好, 拿來測試於資料寫入中, 做 SnapShot 作業系統能保留到那些資料.
create table eee(
ID VARCHAR2(10 BYTE) NOT NULL
);
閱讀全文 測試 Dell EqualLogic iSCSI Storage (V)