親愛(ài)的客戶朋友們
在此希望您有個(gè)愉快的周末!
首先, 我們希望對(duì)于2018年3月11日至3月12日凌晨其間內(nèi)發(fā)生的網(wǎng)絡(luò)連線中斷情形表達(dá)誠(chéng)摯的歉意。以下我們?yōu)槟f(shuō)明此次事件的詳細(xì)情形:
在2018年3月11日晚上,我們收到了第一個(gè)關(guān)于網(wǎng)絡(luò)連線問(wèn)題的投訴。某個(gè)客戶無(wú)法由某個(gè)國(guó)際地區(qū)連接到我們的洛杉磯網(wǎng)絡(luò)。所以,我們都進(jìn)行了初步調(diào)查,但檢查當(dāng)下并沒(méi)有再發(fā)生相同的問(wèn)題。而后,我們收到來(lái)自其他客戶的額外投訴,表示他們無(wú)法加載他們的網(wǎng)站或他們的IPMI。最終,我們將這個(gè)問(wèn)題鎖定在我們網(wǎng)絡(luò)內(nèi)的TCP / UDP連接問(wèn)題上。經(jīng)過(guò)多次故障排除嘗試后,我們?nèi)匀粺o(wú)法找到問(wèn)題的真正根源。在2018年3月11日星期日的早上,我們做了最后的嘗試,并且檢查我們機(jī)房?jī)?nèi)的每個(gè)交換機(jī)/路由器設(shè)備,期望找到可能導(dǎo)致此異常TCP / UDP丟失的任何事情。總而言之,我們最終在核心交換機(jī)上發(fā)現(xiàn)了內(nèi)存泄漏的小警告級(jí)別。而此內(nèi)存泄漏是由操作系統(tǒng)(軟件)錯(cuò)誤引起的。我們?nèi)匀徊桓逸p下結(jié)論,所以我們決定排除此錯(cuò)誤故障來(lái)確定是否能解決問(wèn)題。正如你可能已經(jīng)知道我們有一個(gè)冗余的N + 1網(wǎng)絡(luò)基礎(chǔ)設(shè)施。這使我們有能力暫時(shí)將有問(wèn)題的核心交換機(jī)下線進(jìn)行故障排除。關(guān)閉后,我們看到問(wèn)題自行解決。因此網(wǎng)絡(luò)團(tuán)隊(duì)隨后決定用最新的操作系統(tǒng)更新來(lái)修補(bǔ)交換機(jī),并希望能夠解決修復(fù)這種情況。然后,我們?cè)噲D在核心上運(yùn)行補(bǔ)丁更新,但不幸更新失敗。這迫使我們必須以更新的固件完全格式化交換機(jī),并手動(dòng)配置將各項(xiàng)設(shè)定恢復(fù)到交換機(jī)中。這項(xiàng)更新補(bǔ)丁的嘗試工作造成了大約1-2個(gè)小時(shí)的整個(gè)網(wǎng)絡(luò)中斷。但最終經(jīng)歷更新和恢復(fù)完成后,我們現(xiàn)在很高興地通知您,所有連接問(wèn)題都已解決!
再次,我們對(duì)任何網(wǎng)絡(luò)中斷和最初的TCP / UDP連接問(wèn)題深表歉意。我們知道這可能耗費(fèi)了比預(yù)期更長(zhǎng)的時(shí)間,但由于這個(gè)問(wèn)題的癥狀較廣泛,我們花了一段比較長(zhǎng)的時(shí)間才發(fā)現(xiàn)細(xì)部原因,然后找出問(wèn)題的真正根源。往后, 我們也將持續(xù)監(jiān)控網(wǎng)絡(luò),隨時(shí)關(guān)注我們可能已經(jīng)找到或尚未發(fā)現(xiàn)到的其他任何問(wèn)題。我們非常感謝您繼續(xù)的業(yè)務(wù)合作與支持理解。
如果您有任何反饋需求或尚有其他疑慮, 請(qǐng)?jiān)诖碎_(kāi)啟建立客戶服務(wù)聯(lián)絡(luò)單.