目前主流的商業智能(Business Intelligence,簡稱:BI)和分析應用主要關注的是如何從已有資料中提取業務價值,反映公司發展、客戶行為和業務趨勢,這種方法是面向過去的。而一些新興的資料分析技術已經把目標投向了未來預測分析。企業通過採用大數據分析技術預測未來可能發生的事情。
但是,預測建立模組和資料抓取技術要想準確地預測出客戶行為,制定有效的企業策略,需要處理大量的多種類型資料;其實要真正落實預測分析,企業需要做的不只是給分析人員配備預測建立模組工具這麼簡單。
現在通常是資料科學家和統計分析人員自己寫演算法,構建預測模型。其實演算法和分析模型需要經歷創建、測試和運行的階段,在資料產生之前,這些工作應該是已經做好了的。“要解決一個問題,其實百分之八十的時間都花在資訊收集上,而資訊收集一開始就應該和業務相關聯繫。”
大數據項目一開始就要有建立模組人員參與其中,建立模組人員需要將自己的數學知識和企業的業務知識相結合。演算法寫的再好也不能為企業解決具體業務問題的。讓資料分析人員和業務人員多交流,讓資料科學家瞭解自己要解決的問題,這樣他們才能充分利用資料,解決業務問題。
技術與業務不能各自為政
大數據分析專案主要是對資料進行挖掘,找出和企業相關的資訊。這個過程中,需要建立模組人員與業務用戶的合作。建模工作不能孤立地完成。
隨著企業不斷的收集、存儲和分析大數據,企業利用資料的方式也在發生改變。一開始的時候,企業更感興趣的是資料收集,把一堆資料放到Hadoop或者其他存儲系統裡。慢慢地,企業更希望合理利用資料,達成具體目標,比如增加利潤、節省支出等。這意味著預測模型的構建需要以具體的業務目標為基礎。
如果建立模組人員不瞭解業務,預測分析就不能發揮出價值。無論是不是大數據,建立模組都應該以特定的業務問題為基礎。我見到過很多公司的資料項目都因為技術人員不懂業務而失敗,結果往往是模組本身很好,但卻沒法實際應用。
成功是來自無數次的失敗
很多公司之中,業務問題和相關的資料集一旦確立,預測模型的開發基本上是一個可反覆運算的過程。分析團隊會創建多種不同的模型,比如線性回歸模型和神經網路模型,從而找出最適合使用的應用程式。在建立模組的同時,技術人員會建立獨立的資料沙盒,包含相關資訊,並且與資料庫隔開。這樣技術人員就可以深入瞭解不同的選項,測試不同的樣板模型。確保模型能夠正常使用。
我們一年前接觸過一家公司,這家公司使用的是SAS軟件供應商的資料建立模組、資料採擷和分析工具。他們的建立模組首先關注的是對保險管理賠償和健康檔案的分析,公司借此判斷哪些患者需要額外的醫療服務、哪些人的症狀表明他有可能患有疾病(比如糖尿病、心臟病)。分析團隊也會關注臨床,幫助患者快速恢復健康,或降低醫療成本。
因為資料科學家需要嘗試不同的方法構建資料模型,所以這個過程要花費較長時間,而且經常會失敗。正因為如此,專案需要獲得高層的支持(金錢上的支持十分重要),這樣才能保證項目能夠持續下去。專案管理者要讓高層瞭解專案的特點,不能讓專案因為失敗或成本過高而停止。
以上資訊由www.hkitblog.com提供
[詳情] http://clink.hk/m16yi
送您一年 Smart SSL VPN 服務 *
為慶祝 CommuniLink 十六週年,現推出大贈送優惠!
* 現凡新參加 CommuniLink 指定雲端 網站寄存 或 電郵 計劃,即送您一年 Smart SSL VPN 服務,享用優質雲端網站寄存和電郵服務外,更可解決出差時的網絡連接不通問題,工作時就更加得心應手。
優惠期至9月30號,請立即網上登記,勿失良機!
作為 Network 人,想必都曾經採用過 Wireshark 來分析封包之中的數據;雖然 Wireshark 在極其細微的層面上為 IT 專業人士提供了關鍵的封包擷取數據,的確能幫助他們更深入了解網絡的內部情況,為 IT 專業人士需要在獲得及評估這些數據時省去花費幾個小時手動計算的精力。不過要快速完成封包的分析工作並非易事,即使專業人員往往亦需花上一定時間。
近日便有廠商考慮到分析 Wireshark 數據的時間問題,於是便推出一套名為 SolarWinds Response Time Viewer for Wireshark 的免費工具,通過此工具的協助下,管理員便可將手動分析由 Wireshark 生成的封包擷取數據的過程自動化,令 IT 專業人士能更輕鬆迅速地計算應用程式及網絡的反應時間。
透過對應用程式及網絡反應時間以及由 Wireshark 封包擷取數據產生的數據和交易量進行無縫自動分析及計算,SolarWinds Response Time Viewer for Wireshark 提升了用戶對 Wireshark 的體驗。憑藉對數據的深入了解,IT 專業人士就可以判斷效能問題的根源是來自網絡還是應用程式。
SolarWinds Response Time Viewer for Wireshark 可讓 IT 專業人士:
– 分析常見的 Wireshark 封包擷取文檔
– 計算網絡及應用程式反應時間
– 分析及顯示數據與交易量
以上資訊由www.hkitblog.com提供
Categories: 市場快訊 Tags: SOLARWINDS, SOLARWINDS RESPONSE TIME VIEWER FOR WIRESHARK, WIRESHARK, 免費工具, 分析封包, 封包分析, 封包分析 WIRESHARK, 封包分析 中文, 封包分析器 未知交換, 封包分析工具, 封包分析軟體
網絡功能虛擬化 (Network Functions Virtualization,簡稱 NFV)是一個新的技術,此技術簡單直接而言,就是將以往必須建基於硬件形式的各種技術虛擬化,例如負載平衡、防火牆、IDS(Intrusion Detection System)等等,最終希望做到盡量減少硬件投資的各種成本,包括部署、硬件使用的電力、數據中心空間等。
早年 SDN 的出現亦是如此,就是希望通過將傳統的網絡管控虛擬化從而減少部署成本,所以 SDN 一時間成為科技投資者的心頭好,不過 SDN 是否真能改變傳統硬件上的種種問題,暫時仍是 Still Don’t No-Know(SDN~);NFV 的出現當然亦引起投資者的興趣,不過卻比 SDN 更為複雜。
盡管如此,坊間仍然有網絡設備生產商對此技術興致勃勃,其中 Brocade 便是當中的表表者,近日更投放資源與 Telefónica NFV 參考實驗室 (Telefónica NFV Reference Lab) 展開一連串的行動,包括為 NFV 方案的部署及效能進行試驗並奠定新基準,希望說服服務供應商能信任並徹底提升對虛擬化軟件網絡基建效能的期望,最終達致增加銷售及領先同行。
在實驗中,Telefónica NFV 參考實驗室利用記憶棒,於不足兩小時內成功部署了 Brocade Vyatta 5600 vRouter 並完成效能測試。Brocade Vyatta 5600 vRouter 除了具備 Brocade vPlane 技術,亦利用了採用 Intel Xeon 處理器的伺服器以及 Intel Data Plance Development Kit,從而達致世界最大型電訊和服務供應商所要求的性能表現。
SDN 的故事
SDN 與 NFV 是有一定的關係,不過這兩種技術有那些地方是相近,對於企業來說又應該如何互補兩種技術的不足之處?先說說 SDN。可能大家都不知,原來 SDN 的起源最初是因為史丹福大學的學生厭倦每次進行網絡相關的研究時均需部署不同的核心系統,因此他們便研究如何將實體的網絡硬件設備的部份元素變成可編程化以及集中管理,就這樣 SDN 的元素及定義便出來了。
數據中心、OpenFlow 推動 SDN 成長
隨著流動裝置普及以及應付雲端服務需求,因此數據中心便需考慮不同方法降低成本,而恰好 SDN 的優勢就是能針對不斷擴展的虛擬機器作更好的連接與控制,多了數據中心採用 SDN 技術,令 SDN 很快便被各大企業接納;另外 OpenFlow 的出現,亦加快了 SDN 成長。一項新的技術,除了需要一些天才開發及完善之外,如何能從中獲利以令計劃可持續發展亦十分重要,而 SDN 開初出現時亦遇到了這問題,就是新技術有了,如何令企業接受及嘗試?
其中一個重要的工作就是要盡快定立標準化,就好像不同的技術如 3.5G、4G LTE 等等,都是因將技術標準化繼而令廠商可易於遵循及開發採用新技術的方案;於是 SDN 便聯合各大廠商組織了一個開放的網絡論壇(ONF),其開初的主要目的就是為 SDN 之中的控制層(Control)與轉發層(Forwarding Layers)之間的通訊定立一個標準;現時大家能直接通過控制層管理實體/虛擬式的路由器、網絡交換器等等,都是多得 OpenFlow 的出現…..
以上資訊由www.hkitblog.com提供
Categories: 市場快訊 Tags: Brocade, IDS, NETWORK FUNCTIONS VIRTUALIZATION, NFV, OPENFLOW, SDN, SDN 香港, SOFTWARE-DEFINED NETWORKING, SOFTWARE-DEFINED NETWORKING VENDORS, STILL DON’T NO-KNOW, 數據中心, 網絡功能虛擬化, 負載平衡, 軟件定義網絡, 防火牆
SLA(Service-Level Agreement)作為 IT 人你一定有接觸過,例如我們想租用某個數據中心又或者使用不同的 SI 服務,那我們便會留意 SLA 的百分比;不過大家又有沒有詳細計算過,例如是 99.998% 的 SLA 代表了實際停機的總時數呢?我相信大家都沒有時間做這些計算。
今天筆者正在打量著數據中心的 SLA 有沒有「水份」,於是便決定在網絡上找尋一下計算 SLA 的工具,竟然發現了一個專門用來計算 SLA 的網站。該網站雖然設計上十分一般,然而卻提供十分詳細的 SLA 計算功能。
例如筆者在上方的「Change SLA level: 」一欄輸入 99.98 的話,下方便會即時顯示出每天、每星期、每月以及每年所代表的停機時間,通過此工具我們便大約可知不同 SLA 百分比背後代表的真正意義,有興趣的話不妨到以下網址一試。
以上資訊由www.hkitblog.com提供