如何做好數(shù)字化體驗管理,了解一下?
大家好,我是阿里云云原生 ARMS 產(chǎn)品經(jīng)理徐葛,今天給大家?guī)砜捎^測系列課程的第三節(jié)課 -《業(yè)務(wù)&數(shù)字化體驗管理場景解讀》。本文主要分為三部分,第一部分是數(shù)字化體驗的必要性,從數(shù)字化體驗管理對業(yè)務(wù)的影響和數(shù)字化體驗管理對企業(yè)的價值兩個方面來介紹其必要性;第二部分,ARMS 在數(shù)字化體驗管理上的產(chǎn)品能力介紹;第三部分,結(jié)合客戶案例進行最佳實踐分享。
01
數(shù)字化體驗管理的必要性
Cloud Native
為什么我們需要數(shù)字化體驗管理呢?國外調(diào)研報告顯示,70% 用戶反饋網(wǎng)頁打開速度會直接影響用戶在線上網(wǎng)站進行購物的意愿。亞馬遜也發(fā)現(xiàn)網(wǎng)站加載速度每增加 100 毫秒,整體銷售額將減少 1%。 總的來看,用戶體驗將會直接影響到業(yè)務(wù)表現(xiàn)。那么數(shù)字化體驗對于企業(yè)來說,會帶來哪些價值?我們認(rèn)為數(shù)字化體驗的價值體現(xiàn)在三個方面:
.
首先,從流量角度來看,云撥測其實不是真實流量,它是模擬訪問流量。前端性能分析和 APP 性能分析基于真實流量進行性能分析,所以,從這里可以看出云撥測不需要流量,也能實現(xiàn)對網(wǎng)站或 API 接口進行性能管理。前端性能分析與 APP 性能分析,需要有真實流量才能夠?qū)崿F(xiàn)數(shù)字化體驗管理。 其次,從形式上看,云撥測是主動手段,它會主動對網(wǎng)站或者是 APP 的提供商進行訪問,更快、更早的發(fā)現(xiàn)體驗或其他相關(guān)問題,能夠在用戶之前去解決和修復(fù)這些問題。前端性能分析與 APP 性能分析更多的是被動式手段,有了用戶訪問流量以后,才能夠獲知相關(guān)指標(biāo),從而實現(xiàn)對應(yīng)分析。 最后,從數(shù)據(jù)量來看,云撥測訪問頻率和訪問次數(shù)都是能夠設(shè)定好,事先可控的,數(shù)據(jù)量相對來說較少。而前端性能分析和 APP 性能分析,因為采集的是真實流量數(shù)據(jù),所以網(wǎng)站及 APP 上的交互事件都會產(chǎn)生對應(yīng)指標(biāo)、日志,這都將產(chǎn)生大量數(shù)據(jù)。 總結(jié)來看,云撥測更多適用于獲取基準(zhǔn)體驗指標(biāo),例如某地區(qū)如果沒有用戶流量的話,通過云撥測對網(wǎng)站進行撥測,獲知這個地區(qū)整體性體驗指標(biāo)。同時,還可以對行業(yè)競爭對手網(wǎng)站進行撥測,獲取到行業(yè)基準(zhǔn)體驗指標(biāo)。而前端性能分析和 APP 性能分析由于基于真實流量,獲取的都是網(wǎng)站或者 APP 的真實體驗指標(biāo)。比如針對某新版本發(fā)布以后,驗證整體體驗是否達到了預(yù)期效果。另外,云撥測適合診斷及短期關(guān)注的體驗問題,前端性能分析和 APP 性能分析適合長期跟蹤 APP 或網(wǎng)站性能,并識別出潛在問題。也就是說云撥測能夠幫助我們回答的是已知問題的答案,比如說這個網(wǎng)站到底是可不可用?但是沒辦法回答潛在的問題,也就是說當(dāng)你還不知道問題出在哪里的時候,這種場景比較適合真實流量性能分析。
所以,在數(shù)字化體驗管理場景下,兩者進行結(jié)合才能夠為企業(yè)提供全方位數(shù)字化體驗管理。
ARMS 數(shù)字化體驗管理產(chǎn)品能力介紹
Cloud Native
接下來,我們針對云撥測、前端性能分析、APP 性能分析分別講解其核心能力。 概括來說,云撥測就是通過部署在全球各地的觀測點去盡量模擬真實用戶,從全球各地區(qū)訪問目標(biāo)網(wǎng)站或者 APP 掌握其可用性和性能。
云撥測具備以下優(yōu)勢:
- 分布于全球的海量檢測點,既有 IDC 機房檢測點,也有網(wǎng)民 LasMile 檢測點。
- 相對于應(yīng)用性能分析,既不需要專業(yè)技能,也不需要嵌碼,是一種非侵入式的手段,對網(wǎng)站進行撥測時,不需要研發(fā)配合,三分鐘就可以完成撥測配置。
- 作為主動式手段,7×24小時和分鐘級別的測試,先于用戶發(fā)現(xiàn)問題。
- 云撥測具備多種檢測模型,包括可用性分析、網(wǎng)頁性能分析、DNS劫持分析、CDN質(zhì)量性能分析。
第二個場景就是性能觀測。云撥測性能觀測可以分為三個方面,第一是針對網(wǎng)頁性能,包括首屏用時、100K 耗時,以及網(wǎng)絡(luò)層的 DNS 用時、TCP 用時、下載用時、SSL 握手用時以及阻塞用時;第二是針對網(wǎng)絡(luò)性能,網(wǎng)絡(luò)性能主要體現(xiàn)在時延和 DNS 查詢用時上;最后,針對文件傳輸,云撥測可以掌握到文件平均傳輸速度以及首包用時等指標(biāo),對需要文件傳輸?shù)膱鼍斑M行性能觀測。
第三個場景就是劫持分析場景,云撥測針對于常見劫持類型,包括 DNS 劫持、流量劫持和元素劫持進行劫持分析。另外,云撥測可以針對于 DNS 和 CDN 質(zhì)量進行檢測,包括對 DNS 解析策略及各個主機節(jié)點的性能狀況進行實時分析,并根據(jù)分析結(jié)果來對 DNS 解析策略進行調(diào)整。
云撥測還能在進行 CDN 選型時對 CDN 提供商的服務(wù)質(zhì)量進行評估,輔助進行選型決策。在采購 CDN 服務(wù)以后,也可通過云撥測持續(xù)對 CDN 進行檢測,獲取到 CDN 解析的檢測數(shù)據(jù),來對 CDN 調(diào)度策略進行調(diào)優(yōu)。
最后,由于云撥測的主動式黑盒能力,還可以實現(xiàn)競品分析。針對于行業(yè)里競爭對手的網(wǎng)站發(fā)起主動式撥測,獲知體驗性相關(guān)指標(biāo),指導(dǎo)自身網(wǎng)站優(yōu)化,促使我們在競爭中處于相對比較有利的位置。
ARMS 的真實數(shù)字化體驗管理產(chǎn)品具備以下幾個特點:
一、兼容多平臺,支持 web、H5、小程序。常見平臺像微信、支付寶、釘釘還有小程序都支持。同時它在 APP 上支持 iOS 和安卓等多種用戶終端。
二、結(jié)合ARMS應(yīng)用性能分析和鏈路追蹤,能夠?qū)崿F(xiàn)端到端的分析,可以將一個頁面的API請求與后端的調(diào)用鏈進行關(guān)聯(lián),實現(xiàn)端到端的性能分析和問題定位。
三、接入簡單,無需埋點,也支持多種接入方式。
四、除了分析能力,也提供在線診斷能力,來輔助定位到問題的根因。
前端性能分析第一個要講到的能力就是 ARMS 端對端的性能分析,我們既可以在 ARMS 前端性能分析里面通過多個維度,比如說版本、操作系統(tǒng)、設(shè)備、瀏覽器、地域和網(wǎng)絡(luò)等多種維度對 API 性能進行分析,還可以與應(yīng)用性能分析進行聯(lián)動,實現(xiàn)端到端的調(diào)用分析,幫助用戶定位到造成 API 請求錯慢的具體應(yīng)用和代碼。
第二個能力就是前端性能分析多維分析的能力。支持從地理維度、終端維度包括瀏覽器、設(shè)備、操作系統(tǒng)、分辨率、網(wǎng)絡(luò)等維度對性能指標(biāo)進行分析。能夠在一些場景下定位到具體出現(xiàn)問題的維度,是設(shè)備問題、地域問題,還是網(wǎng)絡(luò)問題,為業(yè)務(wù)決策提供數(shù)據(jù)支撐。
最后,就是前端性能分析的 JS 錯誤分析能力。ARMS 從不同維度去統(tǒng)計 JS 錯誤數(shù)、錯誤率,以及這個錯誤對業(yè)務(wù)的影響,輔助我們進行業(yè)務(wù)決策。
首先是 APP 穩(wěn)定性相關(guān)分析,ARMS APP 性能分析,針對于穩(wěn)定性問題分為三個類型。第一是崩潰分析,包括 crash 和 aboard;第二是異常分析,我們會主動去發(fā)現(xiàn)你的異常,包括內(nèi)存泄漏,主線程 IO 的這種異常;另外,在穩(wěn)定性的這方面,我們也會支持多維的分析能力,包括具體是哪個版本,哪個設(shè)備,哪個運營商,哪個地域,哪個網(wǎng)絡(luò),統(tǒng)計出不同維度的占比,能夠幫助我們?nèi)ゴ_定根因和影響面。同時,支持穩(wěn)定性問題的明細(xì)下鉆,幫助我們定位到具體的原因。
其次是 API 的性能分析能力,可以結(jié)合 ARMS 應(yīng)用性能分析實現(xiàn)端到端的網(wǎng)絡(luò)性能分析。除了統(tǒng)計出 APP 端的網(wǎng)絡(luò)性能以外,還可以一鍵關(guān)聯(lián)到后端的應(yīng)用調(diào)用鏈路,實現(xiàn)快速定位到造成這種慢調(diào)用的具體是哪個微服務(wù)或組件,甚至是哪行代碼。
最后講一下 APP 性能分析遠(yuǎn)程日志拉取能力。針對于這種日志,ARMS 的 APP 性能分析相對輕量,無需進行埋點或采集,或接入全文的搜索系統(tǒng),只要集成 APP 的 SDK,ARMS 會按需拉取崩潰日志,還原出錯現(xiàn)場,快速定位復(fù)雜問題。也可以指定設(shè)備、版本、系統(tǒng),去新建拉取任務(wù),主動拉取用戶 APP 設(shè)備的日志。同時,也會把當(dāng)時日志運行時,機器內(nèi)存、CPU 這種環(huán)境拉取出來輔助進行問題定位。除了主動式拉取以外,針對崩潰場景也可以實現(xiàn)智能拉取,檢測到這種 crash 事件后,自動創(chuàng)建任務(wù),智能選取設(shè)備,預(yù)先獲取到問題設(shè)備的日志,保留現(xiàn)場,節(jié)省問題排查時間。
數(shù)字化體驗管理最佳實踐
Cloud Native
以上是 ARMS 在數(shù)字化體驗管理上的產(chǎn)品能力介紹,最后我們結(jié)合幾個客戶案例分享一些最佳實踐。第一個案例是節(jié)卡機器人,節(jié)卡機器人是國內(nèi)智能機器人制造服務(wù)提供商,與全球超過了 300 家自動化的航空公司緊密合作服務(wù)全球客戶。節(jié)卡機器人為了更好地服務(wù)全球客戶,將線上營銷作為重要的市場營銷手段之一,在谷歌上進行了大量海外廣告投放。為了保證在線營銷效果,節(jié)卡機器人首先要確保官網(wǎng)落地頁能夠正常訪問。如果頁面或官網(wǎng)出現(xiàn)可用性或性能問題,不但會影響轉(zhuǎn)化率還可能會造成谷歌停止對他們提供服務(wù)。經(jīng)過與可觀測團隊溝通,節(jié)卡機器人決定采用 ARMS 云撥測對海外官網(wǎng)進行持續(xù)性檢測,選取了主要客戶所在地域,包括北美、歐洲、南美洲以及東南亞等地區(qū)的網(wǎng)民檢測點,基于瀏覽器的撥測任務(wù),對官網(wǎng)進行持續(xù)性能檢測,最后發(fā)現(xiàn)兩個問題:
第一,部分地區(qū) CDN 調(diào)度不太準(zhǔn)確,主要是集中在美東和東南亞地區(qū)。CDN 調(diào)度并沒有實現(xiàn)最優(yōu)化調(diào)度方案。第二,官網(wǎng)存在一些體積較大的圖片文件,影響網(wǎng)站加載速度。基于這兩個判斷及定位以后,節(jié)卡機器人與 CDN 供應(yīng)商溝通后,全面優(yōu)化美東、東南亞的 CDN 調(diào)動邏輯,同時也推動研發(fā)團隊對頁面圖片進行壓縮,整體問題修復(fù)上線以后,通過云撥測檢測到網(wǎng)站打開速度提升了 50%,全面保證了在線營銷效果。
對于在線教育行業(yè)來說,用戶體驗是非常重要的。因為用戶體驗會直接決定著品牌形象和轉(zhuǎn)化率。但由于采用了微服務(wù)架構(gòu),在一個教學(xué)場景下,一個用戶的簡單教學(xué)可能會涉及到不同的應(yīng)用與應(yīng)用之間的調(diào)用,甚至還有一些第三方服務(wù)接口。所以任何環(huán)節(jié)出現(xiàn)故障或者線路瓶頸,都可能會影響到用戶體驗。核桃編程經(jīng)過考察了開源方法和企業(yè)級方案后,最終決定采用 ARMS 的前端性能分析,同時結(jié)合應(yīng)用性能分析來實現(xiàn)對教學(xué)終端的數(shù)字化體驗管理。當(dāng)時打動他們的第一點是前端性能分析的快速接入能力,不需要進行埋點,只需要在客戶前端代碼中引入一段腳本,就能夠?qū)崿F(xiàn)檢測數(shù)據(jù)上報。第二是結(jié)合應(yīng)用性能分析的端到端性能洞察能力,去快速地定位到問題根因。第三就是多維分析的能力,ARMS 的前端性能分析能夠從地理位置、操作系統(tǒng)、分辨率、網(wǎng)絡(luò)運營商等多個維度對性能進行聚合分析,具體定位到造成性能瓶頸的原因。最后就是 ARMS 的告警能力,在遇到體驗問題時,能夠第一時間讓運維團隊感知。真正實現(xiàn) 5 分鐘內(nèi)發(fā)現(xiàn)問題,10 分鐘內(nèi)隔離和 30 分鐘內(nèi)解決。對于核桃編程來說,ARMS 的可觀測體系幫助他們減少 30% 以上的運維工作量,同時也縮短了 60% 的故障定位平均耗時,極大的提升了用戶體驗,為業(yè)務(wù)持續(xù)發(fā)展打下了堅實的基礎(chǔ)。 以上是針對數(shù)字化體驗管理不同產(chǎn)品的用戶案例分享。