2021-10-9 資深UI設計者
編輯導語:數(shù)據(jù)分析有助于幫助我們獲知業(yè)務效果及其他效果反饋,然而當下企業(yè)在線下業(yè)務當中,不少數(shù)據(jù)都有所流失,這就要求企業(yè)尋找更有效的數(shù)據(jù)體系搭建方式。本篇文章里,作者就線下業(yè)務的數(shù)據(jù)體系搭建做了總結(jié),不妨來看一下。
前言
在實際的業(yè)務環(huán)境下,能夠完全通過線上留存的數(shù)據(jù)搭建業(yè)務數(shù)據(jù)體系的情況主要還是以互聯(lián)網(wǎng)公司為主,有大量的線下傳統(tǒng)公司,是沒辦法通過線上數(shù)據(jù)的積累完成業(yè)務數(shù)據(jù)體系的搭建的,在這種情況就得通過不同類型的數(shù)據(jù)來源去獲取業(yè)務中可能涉及的數(shù)據(jù),設計合理的業(yè)務數(shù)據(jù)體系,完成線下業(yè)務數(shù)據(jù)的監(jiān)控、維護和分析。
如果是從數(shù)據(jù)邏輯出發(fā),第一步應當是監(jiān)控數(shù)據(jù),就是我們平常一直說的看數(shù)據(jù)。
但在實際業(yè)務中,尤其是線下業(yè)務中,其實有大量業(yè)務沒有留存業(yè)務發(fā)生時點的數(shù)據(jù),在業(yè)務的各個轉(zhuǎn)化節(jié)點的數(shù)據(jù)也很難及時獲取留存,大量的數(shù)據(jù)丟失。如果需要從監(jiān)控數(shù)據(jù)開始,其實相對來說難度會很大,甚至有很多業(yè)務數(shù)據(jù)沒有合適的方式被留存下來,在日后的數(shù)據(jù)分析搭建中也無法起到作用。
所以,我更建議從業(yè)務的發(fā)展方向上入手,盡量細化業(yè)務流程,明確各個業(yè)務流程對部門業(yè)務到底有什么影響,核心業(yè)務流程是什么,優(yōu)先從核心業(yè)務流程入手,根據(jù)業(yè)務流程的步驟完成業(yè)務數(shù)據(jù)的監(jiān)控和留存。
舉個例子,如果對保險行業(yè)熟悉的朋友會知道,保險業(yè)所有公司都有“培訓”這個項目,甚至在保險業(yè)里面“組訓”、“督訓”都是很吃香的崗位,能夠在短期內(nèi)積累大量經(jīng)驗,往公司中高層走更快速,這個崗位主要的業(yè)務范疇就是“培訓”,培訓外勤、培訓新人、培訓合作渠道等等。
怎么評價培訓效果呢?依靠外勤人員的銷售量、銷售額對培訓效果進行評價,剩余對培訓效果的評價來自學員和更高級的培訓講師的打分。
其實可以從上述模式看出,對線下培訓這種業(yè)務模式的評判,對培訓崗工作人員能力、業(yè)績的評估其實很難通過以上評分模式進行量化,更不用說實際培訓效果的追蹤。
還是同個例子,如果要想追蹤實際培訓對銷售業(yè)務產(chǎn)生的效果和影響,要關(guān)注幾個模塊:
從培訓業(yè)務的目標出發(fā),如果想從更細化的角度去關(guān)注培訓,會有以下幾個業(yè)務方會想要關(guān)注的點:
所有這些關(guān)注點的數(shù)據(jù),均無法從線上獲取,也很難追蹤(這還是僅僅線下業(yè)務在實際業(yè)務細化關(guān)注項提出后的一部分數(shù)據(jù)的數(shù)據(jù)量化和追蹤,如果要實現(xiàn)業(yè)務數(shù)據(jù)的獲取,就需要公司嚴格要求外勤人員反饋該類型數(shù)據(jù),可想而知如果是溝通渠道獲取業(yè)務數(shù)據(jù),就會顯得更為困難)。
在這種情況下,線下業(yè)務數(shù)據(jù)體系建立就需要建立嚴格且標準的業(yè)務數(shù)據(jù)體系,這需要與每一步工作流程相互契合,這個流程有點類似于線上數(shù)據(jù)埋點的過程,只不過因為業(yè)務不在線上,沒法在線上完成數(shù)據(jù)積累。
當然,線下數(shù)據(jù)埋點和線上數(shù)據(jù)埋點完全不一樣,因為缺乏線上工具的記錄能力,大量數(shù)據(jù)記錄只能依靠人力完成,如果想要通過人力完成這類數(shù)據(jù)登記匯總,就需要使用統(tǒng)一的工具,使用統(tǒng)一的數(shù)據(jù)字段、數(shù)據(jù)格式,這需要做到數(shù)據(jù)流轉(zhuǎn)記錄的標準化留存。
以上問題的解決方法除了需要依靠人力對數(shù)據(jù)進行核準清洗外,建議最好是按照統(tǒng)一的字段建立本地數(shù)據(jù)庫。
熟悉EXCEL或者WPS EXCEL的朋友會了解,這兩個軟件的處理能力隨著數(shù)據(jù)量的上漲會十分受限,如果是行數(shù)超過百萬級的話,是無法在EXCEL中操作的,會出現(xiàn)數(shù)據(jù)丟失。
同樣的,如果數(shù)據(jù)量在20萬以上,使用IF系的函數(shù)將會加重性能負擔,非常容易崩潰,尤其是當出現(xiàn)過去的某一原始主鍵重復出現(xiàn)的時候,利用EXCEL技巧實現(xiàn)等價FOR循環(huán)會變得更難。
這個時候我們會更傾向于在本地建立MySQL數(shù)據(jù)庫,可以利用MySQLworkbench或者NAVICAT對本地數(shù)據(jù)庫進行處理, 利用本地數(shù)據(jù)庫的字典表的字段完成線下交互數(shù)據(jù)EXCEL/CSV表格表頭字段的統(tǒng)一,在簡單獲取了線下匯總回來的數(shù)據(jù)之后利用update函數(shù)完成數(shù)據(jù)更新,形成本地數(shù)據(jù)庫。
作為參考,這個是阿里天池某次比賽的測試集數(shù)據(jù)源,測試數(shù)據(jù)集的文件不超過100M,模型處理后的預測集也就100M-150M,這部分數(shù)據(jù)條數(shù)約為20W,如果是數(shù)據(jù)條數(shù)在70-80W左右的線下數(shù)據(jù),文件大小會達到超過200M,如果還需要清洗、維護這些業(yè)務數(shù)據(jù),僅僅依靠EXCEL是完全不現(xiàn)實的。
既然要建立數(shù)據(jù)庫,線下數(shù)據(jù)的維護同步時間就極為關(guān)鍵,線下數(shù)據(jù)的收集端口需要明確,不同部門、不同渠道之間進行數(shù)據(jù)交互的人員要固定,交互時間要固定,否則就容易出現(xiàn)數(shù)據(jù)交互不清晰,導致最后在不同的統(tǒng)計節(jié)點的數(shù)據(jù)無法統(tǒng)一,不斷會出現(xiàn)數(shù)據(jù)重復更新的情況,不利于數(shù)據(jù)檢測監(jiān)控。
這要數(shù)據(jù)監(jiān)控和數(shù)據(jù)維護以及數(shù)據(jù)統(tǒng)計在同個周期內(nèi)完成,同時還要確定所有數(shù)據(jù)的每一次更新都是以數(shù)據(jù)覆蓋的邏輯,即每一次新增更新的數(shù)據(jù)范圍和內(nèi)容必須是完全新增的數(shù)據(jù)。
舉個例子,新增的數(shù)據(jù)版本為C,數(shù)據(jù)庫內(nèi)現(xiàn)有數(shù)據(jù)版本為B,更早的版本為C,上傳的時候就不允許C版本的數(shù)據(jù)中含有A版本的數(shù)據(jù)內(nèi)容,這樣會導致數(shù)據(jù)的轉(zhuǎn)化順序存在混亂,涉及時間續(xù)流的數(shù)據(jù)就出現(xiàn)問題。
以上是線下數(shù)據(jù)體系中數(shù)據(jù)監(jiān)控和數(shù)據(jù)維護的部分,接下來我們聊聊線下數(shù)據(jù)分析體系的搭建.
和線上數(shù)據(jù)類似,所有的線下“埋點”的數(shù)據(jù)回收都是服務于實際業(yè)務數(shù)據(jù)分析的,可以這么說,我們要的不是數(shù)據(jù),而是數(shù)據(jù)告訴我們的事實,以及我們根據(jù)歷史事實能推導出的合理預測,從邏輯方法論上面,就是歸納—演繹。
想進行數(shù)據(jù)分析,首要的是需要對歷史和現(xiàn)階段的事實情況進行歸納統(tǒng)計,這就需要加入線下“埋點”的數(shù)據(jù)進行統(tǒng)計分析,即,先深入了解知道自己的情況。
深入了解自己的情況可以從以下幾個方向去深入思考:
了解了這些自身情況之后,還需要深入了解,那些和你在做一樣事情的人,在面對同類型業(yè)務核心指標的人,他們的工作情況、業(yè)務完成情況、實際業(yè)務流程轉(zhuǎn)化,和他們歷史的情況。
當然,所有的這些外部事實情況都可能不準確,這就需要從業(yè)人員實際判斷這些外部信息的準確性和可用性。
這些事實怎么得出?通過數(shù)據(jù)的形式。
這些事實怎么校驗?通過數(shù)據(jù)的形式。
舉個例子,還是以我們上說的保險公司培訓部門的例子。
假設當前保險公司的業(yè)務正常,市場正常,政策上國家沒有對保險市場提出什么更為嚴苛的政策要求,在這些條件下:
這些是相對比較概念化的事實,這時候就需要利用數(shù)據(jù)把所有的事實細化描述清晰,且所有的數(shù)據(jù)都需要和工作流程相關(guān)聯(lián)。
同時,所有的業(yè)務數(shù)據(jù)分析都需要建立“時間”的概念,我們可以畫一個時間軸來看這個業(yè)務流程:
每個業(yè)務流程下其實都需要一定時間完成當前工作狀態(tài)的信息收集,數(shù)據(jù)本身就具有時間的特性,如果是金融公司、金融部門,還會對數(shù)據(jù)的時間序列有更嚴格的要求,因此,數(shù)據(jù)本身就需要打上所屬時間的標簽。
在業(yè)務流程中,記錄每個事件發(fā)生時間點的數(shù)據(jù),留存這些時間標簽下的數(shù)據(jù),完成基礎(chǔ)數(shù)據(jù)源的匯總。
在分析中可以將分析劃分為幾層,可以先按“事前—事中—事后”的順序留存各個事件發(fā)生時點的數(shù)據(jù),從中盡量明確有規(guī)律性的節(jié)點,例如:
這些時點的數(shù)據(jù)收集可以幫助你深入了解業(yè)務流程,在日后做到各類自動化有很大程度上的幫助,這就是業(yè)務體系初步建立之后再進行優(yōu)化的工作了。
在關(guān)注了業(yè)務的核心指標后,找到能夠?qū)诵闹笜水a(chǎn)生影響的因素,將這些因素拆分成“事前—事中—事后”的形式,設定一定的主鍵完成數(shù)據(jù)特質(zhì)化的積累。
以電商為例,電商可以以“訂單號—用戶ID”的形式,如果是在保險培訓的角度下可以參訓外勤人員ID作為主鍵,當然,不同的業(yè)務模式會有不同類型的主鍵,涉及的后續(xù)的一些數(shù)據(jù)內(nèi)容也不一致。
還是以保險培訓為例,在培訓中有大量數(shù)據(jù)是沒有辦法輕松進行積累的,也同樣不能很明確地進行量化,這時候就要建立評分卡的制度,用于量化一部分難以直接估量的行為數(shù)據(jù)。
比方說,A講師培訓營銷技巧和保險學原理課程,兩門課程完全不屬于同一個課程體系下,在實際外勤作業(yè)中,營銷技巧所能給實際業(yè)績的增長是短期高效的,而保險學原理課程可能在提升外勤人員金融素養(yǎng)方面更為突出,可能在面對高凈值客戶的時候能更體現(xiàn)優(yōu)勢。
這部分提升并不會很直接的在實際銷售業(yè)績上有明確的體現(xiàn),這時候就會需要對實際的培訓效果進行分類歸納,建立不同評分評級制度。
類似于量化投資,這些數(shù)據(jù)都會需要和業(yè)務核心指標建模擬合判斷,根據(jù)歷史經(jīng)驗,最好是建立相關(guān)的多元線性回歸模型,機器學習模型雖然在預測方面更具有優(yōu)勢。
但是實際可解釋性并沒有那么強,在實際業(yè)務總結(jié)反饋的時候并不能明確的找出問題所在,所以在預測分析的角度還是更推薦從線性回歸的角度配合相關(guān)性進行分析。
希望分享的這些給現(xiàn)在還在線下摸索業(yè)務數(shù)據(jù)體系搭建的朋友們一些啟發(fā)。
藍藍設計建立了UI設計分享群,每天會分享國內(nèi)外的一些優(yōu)秀設計,如果有興趣的話,可以進入一起成長學習,請掃碼ben_lanlan,報下信息,會請您入群。歡迎您加入噢~~希望得到建議咨詢、商務合作,也請與我們聯(lián)系。
分享此文一切功德,皆悉回向給文章原作者及眾讀者.
免責聲明:藍藍設計尊重原作者,文章的版權(quán)歸原作者。如涉及版權(quán)問題,請及時與我們?nèi)〉寐?lián)系,我們立即更正或刪除。
藍藍設計( tweetduck.com )是一家專注而深入的界面設計公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的UI界面設計、BS界面設計 、 cs界面設計 、 ipad界面設計 、 包裝設計 、 圖標定制 、 用戶體驗 、交互設計、 網(wǎng)站建設 、平面設計服務