打破數(shù)據(jù)壁壘 賦能專業(yè)服務(wù) — 信永中和數(shù)字服務(wù)之?dāng)?shù)據(jù)分析服務(wù)
2019年09月27日
現(xiàn)今企業(yè)信息化快速發(fā)展和廣泛應(yīng)用,數(shù)字化滲透到企業(yè)生產(chǎn)運(yùn)營(yíng)的各個(gè)方面,顯著提升了企業(yè)產(chǎn)生和收集數(shù)據(jù)的能力。這是新一輪的科技革命和產(chǎn)業(yè)變革,我們的企業(yè)客戶正大力推動(dòng)信息化、數(shù)字化建設(shè),而作為傳統(tǒng)的會(huì)計(jì)師事務(wù)能否持續(xù)不斷地向客戶提供增值服務(wù),緊跟時(shí)代的步伐,取決于事務(wù)所是否可以快速適應(yīng)企業(yè)日益增長(zhǎng)的龐大數(shù)據(jù),利用新工具、新方法,增加服務(wù)的廣度和深度,提高工作效率、縮短項(xiàng)目時(shí)間,進(jìn)而為企業(yè)管理提供快速、全方位的支持、分析與指導(dǎo)。
得益于企業(yè)信息化的提升,其生產(chǎn)運(yùn)營(yíng)中的各項(xiàng)業(yè)務(wù)、財(cái)務(wù)數(shù)據(jù)可以結(jié)構(gòu)化、規(guī)則化的存儲(chǔ)在企業(yè)數(shù)據(jù)庫(kù)中。相較紙質(zhì)單據(jù)、電子表格記錄,結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)為數(shù)據(jù)分析、人工智能、機(jī)器學(xué)習(xí)和圖像識(shí)別的應(yīng)用打開(kāi)了大門(mén)。在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。
信永中和員工中包括大量高水平的技術(shù)專家,廣泛服務(wù)于審計(jì)、管理咨詢、會(huì)計(jì)稅務(wù)服務(wù)和工程造價(jià)等眾多領(lǐng)域,其所欠缺的只是對(duì)大數(shù)據(jù)的處理能力。通過(guò)對(duì)數(shù)據(jù)的深入分析,可以將企業(yè)有價(jià)值的、深層次的信息展現(xiàn)給專業(yè)服務(wù)團(tuán)隊(duì),實(shí)現(xiàn)信息化、智能化的數(shù)據(jù)分析同專家經(jīng)驗(yàn)的全面融合,讓專業(yè)團(tuán)隊(duì)從大量數(shù)據(jù)中提煉規(guī)律和商業(yè)見(jiàn)解,創(chuàng)造更大的價(jià)值。
信永中和的數(shù)字服務(wù),依托大數(shù)據(jù)開(kāi)發(fā)平臺(tái),為不同行業(yè)的企業(yè)客戶提供數(shù)字化和信息化服務(wù),秉承有所想即有所得的理念,賦能專業(yè)團(tuán)隊(duì),幫助事務(wù)所團(tuán)隊(duì)提升工作效率,拓展工作范圍。現(xiàn)通過(guò)以下幾個(gè)落地場(chǎng)景,簡(jiǎn)單介紹信永中和數(shù)字服務(wù):
一.財(cái)務(wù)數(shù)據(jù)和資金管理的數(shù)據(jù)分析
場(chǎng)景描述:
為全面審視某公司資金管理狀況,核實(shí)公司資金管理的舞弊問(wèn)題和風(fēng)險(xiǎn),需要對(duì)會(huì)計(jì)日記賬的進(jìn)行核對(duì)。如果采用傳統(tǒng)的抽樣方法,選取日記賬中的大額交易及非常規(guī)交易,只能實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的對(duì)賬,容易遺漏真正的風(fēng)險(xiǎn)數(shù)據(jù)。理想的工作方法是將該公司的銀行流水賬目和會(huì)計(jì)日記賬數(shù)據(jù)一一核實(shí),驗(yàn)證是否存在不實(shí)賬目。
場(chǎng)景難點(diǎn):
1. 會(huì)計(jì)日記賬存在記賬日期滯后于銀行流水交易日期的情況,難以使用簡(jiǎn)單的函數(shù)和公式完成數(shù)據(jù)匹配。
2. 公司資金交易頻繁,收支筆數(shù)多、銀行賬號(hào)多,人工匹配工作量過(guò)大。
3. 對(duì)于大量的財(cái)務(wù)數(shù)據(jù),缺乏有效地?cái)?shù)據(jù)挖掘手段。
解決方案:
1. 財(cái)務(wù)數(shù)據(jù)的匹配性分析
信永中和數(shù)據(jù)分析服務(wù)研發(fā)的財(cái)務(wù)對(duì)賬工具,通過(guò)多種判斷規(guī)則,將銀行流水?dāng)?shù)據(jù)和日記賬數(shù)據(jù)準(zhǔn)確高效的匹配在一起。工作人員只需將原始數(shù)據(jù)表進(jìn)行簡(jiǎn)單加工,并上傳到對(duì)賬工具中,即可得到【銀行流水和日記賬匹配數(shù)據(jù)表】、【未匹配銀行流水?dāng)?shù)據(jù)表】、【未匹配日記賬數(shù)據(jù)表】三個(gè)文件。對(duì)于該公司1.5萬(wàn)條流水和日記賬測(cè)試數(shù)據(jù),對(duì)賬工具不足10s即完成全部數(shù)據(jù)的處理。
圖: 信永中和對(duì)賬工具使用界面
圖: 銀行流水和會(huì)計(jì)賬目日期差異(月)
得益于企業(yè)信息化的提升,其生產(chǎn)運(yùn)營(yíng)中的各項(xiàng)業(yè)務(wù)、財(cái)務(wù)數(shù)據(jù)可以結(jié)構(gòu)化、規(guī)則化的存儲(chǔ)在企業(yè)數(shù)據(jù)庫(kù)中。相較紙質(zhì)單據(jù)、電子表格記錄,結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)為數(shù)據(jù)分析、人工智能、機(jī)器學(xué)習(xí)和圖像識(shí)別的應(yīng)用打開(kāi)了大門(mén)。在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。
信永中和員工中包括大量高水平的技術(shù)專家,廣泛服務(wù)于審計(jì)、管理咨詢、會(huì)計(jì)稅務(wù)服務(wù)和工程造價(jià)等眾多領(lǐng)域,其所欠缺的只是對(duì)大數(shù)據(jù)的處理能力。通過(guò)對(duì)數(shù)據(jù)的深入分析,可以將企業(yè)有價(jià)值的、深層次的信息展現(xiàn)給專業(yè)服務(wù)團(tuán)隊(duì),實(shí)現(xiàn)信息化、智能化的數(shù)據(jù)分析同專家經(jīng)驗(yàn)的全面融合,讓專業(yè)團(tuán)隊(duì)從大量數(shù)據(jù)中提煉規(guī)律和商業(yè)見(jiàn)解,創(chuàng)造更大的價(jià)值。
信永中和的數(shù)字服務(wù),依托大數(shù)據(jù)開(kāi)發(fā)平臺(tái),為不同行業(yè)的企業(yè)客戶提供數(shù)字化和信息化服務(wù),秉承有所想即有所得的理念,賦能專業(yè)團(tuán)隊(duì),幫助事務(wù)所團(tuán)隊(duì)提升工作效率,拓展工作范圍。現(xiàn)通過(guò)以下幾個(gè)落地場(chǎng)景,簡(jiǎn)單介紹信永中和數(shù)字服務(wù):
一.財(cái)務(wù)數(shù)據(jù)和資金管理的數(shù)據(jù)分析
場(chǎng)景描述:
為全面審視某公司資金管理狀況,核實(shí)公司資金管理的舞弊問(wèn)題和風(fēng)險(xiǎn),需要對(duì)會(huì)計(jì)日記賬的進(jìn)行核對(duì)。如果采用傳統(tǒng)的抽樣方法,選取日記賬中的大額交易及非常規(guī)交易,只能實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的對(duì)賬,容易遺漏真正的風(fēng)險(xiǎn)數(shù)據(jù)。理想的工作方法是將該公司的銀行流水賬目和會(huì)計(jì)日記賬數(shù)據(jù)一一核實(shí),驗(yàn)證是否存在不實(shí)賬目。
場(chǎng)景難點(diǎn):
1. 會(huì)計(jì)日記賬存在記賬日期滯后于銀行流水交易日期的情況,難以使用簡(jiǎn)單的函數(shù)和公式完成數(shù)據(jù)匹配。
2. 公司資金交易頻繁,收支筆數(shù)多、銀行賬號(hào)多,人工匹配工作量過(guò)大。
3. 對(duì)于大量的財(cái)務(wù)數(shù)據(jù),缺乏有效地?cái)?shù)據(jù)挖掘手段。
解決方案:
1. 財(cái)務(wù)數(shù)據(jù)的匹配性分析
信永中和數(shù)據(jù)分析服務(wù)研發(fā)的財(cái)務(wù)對(duì)賬工具,通過(guò)多種判斷規(guī)則,將銀行流水?dāng)?shù)據(jù)和日記賬數(shù)據(jù)準(zhǔn)確高效的匹配在一起。工作人員只需將原始數(shù)據(jù)表進(jìn)行簡(jiǎn)單加工,并上傳到對(duì)賬工具中,即可得到【銀行流水和日記賬匹配數(shù)據(jù)表】、【未匹配銀行流水?dāng)?shù)據(jù)表】、【未匹配日記賬數(shù)據(jù)表】三個(gè)文件。對(duì)于該公司1.5萬(wàn)條流水和日記賬測(cè)試數(shù)據(jù),對(duì)賬工具不足10s即完成全部數(shù)據(jù)的處理。
圖: 信永中和對(duì)賬工具使用界面
2. 財(cái)務(wù)數(shù)據(jù)的異常分析
我們注意到部分會(huì)計(jì)賬目的登記日期要遠(yuǎn)遠(yuǎn)滯后于銀行流水交易日期,將數(shù)據(jù)按照兩者間隔日期分組,12,937筆數(shù)據(jù)中有188筆的會(huì)計(jì)賬目日期晚于銀行交易日2個(gè)月以上,其中更是4筆滯后5個(gè)月,違背正常的記賬行為。
我們注意到部分會(huì)計(jì)賬目的登記日期要遠(yuǎn)遠(yuǎn)滯后于銀行流水交易日期,將數(shù)據(jù)按照兩者間隔日期分組,12,937筆數(shù)據(jù)中有188筆的會(huì)計(jì)賬目日期晚于銀行交易日2個(gè)月以上,其中更是4筆滯后5個(gè)月,違背正常的記賬行為。
圖: 銀行流水和會(huì)計(jì)賬目日期差異(月)
3. 基于財(cái)務(wù)數(shù)據(jù)的風(fēng)險(xiǎn)偵防分析
我們根據(jù)公司業(yè)務(wù)場(chǎng)景假定存在資金挪用的風(fēng)險(xiǎn),并將同時(shí)具有借、貸雙向交易的外方賬戶信息從全部數(shù)據(jù)中篩選出來(lái)。通過(guò)審閱交易方的公司屬性以及日記賬數(shù)據(jù)匹配的摘要信息,可以有效判斷往來(lái)資金的合理性。
我們根據(jù)公司業(yè)務(wù)場(chǎng)景假定存在資金挪用的風(fēng)險(xiǎn),并將同時(shí)具有借、貸雙向交易的外方賬戶信息從全部數(shù)據(jù)中篩選出來(lái)。通過(guò)審閱交易方的公司屬性以及日記賬數(shù)據(jù)匹配的摘要信息,可以有效判斷往來(lái)資金的合理性。
表: 往來(lái)資金賬目明細(xì)
通過(guò)對(duì)日記賬和銀行流水的全量匹配,我們可以識(shí)別企業(yè)財(cái)務(wù)風(fēng)險(xiǎn),驗(yàn)證財(cái)務(wù)賬目的準(zhǔn)確性。此外,展開(kāi)的數(shù)據(jù)合理性分析,可以深層次的識(shí)別賬目異常數(shù)據(jù),發(fā)現(xiàn)財(cái)務(wù)舞弊行為。
總結(jié):圍繞企業(yè)財(cái)務(wù)系統(tǒng)和財(cái)務(wù)報(bào)表的數(shù)據(jù)分析,協(xié)助審計(jì)師及企業(yè)管理者把握不同經(jīng)濟(jì)下公司財(cái)務(wù)管控的重點(diǎn)、整合提煉財(cái)務(wù)數(shù)據(jù)中可挖掘的價(jià)值、識(shí)別財(cái)務(wù)風(fēng)險(xiǎn),全面提高決策質(zhì)量。
二.互聯(lián)網(wǎng)廣告公司應(yīng)用場(chǎng)景分析
場(chǎng)景描述:
某個(gè)互聯(lián)網(wǎng)廣告公司業(yè)務(wù)形式為根據(jù)廣告主的需求尋找合適的渠道商,幫助廣告主投放廣告到合適的渠道,按照CPA(Cost Per Action)計(jì)費(fèi),賺取廣告主和渠道商的差價(jià)獲利。在數(shù)字廣告行業(yè),行業(yè)的不透明催生大量機(jī)器或人為產(chǎn)生的虛假流量,廣告主獲取虛假的營(yíng)銷數(shù)據(jù),供應(yīng)商獲取不當(dāng)利潤(rùn)。如何驗(yàn)證收入、支出以及日志數(shù)據(jù)的一致性是該場(chǎng)景分析的主要方向。此外,如何驗(yàn)證大量日志數(shù)據(jù)的真實(shí)性,也是我們需要解決的問(wèn)題。
該廣告公司提供的數(shù)據(jù)分為兩類,一類是用于同廣告主和渠道商費(fèi)用結(jié)算的匯總數(shù)據(jù),其中廣告主匯總數(shù)據(jù)是以日期、廣告名稱分組匯總(7個(gè)月約1.7萬(wàn)條數(shù)據(jù)),渠道商匯總數(shù)據(jù)是以日期、廣告名稱、渠道名稱分組匯總(7個(gè)月約3.1萬(wàn)條數(shù)據(jù));另一類是記錄用戶轉(zhuǎn)化量信息的底層日志數(shù)據(jù),選取13家主要廣告訂單1個(gè)月的日志數(shù)據(jù),包括用戶ID、廣告訂單號(hào)、轉(zhuǎn)化時(shí)間、IP地址等7個(gè)字段,約1,095萬(wàn)條數(shù)據(jù)。
場(chǎng)景難點(diǎn):
1. 廣告主和渠道商的匯總數(shù)據(jù)數(shù)量眾多,但字段相對(duì)簡(jiǎn)單,難以找到數(shù)據(jù)的價(jià)值點(diǎn)。
2. 日志數(shù)據(jù)量相對(duì)巨大,難以使用常規(guī)技術(shù)手段完成解讀。
3. 日志數(shù)據(jù)驗(yàn)證匯總數(shù)據(jù)的統(tǒng)計(jì)準(zhǔn)確性外,數(shù)據(jù)相關(guān)字段信息未有效使用。
解決方案:
1. 廣告主與渠道商轉(zhuǎn)換化率差異比對(duì)
我們首先驗(yàn)證廣告主匯總數(shù)據(jù)和渠道商匯總數(shù)據(jù)的一致性,根據(jù)訂單名稱和日期,對(duì)兩個(gè)數(shù)據(jù)源的轉(zhuǎn)化量再次匯總計(jì)算。
1) 對(duì)全部訂單的轉(zhuǎn)化量比對(duì)校驗(yàn)
我們將7個(gè)月4.7萬(wàn)條匯總數(shù)據(jù),按照136個(gè)廣告主聚合,計(jì)算得出廣告主和渠道商匯總量的差異。通過(guò)此種方法,我們可以快速而全面的對(duì)收、支結(jié)算數(shù)據(jù)進(jìn)行校驗(yàn)。
在檢查中我們發(fā)現(xiàn),某訂單廣告主的轉(zhuǎn)化數(shù)高于渠道商轉(zhuǎn)化數(shù)6,399個(gè)。通過(guò)查看其匯總數(shù)據(jù)的明細(xì),我們發(fā)現(xiàn)5月3日至5月12日,每日均相差609個(gè),據(jù)此可以認(rèn)定這部分?jǐn)?shù)據(jù),存在人為操縱的風(fēng)險(xiǎn)。
總結(jié):圍繞企業(yè)財(cái)務(wù)系統(tǒng)和財(cái)務(wù)報(bào)表的數(shù)據(jù)分析,協(xié)助審計(jì)師及企業(yè)管理者把握不同經(jīng)濟(jì)下公司財(cái)務(wù)管控的重點(diǎn)、整合提煉財(cái)務(wù)數(shù)據(jù)中可挖掘的價(jià)值、識(shí)別財(cái)務(wù)風(fēng)險(xiǎn),全面提高決策質(zhì)量。
二.互聯(lián)網(wǎng)廣告公司應(yīng)用場(chǎng)景分析
場(chǎng)景描述:
某個(gè)互聯(lián)網(wǎng)廣告公司業(yè)務(wù)形式為根據(jù)廣告主的需求尋找合適的渠道商,幫助廣告主投放廣告到合適的渠道,按照CPA(Cost Per Action)計(jì)費(fèi),賺取廣告主和渠道商的差價(jià)獲利。在數(shù)字廣告行業(yè),行業(yè)的不透明催生大量機(jī)器或人為產(chǎn)生的虛假流量,廣告主獲取虛假的營(yíng)銷數(shù)據(jù),供應(yīng)商獲取不當(dāng)利潤(rùn)。如何驗(yàn)證收入、支出以及日志數(shù)據(jù)的一致性是該場(chǎng)景分析的主要方向。此外,如何驗(yàn)證大量日志數(shù)據(jù)的真實(shí)性,也是我們需要解決的問(wèn)題。
該廣告公司提供的數(shù)據(jù)分為兩類,一類是用于同廣告主和渠道商費(fèi)用結(jié)算的匯總數(shù)據(jù),其中廣告主匯總數(shù)據(jù)是以日期、廣告名稱分組匯總(7個(gè)月約1.7萬(wàn)條數(shù)據(jù)),渠道商匯總數(shù)據(jù)是以日期、廣告名稱、渠道名稱分組匯總(7個(gè)月約3.1萬(wàn)條數(shù)據(jù));另一類是記錄用戶轉(zhuǎn)化量信息的底層日志數(shù)據(jù),選取13家主要廣告訂單1個(gè)月的日志數(shù)據(jù),包括用戶ID、廣告訂單號(hào)、轉(zhuǎn)化時(shí)間、IP地址等7個(gè)字段,約1,095萬(wàn)條數(shù)據(jù)。
場(chǎng)景難點(diǎn):
1. 廣告主和渠道商的匯總數(shù)據(jù)數(shù)量眾多,但字段相對(duì)簡(jiǎn)單,難以找到數(shù)據(jù)的價(jià)值點(diǎn)。
2. 日志數(shù)據(jù)量相對(duì)巨大,難以使用常規(guī)技術(shù)手段完成解讀。
3. 日志數(shù)據(jù)驗(yàn)證匯總數(shù)據(jù)的統(tǒng)計(jì)準(zhǔn)確性外,數(shù)據(jù)相關(guān)字段信息未有效使用。
解決方案:
1. 廣告主與渠道商轉(zhuǎn)換化率差異比對(duì)
我們首先驗(yàn)證廣告主匯總數(shù)據(jù)和渠道商匯總數(shù)據(jù)的一致性,根據(jù)訂單名稱和日期,對(duì)兩個(gè)數(shù)據(jù)源的轉(zhuǎn)化量再次匯總計(jì)算。
1) 對(duì)全部訂單的轉(zhuǎn)化量比對(duì)校驗(yàn)
我們將7個(gè)月4.7萬(wàn)條匯總數(shù)據(jù),按照136個(gè)廣告主聚合,計(jì)算得出廣告主和渠道商匯總量的差異。通過(guò)此種方法,我們可以快速而全面的對(duì)收、支結(jié)算數(shù)據(jù)進(jìn)行校驗(yàn)。
在檢查中我們發(fā)現(xiàn),某訂單廣告主的轉(zhuǎn)化數(shù)高于渠道商轉(zhuǎn)化數(shù)6,399個(gè)。通過(guò)查看其匯總數(shù)據(jù)的明細(xì),我們發(fā)現(xiàn)5月3日至5月12日,每日均相差609個(gè),據(jù)此可以認(rèn)定這部分?jǐn)?shù)據(jù),存在人為操縱的風(fēng)險(xiǎn)。
表: 廣告主和渠道商匯總數(shù)據(jù)差值
圖: 某廣告匯總數(shù)據(jù)日偏差 圖: 某廣告匯總數(shù)據(jù)日合計(jì)
2) 匯總數(shù)據(jù)和日志數(shù)據(jù)校驗(yàn)
為了驗(yàn)證匯總數(shù)據(jù)和日志數(shù)據(jù)的一致性,我們對(duì)樣本日志數(shù)據(jù)按照訂單和日期匯總,結(jié)果發(fā)現(xiàn)這部分日志數(shù)據(jù)的轉(zhuǎn)化量和渠道商匯總數(shù)據(jù)的轉(zhuǎn)化量是匹配一致的。
我們對(duì)渠道商匯總數(shù)據(jù)的轉(zhuǎn)化量檢查中發(fā)現(xiàn),某廣告訂單日激活數(shù)量異常,8月1日至10日的日激活量均為9,390個(gè),實(shí)際的點(diǎn)擊數(shù)量則每日均有波動(dòng),即每日點(diǎn)擊量大幅變化,轉(zhuǎn)化數(shù)量一定,匯總數(shù)據(jù)已存在嚴(yán)重失真風(fēng)險(xiǎn)。而如前述說(shuō),該訂單的日志數(shù)據(jù)和匯總數(shù)據(jù)是完全匹配的,此種數(shù)據(jù)異常情況,讓我們已經(jīng)不能認(rèn)為全部1,095余萬(wàn)條底層日志數(shù)據(jù)是真實(shí)可信性的。
圖: 某廣告訂單日點(diǎn)擊數(shù)和轉(zhuǎn)化數(shù)
2) 匯總數(shù)據(jù)和日志數(shù)據(jù)校驗(yàn)
為了驗(yàn)證匯總數(shù)據(jù)和日志數(shù)據(jù)的一致性,我們對(duì)樣本日志數(shù)據(jù)按照訂單和日期匯總,結(jié)果發(fā)現(xiàn)這部分日志數(shù)據(jù)的轉(zhuǎn)化量和渠道商匯總數(shù)據(jù)的轉(zhuǎn)化量是匹配一致的。
我們對(duì)渠道商匯總數(shù)據(jù)的轉(zhuǎn)化量檢查中發(fā)現(xiàn),某廣告訂單日激活數(shù)量異常,8月1日至10日的日激活量均為9,390個(gè),實(shí)際的點(diǎn)擊數(shù)量則每日均有波動(dòng),即每日點(diǎn)擊量大幅變化,轉(zhuǎn)化數(shù)量一定,匯總數(shù)據(jù)已存在嚴(yán)重失真風(fēng)險(xiǎn)。而如前述說(shuō),該訂單的日志數(shù)據(jù)和匯總數(shù)據(jù)是完全匹配的,此種數(shù)據(jù)異常情況,讓我們已經(jīng)不能認(rèn)為全部1,095余萬(wàn)條底層日志數(shù)據(jù)是真實(shí)可信性的。
圖: 某廣告訂單日點(diǎn)擊數(shù)和轉(zhuǎn)化數(shù)
2. 日志數(shù)據(jù)真實(shí)性校驗(yàn)
由于日志數(shù)據(jù)存在造假風(fēng)險(xiǎn),我們根據(jù)日志數(shù)據(jù)的字段信息展開(kāi)了進(jìn)一步分析。
1) 時(shí)間趨勢(shì)行為校驗(yàn)
對(duì)于底層日志數(shù)據(jù)的真實(shí)性校驗(yàn),我們首先將日志數(shù)據(jù)的用戶激活時(shí)間按照一天24小時(shí)進(jìn)行切割,查看每個(gè)小時(shí)的激活量。經(jīng)過(guò)大數(shù)據(jù)比對(duì)發(fā)現(xiàn),選取的日志數(shù)據(jù)在廣告投放期間24小時(shí)內(nèi)基本是均勻分布的,波峰和波谷的波動(dòng)不足0.6%,說(shuō)明每個(gè)小時(shí)用戶注冊(cè)數(shù)量是完全均與分布的,此種情況完全背離人的正常行為習(xí)慣。
圖: 轉(zhuǎn)化量按24小時(shí)時(shí)間節(jié)點(diǎn)分布圖
由于日志數(shù)據(jù)存在造假風(fēng)險(xiǎn),我們根據(jù)日志數(shù)據(jù)的字段信息展開(kāi)了進(jìn)一步分析。
1) 時(shí)間趨勢(shì)行為校驗(yàn)
對(duì)于底層日志數(shù)據(jù)的真實(shí)性校驗(yàn),我們首先將日志數(shù)據(jù)的用戶激活時(shí)間按照一天24小時(shí)進(jìn)行切割,查看每個(gè)小時(shí)的激活量。經(jīng)過(guò)大數(shù)據(jù)比對(duì)發(fā)現(xiàn),選取的日志數(shù)據(jù)在廣告投放期間24小時(shí)內(nèi)基本是均勻分布的,波峰和波谷的波動(dòng)不足0.6%,說(shuō)明每個(gè)小時(shí)用戶注冊(cè)數(shù)量是完全均與分布的,此種情況完全背離人的正常行為習(xí)慣。
圖: 轉(zhuǎn)化量按24小時(shí)時(shí)間節(jié)點(diǎn)分布圖
查看日志數(shù)據(jù)前10家渠道商(占日志數(shù)據(jù)87.8%)的小時(shí)轉(zhuǎn)化量分布圖,均呈現(xiàn)此種小時(shí)轉(zhuǎn)化量平均分布的情況,說(shuō)明此類問(wèn)題在該廣告公司普遍存在。
2) IP地址合理性校驗(yàn)
為拓展日志信息,我們使用IP地址庫(kù)與日志數(shù)據(jù)的IP地址匹配,根據(jù)已有的IP地址,添加對(duì)應(yīng)的運(yùn)營(yíng)商和IP地理位置信息??梢钥闯鋈罩緮?shù)據(jù)中,電信運(yùn)營(yíng)商占比明顯偏高,占到總量的53.03%。按照IP地理位置分布,廣告受眾主要集中于江蘇、浙江、廣東、山東、遼寧等省份,其中轉(zhuǎn)化量前兩名的江蘇和浙江省的電信IP占比達(dá)到70%以上,存在數(shù)據(jù)造假的風(fēng)險(xiǎn)。
圖: 廣告受眾電信運(yùn)營(yíng)商占比 圖: 廣告受眾省份占比
圖: 各省份廣告受眾所屬運(yùn)營(yíng)商數(shù)量統(tǒng)計(jì)
2) IP地址合理性校驗(yàn)
為拓展日志信息,我們使用IP地址庫(kù)與日志數(shù)據(jù)的IP地址匹配,根據(jù)已有的IP地址,添加對(duì)應(yīng)的運(yùn)營(yíng)商和IP地理位置信息??梢钥闯鋈罩緮?shù)據(jù)中,電信運(yùn)營(yíng)商占比明顯偏高,占到總量的53.03%。按照IP地理位置分布,廣告受眾主要集中于江蘇、浙江、廣東、山東、遼寧等省份,其中轉(zhuǎn)化量前兩名的江蘇和浙江省的電信IP占比達(dá)到70%以上,存在數(shù)據(jù)造假的風(fēng)險(xiǎn)。
圖: 廣告受眾電信運(yùn)營(yíng)商占比 圖: 廣告受眾省份占比
圖: 各省份廣告受眾所屬運(yùn)營(yíng)商數(shù)量統(tǒng)計(jì)
此案例中,我們通過(guò)大數(shù)據(jù)技術(shù),分別將海量的廣告主匯總數(shù)據(jù)、渠道匯總數(shù)據(jù)和日志數(shù)據(jù)進(jìn)行匹配,驗(yàn)證了各數(shù)據(jù)的一致性。在此基礎(chǔ)上,通過(guò)對(duì)各個(gè)數(shù)據(jù)的合理性分析,延展到對(duì)整個(gè)業(yè)務(wù)系統(tǒng)可信度的分析。
總結(jié):圍繞海量數(shù)據(jù)的應(yīng)用場(chǎng)景進(jìn)行數(shù)據(jù)分析,調(diào)整在分析維度上的顆粒度尋找隱性差異和波動(dòng)區(qū)域,審計(jì)過(guò)程可以識(shí)別更多風(fēng)險(xiǎn)領(lǐng)域并給予重點(diǎn)關(guān)注。
三.運(yùn)輸行業(yè)應(yīng)用場(chǎng)景分析
場(chǎng)景描述:
一家運(yùn)輸公司主要是承接汽車的輸運(yùn)業(yè)務(wù),從客戶簽訂協(xié)議后,將運(yùn)力分解交付到不同的運(yùn)輸商,由運(yùn)輸商負(fù)責(zé)實(shí)際的運(yùn)輸業(yè)務(wù)。運(yùn)單數(shù)據(jù)選取該公司7個(gè)月14家客戶的成本表數(shù)據(jù),涉及72.8萬(wàn)條數(shù)據(jù)。值得注意的是,部分長(zhǎng)距離運(yùn)單會(huì)被公司拆分,交由不同的運(yùn)輸商分段運(yùn)輸,故需要按照運(yùn)輸商維度展開(kāi)分析。
場(chǎng)景難點(diǎn):
1. 常規(guī)的分析方法,不考慮運(yùn)輸線路和區(qū)域,只對(duì)成本表里程單價(jià)計(jì)算比較,分析結(jié)果會(huì)有所偏差。
2. 成本表數(shù)據(jù)中,部分?jǐn)?shù)據(jù)沒(méi)有里程數(shù)據(jù),只能查看運(yùn)單的單臺(tái)價(jià)格,數(shù)據(jù)難以得到有效使用。
3. 運(yùn)單地址具體到縣一級(jí),數(shù)據(jù)的過(guò)度細(xì)分,不利于匯總分析。
解決方案:
我們重點(diǎn)對(duì)成本進(jìn)行多維度的解讀,將運(yùn)輸訂單按照運(yùn)輸商維度展開(kāi),分析相同線路或相近運(yùn)輸距離的運(yùn)輸商價(jià)格差異,校驗(yàn)運(yùn)輸商數(shù)據(jù)的真實(shí)性。
1. 運(yùn)單地址處理
將地址數(shù)據(jù)文本拆分,分為省、市兩級(jí)結(jié)構(gòu),以市級(jí)地址作為運(yùn)單起/終的地址,過(guò)濾縣/區(qū)級(jí)地址信息。
2. 運(yùn)輸供應(yīng)商和運(yùn)輸成本比對(duì)
選擇相同的起始地和目的地,我們可以查看某一發(fā)運(yùn)區(qū)間段對(duì)應(yīng)不同運(yùn)輸商的價(jià)格分布。如某一汽車品牌從河北到上海區(qū)間段的運(yùn)輸,正常情況下應(yīng)為同一個(gè)價(jià)格,但觀察1~8月份,某運(yùn)輸商的單臺(tái)單價(jià)始終高于其他廠家約300元。
圖: 河北到上海各月單臺(tái)運(yùn)輸價(jià)格(供應(yīng)商按顏色區(qū)分)
總結(jié):圍繞海量數(shù)據(jù)的應(yīng)用場(chǎng)景進(jìn)行數(shù)據(jù)分析,調(diào)整在分析維度上的顆粒度尋找隱性差異和波動(dòng)區(qū)域,審計(jì)過(guò)程可以識(shí)別更多風(fēng)險(xiǎn)領(lǐng)域并給予重點(diǎn)關(guān)注。
三.運(yùn)輸行業(yè)應(yīng)用場(chǎng)景分析
場(chǎng)景描述:
一家運(yùn)輸公司主要是承接汽車的輸運(yùn)業(yè)務(wù),從客戶簽訂協(xié)議后,將運(yùn)力分解交付到不同的運(yùn)輸商,由運(yùn)輸商負(fù)責(zé)實(shí)際的運(yùn)輸業(yè)務(wù)。運(yùn)單數(shù)據(jù)選取該公司7個(gè)月14家客戶的成本表數(shù)據(jù),涉及72.8萬(wàn)條數(shù)據(jù)。值得注意的是,部分長(zhǎng)距離運(yùn)單會(huì)被公司拆分,交由不同的運(yùn)輸商分段運(yùn)輸,故需要按照運(yùn)輸商維度展開(kāi)分析。
場(chǎng)景難點(diǎn):
1. 常規(guī)的分析方法,不考慮運(yùn)輸線路和區(qū)域,只對(duì)成本表里程單價(jià)計(jì)算比較,分析結(jié)果會(huì)有所偏差。
2. 成本表數(shù)據(jù)中,部分?jǐn)?shù)據(jù)沒(méi)有里程數(shù)據(jù),只能查看運(yùn)單的單臺(tái)價(jià)格,數(shù)據(jù)難以得到有效使用。
3. 運(yùn)單地址具體到縣一級(jí),數(shù)據(jù)的過(guò)度細(xì)分,不利于匯總分析。
解決方案:
我們重點(diǎn)對(duì)成本進(jìn)行多維度的解讀,將運(yùn)輸訂單按照運(yùn)輸商維度展開(kāi),分析相同線路或相近運(yùn)輸距離的運(yùn)輸商價(jià)格差異,校驗(yàn)運(yùn)輸商數(shù)據(jù)的真實(shí)性。
1. 運(yùn)單地址處理
將地址數(shù)據(jù)文本拆分,分為省、市兩級(jí)結(jié)構(gòu),以市級(jí)地址作為運(yùn)單起/終的地址,過(guò)濾縣/區(qū)級(jí)地址信息。
2. 運(yùn)輸供應(yīng)商和運(yùn)輸成本比對(duì)
選擇相同的起始地和目的地,我們可以查看某一發(fā)運(yùn)區(qū)間段對(duì)應(yīng)不同運(yùn)輸商的價(jià)格分布。如某一汽車品牌從河北到上海區(qū)間段的運(yùn)輸,正常情況下應(yīng)為同一個(gè)價(jià)格,但觀察1~8月份,某運(yùn)輸商的單臺(tái)單價(jià)始終高于其他廠家約300元。
圖: 河北到上海各月單臺(tái)運(yùn)輸價(jià)格(供應(yīng)商按顏色區(qū)分)
3. 運(yùn)輸價(jià)格合理性分析
為了探討固定線路的價(jià)格變化關(guān)系,我們可以按照不同的運(yùn)輸線路計(jì)算單臺(tái)運(yùn)輸價(jià)格的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差異常明顯偏高的表示價(jià)格存在異常的波動(dòng)。
下圖中,對(duì)于某汽車品牌由吉林發(fā)往安徽安慶市的貨物,標(biāo)準(zhǔn)偏差相對(duì)較高,查看其月度運(yùn)輸價(jià)格,發(fā)現(xiàn)7月份較前6個(gè)月份的單價(jià)大幅上漲近45%,此種漲幅是否合理,尚需進(jìn)一步判斷。
圖: 各線路價(jià)格標(biāo)準(zhǔn)差(按起始地和目的地劃分)
為了探討固定線路的價(jià)格變化關(guān)系,我們可以按照不同的運(yùn)輸線路計(jì)算單臺(tái)運(yùn)輸價(jià)格的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差異常明顯偏高的表示價(jià)格存在異常的波動(dòng)。
下圖中,對(duì)于某汽車品牌由吉林發(fā)往安徽安慶市的貨物,標(biāo)準(zhǔn)偏差相對(duì)較高,查看其月度運(yùn)輸價(jià)格,發(fā)現(xiàn)7月份較前6個(gè)月份的單價(jià)大幅上漲近45%,此種漲幅是否合理,尚需進(jìn)一步判斷。
圖: 各線路價(jià)格標(biāo)準(zhǔn)差(按起始地和目的地劃分)
4. 日運(yùn)輸里程合理性判斷
對(duì)于運(yùn)單的運(yùn)輸時(shí)間,我們可以依據(jù)公司的運(yùn)輸特點(diǎn),設(shè)定每日運(yùn)輸?shù)睦锍谭秶绻者\(yùn)輸里程超過(guò)設(shè)定值,則判斷為運(yùn)輸異常項(xiàng),并以此篩選出異常數(shù)值。
圖: 發(fā)運(yùn)里程和運(yùn)輸天數(shù)異常數(shù)據(jù)
圖: 發(fā)運(yùn)里程和運(yùn)輸天數(shù)異常數(shù)據(jù)
從上圖我們可以看出,有部分?jǐn)?shù)據(jù)的運(yùn)達(dá)日期早于發(fā)車日期,此外還有大量的數(shù)據(jù),其日行駛里程高于我們?cè)O(shè)定的閾值,如1天行駛5,300KM。以此為基礎(chǔ),我們可以識(shí)別出異常物流供應(yīng)商。
圖: 運(yùn)輸數(shù)據(jù)異常運(yùn)單的運(yùn)輸商占比(運(yùn)輸商以顏色劃分)
圖: 運(yùn)輸數(shù)據(jù)異常運(yùn)單的運(yùn)輸商占比(運(yùn)輸商以顏色劃分)
該案例,我們通過(guò)對(duì)數(shù)據(jù)中關(guān)聯(lián)字段的場(chǎng)景設(shè)計(jì),從多個(gè)維度對(duì)業(yè)務(wù)狀態(tài)的真實(shí)性進(jìn)行解讀。此外,通過(guò)制定相關(guān)的判定規(guī)則,可以迅速的將異常數(shù)據(jù)和離群數(shù)據(jù)從大量的基礎(chǔ)數(shù)據(jù)中篩選出來(lái)。
總結(jié):圍繞交通運(yùn)輸行業(yè)的數(shù)據(jù)分析服務(wù),基于業(yè)財(cái)數(shù)據(jù)融合分析業(yè)務(wù)和財(cái)務(wù)上的風(fēng)險(xiǎn)點(diǎn),并挖掘和尋找企業(yè)運(yùn)營(yíng)效率上的提升與優(yōu)化空間。
四.電子商城應(yīng)用場(chǎng)景分析
場(chǎng)景描述:
某電子商城的主要業(yè)務(wù)形式為分期購(gòu)物的金融服務(wù)平臺(tái),用戶在商場(chǎng)上購(gòu)買商品時(shí),可以向商城申請(qǐng)分期付款,經(jīng)商城審批通過(guò)并收貨后,用戶按照約定的時(shí)間,定期向商城還款。作為金融服務(wù)平臺(tái),除商城自身資金發(fā)放貸款外,該商城還引進(jìn)多家外部公司的資金用于向用戶發(fā)放貸款。用戶向商城還款后,由商城向相應(yīng)的資方公司還款,對(duì)于未按時(shí)還款的用戶,商城會(huì)收取約定比例的滯納金,此外,部分逾期用戶拖欠的貸款由商城自有資金代為償還。
場(chǎng)景難點(diǎn):
1. 該商城為金融平臺(tái),還款邏輯復(fù)雜,商城既作為貸款出資方,又作為中間商,數(shù)據(jù)間存在強(qiáng)關(guān)聯(lián)性,人工核對(duì)檢查操作繁瑣,工作量大,抽樣數(shù)量占總樣本比例低。
2. 數(shù)據(jù)量大且存儲(chǔ)分散,還款數(shù)據(jù)分為用戶向商場(chǎng)還款表(252余萬(wàn)條數(shù)據(jù))和商城向資方還款表(118余萬(wàn)條數(shù)據(jù)),數(shù)據(jù)處理難度大。
3. 難以將各個(gè)數(shù)據(jù)庫(kù)貫通,有效關(guān)聯(lián)分析,驗(yàn)證公司現(xiàn)有財(cái)務(wù)收益的合理性。
解決方案:
在對(duì)公司業(yè)務(wù)場(chǎng)景和數(shù)據(jù)全面解讀后,我們通過(guò)“訂單號(hào)”建立訂單明細(xì)表和用戶還款表、訂單明細(xì)表和資方還款表的關(guān)聯(lián)關(guān)系,通過(guò)“訂單號(hào)”+“還款期數(shù)”建立用戶還款表和資方還款表的關(guān)聯(lián)關(guān)系。以此為基準(zhǔn),我們可以開(kāi)展數(shù)據(jù)一致性檢驗(yàn)和數(shù)據(jù)合理性的分析。
1. 訂單信息溯源與分析
我們分別將用戶還款數(shù)據(jù)和資方還款數(shù)據(jù),同訂單數(shù)據(jù)比對(duì),用戶還款數(shù)據(jù)中有76.71%可以同訂單明細(xì)數(shù)據(jù)相匹配,另有23.29%的數(shù)據(jù)無(wú)法找到相應(yīng)的訂單;資方還款數(shù)據(jù)中,只有192筆數(shù)據(jù)(涉及24個(gè)訂單)無(wú)法與訂單明細(xì)數(shù)據(jù)匹配,占比不足0.001%。資方還款數(shù)據(jù)和實(shí)際訂單一致性很高,而用戶還款數(shù)據(jù)中有大量數(shù)據(jù)無(wú)法找到相應(yīng)的訂單來(lái)源。
圖: 用戶還款表和訂單明細(xì)表匹配比例(左) 圖:資方還款表和訂單明細(xì)表匹配比例(右)
2. 訂單狀態(tài)合理性判斷
1) 用戶還款數(shù)據(jù)校驗(yàn)
用戶還款數(shù)據(jù)中,有160余萬(wàn)條數(shù)據(jù)可以與訂單明細(xì)信息匹配成功,我們根據(jù)訂單明細(xì)表中的訂單狀態(tài)對(duì)數(shù)據(jù)進(jìn)行分組解析,發(fā)現(xiàn)有1,485條數(shù)據(jù)(838筆訂單,占比0.09%)為交易關(guān)閉訂單或退貨訂單,但在用戶還款數(shù)據(jù)中的狀態(tài)為逾期未還且仍按日記錄應(yīng)繳滯納金。
圖: 用戶還款數(shù)據(jù)滯納金異常占比
總結(jié):圍繞交通運(yùn)輸行業(yè)的數(shù)據(jù)分析服務(wù),基于業(yè)財(cái)數(shù)據(jù)融合分析業(yè)務(wù)和財(cái)務(wù)上的風(fēng)險(xiǎn)點(diǎn),并挖掘和尋找企業(yè)運(yùn)營(yíng)效率上的提升與優(yōu)化空間。
四.電子商城應(yīng)用場(chǎng)景分析
場(chǎng)景描述:
某電子商城的主要業(yè)務(wù)形式為分期購(gòu)物的金融服務(wù)平臺(tái),用戶在商場(chǎng)上購(gòu)買商品時(shí),可以向商城申請(qǐng)分期付款,經(jīng)商城審批通過(guò)并收貨后,用戶按照約定的時(shí)間,定期向商城還款。作為金融服務(wù)平臺(tái),除商城自身資金發(fā)放貸款外,該商城還引進(jìn)多家外部公司的資金用于向用戶發(fā)放貸款。用戶向商城還款后,由商城向相應(yīng)的資方公司還款,對(duì)于未按時(shí)還款的用戶,商城會(huì)收取約定比例的滯納金,此外,部分逾期用戶拖欠的貸款由商城自有資金代為償還。
場(chǎng)景難點(diǎn):
1. 該商城為金融平臺(tái),還款邏輯復(fù)雜,商城既作為貸款出資方,又作為中間商,數(shù)據(jù)間存在強(qiáng)關(guān)聯(lián)性,人工核對(duì)檢查操作繁瑣,工作量大,抽樣數(shù)量占總樣本比例低。
2. 數(shù)據(jù)量大且存儲(chǔ)分散,還款數(shù)據(jù)分為用戶向商場(chǎng)還款表(252余萬(wàn)條數(shù)據(jù))和商城向資方還款表(118余萬(wàn)條數(shù)據(jù)),數(shù)據(jù)處理難度大。
3. 難以將各個(gè)數(shù)據(jù)庫(kù)貫通,有效關(guān)聯(lián)分析,驗(yàn)證公司現(xiàn)有財(cái)務(wù)收益的合理性。
解決方案:
在對(duì)公司業(yè)務(wù)場(chǎng)景和數(shù)據(jù)全面解讀后,我們通過(guò)“訂單號(hào)”建立訂單明細(xì)表和用戶還款表、訂單明細(xì)表和資方還款表的關(guān)聯(lián)關(guān)系,通過(guò)“訂單號(hào)”+“還款期數(shù)”建立用戶還款表和資方還款表的關(guān)聯(lián)關(guān)系。以此為基準(zhǔn),我們可以開(kāi)展數(shù)據(jù)一致性檢驗(yàn)和數(shù)據(jù)合理性的分析。
1. 訂單信息溯源與分析
我們分別將用戶還款數(shù)據(jù)和資方還款數(shù)據(jù),同訂單數(shù)據(jù)比對(duì),用戶還款數(shù)據(jù)中有76.71%可以同訂單明細(xì)數(shù)據(jù)相匹配,另有23.29%的數(shù)據(jù)無(wú)法找到相應(yīng)的訂單;資方還款數(shù)據(jù)中,只有192筆數(shù)據(jù)(涉及24個(gè)訂單)無(wú)法與訂單明細(xì)數(shù)據(jù)匹配,占比不足0.001%。資方還款數(shù)據(jù)和實(shí)際訂單一致性很高,而用戶還款數(shù)據(jù)中有大量數(shù)據(jù)無(wú)法找到相應(yīng)的訂單來(lái)源。
圖: 用戶還款表和訂單明細(xì)表匹配比例(左) 圖:資方還款表和訂單明細(xì)表匹配比例(右)
2. 訂單狀態(tài)合理性判斷
1) 用戶還款數(shù)據(jù)校驗(yàn)
用戶還款數(shù)據(jù)中,有160余萬(wàn)條數(shù)據(jù)可以與訂單明細(xì)信息匹配成功,我們根據(jù)訂單明細(xì)表中的訂單狀態(tài)對(duì)數(shù)據(jù)進(jìn)行分組解析,發(fā)現(xiàn)有1,485條數(shù)據(jù)(838筆訂單,占比0.09%)為交易關(guān)閉訂單或退貨訂單,但在用戶還款數(shù)據(jù)中的狀態(tài)為逾期未還且仍按日記錄應(yīng)繳滯納金。
圖: 用戶還款數(shù)據(jù)滯納金異常占比
2) 資方還款數(shù)據(jù)校驗(yàn)
資方還款數(shù)據(jù)中,我們將用戶還款數(shù)據(jù)與之相匹配,綜合兩個(gè)表的數(shù)據(jù)開(kāi)展分析。在資方還款表中,我們發(fā)現(xiàn)有11,703條還款數(shù)據(jù)(占比0.99%),顯示用戶已按時(shí)還款,但在用戶還款數(shù)據(jù)表并缺失的還款信息,同時(shí)依然計(jì)算這些還款訂單的滯納金,這些異常數(shù)據(jù)絕大部分(11,673個(gè))集中于某一個(gè)特定的資方。
圖: 資方還款數(shù)據(jù)異常占比
資方還款數(shù)據(jù)中,我們將用戶還款數(shù)據(jù)與之相匹配,綜合兩個(gè)表的數(shù)據(jù)開(kāi)展分析。在資方還款表中,我們發(fā)現(xiàn)有11,703條還款數(shù)據(jù)(占比0.99%),顯示用戶已按時(shí)還款,但在用戶還款數(shù)據(jù)表并缺失的還款信息,同時(shí)依然計(jì)算這些還款訂單的滯納金,這些異常數(shù)據(jù)絕大部分(11,673個(gè))集中于某一個(gè)特定的資方。
圖: 資方還款數(shù)據(jù)異常占比
3) 不同數(shù)據(jù)用戶還款比例對(duì)比
我們對(duì)資方還款數(shù)據(jù)和用戶還款數(shù)據(jù)中的用戶還款比例進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)與訂單明細(xì)表相匹配的資方還款數(shù)據(jù)和用戶還款數(shù)據(jù),其用戶還款訂單比例分別為68.17%和71.19%,還款比例明顯偏低。而用戶還款表中占比23.29%,無(wú)法與訂單明細(xì)表匹配的84萬(wàn)條數(shù)據(jù),用戶還款比例達(dá)到99.05%。由于訂單表外與表內(nèi)數(shù)據(jù)的用戶還款比例差距明顯,系統(tǒng)錄入信息的真實(shí)性需要進(jìn)一步的驗(yàn)證。
表: 不同數(shù)據(jù)屬性的用戶還款比例
我們對(duì)資方還款數(shù)據(jù)和用戶還款數(shù)據(jù)中的用戶還款比例進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)與訂單明細(xì)表相匹配的資方還款數(shù)據(jù)和用戶還款數(shù)據(jù),其用戶還款訂單比例分別為68.17%和71.19%,還款比例明顯偏低。而用戶還款表中占比23.29%,無(wú)法與訂單明細(xì)表匹配的84萬(wàn)條數(shù)據(jù),用戶還款比例達(dá)到99.05%。由于訂單表外與表內(nèi)數(shù)據(jù)的用戶還款比例差距明顯,系統(tǒng)錄入信息的真實(shí)性需要進(jìn)一步的驗(yàn)證。
表: 不同數(shù)據(jù)屬性的用戶還款比例
3. 財(cái)務(wù)數(shù)據(jù)對(duì)業(yè)務(wù)數(shù)據(jù)的支持性分析
我們以訂單明細(xì)表的成交明細(xì)作為基礎(chǔ)數(shù)據(jù),通過(guò)關(guān)聯(lián)用戶還款表和資方還款表,可以實(shí)現(xiàn)對(duì)商城財(cái)務(wù)數(shù)據(jù)的多維度解讀。
1) 月度資金數(shù)據(jù)概覽
我們選取訂單明細(xì)表的商城自有資金貸款金額、資方還款表中由商城代還款而用戶未還款金額作為商城的月度支出項(xiàng);選取用戶還款表中實(shí)際收取滯納金、資方還款表中的商城分潤(rùn)和自營(yíng)資金回款作為收入項(xiàng)。
我們以訂單明細(xì)表的成交明細(xì)作為基礎(chǔ)數(shù)據(jù),通過(guò)關(guān)聯(lián)用戶還款表和資方還款表,可以實(shí)現(xiàn)對(duì)商城財(cái)務(wù)數(shù)據(jù)的多維度解讀。
1) 月度資金數(shù)據(jù)概覽
我們選取訂單明細(xì)表的商城自有資金貸款金額、資方還款表中由商城代還款而用戶未還款金額作為商城的月度支出項(xiàng);選取用戶還款表中實(shí)際收取滯納金、資方還款表中的商城分潤(rùn)和自營(yíng)資金回款作為收入項(xiàng)。
以此為基準(zhǔn)可以計(jì)算商城的實(shí)際月收支情況,我們可以看出,該商城的月度支出要遠(yuǎn)大于月度收入。選取2018年1月到8月的數(shù)據(jù),用該期的支出金額減去收入金額,商城資金是凈支出2595萬(wàn)。此外,當(dāng)期的利息分潤(rùn)為394萬(wàn),實(shí)收滯納金1359萬(wàn),在不考慮商城資金成本的情況下,滯納金帶來(lái)的收益是利息收益的3.4倍。
圖: 商城月度實(shí)際收支金額
圖: 商城月度實(shí)際收支金額
2) 商城資金放款分析
商城資金支出款項(xiàng)主要為自有資金的放款,我們將商城放款資金、外部資方的放款資金和商城實(shí)際完成的訂單數(shù)量,三個(gè)數(shù)據(jù)結(jié)合分析,商城訂單量大幅上漲的時(shí)間節(jié)點(diǎn)為2017年12月達(dá)到2.8萬(wàn)個(gè),較11月上漲98.4%。商城的總放款資金和訂單數(shù)量為強(qiáng)相關(guān)的關(guān)系,同時(shí)商城自有資金的放款比例并不穩(wěn)定,18年放款占比在2.5~35%之間波動(dòng)。
圖: 商城月度放款資金和訂單成交數(shù)量
商城資金支出款項(xiàng)主要為自有資金的放款,我們將商城放款資金、外部資方的放款資金和商城實(shí)際完成的訂單數(shù)量,三個(gè)數(shù)據(jù)結(jié)合分析,商城訂單量大幅上漲的時(shí)間節(jié)點(diǎn)為2017年12月達(dá)到2.8萬(wàn)個(gè),較11月上漲98.4%。商城的總放款資金和訂單數(shù)量為強(qiáng)相關(guān)的關(guān)系,同時(shí)商城自有資金的放款比例并不穩(wěn)定,18年放款占比在2.5~35%之間波動(dòng)。
圖: 商城月度放款資金和訂單成交數(shù)量
3) 商城資金滯納金分析
根據(jù)前面的分析,該商城主要收入其實(shí)為滯納金收入,全部已成交訂單中,有23.29%數(shù)據(jù)為未還款數(shù)據(jù),該部分產(chǎn)生的滯納金為1.77億元,占到期間應(yīng)收滯納金的81.41%,這部分滯納金已占到當(dāng)期貸款總額的16.5%,金額巨大且有償還風(fēng)險(xiǎn)的滯納金,給商城的財(cái)務(wù)健康蒙上一層陰影。
對(duì)于逾期但已還款的訂單,應(yīng)收滯納金4,042萬(wàn),實(shí)際收取2,110萬(wàn)元占比52.22%,其余47.48%的滯納金被商城減免。我們根據(jù)已償還貸款的月度實(shí)收滯納金和減免滯納金分析,發(fā)現(xiàn)2018年1月之前,滯納金減免比例低于4.8%,1月之后滯納金減免比例維持較高水平,2018年7月滯納金減免32.53%,為1月份后減免比例最低的月份,滯納金的大比例減免值得我們進(jìn)一步關(guān)注。
總結(jié):通過(guò)數(shù)據(jù)分析,實(shí)現(xiàn)對(duì)信息流的追溯,形成關(guān)系網(wǎng)絡(luò)的可視化分析效果,辨識(shí)錯(cuò)鏈和斷鏈,挖掘不合理與不真實(shí)信息與關(guān)系,有助于審計(jì)師和企業(yè)管理者對(duì)業(yè)務(wù)戰(zhàn)略發(fā)展和風(fēng)險(xiǎn)把控上具有更多決策支持。
信永中和數(shù)字服務(wù),通過(guò)大數(shù)據(jù)技術(shù),可以對(duì)企業(yè)的業(yè)務(wù)、財(cái)務(wù)和運(yùn)營(yíng)數(shù)據(jù)進(jìn)行全面而有效的整合。我們收集的所有數(shù)字信息現(xiàn)在都可以用新的方式加以利用。通過(guò)將公司的全部數(shù)據(jù),按照數(shù)據(jù)類別進(jìn)行分組,可以將其下屬子公司或業(yè)務(wù)板塊的數(shù)據(jù)匯總到一起,一個(gè)問(wèn)題模型解決的企業(yè)所有同類問(wèn)題,而不同主體數(shù)據(jù)的橫向?qū)Ρ雀芡癸@異常的數(shù)據(jù),對(duì)于多業(yè)務(wù)線以及集團(tuán)公司可以顯著提高數(shù)據(jù)分析效率。
信永中和數(shù)字服務(wù)賦予數(shù)據(jù)更多的價(jià)值,提供全流程數(shù)據(jù)解決方案和效率工具,賦能專業(yè)服務(wù)團(tuán)隊(duì)更好更全面的認(rèn)知客戶,適應(yīng)新環(huán)境、拓展新業(yè)務(wù)。我們可以貫穿企業(yè)的各業(yè)務(wù)線,驗(yàn)證不同數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)的一致性;對(duì)數(shù)據(jù)進(jìn)行分類、聚合,不同主體的數(shù)據(jù)與內(nèi)部或公開(kāi)市場(chǎng)數(shù)據(jù)對(duì)比,定位數(shù)據(jù)的差異性;根據(jù)專家經(jīng)驗(yàn)或統(tǒng)計(jì)學(xué)原理,定義數(shù)據(jù)的合理區(qū)間或數(shù)據(jù)關(guān)聯(lián)性,篩選異常數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行加工,補(bǔ)充新的數(shù)據(jù)字段,深入分析。此外,采用數(shù)據(jù)分析方法,可以幫助專業(yè)團(tuán)隊(duì)降低審計(jì)成本,優(yōu)化、提高工作效率,讓團(tuán)隊(duì)精力聚焦到更深層面、更有價(jià)值的問(wèn)題上。
根據(jù)前面的分析,該商城主要收入其實(shí)為滯納金收入,全部已成交訂單中,有23.29%數(shù)據(jù)為未還款數(shù)據(jù),該部分產(chǎn)生的滯納金為1.77億元,占到期間應(yīng)收滯納金的81.41%,這部分滯納金已占到當(dāng)期貸款總額的16.5%,金額巨大且有償還風(fēng)險(xiǎn)的滯納金,給商城的財(cái)務(wù)健康蒙上一層陰影。
對(duì)于逾期但已還款的訂單,應(yīng)收滯納金4,042萬(wàn),實(shí)際收取2,110萬(wàn)元占比52.22%,其余47.48%的滯納金被商城減免。我們根據(jù)已償還貸款的月度實(shí)收滯納金和減免滯納金分析,發(fā)現(xiàn)2018年1月之前,滯納金減免比例低于4.8%,1月之后滯納金減免比例維持較高水平,2018年7月滯納金減免32.53%,為1月份后減免比例最低的月份,滯納金的大比例減免值得我們進(jìn)一步關(guān)注。
圖: 月度實(shí)收滯納金和減免滯納金金額
在電子商城的業(yè)務(wù)場(chǎng)景中,我們獲取的數(shù)據(jù)主要為訂單財(cái)務(wù)收入數(shù)據(jù),針對(duì)這份數(shù)據(jù),我們更多的是對(duì)不同數(shù)據(jù)庫(kù)中數(shù)據(jù)進(jìn)行整合,判斷記錄數(shù)據(jù)的真實(shí)性以及還款行為的合理性,此外,對(duì)財(cái)務(wù)的收支金額和滯納金的減免進(jìn)行統(tǒng)計(jì),可以幫助項(xiàng)目團(tuán)隊(duì)深入理解復(fù)雜場(chǎng)景的資金流數(shù)據(jù)。總結(jié):通過(guò)數(shù)據(jù)分析,實(shí)現(xiàn)對(duì)信息流的追溯,形成關(guān)系網(wǎng)絡(luò)的可視化分析效果,辨識(shí)錯(cuò)鏈和斷鏈,挖掘不合理與不真實(shí)信息與關(guān)系,有助于審計(jì)師和企業(yè)管理者對(duì)業(yè)務(wù)戰(zhàn)略發(fā)展和風(fēng)險(xiǎn)把控上具有更多決策支持。
信永中和數(shù)字服務(wù),通過(guò)大數(shù)據(jù)技術(shù),可以對(duì)企業(yè)的業(yè)務(wù)、財(cái)務(wù)和運(yùn)營(yíng)數(shù)據(jù)進(jìn)行全面而有效的整合。我們收集的所有數(shù)字信息現(xiàn)在都可以用新的方式加以利用。通過(guò)將公司的全部數(shù)據(jù),按照數(shù)據(jù)類別進(jìn)行分組,可以將其下屬子公司或業(yè)務(wù)板塊的數(shù)據(jù)匯總到一起,一個(gè)問(wèn)題模型解決的企業(yè)所有同類問(wèn)題,而不同主體數(shù)據(jù)的橫向?qū)Ρ雀芡癸@異常的數(shù)據(jù),對(duì)于多業(yè)務(wù)線以及集團(tuán)公司可以顯著提高數(shù)據(jù)分析效率。
信永中和數(shù)字服務(wù)賦予數(shù)據(jù)更多的價(jià)值,提供全流程數(shù)據(jù)解決方案和效率工具,賦能專業(yè)服務(wù)團(tuán)隊(duì)更好更全面的認(rèn)知客戶,適應(yīng)新環(huán)境、拓展新業(yè)務(wù)。我們可以貫穿企業(yè)的各業(yè)務(wù)線,驗(yàn)證不同數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)的一致性;對(duì)數(shù)據(jù)進(jìn)行分類、聚合,不同主體的數(shù)據(jù)與內(nèi)部或公開(kāi)市場(chǎng)數(shù)據(jù)對(duì)比,定位數(shù)據(jù)的差異性;根據(jù)專家經(jīng)驗(yàn)或統(tǒng)計(jì)學(xué)原理,定義數(shù)據(jù)的合理區(qū)間或數(shù)據(jù)關(guān)聯(lián)性,篩選異常數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行加工,補(bǔ)充新的數(shù)據(jù)字段,深入分析。此外,采用數(shù)據(jù)分析方法,可以幫助專業(yè)團(tuán)隊(duì)降低審計(jì)成本,優(yōu)化、提高工作效率,讓團(tuán)隊(duì)精力聚焦到更深層面、更有價(jià)值的問(wèn)題上。