4.2 基于 SAS Enterprise Miner 平台的联网审计风险控制系统的应用。
对于大型商业银行内部审计部门的,我们选择某银行的信用卡营销活动作为审计业务的审计对象,期待可以从以往的信用卡使用者中挖掘出可以继续发放额度较高且风险比较小的信用卡用户的数据。
4.2.1 数据挖掘案例实施的步骤和情况我们选用数据挖掘工具为 SAS Enterprise Miner Workstation 13.2 版本。下面介绍运用 SAS Enterprise Miner13.2 对某银行的信用卡客户数据进行挖掘的相关步骤和情况。
(1)打开 SAS Enterprise Miner Workstation 13.2 客户端,打开文件选项进入新建项目界面,输入项目名称和 SAS 服务器目录。
(2)点击下一步后,核对好新建项目的信息,如图 4.4 所示。点击完成即可进入数据挖掘的主界面。
(3)点击主界面新建 SAS 数据的逻辑库,并将被审计业务的原始数据导入 SASEnterprise Miner 软件的特有数据形式 SAS 数据表。
(4)下一步新建数据源,选择 SAS 数据表 Purchased_credit .
对于数据集 purchased_credit 中的元素我们选择 purchase 为目标(即数据挖掘的所想要得到的最终结果对象)(5)下一步我们设置好相关指标后新建数据挖掘的流程图 CreditAudit,并对其中审计数据集的 purchased_credit 中元素进行初步探索结果。
通过观察初步探索的结果我们可以发现审计数据集的 purchased_credit 中有十个变量(元素)并有 1461 个观测数值,变量名分别为:区别不同被审计数据的人员的id 号;代表已工作年限的 age;信用卡所欠的金额 creddebt;债务占收入的比 debtinc;所受教育的程度 ed 等等。
(6)对于 SAS 数据表 purchased_credit 中 1461 个观测数中我们选择 60%位训练集,40%为验证集,并假设对这些以前持卡的人员,如果营销成功则可盈利 95 元,如果失败就亏损 5 元,同时进行数据挖掘。我们选取的数据挖掘模型是决策树、梯度Boosting、回归、神经网络、自动神经网络,通过每一步的设置和连接,最后我们得到了如图 4.9 所示的数据挖掘流程图。
4.2.2 数据挖掘案例实施的结果和分析(1)我们通过探索流程图中模型比较的结果,便可得到五种模型的 ROC 图如图4.10 所示。图左部分为训练集的 ROC 图,而右部份为验证集的 ROC 图。
ROC 曲线指受试者工作特征曲线[47](receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在 ROC 曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。ROC 曲线与坐标轴的面积越大,表示对整个模型的贡献度越好,对于图 4.9可以看出神经网络模型对该数据集的适用结果相较于其他四中模型是不太理想的。而决策树模型对数据集的适用记过相较于其他四中模型是比较好的。通过观察下文的表4.2 我们也可以得出同样的结论。
(2)打开累计预期总利润选项,可得到累计预期总利润评分排名叠加图。
(3)打开 CreditAudit 流程图中模型比较的结果中提升度选项可得提升度评分排名叠加图。无论是图 4.11 的累计预期总利润的评分排名叠加图,还是图 4.12 的提升度的评分排名叠加图(注意箭头处的数据)都可以看到对 20%左右的人进行营销,那么银行的就可以信用卡发行可以利润最大化,且信用卡发行所承担的风险最小。
(4)由 CreditAudit 流程图中模型比较的结果中可以得到以下的五个表。
(5)当然这还不是我们最终想要的结果,我们想要取得是对哪些 20%左右的人进行营销呢?最后我们在图4.9流程图最后一步的SAS代码模块的代码编辑框中输入下列代码:
proc sort data=emws1.score_train out=emws1.train;by descending em_eventprobability;where em_eventprobability>0.6;run;proc export data=emws1.trainoutfile="C:\Users\PURE \Desktop\train.sav"dbms=sav replace;run;在运行了上述代码之后我们便可以从计算机我们选定目的文档"C:\Users\ PURE\Desktop\train.sav"处提取出我们想要信用卡营销成功率在 0.6 以上的 SPSS 数据格式sav 文件的人员名单了。
4.3 本章小结。
本章分别从宏观和微观两个方面通过对某银行联网审计风险控制系统的构建,取得了银行联网审计风险控制系统的模型初步构建。然后重点研究了通过对某银行信用卡营销数据进行内部审计意义上的数据分析(即数据挖掘),借助于 SAS EnterpriseMiner 平台顺利的应用了数据挖掘中的五种算法(模型)于审计数据上,最终获得的想要的审计结果,降低了审计的风险进而增加了企业的价值。
内部审计是由各单位自身设置的相对独立的审计部门对单位内部进行的审计,它是各单位管理职能的一部分。内部审计主要是通过监督检查本单位的财务收支和经营管理活动来达到协助决策层更有效的履行职责的目的。内部审计的目的决定了它自身的特点:服务的内向型...
一、我国注册会计师独立性现状。尽管我国CPA近几年已经取得了长足的发展,但是不得不承认,我国CPA发展仍然存在不少问题。在这里我们列出以下两个主要问题:(一)注册会计师整体职业水准不高,注册会计师职业道德较低注册会计师需要较高的专业胜任能...
1绪论1.1研究背景及研究意义1.1.1研究背景自2006年以来,因为全球经济形势的变化及审计报告各方使用者的相关需求,国际审计与鉴证准则理事会(IAASB)一直在酝酿、推动审计报告准则改革。近些年来,为了改进审计报告,IAASB对审计实践情况进行了跟...
风险导向的内部审计管理工作一定给予足够的重视程度,对于企业内部各部门之间的有序化管理将会起到良好的帮助作用,同时,也是企业不断发展创新的必要条件。...
一、引言随着中国经济市场化改革的步伐加快,海外资金的不断引入以及国有企业私有化进程的加快,导致我国对高质量审计的需求不断提高。这是因为对于资本市场而言,经注册会计师鉴证的会计信息在引导资源配置方面发挥着越来越重要的作用;注册会计师的审计质...
0引言第三方审核机构是衡量节能效益分配,确认节能量的核心机构.作为节能服务体系重要的实体组织,具有严肃性、专业性、独立性.目前,中国第三方审核机构发展速度缓慢,远远落后于节能服务产业整体发展速度,成为阻碍中国合同能源管理模式发展的重要因素.随着节...
前言:建筑工程后期审计工作需要将项目成本真实数据以及搭接器材合法性内容,进行客观审查和有机评估。实际调查发现,建筑项目中涉及安装,以及征地迁移费用总计数量达到九成,所以针对个中建筑安装细节进行细致成本累加,对于竣工结算结果公平性彰显辅助功...
4海尔公司电子商务审计风险的防范4.1环境风险的防范4.1.1完善运营环境无论在任何一个国家或是任何一个地区,物流体系都在电子商务中占有者极其重要的位置。成熟而可靠的物流体系可以帮助被审计单位电子商务更健康地发展,还可以降低企业的经营风险。而...
为了更好提升审计工作人员的业务水平,加强完善健全的考核制度,推动质量管理体系保证达到标准,提高审计人员工作的积极性,更好发挥政府审计在社会中的职能作用,改善审计工作,注重总结改进和制度管理。一、地方审计质量管理体系目前存在的问题1.审计质...
企业绿化支出主要是指厂区内部及周边的绿化和景观支出,包括花草、树木、雕塑、石头、水塘等,其功能分为多种,主要包括美化环境、减少污染、投资增值等。绿化功能不同,相应的会计处理也不同,审计师在对其进行审计时,需要分析绿化支出的经济实质,判断企...