梧桐无羽
利用数据挖掘技术构建信用评分模型一般可以分为10个步骤,它们分别是:业务目的确定、数据源识别、数据收集、数据选择、数据质量审核、数据转换、数据挖掘、结果解释、应用建议和结果应用。这些可以形象地表示为(图一):1) 商业目标确定: 明确数据挖掘的目的或目标是成功完成任何数据挖掘项目的关键。例如,确定项目的目的是构建个人住房贷款的信用评分模型。2) 确认数据源识别: 在给定数据挖掘商业目标的情况下,下一个步骤是寻找可以解决和回答商业问题的数据。构建信用评分模型所需要的是关于客户的大量信息,应该尽量收集全面的信 息。所需要的数据可能是业务数据,可能是数据库/数据仓库中存储的数据,也可能是外部数据。如果没有所需的数据,那么数据收集就是下一个必需的步骤。3) 数据收集: 如果银行内部不能满足构建模型所需的数据,就需要从外部收集,主要是从专门收集人口统计数据、消费者信用历史数据、地理变量、商业特征和人口普查数据的企业购买得到。4) 数据筛选: 对收集的数据进行筛选,为挖掘准备数据。在实际项目中,由于受到计算处理能力和项目期限的限制,在挖掘项目中想用到所有数据是不可能实现的。因此数据筛选是必不可少的。数据筛选考虑的因素包括数据样本的大小和质量。5) 数据质量检测: 一旦数据被筛选出来,成功的数据挖掘的下一步是数据质量检测和数据整合。目的就是提高筛选出来数据的质量。如果质量太低,就需要重新进行数据筛选。6) 数据转换: 在选择并检测了挖掘需要的数据、格式或变量后,在许多情况下数据转换非常必要。数据挖掘项目中的特殊转换方法取决于数据挖掘类型和数据挖掘工具。一旦数据转换完成,即可开始挖掘工作。7) 数据挖掘: 挖掘数据是所有数据挖掘项目中最核心的部分。在时间或其它相关条件(诸如软件等)允许的情况下,最好能够尝试多种不同的挖掘技巧。因为使用越多的数据挖掘 技巧,可能就会解决越多的商业问题。而且使用多种不同的挖掘技巧可以对挖掘结果的质量进行检测。例如:在构建信用评分模型时,分类可以通过三种方法来实 现:决策树,神经分类和逻辑回归,每一种方法都可能产生出不同的结果。如果多个不同方法生成的结果都相近或相同,那么挖掘结果是很稳定、可用度非常高的。 如果得到的结果不同,在使用结果制定决策前必须查证问题所在。8) 结果解释: 数据挖掘之后,应该根据零售贷款业务情况、数据挖掘目标和商业目的来评估和解释挖掘的结果。9) 应用建议:数据挖掘关键问题,是如何把分析结果即信用评分模型转化为商业利润。10) 结果应用:通过数据挖掘技术构建的信用评分模型,有助于银行决策层了解整体风险分布情况,为风险管理提供基础。当然,其最直接的应用就是将信用评分模型反馈到银行的业务操作系统,指导零售信贷业务操作。 数 据挖掘方法可以依据其功能被分成4组:预估模型、分类、链接分析和时间序列预测。每一项功能都可以被开发和修改成为适应不同业务的应用。比如: 分类模型可以被运用到建立信用风险评分模型、信用风险评级模型、流失模型、欺诈预测模型和破产模型等。为实现数据挖掘的每一项功能,有许多不同的方法或算 法可以使用。本文所讨论的信用风险评分模型主要是属于分类模型,所以用到的方法主要有分类分析和分割分析。分类分析主要方法包括:决策树、神经网络、区别分析、逻辑回归、概率回归;分割分析主要方法包括:K-平均值、人口统计分割、神经网络分割。
哦、起床…
1、信用评分模型是什么?信用评分模型是近年来兴起的一种为了保障银行和其他金融部门的金融安全而设立的一种关于人身金融权限的划定模型。该模型指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数,根据客户的信用分数,来决定客户所可以持有的金额权限,从而保证还款等业务的安全性。而随着在现代社会和公司中,贷款,信用卡的作用日渐突出,信用评分模型的发展前景不可估量。2、分为哪些?(1)判别分析模型判别分析法是对研究对象所属类别进行判别的一种统计分析方法。进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值。判别分析就是要从中筛选出能提供较多信息变量并建立判别函数,使推导出的判别函数对观测样本分类时的错判率最小。这种方法的理论基础是样本由两个分布有显著差异的子样本组成,并且它们拥有共同的属性。它起源于1936年Fisher引进的线性判别函数,这个函数的目的是寻找一个变量的组合,把两个拥有一些共同特征的组区分开来。判别分析方法的优点适用于二元或多元性目标变量,能够判断,区分个体应该属于多个不同小组中的哪一组。自身也存在不可避免的缺点:该模型假设前提是自变量的分布都是正态分布的而实践中的数据往往不是完全的正态分布,从而导致统计结果的不可靠性。(2)决策树方法决策树模型是对总体进行连续的分割,以预测一定目标变量的结果的统计技术。决策树构造的输入是一组带有类别标记的例子构造的结果是一棵二叉或多叉树。构造决策树的方法是采用自上而下的递归构造。在实际中为进行个人信用分析选取个人信用作为目标属性,其他属性作为独立变量。所有客户被划分为两类,即好客户的和坏客户,将客户信用状况转换为是否好客户”(值为1或0而后利用数据集合来生成一个完整的决策树。在生成的决策树中可以建立一个规则基。一个规则基包含一组规则每一条规则对应决策树的一条不同路径,这条路径代表它经过节点所表示的条件的一条链接。通过创立一个对原始祥本进行最佳分类判别的决策树,采用递归分割方法使期望误判损失达到最小。决策树模型的优点:浅层的决策树视觉上非常直观,容易解释;对数据的结构和分布不需做任何假设:可以容易地转化成商业规则。它的缺点在干:深层的决策树视觉上和解释上都比较困难;决策树对样本量的需求比较大;决策树容易过分微调于样本数据而失去稳定性和抗震荡性。(3)回归分析法回归分析法是目前为止应用最为广泛的一种信用评分模型这其中以著名的logistic回归为代表。除此之外,线性回归分析、probit回归等方法亦属于此类。最早使用回归分析的Orgler他采用线性回归模型制定了一个类似于信用卡的评分卡,他的研究表明消费者行为特征比申请表资料更能够预测未来违约可能性的大小。同数学规划方法中一样假设已经通过一定的方法从样本变量中提取出了若干指标作为特征向量回归分析的思想就是将这些指标变量拟合成为一个可以预测申请者违约率的被解释变量自然就是违约率p回归分析中应用最广泛的模型当属线性回归模型它是对大量的数据点中表现出来的数量关系模拟出一条直线,回日分析的目标就是使目标变量值和实际的目标变量值之间的误差最小。因此最早将回归方法应用于信用评分研究的模型,就是简单的线性回归模型,目前基于logistic回归的信用评分系统应用最为普遍。
应该就是一种论文的模式吧网上有很多论文模型,就是什么前言啊,导论啊,分析啊,流程啊什么的
计量经济学中的双因素分析模型,如果在之后跟一个格兰杰因果关系检验就更好了
可以考虑用主成分进入模型或用二阶模型表示。(南心网 Amos数据分析)
利用数据挖掘技术构建信用评分模型一般可以分为10个步骤,它们分别是:业务目的确定、数据源识别、数据收集、数据选择、数据质量审核、数据转换、数据挖掘、结果解释、应
我写的也是这样的论文,但老师说我的没新意。我也是在网上凑的。提纲给你吧。希望你能用到。我现在要换选题了,我也在这上提了问题的。我现在还没有通过提纲。别人的都已经