首页 公文范文 统计学经验法则

统计学经验法则汇编(三篇)

发布时间:2023-11-09 16:29:00

绪论:一篇引人入胜的统计学经验法则,需要建立在充分的资料搜集和文献研究之上。搜杂志网为您汇编了三篇范文,供您参考和学习。

篇1

什么是数据挖掘?

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据挖掘如此重要,如何进行数据挖掘呢?当然是知识!

知识将成为比数据更重要的资产

复旦大学计算机科学与技术学院教授肖仰华博士在他近期所作的《知识图谱与认知智能》报告中指出:前几年大数据时代到来的时候,大家都说“得数据者得天下”。去年,微软研究院的沈向阳博士曾经说过“懂语言者得天下”。而我曾经论述过,机器要懂语言,背景知识不可或缺。因此,在这个意义下,将是“得知识者得天下”。如果说数据是石油,那么知识就好比是石油的萃取物。

那么问题来了?你需要哪些知识?

数据挖掘是个复杂的过程,它需要统计学、数据库、机器学习、模式识别等多学科的交叉融合来实现。

数据挖掘过程中用到的算法也很多,下图是对这些算法的一个总体梳理:

接下来我们就来说说这传说中的十大经典算法:

决策树(C4.5算法)

聚类(K-means算法)

关联规则(Apriori算法)

随机森林算法

逻辑回归

SVM

朴素贝叶斯

K最近邻算法

Adaboost 算法

神经网络

篇幅有限,为了保证阅读质量,本文只讲解前三个。其余的算法讲解会不定期更新的呦,想学习的小伙伴看过来???

十大经典算法图解(一)

01

决策树(C4.5算法)

决策树(Decision Tree),又称为判定树,是数据挖掘技术中的一种重要的分类方法,它是一种以树结构(包括二叉树和多叉树)形式来表达的预测分析模型。

根据一些特征( feature )进行分类,每个节点提一个问题,通过判断,将数据分为若干类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶子上。

决策树生长算法流程(以C4.5算法为例):

C4.5算法实例图解:

两周内的天气及网球俱乐部顾客光顾情况

02

聚类(K-means算法)

什么是聚类?

什么是K-means?

K-means算法流程图解:

Setp1:确定初始质心

Setp2:计算距离&划分簇

Setp3:迭代计算中心点

Setp4:收敛

03

关联规则(Apriori算法)

关联规则是形如XY的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则XY,存在支持度和信任度。

关联规则经典算法及优缺点比较:

Apriori算法是种最有影响的挖掘布尔关联规则频繁项集的算法。它的核心是基于两阶段频集思想的递推算法,该关联规则在分类上属于单维、单层、布尔关联规则。

在Apriori算法中,寻找最大项目集(频繁项集)的基本思想是:算法须要对数据集进行多步处理。

Apriori算法图解:

篇2

中图分类号:D914 文献标识码:A 文章编号:1672-3104(2012)06?0094?05

随着食品安全刑事案件的增多,有关食品安全犯罪因果关系的认定难题也日益突出。作为公害犯罪案件因果关系认定的一种学说,疫学因果关系论在国内刑法学理论和实践的应用中还处在探讨阶段。尽管国外已经有了依据疫学因果关系论的刑事判例,但国内刑法理论如何接纳该观点,以及如何在食品安全犯罪案件中运用,仍有许多值得探讨的地方。

一、食品安全犯罪中疫学因果关系论

法律适用的合理性分析

关于食品安全犯罪中采用疫学因果关系论的合理性,笔者以为,可以从如下两个方面加以分析。

(一)证明标准的分析

关于刑事证明标准,有客观真实和法律真实之分。客观真实是我国传统观点对证明标准的要求,而随着西学东渐,法律真实得到越来越多的学者支持。据学者介绍,在美国证据法和证据理论中,将证明的程度分为九等,其中前两等是绝对确定(相当于传统观点的客观真实)和排除合理怀疑,后者是对刑事案件作出定罪裁决所要求的标准,是刑事诉讼证明的最高标准[1](178)。而大陆法系则不区分民事诉讼与刑事诉讼。在两种案件中都要求高度盖然率,即按照一般经验可能达到的那样的高的程度,疑问已告排除,接近确实

性的可能性[2](282)。“排除合理的怀疑”和“高度盖然性”是英美法系和大陆法系同一标准互为表里的两种表述[3](237)。客观真实通常只能作为证明的最高标准而存在,由于受到可获取信息的有限性,诉讼证明手段的受限制性,证明主体认识能力与方法的有限性等诸多限制,作为定罪的标准只能是在法官的内心形成的一种对案件事实的法律上的确信。法律真实在刑事证明标准的体现,即“排除合理的怀疑”或“高度盖然性”,换言之,依据现有证据材料,能够形成如上程度的内心确信,就可以认定行为人有罪。

食品安全犯罪属于公害罪,这是学界比较统一的认识[4](104)。食品安全犯罪的因果进程具有公害罪的共同特征,即因果进程的滞后性、潜伏性和多因性。认定刑法因果关系的前提是确认危害行为与危害结果之间的条件关系,即要求存在着“没有A就没有B”的客观逻辑关系,但食品安全犯罪案件中由于危害结果与危害行为之间存在着较长的时间间隔,加上公众身体特质、食物来源的多样性及其他环境因素的作用,其中的条件关系难以清楚的判断。这就使得基于科学法则追求绝对确定的因果关系论,面对公害罪都无所适从,于是就有了疫学因果关系论。

疫学因果关系论的出现,是为公害罪条件关系的确定提供补充,其抛开运用科学法则确证条件关系的思路,而改以高盖然性为论断基础。只要证明危害行为与危害结果之间存在着高度关联性,即承认存在条件关系,进而认定存在刑法因果关系。如大谷实教授认为:“即便在公害之类的行为到结果之间的因果关系的发展过程在科学上并不能被全部证明的场合,也应按照一般经验法则,在有能认可‘没有A就没有B’的关系的时候,就可以肯定条件关系。因此,即便在行为和结果之间的因果关系在自然科学上不能被证实,但根据疫学的证明,能够认定‘没有超出合理怀疑的限度’时,就应肯定条件关系的存在。”[5](167)

值得注意的是,承认疫学因果关系论合理的观点,都同时强调了因果关系的证明标准问题。如上述大谷实教授的观点,要求达到“没有超出合理怀疑的限度”,其他的学者如大塚仁教授,认为应达到“不可怀疑地存在着疫学上高度的盖然性”[6](168),耶赛克教授认为,应达到“极高的盖然性”,要求“其他原因合理地未被考虑”[7](345?346)。因此,可以理解为,疫学因果关系是符合法律真实要求的条件关系。

疫学因果关系证明标准的合理性,本质是刑法因果关系证明标准的问题。由于不同的构成要件具有不同的事实和规范属性,导致其在证明标准上有所不同。刑法因果关系兼具事实属性和规范属性的特质,前者体现在条件关系认定上,后者体现在相当性判断上。对条件关系的证明,过去都是基于科学法则的,一般采取客观真实的标准,因为诸如枪击心脏、注射氰化物等行为有着必然导致被害人死亡的具有公理性的常识,这是不需要证明的客观真实。对相当性的证明,通常是法律真实的标准。哪些条件能作为原因,是受现有的一般性认识水平所决定的,“相当因果关系说内部存在着客观说、主观说与折衷说的对立,这三种学说都主张以行为时的一般人的认识为标准来判断相当性”[8](125)。不过,在公害罪的场合,对条件关系的认定由于中间因素的复杂,如果坚守客观真实的标准,刑事责任的认定就会悬而不决,应该被追究刑事责任的人就会“逍遥法外”,疫学因果关系论将客观真实的标准转为法律真实的标准。这一转向,并没有越过刑事有罪证明的底线,因此,从刑事证明标准的角度来说,依据高度盖然性或者排除合理怀疑标准认定的条件关系在法律效力上与依据客观真实认定的条件关系是等同的,同样可以作为行为人承担刑事责任的客观基础。

(二)法的有用性与正义性分析

尽管疫学因果关系论得到不少学者的支持,但固守科学法则的学者并不这样认为。“Armin Kaufmann等人说,既然没有确定自然科学的因果法则,就不能肯定有刑法上的因果关系。”[8](128)显然,突破科学法则的疫学因果关系论的合理性,还需要从法的基本理论上进行解释。

刑法一直是有用性与正义性的矛盾统一体。一方面,刑法要发挥犯罪人大的作用,保护犯罪嫌疑人和被告人的合法权益,另一方面,刑法要惩治和打击犯罪行为,保护法益。在公害罪问题上,刑法的有用性和正义性需要进一步解读。

正如前文所述,公害罪的刑法因果关系具有滞后性和潜伏性,并且具有公众身体特质、食物来源的多样性及其他环境因素的作用的背景,从而决定了要从科学法则的角度彻底弄清刑法因果关系成为事实上的不可能。而另一方面,刑法设定公害罪,绝不是要束之高阁,公害罪对国家、社会和普通公众危害极大,造成的损失往往惊人,设立公害罪就是要令相应领域的从业者采取审慎的态度,切实发挥起刑法预防与惩罚犯罪的功能,从而避免出现不特定多数人的福祉被公害罪侵害,将公众对公害罪的危害的恐惧、憎恶与工业化行为带来的巨大经济、社会利益进行平衡。正因为如此,在公害罪的刑法因果关系认定上,固守科学法则的结果,是造成社会巨大损失的、且能证明当事人存在过错的案件却没有人承担刑事责任,这极大地违背了刑法的有用性,如果立法对作为立法者的社会公众没有任何作用,这样的法律其存在的正义性也就值得怀疑了,正所谓“没有功利,公正无所依 存”[9](9),“一个旨在实现正义的法律制度,会试图在自由、平等和安全方面创设一种切实可行的综合体和谐合体。这是一项充满了巨大困难的使命,而且迄今尚未发现一项杰出计划在实现这一目标时能够声称自己体现了‘绝对的正义’。……正义提出了这样一个要求,即赋予人的自由、平等和安全应当在最大程度上与公共福利相一致”[10](297, 299)。

继而应该追问的是,以“排除合理怀疑”或者“高度盖然性”为标准的疫学因果关系论,是否违背了刑法的正义性,导致不应承担刑事责任的人承担了刑事责任。这一问题,除了上述证明标准的解释外,笔者以为,还涉及到对科学法则和高度盖然性之间关系的认识问题。科学法则和高度盖然性都是人类在现有水平下对规律性的认识。事实上科学法则也是不断被取代的,如牛顿的力学三定律,在相对论出现之前被认为是绝对正确的,而相对论出现后,则退居到大多数场合是正确的地位。所以说,科学法则只是被现有证明水平绝对证实的高度盖然性;疫学因果关系论所附加的高度盖然性,是以统计学为基础的,仅次于科学法则在案发时绝对正确的地位,“用来确定因果关系的科学法则,可以是具有绝对意义的法则(即能单独提供确定答案的法则),也可能是统计性法则(即能单独说明或然性的法则)。……因为统计性法则实际上也是普遍用于指导所有人类活动的法则之一”[11](128)。

而且运用疫学因果关系论得到的答案是具体到数字形式的判断,比纯主观性的判断更为可靠,正如著名统计学家C.Radhakrishna Rao所说:“如果有什么问题要解决的话,应求助于统计学而不是某个专家委员会。比起收集少数专家的智慧来说,统计学和统计分析能力能给解决问题带来更多光明”。论及疫学因果关系论的学者往往没有确切地指出高度盖然性的具体数值问题,最常见的表述是,依据疫学因果关系论认定刑法因果关系,须符合四个条件:“第一,该因子是在发病的一定期间之前其作用的因子;第二,该因子的作用程度越显著,患病率就越高;第三,该因子的分布消长与医学观察记载的流行特征并不矛盾;第四,该因子作为原因起作用,与生物学并不矛盾。”[8](128)然而这只是定性的表述,真正充足疫学因果关系论认定刑法因果关系正当性的,是疫学因果关系论统计结论的极高概率。

一般认为,统计学所得到的高概率事件,除去一些偶然因素的影响,几乎接近依据科学法则的结论。“人们积累的大量实践经验表明:当事件发生的概率接近100%时,在一次实验中几乎一定会发生。同时,当事件发生的概率很小,那么可以认为小概率事件在一次实验中该事件实际上不可能发生。”[12](7)按照这一原理,统计学证明的高概率的联系,完全具有认定因果律的正当性。因此,以疫学因果关系认定刑法因果关系的条件关系,完全具有刑法的正义性。

二、食品安全犯罪中疫学因果关系论

法律适用的限制条件

疫学因果关系论虽然具有诸多合理性,但其毕竟不是科学法则,在食品安全犯罪案件中应用该理论判定条件关系,需要遵循如下的条件。

(一)适用案件的范围

什么样的食品安全犯罪案件要应用到疫学因果关系论,其实这个问题的另一种表述是科学法则和疫学因果关系论的关系问题。疫学因果关系论只是科学法则的补充,由于科学法则判断因果关系符合客观真实的要求,因此,只有在科学法则不能作为判断基础时,才可以动用疫学因果关系论。如在案件所涉食品中检测出超出法定安全标准的添加剂,且现有科学法则已经证明过度食用该添加剂会导致案件所出现的危害结果,则无需运用疫学因果关系论,直接依照科学法则认定案件的刑法因果关系。

另外,当受害人的范围不足以满足统计学要求时,一般也不能应用该理论。例如,受害人只有一人时,缺乏统计基础,一般不能采用疫学因果关系论。如前所述,该理论的规则是“该因子的作用程度越显著,患病率就越高”和“该因子的分布消长与医学观察记载的流行特征并不矛盾”,这些都要求具有一定样本量的分析。

(二)刑事证明责任的归属

证明责任本身是一个复杂的概念,据学者研究,大陆法系以主观证明责任和客观证明责任构建证明责任概念,英美法系以说服责任和提出证据责任构建证明责任概念[13](107)。不过无论是哪种构造,都要解决当控辩双方举证后待证事实仍无法查清的法律效果问题。由于无罪推定、疑罪从无的原则,一般情况下,这种法律效果都是由控方承担。在《刑法》中只有极少数罪名采取了举证责任倒置的原则,由辩护方承担事实不清的法律后果,如巨额财产,非法持有国家秘密、机密文件、资料、物品罪。

多数学者谈到疫学因果关系论的应用依据,必首提日本《公害罪法》的规定。该法第5条规定“在某工厂或事业场所,在其事业活动中已排放了有害人体健康的物质,且其单独排放量已使公众的生命或健康受到危害的程度的情况下,若在排放此物质的地域内,公众的健康或生命早已由此物质的排放而受到损害和威胁,则便可推定,此种危害纯系该排放者的此种有害物质所致。”有观点据此认为,疫学因果关系论,是推定的因果关系,疫学因果关系论适用的场合,鉴于公害罪主体处于社会责任重要的地位,采取举证责任倒置的原则[14](106)。还有观点认为,虽然法律没有规定“因果关系推定”原则,但实践中已经有此方面的实例,如1980年王娟诉青岛市化工厂氯气污染损害赔偿案就已经运用了流行病学原理,推定王娟所患支气管哮喘病与氯气污染具有因果关系[15](144)。作为相反意见,有学者认为尽管世界各国对公害案件多采用举证责任倒置及因果关系的推定,但我国刑法、刑诉法目前均无此类规定,而且在我国参加的《公民权利和政治权利国际公约》中,已明文规定“任何人不被强迫作不利于他自己的证言或强迫承认犯罪”,因此,根据我国现行的法律框架,如果控方不能确实充分地举证,则不能判定被告方构成公害犯罪[16](18)。

笔者以为,所谓认为疫学因果关系论是推定的因果关系的观点,并不可取,实际上是将证明责任与疫学因果关系论混淆的观点。理由有三:

第一,《公害罪法》的规定实际是相当性判断。即《公害罪法》第5条所规定的推定,实际上是不考虑因果关系的实际进程的相当性判断,因为该条设定了两个明确的条件,一是特定地域工厂的单独排放量具有危害公众生命健康权的危险,二是实际上该特定地域公众生命健康权已被查明是被该排放物伤害,至于具体的因果过程是通过直接污染还是间接污染,不需要具体的查明。因此,并不能由此得出疫学因果关系论是推定因果关系的结论。

第二,疫学因果关系论的证明标准否定了推定因果关系的可能。如前所述,疫学因果关系论本身的合理合法性,是建立在统计科学的基础上的,所要达到的标准也是排除合理的怀疑或极高的盖然性的,所以,应用该理论认定条件关系的做法,并没有确定要将证明责任分配给辩护方。国外之所以将公害罪的证明责任分配给辩护方,并不是因为条件关系的认定运用了疫学因果关系论的原因,而是基于公害罪因果关系的证据资料优势不在控诉方而在辩护方的原因,相比之下造成公害的企业在证据资料的获得上有更大的便利和更专业的支持,然而定罪的证明标准,仍然要是能达到排除合理的怀疑或者极高的盖然性标准的疫学关系,否则,疫学因果关系论支持者所持的证据标准和事实不清时由辩护方承担刑事责任的法律效果是相互冲突的,如果认为疫学因果关系就是推定因果关系,实际上是否定了疫学因果关系认定条件关系的合理合法性。

第三,民事的公害侵权行为不能用来解释刑事公害罪问题。个别论者所举王娟诉青岛市化工厂氯气泄漏的事例,并不足以作为刑事法中疫学因果关系是推定因果关系的佐证。其一,在于本案中原告只有王娟一人,不符合疫学因果关系的统计学要求;其二,本案并非刑事案件,以民事案件的证明标准、证明责任来说明刑事案件的逻辑,本不可取;其三,本案不符合公害罪常见的危害行为与危害结果之间时间间隔较长的特征。王娟住处距化工厂只有100米,由于中毒较重当晚即送医院救治,且在医院治疗长达300多天,出现哮喘这种并发症完全可以以科学法则解释。

因此,在现有法律规定框架中,应用疫学因果关系论认定条件关系的证明责任,仍然属于控方。即控方必须承担条件关系证明不达到排除合理怀疑或极高的盖然性标准而败诉的后果。

(三)应用精确性和有效性的要求

流行病学研究方法,包括现状研究、队列研究、对照研究、实验研究等,研究的步骤一般包括如下几步:① 描述性研究提出假设;② 分析性研究检验假设(一般先是对照研究,然后队列研究);③ 实验验证;④ 病因推导(主要是例外因素的排除)。主要包括机遇的排除、偏倚的排除和Hill’s标准的满 足[17](186?190)。就刑事案件而言,受刑事程序是有限时间段的影响,最常用的是对照研究、队列研究,通过对同一人群和非同一人群暴露组与非暴露组的对照,得出比值比(OR)和相对危险度(RR)等数值,运用统计软件(如SPSS,SAS)计算怀疑因素与结果之间的关联强度,并在排除怀疑因素的基础上,判断是否存在因果关系。在这些方法和步骤运用中,始终离不开精确性和有效性的问题,这决定了疫学理论应用能否达到证明标准的问题。

(1)精确性的要求。流行病学理论认为,在流行病学研究中,在对某因素与疾病发生间的联系做总体参数估计或病因学推断时,如果方差小即总体参数估计值的可信区间较窄,该研究的精确性就好。流行病学研究中导致随机误差的原因,主要来源于对研究对象的选择过程,因为研究对象实际上只是某人群的一个样本。为了提高精确性,一是增加样本含量,二是提高统计信息量[18](158)。在食品安全犯罪案件中,即要求,一方面要尽可能地扩大样本含量,将特定食品流通、消费地域的人群尽可能多地包括到样本库中来,避免出现因样本量过小导致判断误差无法排除的问题;另一方面,必须采用合理的设计和分析方法,包括充分收集和利用所有信息、合理应用统计模型、限制研究对象的特征,平衡各比较组群间的对象 数[18](159)。如包括尽可能收集特定食品的流通、消费的频率,出货量,相关人群的饮食习惯等,采取合适模型控制混杂因素对结论的影响,使暴露组与非暴露组的人群比例均衡等。

(2)有效性的要求。疫学有效性的问题,转换到刑事证明中,主要是怀疑因素的排除问题(即疫学所称的偏倚)。流行病学理论一般将偏倚分为选择偏倚、信息偏倚、混杂偏倚等。偏倚的存在,会导致研究者形成错误的关联。具体到食品安全犯罪案件中,防止偏倚的存在,主要应注意:一方面,对受害者信息的分析。应避免将可能由其他因素导致同一结果的受害者纳入到样本库中。例如有学者在说明疫学因果关系论时,例举如下案件:医院院长李某没有对到院检查的赵某某采取合适措施,导致与实患“非典”的赵某某有过密切接触的200多人中有16人患有“非 典”[19](96)。虽然学者举出赵某某接触的人群(即暴露人群)与非暴露人群的相对危险度(RR)高达4000,但正如案例本身所述,密切接触的200多人中,有28人曾经与其他“非典”病人接触,也可能16人是被其他“非典”病人传染,这样得出的RR值其可信度值得怀疑。另一方面,对信息的可靠性分析。应避免将不确定的对象纳入到样本库中。由于公害罪案件时间跨度长,一些受害人可能不记得确切的时间段确切的食物来源和数量,这会导致信息本身的不可靠,不利于条件关系的判断。

参考文献:

[1] 陈光中, 徐静村. 刑事诉讼法学[M]. 北京: 中国政法大学出版社, 2000.

[2] 沈达明. 英美证据法[M]. 北京: 中信出版社, 1996.

[3] 卞建林. 刑事证明理论[M]. 北京: 中国人民公安大学出版社, 2004.

[4] 福田平, 大塚仁. 企业的公害罪和刑事责任[J]. 环球法律评论, 1993(3): 104.

[5] 大谷实. 刑法总论[M]. 黎宏译. 北京: 法律出版社, 2003.

[6] 大塚仁. 刑法概说(总论)[M]. 冯军译. 北京: 中国人民大学出版社, 2003.

[7] 汉斯·海因里希·耶赛克,托马斯·魏根特. 德国刑法教科书(总论)[M]. 徐久生译.北京: 中国法制出版社, 2001.

[8] 张明楷. 外国刑法纲要[M]. 北京: 清华大学出版社, 1999.

[9] 储槐植. 美国刑法[M]. 北京: 北京大学出版社, 2005.

[10] E·博登海默. 法理学:法律哲学与法律方法[M]. 北京: 中国政法大学出版社, 1999.

[11] 杜里奥·帕多瓦尼. 意大利刑法学原理[M]. 林译. 北京: 法律出版社, 1998.

[12] 王炳顺. 医学统计学及SAS应用(修订版)[M]. 上海: 上海交通大学出版社, 2009.

[13] 黄永. 刑事证明责任概念的比较法分析[J]. 政治与法律, 2003(6): 107.

[14] 时延安,阴建峰. 过失破坏环境资源犯罪之比较研究[J]. 浙江社会科学, 2003(1): 106.

[15] 张梓太. 论公害罪[J]. 南京大学学报(哲学人文社会科学), 1999(4): 144.

[16] 陈航. 公害犯罪若干问题研究[J]. 甘肃政法学院学报, 2001(6): 18.

[17] 雷毅雄. 医学统计与流行病学方法[M]. 广东: 广东科技出版社, 2006.

[18] 徐飙. 流行病学原理[M]. 上海: 复旦大学出版社, 2009.

[19] 庄劲. 从一起案例看传染病犯罪因果关系的司法认定[J]. 中国刑事法杂志, 2003(6): 96.

The Rationality and Restraint of Application of the Theory of Causation

Based on Epidemiology in Crimes of Food Safety

ZUO Xiuyang, LUO Tingting

(Beijing Academy of Social Sciences, Beijing, 100101, China;

Procuratorate of Jiangnan District of Nanning City of Guangxi Province, Nanning Guangxi, 530031, China)

Abstract: The nature of crimes of food safety determines the need of application of the theory of causation based on epidemiology. The rationality of the theory lies in the fact of its high standard of proof and the balance between justification and utility. It is critical to notice issues such as scope of application, burden of proof, accuracy and validity requirements of proof.

Key Words: causation based on epidemiology; utility of law justification of law; crimes of food safety; condition of restraint

篇3

电子商务企业资信评估是以独立经营企业或经济主体为对象,神经网络技术可实现非线性关系的隐式表达,扬弃了预测函数的变量是线性和互相独立的假设,信用评级时不用确定各因素的权重且可以处理各指标之间的非线性相关性。文中将基于BP神经网络用于电子商务企业资信评估,建立了企业资信的神经网络评估模型,通过对原始数据的训练,进行自学习、自组织,最终得到评价结果,避免了人为判断的主观性过大。

一、电子商务企业资信影响因素选择

电子商务企业资信度评价即企业评级,以独立经营的电子商务企业或经济主体为对象,是对其在一般性的商业交往、投资合作及信贷活动中的信用评价。实际上就是对电子商务企业及经济主体的生产、经营、管理前景及经济效益状况所进行的全而考察与综合评价。文中将企业资信等级分为优、良、中、差四个等级。影响电子商务企业资信的因素很多,在对诸多学者研究的基础上,结合有关文献选取了如下12个财务指标:

二、神经网络结构设计

电子商务企业资信评估是一个模式识别问题,神经网络的目标是根据企业财务情况给出准确的信用等级。神经网络模型的建立关键是要确定网络的拓扑结构、输入结点、输出结点和层数。根据Kolmogoro、定理,三层BP网络充分学习后能逼近任何函数,因此构建三层结构的BP神经网络。由于输入向量包含12项指标,故输入层应包含12个结点。隐含结点数的确定有很多经验法则,根据Kolmogoro定理,取2n+ 1个的隐含层结点数,其中n为输入层的结点个数。因此这里隐含层结点数为25个。文中将企业资信等级分别对应一个分值,优取值4,良取值3,中取值2,差取值1。因此,输出层包含1个结点,输出资信得分。

三、实验分析

采用MAT LAB 2012b软件及其神经网络工具箱建立、训练并测试神经网络。样本数据来源于实际上市公司的财务数据,其中80例用于训练网络,5例用于测试。在评价电子商务企业资信的12个指标中,不同的指标从不同的角度对企业资信进行评估,指标之间无法比较,为了便于最终评价值的确定,需要对各个指标进行无量纲化处理;同时,由于评价中所使用的各项指标之间数值相差很大,不能直接进行比较。为使各指标在整个系统中具有可比性,必须对各指标进行标准化处理。文中在训练前对数据用M at lab中的prestd函数进行归一化处理,使其具有零均值与单位方差,鉴于篇幅的局限性删减了训练样本表。

利用实现BP算法的traingd函数对网络进行训练,2857步后网络误差平方和mse达到了误差标准目标1e- 008的要求。至此,电子商务企业资信评估的神经网络评价模型已经构建完成,在应用过程中,只需输入测试样本的指标数据,便可以进行测试。

文中将BP神经网络用于企业资信评估

通过实验表明,该方法可行且具有较高的精度,评估结果可作为靠的参考依据。其中预测值和实测值还是有一定误差,主要是因为资料数据收集的有限没有足够多的练样本,致使网络还没有得到充分的学习局限性。相信有了足够多的样本后基于BP神经网络的企业资信护估能达到更好的精确性。实验结果同时表明,该方法稳定、快捷,评价结果有效、可靠,对电子商务企业资信评估有养良好的性能。

参考文献:

[1]胡珑瑛,蒋樟生.基于BP神经网络的创新型企业评价研究[J].软科学,2008(02).

友情链接