首页 公文范文 统计学的分析方法

统计学的分析方法汇编(三篇)

发布时间:2023-10-13 15:37:11

绪论:一篇引人入胜的统计学的分析方法,需要建立在充分的资料搜集和文献研究之上。搜杂志网为您汇编了三篇范文,供您参考和学习。

统计学的分析方法

篇1

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2009)33-9515-03

The Design of Medical Image Classification Based on Ensemble Leaning

LIN Xiao-jia

(Faculty of Logistic and Information Management, Fujian Ineternational Business and Economics College,Fujzhou 350006,China)

Abstract: The paper proposes a medical image classification based on ensemble leaning.The system we proposing consists of a pre-processing phase, a feature extraction phase and a building the classifier phase. On the basis research of single feature, one new method is proposed one kind of medicine image classification new method that synthesized the multi-characteristic merge and the data mining technology. This method is through the introduction of data mining in the concept of Ensemble Learning,utilizing the Ensemble learning method to classify to the single characteristic the weak sorter to carry on the iterative training.

Key words: ensemble learning;the characteristic extraction;adaboost M1;medical image classification

随着计算机医学成像技术的发展,医学影像越来越多样化,医学影像的应用也越来越广泛,与此同时大量的医学设备的应用使得医学影像的数量也越来越多,大量的影像资料使医院迷失在信息的海洋。利用数据挖掘技术可以有效的对医学图像进行组织和管理,合理有效的对其进行分类,从而使其更好的辅助日常的医学诊断和医学研究。

该文提出的方法是使用SVM分类器将整个特征空间分成诸多子空间;采用集成学习方法Adaboost方法对样本进行多次抽样,将Adaboost算法中的分类精度作为特征选择的依据,选取出少量有利于分类的特征,同时将单特征训练得到的弱分类器通过集成学习增强为强分类器。

1 系统的构成

整个系统的构成如图1所示。

该系统主要包括训练和分类两个阶段。在医学图像训练阶段,通过数据库建立训练集,对医学图像进行预处理,提取图像颜色和纹理特征,创建训练的弱分类器。对图像特征进行选择。分类阶段进行的是待分类图像的选择特征的提取,利用训练得到的强分类器进行分类,输出分类结果。

2 图像预处理

由于实际的医学图像数据因为操作的原因,存在不完整性、噪声和不一致性性,不能直接在原始数据上进行数据提取,因此必须对医学图像进行预处理。数据清洗和数据的变换[1-2]都是经常用于图像数据预处理技术上的。

图像预处理的第一步就是图像去噪。大部分的医学图像一般包含了大量有噪声的背景:有的医学图像太暗,有的医学图案太亮,还有来自影像设备中电子元器件的随即扰动。通过去噪处理后,可以去掉图像中的大多数的背景信息和噪声,增强图像的特征,提高图像的信噪比。针对医学图像来说,图像本身有边缘模糊的特性,通过去噪对医学图像进行复原,使之与原图像逼近是存在比较大的困难的。因此本系统主要采取的去噪方法为滤波技术,该技术可以在最大限度保持信号不受损失的基础上,尽可能过滤噪声,提高图像的可读性,将医学图像中感兴趣的特征(图像的轮廓和边缘等重要信息)有选择的突出。

图像预处理的第二步是图像归一化,基于图像特征分类主要是对图像特征进行匹配和区分的过程,但是通常情况下待检图像的图库中,图像的大小尺寸并不完全相同,用户所提供的分类例图大小也不完全一样的。在提取图像特征(特别是空间分布特征)时,就有可能存在本身同类的图像所计算出来的特征差别却很大,而不属于同一类的图像由于尺度不同却计算出了相似的特征,进而影响到分类的结果。为了防止这类情况的发生,本分类系统必须首先对图像的尺度进行归一化,即通过对图像的缩放使得图像具有同一尺度256×256,在同一尺度上提取图像特征,从而消除尺度影响,又能够保证图像的整体灰度不变性。通过对大尺度的图像进行尺度归一化之后,按比例进行了缩小,降低了图像特征提取时的计算量,提高了分类速度。

3 基于集成学习方法的特征选择和分类

3.1 集成学习方法

集成学习(Ensemble Learning)是一种新的用来组合的学习器的方法。其主要思想[3]是:通过某种组合方法把一些学习器组合起来,使得集成后的学习器能够表现出比单个学习器更好的性能。狭义的说,集成学习是指利用多个同质的学习器对同一个问题进行学习,这里的“同质”是指所使用的学习器属于同一种类型,例如所有的学习器都是决策树、都是神经网络等等。广义的来说,只要是使用多个学习器来解决问题,就是集成学习[4]。

集成学习从萌芽阶段发展到现在,很多研究者提出了不同的算法。其中研究最深入,最具影响力,应用最广泛的就要算Boosting算法了。在众多Boosting算法中,AdaBoost是Boosting家族中的基础算法,也是Boosting家族最具代表性的算法,之后出现的Boosting家族中的扩展算法都是在AdaBoost算法的基础上发展而来的,对AdaBoost的分析也适用于其它的Boosting方法。因此下面我们以AdaBoost M1算法为例,进行描述。

AdaBoost M1算法用于解决多类单标签问题。每个待分类样本只能属于多个类别中的单个类。AdaBoost M1的基本思想是:首先给定任意一个弱学习算法和训练集(x1,y1),(x2,y2),…,(xm,ym),yi在分类问题中是一个带类别标志的集合,yi∈Y={1,…,K}。初始化的时候,对每个训练例赋予的权重都相同为1/m。接着,调用弱学习算法对训练集进行T次的迭代训练,每次训练后,按照训练结果更新训练集上的分布,对于训练失败的训练示例赋予教大的权重,也就是在下一次迭代训练的时候,更加关注集中对这些失败的训练例进行训练。通过这样的T次迭代训练,得到一个预测函数序列h1,h2,…,ht,其中ht也有一个权重,预测效果好的预测函数的权重较大,预测效果差的预测函数的权重较小。经过T次迭带后的最终预测函数H采用有权重的投票方式产生。

3.2 特征选择和分类

本系统利用训练样本的分类属性,采用Adaboost M1算法同时,对算法进行改进,使算法同时具有进行特征分类性能的评价(特征选择)和SVM分类器的增强的功能:对样本进行多次抽样,将分类精度作为特征对分类性能的判定依据,进行有效特征选择,选取出少量对分类作用较大的特征,同时将单特征训练得到的弱分类器增强为强分类器,使分类器具有较好的分类精度和泛化能力。具体算法思想如下:

1) 在Adaboost M1算法每次迭带训练时候,赋予每个训练例的分配权重 Dt(i)(t表示迭代次数,i表示训练例标号),同时也表明它被分类器选入新训练子集的概率。如果某个样本已经被准确的分类,那么在构造下一个训练集中,它所占的比重概率就会被降低;反之,如果某个样本没有被正确分类,那么它所占的比重就会得到提高。通过这样的方式,Adaboost M1算法就能更加重视那些较困难、更富信息的样本上。

2) 针对Adaboost M1这个特点,我们在选入的训练集上,选择SVM作为弱学习机,针对每个特征维向量进行训练,产生弱分类器,并且计算分类精度,用来衡量该弱分类器对分类的作用程度,精度大的弱分类器表明该特征维向量的分类性能较好,有利于作为有效的分类特征,被选入作为分类特征,经过多次迭代可以得到大部分对分类作用较高的特征,最终增强得到一个强分类器。

改进的Adaboost M1进行特征选择以及SVM分类器增强的算法步骤如下:

输入:训练集 (x1,y1),(x2,y2), …,(xm,ym) ,其中标签yi ∈Y={1, …,k}

特征维向量集{S}

弱学习算法SVM

迭带训练的次数T

初始化:对于i=1,2,…,D1(i)=1/m, Do For t=1,2,…,T //其中T为迭代训练的次数,m为训练样本数。

步骤1 弱分类器学习

根据选择权重Dt(i)进行采样,获得第t次迭代样本集,选取特征子集,学习重采样后的样本集得到弱分类器集合Hrt ,其中Srt是特征子集集合,表示第t次迭代的每个特征维度;Srt是弱分类器集合,是根据Hrt单特征训练出的弱分类规则,r表示特征维度标签号,t表示迭代次数。

步骤2 计算分类精度,选择特征

计算弱分类器在样本集上的误差 在此作为特征子集Srt 有效性的判据,误差越小则此特征子集作用越大,选取误差最小(εt=min{εrt})的对应的分类器为Ht与有效特征向量Srt计算本次迭代得到的分类器贡献权值βt=εt/(1-εt)。

步骤3 更新权重

其中,βt为每次迭代的分类器贡献权值,值由βt=εt/(1-εt)来确定;Dt(i)为每个训练例的分配权重,Zt为标准化常量。

输出:有效特征子集Sr

增强分类器

通过改进的Adaboost M1算法可以得到所选择的特征子集Sr以及增强的分类器Hx。

分类时,只要将待分类医学图像根据有效特征子集Sr进行特征提取,输入增强的分类器集 Hx中,就可得到分类的结果。

4 实验结果及结论

本实验所采用的是医学图像中的CT、MRI和DDR图像,根据医学图像的功能和用途,我们将这些医学图像分为头部(包括中枢神经和头颈五官)、胸部(包括呼吸系统、循环系统)、腹部(包括消化系统)、骨盆(包括泌尿系统)和其他等五大类标签,每类标签60幅(由于CT应用比较广泛,所以选用CT图像40幅,MRI和DDR各20幅),共计300幅图像构成图像库。在测试集和训练集的选择上,采用10折交叉验证的方法。通过训练集最终选取了36维特征向量中的分类性能较高的12维(详细如表1所示)。

分类性能采用敏感度(sensitivity)、特异度(specificity)以及分类精度(precision)三个指标率来衡量:敏感度也称真正识别率,即正确识别该类元组的百分比;特异度是真负率,即正确拒绝不属于该类元组的百分比;而精度就来标记实际属于该类的元组在已分配到该类的元组总数的百分比,表2是本实验的分类结果。

从表2中可以看出,本实验医学图像分类器算法的敏感度、特异性和分类精度都较高,分类识别率和精度平均在83%左右。

分类系统的速度主要取决于特征的提取以及进行分类的运算量。如果将所有特征都运用于分类的话,由于有些特征向量维度对分类贡献不高,对分类效率没有明显的提高,并且也大大增加了特征提取阶段的时间负担。在本系统中仅仅选择了不到1/3的特征,去除了部分对分类效率贡献不高的特征,因此在特征提取阶段速度大大提高了,而且在分类阶段也因为只在有效特征中进行提取分类,速度也有较大提高,表3列出了在 Inter Core Duo processor T2450 2.0GHz、1G DDR内存、VC++6.0环境下本分类系统与其他分类平均分类精度的比较。

本方法比最常见的综合特征分类法在特征提取分类阶段速度上有所提高,但是比起单个特征提取,速度还是比较慢的。但是从表3正确率相比,准确率还是蛮高的,相对的牺牲时间还是值得的。

参考文献:

[1] Maria-Luiza Antonie,Osmar R.Z aiane and Alexandru Coman,Application of Data Mining Techniques for Medical Image[C],Proceedings of the second international workshop on Multimedia Data Mining(MDM/KDD’2001),in conjunction with ACM SIGKDD conference.

[2] Osmar R.Z aiane,Maria-Luiza Antonie and Alexandru Coman,Mammography Classification by Association Rule-based Clasifier[C], MDM/KDD2002:International Workshop on Multimedia Data Mining(with ACM SIGKDD 2002).

[3] Zhou Z-H,Wu J-X,Tang W,Chen bining regression estimators:GA-based selective neural network ensemble.International Joural of Computational Intelligence and Applications,2001,1(4):341-356.

[4] Zhou Z-H,Wu J-X,Tang W.Ensembling neural networks:many could be better than all.Artificial Intelligence,2002,137(1-2):239-263

篇2

仪器:Sysmex XS-1000i全自动血液分析仪,试剂为原厂配套试剂,抗凝管,严格按操作规程操作。

2011年3~10月收治患者343例,男189例,女154例,年龄2~12岁。儿童健康体检标本各2份,1份用EDTA-2K抗凝真空采血管采集静脉血2ml混匀;另1份用EDTA-2K干粉式“子弹头”抗凝管采集手指末梢血60μl,混匀静置10分钟,同1人标本静脉血、末梢血标本先后依此用血液分析仪进行测定。

结果

静脉血、末梢血标本先后依此用血液分析仪进行测定结果,P<0.05。

讨论

在排除仪器、试剂、抗凝剂、疾病、药物等因素的影响下,从表中数据可以看出,末梢血标本PLT普遍比静脉血PLT偏高,究其原因,主要有如下几点:首先,将血液与抗凝剂混匀时,因末梢血采样量少,抗凝剂为固态干粉状,混匀时需要用较大力度进行,导致血细胞产生裂解破坏,形成白细胞碎片、红细胞碎片、脂类和蛋白的聚集体等和血小板相类似颗粒,血液分析仪计数PLT时将以上颗粒误计为PLT,导致血小板计数假性偏高[1]。其次,因儿童末梢循环相对较差,可能使采样不顺,采样时间延长和过力挤压,易发生血管内溶血,使红细胞破坏过多,血细胞分析仪计数PLT时,误将红细胞碎片以为是PLT而计入,造成测定结果假性增高。再者,由于“子弹头”抗凝管采样量少,易出现血样与抗凝剂比例不匹配,抗凝剂颗粒溶解不完全形成与PLT大小相似颗粒而被误计为PLT。同时,若上一例样品计数偏高,可能因冲洗不彻底而影响下例样品的PLT计数的准确性,造成PLT假性升高[2]。此外,仪器液路的定期维护清洗也至关重要,计数管路的不清洁会造成血小板数量明显的升高。

对这些因素了解后,在操作中就可以做到心中有数。遇到有问题的标本、有问题的结果,要认真进行分析,要使发出的检验报告能真实地反映客观实际,保证检验结果的准确性。

参考文献

1王建中,屈晨雪.3种流式细胞术计数血小板方法的比较研究.中华检验医学杂志,2003,26(1):12.

2肖景珠,赵慧斌,李峰,等.血细胞分析仪计数PLT的影响因素分析.临床检验杂志,1998,16(5):309.

表1血液分析仪测定结果

样本PLT均值(×109/L)PLT最大值(×109/L)PLT最小值(×109/L)计数结果超参考范围例数计数结果超参考范围比例数343例静脉抗凝血196.5431912861.75%343例末梢抗凝血241.624761947521.87%注:男女性别间无显著差异。的主要病因,而NGU发病率在我国性传播疾病中所占比例居高不下,且临床盲目用药使其耐药率逐年增高。本组分析3年来解脲支原体的阳性率与文献报道的结果接近[3],呈上升趋势。近年来对支原体感染敏感抗生素的报道各不相同。有资料显示[4],美满霉素、阿奇霉素、司帕沙星的敏感率分别为74%、512%和197%。而徐柏等[5]报道,对解脲支原体感染最敏感的是强力霉素和美满霉素;而耐药率最高的是罗红霉素和环丙沙星,分别为778%和80%。本组资料中,壮观霉素、环丙沙星、氧氟沙星3年的耐药率极高;而司帕沙星、强力霉素、交沙霉素、克拉霉素等耐药率每年呈下降趋势,强力霉素、交沙霉素和克拉霉素的敏感率每年呈上升趋势,到2010年分别达932%、988%和80%,因此临床治疗解脲支原体应首选强力霉素、交沙霉素和克拉霉素。

目前抗菌素的滥用现象很普遍,所以临床医生要尽量避免经验用药,应根据培养鉴定药敏结果用药,减少和防止耐药菌株的产生和传播,从而提高疗效和治愈率。近年来临床上出现环丙沙星和氧氟沙星的滥用,已使解脲支原体对其产生了较高的耐药性,其敏感率仅为24%和141%。因此临床上要尽量避免使用,以提高疗效。总之,做解脲支原体培养鉴定药敏对临床用药具有重要指导意义。

参考文献

1刘运德,楼永良.微生物学检验[M].第2版.北京:人民卫生出版社,2002:333.

2戴金华,叶玉琼,王邦勇.荧光定量PCR检测沙眼衣原体解脲支原体生殖道感染临床分析[J].实用预防医学,2004,11(6):1289.

篇3

血气分析是指溶解于血液中的全体成份(O2,CO2,N2等)的分压和含量的测定,主要测定血液中的氧分压,二氧化碳分压,血氧饱和度等。通常同时测定酸碱平衡的有关指标。通过血气分析,能对患者的通气功能,换气功能以及缺氧和二氧化炭潴留情况及机体的酸碱状态,电解质紊乱的程度有一个较全面的了解。

血气分析的测定,已被广泛应用于临床各科,特别是在危重患者抢救中占重要地位。它有助于了解病情、鉴别诊断、观察疗效和估计预后。血气分析标本的采集是临床护理工作中比较常规而重要的操作,熟练的穿刺技术是标本准确监测结果的保证[1]。笔者将2014年1月~8月我院患者分为三组,分别经桡动脉,足背动脉,股动脉采血,进行比较,现报告如下。

1资料与方法

1.1一般资料 2014年1月~8月需采集血气分析标本的患者403例,其中男性204例,女性199例,年龄18~98岁,平均年龄67岁,三组患者在年龄,病种,性别方面无统计学意义,具有可比性。

1.2方法

1.2.1桡动脉采血法 操作者穿戴整齐,洗手,戴口罩,准备用物(皮肤消毒剂,1.5~2.5 ml的注射器一副,抽吸少量的肝素钠抗凝剂湿润针筒壁后排气备用,橡胶塞,棉签,并备一小枕和一个沙袋)。向患者说明穿刺的目的,消除患者紧张情绪,取得患者的配合。患者取坐位,半坐位,平卧位均可,采取血标本的上肢外展放松,手掌自然外展平放,腕关节下垫一小枕,手心朝上,绷紧穿刺部位的皮肤,在前臂掌侧腕关节上2 cm,动脉搏动明显处为进针点。操作者消毒患者穿刺部位的皮肤和操作者左手食指和中指,用已消毒的手指触摸桡动脉搏动的准确位置,使动脉恰在手指的下方,右手持注射器在动脉搏动处以20°~30°角进针,进针至有鲜红色血液流出证实针头在血管内,抽取所需的血量后拔出针头,立即将针头斜面刺入软木塞或橡胶塞以隔绝空气,并轻轻搓动注射器,使血液与肝素混匀,防止空气进入注射器影响检验结果。用干棉签或无菌纱布按压穿刺部位5~10 min后跟踪穿刺点是否肿胀,淤青。

1.2.2足背动脉采血法 操作者穿戴整齐,洗手,戴口罩,准备用物(皮肤消毒剂,1.5~2.5 ml的注射器一副,抽吸少量的肝素钠抗凝剂湿韵针筒壁后排气备用,橡胶塞,棉签,并备1小枕和1个沙袋)。向患者说明穿刺的目的,消除患者紧张情绪,取得患者的配合。患者取坐位或平卧位,将患者脚掌自然下压,使足背绷紧,足背动脉的搏动点最明显处一般在足背内、外踝连线的中点,操作者消毒患者穿刺部位的皮肤和操作者左手食指和中指,用已消毒的手指触摸足背动脉搏动的准确位置,摸到动脉搏动最强点,使针头与皮肤呈20°~30°角进针,见回血后固定针栓,抽取所需的血量后拔针,立即将针头斜面刺入橡胶塞以隔绝空气,并轻轻搓动注射器,使血液与肝素混匀,防止空气进入注射器影响检验结果。用干棉签或无菌纱布按压穿刺部位5~10 min后跟踪穿刺点是否肿胀,淤青。

1.2.3股动脉采血法 操作者穿戴整齐,洗手,戴口罩,准备用物(皮肤消毒剂,1.5~2.5 ml的注射器1副,抽吸少量的肝素钠抗凝剂湿润针筒壁后排气备用,橡胶塞,棉签,并备1小枕和1个沙袋)。向患者说明穿刺的目的,消除患者紧张情绪,取得患者的配合。患者取平卧位,穿刺侧大腿外展,股动脉搏动点一般在髂前上棘与耻骨结节体表连线的中点,以搏动明显处为穿刺点。操作者消毒患者穿刺部位的皮肤和操作者左手食指和中指,用已消毒的手指触摸股动脉搏动的准确位置,在搏动最明显处垂直进针或45°进针,见回血后停止进针,固定针栓,抽取所需的血量后拔针,立即将针头斜面刺入软木塞或橡胶塞以隔绝空气,并轻轻搓动注射器,使血液与肝素混匀,防止空气进入注射器影响检验结果。用干棉签或无菌纱布按压穿刺部位5~10 min后跟踪穿刺点是否肿胀,淤青。

2结果

3种采血方法的比较,见表1。

3讨论

三种采血方法的比较情况如下。

3.1经足背动脉采血 足背动脉位置表浅,较桡动脉皮下脂肪分布少,周围软组织少,采血时患者疼痛较桡动脉和股动脉敏感,患者的依从性小,部分患者足背动脉搏动细数,弹性不好易滑动。还有部分危重患者下肢循环不好时,搏动难以触及,一次穿刺成功的几率小。

3.2 经股动脉穿刺 患者需平卧,如哮喘,过度肥胖患者,不能平卧,给操作者带来困难,对于肢体活动度不好的患者,股动脉不容易外展时,不能很好的选择操作部位,因此影响穿刺成功率[2]。还有股动脉位置较深,周围神经血管比较丰富,而且解剖位置复杂,管径较粗,血流量大,穿刺后需要按压较长时间才能止血,如果压迫不当就会引起穿刺部位淤青或血肿[3]。且发生血肿或淤青后不易被发现。穿刺时暴露患者较多,冬天患者容易着凉感冒,清醒患者暴露隐私部位对患者造成一定的心理影响。使患者的依从性小。股动脉与股静脉并行,穿刺时很容易误入静脉,且容易损伤股神经。

3.3经桡动脉采血 经桡动脉采血时只需暴露患者前臂, 因为手本身暴露在外面,患者容易接受,依从性好。桡动脉采血时患者无需穿脱衣服,减少了患者穿脱衣服的麻烦,护士操作比较方便。手部因为经常清洗,手腕部比较清洁,相对带菌比其他部位少,减小了侵入性操作的感染机会。桡动脉表浅,易于触摸,搏动明显,定位简单。采集标本不受的限制,穿刺安全,不易形成血肿,穿刺成功率高,易于止血,且随时可以观察穿刺部位的情况。桡动脉附近无重要的血管和神经,迷走神经分布少,不易发生血管和神经损伤[4]。

综上所述,桡动脉采血比足背动脉采血和股动脉采血不良反应小,穿刺后按压的时间短,操作简便,穿刺成功率高,患者的依从性高,对患者的要求不高,是值得推广的采血部位。

参考文献:

[1]林玉清,张云峰,汪克林.桡动脉与股动脉血气分析标本采集方式和结果的临床比较[J].现代医院,2010,2(2):99-100.

友情链接