发布时间:2024-03-12 16:17:42
绪论:一篇引人入胜的档案归纳方法,需要建立在充分的资料搜集和文献研究之上。搜杂志网为您汇编了三篇范文,供您参考和学习。

数据挖掘技术是指以计算机系统为平台,对系统中的大量随机数据进行分析、整理,从而提取出对商业发展有用的数据。既提高了企业档案信息管理工作的质量与效率,又完善了信息化整合机制,对基本数据进行深入、差异化分析,为下一步工作奠定了坚实的基础。
1数据挖掘技术的实际应用
当前社会,计算机信息技术在各行各业应用十分广泛,并且受到了社会各界的高度肯定和认可。以数据挖掘技术为例,在档案信息管理工作中该技术发挥了较大的优势,较好的完善了现有档案工作中的不足与问题,应用计算机平台可以在保证信息安全的基础上,做到了资源信息优化管理,提炼出有意义的数据;在医疗档案管理上,计算机平台可以自主分析档案的基本情况,医生在就诊时需,要利用计算机平台对患者进行档案记录,以建立完善的档案管理系统;对档案信息管理而言,数据循环需要通过计算机对目标进行不断的循环处理,以达到信息、筛选提取的目的。计算机数据挖掘技术以数学方法为主,在一定条件下,工作人员通过计算机用一种具有高度概括性和逻辑性的语言,将事物的状态过程关系表达出来。同时,在实际运算过程中,还会涉及演绎法和归纳法,以保证所收集数据的准确性,并且符合信息管理领域的基本原则。
2数据挖掘技术的形式
数据挖掘技术所包含的知识十分广阔,包括机器学知识、统计学知识、人工智能等相关技能,进一步通过计算机平台对企业数据库内的数据进行自动化分析,并且总结出潜在规律,以辅助工作人员做出合理的决策。针对计算机数据挖掘技术的类型,本了以下三点分析:
2.1过程与分类
2.1.1基本过程系统在运行之前需要根据实际解决的问题,合理安排任务,以明确挖掘目标和基本程序,基本分为三个阶段:准备阶段、挖掘阶段、解释和评价筛选阶段。首先,企业所提供的无序数据库具有随机性、模糊性,系统需要自主筛选并删除其中重复的数据,根据得到的规律与异常原因做进一步筛选,最终选择对应的方法清理数据。其次,对于所收集的数据系统,可以通过物理或者逻辑的方法分析其特点,并根据系统、软件等差异性完成数据收集工作。最后,根据数据源自身的特点,系统筛选数据的方法是多种多样的,包括线性分析、非线性分析、聚类分析等方法,再利用数学知识与统计学对其进行分析,挖掘内在联系,找出隐藏的规律。数据处理的最终目的是帮助企业找到有价值的数据信息,并且应用到实际生产中,每次技术分析所得到的数据结果,不一定一四到位,需要工作人员对数据源进行反复甄别、提取,直到得到满意的结果为止。并且数据处理的过程是十分复杂的,工作人员需保证每一步操作的结果,满足预期要求,在此基础上进行下一步操作,以获得有价值的档案信息资源。
2.1.2分类传统的数据挖掘技术,在操作过程中存在一定的不足与问题,因此需要不断发展融合新的知识和元素,以为用户提供最实用简单的数据归类方法。首先,计算机系统需要对数据库内庞大的信息源进行甄别、分析,并将其按不同的属性进行分类、处理、划分。在此基础上,对所得数据进行处理、划分、测试,对满足要求达到指定目标的数据进行下一步分类。
2.2相关规则
相关规则是计算机数据挖掘技术运行的基本原则,不仅要准确描述出系统中相关数据,而且要利用数学归纳法对所得的信息进行针对性分析,以用数学的语言描述出相同属性的事物状态、过程与关系。相关规则可以加大系统处理庞大数据库的效率,利用有效的记录方式,降低数据占用空间,进而分析总结出对企业发展有益的规律与信息。
2.3粗糙集
在数据挖掘技术中,粗糙集具有重要的意义和作用,是数据挖掘的最实用方法,是用来专门研究不具有稳定性的数据源的基本工具,不仅运算方法简洁,而且无须知晓额外信息,可操作性强。
3数据挖掘技术在档案管理中应用的可行性
传统的档案管理水平已经不能满足时展的需求,需在技术上不断创新,以提高档案服务水平、效率与质量。因此,现代档案管理系统结合计算机挖掘技术,既节省了人力资源,又提取了海量数据源中的实质信息,实现了网络化、数字化的无缝对接。数据挖掘技术并不仅仅是一种信息处理技术,还可以使档案信息更加科学化、合理化,提高了在档案应用中的可行性。
4计算机挖掘技术在档案信息管理系统中的应用意义
档案信息资源在我们的生活中具有重要的地位,不仅涉及个人信息,还包括了历史奖励问题、处罚问题,根据内容不同,密级等级也不同。当前档案信息管理系统充分发挥计算机挖掘技术的优势,从根本上提高了服务管理水平,优化了档案管理模式,为档案的收集、整理、归纳提供了一定的便利。本文就挖掘技术在档案信息管理系统中的应用做了以下四点分析:
4.1提高了档案信息的安全性
档案信息所包含的信息源不仅复杂,而且内容含量大,是对过去信息的分类、总结性记录,是十分珍贵的文字资源。一方面这些资源为人们的工作、学习提供了专业的信息,需要尽可能长久保存,然而在实际使用储存过程中,由于计算机系统或者人为因素造成了一定的信息损失。另一方面,档案信息的资源牵涉广泛,包括人员的教育背景、生活背景、工作背景,所接受奖励情况、惩罚情况等等,是需要机密保存的,如果在档案借阅过程中监督不到位,会造成信息泄露,而数据挖掘技术可以协助档案信息管理系统统计档案的借阅次数与内容,从而监督不恰当的借阅行为,并且统计分析恶意损害、利用档案的情况,提高档案的保密程度与安全性。
4.2提高了档案信息的使用效率
档案内容不仅信息量大,而且所涉及的领域也十分复杂,大多带有一定密级的,在借阅过程中需要严格遵守相关规定,以保障档案信息的安全。随着时代的发展,国家也在一定程度上降低了档案借阅的标准,提高了档案信息的可利用性。但是在实际操作过程中,档案借阅行为依然在法律法规的调控范围内,实际借阅效率并不是很高。利用数据挖掘技术,档案信息管理系统可以通过计算机平台与借阅者进行沟通,了解其需求的基础上,建立双向档案供需渠道,既提高了档案部门的服务水平,提升了档案信息利用效率,又保证了档案信息在就业过程中的安全性,从而发挥了答案信息的最宝贵价值。
4.3为档案鉴定工作提供了便利
档案鉴定工作是档案管理系统中难度系数最高的一道流程。在传统的档案管理系统中,档案鉴定需要人为操作,受有个人能力与客观因素的影响,容易受到人为失误的影响,造成档案资源的浪费,甚至某些有价值的档案信息,也会由于人为偷的失误未被保存下来。此时利用计算机数据挖掘技术的优势,可以从庞大的数据源中筛选、分析、比对出完整、清晰、有潜在价值的信息,已被系统提供有力的支撑依据,防止档案信息丢失。其次,计算机系统可以弥补人为失误与疏忽,在广泛模糊的信息数据源中,挖掘出有一定规律的实质信息,从而保护有关人员的隐私,对借阅者提供有针对性的帮助。
4.4降低档案鉴定工作成本
档案鉴定是档案工作中的一项重要内容,贯穿档案工作的每一个环节,通过档案鉴定对已知内容信息的作用与用途进行研究,有价值的会交给档案馆永久保存,没有价值的会被送进销毁炉进行档案的销毁。因此,相关部门应加强工作人员的责任心,通过行政监督指导,引导档案鉴定人员高效、高质地开展归档、保管、利用、统计等工作。通过计算机数据挖掘技术,可以有效降低档案鉴定的工作成本,通过科学合理的筛选,保证答案的真实程度。利用计算机系统的信息分析能力,对海量信息资源进行量化处理,从而为鉴定、归纳等环节提供基本依据。除此之外,计算机系统在实际运行过程中,可以针对信息资源进行管理维护,保障筛选工作的有效进行,避免出现档案信息丢失等人为失误。
5数据挖掘技术在档案管理中的详细运用
数据挖掘技术在20世纪80年代就已经被开发利用,并逐渐应用于各个领域,但在档案信息管理中还处于实验阶段,实际运用主要体现在以下三点:
5.1档案信息的收集
档案管理工作的第一步是对信息资源的收集,进而利用数据挖掘技术以数学角度分析数据的类型、属性,最终获得准确的模型。对海量数据资源进行分类是信息收集的第一步,也是档案管理工作的基础。比如,档案管理员利用计算机平台向借阅者问卷调查,并将所得结果整理、归纳,录入数据库中。档案管理平台通过借阅者提供的数据信息对其档案需求进行分析,提供针对性较强的信息,提高数据管理的个性化服务性能。
5.2档案的分类与预测
数据挖掘技术,将整个区域划分为不同的工作流程类别,进而按照挖掘系数与信息属性进行分类和分析。提供一组不同属性的数据,通过筛选将其分成良好的训练集,建立模型,帮助用户利用计算机系统提取最原始的查询信息,从而总结出用户的特征。比如,借阅者利用网络平台对档案类别进行查询,档案信息管理系统可以通过用户访问网页的情况,了解用户的需求,进而推测出用户的特征和喜好,包括搜索内容、停留时间、访问次数等。
5.3档案信息的整合
(一)传统思维方式即寻找问题原因的思维方式。寻找问题原因的思维指的是当你在日常生活过程中发现一个问题是,追根溯源,找到问题出现的原因,问题是如何产生的。这种思维方式并不适合于当档案管理工作在实际工作过程中出现问题,并对这些问题加以解决。而在档案信息的开发过程中,一旦遇到与档案有着密切关系的问题时,需要将解决问题作为自己思考的一个关键的出发点,而不是追本溯源追寻问题出现的原因。而如何解决这些问题的思维模式则是需要在问题出现时,需要去寻找解决问题的方法,而不是一味地寻找问题出现的原因。所以,笔者认为这种思维更适合在档案信息开发的实际过程中遇到的各种实际的问题,这是一种更为高效的解决问题的思维。
(二)思维方式转变的重要性。档案工作人员在实际的档案管理工作过程中,如何解决问题是他们需要首先需要做的,而不是一味的询问为什么。所以,当档案工作人员在档案专业基础知识的学习中时,还应该注重传统思维方式的转变。
二、主观性思维朝向客观思维的转变
(一)主观性思维的简要概述。主观性思维指的是人们在接受一些必要的信息是,在接受知识时将自身的知识背景以及情感融入其中,经过自己的分析和判断继而通过推断而得出的结论。它已经将信息的原始情况进行了彻底的改变,赋予原始信息一种颠覆性的倾覆。
(二)客观性思维的简要概述。客观性思维不同于主观性思维,它是指工作人员在接触信息时,保持信息的原始面貌,不会被工作人员的主观判断所干扰,并且这些信息能够得到再次的使用和利用,因为这是一种原始性的思维。
(三)培养客观性思维的重要性。在档案管理的实际工作过程中,人们强调的是对档案信息的收集、整理、保管等各种活动中保证自身情感的隔绝以及判断标准的客观性,档案信息工作人员必须要从档案信息的实际出发,切勿将自己的任何主观情绪融入其中,保证信息的原汁原味,保证信息能够二次甚至多次的重新利用,客观的、实事求是的对信息进行运用和判断。
(四)培养客观性思维的主要途径。客观思维的培养不同于主观性思维是天生的,它需要一个漫长的过程,需要档案信息工作人员在日常的工作和生活过程中不断的对可观性思维进行锻炼,从而将其培养成为自己一种惯有的思维。档案信息工作人员在学习学习档案信息知识的过程中,就应该有意识地培养自己客观性思维,要求自己单纯的接收档案信息中字面上的内容和真实含义,而切勿深入挖掘。在掌握字面意思的前提下,在阅读档案学教材及文章中,在涉及到档案学现象的描述时,只允许自己客观的接受现象描述的字面意思,不做任何的主观猜测。在日常生活与人谈话时,需要做到只接受对方说话内容信息的字面意思及字面意思的前提,不加入已有的常识。跟对方讲话时,假装对方什么都不知道,尽量把要表达的内容说的尽量详实,齐全。
三、演绎思维与归纳思维模式的训练
(一)演绎思维与归纳思维定义。所谓演绎思维指以一个主题为中心,由这个中心主题思维层层向外辐射,思维不断深入,不断细致化,这符合人类大脑的思维模式,可以将人类的思维过程直观的呈现。而归纳思维指从部分到整体,从个别到一般的总结概括。
(二)演绎思维。与归纳思维在档案中的应用全宗内文件的分类主要是从整体到部分,从一般到个别,偏重于分析的方法,偏重于演绎法,立卷主要从部分到整体,从个别到一般,偏重于归纳法。因此,分类时要有一个整体设计方案。
1数字化档案管理元数据需求分析的内涵
在现有的国际、国内、行业等标准的基础之上,才能实现数字化档案管理元数据的需求分析,这些是针对具体的数字化档案类型、用户、业务管理流程等采用科学的方法所进行的元数据模型中元数据功能项的设置分析及对其描述的过程。这个功能的意思是要基于元数据元素、元数据模型。根据这一定义,应该明确的是,数字化档案管理元数据的需求首先是一种功能需求,需要确定需求分析的信息源并施以科学的方法。
2 数字化档案管理元数据需求分析的信息源
数字化档案管理需求分析的信息源,是以数字化档案管理元数据需求分析的信息来源范围为主要的另外包含权威性文献、数字化档案本身、用户等。
就其本身而言的话,数字化档案的分类丰富,有多媒体数字化档案、视频档案、音频档案、图像、图形档案盒数字处理档案,因此,其信息源范围可以是关于字处理档案、图像档案、图形档案、音频档案、视频档案以及多媒体数字化档案的管理元数据范围的需求分析。
针对权威性文献而言,权威性文献可以分为法规、标准、政策、规范、最佳实现及理论等,因此,其信息源的分析范围可以是国内外的有关文件管理、档案管理和数字化档案管理的法规、标准、规范、最佳实践及理论中存在着的有关对数字化档案管理元数据需求的分析。
针对用户而言,信息源的分析范围可以是对文件管理者、档案管理者、数字化档案管理者、计算机系统管理员以及数字化档案利用者所提出的分析方法。
3 数字化档案管理元数据需求的分析方法
在数字化档案管理元数据领域中,对数字化档案管理元数据进行需求分析,要采用科学的方法才能保证其分析的科学性和准确性。笔者认为,有两类方法:一类是自上而下演绎分析法;另一类是自下而上归纳分析法。
3.1自上而下演绎分析法
3.1.1文献参考法
文献参考法,以“文献”形式表述有关法规、标准、政策、规范等,以保证符合现行法律的规定,是从“文献”的抽象到具体数据元的确定的方法。主要是从所涉及文件管理的文献中概括出数字化档案元数据的需求。美国匹兹堡大学的元数据项目是运用此法的主要代表项目,该项目主要研究文件管理的中凭证要求(简称《baC项目》)。
3.1.2理论推导法
从文件管理理论出发进行归纳演绎,以层层递进的逻辑来验证数字化档案管理元数据的合理性,即是理论推导法。
目前流行的文件管理理论主要有:文件连续体理论、文件生命周期理论和文件运动理论。不论采取哪种理论作为我们的研究依据,都对数字化档案管理元数据的需求均具有一定的指导意义。
以澳大利亚元数据研究项目《教育、研究与产业合作项目》(SPIRT project)为例,他们所制定的元数据主要依据澳大利亚所独创的“文件连续体理论(records continuum thinking)”;而加拿大不列颠哥伦比亚大学研究项目《数字化档案完整性保存项目(UBC)》则依据的是文件运动理论理论。按照我国目前的档案管理相关理论,我们要采取在我国比较流行的文件生命周期理论。
3.2自下而上归纳分析法
3.2.1调查访问法
通过对文件创建人员、文件管理人员等相关的专业人员等进行跟踪访谈和数据分析,按照用户的实际需要,在大数据的基础上得出数字化档案管理元数据需求。另外用到此方法的是在跨国联合项目――文件永久性凭证性问题在电子系统里的应用(简称INTERPARPES)。
3.2.2流程实际法
按照档案实际管理的业务流程为基础,通过数字化档案在管理过程中的运动为分析的切入点进行需求分析。研究者持有这类分析方法会认为文件管理流程和元数据是分不开的,所以,要理解元数据,就要紧紧联系数字化档案管理流程实际,值得注意的是,不是传统的手工管理业务流程。
以上方法各有优劣,如文献参考法,可以从宏观上保证建立的数字化档案管理元数据具有合法性和凭证性,但建立的标准过于宽泛;理论推导法,可以保证其合理性和系统性,但建立的标准偏向理论性,实用性不强;基于用户访问法建立的标准,其实用性和操作性较好,但缺乏完整性与系统性;流程实际法,即使具有可行和运用性范围依旧被局限。所以说,数字化档案管理元数据的需求分析时,需要综合作用各类所学多种方法分析需求,而不是孤立、单一的只作用一种方法,这样做才可能满足数字化档案元数据更全面和客观的需求。
4关于数字化档案管理元数据需求分析体系模拟建构
在以上探讨数字化档案管理元数据需求分析的内涵、信息源及方法的基础上,笔者尝试模拟建构需求分析体系。
首先,根据具体行业、应用领域的目标与特点,确定数字化档案管理元数据需求分析的信息源;需求分析的信息源主要包括,文献(规范、标准)、数字化档案本身、用户、数字化档案管理业务流程等方面。其次,对需求分析信息源进行分类整理、审读,综合采用科学的方法对信息源进行分析,简练出数字化档案管理数据的需要并形成需求陈述。再次,针对各需求陈述进行元数据的提炼,将提炼到的元数据进行分类,再将具体的元数据纳入到分析框架。最后,判断元数据元素项的设置,形成数字化档案管理元数据体系模型。
参考文献: