Logo 热线
2024年面授班
2024年档案培训面授班 2024年档案培训就业班 24年档案高级研修班 2024年档案修裱班
2024年网络班
2024年档案人员岗位培训(直播) 2024年档案人才培养高研班(直播) 2024年档案职称辅导班(录播) 专业档案培训专题
在线试听
文书档案整理试听 人事档案管理试听 工程档案试听 档号编制规则试听
新闻分类
底部
留言咨询
招贤纳士
联系我们
档案管理培训信息网
手机:13241838330
手机:18601298758
固话:010-62700072
传真:010-62700072
邮箱:2087217266@qq.com
地址:北京市海淀区西土城路25号中国政法大学六号楼
底部
新闻内容 您现在的位置:网站首页 >> 新闻中心 >> 档案快讯 >> 详细信息

大数据时代的档案馆是否将成为中国记忆“数据资源库”?基于SWOT的分析

发布者:  发布时间:2020-09-28  阅读:2904次
内容摘要:大数据是近两年继Web2.0、云计算、物联网之后的一个新词汇,其引发了信息科技领域越来越多的关注。2011年,麦肯锡在研究报告《大数据:下一个创新、竞争和生产率前沿》中首次提出“大数据”的概念,之后《纽约时报》、《华尔街日报》等都对其进行了专栏介绍。 在庞大的新数据来源的支持下,量化的前进步伐将会踏遍学术、商业和政府领域,没有一个领域可以不被触及,大数据时代的到来,给档案馆也带来了极大的冲击。档案馆必须利用一切有效手段来分析现状与未来,做出正确的选择。

何谓大数据

 

1.大数据概述

截至目前,大数据尚未形成一个统一的定义,然而通过分析不同概念发现,尽管描述不一,但其内涵一致:大数据不是对数据量大小的定量描述,而是一种在种类繁多、数量庞大的多样数据中进行的快速信息获取。与定义上的分歧不同,对于大数据的特征则早已达成共识。业界一般将大数据的特征归纳为“4V”,即数据体量巨大(Volume)、处理速度快(Velocity)、数据类型繁多(Variety)、数据价值高(Value)。关于大数据,目前已有较多的研究成果,在此不再赘述。

2.大数据的认识拓展

大数据之大并不仅仅指其容量。“大数据并非总是说有数百个TB才算得上,根据实际使用情况,有时候数百个GB的数据也可称为大数据,这主要看它的第三个维度,也就是速度或时间维度”。事实上,解决一个问题的数据规模有一个阈值。“数据少于这个阈值,问题解决不了;达到这个阈值,就可以解决以前解决不了的大问题;而数据规模超过这个阈值,对解决问题也没有更多的帮助”。

大数据是相对的。大数据的定义是相对于目前的技术和资源而言的,随着时间的推移,处理数据的工具和技术、存储空间和处理能力的提升,大数据的界定也必然会发生变化。今天的大数据明天可能不再被认为是大数据,就像10年前的大数据在如今看来微不足道一样,大数据会继续演进下去。

大数据的价值在于分析与应用。很多人认为,正是由于大数据的大容量、高速度和多样性,才使其比其他数据更具有优势且更重要。然而,“大”和“数据”都不是大数据中最重要的。事实上,拥有任何一个数据集,无论它们多大或者多小,其自身都不会带来任何价值。被收集来的数据若从不使用,不会比存放在阁楼或地下室的垃圾更有价值,大数据的价值体现在如何分析它们,并采取怎样的措施来提升自身的业务水平。

大数据是一种服务变革。本质而言,大数据是信息爆炸时代对数据核心价值的再挖掘,综合运用到去冗降噪技术、语义引擎、可视化分析等,因此被很多专业人士认为是继云计算、物联网之后IT行业的又一次颠覆性变革。事实上,大数据“不仅仅是技术变革,更实质上的是计算机服务时代的来临,对数据的抽丝剥茧、总结结论更体现了计算机行业正从技术供应型转为服务供应”。

 

档案应用大数据的SWOT分析

SWOT分析法即态势分析法,其思路是在分析与研究对象密切相关的内部优势、劣势及外部机会、威胁的基础上,构建SWOT分析矩阵,得出相应的结论,并制定发展战略及对策。运用SWOT分析法对大数据时代档案馆的发展进行分析,有利于档案馆认清内外部形势,明确发展方向,从而制定科学的发展规划。

1.优势(Strengths)分析

资源优势。对档案馆而言,其最大的优势在于所拥有的资源。首先,档案馆信息资源总量庞大且增长迅速。2008年,全国各级国家档案馆共保存档案1.93亿卷,较上年增加1769万卷,增幅达10%,而到2011年各级国家档案馆馆藏已达3.3亿卷,到2020年各级国家档案馆馆藏将达到6亿多卷。其次,档案馆数据资源种类繁多。在档案馆的数据资源中,既有数字化的纸质档案、接收进馆的电子文件、音视频档案等,也有用户利用信息、服务数据等数据资源。再次,档案馆数据资源价值很高。与其他数据资源相比,“档案是一种最真实、最可靠、最具权威性与凭证性的原生信息资源”,这就使得数据洪流时代档案的价值与作用更加凸显。

行业领先。首先,各级国家档案馆是集中统一保管党和国家档案的科学文化事业机构,是永久保管档案的基地,是社会各界利用档案史料的中心。作为一种机构性存在与制度性安排,档案馆的公共性、服务性、公平性、永久性等特征,使得档案馆成为人们心目中最系统、最值得信赖的数据资源库。大数据时代,档案馆维护和传承记忆的功能将更加重要,构建一个“基于互联网的,以档案数字资源为主体,以文本、图片、音频、视频等为形式,为中华民族集体记忆的建构和传承提供文献支撑的‘中国记忆’数字资源库”将成为档案人新的目标与使命。其次,档案馆在数据处理上具有丰富的经验。考察数据生命周期,涉及数据生成、采集、传输、处理、分析、应用等阶段,而这也恰恰是档案馆熟悉的业务范畴。因此,档案馆可以通过模拟或借鉴传统档案处理的整套业务规范或流程来指导大数据的处理,“对知识规范性控制的思想和技术方法恰巧在大数据领域有了用武之地”。

 

2.劣势(Weaknesses)分析

认识问题。作为一个档案大国,几千年档案工作的历史积淀在我国形成了丰富多彩的档案文化,也形成了一套独特的档案思维模式。大数据时代,有可能出现两种认识问题:一是没有大数据意识,即无视大数据时代的来临,采取固守原状的鸵鸟政策,这将使档案馆失去未来的发展机会,甚至会失去存在的意义。二是泛大数据化,即不加鉴别地收集保存数据,从而使档案馆陷入数据沼泽,进而丧失自己的特色,显然这也是档案馆无法承受的。因此,大数据背景下,科学认识大数据的内涵,合理地选择切入点,将是档案馆在大数据时代立足的首要问题,而这或许也是档案馆最难解决的一个问题。

人才瓶颈。在档案事业快速发展的今天,我国的档案人才队伍建设却不尽如人意。一是专业人才不足。从国家档案局新发布的2019年度全国档案行政管理部门和档案馆基本情况,全国各省(除台湾外)、自治区、直辖市各级档案馆中具备博士学位且毕业于档案学专业的工作人员仅74人,具备硕士学位且毕业于档案学专业的工作人员仅2142人,具备学士学位且毕业于档案学专业的工作人员26520人。二是信息技术人才的匮乏。“大数据泡沫如果现在存在的话,恐怕并非数据的作用被过分夸大,而主要是由于真正具备资质的数据科学家数量不足导致的。”据统计,2018年美国面临150万个掌握大数据应用分析方法的技术经理和分析师缺口,另缺14万至19万具有“深度分析”经验的工作者。从目前来看,大数据成功的案例无不是特定的项目,例如“啤酒与尿布”,因此,现阶段档案馆人员最需要的是懂得用户的需求,因为数据越大,用户的个性需求就越多样,服务切口就越小。毫无疑问,这需要档案人员拥有极强的洞察能力。

 

3.机会(Opportunities)分析

需求旺盛。随着信息环境的变化和社会档案意识的觉醒,用户的档案信息需求层面不断加深,需求领域也不断拓展。首先,精品化的信息需求与专业化的知识服务要求。随着社会档案意识的增强,“用户关注的已不再是简单的获取文献,而是如何从繁杂的信息环境中捕获和析取解决所面临问题的信息内容,并将这些信息融化或重组为相应的知识或解决方案”。其次,个性化的信息需求与互动式的信息服务要求。随着用户信息素养的不断提高,档案用户已从信息服务的“被动接受者”转换为“主动选择者”,他们更希望获得一种为自己量身定做的个性化信息服务。同时,用户在获取信息的过程中,希望能与馆员进行人际交流与相互沟通,从而获取文化的熏陶、思想的碰撞及心灵的浸润。

政策导向2010年国家档案局《数字档案馆建设指南》颁布,提出运用多种技术手段“采集具有重要保存价值的各类数字信息,进行资源整合”、“对数字档案信息进行深度挖掘,开展增值服务”、“开展档案利用访问量统计、分布分析、舆情分析等工作”。2012年杨冬权在全国档案局馆长会议上讲话指出,要在新的起点上进一步推进档案信息化,即从过去以技术为主导向以服务为主导转变,从注重应用信息技术向注重档案内容信息化转变,树立“内容为王”的观念,建设以服务为主导的档案信息化体系。这些政策性文件及讲话,将为大数据在档案馆中的应用带来更多的政策支持,也为大数据时代档案馆的发展带来更多机遇。

 

4.威胁(Threats)分析

信息安全。大数据时代,数据量之大、数据种类之多、对数据处理速度与时间之快,都对传统的档案馆安全体系造成极大冲击。从基础技术角度而言,当前档案馆广泛应用的关系型数据库(SQL)技术,经过长期实践与完善,在维护数据安全方面已经设置了严格的访问控制和隐私管理工具,而大数据依托的基础技术是非关系型数据库(NoSQL),其在成熟度和可访问性方面都不如传统数据库技术。从核心价值角度而言,大数据的关键在于信息爆炸时代对数据价值的再挖掘。然而,数据分析技术的发展,对国家安全及用户隐私产生了极大威胁,数据持有人可以从历史数据中推测判断出行为人的下一步动作——个人行动轨迹、行为轨迹,甚至思维轨迹。

用户流失。大数据时代,档案馆面临着网络、图书馆及信息服务公司等的竞争,用户流失是不争的事实。以网络为例,网络信息资源的丰富使用户足不出户就可以获取所需的信息,用户对档案馆的稳定性与忠诚度下降。据统计,“超过90%的用户在查找信息时,会首选搜索引擎,搜索已经成为公众获取信息的代名词”。因此,数字化时代,档案馆如何实现“数据化生存”,将是不得不慎重考虑的难题。

 

大数据时代档案馆发展的战略选择

根据上述对大数据时代档案馆内外部环境的分析,将各个要素按照重要程度进行排列组合,结合SWOT分析法提供的四种战略规划方式,可形成大数据时代档案馆的四种发展战略。

 

1.SO战略——抓住机遇,发挥优势

强化资源优势。大数据时代,档案馆的核心竞争力在于其拥有的档案资源。因此,要实现从传统档案资源观向“大档案观”转变,尽可能地收集全面数据、完整数据和综合数据,更多地关注一些底层化、碎片化、复杂化的信息,从而构建一幅反映国家和社会变迁的实时全景图。档案馆在进一步推进纸质档案数字化、加快电子文件接收进馆的基础上,要有意识地收集一些诸如电子邮件、网页、社交媒体等价值重大、形式多样的数据资源,从而实现档案资源的全方位保存,真正建立覆盖人民群众的、满足长远需要的档案资源体系。

加快档案开放。大数据时代,公民对于“数据权”的要求与档案馆面临的激烈数据竞争,将加快档案资源开放的进程,使档案资源的开放和流动成为必然。档案开放的意义,不仅在于保障公民的知情权、推动政务透明与工作效率的提高,更在于让大数据时代最重要的档案数据可以自由流动起来,由封闭的内部资源向公开的社会信息转变,以催生创新,从而建立一个前所未有的开放社会与智慧城市。例如,为了积极公开政府信息让公众参与政府各种决策过程,NARA出台了《开放政府计划》,通过公民档案员项目、数字化战略、社交媒体战略等举措,扩大档案开放力度和公众参与水平。

创新服务内容。数据本身没有价值,通过数据提供服务才具有真正的价值。换言之,数据即服务,档案馆数据资源亦是如此。如何将死档案变成活资源,从传统的资源保障获取到数据支持创造,这就需要档案馆不断创新服务内容。可以预见的是,大数据时代,借阅、咨询、展览等传统服务将得到调整,而为社会机构如政府、企业等做一定的数据分析服务、数据挖掘服务,将成为大数据时代档案馆的常态服务内容。

 

2.ST战略——发挥优势,化解威胁

加大宣传力度。大数据时代,如何避免档案信息被海量的繁杂信息所湮没,如何让更多的人享受档案馆的服务成果,这都需要档案部门采取各种措施来加大档案宣传力度。具体而言,在宣传内容上,要积极宣传档案馆的资源体系,重点宣传档案馆的特色馆藏;在宣传手段上,要注重发挥新兴媒体特别是网络媒体的宣传作用,实现全媒体宣传;在宣传对象上,要实现大众传播向分众传播的转变,提升档案宣传的效果。

个性化服务。大数据的产生,使得一切领域都将进入一个可量化的时代,重中之重,就是人的行为,随之而来的,则是档案馆的个性化服务。与以往点对点的个性化服务不同,大数据背景下的个性化服务不仅提供用户所需要的信息,还通过对用户需求进行分析,开展跟踪服务、知识关联服务,提供基于海量分布式资源的精细化知识组织输出,即实现“信息+解决方案”的一站式服务。

 

3.WO战略——利用机会,改变劣势

促进资源整合。档案馆启动大数据的一个重要挑战,就是档案资源的碎片化。目前,许多档案馆的资源都散落在互不连通的数据库中,如何将这些数据库打通,实现资源共享,将是大数据价值最大化的关键。从目前来看,利用云计算技术,将全国档案资源整合,形成“中国档案云”,或许将有效解决这一问题。加强多方合作。大数据时代,数据的多样性是一种客观真实的存在,没有机构能够在大数据时代置身之外,也没有机构能够实现对所有数据的兼容并包,因此,不同资源拥有者之间的合作将非常必要。从范围上讲,这种合作不仅包括档案系统内部的合作,还包括档案部门与图书馆、博物馆及互联网运营商之间的合作;从内容上讲,既包括资源上的共建共享,也包括技术、人才等方面的合作互通。

 

4.WT战略——克服劣势,避免威胁

提升馆员素质。从上古的结绳记事到今天的档案数字化管理,技术的发展对档案人员提出了越来越高的要求。大数据时代,档案人员要实现从“一把锁”到“数据科学家”的转变。对此,缪其浩认为未来的数据科学家应具备三大核心技能:“一是具备数学知识为数据集构模;二是具备工程技能,建成数据模型分析系统;三是发现见解,从数据中讲出故事来”。

保障信息安全。大数据是一把双刃剑,在大数据环境下,社会因大数据而获益匪浅,但个人隐私也将无处遁形。因此,档案馆除了要从技术上实现反黑客、反病毒、防盗窃等方式来抵御外来入侵者的威胁外,更需要重点加强信息安全保障体系、信息资源共享制度、机密信息保护、信息审计等方面的制度建设,从管理上杜绝信息安全风险、切实加强个人隐私保护。

来源丨壹学者、棱兑集团融媒体中心


上一篇: 区块链技术在档案管理中应用路径研究
下一篇: 档案信息资源开发利用专题培训的实践与思考

Copyright © 2008-2036 档案管理培训信息网 All Rights Reserved 版本所有
24小时服务热线:13241838330/18601296758固定电话:010-62700072  报名邮箱:
2087217266@qq.com
档案管理基础知识  企业档案管理培训  人事档案管理培训  会计档案管理培训  建设项目档案管理培训  档案室建设
档案管理人员学习交流QQ群 :869546062    档案服务公司QQ联盟群:908606669
档案教育北京办公地址:北京市海淀区西土城路25号中国政法大学六号楼
山东地址:
山东省济南市槐荫区青岛路与齐州路中建锦绣广场2号楼1209室

京ICP备14023321号-6


京公网安备 11010802037382号

收缩
  • QQ咨询

  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 电话咨询

  • 18601296758