数据挖掘论文论文(3)

2020-06-17实用文

  3.3 数据安全

  2017年, 数据安全事件屡见不鲜, 伴着大数据而来的数据安全问题日益凸显出来。在大数据时代, 无处不在的数据收集技术使我们的个人信息在所关联的数据中心留下痕迹, 如何保证这些信息被合法合理使用, 让数据“可用不可见”[4], 这是亟待解决的问题。同时, 在大数据资源的开放性和共享性下, 个人隐私和公民权益受到严重威胁。这一矛盾的存在使数据共享程度与数据挖掘程度成反比。此外, 经过大数据技术的分析、挖掘, 个人隐私更易被发现和暴露, 从而可能引发一系列社会问题。

  大数据背景下的旅游数据当然也避免不了数据的安全问题。如果游客“吃、住、行、游、娱、购”的数据被放入数据库, 被完全共享、挖掘、分析, 那游客的人身财产安全将会受到严重影响, 最终降低旅游体验。所以, 数据的安全管理是进行大数据挖掘的前提。

  3.4 大数据人才

  大数据背景下的智游离不开人才的创新活动及技术支持, 然而与专业相衔接的大数据人才培养未能及时跟上行业需求, 加之创新型人才的外流, 以及数据统计未来3~5年大数据行业将面临全球性的人才荒, 国内智游的构建还缺乏大量人才。

4解决思路

  在信息化建设上, 加大政府投入, 加强基础设施建设, 整合结构化数据, 抓取非结构化数据, 打通各数据壁垒, 建设旅游大数据实验平台;在挖掘方法上, 对旅游大数据实时性数据的挖掘应该被放在重要位置;在数据安全上, 从加强大数据安全立法、监管执法及强化技术手段建设等几个方面着手, 提升大数据环境下数据安全保护水平。加强人才的培养与引进, 加强产学研合作, 培养智游大数据人才。

  参考文献

  [1]翁凯.大数据在智游中的应用研究[J].信息技术, 2015, 24:86-87.

  [2]梁昌勇, 马银超, 路彩虹.大数据挖掘, 智游的核心[J].开发研究, 2015, 5 (180) :134-139.

  [3]张建涛, 王洋, 刘力刚.大数据背景下智游应用模型体系构建[J].企业经济, 2017, 5 (441) :116-123.

  [4]王竹欣, 陈湉.保障大数据, 从哪里入手?[N].人民邮电究, 2017-11-30.

数据挖掘论文三:

  题目:档案信息管理系统中的计算机数据挖掘技术探讨

  摘要:伴随着计算机技术的不断进步和发展, 数据挖掘技术成为数据处理工作中的重点技术, 能借助相关算法搜索相关信息, 在节省人力资本的同时, 提高数据检索的实际效率, 基于此, 被广泛应用在数据密集型行业中。笔者简要分析了计算机数据挖掘技术, 并集中阐释了档案信息管理系统计算机数据仓库的建立和技术实现过程, 以供参考。

关键词:档案信息管理系统; 计算机; 数据挖掘技术; 1 数据挖掘技术概述

  数据挖掘技术就是指在大量随机数据中提取隐含信息, 并且将其整合后应用在知识处理体系的技术过程。若是从技术层面判定数据挖掘技术, 则需要将其划分在商业数据处理技术中, 整合商业数据提取和转化机制, 并且建构更加系统化的分析模型和处理机制, 从根本上优化商业决策。借助数据挖掘技术能建构完整的数据仓库, 满足集成性、时变性以及非易失性等需求, 整和数据处理和冗余参数, 确保技术框架结构的完整性。

  目前, 数据挖掘技术常用的工具, 如SAS企业的Enterprise Miner、IBM企业的Intellient Miner以及SPSS企业的Clementine等应用都十分广泛。企业在实际工作过程中, 往往会利用数据源和数据预处理工具进行数据定型和更新管理, 并且应用聚类分析模块、决策树分析模块以及关联分析算法等, 借助数据挖掘技术对相关数据进行处理。

2 档案信息管理系统计算机数据仓库的建立

  2.1 客户需求单元

  为了充分发挥档案信息管理系统的优势, 要结合客户的实际需求建立完整的处理框架体系。在数据库体系建立中, 要适应迭代式处理特征, 并且从用户需求出发整合数据模型, 保证其建立过程能按照整体规划有序进行, 且能按照目标和分析框架参数完成操作。首先, 要确立基础性的数据仓库对象, 由于是档案信息管理, 因此, 要集中划分档案数据分析的主题, 并且有效录入档案信息, 确保满足档案的数据分析需求。其次, 要对日常工作中的用户数据进行集中的挖掘处理, 从根本上提高数据仓库分析的完整性。

  (1) 确定数据仓库的基础性用户, 其中, 主要包括档案工作人员和使用人员, 结合不同人员的工作需求建立相应的数据仓库。

  (2) 档案工作要利用数据分析和档案用户特征分析进行分类描述。

  (3) 确定档案的基础性分类主题, 一般而言, 要将文书档案归档情况、卷数等基础性信息作为分类依据。

  2.2 数据库设计单元

  在设计过程中, 要针对不同维度建立相应的参数体系和组成结构, 并且有效整合组成事实表的主键项目, 建立框架结构。

  第一, 建立事实表。事实表是数据模型的核心单元, 主要是记录相关业务和统计数据的表, 能整合数据仓库中的信息单元, 并且提升多维空间处理效果, 确保数据储存过程切实有效。 (1) 档案管理中文书档案目录卷数事实表:事实表主键, 字段类型Int, 字段为Id;文书归档年份, 字段类型Int, 字段为Gdyear_key;文书归档类型, 字段类型Int, 字段为Ajtm_key;文书归档单位, 字段类型Int, 字段为Gddw_key;文书档案生成年份, 字段类型Int, 字段为Ajscsj_key, 以及文书档案包括的文件数目。 (2) 档案管理中文书档案卷数事实表:事实表主键, 字段类型Int, 字段为Id;文书归档利用日期, 字段类型Int, 字段为Date_key;文书归档利用单位, 字段类型Int, 字段为Dw_key;文书归档利用类别, 字段类型Int, 字段为Dalb_key;文书归档利用年份, 字段类型Int, 字段为Dayear_key等[1]。

  第二, 建立维度表, 在实际数据仓库建立和运维工作中, 提高数据管理效果和水平, 确保建立循环和反馈的系统框架体系, 并且处理增长过程和完善过程, 有效实现数据库模型设计以及相关维护操作。首先, 要对模式的基础性维度进行分析并且制作相应的表, 主要包括档案年度维表、利用方式维表等。其次, 要建构数据库星型模型体系。最后, 要集中判定数据库工具, 保证数据库平台在客户管理工作方面具备一定的优势, 集中制订商务智能解决方案, 保证集成环境的稳定性和数据仓库建模的效果, 真正提高数据抽取以及转换工作的实际水平。需要注意的是, 在全面整合和分析处理数据的过程中, 要分离文书档案中的数据, 相关操作如下:

  from dag gd temp//删除临时表中的数据

  Ch count=dag 1.importfile (dbo.u wswj) //将文书目录中数据导出到数据窗口

  Dag 1.() //将数据窗口中的数据保存到临时表

  相关技术人员要对数据进行有效处理, 以保证相关数据合并操作、连接操作以及条件性拆分操作等都能按照数据预处理管理要求合理化进行, 从根本上维护数据处理效果。

  2.3 多维数据模型建立单元

  在档案多维数据模型建立的过程中, 相关技术人员要判定联机分析处理项目和数据挖掘方案, 整合信息系统中的数据源、数据视图、维度参数以及属性参数等, 保证具体单元能发挥其实际作用, 并且真正发挥档案维表的稳定性、安全性优势。

  第一, 档案事实表中的数据稳定, 事实表是加载和处理档案数据的基本模块, 按照档案目录数据表和档案利用情况表分析和判定其类别和归档时间, 从而提高数据独立分析水平。一方面, 能追加有效的数据, 保证数据仓库信息的基本质量, 也能追加时间判定标准, 能在实际操作中减少扫描整个表浪费的时间, 从根本上提高实际效率。另一方面, 能删除数据, 实现数据更新, 检索相关关键词即可。并且也能同时修改数据, 维护档案撤出和档案追加的动态化处理效果。

  第二, 档案维表的安全性。在维表管理工作中, 档案参数和数据的安全稳定性十分关键, 由于其不会随着时间的推移出现变化, 因此, 要对其进行合理的处理和协调。维表本身的存储空间较小, 尽管结构发生变化的概率不大, 但仍会对代表的对象产生影响, 这就会使得数据出现动态的变化。对于这种改变, 需要借助新维生成的方式进行处理, 从而保证不同维表能有效连接, 整合正确数据的同时, 也能对事实表外键进行分析[2]。

上一篇:绩效统计的论文下一篇:the FATHER AND HIS SONSA美文