来源:中国一卡通网 作者:蒙应杰,王哲,陈云侠 发布时间:2009-12-30 09:55:56 字体:[大 中 小]
摘 要:决策支持系统是一个集数据采集、联机分析与数据挖掘为一体的综合信息管理系统,针对目前高校基于智能卡辅助管理中存在的系统众多、无法统一管理、数据资源丰富却无法有效集成利用等问题,构建了一个基于智能卡的高校辅助信息管理决策支持系统,并详细阐述了系统的模型及体系结构,对影响系统设计及实现的元数据设计、数据采集和数据反馈等关键环节进行了讨论。
随着我国高校信息化建设的不断深入,基于智能卡(即高校中俗称的校园卡) 技术建立的各种信息系统逐渐被应用于高校管理的各个方面,例如,餐饮管理系统、出入门禁系统、图书借阅系统等等,这些系统在高校辅助管理方面发挥了巨大的作用。 但是这些系统仅能满足某一方面的应用,并没有形成一个综合性的辅助信息系统,还没有上升到综合性的数据处理与管理的层面. 另外,随着这些单一系统运行时间的增长,积累了大量的数据,而这些数据事实上已经形成了信息孤岛,导致这些有价值的数据无法得到综合的分析与利用。
从20 世纪70 年代初首次提出至今,决策支持系统经过40 多年的发展已经日趋成熟,它是信息技术经过漫长而复杂的演变产生的。构建决策支持系统的主要目的就是要将简单的数据转化为有用的信息,这一目的与高校在辅助管理方面的需求完全符合,因此构建基于智能卡的辅助决策支持系统,对数据资源进行综合利用,已经成为目前高校辅助管理急需解决的问题. 基于上述原因,我们研究了基于智能卡的辅助信息管理决策支持系统的模型构建、体系结构及系统设计中的几个关键问题。
1 辅助信息决策支持系统的构建
1. 1 决策支持系统的逻辑模型设计
目前基于智能卡的各种管理系统都是孤立运行的,为了达到消除信息孤岛,综合管理利用这些数据的目的,首先需要进行数据收集和整理,构建智能卡辅助信息数据仓库;其次以数据仓库为基础,建立面向不同主题域的决策分析预测系统. 根据这一情况结合数据采集和数据利用2 方面的需求,可设计出系统的逻辑模型,如图1 所示。
由图1 可以看出,从现有的基于智能卡的信息系统中得到数据,经过清理、采集和筛选后保存到数据仓库中,通过数据挖掘引擎对数据进行处理. 数据经过处理后形成的决策信息,可以为基于智能卡的信息系统提供改进指导,对共享数据的接口进行标准化,使用可视化技术向学校的决策者提供决策依据. 对分析得到的结果,由用户进行评估,根据客观度量,识别决策信息的价值,不断对挖掘引擎进行改进。
1. 2 决策支持系统的体系结构构造
依据图1 的系统逻辑模型、处理过程和目前高校中智能卡辅助信息系统所涉及到的范畴,结合信息处理中的分类与分层技术,可以将智能卡辅助信息管理决策支持系统的数据处理分为3 个层次:数据采集层、信息处理层和预测分析层,其体系结构如图2 所示。
由图2 所示的体系结构可以看出,数据采集层是整个决策支持系统实现的基础,完成了对所有数据资源的收集与整合工作. 这些多渠道的、长期积累的数据资源构成了整个决策支持系统的底层数据样本,它来源于现有的使用智能卡的所有信息系统,例如门禁数据、医疗数据和图书借阅数据等. 另外数据采集层还要为使用智能卡的信息处理系统提供标准的共享数据接口,考虑预留扩展接口的问题,便于需求增加时新系统的接入。
信息处理层,作为数据层与预测分析层的桥梁,负责为挖掘模型提供经过初步分类与关联的中间层数据. 在信息处理层中需要对底层的数据样本进行结构化处理,增加不同层次的信息处理粒度,提取初步综合数据作为决策分析的基础,同时要提供管理工具对数据仓库中的数据进行管理。
预测分析层,承担着数据挖掘与结果展示的双重工作,对中间层数据进行提取,形成面向主题的实例化的综合数据. 这些实例化的综合数据是针对具体主题域的特点,经过进一步规范化得到的,在实例化的综合数据之上可以直接应用数据挖掘算法进行决策分析. 经过决策分析层的处理后,原始数据样本中有价值的、隐藏的规律被发现并呈现给用户。
2 影响系统实现的几个关键问题
按照图2 所示的3 层体系结构,可以看出决策支持系统的信息处理层与预测分析层与其他类型的决策支持系统在设计及实现方法上没有本质的区别,此处不再赘述. 由于数据采集层是整个智能卡辅助信息管理决策支持系统的工作基础,因此以下对该层实现中的几个关键点进行阐述。
2. 1 元数据的设计
元数据的设计是决策支持系统构建的重要环节,它在数据处理的各个层次中发挥着不同的作用. 虽然在决策支持系统中需要定义描述数据结构,数据映射关系,以及别名和状态等多种类型的元数据,但具体的内容要根据所构建决策支持系统的特点来确定。
在智能卡辅助信息管理决策支持系统中,针对系统涉及范围广泛,实体众多,关系复杂,需求不稳定等特点,最为关键的是实体信息元数据的设计,因为以实体信息元数据为基础,可以派生出其他重要的元数据,如主题域划分、数据所处粒度等元数据,它们直接影响决策支持系统的信息细化程度、涉及主题域的范围、挖掘算法的应用效率以及系统扩展性等指标。
实体信息元数据主要完成系统中实体及其维度、粒度、别名和唯一标识等信息的描述. 表1 给出了智能卡辅助信息管理决策支持系统的部分实体信息元数据。
表1 部分实体信息元数据示例
表1 中,级别信息反映了数据处理的不同层次和不同角度,系统中原子数据的级别定义为0 ,数据分类信息级别为1 ,实体的应用信息级别为2 ,粒度信息级别为3 ;综合数据信息中,初级的分类统计信息级别较低,根据粒度扩展的分析信息级别较高,依此类推. 通过对实体信息元数据的应用,可以在数据转化为信息过程中针对具体主题,从维度、粒度等角度方便的控制信息细化程度。
2. 2 系统数据采集的实现
虽然现有基于智能卡的信息系统所使用的数据在存储模式、数据格式等方面存在很大差异,但就其本质来讲无非由2 大类构成,即记录文件和字符流文件,也就是通常所说的记录文件和非记录文件(为了叙述方便以下称记录文件为数据库文件,字符流文件为非数据库文件) . 因此,在数据采集中可按照这2 类分别处理. 实现过程主要包括数据源的识别与读取,数据的转换以及数据的保存3 个主要步骤.数据采集实现的客户端过程Imp Procedure 的算法描述如下:
/ / Input 输入待处理字符,文件类型File Type
/ / Output 反馈信息ReturnInfo s
算法Db_Import
step1 : / / 判断文件类型,连接目标数据库
if filetype = Databasefile
t hen go step2
else go step3
step2 : / / 处理数据库文件
Open Databaselink (DNS) SourceDbLink / / 连接源数据库
Open Databaselink (DNS) AimDbLink / / 连接目标数据库
/ / 逐条处理数据集中的记录
for each SourceDbLink. Table. record do
begin
Filedst r = ”/ / 初始化
/ / 逐个读取记录中的字段
for each SourceDbLink. Table. filed do
Filedst r ←Filedst r + SourceDbLink. Table.
fieldvalue +‘,’
/ / 向目标数据库端存储过程提交记录
ReturnInfo ←AimDbLink. Procedure ( Filedst r)
if ReturnInfo = errorinfo t hen show(ReturnInfo)
end
Close SourceDbLink
Close AimDbLink
step3 :/ / 处理非数据库文件
Open Databaselink (DNS) AimDbLink / / 连接目标数据库
Open File ( FilePat h) SouFile/ / 打开文件
/ / 逐条处理文件中的记录
for each AimDbLink. record do
begin
SouFile. read ( Filedst r)
/ / 向目标数据库端过程提交记录
ReturnInfo ←AimDbLink. Procedure ( Filedst r)
/ / 如果出现错误,显示错误信息
if ReturnInfo = errinfo t hen
show(ReturnInfo)
end
Close SouFile
Close AimDbLink
从以上算法中可以看出,对于数据库文件使用ODBC 技术,通过DNS 数据源来访问数据库;非数据库文件读取时,使用具体开发语言中与之适应的读取函数进行操作,通过文件名和绝对路径访问文件,对非数据库文件有一定的格式要求. 数据转换和保存工作依据元数据中定义的规则由统一的存储过程进行处理。
2. 3 系统数据反馈接口的实现
基于智能卡的辅助信息决策支持系统除了具备一般决策支持系统的功能外,还可以为已有的基于智能卡的信息系统反馈指导信息. 鉴于现有的基于智能卡的信息系统开发时间的不同,构建的决策支持系统可采用导出和同步2 种数据反馈模式,导出模式只需将反馈数据按照固定格式保存到指定文件中即可,主要为适应早期研发的信息系统;同步模式针对目前采用新技术研发的系统提供统一的数据访问接口,其过程主要包括用户权限判定、请求数据的查询和结果返回3 个主要步骤,该过程实现也比较容易,例如采用Framewrok2. 0 框架下的Webser2vice 技术,实现的服务器端过程FeedbackProcedure的算法描述如下:
/ / Input 用户代号Userid ,用户密码PassWord ,同步类型Info Flag ,
开始时间Begin Time ,截至时间EndTime ,数据表名TableName
/ / Output 数据集DateSet
算法Db_Feedback
Step1 :/ / 判断用户是否合法
if (Userid not Read TableName) or ( Password = false) t hen
begin
Show errorinfo / / 提示错误信息
exit
end
Step2 :/ / 判断同步类型
if InfoFlag = t rue t hen / / 同步全部信息
sSt rSql ←select 3 f rom sTableName
else / / 同步部分信息
sSt rSql ←select 3 f rom TableName where
Change Time > = Begin Time and Change Time < = EndTime
Step3 :/ / 查询信息并反馈
Open Databaselink (DNS) AimDbLink
/ / 执行Sql 语句并输出
DateSet = AimDbLink. Exec ( sSt rSql)
Close AimDbLink
以上算法描述了一个公用的数据同步反馈处理过程,过程可依据输入参数和元数据中定义的访问级别,判断是否具有访问指定数据表的权限;认证通过后根据反馈方式动态组合查询语句并执行,增量数据共享时,使用时间戳机制进行控制。但具体实现过程中应考虑加入多重安全机制的处理,关于安全机制处理此处不再赘述。
3 结语
智能卡辅助信息管理决策支持系统主要利用目前高校中基于智能卡的信息系统所积累的海量数据,为高校的辅助管理工作提供多方面的决策依据。文章论述了其系统的模型和体系结构,并对系统设计实现涉及的几个重要环节进行了描述。目前该系统还处于原形设计阶段,虽然可解决当前高校辅助管理中存在的一些问题,但在模式评估、兴趣度量和挖掘算法的改进等方面还有待进一步研究。
(作者单位/1. 兰州大学信息科学与工程学院;2. 兰州兰大小精灵新技术有限责任公司;3. 兰州大学通信网络中心)
推荐文章
论坛热帖