20
3 第三章 基于 Rough 集理论的救援等级智能决策方法
3.1 引言
决策支持系统是用来支持用户决策的计算机系统,它以现代信息技术为手
段,综合运用计算机技术、管理科学、经济数学、人工智能技术等多种学科知
识,针对某一类型的半结构化和非结构化决策问题,通过提供背景材料协助明
确问题、修改完善模型、列举可能方案等方式,帮助管理者做出正确决策的计
算机辅助式系统。智能决策支持系统(Intelligent Decision Support Systems,
简称 IDSS)是在决策支持系统基础上,集成人工智能专家系统(Expert Systems,
简称 ES)形成的。现代智能决策支持系统是建立在数据挖掘(知识发现)技术基础
上的基于数据挖掘的智能决策支持系统。90 年代以前,国内外的研究重点在于建
立数据仓库和联机查询机制(OLAP),首先将多数据源信息概括、聚类、集成,建
立面向主题、集成、时变、持久的数据仓库,然后通过 OLAP 技术对数据仓库作
即席、多维、复杂查询和综合分析,得出隐藏在数据中的总体特征和发展趋势。
90 年代中期到现在,国内外研究者将研究重点转移到数据驱动的数据挖掘方法,
利用人工神经网络、决策树、机器学习等方法,发现已有的和未知的知识,使
数据挖掘成为不需要人工干预的自动过程。近几年,随着 Rough 集理论研究和
应用研究的深入,越来越受到广大学者们的重视,目前以 Rough 集知识获取为
驱动的数据挖掘方法已经应用到医疗诊断、商业策划、银行预算、气象预测、
模式识别等领域,并取得了一定的成果。
Rough 集理论是波兰 Pawlak 教授于 1982 年提出的一个研究不精确、不确定
性知识的数学工具,用以解决不确定性的数学问题[22]
。它的最大特点是无需任
何先验信息,就能有效地分析和处理不精确、不一致、不完整等各种不完备数
据,从中发现隐含的知识(规则),揭示潜在的规律。1992 年以后随着 Rough 集
理论研究的发展和深入,许多学者开始将其引入到应用领域并取得了许多成果。
Tsumoto S 等
[23],[24]
将 Rough 理论引入到医疗诊断领域,利用 Rough 集方法根据
以往病例归纳出诊断规则,用来指导新的病例,将预测早产的准确率由 17%-38%
提高到 68%-90%。Golan R
[25]
等利用 Rough 集方法分析了十年间股票的历史数据,
研究了股票价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证
券交易专家的认可。Jelonek J
[26]
等将 Rough 集理论应用在人工神经网络研究领
21
域,利用 Rough 集化简神经网络训练样本数据集,在保留重要信息的前提下消
除了多余的数据,使训练速度提高了 4.72 倍。此外,Rough 集理论还广泛应用
在商业策划、银行预算、气象预测、模式识别、图像处理、机器学习等领域
[27][28]
。
在应急救援领域,智能辅助决策功能十分重要,许多学者和科技人员都对
此进行了研究并取得一定成果。例如:张晖
[29]
等分析了工业事故的整体处理流
程,按照应急响应职能发挥的情况,将整个应急响应过程划分为应急响应通讯、
应急响应级别确定、事态检测与发展预测、避难方式选择和人员疏散安置等五
个逻辑程序,对这五个环节在事件处理过程中应该如何作出决策做了详细的分
析和研究,提出了相应的决策方法和决策依据。薛克勋
[30]
,曾庆伟
[31]
等将 GIS
技术和应急救援的辅助决策结合起来,讨论了将 GIS 作为数据集成的平台,结
合关系数据库,实现智能辅助决策的若干问题。王林则
[32]
等将产生式规则、决
策树分层分类知识与数据库技术相结合,研究了铁路行车事故救援决策的知识
表示方法,为铁路行车事故救援决策提供了一种新的途径。李元佳[33]
等将贝叶
斯决策理论应用到核事故中晚期应急决策优化的处理中,提供了一种可以改善
决策优化结果的方法。李鑫[34]
等人则将模糊查询技术引入危险化学品泄露的应
急决策系统中,建立了危险化学品查询系统,为危险化学品泄露的应急决策系
统提供了有力的支持。
具体到机场应急救援管理系统,计算机智能辅助决策功能具有举足轻重的
作用。例如,在某次突发事件中,仅靠主观评估,就很难快速准确的确定该次
事件所需的各类救援资源的规模和数量:一方面,如果派遣资源过少,则会影
响救援质量,延误救援的最佳时机,很容易造成事件升级或二次事件的发生;
另一方面,如果派遣资源过多,则会造成人力物力的严重浪费,同样不可取。
所以,如何根据历史经验和数据建立一个有效的辅助决策规则库,如何在规则
库的基础上,结合当前报警信息帮助决策者进行快速高效的决策是一个很有价
值的问题。由于种种原因,国内的机场应急救援系统的研究尚处于起步阶段,
救援系统中计算机智能辅助决策方面的研究更是少之又少。本章在详细分析民
用运输机场应急救援规则的基础上,借鉴应急救援领域内智能辅助决策的各类
研究处理方法,首次将 Rough 集理论和方法引入民用机场应急救援管理系统中,
利用它对救援等级进行智能决策,提取出了救援等级的决策规则。
22
3.2 Rough 集理论的基本思想
Rough 集理论是一种处理不精确、不确定性问题的新型数学工具,它具有很
强的对象分类能力和知识(规则)发现能力。下面就其相关内容作简单介绍。
3.2.1 Rough 集理论基本概念
Rough 集具体理论参见文献[35],[36],这里简要介绍一下 Rough 集的几个基
本概念:
(1) 决策系统(决策表):设信息系统 S=(U,R,V,f),其中 U 是论域,R=C ∪ D,
C 和 D 分别为条件属性集和结果属性集,D ≠ ?,V= r
r R
V
∈
∪ 是属性值的集合, rV 表
示属性 r R∈ 的值域,f:U R V× → 是一个信息函数,它指定 U 中每一个对象 x
的属性值。称具有条件属性集合和决策属性集合的信息系统为决策系统(决策
表),记作 T=(U,C ∪ {d}),{d}=D。显然,可以将一个具有因果关系的二元数据
表作为决策表。
(2) 不可分辨关系:对于信息系统 S=(U,R,V,f),P ? R 且 P ≠ ? , ,i jx x U∈ ,
称二元关系 ( ) {( , ) | , ( , ) ( , )}i j i jIND P x x U U a P f x a f x a= ∈ × ∈ = 为关于属性集合 P 的
不 可 分 辨 关 系 。 由 不 可 分 辨 关 系 ( )IND P 产 生 的 所 有 等 价 类 构 成 的 集 合 用
/ ( )U IND P 表示(简称 /U P )。
(3) 下近似和上近似:给定决策表信息系统 S=(U,R,V,f),对于每个子集
X ? U 和不可分辨关系 B,X 的下近似集和上近似集分别定义为
*
*
( ) { | | ( ) }
( ) { | | ( ) }
i i i
i i i
B X Y Y U IND B Y X
B X Y Y U IND B Y X
= ∈ ∧ ?
= ∈ ∧ ≠ ?
∪
∪ ∩
其中, ( ) { | ( , , ( ( ) ( )))}IND B X X U x X y X b B b x b y= ? ∧? ∈ ∈ ∈ = 是不可分辨关系
B 对 U 的划分。
(4) 分辨矩阵:对于信息系统 S=(U,R,V,f),R=C ∪ D 是属性集合,子集
{ | 1, , }iC a i m= = 和 D={d}分别为条件属性集和决策属性集, 1 2{ , , , }nU x x x= 是
论域, ( )i ja x 是样本 jx 在属性 ia 上的取值。 ( , )DC i j 表示分辨决策中第 i 行 j 列的
元素,则分辨矩阵 DC 定义为
{ | ( ) ( )}, ( ) ( )
( , ) , 1,
0, ( ) ( )
k k k i k j i j
D
i j
a a P a x a x d x d x
C i j i j n
d x d x
? ∈ ∧ ≠ ≠?
= =?
=??
(5) 约简,核:设 U 为一个论域,P,Q 为 U 上的两个等价关系簇,若 Q ? P
是独立的,并且 ( )IND P = ( )IND Q ,则称 Q 是 P 的约简,在每个约简中都不可缺
少的关系集合称为核,记作 ( )QCORE P 。其中 ( )QCORE P = ( )QRED P∩ , ( )QRED P 为
P 的所有 Q 的约简关系簇。
23
3.2.2 Rough 集理论的核属性及属性约简
基于 Rough 集的属性约简,主要是通过对原始决策表的约简在保持决策表
决策属性与条件属性之间的依赖关系不发生变化的前提下对决策表进行约简
(简化),即删除冗余属性。要进行属性约简就必须首先了解核属性的概念,因
为属性约简的许多算法都是建立在求核属性的基础上的。
属性核是粗糙集理论的一个非常重要的概念,它是一个决策表的所有约简
集合中比不可少的关键属性,可以看作是所有约简集合中的交集。它对解决基
于粗集模型的属性约简问题具有极其重要的意义。目前主要的求核算法有:
(1) 分辨矩阵法
[37]
。该算法是目前求核属性的最为常用的方法,思路简单,
方法有效,但具有较高的空间和时间复杂度,其过程不易用关系数据库实现。
(2) 差异表法[38]
。该算法简单、直观,可以用关系数据库实现。
(3) 逐列消除法
[39]
。该算法对一致的决策表系统非常有效,不依赖于系统的
分辨矩阵,效率高,也易于用在关系数据库中实现。
一般来讲,一个决策表的条件属性对于决策属性的相对约简不是唯一的,
即对于同一个决策表可能存在多个相对约简。目前属性约简算法主要有:一般
约简算法,改进的基于分辨矩阵和逻辑运算的属性约简算法,归纳式属性约简
算法,基于互信息的属性约简算法[MIBARK 算法],基于特征选择的属性约简算
法等。各种算法之间的联系和区别参见文献[36],[41]。这里重点介绍一下本文
使用的改进的基于分辨矩阵和逻辑运算的属性约简算法。
设 Redu 是决策表 T 属性约简后得到的属性集合,该算法描述如下:
第 1 步:将核属性列入属性约简后得到的属性集合,即 Redu= 0C ;
第 2 步:在可变识矩阵中找出所有不包含核属性的属性组合 S,即
Q= { : Redu , =1,2, , }, = -i iB B i s S S Q≠ ?∩ … ;
第 3 步:将属性组合 S 表示为合取范式的形式,即
P= ,{ :( 1,2, , ; 1,2, , )}i kb i s k m∧ ∨ = =… … ;
第 4 步:将 P 转化成析取范式形式;
第 5 步:根据需要选择满意的属性组合。例如,如果要求属性数最少,可以
直接选择合取式中属性数最少的组合;如果要求规则最简,则需要进一步进行
属性值的约简。
3.2.3 Rough 集理论的属性值约简
通过属性约简,可以将决策表中对决策分类不必要的属性忽略,从而实现决
策表的简化,但是,属性约简只是一定程度上去掉了决策表中的冗余属性,我
飞行翻译公司 www.aviation.cn
本文链接地址:民用机场应急救援管理系统关键技术研究_(3).pdf