( 1中国科学院地理科学与资源研究所, 北京 100101; 2中国科学院研究生院, 北京 100049)
论文来源:测绘科学
摘要:本文通过对近年来遥感影像理解 ( IU: Im age U nde rstanding) 研究的分析, 本文给出了遥感影像理解的框架流程, 讨论了高级语义特征和低级影像特征, 针对流程中的各个任务介绍了有代表性的方法应用, 并对发展趋势进行预测, 特别是基于知识系统和影像认知的应用。
关键词: 影像理解; 模式识别; 特征提取; 综述
1 引言
大量的航空和航天传感器设备为我们获得了巨大的对地观察数据源, 使得对地球表层细节分析、变化监测和管理等应用成为可能 [ 1] 。特别是高分辨率的卫星遥感影像 (如IKONOS, SPOT 5, COSMOS, O rbV iew 等 ) 的发展使得遥感影像的深入应用成为可能, 从而为 G IS数据的更新、G IS的应用提供了有利的条件; 对于生态研究、土地管理、灾害监测等也具有重要意义 [2] 。快速准确地从影像中提取影像信息, 实现影像理解是目前遥感应用, 特别是影像更高层次应用的瓶颈。
目前影像理解在一定领域有较成功的应用, 如军事目标提取, 医学影像解译, 道路提取, 建筑物提取等, 但对于地表的遥感影像理解仍悬而未解, 是目前非常活跃的研究领域 [ 2, 3] 。
本文从广义的影像理解出发, 对高分影像分析和理解的基本思想和方法进行了探讨, 讨论了用于影像理解的高级语义特征和低级影像特征, 对近年来有代表性的影像理解方法: 基于知识 ( Know ledge-based ) 的方 法、神 经网络( NN: N eu ra l N etwo rk) 方法和 贝叶斯网 络 ( BN: Bays N et-w ork) 方法, 及相关算法: 遗传算法 ( G enetic A lgo rithm )、模糊理论 ( Fuzzy T heo ry) 、支持向量机 ( SVM: Suppo rt V ecto r M achines)、集成算法等进行了分析和总结, 并对影像理解的进一步发展做出展望。考虑到文章的篇幅, 没有做过多展开, 详细信息请参考引文。
2 遥感影像理解 ( R emote Sensing Image Under-stand ing)
2.1 影像理解概念
影像理解 ( im ag e understand ing) 最初是指通过利用计算机对影像进行基于知识解译工作, 始于 1975年。而后成为信号处理、统计分析、模式识别、人工智能、心理学和神经学等多学科交叉的研究领域。计算机视觉也与影像理解同指相关领域研究, 但前者偏向于视觉信息的处理计算方面, 如三维形状信息的测量; 而后者强调影像解译过程中知识的表达和推理。L uo等参考相关文献给出继承性的影像理解概念, 即把计算机影像表达转换为知识的符号表达,也可以说是 / p ixe ls to perd icates0, 同时指出影像理解是计算机视觉的最高抽象层次; 而影像处理只是换了一种影像表达方式, 如从栅格像元变为有区域边界的地图[ 4]。同时,许多学者引入认知心理学的术语 ) ) ) 语义 ( Sem antic)、图解( Schem a) 等, 把 语 义 影 像 理 解 作为 影 像 理 解 的 最 高层次 [ 1, 5] 。
2.2 影像理解架构
事实上, 大多数 IU 系统都需要专业背景知识的参与,但由于影像和知识的复杂性, 使得整个系统需要考虑的因素很多, 决定了 IU 系统的复杂性。为了解决这个问题, 很多学者对 IU 进行了任务化 (模块化 ) 的抽象, 对流程进行分析设计。
Jurie等给出了基于知识动态的影像理解系统的定义和框架。 Bahr考虑知识在影像理解中的应用, 给出了影像理解流程。 Fan等提出多级架构 ( M ulti-L eve l)即原始遥感影像( O rig inal Image)、语义敏感影像表达 ( Salient Ob jects)、语义影像 ( Semantic Im ag e)三级来实现遥感影像理解, 并成功应用于花园, 山脉、航行、海滩等场景的识别[ 6] 。L uo综述了影像理解的通用架构, 基于贝叶斯网络提出影像理解的流程, 强调低级特征 ( 如颜色、纹理、形状等 ) 与语义特征的结合作为贝叶斯网络的输入, 最终达到对影像的语义理解的目的 [ 4] 。T adeusiew icz等在研究了模式识别与影像理解关系的基础上, 提出影像理解的一般范式, 即数据流 (前馈模式 ) 与影像解译的语义流的认知共鸣 ( cognitive reso-nance)来实现影像的理解 [ 7] 。T orra lba等强调全景环境特征对于对象识别的重要作用, 此外还有 L iedtke, H e等对此进行了研究。
基于以 上研究, 给出 以影像数据和知识为主要输入的影像理解流程 ( 忽 略成 熟的 预 处 理 阶段 ), 如 图 1所示。在此 流程中, 将影像理解任务模块化, 有利于不同模块应用不同方法及不同应用系统中模块的重用。
更多内容请查看pdf