第1章 绪论

视觉是人类观察世界、认知世界的重要手段,人类从外界获得的信息约有75%来自视觉系统。人类视觉过程可以看做是一个复杂的从感觉到知觉的过程,最终目的从狭义上说是要对场景作出对观察者有意义的解释和描述,从广义上说是基于这些解释和描述并根据周围环境和观察者的意愿制定出行为规划。视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些西方国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题。

计算机视觉是各种成像系统代替视觉器官作为输入手段,由计算机来代替大脑完成处理和解释的科学和技术。计算机视觉研究的首要目标就是使计算机通过图像创建或恢复现实世界模型,然后认知现实世界。这里主要有两类方法:一类是仿生学的方法,参照人类视觉系统的结构原理建立相应的处理模块完成类似的功能和工作;另一类是工程的方法,从分析人类视觉过程的功能着手并不去刻意模仿人类视觉系统内部结构而仅考虑系统的输入和输出,并采用任何现有的可行手段实现系统功能。

计算机视觉是一门综合性的学科,它正吸引来自各个学科的研究者参加到对它的研究之中,其中包括:计算机科学、信号处理、物理学、应用数学和统计学、生物医学、生理学和认知科学等。它的发展得益于神经、生理学、心理学与认知科学对生物系统的研究,虽然由于人脑的高度复杂性对这种跨学科的研究还远远不够深入,但从事计算机视觉的研究者们已经发展起一套独立的计算理论和算法,从而对视觉信息进行分析和处理。