课程介绍
《数字视频图象处理与通信》作为通信工程专业选修课之一,覆盖视频图像处理技术和传输领域的基础知识,并初步涉及机器学习的概念。通过本课程学习,使得学生系统性地掌握图像数学变换,图像预处理,图像/视频分割和识别等方面的基本方法,尤其注重培养学生在工程中应用这些方法的能力。课程的教学演示和实验环境为OpenCV库和C++语言;课程通过丰富的原理性演示程序和例程代码,将原理与工程应用衔接起来,以强化学生的工程能力。本课程是一维化的数字信号处理课程在二维图像领域的延伸,并涉及C语言编程能力的工程化应用。
教学目标
1)课程内容涵盖图像/视频数据访问,图像的数学运算和变换,图像/视频压缩编码和传输,图像预处理,图像/视频分割,图像分类和识别等6个方面的知识模块;其中图像/视频数据访问模块涉及如何修改图像像素,如何读取视频图像,如何存储图片文件,如何存储视频文件,如何改变图像彩色空间等方面的问题;图像的数学运算和变换模块涉及相关和卷积运算,DFT和DCT变换,PCA变换等方面的内容;图像/视频压缩编码和传输模块涉及图像压缩和编码,视频压缩和编码,视频传输API的应用等内容;图像预处理模块涉及灰度变换和图像滤波等方面的内容;图像/视频分割模块涉及图像的阈值/边缘/区域分割,视频前景与背景分割等内容;图像分类和识别涉及HARR级联分离器原理和应用,PCA/FISHER/LBPH等全局特征人脸识别算法原理和应用,SIFT分类器和HOG分类器的原理和应用,并初步介绍机器学习技术在图像处理中的应用。
2)课程能力培养以图像和视频像素基本操作方法为起点,进而使用数学变换或图像分类/识别算法解决几个工程问题;课程在演示和实验中使用C++或JAVA语言作为编程工具,结合典型工程问题,进一步突出工程能力的培养。具体的能力培养可分解为如下几个方面:使用OpenCV库和C++/JAVA编程语言对图像和视频像素进行修改并存储结果;能够设计并编程实现图像预数学变换和图像预处理方面的算法实验;针对类似人脸识别、车流统计、车牌分割、行人分割、标牌分割这样的工程性问题(不限于此),能够运用课程知识,使用C++或JAVA语言编写程序,针对其中某个问题初步实现基本的处理功能。
3) 信号和图像处理算法往往较为抽象,学生不易理解。在本课程教学中,通过丰富的算法演示程序,可直观地剖析抽象数学算法的计算过程和作用效能,使得学生能够在较短课时内理解算法原理,并初步掌握算法功能和性能。
教学大纲和实验指导书见附件。