数字媒体导论复习
第一章 媒体
1. 从技术角度分类
- 感觉媒体:直接作用于人的感觉器官,能够使人产生直接感觉的媒体
- 表述媒体:为了收集、加工、处理和传输某种感觉的媒体
- 表现媒体:用于信息输入和输出的媒体
- 存储媒体:存储信息的物理介质
- 传输媒体:能够将媒体在不同时空传送数据信息的物理介质或载体
2. 从感官角度分类
- 视觉类媒体:
- 位图图像
- 图形
- 符号
- 视频
- 动画
- 其他
- 听觉类媒体
- 波形声音:自然界中所有声音的拷贝,是声音数字化的基础
- 语音:语音也可以表示为波形声音,但波形声音表示不出语音的内在语言、语音学的内涵
- 音乐:音乐与语音相比更规范一些,是符号化的声音,但是音乐不能对所有声音进行符号化
- 触觉类媒体
- 指点:包括直接指点和间接指点。通过指点可以确定对象的位置、大小、方向和方位,执行特定的过程和相应的操作
- 位置跟踪:为了与系统交互,系统必须了解参与者的身体动作,包括头、眼、手、肢体等部位的位置和运动方向
- 力反馈与运动反馈:这与位置跟踪正好相反,是系统参与者反馈的运动力的信息
3.从表现形式的分类
- 平面媒体:报纸杂志
- 电波媒体:广播、电视广告
- 网络媒体:门户网络、动画、论坛
4. 从出现的先后顺序分类
- 报纸刊物为第一媒体
- 广播为第二媒体:分为无线广播和有线广播
- 电视为第三媒体
- 互联网为第四媒体
- 移动网络为第五媒体
5. 媒体的特性
- 集成性:将各种信息媒体按照一定的数据模型和组织结构集成为一个有机的整体,来传情达意,更形象的实现信息的传播
- 多样性:多样性使得媒体信息能够被处理的空间范围扩展和放大了,而不是局限于数值、文本、或特定的图形好人图像
- 便捷性:可以按照自己的需求、兴趣爱好、任务要求、和认知特点来使得信息,及时快捷得获取图、文、声等各种信息表现形式
- 实时性
- 交互性
- 共享性
- 非线性
第二章 传播学基础
1. 人类传播的演进分为六个阶段
- 符号和信号传播时代:触觉和嗅觉、视觉符号、听觉符号
- 口语传播时代:六大语系
- 文字传播时代
- 印刷传播是时代
- 电子传播时代
- 数字化传播时代:01代码
第三章 数字媒体概述
1. 数字媒体的定义:
数字媒体是基于计算机信息网络技术,以二进制数的形式记录、处理、传播和获取的能在全球范围内的即时互动传播信息的信息载体,这些载体包括数字化的文字、图像、图形、声音、视频影像和动画等感觉媒体,和表示这些感觉媒体的编码等,通称为表示媒体,以及存储、传输、显示逻辑的存储媒体与表现媒体
第四章 数字音频处理技术
1. 声音的三个重要物理特性
- 频率
- 周期
- 振幅
2. 声音的三要素
- 音强:音强与声波振幅成正比,振幅越大,强度越大,反之亦然
- 音调:代表声音的高低,与频率有关。频率越高,音调越高,反之亦然
- 音色:声音的特色,影响声音特色的因素是复音。复音是指具有不同频率和不同振幅的混合声音,自然声中大部分是复音(不同频率不同振幅的声音混合起来影响音色)
第五章 数字图像处理技术
1. 彩色模型(RGB,CMYK,HSL)
- RGB(立方体:点线面):采用红绿蓝三基色以不同比例进行颜色叠加的模型为RGB色彩模型。三基色的波长分别为红(700nm),绿色(546.nm)和蓝色(453.8nm)。自然界中任何一种颜色可以由以下公式进行表述:
C = r[R] + g[G] + b[B] - CMYK(三个平面,每个平面都是RGB): 以红、绿、蓝的补色青、品红、黄为原色构成CMY色彩模型。实际使用是彩色打印机很难通过以上三种颜色叠加出纯正的黑色,故而,在该模型中又添加一种原色——黑色(K)。
- HSL(锥形):(色调、饱和度、亮度)色彩模型是工业界的一种颜色标准,通过三个颜色的通道的变化以及他们相互之间的叠加来得到各式各样的颜色。HSL色彩模型可以抽象为一个圆锥立体模型。纵轴表示亮度,自上而下由亮变暗;横轴表示颜色饱和度,自内向外逐渐饱和;环向轴为色调的变化
2. 图像数字化的三个过程(采样、量化、编码)
- 采样:采样就是把一幅画在二维空间分割成M*N个网格,每个网格用一个亮度值或颜色值表示。
- 量化:是将图片中每个采样点的亮度值或彩色信息进行数字化处理,即把原来的模拟连续数值转换为数字化的离散数值。量化字长越长,图像越逼真,字长越短图像越失真。对于灰度图来说,当量化字长为1位时,图像会转换为单色图(只有黑白)量化是把采样后的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化算法:Medium Cut算法
- ==编码==:编码是将量化后的数值以二进制的形式进行存储的方式。图像的采样点越多,信息就会越多,从而数据量就会越大,所占空间就会越大。为了在不影响观看或使用的情况下尽量节约资源,对图像进行压缩是必不可少的环节。应该说,压缩编码技术在整个图像数字化的过程中起着重大的作用,也是对后期图像进行编辑、保存和传输等操作的关键环节
注意
基本图像数据类型
- 1bit二值图像
- 8bit灰度图
- 24bit真彩色
- 8bit索引图
- 索引表color lookup table
3. 图像的分辨率和像素深度
- 分辨率:分辨率可以针对图像自身显示效果的图像分辨率、以计算机显示器为主体的显示分辨率,以及扫描和打印时使用的分辨率
- 图像分辨率:组成一副图像单位长度包含像素数目的多少
- 显示分辨率:显示器屏幕上能够显示的分辨率,即显示器显示图像区域的水平像素和垂直像素数目
- ==打印与扫描分辨率==:打印与扫描分辨率是指使用打印机或扫描仪输出图像时每英寸可以识别的像素点数,用dpi作为单位。==如果采用分辨率为
500dpi的扫描仪扫描一幅10”×12”的彩色图像,那么扫描输出的图像即为
(500×10)×(500×12)的像素。==
- 像素深度:指记录每个像素点所用的位数,它也可以用来度量图像的分辨率。当采用RGB色彩模型时,像素深度与色彩的映射关系主要有真彩色、伪彩色与调配色三种。++像素深度就是一个像素需要几个bit也就是二进制的几位来存储的。++
- 真彩色:一幅彩色图像的每个像素用RGB三个分量表示,每个分量用8位二进制数记录
- 伪彩色:图像的每个像素值是以一个索引值或代码表示,由这个代码值作为入口地址在色彩查找表CLUT中查找实际RGB的强度值
- ==调配色==:以图像中每个像素点的RGB分量分别作为单数的索引值进行变换,再由色彩变化表找出相应的强度值,用变换后的RGB强度值产生色彩
==4. 图像大小的计算==
- 图像大小是指计算机磁盘中存放该图像像素的字节数(bytes)
- 计算公式:
- 图像大小=图像分辨率×像素深度/8
=(图像水平分辨率×图像垂直分辨率)×像素深度/8
- 注意:对于不同种类的图像的计算(1bit黑白、8bit灰度、8it彩色、24位真彩色)
5. 图像的种类:矢量图和位图
- 矢量图像:矢量图是指完全由计算机的指令生成的图像的形式。矢量图像的基本构成元素是点线矩形多边形圆和弧线等简单图形。矢量图形最大的优点是无论放多大,缩小或者旋转都不会失真,矢量图形与分辨率无关;最大缺点是难以表现色彩层次丰富的逼真图像效果
- 位图图像:位图是通过相机、扫描仪、摄像机等设备将模拟图像信号转换为数字图像数据阵列的图像形式。它由像素点组成,像素是位图最小的信息单元,存储在图像栅格中。位图的优点是可以表现色彩层次丰富的逼真图像效果,适用于相片或要求精细的图像。缺点是由于位图像素的总数是一定的,所以当旋转或者缩放位图时会产生失真和畸变(锯齿、形变、像素化)
第六章 数字视频处理技术
1. 电视机的扫描原理(隔行扫描和逐行扫描)
- 扫描:传送电视图像时,将每幅图像分解成很多像素,按照一个一个像素、一行一行的方式顺序传送或接受称为扫描。隔行扫描方式把一副图像分成两次扫描,第一次先扫描奇数行,第二次扫描偶数行,没两次扫完组成一幅完整的画面。每一行都正程和逆程,也称为行消隐
- 电视因为存在信号带宽的问题,通常以隔行扫描的方式显示,其优点是可以保证图像清晰度无太大下降和画面无大面积闪烁的前提下,将图像信号带宽减小一半,由此加快了信息传输的速度。电视上的画面是由两条叠加的扫描折线组成的,所以,电视显示出的图像有两个图像区域,每个图像区域称为一场,故每一帧被分为两个场,即奇场合偶场,也是上场和下场。每一场有正程和逆程,叫做场消隐
- 帧及帧速率:从上到下扫描完一幅完整的画面,称为一帧。每秒钟扫描的帧数称为帧速率,也称帧频
- 像素比:像素的长宽比。对于电视而言,不同制式的像素比是不一样的,在显示器上播放的像素比是1:1,而在电视上以PAL制式为例,像素比为1:1.07,这样才能保证良好的画面效果。
2 电视机的三种制式
- NTSC(National Television System Committee)制式:即正交平衡调幅制,是由美国国家电视标准委员会制定的彩色电视广播为标准,属于同时制,隔行扫描,画面比例为4:3。(美国日本)
- PAL(Phase Alternative Line)制式:逐行倒相制。也属于同时制,隔行扫描,画面比例为4:3。PAL采用逐行倒向正交平衡调幅技术方法,对同时传送的两个色差信号中的一个色差信号采用逐行倒向,另一个色差信号进行正交调制方式(中国德国英国朝鲜)
- SECAM(Sequentiel Couleur A Memoire)制式:按顺序传送彩色与存储制,代表图像色度的两个信号逐行轮换地对彩色负载波进行调频。同时顺序制,隔行扫描。特点是不怕干扰,色彩效果好,但兼容性差。(法国俄罗斯东欧国家)
- HDTV(高清晰数字电视):数字电视,拍摄、编辑、制作、传输、播出、接受电视信号全过程都使用数字技术的电视系统
第七章 数字动画
1. 计算机动画基础(定义、播放速度、格式、应用)
- 动画类型:
- 从技术手段上,动画分为计算机辅助动画和计算机生成动画。
- 从观看方式上划分:可分为顺序动画和交互式动画。
- 从内容与画面数量关系上划分:可分为==全动画和半动画==。
- 从动画产品的形式来划分:可分为动画片,动画特技效果图以及动画与真人合成的作品
- 数字动画的文件格式
- GIF格式(Graphics Interchange Format,图形交换格式):是一种广泛应用与网络传输的位图图形文件格式,以8位色(即256种颜色)==重现真彩色的图像==。它实际上是一种压缩文档,采用==LZW压缩算法==进行编码,有效减少了图像文件在网络上传输的时间
- SWF格式:动画设计软件Flash创作影片时专属的文档格式,该格式支持==矢量和点阵图形==,被广泛应用与网页设计,动画制作等领域,整体结构是由header+body组成
- fla格式:通常称之为源文件,需要在flash中打开编辑和保存。他在flash中的地位就像PSD早photoshop中的地位一样,所有的原始素材和操作都存储在fla文件中。由于它包含所需的全部原始信息,所以体积较大。fla文件十分重要,在后期的修改和再次使用时会更加快捷,所以建议将其把偶才能完好,方便下次直接使用
- FLIC(FLI/FLC):Autodesk公司在其2D/3D动画制作软件中采用的彩
色动画文件格式 - QTM(Quick Time):Apple公司的动画文件格式,能通过Internet提供实时的
数字化信息流、工作流与文件回放,可用于保存音频和运动视
频信息。 - VRML(Virtual Reality Modeling Language):面向Web,用于建立真实世界的场景模型或虚构三维世界
的场景建模语言,具有平台无关性
- 数字动画的应用领域
- 娱乐业:广告、片头、电影、游戏
- 工程建筑:数字动画可以展示工业产品与建筑模型,甚至当下大多数具有强大竞争实力的房地产企业也采用数字动画的方式对新楼盘和样板间进行数字化全方位模拟漫游展示。城市建筑规划、隧道、矿井的三维显示模型,场馆、熟悉校园的搭建斗鱼数字动画紧密相关
- 教育:数字动画用于网上教学、多媒体课件等辅助教学的方式
- 科研与军事:数字动画在医学、航空航天以及军事演习与模拟训练中发挥重要作用。在军事领域中被大量用来模拟、仿真以及实训。在航空航天领域中通过数字动画方式模拟飞行器及天体的运行情况可以很好地实现工作人员对探索过程的控制与观察
- 飞行模拟:训练飞行员模拟起飞和着陆、操纵各种手柄、观察各种仪器以及在舷窗能看到机场跑道或自然景象等
- 科学可视化:通过计算机动画将科学计算过程及结果转换为图形或图像并显示出来,如计算标量数据场、流体力学分析等
- 虚拟现实技术:利用计算机动画模拟产生一个三维空间的虚拟环境系统。包括视觉、听觉、触觉、嗅觉等
- 动画定义:通过一定速度播放的连续的画面来显示运动和变化的过程。==计算机动画==是借助计算机生成的一系列连续图像并动态播放的计算机技术
- 播放速度:24f/s,25f/s,30f/s
2. 二维动画和三维动画的制作步骤,及其制作上的区别
- 二维动画制作流程分两种,一种采用纸质媒介,多为纸上手绘;另外一种是采用计算机媒介的数字二维动画制作,整个过程由计算机通过软件实现
- 二维动画制作流程分为以下九个步骤:剧本编写,角色与场景的设计、分镜头脚本的绘制、绘制关键帧画面、绘制关键帧间画面、着色、拍摄、剪辑、配音和添加字幕
- 二维数字动画的制作流程:策划筹备阶,前期设计阶段,中期制作阶段,后期加工阶段。其优势在于可以大幅度降低制作成本,实现高速便捷传输,提高绘画质量,提高制作效率,生成传统动画无法实现的特效
- 二维数字动画制作软件:.Ulead GIF Animator、flash、animo、Softimage/TOONZ、USanimation、RETAS PRO
- 三维数字动画制作:三维动画最大特点就是在一个虚拟的三维场景中,安排三维角色按照指定方式运动,并通过模拟摄像机的镜头来控制镜头画面,最后渲染生成。制作流程:建模,动画编辑,材质选定,贴图,灯光,渲染合成。
- 建模:利用三维软件进行三维物体和场景的创建。创建过程中,首先绘制出平面的造型,再通过三维软件将其立体化,以相应的建模方式赋予象形指定的复杂形体
- 动画编辑:根据物理动画的基本规律,使用关键帧技术、轨迹驱动技术物体变形和形状过度技术、表达式动画和剧本动画技术、正逆向关节链结构运动技术、粒子技术、传感和语言驱动技术等方法为角色形象设定运动路径和关键帧动画,再由计算机运算生成中间帧动画。在此阶段,有各种软件可以帮助完成动作的设计与创建
- 材质选定:指对模型的光滑度、反光度、透明度等材质效果的选定。经材质选定这一阶段渲染生成的模型是具有单色且质感细腻的物体模型
- 贴图:对于一个形象或场景而言,它还需要具备相应的纹理和图像效果。则这些工作就由第三阶段材质选定来完成,或称为“贴图”。这些能够附着在模型表面的图实际上是二维的平面效果图,将其像贴纸一样贴在模型表面即可赋予模型逼真感
- 灯光:对于灯光的设定其实就是针对场景的环境与剧情设置的灯光强度、角度与位置。模拟 出来的灯光有主光和复光之分,包括太阳光、方向光源、点光源、线光源、面光源、泛光源,以及聚光灯、环境光源等。专业人员可设置灯光的各种参数来控制画面的明暗效果。
- 渲染合成:渲染是三维动画视频制作的最后一步。在此过程中,需要将繁杂的数据渲染并输出,加上后期制作(添加音频),形成最终可以用于放映的影片。基本渲染算法:扫描线、光线跟踪和辐射度。
- 常见的三维数字动画制作软件:Softimage|XSI、LightWave 3D、 3D、 Studio Max、 Maya、 ZBrush
第八章 数字压缩技术
1. 视频图像大小的计算,音频文件大小的计算
- bit与byte:bit(比特),byte(字节)
- 8bit = 1byte。
- KB是千字节,1KB = 1000byte
2. 相对冗余度、压缩率、平均码长的含义和计算
- n1,n2表示相同信息的数据集合中所携载信息单元的数量
- 压缩率CR = n1 / n2
- 相对冗余度RD = 1 - 1 / CR
(n1表示的)
n1相对于n2 | CR | RD | 对应的情况 |
---|---|---|---|
n1 = n2 | 1 | 0 | 第一种相对于第二种表达不含冗余 |
n1 >> n2 | 趋近正无穷 | 趋近1 | 第一种数据集合包含相当多的冗余数据 |
n1 << n2 | 趋近0 | 趋近负无穷 | 第二种数据集合包含相当多的冗余数据 |
- 平均码长:每种字符的加权平均数
3. 图像压缩的原理
- 数字图像压缩是指通过去除多余数据来表示数字图像的编码方式
- 数据图像之所以能被压缩,就是因为数据中存在冗余,主要变现为:图像中相邻间的相关性引起的==空间冗余==;图像序列中不同帧之间存在相关性引起的==时间冗余==,不同色彩平面或频谱带的相关性引起的==频谱冗余==
- 数据压缩的目的是通过去除这些数据冗余来减少表示数据的比特数
- 图像压缩可以分为有损数据压缩和无损数据数据压缩 ,在不同场合与使用方式可以采用不同人压缩方法
4. 图像压缩的三种冗余
- 如果能减少或者消除三种冗余的一种或多种,就能取得数据压缩的效果
- 编码冗余:如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余
- 像素冗余:由直方图的特征可知,可以用变长编码减少编码冗余。但是编码处理不会改变图像像素之间的相关性级别。也就是说用于表示每幅图像的灰度级的编码与像素之间的相关性为0,这些相关来自与图像中对象之间的==结构或几何关系==。相关性反映了图像中像素间的直接关系。
- 像素冗余反映图像中像素之间的相互关系:空间冗余,几何冗余,帧间冗余
- 因为任何给定像素的值可以根据与这个像素相邻的像素进行预测,所以单个像素携带的信息相对较少
- 对于一幅画,很多单个像素对视觉的贡献是冗余的。它的值可以通过与它相邻的像素值为基础进行预测
- 视觉心理冗余
- 人眼感觉到的图像区域亮度不仅取决于该区域的反射光,根据马赫带效应,在灰度值为常数的区域也能感觉到灰度值的变化
- 这是由于眼睛对视觉信息感受的灵敏度不同。这正常视觉处理过程中各种信息的相对重要程度不同
- 有些信息在通常的视觉过程中与另外一些信息相比不那么重要,这些信息被认为是心理视觉冗余的,去除这些信息并不会明显降低图像质量
- 由于消除心理视觉冗余数据会导致一定量信息的丢失,所以这一过程中通常称为量化
5. 图像的直方图、有损压缩和无损压缩
1.灰度直方图反映的是一幅图像中各灰度级像素出现的频率,以灰度级为横坐标,纵坐标为灰度级的频率,绘制频率同灰度级的关系就是灰度直方图。他是图像的一个重要特征,反映了图像灰度分布的情况
平均比特数简单说就是每种颜色出现的概率与其编码的比特数的乘积再平均,就是每种颜色的加权平均数
- 图像的无损压缩:无损压缩的压缩率一般为2-10。无误差压缩技术:减少像素间的冗余,建立一种可替代的图像表达方式;减少编码冗余:对这种表达方式进行编码
- 图像的压缩方法
6. Huffman编码
- 简介:这是一种可变字长编码,完全依据字符出现的概率来构造异字头的平均长度最短的码字。
- 基本思想:通过减少编码冗余来达到数据压缩的目的。首先统计各个字符出现的概率,再建立一个概率统计表,将最常出现的符号用最短的编码;最少出现的符号用最长的编码
- 编码效率:对n个信源符号,需要进行n-2次信源化简和n-2次编码分配。牺牲编码效率以减少编码构造的复杂性
7. 常见的压缩标准(MP3/JPEG/MPPEG)
8. JPEG压缩算法步骤
- JPEG标准:静态图像数据压缩标准,用于压缩灰度图像和彩色图像。两种基本压缩算法:==有损压缩算法==:以离散余弦变换为基础,在压缩比为25:1的情况下,压缩后还原得到的图像余原始图像相比,非图像专家难于找出他们之间的区别。==采用预测技术为基础的无损压缩算法==
- 算法概要:利用视觉系统特性,使用变换、量化和熵编码相结合的方法,以去掉或减少视觉的冗余信息和数据本身的冗余信息
- 使用正向离散余弦变换把空间域表示的图变换成频率域表示的图
- 使用加权函数对DCT系数进行量化,加权函数对人的视觉系统是最佳的
- 使用霍夫曼编码器对量化系数进行编码
该算法与颜色空间无关 - RBG和YUV之间的变换不包含在JPEG算法中
- JPEG算法处理单独的图像彩色分量,因此可以压缩不同颜色空间的数据,如RGB,YCbCr,CMYK
- 主要步骤
- (1)正向离散余弦变换(FDCT)。
- (2)量化(quantization)。
- (3)Z字形编码(zigzag scan)。
- (4)使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。
- (5)使用行程长度编码(Run Length Encoding,RLE)对交流系数(AC)进行编码。
- (6)熵编码(entropy coding)。
问题:
- “一幅512*512的灰度图”其中的数字是什么意思?指的是像素个数?
- 信息熵是什么?