电子书:《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27

[复制链接]
查看167 | 回复1 | 2019-12-23 11:11:07 | 显示全部楼层 |阅读模式

《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27_1

《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27_1

《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27_2

《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27_2

《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27_3

《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27_3


内容简介:

申经网络的新
第3章人工神
3.4改进的反向传播算法
5.1,3 Mentee网络与 FinEt
参考文献
本章小结
第4章卷积神经网络
参考文献
102附录AY
118后记
参考文献

第1章
视觉计算简介
人们进行科学探索的目的是增强人类的能力。我们用火来烹饪食物,
减轻了胃来加工食物的负担。这使得人类可消化的食物量增加,加速了文
明的发展—这种文明水平是其他物种未达到的。轮子和交通工具的发
明,可使我们旅行的速度大大加快。飞机的发明实现了人类遨游蓝天的梦
想。人类发明和技术发展就是人类无止境地增强自己能力和探索未来
过程
这些进步归功于人类的神经系统。人类错综复杂的神经系统具有思
维、情感、推理、想象和晢学的能力。计算机视觉研究者偏向于人类视觉
系统( human vision),但对我们来说,认知视觉系统( cogni
system)是人类能力(包括智力)中最重要的部分。虽然人类视觉系统及
其认知决策过程是很快速的,但并不是所有生物中最强大的,如敏锐性或
夜视能力( Thorpe等人,1996; Watamaniuk和 Duchon,1992)。人类观
察世界局限于一段很窄的电磁波谱,而许多其他生物的视觉感知范围比我
们广得多。同时,人类也更容易产生许多视觉缺陷,如近视。基于上述考
虑,我们很自然地想要改善我们的视觉能力,弥补缺陷
多个世纪以来,我们发明了很多工具去超越人类肉眼的观察极限
望远镜、双筒镜、显微镜和放大镜,去观察更远或更小的物体。无线电

红外线和Ⅹ射线设备可使我们观察到可见光谱以外的范围。最近,利用干
涉仪发现了引力波,使得人类可用引力天文学来观察世界。虽然这些设备
增强了人类的视觉能力,但学者和哲学家们早已意识到眼睛只是一种成像
工具,真正“看到”的是大脑
从柏拉图、亚里士多德、查拉卡、欧几里德到达·芬奇都研究了眼
睛是如何观察世界的问题,但只有 Hermann von helmholtz在1867年所
著的《生理光学》中首次提出:眼睛只捕捉图像,而大脑才真正“看到”
和识别图像中的物体。在他的书中,他基于达·芬奇早期的工作,提出
了关于深度和色彩感知、运动感知的新理论。尽管一直以来人们通过各
种方式进行研究, Helmholtz则首次提出了无意识推理( unconscious
ference)的概念:不是所有的想法、思维和决定都是大脑有意识地完
成的。 Helmholtz注意到人类很容易受到视觉错觉的影响,引用了太阳围
绕地球旋转这个著名的误解案例,而事实上是地平线在移动。使用这种
类比, Helmholtz提出在人类无意识的情况下,是大脑在理解眼睛看到的
推断和理解正在观察的物体。这可能是第一次深入洞察神经视
觉的研究。一些近代早期的科学家(如 Blakemore和 Campbel)开始争
论一些现在已知的事实:大脑中有神经元负责估计物体的大小和方位感
( Blakemore和 Campbell,1969)。后来同时期的研究发现了人类视觉系统
感知和识别颜色、形状、方向、深度,甚至物体的更复杂原理( Field等
A, 1993: McCollough, 1965: Campbell Fn Kulikowski, 1966: Burton
1973)。
上述简短的历史叙述说明计算机视觉领域在丰富的人类技术发展中占
有一席之地。本书重在简洁介绍现代计算机视觉技术,因为这项技术大多

视觉计算简介
来源于人工神经网络,所以称为“神经”计算机视觉( neural computer
visIon)。为了确保本书的完整性,我们在一些基础章节的开始处,通过定
义基本概念、公式和方法,向读者介绍一般的视觉计算原理,之后的部分
简要介绍图像表示
1.1图像表示基础
任何计算机视觉处理流程都始于成像系统,它从景物中捕获反射出来
的光线,并将光信号转换成计算机可以读取和处理的图像格式。在计算
像技术发展的早期,图像通过把胶卷或印刷图像数字化后获得;而现在图
像通常直接由数码相机获取,并存储成称为像素的有序数字。目前已有很
多关于图像采集和照相机内部工作原理的教科书(例如光学、机械控制和
彩色滤波等)(Jain,1989; Gonzalez和 Woods,2002),因此对于这部分内
容本书只做简单阐述。图1-1展示了光线进人相机形成图像的采样(即通
过图像网格划分)和量化(即用有限的整数表示每个像素的颜色值
过程
图1-1图像的采样和量化

所有图像可以看作一个矩阵(或三个矩阵,如果分别考虑色彩平面)
该矩阵是景物的反射光在相机成像平面上的强度和色彩信息的量化数据
图1-1显示了景物在数码相机上成像的过程:相机中的传感器阵列决定了
图像的大小和分辨率。假设传感器阵列有nXm个传感器,则产生n×m
大小的图像。每个传感器捕获通过透镜人射到该传感器上的光线。对于
个b位图像,传感器为每个采样赋予0到(2-1)之间的值。假设一个8
位图像,那么采样值就在0到255之间,如图1-1所示。上述过程称为采
样和量化。所谓采样就是在连续视场中选择某些点;所谓量化就是把光强
的取值限制在有限的离散数值内。在相机设计和相机模型中,采样、量化
和图像形成涉及很多主题,感兴趣的读者可以查阅相关文献并进行更深入
的研究。彩色图像在照相机中通常会分别对应生成红(R)、绿(G)和蓝
(B)三个基色图像。如何产生这些R、G和B图像取决于相机,大多数消
费级相机在传感器平面前设置滤色器来捕获所有三个颜色通道的马赛克图
像,然后依靠“解马赛克”过程来创建全分辨率、分离的R、G和B
图像
有了这个装置,我们就能把图像表示为计算机中可存储的数字数据
称为图像的像素表示。每个图像是表示一个(灰色)或三个(彩色)或
更多(深度和其他场)通道的矩阵或张量。像素顺序与采样顺序相同
也就是采集像素的传感器的位置顺序。像素值越大,对应的颜色强度就
越大,这可能是图像最明显的表示方法。图像越大,像素越多。当要捕
获景物的细节时,传感器需靠得更近,产生的图像分辨率也越髙。如果
用两个大小不同的图像来拍摄现实世界的相同区域和视场,那么较大
像比较小图像具有更高的分辨率,这是因为较大图像可以分辨更多的细


#############################################


回复

使用道具 举报

泡沫之夏 | 2019-12-23 11:11:12 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则