来呀,快活呀~


  • 首页

  • 归档

  • 标签

  • 关于

  • 搜索
close
来呀,快活呀~

YOLO 论文阅读

发表于 2017-02-04

YOLO(You Only Look Once)是一个流行的目标检测方法,和Faster RCNN等state of the art方法比起来,主打检测速度快。截止到目前为止(2017年2月初),YOLO已经发布了两个版本,在下文中分别称为YOLO V1和YOLO V2。YOLO V2的代码目前作为Darknet的一部分开源在GitHub。在这篇博客中,记录了阅读YOLO两个版本论文中的重点内容,并着重总结V2版本的改进。

Update@2018/04: YOLO v3已经发布!可以参考我的博客论文 - YOLO v3。

YOLO V2的检测效果示意

阅读全文 »

来呀,快活呀~

CS131-立体视觉基础

发表于 2017-02-02

数字图像是现实世界的物体通过光学成像设备在感光材料上的投影。在3D到2D的转换过程中,深度信息丢失。如何从单幅或者多幅图像中恢复出有用的3D信息,需要使用立体视觉的知识进行分析。如下图所示。这篇博客对课程讲义中立体视觉部分做一整理,分别介绍了针孔相机模型和对极集合的基础知识。
立体视觉应用

阅读全文 »

来呀,快活呀~

CS131-描述图像的特征(SIFT)

发表于 2017-01-30

SIFT(尺度不变特征变换,Scale Invariant Feature Transform),最早由Lowe提出,目的是为了解决目标检测(Object Detection)问题中提取图像特征的问题。从名字可以看出,SIFT的优势就在于对尺度变换的不变性,同时SIFT还满足平移变换和旋转变换下的不变性,并对光照变化和3D视角变换有一定的不变性。它的主要步骤如下:

  • scale space上的极值检测。使用DoG在不同的scaleast和image position下找到interest point。
  • interest point的localization。对上面的interest point进行稳定度检测,并确定其所在的scale和position。
  • 确定方向。通过计算图像的梯度图,确定key point的方向,下一步的feature operation就是在这个方向,scale和position上进行的。
  • 确定key point的描述子。使用图像的局部梯度作为key point的描述子,最终构成SIFT特征向量。

SIFT图示

阅读全文 »
来呀,快活呀~

CS131-描述图像的特征(Harris 角点)

发表于 2017-01-25

feature是对图像的描述。比如,图像整体灰度值的均值和方差就可以作为feature。如果我们想在一副图像中检测足球时,可以使用滑动窗方法,逐一检查窗口内的灰度值分布是否和一张给定的典型黑白格子足球相似。可想而知,这种方法的性能一定让人捉急。而在image matching问题中,常常需要将不同视角的同一目标物进行matching,进而计算相机转过的角度。这在SLAM问题中很有意义。如下图所示,同一处景观,在不同摄影师的镜头下,不仅视角不同,而且明暗变化也有很多差别,右侧的图暖色调更浓。这也告诉我们,上面提到的只使用全局图像灰度值来做feature的做法有多么不靠谱。

那么,让我们脱离全局特征,转而将注意力集中在局部特征上。这是因为使用局部特征能够更好地处理图像中的遮挡、变形等情况,而且我们的研究对象常常是图像中的部分区域而不是图像整体。更特殊地,在这一讲中,我们主要探究key point作为local feature的描述,并介绍Harris角点检测方法。在下一节中介绍SIFT特征。

image matching example

阅读全文 »
来呀,快活呀~

CS131-边缘检测

发表于 2017-01-24

边缘(Edge)在哺乳动物的视觉中有重要意义。在由若干卷积层构成的深度神经网络中,较低层的卷积层就被训练成为对特定形状的边缘做出响应。边缘检测也是计算机视觉和图像处理领域中一个重要的问题。

边缘检测图示

阅读全文 »

来呀,快活呀~

CS131-线性滤波器和矩阵的SVD分解

发表于 2017-01-23

数字图像可以看做$\mathbb{R}^2 \rightarrow \mathbb{R}^c$的映射,其中$c$是图像的channel数。使用信号与系统的角度来看,如果单独考察某个channel,可以将图像看做是二维离散系统。

SVD图示

阅读全文 »
来呀,快活呀~

CS131-线代基础

发表于 2017-01-22

CS131课程(Computer Vision: Foundations and Applications),是斯坦福大学Li Feifei实验室开设的一门计算机视觉入门基础课程,该课程目的在于为刚接触计算机视觉领域的学生提供基本原理和应用介绍。目前2016年冬季课程刚刚结束。CS131博客系列主要是关于本课的slide知识点总结与作业重点问题归纳,作为个人学习本门课程的心得体会和复习材料。

2018/03/20 Update: 这门课的2017秋季课程已经全部放出来,和上个版本相比,作业采用Python实现,同时加入了更多机器学习的内容。详细内容见:CS131 Computer Vision@Fall 2017

由于是个人项目,所以会比较随意,只对个人感兴趣的内容做一总结。这篇文章是对课前线代基础的复习与整理。
线性代数词云

阅读全文 »
来呀,快活呀~

使用 Visual Studio 编译 GSL 科学计算库

发表于 2016-12-16

GSL是一个GNU支持的科学计算库,提供了很丰富的数值计算方法。本文介绍了GSL库在Windows环境下使用VisualStudio进行编译构建的过程。

GSL is GNU Sentific Library

阅读全文 »

来呀,快活呀~

Hello World

发表于 2016-12-16

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

Hexo

阅读全文 »

来呀,快活呀~

Windows环境下使用Doxygen生成注释文档

发表于 2016-12-16

Doxygen 是一种很好用的代码注释生成工具,然而和很多国外的工具软件一样,在中文环境下,它的使用总是会出现一些问题,也就是中文注释文档出现乱码。经过调试,终于是解决了这个问题。

Doxygen

阅读全文 »

1…8910
一个脱离了高级趣味的人

一个脱离了高级趣味的人

相与枕藉乎舟中,不知东方之既白

91 日志
36 标签
RSS
GitHub 微博
© 2021 一个脱离了高级趣味的人
由 Hexo 强力驱动
主题 - NexT.Muse