分割是对像素力度进行分析,像PS一样每个像素都精确到,是最难的问题
如果给每个像素进行分类称之为语义分割
如果把不同的物体分别分割出来称之为实例分割
(语义分割同一种物体会分为一起,实例分割将同个物体区分开来)
关键点检测:
人体的关节检测连成像火柴人
AlexNet:首次用卷积神经网络
ResNet:深度残差网络,通过残差结构可以训练非常深的卷积神经网络,不再惧怕深度(首次超过人类水平)
不同模型的计算量、参数数量以及准确率之间的关系:
圈越大表示参数量越多
圆心越靠右表示计算量越大
圆心越靠上准确率越高
可以看到Resnet系列和inception-v3都表现不错
1.两阶段:先提取候选框,在对每一个候选框甄别,把置信度较高的框筛选出来,得出最后的结果(速度慢)
如Faster R-CNN要提取两千多个候选框,明显不会出现2000多个物体,算力和时间被消耗,但是准确率比较高
2.单阶段方法:不需要提取候选框,直接把图像喂进去就能得到结果