最近在自动图像标注领域有哪些计算机视觉方面的综述/调查论文?
随着互联网的发展,图片的数量呈指数级增长。为了提供满足用户需求的图像,重要的一点之一是正确标记图像。由于现在网络上很多没有标签的图片,通过文字检索图片很困难。众所周知,随着图像的爆炸式增长,手动标记图像的时间成本和人工成本更加昂贵。
此外,手动标记图像的结果因人而异。从上面讨论的内容来看,自动图像注释具有很大的潜力。如果我们提高图像标注的准确性,会有巨大的商业利益。
当前的自动图像注释旨在将有限词汇表中的一些相关单词分配给没有标签的图像。大多数自动图像标注算法的过程是:首先,从训练图像和测试图像中提取特征。其次,根据训练数据生成标注模型。最后,根据测试图像的特征生成注释。
从标注的过程来看,本质上有两个因素影响结果,一个是我们从训练图像和测试图像中提取的特征,另一个是标注模型。
尽管如此,自动图像标注仍然存在一些问题,之前的研究人员已经做了大量的工作来尝试优化。第一个是算法无法弄清楚每个标签对应于图像的哪个区域。标签可以对应于图像的一个区域,也可以对应于整个图像。其次,低级图像特征不能准确表达图像的含义,导致计算两幅图像之间的距离时出现错误。
本站所有相关知识仅供大家参考、学习之用,部分来源于互联网,其版权均归原作者及网站所有,如无意侵犯您的权利,请与小编联系,我们将会在第一时间核实并给予反馈。