专利内容由知识产权出版社提供
专利名称:基于级联神经网络的视频动作识别及定位算法专利类型:发明专利
发明人:周圆,李鸿儒,杨建兴,毛爱玲,李绰申请号:CN201811077637.5申请日:20180915公开号:CN109325435A公开日:20190212
摘要:本发明公开了一种基于级联神经网络的视频动作识别及定位算法,步骤(1)、生成候选区间并扩展,把候选区间分为三类;步骤(2)、将扩展后的候选区间中的彩色图像进行结构化;步骤(3)、利用视频单元时/空域特征提取网络进行视频单元级别的时/空域特征的提取,获得二维特征图F;步骤(4)、得到全局时域特征向量和全局空域特征向量f′,f′;步骤(5)、将全局时域特征向量和全局空域特征向量f′,f′输入动作分类器、完整性分类器和候选区间坐标调整器中,计算损失函数并优化网络参数;步骤(6)、得到最终预测结果即以取整后的loc+Δloc帧为中心、宽度为取整后的size+Δsize帧的范围的第m类动作。与现有技术相比,本发明能够精准判断原始视频中从开始到结束的区间内是第几类动作。
申请人:天津大学
地址:300072 天津市南开区卫津路92号
国籍:CN
代理机构:天津市北洋有限责任专利代理事务所
代理人:李素兰
更多信息请下载全文后查看