摘要:随着信息化建设的加快,图像和视频数据呈现爆炸式增长。卷积神经网络的不断更新优化使得行为识别研究取得了较大的进展。因此,我们需要在真实的复杂环境中实现行人检测并识别行为类别,这是一个值得探索和讨论的话题。本文提出了一种新的模型,基于 ResNeXt 模型并设置多尺度特征提取单元的残差神经网络,能充分挖掘输入的特征信息,丰富特征维度,解决特征信息尺度单一的问题。为了验证我们改进的算法性能,我们进行了多组识别场景的测试,其中包括UT-interaction数据集、UCF11数据集、UCF101数据集和CAVIAR数据集。我们的模型在以上数据集上的识别准确率分别达到了99.9%、99.5%、97.3%和100%。根据结果显示,我们的模型在各项识别任务中均表现出了较高的水平,证明了模型的卓越性能。