⼈体⾏为识别

成员

  • 谷红岩 2120141007
  • 张琴 2120141084

描述

我们在Weizmann⾏为数据库上对⼈体的⾏为进⾏识别。Weizmann数据库中含有10个不同的⾏为类别:⾏⾛、跑步、跳⾛、侧⾝⾏⾛、弯腰、单⼿挥、双⼿挥、原地跳跃、展开跳跃、单脚跳⾛。每个类别含有9个到10个视频,是由不同的表演者表演的相同⾏为。

在本实验中,我们打算采⽤Dollar提出的兴趣点模型来作为描述⾏为的特征。以时空兴趣点为中⼼沿x, y, t ⽅向提取时空窗⼜视频块,再沿这x, y, t ⽅向分别计算视频块灰度值梯度,作为梯度特征向量,得到的梯度特征向量都具有很⾼的维数,可能会遭遇所谓的“维数灾难”,因此需要进⾏降维处理,⽐较有代表性的降维技术包括 PCA,LLE,LDA等。

通过聚类⽅法⽣成表观单词,例如k-means,即每个聚类中⼼就可以被定义为⼀个表观单词,表观单词的集合被称为表观词袋(bag of words),完成表观词袋的构建后,可以对表观单词进⾏投票,⽤表观单词出现频率的统计直⽅图作为该图像序列最 后的特征表⽰。

在识别阶段,我们可以采⽤⽀持向量机(Support Vector Machine,SVM)对⾏为进⾏分类。SVM模型中我们将选取线性核函数⽤于识别。