セコム IS研究所
セコムウェブサイト セコムウェブサイト
IS研究所について 研究紹介 コラム 対外活動 研究員紹介 採用情報


タイトル - 「要約映像」の研究

 録画された監視カメラ映像の時間長を短縮する技術を開発した。

 監視カメラにより撮影された映像を背景と登場する物体に分離し、背景の表示速度を物体の表示速度より速くなるように映像を加工した後、これらを合成することで、物体の観察しやすさを維持した状態で映像全体の時間長を短縮する。屋外の駐車場を撮影した映像に対して本手法を適用したところ、6時間の映像を22分に短縮することができた。

 また、IPカメラを入力とし、実時間で本処理を行い、現在までの録画映像をただちに時間長を短縮した状態で再生するシステムを試作した。試作システムでは、背景と物体を合成する処理に工夫を加え、精密な物体領域を必要としない処理構成とした。これにより、領域抽出を正確に行えない場合でも圧縮映像の生成が可能となり、また、総合的なコストが削減された結果、実時間処理が実現した。


目次
 

はじめに
  「要約映像」の仕組みと効果
  試作システム
  おわりに


はじめに

 多くの監視カメラシステムでは、撮影した映像を専用の録画装置によって記録している。記録された映像は事件が発覚した時に、状況を観察するために再生されるのが一般的である。今日の防犯用録画装置はハードディスクを使用したデジタル記録方式であり、事件の発生時刻がおおむね判明している場合は、時刻検索によってすばやく当該映像を再生できる。しかし、発生時刻についての手がかりが無い場合、事件に関係する可能性があるすべての録画映像を目視観察する作業が必要となる。観察作業を効率化する手段として、映像に変化のある部分をタイムチャートとして表示する機能、変化のある部分だけを次々と再生する機能を持った録画装置が実用化されている。我々は、観察のしやすさを維持したままで映像の時間長を短縮することで、さらに観察作業を効率化する方法を開発した。

 

「要約映像」

 例えば、3人の人物がつぎつぎとカメラの視野に現れて立ち去る映像を想定する(映像1 時間長27秒)。一人の人が立ち去ってから次の人が現れるまでの映像は観察の必要がなく、この空白部分を取り除いて3人が撮影されている映像を順に表示すれば一定の時間短縮がはかれる(映像2 時間長22秒)。次に3人の人物が撮影されている映像を順に表示するのではなく、同時に表示する(映像3 時間長9秒)。

映像1 3人が次々と現れる映像
(1.7MB)



映像2 映像1から「空白部分」を取り除いた映像
(1.3MB)



 
映像3 映像1から作成した「要約映像」
(560KB)
 


  このように、異なる時間の映像を同時に表示することによって大幅な映像の時間長短縮が可能であり、どんな人物が現れたかを把握する範囲の観察が可能である。そこで、このようにして時間長を大幅に短縮した「要約映像」によって、映像の内容を大雑把につかみ、不審な人物についてのみ通常の表示による映像を観察することで、長時間の映像を効率的に観察することが出来る。

 実際の「要約映像」では、多数の人物の映像を同時に表示するのではなく、現れた順序で、しかし、実際に現れるときの時間間隔よりも短い間隔で人物を登場させる。これにより、短縮しようとする映像に現れるすべての人物が要約映像の最初にいっせいに現れて画面を埋め尽くしてしまうことなく、長時間の映像について「要約映像」を生成することが出来る。このようにして6時間分の映像(映像4)の「要約映像」(映像5)を作成したところ、22分に時間長を短縮できた。

映像4 長時間の監視映像
(6時間分の映像のうちの30分間分を
30倍速で表示)
(3.8MB)

映像5 映像4の「要約映像」
(6時間分の要約映像を30倍速で表示)
(2.4MB)


試作システム

 「要約映像」の生成および「要約映像」と通常の表示を切替えて監視映像の観察を行うことができるシステムを試作した。IPカメラ、録画用PC、表示用PCによって構成した。録画用PCにてIPカメラの映像を一定間隔で取得、録画すると共に、画像を升目上に区切った各ブロックの画像変化の有無を検査し記録する。表示用PCでは録画用PCから画像変化有無情報と録画映像を取得して、任意の過去の時刻の「要約映像」をリアルタイムに生成し表示する。

 「要約映像」の生成処理は、監視映像から人物領域を抜き出す処理、背景映像の適切な時間に抜き出した人物領域の映像を合成する処理から成っている。試作したシステムでは、人物領域を抜き出すための事前情報としての各ブロックの画像変化の有無情報の作成までを録画と共に行い、表示用PCで人物領域の抜き出しと合成を行っている。また、人物領域は精密に作成せず、ブロックの集合として概略的に取り扱っている。人物領域の抜き出しと合成をブロック単位で行うことで、人物領域抽出処理のエラーに対してロバストとなり、また、処理コストが削減される。一方で、生成される「要約映像」にブロック状の明度差が現れることがあるが、概略を把握する上で障害にならないと考えた。

 

おわりに

 静止画像の場合、多数の画像の内容を概観するための表示手段としてサムネイル表示が一般的である。動画像の場合、動画編集ソフトウェアではシーンの変わり目の静止画像を並べた表示がよく用いられているが、動画像に含まれる人物の挙動を概観する表現方法はあまり見かけず、ゴルフスイング等のスポーツ分析で動画像を一枚の静止画像に重ねて表示する手法が利用されている程度と思われる。本件では監視カメラ映像に特化した形で動画像をコンパクトに、かつすばやく内容を概観できる「要約映像」を開発した。



  一覧へ戻る

ページトップへ