駅、空港、病院、商業施設などの人が行きかう場所には、多数の防犯カメラが設置されています。ただし、すべてのカメラの画像を人の目で確認して状況を常に把握することは多大な労力が必要です。そのため画像処理を利用して自動的に状況を把握できる技術が期待されています。
人の映る画像には、「年齢・性別・服装」「何を持っているか」「その人が誰か」「誰と一緒にいるか」などのさまざまな「属性情報」が含まれています。人間も視覚情報から属性情報を読み取り、誰が何をしているかなどの状況を把握しています。画像から自動的に属性情報を推定し、状況を把握できる技術が実現できれば、人の監視が行き届かない場合でも、助けや対処が必要な状況を早期に発見できると考えています(例:子供が迷子になっている、顔を隠した人がうろついているなど)。
ある対象者の状況を把握するためには、対象者が移動してもどこにいるかを把握することが重要です。人間は、場面が変わっても事前に覚えた服装や体格などの特徴をもとに人を見分け、特定しています。本テーマでは対象同定技術を用いて、映像に映った人物があらかじめ登録された人物と同じかを特定しています。この技術を活用すると、例えば建物の入口でそれぞれの人物の特徴を登録しておき、迷子や不審人物などの問題が起きた際に、該当する特徴の人物を検索するという活用も考えられます。
対象同定技術は、行動認識や顔認証などの他の技術と組み合わせることで、対象者に関する異なる時間の情報を結び付けられます(「過去にどのような行動をしてきたのか」「誰といたのか」、「途中から物を所持している」など)。対象者の過去から現在までの詳細な状況を把握できれば、人がより的確に対応できるだけでなく、特定の時間と場所を超えた行動履歴や動画要約への応用も期待できます。
深層学習など画像認識AIは、事前に収集した大量の画像データを基に構築されているため、学習データに内在するバイアス(偏り)を学習してしまう危険があります。そのため、現実データの認識結果に対して想定外のバイアスが存在しないか確認しなければなりません。つまり、それぞれの現場で予測結果の信頼性を保つ技術が必要です。本テーマでは、想定データと現実データの特徴を比較して変化を検知し、誤った予測を防ぐ仕組みを検討しています。また予測結果が、過去のデータと比較して大きく外れている場合は、ルールベースの仕組みなど別の方法で予測することも検討しています。
画像認識AIは、人間では対応しきれない膨大な情報を短時間で迅速に処理する利点があります。しかし、AIには最終判断が曖昧になるため、最終的にはAIの認識結果を基に柔軟に対処できる人間の力が必要です。
セコムのサービスでは、人間と画像認識AIが連携した「マン・マシンシステム」を導入しています。例えば、現場に設置されたカメラ映像から、画像認識AIが異常を検知した場合、セコムの管制センターに情報が送られます。次に管制員が認識結果を確認して、的確な現場対応を決定します。認識結果が誤っていた場合、現場のデータと人間の判断を基に画像認識AIを改善できます。セコムのサービスは、人間とAIのバランスの取れた共存関係で成り立っています。
AIの認識結果を確認して最終判断するのは人間です。そのため、的確な判断ができるように人間とAIの間にあるインタフェースも重要な部分といえます。技術がどれだけ発展しても、すべてをAIに任せることができない分野もあります。セキュリティ事業において大切なことは、安心を提供することです。異常が起きたとき、家族に何かあった時に、人が助けに来てくれることは安心に繋がります。これは、AIや機械では代替できない役割です。最後は「プロフェッショナルな人間」が対応する、というのは安心の根幹であり、セコムのサービスにおいて欠くことのできない理念だと考えています。