画像から人物の行動を認識する技術は、多様なサービスにつながる重要なテーマです。行動認識が応用できる用途は、例えば、強盗や万引きなどの犯罪行動の未然防止、医療行為や工場作業の手順や作業忘れ防止などの正常性の確認、記録した行動を基にした作業効率化などが挙げられます。
画像から物体や人物行動を認識する技術として、人工知能(AI)が広く利用されています。私たちはこのAIを「人間知識型AI」と「機械学習型AI」に分類しています。
人間知識型AIは、機械学習の登場以前は一般的な手法でした。人間知識型AIは、人間の知識を利用して認識を行います。例えば、馬を認識するためには、人間が考える馬の特徴(顔が長い、たてがみがあるなど)をルールで記述して識別します。しかし、さまざまな物体の種類や見え方に関する細かな違いを全てルールに落としこむことが難しく、精度向上は頭打ちとなっていました。
一方、深層学習などの機械学習型AIは、コンピューターが大量のデータを学習し、物体の特徴の記述と識別などを行います。機械学習型AIは自動運転や画像検索、自動翻訳などさまざまな分野において実用化されています。
機械学習型AIの課題は、大量のデータを必要とすることです。例えば、顔認識用のデータ数は数億枚、人や車などの物体認識では数千万枚が必要です。またスポーツの行動認識においては数百万の動画が必要で、画像数にすると動画数の数十倍にもなります。あらゆる物体や行動を認識するためには、さらに膨大な数のデータが必要になると予想されます。
そして、最大の課題はそもそもデータが集められないときにどうするかということです。データが少ないと機械学習は高い性能を出せません。これは防犯分野においては致命的です。なぜなら、防犯の対象である空き巣や強盗は稀にしか発生しないため、データの収集は非常に困難だからです。また医療分野も同様に、病気によっては症例のデータが少なく、プライバシーの観点からもデータ入手が難しいという課題があります。防犯も医療もセコムの主要事業であるため、AIを事業に活用するにはこれらの課題解決が望まれます。
本テーマでは、少数のデータしか集められない課題の解決策として、人間知識型AIと機械学習型AIを融合する方法を研究しています。
データ収集が難しいケースの例として、「顔を隠して凶器で人を脅す強盗」を挙げます。これを機械学習型AIで見つけるためには、さまざまな顔の隠し方をした強盗のデータが必要です(マスクやサングラスの着用、マフラー等で顔を覆うなど)。一方、人間知識型AIは、「目鼻口が見えなければ顔が隠れている」などの人間の知識をもとに顔の隠蔽を識別します。ただし、人間は細かな違いを網羅することが不得手です。
そこで人間知識型AIと機械学習型AIを融合した例では、目鼻口の検出を機械学習型AIで学習し、いずれも検出されなければ顔が隠蔽であると判定します。この方法で、強盗などの収集しづらいデータを多数用意せずに、高精度に顔の隠蔽を認識できると考えています。
人間の知識を利用することで、機械学習型AIの透明性を高められます。人間が把握し切れないほどの、膨大なデータを入力して学習された機械学習型AIの出力は、人間には理解が及ばないものになります。これは「AIのブラックボックス化」として問題視されています。人間知識型AIと融合した機械学習型AIは、人間の知識に基づいているため、出力される結果は人間が理解しやすく、透明性が高くなります。
AIの透明性を高めることはセコムのサービスにとって重要です。セコムの防犯サービスでは、お客様の物件に設置されたカメラで画像認識を行い、侵入者などの異常を検知します。その後、セコムの管制員が画像認識の結果を確認して、人による対処が必要かどうかを判断し、セコムの対処員に指示をします。もし管制員が認識結果を理解できなければ、指示に支障をきたします。また、エンジニアが全てを設計したアルゴリズムと異なり、ブラックボックス化したAIは認識プロセスが不明のため改善が困難です。
技術の力を積極的にサービスに取り入れてきたセコムにとって、人間が理解可能なAIは今後必要不可欠な技術になると考えています。そのため人間知識型AIと機械学習型AIを融合する技術は、サービスを支える重要な役割を果たすテーマとして研究に取り組んでいます。