高柳賞受賞記念インタビュー(安田浩先生2)|安全安心な科学技術の振興:セコム科学技術振興財団

安田浩財団理事 東京電機大学 未来科学部学部長 東京大学名誉教授 高柳記念賞受賞記念インタビュー「画像・映像をコンパクトに表現するための符号化方式および通信に関わる研究と国際標準化への貢献」


静止画の圧縮形式がJPEGに標準化された功績で、安田先生は“JPEGの父”と呼ばれるようになられました。つぎに動画のMPEGへの標準化が成功した理由についてもお聞かせください。

 キーポイントは“人集め”でしたね。動画圧縮技術について最先端の研究をしている人、ほぼ全員に声をかけ、まずは会議に出席してもらうように促しました。普通、この手の会議には20~30人規模となりますが、最終的に300名以上となり、多くの人を巻き込むのに成功したわけです。300名の会議の運営というのは、ご想像のようにたいへんなものがあります。ですが、スタートの時点でたいへんな思いをしておくと、あとはスムーズに流れるものです。

当時、動画圧縮で最先端の技術をもつ技術者がほぼ全員で300名程集まりましたから、この会議で決まったことが、世界中に広がるスピードは速かったですね。

 ただ、標準化仕様を決める時に、規則でガチガチにしばることだけはしたくありませんでした。会議では要素技術に徹しながら、各国の研究者達に競争の余地を残すように意識して運営していました。こうすることでMPEG2→4→AVCへと進化させることができたと思っています。

ところで、動画の圧縮は静止画とは違い、音声の圧縮とそれに同調させるという作業がプラスされますが。

 1980年代後半に、KDDとNTTが共同で、夢の技術といわれていたテレビ電話を作りました。すると「画像は送られてきたが音が聞こえない」というようなことが起こってしまいました。音の符号化の圧縮方式が違っていたからです。標準化会議では、研究者同士で「他人の技術」を検証することが重要です。とはいえ、実際には誰もやろうとはしませんから「日本がフランスのものを検証します」というように自ら手を挙げることからスタートしたのです。すると、困ったのはアメリカです。「日本に検証されると自分達のあずかり知らぬところで話が進んでしまうと不利になる」と心配したのでしょう。結果、互いの検証に参加してくれるようになったのです。これによりたった2年ほどで映像の圧縮技術をMPEGに統一することができました。日本が音頭をとり、縁の下の力持ちになることによってMPEGは成功したわけです。

日本が引き下がることで、損をした部分があったのでは。

 そう思われるかもしれませんが、実際は違いました。日本の各社は、検証に参加したことによりその後、特許を多数申請し、MPEG関連の特許全体の60%ほどの収入を得ることができたのです。「これで私も少しはお国のために貢献できたのかな」と思いました。

動画圧縮技術において安田先生が研究されてきた分野について、お教えいただけませんか。

 「動き補償フレーム間予測」と言われるものがあります。テレビの映像というのは、1秒間に30枚の画像が次々に映し出されますが、その1/30秒の間に、画像がどれだけ変化するかというと、ほとんど変化しないことがお解りいただけると思います。そこで「動いて変化した領域だけをデータ化して送る」ということが圧縮技術の基本となります。静止している領域は何度同じものを送信しても時間の無駄だからです。ではどのようにして、動いている領域を抽出するかといいますと、1フレーム目と2フレーム目、隣り合うフレームの差分を計算します。これをフレーム間差分といいます。

この差分だけのデータを送信すれば、もとの動画よりもデータ量をかなり圧縮できたことになりますよね。

 その通りです。ですが、研究をはじめた当初は、なかなかうまくいかないことが多かったです。たとえば現在でも解決できていない問題に、テレビなどで車のホイールなどが回転しているシーンがありますが、あれは逆に回ってみえるでしょう。1/30秒の間に、対象が4ドット、5ドットというように、きっちりとした整数分だけ動いてくれればいいのですが、実際には4.5ドットのように、小数点以下の端数分が動いてしまうのです。これがうまく処理できていないと「折り返し雑音」と呼ばれるものが発生し、それらの「雑音」が重なって映像となってしまうと、実際には順回転しているホイールが逆回転してみえてしまうのです。木に茂る何百枚もの多くの葉を写していて、カメラが少しでも動くと、実際に葉は動いていないのに、葉全体がざわついて見えるのも「折り返し雑音」ですね。