Vol.33 No.4 (2000.1) 発  行:視聴覚情報研究会(AVIRG) 代表幹事:伊 藤 崇 之      〒157-8510 世田谷区砧1-10-11      日本放送協会放送技術研究所      TEL 03-5494-2361      FAX 03-5494-2371 T.11月例会報告 「情報空間の知覚化」 講演: 広池 敦 氏(日立製作所 中央研究所) 報告: 影広 達彦(日立製作所 中央研究所) 《概要と感想》 5,6年ほど前までは,一般的なパソコン で多量のカラー画像を扱うことは非現実的 な事であったが,ここ最近は動画処理でさ えも可能になりつつある.これは,コンピ ュータの計算能力と記憶容量の爆発的増加, ネットワークインフラの整備,デジタルカ メラやカラープリンタ等の入出力デバイス の充実による恩恵である.このようにハー ドウエアの発展により膨大なデータを処理 する事は可能になったが,ユーザーとハー ドウエアとの橋渡しとなるインターフェイ スの対応は充分とは言えない.コンピュー タのインターフェイスは,CUIに始まり,こ こ10年ほどでGUIが主流となったが,多量な データをユーザーに直感的に知覚させるイ ンターフェイスはまだ存在しない.今回の 広池氏の講演は,このような多量なデータ を用いたユーザーとコンピュータの橋渡し の一つ提案であった. 広池氏は,格納された莫大な画像をユー ザーにどうやって知覚させるかという大き な課題に対し,3次元のVR空間を用いる手法 を試みている.画像中の類似性を基準とし た分類手段は多数見受けられ,市販のアプ リケーションやシェアウエア等でも実現さ れている.この類似性の評価方法は様々な 基準が考えられるが,一長一短がありユー ザーの意図している分類に適応できる保証 は無い.また,ユーザーの分類目的も刻々 と変わり,ある分類目的には有効な手法で も,次のオペレーションによる別の分類目 的には全く役に立たない場合も多々ある. このような課題に対し,広池氏は画像を分 類するというスタンスからではなく,シス テムは人間の感覚器官の延長であり,ユー ザーに対しなるべく多くのデータの出会え るようにするべきであると主張している. 提案されたインターフェイスは,莫大な 画像データ中のそれぞれの画像から多様な 特徴量を抽出し,選択されたキー画像を原 点とし,ある3つの特徴量を軸とした3次元 空間に縮小画像をマッピングしユーザーに 表示する[1].ユーザーは,特徴量の軸を自 由に切り替えたり,視点を動かしたり,キ ー画像を選択し直したり出来る.本インタ ーフェイスをビデオで見せていたが,縮小 画像がキー画像を核としてクラスタを形成 し,特徴量の軸を変更するごとに,まるで 意思を持ったかのように画像が移動する. また,キー画像を変更すると新しい核に向 かい画像が群れをなして集まってくる.こ のデモを見ると,画像を分類するという目 的というより,莫大な画像データ中を漂っ て遊ぶという感覚に近い.これは,ある目 的を持ってコンピュータと接するという立 場ではなく,無目的にコンピュータと接し 楽しむという立場であると思う.最近ネッ トサーフィンをする際にも,何かを調査す る目的があって行う場合と,大して目的は 無いがネットワーク上を漂って好奇心を満 足させるという場合がある.この後者の場 合を,大量の画像データ空間中で実現でき るインターフェイスであるよう感じた. 個人的な意見であるが,画像の特徴量を もっと人間に一般的に理解しやすい軸に変 換すれば,より馴染みやすいと思われる. また扱うデータを画像データに限らず,音 声,動画,テキスト,Webアドレス,メイル アドレス,アプリケーション等のコンピュ ータ内で存在しうるデータ全てを用いて,3 次元VR空間上で関連付けられてクラスタリ ングすると,新しいインターフェイスの概 念になるかもしれない.例えば,ユーザー があるタスクを行おうとすると,3次元VR 空間内で様々なデータがクラスタを形成し, その中でユーザーが忘れていたデータを再 発見し,また新たなタスクへのきっかけに なる.このように,非常にユーザーに対し て親和性の高いインターフェイスになりう る. 提案されたインターフェイスは,多数の 縮小画像を3次元空間にマッピングし,ユー ザーの操作に対しインタラクティブに反応 する必要があるため,コンピュータに多大 な能力を要求する.ビデオで見せていたデ モも,実際にはSGI製のワークステーション を用いて動作させていると話していた.現 状の一般的なPCでは実用にならないであろ うが,近年のCPUの計算能力向上,メモリ単 価の下落,ビデオチップの性能向上を見る と,近い将来市販のPCでも動作可能になる であろう.ある意味,このような計算コス トの高いインターフェイスを一般ユーザー が用いるようになれば,年々倍増するデバ イス能力の使い道が見付かるかもしれない. 今後は,コンピュータのパワーをユーザー とのインターフェイスに費やすことが,大 きな流れになっていくものと思われる. 《参考文献》 [1] 広池, 武者, 杉本, “VR空間を用いた画像特 徴量空間の可視化− 画像データベースの 検索・ブラウジングのためのユーザインタ フェイス”,信学技報,PRMU98-86, pp.17-24, 1998. 「撮像面上に処理機能を統合したイメージセンサ」 講演: 浜本 隆之 氏(東京理科大学) 報告: 川田 亮一(KDD研究所) 《概要と感想》 本発表は,スマートセンサ(撮像面上に 処理機能を統合したイメージセンサ)につ いてのものであった.内容としては,その 研究動向に始まり,浜本氏らが提案する次 の4種類のイメージセンサの解説が行なわ れた.  (1) 動画像圧縮イメージセンサ  (2) 適応蓄積時間イメージセンサ  (3) A/D変換搭載イメージセンサ  (4) 空間可変サンプリングセンサ まず,スマートセンサの必要性が説明さ れた.これには,画像入力部が抱える課題 の解決がある.撮像素子は,画像処理シス テム全体の画質を支配する.このため,高S /N化,高感度化,高ダイナミックレンジ化, 高速度化,高精細化,小型化,低消費電力 化が必要である. すなわち,イメージセンサの高機能化と いう課題がある.これには,(1)イメージセ ンサと制御回路の統合,(2)イメージセンサ と画像処理の統合が含まれる.目的として は,カメラの小型化や,高速化,画像処理 システム全体の処理性能の向上があげられ る. 続いて,スマートイメージセンサについ てより詳細に説明された.これは,撮像面 状での画像情報の2次元性を利用し,おもに アナログ回路による高速並列演算を行なう. また,処理結果のみを転送することにより, 情報量の圧縮が可能である.さらに既存の 規格のビデオレートに束縛されず,柔軟な 読みだし形態の実現が可能である.これに は,XYアドレスによるランダムアクセスや, 多重解像度出力などがあげられる.従って, 新しい画像アルゴリズムの開発の可能性が 広がってくる.例えば,蓄積された中間画 像の利用や,高フレームレートでの動き予 測などの処理である. スマートイメージセンサを使用すること によるシステム全体に対する効果としては,  (1) 処理の高速化(例:視覚情報でロボ ットの動作を直接制御)  (2) 高速/高精細撮像など撮像性能の改 善  (3) 小型化  (4) 低消費電力化 などがあげられる.また,課題としては, (1)処理アルゴリズムに関し,実装上の物 理的制約があることや,アナログ回路の場 合の演算精度の低さ(2)撮像性能の劣化(3) 処理の特定化/汎用性の欠如があげられる. しかし,これらは,アルゴリズムや回路, 構造の工夫により解決されると考えられる. スマートセンサの研究は,アプリケーシ ョンやアルゴリズムからのアプローチと, デバイスやインプリメンテーションの分野 からのアプローチがあり,浜本氏らは前者 に属するとのことである. スマートイメージセンサの先駆的研究と しては,80年代後半にカリフォルニア工科 大学のC. Mead教授のグループにより行なわ れた,人間の網膜の平滑化処理機能の模擬 がある.以来,おもにニューラルネットワ ークやマシンビジョンの分野で,次のよう な研究が行なわれてきた. (1) エッジ検出  (2)動き検出  (3)位置方向検出  (4)平滑化  (5)距離計測センサ これらに共通する特徴として,撮像より も処理重視であること,アナログ演算によ るグローバルな処理であること,処理回路 の中に開口部をもつことがあげられる. ここで,スマートセンサの中に実現する アルゴリズムの実装方法として,アナログ 回路にするかディジタル回路にするかとい う問題がある.アナログ回路の特徴として, 高速処理可能,回路の小規模化が可能,制 御動作が簡単ということがある.一方,デ ィジタル回路の特徴としては,処理の高精 度化が可能,回路規模が大きいということ がある.従来は,アナログ処理による検討 が多かった.しかし,最近では,東京大学 計数工学科石川研究室の0.35ミクロンCMOS プロセスを用いたディジタル処理スマート センサ開発のように,ディジタル処理のも のも増加している.今後,CMOS技術の急激 な進展にともない,ディジタル処理の搭載 がますます増えていくのではないだろう か? スマートセンサの処理構成としては, (1)画素並列処理 (2)列並列処理 (3)行並列処理 (4)シングル処理 がある.(1)は高速処理が可能だが,開 口率が犠牲となる.(2)(3)は,それぞれ 列,行に1個の処理回路を有する.撮像部が 独立のため,開口率は従来センサと同等に 保てる.また,1行または1列ずつの読みだ し及び処理のため,従来のイメージセンサ 技術と親和性がある.また,(4)は,セン サ毎に処理回路を有するため,並列処理が 必要となる. スマートイメージセンサ開発におけるト レードオフは,次のようにまとめることが できる.(1)アナログ処理/ディジタル処 理(2)センサ内処理/周辺チップによる外 部処理.これらは,小型化/高速化や,シ ステムコスト/汎用性のトレードオフとい え,アプリケーションに応じて最適な選択 が決まるものといえる. 最近になってスマートセンサの研究が盛 んになった背景としては,試作環境の充実 があげられる.LSIチップ試作製造サービス 機関の誕生により,大学やベンチャー会社 がプロトタイプLSIを簡単に試作すること が可能となった.これらの例としては,米 MOSIS(11プロセス,77ラン),仏CMP(8プロ セス,44ラン),東大VDEC(3プロセス,14 ラン)がある.ここにプロセス数とは選択 可能な製造方式のメニューの数であり,ラ ン数とは,年間に何回注文を受け付け可能 かという数字である. 続いて,具体的研究例として,浜本氏ら のグループによる動画像圧縮イメージセン サの例が説明された.これは,高解像度・ 高フレームレートの画像を,圧縮すること により出力するものである.条件つき画素 充填法などにより実現されている.具体的 応用例として,この圧縮センサチップを2 個用いたステレオカメラシステムの試作が あげられる. また,同じグループによる適 応蓄積時間イメージセンサは,ダイナミッ クレンジの改善や解像度の向上に大きな効 果がある. この他,A/D変換内蔵センサや,空間可 変サンプリングセンサについて紹介された. とくに,空間可変サンプリングセンサは, 今後様々なフォーマットが混在することに なるであろうディジタルテレビの分野への 親和性が非常に大きいように感じた.例え ば,センサ自体にそのようなサンプリング 可変機能を搭載することにより,プログレ ッシブやインタレース,フレームレートや 水平/垂直画素数など任意のフォーマット で画像信号を出力できるカメラが実現でき るのではないだろうか? さらには,MPEG-2 エンコーダ処理をも搭載することにより, マルチフォーマットMPEG-2 TS出力が可能な ディジタルTV用カメラが考えられる.これ らは,撮像の段階から目的のフォーマット で出力することが可能なため,方式変換に よる画質劣化を原理的に含まず,各フォー マットの特長を最も良く引き出せることに なるといえる.また,現在では装置化にコ ストがかかる超高精細動画像カメラにも, 応用可能と思われる.出力帯域幅が問題の 場合は,センサで圧縮して出力すれば良い. 感度の問題さえクリアできれば,5kHzのフ レームレートでも実現可能とのことである. さらに,会場からは,例えばPentiumなど の高機能CPU及びメモリを,センサと同一チ ップ上に搭載することで,汎用性と高度処 理機能を兼ね備えたチップが実現できるの では,という意見も出され, 盛会のうちに 研究会終了時刻となった. 今後のこの分野のさらなる発展に期待し て筆をおくこととしたい. U. 1月例会予定 AVIRG 2000年1月例会は, 日時: 1月20日(木)14時〜17時 場所: 東京大学工学部6号館 2F 61号講 義室 で開催いたします.テーマは,『生体情報処 理』です.講演者およびタイトルは以下の2 件を予定しております.奮ってご参加くだ さい. 「ジター錯視の生成機序」 講演者: 村上 郁也 氏 (NTTコミュニケーション 科学基礎研究所人間情報研究 部) 網膜像には眼球運動に由来するスリップ が常に発生している.外界を正しく知覚す るためには,このような網膜像スリップを 補償する必要がある.今回新たに発見した 現象は,固視微動のような眼球運動の補償 に視覚運動情報が用いられていることを示 す[1].この現象を生ぜしめるには順応パラ ダイムを用いる.まず,ある領域にダイナ ミック・ランダムノイズを呈示して順応さ せた後,先の順応領域を含んでそれ以外の 領域にまたがる静止ランダムノイズを試験 刺激として与える.物理的に静止している にもかかわらず,知覚的には非順応領域が 何秒間か揺れ動いて見える (ジター錯視). 非順応領域を4つに小分けしておくと,これ ら離れた場所でジター錯視は同期して生じ る.また,試験刺激を静止網膜像にすると 錯視は生じない.したがって,ジター錯視 とは固視微動に伴う網膜像スリップが知覚 化されたものだと考えられる.この現象を 説明し,日常の網膜像スリップをいかに補 償するかをも説明できるモデルを提案した [2].このモデルでは,順応部位,補償部位 というふたつの段階を仮定している.順応 部位に関しては,錯視が両眼間転移しない こと,また方向選択性があることから,単 眼性でかつ方向選択的な部位であるといえ る.補償部位に関しては,錯視が左右視野 間転移することから,全視野を表現してい る部位であるといえる. 《参考文献》 [1] Murakami, I. & Cavanagh, P. (1998). A jitter after-effect reveals motion-based stabilization of vision. Nature, 395, 798-601. [2] Murakami, I. & Cavanagh, P. (1999). A directionally selective monocular adaptation process and a distinctive bilateral compensation process for visual jitter. Investigative Ophthalmology and Visual Science, 38, S2. 「ブレインウェイコンピュータ (脳型コンピュータ)の開発に向け て」 講演者: 市川 道教 氏 (理化学研究所脳創成デバイス研究チ ーム) 今日のコンピュータは脳に迫るメモリー 容量と処理速度を数字の上では達成してい る.しかしながら,ある種の処理は明らか に脳に劣る.そこには単にソフトウェアの 問題というには大きすぎるギャップがある ように見える.我々は脳神経研究の成果を このギャップを埋めるために活用しようと 考えている. 処理方法という視点で,脳とプロセッサ ー型コンピュータの最大の違いは,分岐の ありようである.脳には戻れない分岐とい う概念は存在せず,どのような局面でも後 方を参照し,誤りを修正しながら答えにア プローチできる. プロセス制御という視点での違いは,目 標の設定と達成にある.コンピュータの直 列型のアルゴリズムとは異なり,脳での行 動発生には常に目標が存在し,それを達成 するタスクやプロセスを経験で積み上げた 持ち駒から選択して,行動を決定していく 手法が採用されている. また,汎化能力という視点でも,両者は ほぼ逆の戦略で対処している.コンピュー タは要素還元的な手法で上位概念を構成す る手法を好むが,脳では,先に上位概念を 作り,それに含まれる下位情報を選択して いく戦略を取っている. ブレインウェイコンピュータは,この様 な脳の特徴をハードウェアで実現しようと いう試みである.未だ途上ではあるが,参 加者の何かのヒントになれば幸いである. 《参考文献》 [1] 市川, 松本,“ブレインウェイ・コンピュー タの開発に向けて”,bit誌, 1998 11月号ー 1999 4月号 [2] http://brainway.riken.go.jp 〜会員登録情報の変更のお願い〜 AVIRG会員の御所属,会報送付先など登録情報に変更がありましたら,お手数ですが以下のいずれ かにご連絡ください. ◎ (財)日本学会事務センター 会員業務係 ◎ 電子メール(1999年度中) avirg-member@vision.STRL.nhk.or.jp (AVIRG幹事宛)  (注) 会員の確認のために,御氏名とともに,必ず会員番号を明記して下さい.      会員番号および学会事務センターの連絡先は会報郵送時の封筒に印刷されています. 5