Vol.33 No.5 (2000.3) 発  行:視聴覚情報研究会(AVIRG) 代表幹事:伊 藤 崇 之      〒157-8510 世田谷区砧1-10-11      日本放送協会放送技術研究所      TEL 03-5494-2361      FAX 03-5494-2371 T.1月例会報告 「ジター錯視の生成機序」 講演: 村上 郁也 氏(NTTコミュニケーション科学基礎研究所) 報告: 中川 俊夫 (NHK) 《概要と感想》 人間が物を見るときに,常に眼球運動に よって,網膜像にスリップが生じている. それにも関わらず,人間は,手ぶれしたカ メラのような映像でなく,静止した映像を 見ることができる.スリップを起こしてい る網膜像から,どのような計算過程で静止 像を得ているのか解明するために,村上氏 らは自分たちが発見したジター錯視という 現象を用いた実験によって研究を行われて いる.講演では,村上氏がハーバード大で Cavanaghと行った研究について話された. 最初に,固視微動などに伴う網膜像のス リップの補正が,どのように行われている か説明する下記の3つの仮説が紹介された. (1) Extra-retinal outflow  眼球運動のための指令を補正に使う方法 (2) Extra-retinal inflow  外眼筋の自己受容感覚器の信号を補正に 使う方法 (3) Visual Inputs  眼球運動に伴う視野の全体の動きを補正 に使う方法 これらの仮説を村上氏は次のジター錯視 という現象を使った心理物理実験で検証さ れている.実験では,2重の同心円状図形 で,中心部に静止ランダムノイズ,周辺部 にダイナミックランダムノイズのパターン を配置した順応刺激を,被験者に30秒ほど 円の中心を固視点として見せる.その後, テスト刺激として,周辺部も静止ランダム ノイズのパターンを呈示すると,最初から 静止しているはずの中心部のパターンがも やもやと動いて見える.さらに,テスト刺 激を,フラッシュによる残像という形で静 止網膜像として被験者に与えたところ,ジ ター錯視は観察されなかったところから, ジター錯視は眼球運動に伴う網膜スリップ による現象であると判断される. そこで,3つの仮説がジター錯視を説明 できるか考える.(1),(2)の仮説は,網膜 外の情報を用いて,網膜上の動きを引き算 的に補正する考えである.ジター錯視にお いて,ダイナミックランダムパターンによ って順応した部分(前記の実験では周辺部) は,動きを検知する神経細胞の反応が下が ると考えられる.そのため,順応後静止パ ターンに対して,順応前と同じように網膜 外の情報によって補正をかけたのでは,過 補正になり,その部分で動きが観察される はずである.しかし,実際には,逆に動き パターンに対して順応していない部分に順 応後動きが観察されている.結果,(1)(2) の仮説ではジター錯視を説明できない. (3)の視覚入力自体を補正に用いる方法 では,視覚により検出された運動ベクトル のうち,例えば小さなベクトルを見つけて, 他のベクトルをそのベクトルに対する相対 成分として表現しているとする.ダイナミ ックランダムパターンによって順応した部 分では,神経細胞の反応が下がり,固視微 動による動きベクトルより小さな動きベク トルを検知してしまうことになる.この小 さなベクトルを基準に他の動きベクトルを 相対表現すると補正不足になり,結果とし て静止パターンの部分に動きが見られる現 象となって現われる.このような処理を考 えると,ジター錯視の現象だけでなく,多 くの場合の眼球運動によるベクトルは補正 できるのではないかと説明された.これら の推論から,少なくとも固視状態における, 網膜スリップの補正は,視覚入力で十分だ と結論付けられている. さらに,村上氏は,ジター錯視の両眼間 や両視野間での転移の有無を調べる実験を 行って,その順応と補正の働きが視覚神経 系のどこで行われているか解明しようとさ れている.実験の結果では,ジター錯視は 単眼性であり,両視野間の転移が有ること がわかった.このことから,順応は視覚一 次野などの単眼性の経路の運動方向選択性 のある細胞のある部位で,補正は両視野表 現の部位(例えば,MT野やMST野など) で行われているのではないかと推測されて いる.この後,会場からも,視覚系のフィ ードバックループの存在も含め,どこで本 当に補正処理が行われている可能性がある のかと質問があり,議論が行われた. 村上氏が講演で示された推論過程は,実 際に答えに至る道筋はそう簡単ではなかっ たのであろうが,明解でわかりやすい.た だ,網膜スリップが視覚入力だけで補正で きると言われると,実際にその計算アルゴ リズムが,氏が例えばと言って挙げられた 方法で様々な場合の解決になりうるものな のか気になるところである.実際に講演中 の質疑においても,補正の基準となる眼球 運動を示すベクトルを見つける方法につい て,多数のベクトルのアンサンブルによる ものなのか,ある程度局所的な処理となっ ているのかなど意見が交わされた. また,補正の計算処理として,動きベク トルの大きさを眼球の動きベクトルの相対 値として表現し直すことは,なんらかの抑 制性の結合などの機構で確かに可能である かもしれない.しかし,視覚経路の多くの 部位にレチノトピーがあることから,少な くとも初期のステージでは,その外界が表 現されたマップ上では眼球運動に伴い像が 位置的に動いている可能性がある.その位 置的な動きを無視できるような表現が視覚 系でなされているのか,もしくは,補正し た表現にマップし直す処理が行われている のかなど,いろいろ考えをめぐらしたくな る. 村上氏は,fMRIを使った実験でも同様の 結果が得られていると最後に述べられてい た.心理物理実験では,視覚経路のどこで どのような処理が行われているのか,実験 によって理詰めで推定していくしかない. しかし,視覚のような大規模なシステムに おいて,フィードバックループやダイナミ クスが存在する中では,場所の可能性の推 定ではあっても,特定まではなかなか到達 するのは難しい.また,サルを使った生理 学実験では反応を直接見ることができたと しても,高次の機能になればなるほど,ヒ トとサルが同じような脳の構造と機能を持 っているだろうという前提に疑問をはさま ざるを得ない.今回のような心理物理実験 に合わせて,,fMRIをはじめとしたイメージ ング技術を使った実験が多く行われていく ことで,視覚処理の部位の特定やダイナミ クスも含めた計算メカニズムの解明が進む 可能性が大きくなってきたことに期待した い. 《参考文献》 [1] Murakami, I. Cavanagh, P. (1998). A jitter after-effect reveals motion-based stabilization of vision. Nature, 395, 798-601. [2] Murakami, I. Cavanagh, P. (1999). A directionally selective monocular adaptation process and a distinctive bilateral compensation process for visual jitter. Investigative Ophthalmology and Visual Science, 38, S2. 「ブレインウェイコンピュータ(脳型コンピュータ)の開発に向けて」 講演: 市川 道教 氏(理化学研究所脳創成デバイス研究チーム) 報告: 依田 育士 (電子技術総合研究所) 《概要と感想》 報告者らのグループで3年前から行なわ れているブレインウェイコンピュータにつ いて,講演の流れに沿って,特に感心を持 った点を中心に報告致します. そもそも「ブレインウェイ」とは,脳流 のやり方でという意味で,脳の方式に基づ いた方法での計算方式を考え,それを実際 にハードとして実装するものです.大脳の 構造では,新皮質はモジュール構造になっ ているが,一方,中心の海馬は構造化され ているようには見えない.脳には1千億の細 胞がり,実験的に1つずつ調べることは不可 能である.しかし,その構造に着目し,少 しずつチップ化したい.できればシングル チップ化したい.これが生理学的に神経細 胞を研究してきた講演者のこの研究に対す る基本的な動機である. 次にコンピュータと脳の実際の処理の違 いとして,コンピュータは決められた仕様 範囲でしか動かない.つまりバグは避けて 通れない構造になっている.一方,脳は抜 け落ちはあるが,網のようになっていて道 筋がいろいろある.またそれは非固定的な 処理であり,双方向性のネットワークとし て実現されている.これが大きな違いであ る. そうすると,脳はメモリーベースアーキ テクチャと考えることができる.その考え に基づく脳の学習と予測の例題として,パ ブロフの犬のような例が取り上げられた. これは訓練中は,(音がする→走る→えさ がもらえる)といった一連の動作はいわば 「過去を覚える」ものである.一方,訓練 後は(音がする→どうすればいい→えさが もらえる→どうすればいい→走ればいい) といった「未来を思い出す」ものである. これを実際のタスクに置き換えるとある 仕事をまかされた場合,人間(脳)は自動 的にそれをいくつかの小さいタスクに分割 している.またさらにそのタスクを分割す るといったことを自動的に行なっている. そしてこのタスクを順次選択していくこと で,目標を実現している.このとき目標達 成への小タスクのネットワークができ,そ れを自動選択が必要となるわけだが,現在 の計算機はこれを順方向に選択するのが一 般的であるが,これを逆方向から選択して いくことを考える. さてこういった機能を実装を考えていく と,まず最小単位の神経細胞をどうするか になる.人間の神経細胞は約20種あり,違 うものを20種用意するのはとうていまねで きない.そこで,最小単位には1つのORゲー トの下に複数のANDゲートがぶら下がるも のとする.これはANDゲートの下には複数の 入力があり,その複数の入力に信号が入っ たときのみに発火し,上位がOR回路である ので,単独でANDゲートが発火すれば発火す る,まさに神経細胞を模倣したものである. この構造であれば簡単に作れる.またこの とき実際のシステムレベルでは,1つの神経 回路を完全なシンボルとして取り扱う.こ れによりNeural Network Processorでは1000 個を使い16MHzで同期させるDigital Neuron Modelとして実装することができる. そしてこれを実際に使ったアプリケーシ ョンとしてはヘリコプターの自動制御(空 中静止)を行なっている.5つのCCDカメラ を装着したラジコン型の市販ヘリコプター を使って100msecで運動制御を行なうもの である.カメラからの入力から最終的に4 つのモータ制御パラメータのコントロール ができるようになっている.ただ,まだタ スクの分割までは回路で実現されていない ので,これを現在目指している. 今までの実験的神経生理学の基づく研究 でああるので,非常に興味ある研究でした. ただ,実際の脳の1000億ある細胞をハード で実現することはパワー的に不可能である ので,現在の形で実装して,そこで一定の 成果を求めているととのことなので,当然 のことながら向く問題とそうでない問題は はっきりしているようです.ここでの成果 が,より汎用的,より高度な脳型アーキテ クチャに繋がっていくことを期待します. 粗い報告となってしまいましたので,講 演者の研究をより詳細に知るためには以下 の参考文献とHPを参照されることをお薦め します.特にHPのフォーラムでは,講演者 自ら質問・意見などに丁寧に答えています. 《参考文献》 [1] 市川,松本, 「ブレインウェイ・コンピ ュータの開発に向けて」, bit誌, 1998.11月号〜1999. 4月号 [2] http://brainway.riken.go.jp/ U.AVIRG会費未納による除名手続きの実施について(重要)  1999年度の通常総会において決議されま した「AVIRG会費未納による除名手続き」に 基づきまして,1999年度の除名処理を行い ました.除名の対象となったのは以下に該 当する方となります.ご了承下さい. 1) 会費未納額が4年分以上(10,000円)の会 員で,会費の再請求後半年内に未納額の 支払いがなかった方 2) 住所不明の会員については,総会後,半 年間内に住所の変更の連絡がなかった方  なお、先の総会の決議内容につきまして はAVIRG会報Vol.33 No.1をご参照下さい. V. 3月例会予定 AVIRG 2000年3月例会は, 日時: 3月16日(木)14時〜17時 場所: 東京大学工学部6号館 2F 61号講 義室 で開催いたします.テーマは,『マンマシン インタフェース』です.講演者およびタイ トルは以下の2件を予定しております.奮っ てご参加ください. 「マンマシンインタフェース構築に向けた                顔画像認 識」 講演者: 福井 和広 ((株)東芝 研究開発センター  マルチメディアラボラトリ ー) マンマシンインタフェース構築において, リアルタイムのユーザ識別は不可欠な要素 である.特に顔による識別は,ユーザの負 担が少なく有効である.ただし,この有効 性は,ユーザに意識して顔向きや姿勢を変 えてもらわなくても安定に識別できること が前提となる.顔パターンは,顔向きや表 情変化により容易に変化するため,従来の 様な1枚の顔パターンから識別では,安定な 性能を期待できない.そこで,一定時間に 得られた複数の顔パターンの分布と,予め 登録されている複数の顔辞書パターンの分 布との類似度に基づいて識別を行う[1].こ れは,複数視点から見た様々な顔パターン から総合的に個人を識別することに相当し, 安定な識別が期待できる.実際に分布間の 類似度を計算するために,入力と辞書パタ ーン分布をパターン空間中の部分空間でそ れぞれ表す.相互部分空間法により求まる この2つの部分空間の成す正準角を分布間 の類似度とする. また照明変化の影響に対する対処も不可 欠である.このために,入力と辞書の部分 空間を,照明変動を含まない制約部分空間 へ射影し,射影された2つの部分空間の成す 正準角を類似度とする.制約部分空間への 射影は,照明変動の影響を受けるパターン 成分を取り除く効果が期待できる.この方 法を制約相互部分空間法[2]と呼ぶ. 最後に,顔認識の過程で検出される瞳な どの特徴点の情報[3]や,個人認識結果を使 ったアプリケーションを幾つか紹介する. 《参考文献》 [1] O.Yamaguchi, K.Fukui, K.Maeda, "Face Recognition using Temporal Image Sequence",Proceedings of the third International Conference on Automatic Face and Gesture Recognition, pp.318-323,April 1998. [2] 福井 和広,山口 修,鈴木 薫,前田 賢一, “制約相互部分空間法を用いた環境変化に ロバストな顔画像認識 - 照明変動を抑える 制約部分空間の学習 ? ”, 電子情報通信学 会論文誌 (D-II), vol.J82-D-II, no.4,pp.613-620,April 1999. [3] 福井 和広,山口 修,“形状抽出とパターン 照合の組合せによる顔特徴点抽出”, 電子 情報通信学会論文誌 (D-II), vol.J80-D-II,no.8,pp.2170-2177,August 1997. 「人間の聴覚的空間知覚特性」    講演者:大倉 典子 氏    (芝浦工業大学 工学部 工業経営学 科) 人間の持つ優れた空間知覚能力を生かし た使いやすいインタフェースを創出する技 術として,人工現実感が期待を集め,実用 化されてきている.人工現実感における人 間への空間情報入力手段としては,視覚の 利用が最も一般的であるが,触覚や聴覚も 利用されている.空間知覚利用型インタフ ェースにおいて,人間への空間内の位置情 報入力手段として聴覚情報を最適な形で利 用するためには,人間が聴覚情報のどのよ うな部分を手がかりとしてどのような認知 をしているのかという,人間の聴覚的空間 知覚特性を把握しておくことが重要である. 今回は,人間の聴覚的空間知覚特性,特 に音源距離定位に関してこれまで行ってき た以下の研究について紹介する. 1. 聴空間におけるホロプタの距離依存性 2. 仮想環境を利用した距離に関する音源 定位 3. 聴空間におけるアレイの距離依存性 4. 聴空間におけるホロプタやアレイを説 明する数学モデル さらに現在実用化されている,聴覚情報 を利用した人工現実感システムについても 紹介する. 《参考文献》 [1] 大倉典子,舘日章,“距離に関する音源定位と 聴空間におけるホロプタ”,計測自動制御学 会論文集,30-11,1287/1292 (1994) [2] 大倉典子,前田太郎,舘日章,“聴覚ホロプタ を説明する空間位置知覚モデル”,計測自動 制御学会論文集,34-10,1472/1477 (1998) [3] 大倉典子,柳田康幸,前田太郎,舘日章,“仮 想環境における聴覚アレイの測定とその数 学モデル”,電子情報通信学会論文誌, D-II-10,2438-2446 (1998) 〜会員登録情報の変更のお願い〜 AVIRG会員の御所属,会報送付先など登録情報に変更がありましたら,お手数ですが以下のいずれかにご連 絡ください. ◎ (財)日本学会事務センター 会員業務係 ◎ 電子メール(1999年度中) avirg-member@vision.STRL.nhk.or.jp (AVIRG幹事宛)  (注) 会員の確認のために,御氏名とともに,必ず会員番号を明記して下さい.      会員番号および学会事務センターの連絡先は会報郵送時の封筒に印刷されています. 2