Vol.34 No.5 (2001.3) 発  行:視聴覚情報研究会(AVIRG) 代表幹事:伊 藤 崇 之      〒157-8510 世田谷区砧1-10-11      日本放送協会放送技術研究所      TEL 03-5494-2361      FAX 03-5494-2371 T.1月例会報告 「V4野における陰影テクスチャーの特徴抽出」           講演:花澤 明俊 氏(生理学研究所高次神経性調節研究部門)           報告:村上 郁也(NTTコミュニケーション科学基礎研究所) 《概要と感想》  我々が外界の物体を見るとき,その形, 動き,奥行きなどはもちろんのこと,物体 の材質なども何となくわかる.我々の視覚 系は,明るさ情報や色情報を手がかりにし て表面反射率や分光反射特性を推定したり しているらしい.そのおかげで,マクワウ リを眺めたときにこれが薄緑色の表面をも った物体であることがわかる.しかし,同 じような色をしたマクワウリとマスクメロ ンの質感の違いはどこからくるのか.視覚 系はおそらく,表面内部における明るさや 色の空間分布――肌理――を手がかりとし て用いて,つるつる,ざらざら,といった 表面の属性を推定しているのだろう.実際、 肌理という情報は明るさや色などの属性と 似たような方式で処理されているらしいと する知見が,視覚心理学の分野ではすでに 多く蓄積されている.  しかしながら,視覚神経系において肌理 の処理に関与すると思われる神経対応物は, 生理学的には未開拓の領域である.ニホン ザルの線条外皮質腹側経路にあるV4野で どうやら肌理を扱う処理がなされているら しい,というのが今回の花澤博士らのグル ープの発見である.  まず,V4野の単一神経細胞の発火活動 を細胞外電極で記録し,その細胞の受容野 を特定しておく.動物が注視課題を遂行し ている間に,さまざまな肌理を含む静止し た方形領域の視覚刺激を受容野内部に与え, 細胞応答をみる.肌理刺激はランダムに配 置した多数の要素刺激からなる.ひとつの 要素刺激は、背景より明るい二次元正規分 布と暗い二次元正規分布を少し位置をずら して加算したもので,要するに白っぽい山 と黒っぽい谷が隣り合わせになって全体が ぼやけているようなものだ.白から黒に変 わっていく勾配方向は上下にもできるし左 右にもできる.あるサイズの要素刺激をあ る密度で配置して肌理刺激をつくる.要素 刺激のサイズ,密度,勾配方向をさまざま に変えた.  多くの細胞が,これらの変数を系統的に 変えるに応じて応答の強さを変えた.要素 刺激が特定のサイズであるときにしか応答 しなければ,サイズ選択性があるというこ とになる.同様に,密度選択性もあれば, 勾配方向選択性もある.このような選択性 を示す細胞がV4野にたくさん見つかった. ひとつの細胞が同時に複数の選択性を示す こともあった.  V4野に見つかったからといって,それ 以前の処理過程,例えば一次視覚野でも同 様な応答特性があるのだったら話は面白く ない.一次視覚野には特定の方位や特定の 空間周波数に同調している単純型細胞が多 数あり,今回の肌理刺激でもサイズ,密度, 勾配方向を変えるに従ってそれらの変数も 同時に変わる.今回記録された活動は単に 一次視覚野的な活動を反映したものだろう か? 否.一次視覚野単純型細胞の実際の 受容野は小さくてたかだか要素刺激ひとつ の大きさぶんくらいしかないし,受容野内 で白を好む位置、黒を好む位置は固定して いる.要素刺激の位置をランダムに変える と,応答も変わるはずだ.ところがV4野 の細胞はそんなことをしても同じ強さで応 答し続けた.では,単に方位や空間周波数 への選択性で片付けられるだろうか? 否. もっと単純な正弦波縞模様の刺激を用いて 統制実験をした結果,V4野の肌理刺激に 対する応答はそんな単純なものではなく, 多くは肌理刺激に特異的な応答であること を確かめている.  よし,V4野には肌理の処理に関与して いる細胞があるらしい,以上報告終わり, でいいだろうか? 花澤博士はここでもう 一歩踏み込んだ議論をする. 勾配方向― ―要素刺激が白から黒へ変化する視野上の 方向――を系統的に変えると、選択性の性 質は次の3つに分類できた. (1) 選択性がないもの (2) 双方向性――勾配方向を例えば上下に しても下上にしても同じ応答をするが, それ以外の方向にすると応答しないも の (3) 単方向性――勾配方向が例えば上下の ときにしか応答しないもの この3つめの性質は何を意味するのだろう. 上が白,下が黒になった要素刺激がたくさ んあるときに応答する細胞.そんな細胞が あって何か嬉しいことがあるのだろうか?  世の中にそんなパターンの肌理をもった表 面が本当にそんなにあるのだろうか?  ある.そそりたつ崖下の岩肌やたわわな 葡萄の房のように,ぼちぼちと凸部分がた くさんある表面を,太陽光のように、上か らの照明を当てて観察するときだ.凸部分 の上半分には光が当たり,下半分には陰が できる.ちなみに,ゴルフボールのように ぼちぼちと凹部分のある表面では,下半分 に光,上半分に陰となる.我々はそれらを 凹凸の質感を伴って知覚することができる. 肌理の手がかりに,陰影の手がかりをも加 えて,表面形状を推定しているわけだ.V 4野の細胞はそうした処理にさえ関与して いる可能性がある,と花澤博士は言う. 照明は常に上からとは限らないし,自分 の頭を動かせば太陽照明の視野上の方向も 変わる.それに呼応するかのように,V4 野の細胞にとっての最適勾配方向は細胞ご とにさまざまで,例えばあるものは下から 上,あるものは右から左に向かって白から 黒へ変わるような刺激を好む.ところが, 多数の細胞のデータを集めて最適勾配方向 のヒストグラムをつくると,これは一様な 分布にはならない.上に白,下に黒の勾配 方向を好む細胞が最も多いのだ.次いで, 下に白,上に黒の勾配方向が好まれる.頭 を立てて陸上で活動する人間やサルにとっ ての最もありふれた照明は上からふりそそ ぐ太陽光であることを考えると,この発見 は示唆的ではないだろうか.  本講演を聞いていろいろ考えた.簡単に は解けないものの興味深い問題がひとつ残 っている.このような応答特性は視覚神経 系の階層構造の中で一体どうやってつくら れているのか? 今回彼らの用いた肌理刺 激はある程度複雑な構造をしているが,実 画像における肌理よりははるかに単純だ. そもそも,肌理刺激を構成している個々の 要素刺激は一次視覚野単純型細胞の受容野 の空間構造によく似ており,それらの細胞 にとってほとんど最適刺激といえる.いま 肌理刺激を呈示したとすると,網膜でそれ を受け取り,一次視覚野に伝え、そこでは 多数の単純型細胞が要素刺激に対して強く 発火するのは間違いない.一方V4野では、 その要素刺激サイズ,密度,勾配方向を好 む細胞が刺激選択的に発火するという事実 が示された.この,一次視覚野の発火とそ の後のV4野の発火との間に隠れているミ ッシング・リンク.そう何枚も中間段階の 皮質が間に介在しているわけではない.例 えば両者はV2野を通じて結んでいるし, 直接投射もわずかにありそうだ. 同じ受容野構造をもつ単純型細胞群の応 答を空間的にかき集めればいけるのではな いか,と考えたが,それほど単純には今回 の選択性は出てこないそうだ.閾値型非線 形をかけてから空間加算すればいいのかも しれない.よくわからない.ちなみに,同 じ受容野構造ではなく位相的に異なる受容 野構造をもつ単純型細胞群の応答をかき集 めて位相不関な表現に変換していこう,と いう構図は形状,運動,両眼視差の最近の 計算モデルに共通の処理の流れだ.形や動 きや奥行きなどの概念をコードするための 細胞が刺激の空間周波数の位相ごときでむ やみに応答を変調させてしまっては困るか らだ.しかし,視覚神経系の階層構造を昇 っていくうちに位相情報が捨てられてパワ ーのみ残るならば,パワーが同一で位相の み異なるふたつの画像を我々は弁別できな いことになる.花澤博士が講演冒頭で示し たデモはまさにこの例だ.我々はたやすく 両者を弁別できる.パワーだけの世の中で はないのだ.  照明がらみの処理の実現方法も興味深い. V4野では一次視覚野と異なり,照明の色 などを考慮に入れた処理を行い,色の恒常 性を実現する働きをしている,とする見方 がある.今回報告された勾配方向の単方向 選択性をもって,照明方向を考慮した陰影 からの形状知覚にただちに結びつけること はできないが,V4野という未知の大陸に 対して将来の具体的な探索方向を示唆する 照明を当てた花澤博士らの功績は大きい. 「人間の初期視覚系におけるテクスチャ画像の処理」     講演:本吉 勇 氏(NTTコミュニケーション科学基礎研究所人間情報部)     報告:後藤 誠(富士通研究所メディアソリューション研究部) 《概要と感想》   テクスチャ分凝(texture segregation) とは,細かい形状の違いに基づいてエッジ を検出し,領域を分割することである.本 講演では,心理物理的手法により人間の視 覚におけるテクスチャ分凝を研究されてい る本吉氏に,これまでに得られた知見を分 かりやすく概括して頂き,さらに御自身の 実験結果について紹介して頂いた.  まずは,テクスチャ分凝の心理物理学・ 生理学的知見を概括された.古くは,ラン ダムドットステレオグラムの考案者として 有名なベラ・ユレスが,テクスチャ分凝の 記述法則として「一次/二次統計量の異な るテクスチャは分凝できるが,三次以上の 統計量が異なるテクスチャは分凝できな い」という“二次統計量”説を唱えた.し かしながら,この説には多くの反例が挙げ られた.そこで,ユレスは,「テクスチャ分 凝を含め全てのパタン知覚の基礎となるロ ーカルな表現素がある」という“テクスト ン理論”を提唱した.テクストンとしては 小塊,方位,端点,交差などが挙げられた. 当時,マーの“原始スケッチ”やトリーズ マンの“視覚特徴”など類似した理論も出 たことから,かなり支配的となったが,や はり,諸問題が出てきた.「誰もが認めるテ クストンは方位とサイズくらいであるこ と」「テクストンであることの判定条件が 不明瞭であること」「交差などの個々のテ クストンの定義が不明瞭であること」など である.さらに,テクストンそのものの実 在性も疑われた.なぜなら,初期視覚系で シンボリックな表現は用いられにくいから である.また,テクストン検出器というよ うな神経細胞もまったく見つからなかった. そういった訳で,今では,テクストン理論 はテクスチャ分凝のモデルとしてあまり採 用されていない. そんな中「二次のフィルタリングモデル」 という計算モデルが提唱された.初期視覚 系のフロントエンドでは,空間周波数と方 位に選択的な局所的フィルタリングを行う ユニットがあるのはよく知られているが, この一次の線形フィルタ群の出力に対して, 特定の非線型なフィルタリング処理を行う だけでテクスチャ分凝ができるというモデ ルである.このフィルタを通過した表現で は,テクスチャ間で相対的なレスポンスの 差があり,そこにエッジ検出処理をほどこ してやるとテクスチャが分凝されるのであ る.そして,このモデルは,心理物理実験 における人間の観察者のパフォーマンスを 非常によく予測できることが分かった.逆 L字形と十字形など,かなり複雑なテクス チャの要素の様々なペアを説明できるので ある.さらに,フィルタの空間特性が調べ られた結果,比較的広い抑制野をもつ二次 のフィルタのプロファイルとして想定して やると,心理物理実験の結果を綺麗に予測 できることが分かった.  一方,生理学的基礎としては,一次視覚 野でテクスチャ分凝に対応すると思われる 細胞があることが分かっている.テクスチ ャの境界にあるときに応答が大きい細胞で ある.メカニズムとしては,一次視覚野内 部での相互作用により,処理が行われてい るという考えがある.実際,解剖学的知見 では,神経のコネクションが広い範囲にわ たっている.あるいはより高次な皮質から のフィードバックも予想される.これらの 生理的事実を基にして,低次視覚野におけ る神経相互作用による再帰的な数理モデル が多数提出されている.  次に,以上のような研究の流れの中で本 吉氏らによって行われた,テクスチャ分凝 の時間特性を測るための心理物理実験のデ ータをご報告頂いた.心理物理学的には, “一目で分かる”すなわち“素早い”時間 特性を持つと言われてきたが,神経生理に 基づくモデルでは,再帰的相互作用に基づ くため遅い特性を持つと考えられる.時間 特性を調べることによりモデルを拘束し, テクスチャ分凝の二次フィルタの実現様式 を絞り込むすることが実験の目的であり, より 具体的には,「輝度コントラストの検出」→ 「方位の検出」→「方位コントラストの検 出」の3段階がテクスチャ分凝に関わって いると考え,どの段階の伝達特性がボトル ネックとなっているかを調べることが目的 である.「方位コントラストの検出」がテク スチャ分凝の時間分解能を決めていると考 えるのが普通だが,本当にそうなのだろう か.  実験方法は以下の通りである.二次元の ガウス関数をある方位で二階微分したパタ ーンが並んだ刺激を用いる.このパターン は,方位差が90度のパターンを交互に高 速提示すると,フレーム間で融合し,方位 情報が無くなるという特徴がある.分凝さ せる領域を構成するパターンと背景領域の パターンとのフレーム内方位差が90度の 刺激と45度の刺激の2種類を用いる.前 者は,フレーム毎に領域間の方位差を検出 しないと分凝できないのに対し,後者は, 融合が不完全な状態では,フレーム毎で方 位差を検出しなくても,方位情報のみに基 づいて分凝することが可能である.後者の 刺激の時間周波数の上限が前者の刺激のそ れと比較して大きければ,「方位コントラ ストレベル」がボトルネックであると言え, そうでなければ「方位検出レベル」がボト ルネックであると言える.また,分凝のた めの信号の強さ(領域間方位差)が異なる ので,時間周波数を直接比較できない.よ って,ノイズ耐性の測定を行い,別実験に よって求めたノイズ量と領域間方位差の関 係を用いて,ノイズ耐性のデータを感度に 読み替える.これにより,時間周波数に対 する感度のグラフを得ることが可能となる. その結果,両者の間では振幅が異なるだけ の,同じ感度曲線が得られた.すなわち, テクスチャ分凝の時間分解能は「方位検出 レベル」で決定されると言える.つまり, 「方位コントラスト検出レベル」の時間分 解能は「方位検出レベル」のそれと同等か それより高いと言える.よって,テクスチ ャ分凝の時間分解能は極めて高いのである. このことから,二次のフィルタは,再帰的 相互作用ではなく,一撃の処理であること が示唆された.  最後に,今後の展望が示された.まず, 二次フィルタが「一次フィルタのようにマ ルチチャネルなのか?」「一次フィルタの ように方位選択性はあうるのか?」など, フィルタの特性を調べることが今後の課題 である.また,「運動や両眼視差に基づくエ ッジ検出も同様のメカニズムに従うの か?」という点も未知である.また,ごく 最近,テクスチャ知覚に拘る二つの経路が あると考えられるようになった.すなわち, エッジ検出により複数の領域に分割する側 面の他に,特定の画像領域の組成・様相を 符号化する側面もある.これら“境界の知 覚”と“面の知覚”が独立かどうかもよく 分かっていない.  以上,テクスチャ分凝の最新知見を分か りやすく概括していただき,大変有意義で あった.また,活発な質疑応答も行われた. 今回の実験で示されたテクスチャ分凝の時 間特性の速さが,具体的に二段階のフィル タリング処理のどの特性に対応するのかが 示され,より統一的な説明に繋がることを 願う. U.3月例会予定 2001年3月の例会は,  日時:3月22日(木)14時〜18時  場所:東京工業大学(大岡山) ベンチャー ビジネスラボラトリー棟 1階ホール で開催します.講演会場や講演内容の詳細に 関しては,AVIRGのホームページ  http://www.avirg.org もご覧下さい. テーマは,『高臨場感映像の生成と表示』 で,以下の2件の講演を予定しています. ● 「CAVEを中心とした 没入型投影ディスプレイの利用動向」 講演者:高橋 裕樹 氏 (東工大)  没入型投影ディスプレイ(IPD: Immersive Projection Display)とは,大画面の映像で体験 者の視野を囲むことによって,体験者に映像へ の没入感を与えようとするディスプレイのこと である.これは,イリノイ大学EVL(Electronic Visualization Laboratory)のT.DeFantiらのグ ループによって1992年に提案された10 feet 四 方のスクリーンに囲まれたCAVE (CAVE Automatic Virtual Environment) から始まった.  本講演では,1996年東工大 VBL (Venture Business Laboratory) への CAVE clone の導入 時や中嶋研究室でCAVE関連の研究を行なう際に 生じた様々な検討事項について述べる.  また,現在では,CAVEに代表される小部屋型 ディスプレイ以外にも様々な形態の表示装置が 提案され,実際に利用されている.そこで,国 内に導入されたCAVEシステムを含む没入型投影 ディスプレイの利用動向についても概観 する予定である. ※ 講演終了後(17時頃〜),高橋裕樹氏の講演 に関連して、東工大のCAVEシステムのデモが予 定されています. 《参考文献》 [1] 高橋 裕樹,中嶋 正之: "CAVEシステムの動 向",月刊ディスプレイ, テクノタイムズ社, Vol.6,No.1,pp.76-79,(2000.1). [2] 中嶋 正之, 高橋 裕樹 : "CAVEを中心とし た大型映像システムの最新動向", 信学技 法, MVE97-86, pp.35-42,(1997.10). [3] 中嶋 正之 : "CAVE --新しい立体映像空間 --", 電子情報通信学会誌,80, [8], pp.888-890, (1997). [4] 増野 智経, 齋藤 豪, 高橋 裕樹, 中嶋 正 之: "Waraji: 仮想環境のための足を用いた 入力インタフェース", 映像情報メディア 学会誌,Vol.54, No.6, pp.833-839, (2000.6). [5] 鈴木 尚亨,高橋 裕樹,中嶋 正之: "大型 VRシステムのための能動型3次元位 置セン サAMUSE", 日本VR学会論文誌, Vol.4, No.3, pp.511-520, (1999.9). [6] 橋本 直己, 中嶋 正之 :"CAVEにおける直観 的操作手法と動的自由度制御を用いた3次 元形状モデラ",日本VR学会論文誌, Vol.4,No.3,pp.487-494,(1999). ● 「多視点画像処理による 臨場感コンテンツ生成技術の動向」   講演者:斉藤 英雄 氏 (慶応大)  近年,マルチカメラシステムなどにより得ら れる多視点画像から,実環境を3次元モデリン グし,仮想環境等で臨場感のある表示を行う研 究と,その応用が非常に盛んになってきた.本 講演では,多視点画像処理による臨場感のある コンテンツを生成する技術について,最近の技 術動向と,関連技術を応用したプロジェクト に ついて報告する. 《参考文献》 [1] 矢口 悟志・斎藤 英雄, "Projective Grid Spaceにおける多視点シルエット画像からの 自由視点画像生成", 電子情報通信学会技術 報告,PRMU2000-26, (2000.6). [2] 松本 圭介・須藤 智・斎藤 英雄・小沢 慎 治, "サッカーシーンにおけるボール追跡に 基づく最適視点決定システム",電子情報通 信学会技術報告,PRMU2000-27, (2000.6). [3] 北原 格,大田 友一,斎藤 英雄,秋道 慎志,尾 野 徹,金出 武雄,"大規模空間における多視点 映像の撮影と自由視点映像生成", 3次元画像工 学コンファレンス,(2000.7). [4] 斎藤 英雄,金出 武雄,"多数のカメラによる ダイナミックイベントの仮想化",情報処理 学会コンピュータビジョンとイメージメデ ィア研究会, 119-16, Vol.99, No.93, pp.117-124, (1999.11). 《 関連プロジェクトのページ》 http://www.coara.or.jp/DailyNews_pict/2000/0011 /jikken/ http://www.cs.cmu.edu/~virtualized-reality 《講演者のホームページ》 http://www.ozawa.ics.keio.ac.jp/~saito/ V.会則改正の中間報告  前回の会報でお知らせしましたように,会則の改正について検討しております.以下は 改正案の骨子です.ご意見のある方は, 代表幹事,または kanji@avirg.org までお送り下さい.なお,会則改正案の全体については,次回の会報でお知らせする予定 です. ●会則改正案の要約 (1)会員の定義 会費の無料化を予定しており,会則の遵守を約束するものは、誰でも会員になれる.なお 新規会員は電子的に自動登録する. (2)提供サービス 従来通りの例会,ホームページによる各種情報提供,電子メイルによる会報,会員メイリ ングリスト等. (3)運営の資金源 旧AVIRGの資産と特別会員による会費.なお特別会員にはAVIRGホームページに 広告を掲載することを認めることを予定している. (4)役員と組織 新組織の役員は2001年5月のAVIRG総会において旧ルールに従って選出する.新 役員の構成は従来どおり,会長1名,監事2名,代表幹事1名,幹事若干名とする. 新組織移行後は,新規役員を以下の方法で選出する. 新会長:現会長の推薦による. 新監事:現監事2名の話し合いのもとでの推薦による. 新代表幹事:現代表幹事および現幹事の話し合いのもとでの推薦による. 新幹事:現代表幹事及び現幹事の話し合いのもとでの推薦による. 特に監事と幹事の人事は独立に行われるように配慮する. 監事の役割は従来の会計監査に加えて,幹事業務の適切さの監視であり,幹事に不適切な 行為が認められる場合や会員の訴えがある場合には監事会を召集し,その議長となって警 告,処分などの対応を取ることになる. (5)総会 従来の総会は定足数以上の会員の出席または委任状の提出を要したが,新組織では,会員 決議を行わない.従って総会は廃止し,代わりに会長,代表幹事,幹事,監事,一般会員 の参加する拡大幹事会を毎年5月に開催する. 拡大幹事会では,会員代表として組織の適切な運用を見守る監事の権限を強化し,会員決 議がなくとも会の健全な運営が図れるように配慮する.なお5月以外にも必要に応じて臨 時拡大幹事会が召集される.拡大幹事会は一般会員に公開し,前年度活動,新年度活動計 画,前年度決算,次年度予算を報告する. AVIRGホームページ:http://www.avirg.org 〜会員登録情報の変更のお願い〜 AVIRG会員の御所属,会報送付先など登録情報に変更がありましたら,お手数ですが以下のいずれ かにご連絡ください. ◎ (財)日本学会事務センター 会員業務係(2000年度中) ◎ 電子メール kanji@avirg.org (AVIRG幹事宛)  (注) 会員の確認のために,御氏名とともに,必ず会員番号を明記して下さい.      会員番号および学会事務センターの連絡先は会報郵送時の封筒に印刷されています. 2