Vol.34 No.2 (2000.10) 発  行:視聴覚情報研究会(AVIRG) 代表幹事:伊 藤 崇 之      〒157-8510 世田谷区砧 1-10-11      日本放送協会放送技術研究 所      TEL 03-5494-2361      FAX 03-5494-2371 T.7月例会報告 「フィルタバンク/ウェーヴレットの理論と画像処理・認識への応用」   講演:長井 隆行 氏(電気通信大学 電子工学専攻)   報告:影広 達彦(日立製作所 中央研究所) 《概要と感想》 デジタル信号処理は, 一般的なユーザー にとって直接意識されることが少なく,イ メージし難い分野である.しかし,実際には 昨今のオーディオやカメラのデジタル化, 通信インフラの充実などの分野において, 大きな役割を果たしている.最近流行りの シリコンオーディオやデジタルカメラなど は,膨大なデータ量を持つ音声や画像を格納 し連続処理する必要があり,生データをそのま ま扱うのは現実問題として不可能である.また, 通信インフラにおいても,今後音声だけでなく インターネット接続などによりパケットが多量 に飛び交うようになり,どれだけ現状の伝送帯 域を有効活用するかが鍵となっている.このよ うな分野では,入力信号に対し劣化を押さえつ つ,出来るだけデータ量を減らして格納または 伝送することが必須の技術となっている. 長井氏は,デジタル信号処理について,特に フィルタバンク,ウェーブレット理論の概念を 解説し,その後,それぞれの理論を画像処理に 適用した応用実験例を分かりやすく提示してい た. 長井氏は,まず,フィルタバンクとウェ ーブレットの解説をしていた.マルチレー トフィルタバンクは,信号をバンド毎に分 け,情報量の多いバンドには多くのビット を割り当て,信号帯域の有効活用を図って いる.また,ウェーブレットには,マザーウ ェーブレットと呼ばれるベースとなる関数 が存在し,この関数自身が伸び縮みして基 底関数を構成する.これにより,入力信号を 展開することで,最適な時間−周波数解析 を実現する.長井氏の主張によると,ある意 味,ウェーブレットもDCTも一種のフィルタ ーバンクであると述べていた.本質的には, 入力信号を分けて,情報量の多い部分と少 ない部分それぞれに最適なビット量を割り 当て直すことに変わりは無いと言う主張と 思われる.このようにデジタル信号の効率 的な圧縮に対する多様なアプローチが,本 質的に根源が同じであるという観点が興味 深く感じられ,今後この分野においてまだ まだ新しいアプローチが提案されていく予 感がした. 次にフィルターバンクとウェーブレット を画像処理・認識に適用した応用実験例を 示していた.  まず,DCTとフィルターバンクとウェーブ レットそれぞれを画像圧縮に適用した実験 結果を見せていた.長井氏によると,同じビ ットレートで比較した場合,DCT,フィルタ ーバンク,ウェーブレットの順に画像が綺 麗であると述べていたが,プロジェクター の画像再現性の限界により,顕著な差は聴 講者たちに感じられなかった.また,画像を 圧縮する際に,画像全体をまんべんなく処 理するのではなく,人間の注目点を意識し ながら,圧縮率を変動させる手法を検討し ていた.長井氏の実験では,固有顔を用いて 画像中の顔領域を抽出し,その領域のみ重 み付けして高精彩に再現していた.ただし, 本手法だと従来の画像再現性の定量的評価 では,全般的に圧縮した場合より悪くなる. そのため,人間が見た場合の主観的評価を 適用し,本手法の正当性を実証したいと述 べていた.報告者個人の観点では,確かに注 目領域が詳細になっているように見える事 は確認できたが,実際にビットレートを変 化させていった時の画像の劣化度を比較し ていくと面白いのではないかと思った.ま た,実画像から顔領域を抽出する計算コス トは実用としては無視できないレベルであ ると思われる.そこで,ポートレート等の場 合には注目領域は画像中心である可能性が 高いので,中心領域に重み付けするだけで 通常の画像では実用上有用であるかもしれ ない. 次に景観画像から看板領域を抽出する目 的のために,ウェーブレットを用いた実験 の説明があった.本手法は,まず入力された カラーの景観画像をHSV空間でクラスタリ ングし,複数の看板領域の候補を生成する. 次に,それぞれの領域候補位置において, 入力画像をウェーブレット変換して得られ た値を9次元の特徴量として抽出していた. この特徴量が看板領域であるか,それ以外 かをニューラルネットワークで学習し,複 数の候補領域から選別を行っていた.まだ 少量サンプルの実験で精度を厳密に測定で きていない事と,処理時間が膨大である事 が問題であると話していた. 質疑応答では,活発な議論行われ,実際 にフィルターバンクやウェーブレットを画 像処理に適用した際の処理コストに興味を 持つ方がいた.また,看板画像領域の抽出で, ウェーブレット変換により得られた多次元 の特徴量における意味を質問されていた. 長井氏はニューロを用いて特徴量を学習し ていたが,実際得られた特徴量の意味を検 討すると何か新たな知見が生まれるのかも 知れない.  本講演では,フィルターバンク,ウェー ブレットを解説し,適用例を示すことによ り,デジタル信号処理の実感を得ることが 出来た.画像を2次元の信号の固まりとして 見たとき,様々なアプローチがあり,また 信号を変換する事によりデータ圧縮や有用 な情報の抽出が可能であることが理解でき た.このような信号処理は綺麗な論理とし て抽象化されており,実際に何が起きてい て,出力過程は何を「意味」するのか直感 的に理解することは難しい.本講演は,論理 的に裏付けられた信号処理の「意味」を考 える非常に良い機会になったと思う. 「集積回路DA概論」   講演:大豆生田 利章 氏(群馬高専 電子情報工学科)   報告:川田 亮一(KDD研究所) 《概要と感想》  本講演では,近年,画像認識などをリアル タイム化する上で大きな役割を果たしてい る,集積回路の設計技術に関してわかりや すい説明がなされた.DAとは,Design automationの略である.この集積回路の自 動設計の目的は,次のようになる. (1) 大規模化 (2) LSI化 (3) 高速化 (4) 開発期間短縮. まず,最近のLSIの構成の種類について説明 があった.これには,次の3種類ある. (1) ゲートアレイ (2) セルベース(スタンダードセル) (3) フルカスタム. まず,ゲートアレイ方式は,トランジスタを あらかじめ作っておき,設計者は,その配線 を行なう.セルベース方式では,ライブラリ 化されたセルを使用し,そのセルの配置と, 間の配線を設計者が決定する.最後のフル カスタム方式は,全てを設計者が決定する ため,高性能化が可能であるが,最も手間が かかる.今回の講演では,以後,セルベース 方式について詳述された. 具体的な設計工程について説明があった. 仕様は人間が作り,工程の要素は,レイアウ ト設計,製造,テストとなる.設計の要素は, 大きく分けて,次の4種類となる. (1) 回路設計(セルパタン設計) (2) 論理設計 (3) 論理合成 (4) 順序回路合成 まず,回路設計は,カウンタなど,一つのセ ルライブラリを作る工程である.トランジ スタレベルから始まり,レイアウトパタン 設計,マスクパタン設計,設計規則検証,電 気的特性検証,論理接続検証により完成す る.  次に論理設計は,ゲートレベルによるも の,adderなどの機能レベルによるもの,LSI の使い方などの実装レベルによるものがあ る.特に機能レベルによるものは,HDLによ る高位合成で実行可能である.HDLには4種 類あり,本講演では,VHDLによる例が説明さ れた.従来のC言語などのプログラミング 言語に似た構文で,LSIが設計できることが 述べられた. 論理合成では,まず,2段論理展開(2段論理 簡素化)が重要である.これは、全ての組合 せ回路は,ANDとORの2段で表現できるとい うものである.ところがこれによると,一般 にはゲート数が非常に多くなるため,現実 的ではない.そこで,論理多段化が行なわれ る.また,使用可能セルとの比較すなわちテ クノロジーマッピングも重要であることが 述べられた.  さらに順序回路合成について説明があっ た.順序回路は,組合せ回路とことなり,メ モリ(記憶素子)が入るため,その動作は複 雑である.このため,論理合成に比べ,研究 はまだこれからの段階である.状態簡約化 や状態割当の方法が,研究のポイントとな るとのことである. 次に,シミュレーションの必要性について 言及された. シミュレーションには次の4種類がある. (1) 論理シミュレーション (2) タイミングシミュレーション (3) 回路シミュレーション (4) 故障シミュレーション 論理シミュレーションは,ハード化する前 に,デバッグのために行なう.また,タイミ ングシミュレーションでは,遅延をチェッ クする.遅延は,ゲートスイッチングや,負 荷,配線抵抗/容量により決定される.入力 信号やクロックのタイミング(スキュー) を調べる上で,遅延評価は非常に重要であ る.これはそのLSIの動作速度に直結する問 題である. さらに「回路シミュレーション」 では,アナログ的な動作を確認する.最後に, 故障シミュレーションとは,内部の故障時 の出力を予測するためのものである.  次に,レイアウト設計によるセル配置に ついて,さらに詳しい説明がなされた.順序 としては,まず初期配置が行なわれ,その後, 配置改善をする,という2段階の手法がと られる.初期配置では,次の2種類の手法が とられる. (1) クラスタリング (2) ミニカット クラスタリングでは,論理的結合度の高い もの同士をまとめる.また,ミニカット法で は,セル集合を切ってみて,その切線を跨ぐ 配線の数が少なくなるようにする.ここで は,グラフ理論を応用しているとのことで ある. 次に,配置改善の段階では,次の3種類の 手法がとられる. (1) ペア交換 (2) 重心緩和法 (3) ネットバランス ペア交換法では,入れ換えてみて線長が短 くなればその入れ替えを確定する.重心緩 和法とは,ペア交換のヒューリスティック 法であり,あるセルを,それに接続されてい る全セルの重心に移動するというものであ る.一方,ネットバランス法とは,これらを1 次元的に試みる方法である. 次に,実際のレイアウト配線について説 明があった.これは,次の3段階からなる. (1) グローバル配線 (2) トラック割り当て (3) 詳細配線 グローバル配線で,まず全体的に配線を行なう.  次に,トラック割当では,なるべく配線の面積 を減らしセル面積を増やすべく,セル間の配線 用トラックを割り当てる.トラック割当が横線 の割当なのに対し,詳細配線では,実際にセルに 達する縦線の配線を行なう.これが一番時間が かかるとのことである.この配線に関しては,光 ファイバのFTTH(fiber to the home)を連想し, 興味深かった.すなわち,FTTC(fiber to the curb)迄は,比較的安価に実現できるが,そこか ら実際に家庭に光ファイバを引き込む作業が一 番大変であることと,アナロジがとれていると 思われる. 次に,集積回路のテストについて,詳述さ れた.これは,講演者の専門分野でもある. テストには次の3種類がある. (1) 機能テスト (2) AC特性テスト (3) DC特性テスト 機能テストとは,ロジックテストのことであ る.AC特性テストでは,入出力のタイミングをチ ェックする.DC特性テストでは,非動作時の電 力消費がないかチェックする.また,故障の 種類としては,次の3種類がある. (1) ショート/ブリッジ(短絡のこと) (2) オープン(断線のこと) (3) トランジスタの常時オンまたはオフ   (トランジスタが故障していること) この故障のモデル化手法として使用されている のは,単一縮退故障モデルであり,故障によりゲ ートの出力が固定化することを仮定してい る。逆に,これ以外のモデルを使用しようと すると、 複雑過ぎて困難となる.今後の研究テーマ となっている.また、故障検出法としては, 組合せ回路用はいろいろあるが,順序回路 用は研究段階とのことである.これは大豆 生田氏の研究テーマの一つでもあるとのこ と. 故障シミュレーションの方法としては,並 列法,演繹法,コンカレント法の3種類があ る.あらかじめ故障を想定して,それにより 差が出るようなパタンを入力するのがポイ ントとなる.今後,テスト容易化設計手法が 重要となることが述べられた.この手法と しては,次の4種類がある. (1) アドホック法 (2) より系統的な分割手法 (3) 構造的手法 (4)BIST法 アドホック法とは,観測点や制御点を追加 したり,カウンタを分割したりする手法で ある.より系統的な分割手法では,マルチプ レクサや,バスを使用することにより,テス トの単位となる回路規模を小さくすること がポイントとなる.構造的手法では,スキャ ンデザインがポイントとなる.最後のBIST 法は,他の3つとは考え方がことなり.回路 の中に,自己診断用の回路を埋め込んでし まうという手法である.正常時の期待値も, 内部メモリに入れておく. さらに,今後の研究テーマとして,テスト 容易化合成が説明された.これは,現在のよ うに,設計とテストを分けて考えず,はじめ からテストのことを考えた設計をするとい うことである.  以上,非常に懇切丁寧な解説をしていた だいたおかげで,LSI化の実際を良く理解す ることができた.大豆生田氏には遠いとこ ろお越しいただき,非常に感謝している.も し時間に余裕があれば,氏御自身の研究に ついても,さらに深い説明をお聞きしたか ったところである.  普段,我々は主にアルゴリズムの研究開 発をしているわけであるが,この講演を聞 き,実際にハードウェア化を前提としてア ルゴリズムを考えることの重要性を再認識 した次第である. U.10月例会予定 10月の例会は,  日時:10月5日(木)14時〜17時  場所:東京大学工学部 6号館 2F 63号講義室 で開催します. テーマは,『音声・言語処理,知識処理』です. 講演は,以下の2件を予定しております. ● 「東芝の不特定話者音声認識技術と その応用」 講演者:正井 康之 氏 ((株)東芝研究開発センター) 連続音声の認識が実時間で可能となり,PCをは じめホームコンピュータや携帯機器のインタフ ェースとしての音声の利用が現実的なものとな ってきた.東芝がこれまで実現してきたPC向け 音声認識ソフトウェアやマルチメディア教育端 末などの音声認識応用製品事例を紹介し,東芝 の不特定話者音声認識技術の特徴を説明する. また,ディクテーションの特定分野へのタスク 適応実験結果を報告し,連続音声認識の応用拡 大の可能性を考察する. 当日は実機によるデモを予定. 《参考文献》 [1] 松浦博他:「東芝の音声認識製品化への取り組み」, 情処研究報告2000-SLP-32,pp39-40 (2000) [2] 新田他: 「複合特徴平面(MAFP)に基づく音声特徴 抽出」,信学技報,SP98-21,pp57-64 (1998) ●「NHKニュース音声認識システム」 講演者:今井 亨 氏(NHK) NHKでは毎晩7時のニュースの一部で,音声 認識を利用した字幕放送を試行的に行っている. これは,生放送のスタジオ・アナウンサーの音声 をリアルタイムで音声認識して,誤りがあれば 即座に人手で修正しつつ字幕を作成するもので ある.ニュース音声認識システムは,アナウンサ ー用に学習された音響モデル,最近のニュース 原稿に適応化された語彙と言語モデル,音声か らの遅れを最小限に抑えて認識結果を確定する サーチエンジンなどを特徴としている.本講演 では,本システムの概要と各要素技術について 解説する. 《参考文献》 [1] 今井亨,小林彰夫,尾上和穂,安藤彰男,“ニュ ース番組自動字幕化のための音声認識システ ム,”情処学音声言語情報処理研報,23-11, pp.59-64, Oct. (1998) [2] 後藤淳,今井亨,清山信正,今井篤,都木徹, 安藤彰男,磯野春雄,“ニュース音声認識結果の リアルタイム修正装置”,信学総大,A-15-15, pp.293, March. (2000) [3] 小林彰夫,今井亨,安藤彰男,中林克己,“ニュ ース音声認識のための時期依存言語モデル,”情 処学論、Vol.40, No.4, pp.1421-1429, Apr. (1999) [4] 今井亨,小林彰夫,佐藤庄衛,安藤彰男,“逐次 2パスデコーダを用いたニュース音声認識シス テム,”信学技報,SP99-129, pp.85-90, Dec. (1999) 〜会員登録情報の変更のお願い〜 AVIRG会員の御所属,会報送付先など登録情報に変更がありましたら,お手数ですが以下のいずれ かにご連絡ください. ◎ (財)日本学会事務センター 会員業務係 ◎ 電子メール(2000年度中) avirg-member@vision.STRL.nhk.or.jp (AVIRG幹事宛)  (注) 会員の確認のために,御氏名とともに,必ず会員番号を明記して下さい.      会員番号および学会事務センターの連絡先は会報郵送時の封筒に印刷されています. 6