聴覚の情報分析と計算論
和歌山大学システム工学部 河原 英紀
私は1997年4月から和歌山大学に移り、システム工学部デザイン情報学科メディア情報設計講座という、何をやっているのかわからないような部署にいます。逆にいえば、何を研究してもよいわけで、聴覚に関するメディア情報処理の研究を進めることにしました。聴覚の研究は、視覚に比べると道具立ても少なく、研究者も多くありません。そのことに、昔から欲求不満がありました。ところが、最近、そのような状況がかわりそうになってきました。そして、そのために使うことができるような、おもしろい道具も発明しましたので、聴覚の研究をもりあげるための一種のアジテーションを目的に話をさせていただきます。
聴覚の情景分析とは
聴覚の情景分析とは、さまざまな音源からの信号が渾然一体となった中から、それぞれの音源を聞きわける人間の能力を表す言葉です。われわれは一次元の信号でしかない音から、外界の像をつくりだし、何が起こっているのかを理解することができます。それがどのような計算論に基づいて行われているのかを明らかにすることが、聴覚の情景分析の研究の最終目的になります。
この聴覚の情景分析という名称は、カナダのブレグマンが1990年に著した『Auditory Scene Analysis』にちなんでいます。この題名は、ブレグマン先生が30年ほど研究されてきた聴覚心理のさまざまな現象について、人工知能学会で講演する際に苦労して創出したものです。人工知能の研究者にも興味をもたれるような名称を考える必要があるということで、そのころさかんであった画像の情景分析から苦し紛れにつくったという裏話を聞いています。その後、この言葉は一人歩きしていますが、研究が進むにつれて、その妥当性が明らかになってきました。先見の明があった命名だと感心しています。
|