第5回 音声言語シンポジウム

第49回 音声言語情報処理研究会 (SIG-SLP)

日時: 2003年12月18日(木)・19日(金)
場所: 東京工業大学 すずかけ台キャンパス すずかけホール
    (東急田園都市線すずかけ台駅下車徒歩5分)     アクセスキャンパスマップ

主催: 情報処理学会 音声言語情報処理(SLP)研究会
    電子情報通信学会 言語理解とコミュニケーション(NLC)研究会
    電子情報通信学会および日本音響学会 音声(SP)研究会

協賛: 人工知能学会 言語・音声理解と対話処理(SLUD)研究会

概要:
18日(木)
 9:00- 9:50	【話者適応・識別】
10:00-12:05	【耐雑音 】
13:00-14:15	【音響モデル】
14:25-16:05	【言語モデル・要約】
16:15-18:15	【ポスターセッション】
19日(金)
 9:00- 9:50	【対話インタフェース】
10:00-12:00	【招待講演 -- 認知科学の最前線 -- 】
13:00-14:40	【システム・信頼度】
14:50-16:30	【プロジェクト紹介-1】
16:40-18:20	【プロジェクト紹介-2】

----------------------------------------------------------------------

プログラム:

12月18日(木)
(午前・前半)  9:00- 9:50	【話者適応・識別】

(1) {DAEM}アルゴリズムの音声・話者認識における有効性の検討
	板谷 洋平, 全 炳河, 南角 吉彦 (名工大), 宮島 千代美 (名大), 徳田 恵一, 北村 正 (名工大)
(2) 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応
	渡邉 友裕 (豊橋技科大), 西崎 博光 (山梨大), 宇津呂 武仁 (京大), 中川 聖一 (豊橋技科大)

(午前・後半) 10:00-12:05	【耐雑音 】

(3) 周波数特性の変動に頑健な実時間分散型音声認識手法
	柘植 覚, 黒岩 眞吾, 原 一眞, 北 研二 (徳島大)
(4) 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識
	西村 義隆, 篠崎 隆宏, 岩野 公司, 古井 貞煕 (東工大)
(5) {GMM}と{EM}アルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧
	藤本 雅清 (龍谷大), 有木 康雄 (神戸大)
(6) 大規模車内音声データベースにおける認識性能変動要因調査
	藤村 浩司, 伊藤 克亘, 武田 一哉, 板倉 文忠 (名大)  
(7) {PESQ}と擬似音声を用いた雑音下音声認識の性能予測の検討
	山田 武志, 北脇 信彦 (筑波大)

(午後・前半1)13:00-14:15	【音響モデル】

(8) 変分ベイズ法を用いた逐次状態分割法
	實廣 貴敏, 中村 哲 (ATR)
(9) モデル統合に基づく高速{EM}学習法
	芳澤 伸一 (松下電器), 鹿野 清宏 (奈良先端大)
(10) 静的・動的特徴の明示的な関係により{HMM}から導出されるトラジェクトリモデル
	全 炳河, 徳田 恵一, 北村 正 (名工大)

(午後・前半2)14:25-16:05	【言語モデル・要約】

(11) 複数のバックオフN-gramを動的補間する言語モデルの高精度化
	高橋 力矢, 峯松 信明, 広瀬 啓吉 (東大)
(12) 話題と話者に関する{PLSA}に基づく言語モデル適応
	秋田 祐哉, 河原 達也 (京大/JST)
(13) 談話標識の統計的選択に基づいた{CSJ}の講演からの重要文抽出
	南條 浩輝, 北出 祐, 河原 達也 (京大)
(14) 連続音声認識による言語情報と韻律情報を利用した講演音声の重要文抽出
	井上 章, 三上 貴由, 山下 洋一 (立命館大)

(午後・後半)16:15-18:15	【ポスターセッション】 

(15) バイリンガル話者音声に基づく二言語混合音響モデルの話者適応法の検討
	小笠原 洋一, 大河 雄一, 鈴木 基之, 伊藤 彰則, 牧野 正三 (東北大)
(16) 混合因子分析に基づく話者識別モデルのパラメータ共有構造
	山本 啓善, 南角 吉彦 (名工大), 宮島 千代美 (名大), 徳田 恵一, 北村 正 (名工大)
(17) 大人・子供に適応した音声情報案内のためのユーザ自動識別
	西村 竜一, 中村 敬介, 李 晃伸, 猿渡 洋, 鹿野 清宏 (奈良先端大)
(18) {AURORA-2J}を用いた{ETSI STQ Aurora WI008 Advanced DSR Frontend}の評価
	山田 武志 (筑波大), 武田 一哉 (名大), 北岡 教英 (豊橋技科大), 藤本 雅清 (龍谷大), 黒岩 眞吾 (徳島大), 山本 一公 (信州大), 西浦 敬信 (和歌山大), 佐宗 晃 (産総研), 水町 光徳, 遠藤 俊樹, 中村 哲 (ATR)
(19) 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討
	岡田 治郎, 山田 武志, 北脇 信彦 (筑波大)
(20) 離散混合出力分布型{HMM}を用いた非定常雑音下の音声認識
	小坂 哲夫, 加藤 正治, 好田 正紀 (山形大)
(21) 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討
	福田 隆, 新田 恒雄 (豊橋技科大)
(22) フレームごとのモデル合成による残響下音声認識
	山本 仁, 西本 卓也, 嵯峨山 茂樹 (東大)
(23) 様々な雑音環境での音声対話における文法と認識精度の関係の分析
	大庭 隆伸, 鈴木 基之, 伊藤 彰則, 牧野 正三 (東北大)
(24) {CIAIR}実走行車内音声データベース
	河口 信夫, 松原 茂樹, 山口 由紀子, 武田 一哉, 板倉 文忠 (名大)
(25) モーラ情報を用いた音素ラベリング方式の検討
	村上 仁一, 前田 智広, 池原 悟 (鳥取大)
(26) 音節連鎖モデルによる大語彙連続音声認識
	池田 太郎, 山本 一公, 松本 弘 (信州大), 西谷 正信, 宮澤 康永 (セイコーエプソン)
(27) Acoustic modeling in consideration of unknown variation factors at the time of recognition
	鈴木 浩之, 全 柄河, 南角 吉彦 (名工大), 宮島 千代美 (名大), 徳田 恵一, 北村 正 (名工大)
(28) 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討
	伊勢路 真吾, 福田 隆, 山田 博文, 桂田 浩一, 新田 恒雄 (豊橋技科大)
(29) Looking at alternatives within the framework of n-gram based language modeling for spontaneous speech recognition
	Luc Lussier, Edward Whittaker, 古井 貞煕 (東工大)
(30) 音節N-gramと単語辞書併用による姓名入力インタフェース
	押川 洋徳, 北岡 教英, 中川 聖一 (豊橋技科大)
(31) {WEB}文書を利用した音声認識誤りの訂正方法の検討
	西崎 博光, 伊藤 友裕, 関口 芳廣 (山梨大), 中川 聖一 (豊橋技科大)
(32) Application of Multilingual Subphonetic Segment for Spoken Document Retrieval
	Shi-wook Lee (AIST), 田中 和世 (筑波大), 伊藤 慶明 (岩手県立大)
(33) 「日本語話し言葉コーパス」にみられる促音化
	藤本 雅子, 籠宮 隆之 (国語研)
(34) 状況と文脈を利用した音声対話型車載インタフェースの構築と評価
	由浅 裕規, 水野 智士, 伊藤 敏彦, 甲斐 充彦, 小西 達裕, 伊東 幸宏 (静岡大)
(35) 車載情報機器との音声言語インタフェースにおける文体統一の効果
	森田 浩康, 林 真弘, 伊藤 敏彦, 甲斐 充彦, 小西 達裕, 伊東 幸宏 (静岡大), 桂川 景子, 大野 健 (日産自動車)
(36) F0モデル・パラメーターの自動決定方法についての考察
	布 社輝, 板橋 秀一, 山本 幹雄 (筑波大)
(37) F0・パワー・フォルマントを用いた合成音声の明瞭性制御に関する検討
	藤原 敬記, 広重 真人, 荒木 健治 (北大), 栃内 香次 (北海学園大)
(38) 英語学習者の文発声における韻律自動評定
	加藤 圭介, 野沢 和典, 山下 洋一 (立命館大)
(39) 拘束つき混合正規分布の最尤推定と{AIC}による同時発話複数音声の{F0}推定
	亀岡 弘和, 西本 卓也, 嵯峨山 茂樹 (東大)
(40) 音声対話における韻律を用いた話題境界検出
	大久保 崇, 菊池 英明, 白井 克彦 (早大)
(41) マルチモーダル音声認識におけるストリーム重み係数最適化の検討
	田村 哲嗣, 岩野 公司, 古井 貞煕 (東工大)

12月19日(金)
(午前・前半) 9:00-9:50	【対話インタフェース】

(42) 情報検索対話におけるユーザ発話の検索要求単位への分割
	徳久 良子, 寺嶌 立太, 脇田 敏裕 (豊田中研), 乾 健太郎 (奈良先端大)
(43) ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討
	白勢 彩子, 原 直, 藤村 浩司, 伊藤 克亘, 武田 一哉, 板倉 文忠 (名大)

(午前・後半)10:00-12:00	【招待講演 -- 認知科学の最前線 -- 】

(44) 子どもは新奇な名詞・動詞をどのようにアクションイベントに対応づけるのか
	今井 むつみ (慶大)

(45) 脳の文法処理と再帰的計算 --言語の脳科学をめざして--
	酒井 邦嘉 (東大)

(午後・前半)13:00-14:40	【システム・信頼度】

(46) {WOZ}によるオンライン修正が可能な事例ベース音声対話システム
	村尾 浩也 (名大/三洋電機), 河口 信夫, 松原 茂樹, 山口 由紀子, 武田 一哉 (名大), 稲垣 康善 (愛知県立大)
(47) Out-of-Domain Utterance Detection based on Confidence Measures from Multiple Topic Classification
	Ian R. Lane, 河原 達也 (京大/ATR), 松井 知子 (総数研/ATR), 中村 哲 (ATR)
(48) 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法
	李 晃伸 (奈良先端大), 河原 達也 (京大), 鹿野 清宏 (奈良先端大)
(49) A Word-spotting Hypothesis Testing for Accepting/Rejecting Continuous Speech Recognition Output
	Frank K. Soong, Wai-Kit Lo, 中村 哲 (ATR)

(午後・後半1)14:50-16:30	【プロジェクト紹介1】

(50) 21世紀COEプログラム「大規模知識資源の体系化と活用基盤構築」
	古井 貞煕 (東工大)

(51) 特定領域研究「韻律と音声処理」プロジェクトの紹介
	広瀬 啓吉 (東大)

(52) 科学研究費特定領域研究「メディア教育利用」におけるCALL研究
	中川 聖一 (豊橋技科大)

(53) 名古屋大学における音声音響関連研究プロジェクト --20世紀COEから21世紀COEへ--
	武田 一哉 (名大)

(午後・後半2)16:40-18:20	【プロジェクト紹介2】

(54) 総務省情報通信分野での研究開発における「多言語音声翻訳技術と評価プロジェクト」の紹介
	山本 誠一 (ATR)

(55) 人にやさしい音声認識・合成基盤ソフトウェアの研究開発
	鹿野 清宏 (奈良先端大), 河原 英紀 (和歌山大), 河原 達也 (京大), 武田 一哉 (名大), 猿渡 洋 (奈良先端大)

(56) 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告
	嵯峨山 茂樹 (東大), 伊藤 克亘 (名大), 宇津呂 武仁 (京大), 甲斐 充彦 (静岡大), 小林 隆夫 (東工大), 下平 博 (北陸先端大), 伝 康晴 (千葉大), 徳田 恵一 (名工大), 中村 哲 (ATR), 西本 卓也 (東大), 新田 恒雄 (豊橋技科大), 広瀬 啓吉, 峯松 信明 (東大), 森島 繁生 (成蹊大), 山下 洋一 (立命館大), 山田 篤 (ASTEM), 李 晃伸 (奈良先端大)

(57) 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要
	河原 達也 (京大), 武田 一哉, 伊藤 克亘 (名大), 李 晃伸, 鹿野 清宏 (奈良先端大), 山田 篤 (ASTEM)

シンポジウム実行委員会
実行委員長: 小林哲則(早稲田大)
副委員長: 井佐原均(通信総研), 広瀬啓吉(東大)
幹事:中村哲(ATR), 秋葉友良(産総研), 篠田浩一(東工大)
委員: 伊藤克亘(名大), 畑崎香一郎(NEC), 河原達也(京大)
    出羽達也(東芝),宇津呂武仁(京大), 福本淳一(立命館大), 中野幹生(NTT)
    小林隆夫(東工大), 伊藤彰則(東北大), 大川茂樹(千葉工大), 持田岳美(NTT)