close
1.

図書

図書
L. R. Rabiner, R. W. Schafer著 ; 鈴木久喜訳
出版情報: 東京 : コロナ社, 1983.4  2冊 ; 22cm
所蔵情報: loading…
2.

図書

図書
中田和男, 南敏共著
出版情報: 東京 : 昭晃堂, 1987.3  2, 2, 3, 226p ; 22cm
シリーズ名: 21世紀を指向した電子・通信・情報カリキュラムシリーズ ; C-5
所蔵情報: loading…
3.

図書

図書
中嶋正之編著
出版情報: 東京 : 昭晃堂, 1994.4  2, 3, 214p ; 21cm
所蔵情報: loading…
4.

図書

図書
中田和男著
出版情報: 東京 : コロナ社, 1995.2  xii, 147p ; 22cm
シリーズ名: 音響工学講座 / 日本音響学会編 ; 7
所蔵情報: loading…
5.

図書

図書
大澤光編著
出版情報: 東京 : 共立出版, 2000.7  viii, 237p ; 26cm
所蔵情報: loading…
6.

図書

図書
堂下修司 [ほか] 共編
出版情報: 東京 : オーム社, 1998.2  xvii, 383p ; 22cm
所蔵情報: loading…
7.

図書

図書
スチュアート・ローゼン, ピーター・ハウエル著 ; 今富摂子 [ほか] 訳
出版情報: 東京 : 海文堂出版, 1998.8  xv, 365p ; 26cm
所蔵情報: loading…
8.

図書

図書
谷萩隆嗣編著
出版情報: 東京 : コロナ社, 1996.9  ix, 249p ; 22cm
シリーズ名: ディジタル信号処理ライブラリー / 谷萩隆嗣企画・編集責任 ; 3
所蔵情報: loading…
目次情報: 続きを見る
1 : ディジタル音声信号処理の概要
2 : 線形予測法による音声の分析合成
3 : ケプストラム法による音声の分析合成
4 : 音声の規則合成と音声認識
5 : ディジタル画像処理の概要
6 : ディジタル画像の強調と復元
7 : ディジタル画像の圧縮
8 : 投影からのディジタル画像再構成
1 : ディジタル音声信号処理の概要
2 : 線形予測法による音声の分析合成
3 : ケプストラム法による音声の分析合成
概要: 本書では、最初に音声のディジタル信号処理を考え、基礎から分析合成および認識まで、いくつかの代表的な方法について詳しく述べる。つぎに、画像を対象として、ディジタル処理を行う際の基礎から強調、復元、圧縮などについて説明する。さらに、CT画像など で行われているように、投影された画像から原画像を再構成するための方法を詳細に解説する。 続きを見る
9.

図書

東工大
目次DB

図書
東工大
目次DB
今井聖著
出版情報: 東京 : 森北出版, 1996.11  x, 271p ; 22cm
所蔵情報: loading…
目次情報: 続きを見る
第1章 音声のパラメータ表現 1
   1.1 音声信号処理 1
   1.2 音声生成のモデル 3
   1.2.1 人間の音声生成と音源・フィルタモデル 3
   1.2.2 平坦なスペクトルの音源による音声生成のモデル 4
   1.2.3 音声生成のモデルのパラメータ 5
   1.3 スペクトル包絡のモデル 6
   1.3.1 モデルが満足すべき条件 6
   1.3.2 スペクトル包絡のモデルのフィルタ 9
   1.3.3 スペクトル包絡のモデルのパラメータの交換 11
   1.4 音声の分析 12
   1.4.1 音声の分析の目的 12
   1.4.2 音声のスペクトル包絡の抽出 13
   演習問題 15
第2章 音声の特徴ベクトル 17
   2.1 音韻の特徴と特徴ベクトル 17
   2.2 距離尺度の定義 18
   2.3 基本的な特徴ベクトルに対する距離尺度 19
   2.3.1 LPCケプストラムとその距離尺度 19
   2.3.2 LPCメルケプストラムとその距離尺度 21
   2.3.3 ケプストラムの距離尺度 23
   2.3.4 メルケプストラムの距離尺度 24
   2.4 動的パラメータ 25
   2.4.1 静的特性と動的特性 25
   2.4.2 時間変化パラメータの導出 26
   2.4.3 荷重2乗誤差基準に基づく直線あてはめの係数 26
   2.5 動的特性を考慮いた特徴ベクトル 28
   2.5.1 短時間区間の音響パラメータによる特徴ベクトル 28
   2.5.2 時間変化特性を考慮した特徴ベクトルと距離尺度 28
   2.6 特徴ベクトルの分布の解析 29
   2.6.1 特徴ベクトルの空間 29
   2.6.2 特徴ベクトルの確率分布の推定 31
   2.6.3 特徴ベクトルのクラスタ分析 33
   2.6.4 特徴ベクトルのベクトル量子化 34
   演習問題 38
第3章 音声の合成と符号化 41
   3.1 音声の分析合成 41
   3.1.1 音声の分析合成の方法 41
   3.1.2 PARCOR法による音声の分析合成 43
   3.1.3 LSP分析合成システム 46
   3.2 音声の符号化 48
   3.2.1 音声符号化の方法 48
   3.2.2 時間領域における符号化 48
   3.2.3 周波数領域における符号化 50
   3.2.4 音声生成のモデルを利用する符号化 51
   3.3 音声の規則合成 53
   3.3.1 規則合成によるテキスト音声変換 53
   3.3.2 規則合成システム 55
   演習問題 57
第4章 音声の認識 58
   4.1 自動音声認識 58
   4.2 自動音声認識における認識の基本単位 59
   4.3 音素の音響的変動 60
   4.4 自動音声認識の方法 61
   4.5 音素識別 64
   4.5.1 音素識別の方法 64
   4.5.2 パターンマッチング法による音素識別 65
   4.5.3 確率的手法による音素識別 67
   4.5.4 ニューラルネットワークによる音素識別 68
   4.6 DPマッチングによる孤立単語音声の認識 72
   4.7 HMMによる単語音声の認識 76
   4.7.1 HMMの構成 76
   4.7.2 出力符号系列の生成 77
   4.7.3 HMMによる音声パターンの認識 78
   4.7.4 出力符号系列生成確率の計算 79
   4.7.5 モデルのパラメータ推定 80
   4.8 連続音声認識 82
   4.8.1 連続音声の自動認識 82
   4.8.2 連続音声認識の方法 82
   4.8.3 連続音声のセグメンテーション 84
   4.8.4 単語スポッティング 86
   4.8.5 連続音声の認識における言語の確率モデルの利用 87
   4.8.6 連続音声のための自然言語処理 89
   4.8.7 連続音声認識における文の探索 90
   4.9 単語音声認識システムの不特定話者対応 93
   4.9.1 不特定話者対応の方法 93
   4.9.2 話者独立音声認識システム 93
   4.9.3 話者適応音声認識システム 94
   演習問題 94
第5章 不規則信号の解析 96
   5.1 不規則信号の数学的表現と解析 96
   5.2 確率過程の低次モーメント 97
   5.2.1 確率過程のモーメント 97
   5.2.2 相関関数および共分散関数 98
   5.3 定常過程 98
   5.4 共分散関数とパワースペクトル 100
   5.4.1 ウィーナ・ヒンチンの関係 100
   5.4.2 パワースペクトルの因子分解 100
   5.5 二つの定常過程の間の共分散関数とクロススペクトル 101
   5.5.1 相互相関関数と共分散関数 101
   5.5.2 クロススペクトル 102
   5.5.3 システムの入出力とクロススペクトル 102
   5.6 線形予測理論 103
   5.6.1 線形予測 103
   5.6.2 新生過程 104
   5.6.3 予測誤差 106
   5.7 低次モーメントとパワースペクトルの推定 108
   5.8 低次モーメントの推定 109
   5.8.1 平均値の推定 109
   5.8.2 共分散関数あるいは相関関数の推定 110
   5.9 パワースペクトルの推定 111
   5.9.1 サンプル共分散関数の変換によるスペクトル推定 111
   5.9.2 変形ピリオドグラムによるスペクトル推定 111
   5.9.3 LPC法によるスペクトル推定 113
   5.9.4 最尤推定法 117
   演習問題 118
第6章 初期のケプストラム法と準同刑法 120
   6.1 ケプストラム法の歴史 120
   6.2 ケプストラム 122
   6.3 逆畳み込み 123
   6.4 複素ケプストラム 125
   6.5 インパルス応答の複素ケプストラム 125
   6.5.1 複素ケプストラムによるシステムの特性と表現 125
   6.5.2 希望の対数振幅特性をもつ最小位相システムと最大位相システム 126
   6.5.3 希望の対数振幅特性をもつ直線位相システム 129
   6.6 伝達関数の極と零点による複素ケプストラムの表現 131
   6.7 最小位相システムのインパルス応答 132
   6.8 準同形ボコーダ 134
   6.8.1 音声生成のモデルとケプストラム 134
   6.8.2 直線畳み込みによる準同形合成 134
   6.8.3 全極型フルタによる準同形合成 135
   演習問題 137
第7章 不偏ケプストラム法 138
   7.1 不偏ケプストラム法の特徴 138
   7.2. 対数振幅近似フィルタ 141
   7.2.1 指数関数型の伝達関数をもつフィルタの特性 141
   7.2.2 指数関数に対する修正パデー近似式 142
   7.2.3 LMAフィルタの構成 144
   7.3 改良ケプストラム分析 148
   7.4 不偏ケプストラム分析 152
   7.4.1 対数スペクトルのモデル 152
   7.4.2 対数スペクトルの推定誤差 154
   7.4.3 推定値の修正による対数スペクトルの不偏推定 155
   7.4.4 対数スペクトルの不偏推定量の別の表現 157
   7.4.5 時間領域処理による対数スペクトルの不偏推定 160
   7.5 LMA分析合成システム 163
   演習問題 164
第8章 メルケプストラム法 169
   8.1 メルケプストラム法の特徴 169
   8.2 メル対数スペクトルとメルケプストラム 170
   8.2.1 メルスケールの近似表現 170
   8.2.2 メル対数スペクトル 173
   8.2.3 メルケプストラム 174
   8.3 MLSAフィルタ 175
   8.3.1 MLSAフィルタの伝達関数 175
   8.3.2 基礎フィルタの伝達関数の式の変形 178
   8.3.3 MLSAフィルタの係数感度 180
   8.3.4 MLSAフィルタの設計例 182
   8.4 不偏メルケプストラム分析 184
   8.4.1 メル対数スペクトルの推定法 184
   8.4.2 メル対数スペクトルの推定値に対する評価関数 186
   8.4.3 メルケプストラム分析法で求めたスペクトル包絡 187
   8.4.4 推定値の修正によるメル対数スペクトルの不偏推定 189
   8.4.5 時間領域処理によるメル対数スペクトルの不偏推定 189
   8.5 MLSAフィルタを用いるメルケプストラムボコーダ 191
   演習問題 193
第9章 MLSA分析合成システムを利用する音声の規則合成 201
   9.1 規則合成における日本語音声の単位とシステムの構成 201
   9.2 規則合成システムに利用するメルケプストラムボコーダ 202
   9.2.1 ボコーダに要求される条件 202
   9.2.2 MLSAフィルタを用いるメルケプストラムボコーダ 202
   9.2.3 スペクトル包絡の抽出と有声無声判別 204
   9.3 CV音節のデータファイル 204
   9.3.1 データファイルの作成法 204
   9.3.2 CV音節のセグメンテーションと規格化 205
   9.3.3 CV音節データファイルの内容 208
   9.4 CV音節メルケプストラムの接続 208
   9.4.1 CV音節間のパラメータの直線補間 208
   9.4.2 補間の始端と終端の設定 209
   9.4.3 パラメータの接続規則 210
   9.5 韻律の生成 212
   9.5.1 拍同期点のタイミング制御 212
   9.5.2 基本周波数の制御 212
   9.6 システムの性能 213
   9.6.1 システムの入力データ 213
   9.6.2 合成音声の品質 214
第10章 メルケプストラム分析に基づく連続音声認識システム 215
   10.1 連続音声認識システムの構成 215
   10.2 音素セグメンテーションシステム 216
   10.2.1 システムの構成 216
   10.2.2 セグメンテーションパラメータ 220
   10.2.3 有声音と非有声音のクラス分け 223
   10.2.4 有声音区間のセグメンテーション 224
   10.2.5 音素群ラベリング 226
   10.2.6 音素セグメンテーションシステムの性能 229
   10.3 前処理としてセグメンテーションを行う音素ラベリングシステム 229
   10.3.1 音素セグメントの音素ラベリング 229
   10.3.2 音素リファレンスパターン 230
   10.3.3 入力音声の各セグメントの特徴ベクトルの抽出 232
   10.3.4 入力パターンと音素リファレンスパターンとの距離の計算 232
   10.3.5 ラベリングコスト付き音素ラティスの生成 234
   10.4 単語スポッティングシステム 236
   10.4.1 記号列連続DPマッチングによる単語スポッティング 236
   10.4.2 記号列DPマッチング 236
   10.5 係り受け関係を利用する音声認識システム 238
   10.5.1 文認識における係り受け関係の利用 238
   10.5.2 文節候補の生成 240
   10.5.3 文節候補リストの作成 241
   10.5.4 文候補の生成 243
   10.5.5 システムの性能 243
演習問題の解答例 245
参考文献 255
索引 267
第1章 音声のパラメータ表現 1
   1.1 音声信号処理 1
   1.2 音声生成のモデル 3
10.

図書

図書
中録サービス株式会社編 ; 関口芳一著
出版情報: 東京 : オーム社, 1996.7  184p ; 24cm
シリーズ名: マルチメディアスタジオ
所蔵情報: loading…
11.

図書

東工大
目次DB

図書
東工大
目次DB
古井貞煕著
出版情報: 東京 : 近代科学社, 1992.9  xi, 254p ; 21cm
シリーズ名: 電子・情報工学入門シリーズ / 青島伸治, 小畑秀文, 南谷崇共編 ; 2
所蔵情報: loading…
目次情報: 続きを見る
   刊行のことば
   まえがき
1. 序論 1
   1.1 音とその分類 1
   1.2 音に関する研究の歴史 3
2. 音波の基本的性質 6
   2.1 音波とは 6
   2.2 音波の物理的性質 7
   2.3 感覚を考慮した物理量 8
   2.3.1 音圧と音の強さのレベル 8
   2.3.2 音源の音響パワーとそのレベル 9
   2.3.3 音の大きさとそのレベル 10
   2.4 音波の伝搬 11
   2.4.1 距離減衰と吸収 11
   2.4.2 反射・屈折・回折 11
   2.5 室内音響 13
   2.5.1 室内音響のアプローチ 13
   2.5.2 吸音と遮音 13
   2.5.3 残響現象 15
   2.5.4 反射音とハース効果 16
   2.5.5 音響設計 16
   2.5.6 音場明瞭度の評価・予測 17
3. 聴覚の基本的性質 19
   3.1 聴覚機構 19
   3.2 聴覚の特性 21
   3.2.1 可聴範囲 21
   3.2.2 弁別限とウェーバー-フェヒナーの法則 22
   3.2.3 音の大きさおよび高さ 23
   3.3 マスキング 25
   3.4 両耳効果 27
4. 波動理論 29
   4.1 波動方程式 29
   4.1.1 運動の方程式 29
   4.1.2 気体の法則 30
   4.1.3 連続の方程式 31
   4.1.4 波動方程式の導出 32
   4.2 1次元における波動方程式の解 33
   4.3 平面進行波 34
   4.4 閉管中の音波 36
   4.5 球面波 39
5. 機械振動系 40
   5.1 単振動 40
   5.2 1自由度系の自由振動 42
   5.2.1 減衰振動 43
   5.2.2 臨界減衰振動 44
   5.2.3 超過減衰振動 44
   5.3 1自由度系の強制振動 45
   5.4 弾性体の振動 45
   5.4.1 弦の振動 45
   5.4.2 棒の振動 47
   5.4.3 膜の振動 50
6. 電気・機械・音響系の対応 53
   6.1 等価回路 53
   6.2 機械素子 53
   6.2.1 質量要素 53
   6.2.2 機械コンプライアンス 55
   6.2.3 機械抵抗 57
7. 電気・機械・音響変換 58
   7.1 電気・音響変換の分類 58
   7.1.1 可逆変換 58
   7.1.2 非可逆変換 58
   7.2 電磁形変換方式 59
   7.2.1 動電変換 59
   7.2.2 電磁変換 59
   7.2.3 磁歪変換 60
   7.3 静電形変換方式 61
   7.3.1 静電変換 61
   7.3.2 圧電変換と電歪変換 61
   7.4 抵抗変化変換 62
   7.5 マイクロホン 63
   7.5.1 マイクロホンとは 63
   7.5.2 マイクロホンの分類 63
   7.5.3 将来のマイクロホン 66
   7.5.4 ダミーヘッド録音・バイノーラル再生 67
   7.6 スピーカ 68
   7.6.1 スピーカとは 68
   7.6.2 スピーカの分類 69
   7.6.3 振動板材料 71
   7.6.4 その他のスピーカ構成要素 71
8. オーディオ機器 74
   8.1 アナログ録音技術 74
   8.1.1 レコード 74
   8.1.2 テープレコーダ 75
   8.2 ディジタル録音技術 76
   8.2.1 ディジタル録音再生の原理 76
   8.2.2 CD 76
   8.2.3 光磁気ディスク 78
   8.2.4 DAT 78
   8.2.5 半導体メモリ 79
   8.2.6 オーディオ符号化技術 79
   8.3 その他のディジタル・オーディオ技術 79
   8.3.1 スタジオ用オーディオ機器 79
   8.3.2 電子楽器とコンピュータミュージック 80
9. 音場の音響信号処理 82
   9.1 新しい音響信号処理技術の展開 82
   9.2 音響エコーキャンセラ 84
   9.3 マイクロホンアレイ 85
   9.4 音像定位ステレオ通信方式 87
   9.5 音場制御 88
   9.5.1 音場制御の原理 88
   9.5.2 音場のシミュレーション 88
   9.5.3 能動的騒音制御技術 91
   9.5.4 3次元空間の音場制御と再生 93
10. 音声の基本的性質 96
   10.1 音声と言語 96
   10.2 発声器官の構造と機能 97
   10.3 音声の物理的性質 100
   10.3.1 瞬時的性質 100
   10.3.2 統計的性質 103
   10.4 音声生成モデル 104
   10.4.1 音声生成の音響理論とモデル化 104
   10.4.2 声道内音波の伝搬モデル 105
   10.4.3 声帯振動モデル 108
   10.4.4 調音モデル 110
   10.5 音声情報処理の階層構造 111
11. 音声分析法 113
   11.1 音声波形のディジタル化 113
   11.2 音声スペクトルの分析法 115
   11.2.1 スペクトル包絡と微細構造 115
   11.2.2 短時間自己相関とスペクトル 116
   11.2.3 ケプストラム 119
   11.2.4 合成による分析(A-b-S) 121
   11.3 音声分析合成系とピッチ抽出法 122
   11.4 線形予測分析 124
   11.4.1 線形予測分析の原理 124
   11.4.2 最尤スペクトル推定法 127
   11.4.3 音源情報の抽出と分析合成系 129
   11.4.4 PARCOR分析 131
   11.4.5 PARCOR分析による声道断面積関数の推定 136
   11.4.6 LSP分析 137
   11.4.7 線形予測パラメータの相互関係 139
12. 音声符号化 142
   12.1 音声符号化の原理 142
   12.2 時間領域での符号化 149
   12.2.1 非線形量子化と適応量子化 149
   12.2.2 予測符号化 149
   12.3 周波数領域での符号化 153
   12.3.1 帯域分割符号化(SBC)と適応変換符号化(ATC) 153
   12.3.2 適応ビット割当てAPC(APC-AB) 153
   12.4 分析合成系と波形符号化の組合せ 153
   12.4.1 残差または音声駆動による線形予測符号化 153
   12.4.2 マルチパルス(MPC)と符号駆動線形予測符号化(CELP) 154
   12.4.3 位相等化処理を用いた符号化 156
   12.4.4 時間領域調波構造伸縮(TDHS)アルゴリズム 157
   12.5 符号化音声品質の評価 159
13. 音声合成 161
   13.1 音声合成の原理 161
   13.2 録音編集方式とパラメータ編集方式 163
   13.3 規則合成方式 164
   13.3.1 規則による音声合成の原理 164
   13.3.2 合成単位音声の生成 165
   13.3.3 韻律情報の制御 166
   13.3.4 テキスト音声合成 169
   13.3.5 MITalK-79システム 171
   13.3.6 COC音声合成システム 171
14. 音声認識 174
   14.1 音声認識の原理 174
   14.1.1 音声認識の特徴と基本的構成 174
   14.1.2 音声区間の検出 177
   14.1.3 スペクトル距離尺度 178
   14.2 DPマッチング(DTW) 183
   14.2.1 DPマッチングの方法 183
   14.2.2 音素を単位とする方法 185
   14.3 HMM法 187
   14.3.1 HMM法の基本 187
   14.3.2 認識アルゴリズム 189
   14.3.3 バウム-ウェルチのパラメータ推定法 190
   14.3.4 HMM法の種々のバリエーション 191
   14.4 ニューラルネットワークによる方法 192
   14.4.1 多層パーセプトロン 192
   14.4.2 その他のニューラルネットワーク 194
   14.5 連続単語音声認識 194
   14.5.1 2段DP法とその改良 194
   14.5.2 連続DP法 197
   14.6 文音声認識 198
   14.6.1 文音声認識の基本的構成 198
   14.6.2 その他の構成要因 201
   14.6.3 言語処理 201
   14.6.4 統計的言語モデル 202
   14.6.5 文音声認識システムの例 203
   14.7 不特定話者音声の認識 205
   14.7.1 音声に含まれる個人性情報 205
   14.7.2 話者変動の少ない特徴や距離尺度を用いる方法 206
   14.7.3 話者変動をモデル化する方法 206
   14.7.4 話者適応・正規化法 207
15. 話者認識 211
   15.1 話者認識の原理 211
   15.2 話者認識に用いる音声の物理特徴 214
   15.3 発声内容依存型話者認識 215
   15.4 発声内容独立型話者認識 216
   15.4.1 長時間平均スベクトルによる方法 216
   15.4.2 スペクトルのベクトル量子化歪による方法 216
   15.4.3 スペクトルとピッチのペクトル量子化歪による方法 218
   15.4.4 HMMによる方法 219
16. 超音波とその応用 220
   16.1 超音波の性質 220
   16.2 超音波の発生器(超音波振動子) 221
   16.3 超音波の応用 221
   16.3.1 水中音響装置 221
   16.3.2 超音波探傷器 222
   16.3.3 超音波診断装置 222
   16.3.4 超音波スペクトロスコピー 222
   16.3.5 弾性表面波の利用 223
   16.3.6 超音波のエネルギー的応用 223
   16.3.7 その他の超音波応用 223
参考文献 225
索引 242
   刊行のことば
   まえがき
1. 序論 1
12.

図書

図書
電子情報通信学会編 ; 広瀬啓吉著
出版情報: 東京 : コロナ社, 2015.5  viii, 129p ; 26cm
シリーズ名: 電子情報通信レクチャーシリーズ / 電子情報通信学会編 ; C-8
所蔵情報: loading…
目次情報: 続きを見る
1 : 序論
2 : 音声と情報伝達
3 : 音声生成とモデル
4 : 音声分析
5 : 自然言語処理
6 : 音声合成
7 : 音声認識
1 : 序論
2 : 音声と情報伝達
3 : 音声生成とモデル
概要: 本書では、音声応用の基盤技術である音声合成、音声認識の基本技術を習得することを目的とし、それらを理解するために必要な音声生成、音声分析、そして非常に関連の深い自然言語処理の概略についても丁寧かつ平易に記述した。
13.

図書

図書
美山千香士著
出版情報: 東京 : ワークスコーポレーション, 2013.2  463p ; 26cm
所蔵情報: loading…
目次情報: 続きを見る
Pure Dataとは
1 基礎編 : プログラミングの初歩
Pdで音を出そう
メトロノームを作ろう ほか
2 応用編 : DAWとPdの連携
ネットワークを活用する
映像の生成 ほか
3 リファレンス編 : コントロールオブジェクト
チルダオブジェクト
Pure Dataとは
1 基礎編 : プログラミングの初歩
Pdで音を出そう
概要: Pure Dataによる、音のプログラミングのすべて。
14.

図書

図書
Jonathan Davidson, James Peters著 ; 風工舎訳編
出版情報: 東京 : ソフトバンクパブリッシング, 2001.1  xxiii, 399p ; 24cm
所蔵情報: loading…
15.

図書

図書
河原達也, 荒木雅弘共著 ; 人工知能学会編集
出版情報: 東京 : オーム社, 2006.10  xi, 191p ; 21cm
シリーズ名: 知の科学
所蔵情報: loading…
16.

図書

図書
鈴木誠史著
出版情報: 東京 : 丸善, 2005.9  ix, 162p ; 19cm
所蔵情報: loading…
17.

図書

東工大
目次DB

図書
東工大
目次DB
古井貞煕著
出版情報: 東京 : 森北出版, 1998.6  vii, 173p ; 22cm
シリーズ名: 電子情報通信工学シリーズ
所蔵情報: loading…
目次情報: 続きを見る
第1章 音声情報処理の基礎 1
   1-1 音声の基本的性質 1
   1-2 発声器官の構造 2
   1-3 音声生成モデル 6
   1-4 音声の物理的性質 9
   1-5 音声情報処理の概要 13
   演習問題 15
第2章 音声分析 16
   2-1 音声分析の原理 16
   2-2 音源情報の抽出法 22
   2-3 相関関数とスペクトル 24
   2-4 ケプストラム 24
   2-5 線形予測モデルによる分析法 26
   2-6 CSM分析 38
   2-7 LPCケプストラム 38
   2-8 合成による分析 39
   2-9 音声分析合成系 40
   2-10 声道断面積関数の推定 45
   2-11 線形予測パラメータの相互関係 45
   演習問題 46
第3章 音声符号化 47
   3-1 音声符号化の原理 47
   3-2 時間領域での符号化 51
   3-3 周波数領域での符号化 55
   3-4 ベクトル量子化 56
   3-5 時間領域調波構造伸縮(TDHS)アルゴリズム 59
   3-6 分析合成系と波形符号化の組合せ(ハイブリッド符号化) 60
   演習問題 65
第4章 音声合成 67
   4-1 音声合成の原理 67
   4-2 録音編集方式とパラメータ編集方式 68
   4-3 規則合成方式 68
   4-4 テキスト音声合成 73
   演習問題 78
第5章 音声認識 79
   5-1 音声認識の原理 79
   5-2 音響処理 82
   5-3 DPマッチング(DTW) 91
   5-4 HMM法 96
   5-5 ニュートラルネットワークによる方法 105
   5-6 連続単語音声認識 106
   5-7 文音声認識 111
   5-8 ロバスト(頑健)な音声認識 122
   演習問題 132
第6章 話者認識 133
   6-1 話者認識の原理 133
   6-2 テキスト依存型話者認識 140
   6-3 テキスト独立型話者認識 142
   6-4 テキスト指定型話者認識 144
   演習問題 146
第7章 音声情報処理の応用と今後の課題 147
   7-1 音声符号化 147
   7-2 音声合成 148
   7-3 音声認識 148
   7-4 話者認識 149
演習問題解答 150
参考文献 154
索引 168
第1章 音声情報処理の基礎 1
   1-1 音声の基本的性質 1
   1-2 発声器官の構造 2
18.

図書

東工大
目次DB

図書
東工大
目次DB
古井貞煕, 酒井善則著
出版情報: 東京 : 電波新聞社, 2004.1  xii, 291p ; 21cm
シリーズ名: ねっとテクノロジー解体新書 ; Series5
所蔵情報: loading…
目次情報: 続きを見る
まえがき ⅲ
1章 マルチメディアの仕組み 1
   1.1 マルチメディアの特徴 2
   1.2 マルチメディアシステム 2
   1.3 マルチメディアとネットワーク 3
   COLUMN 必要は発明の母 4
2章 音声情報処理の基礎 5
   2.1 音声生成の原理 6
    2.1.1 音声の基本的性質 6
    2.1.2 発声器官の構造 6
    2.1.3 音声生成モデル 10
   2.2 音声の物理的特徴 11
   2.3 音声の分析法 14
    2.3.1 音声分析の原理 14
    2.3.2 相関関数とスペクトル 19
    2.3.3 音源情報の抽出法 19
    2.3.4 ケプストラム 20
    2.3.5 線形予測分析法 21
    2.3.6 最尤スペクトル推定法 23
    2.3.7 変形相関関数 24
    2.3.8 PARCOR分析 25
    2.3.9 LSP分析 28
    2.3.10 LPCケプストラム 30
    2.3.11 線形予測パラメータの相互関係 31
    2.3.12 合成による分析 31
   2.4 音声情報処理の概要 33
   参考文献 34
   COLUMN マガーク効果 36
3章 音声・音響符号化 37
   3.1 音声・音響符号化の原理 38
   3.2 分析合成系 42
    3.2.1 分析合成系とは 42
    3.2.2 線形予測分析法による分析合成系 43
    3.2.3 PARCOR分析合成系 44
    3.2.4 LSP分析合成系 45
   3.3 H寺間領域での符号化 45
    3.3.1 非線形量子化 47
    3.3.2 適応量子化 48
    3.3.3 予測符号化 48
    3.3.4 時間分割符号化 50
    3.3.5 位相等化処理 50
    3.3.6 可変長符号 50
   3.4 周波数領域での符号化 51
    3.4.1 帯域分割符号化 51
    3.4.2 直交変換符号化 51
    3.4.3 適応ビット割当てAPC(APC-AB) 52
    3.4.4 ノイズシェーピング 53
   3.5 ベクトル量子化 53
    3.5.1 ベクトル量子化の原理 53
    3.5.2 一般化ロイドアルゴリズム 54
    3.5.3 木符号 54
   3.6 分析合成系と波形符号化の組み合わせ(ハイブリッド符号化) 55
    3.6.1 残差または音声駆動による線形予測符号化 55
    3.6.2 重み付きベクトル量子化変換符号化(TC-WVQ)とTwin VQ 56
    3.6.3 マルチパルス(MPC)と符号駆動線形予測符号化(CELP) 57
   3.7 広帯域音声の符号化 60
   3.8 MPEGの音響・音声符号化 61
   3.9 符号化音声品質の評価 62
   3.10 マルチメディアサービスヘの音声符号化技術の応用 53
   参考文献 64
   COLUMN 音声情報処理の研究動向を知るには 66
4章 音声合成
   4.1 音声合成の原理 68
   4.2 テキスト解析 69
   4.3 音声波形の生成 70
   4.4 録音編集方式とパラメータ編集方式 71
   4.5 規則合成方式 72
    4.5.1 規則による音声合成の原理 72
    4.5.2 合成単位音声の生成 72
    (1)ターミナルアナログ方式 73
    (2)波形接続(波形編集)方式 74
    (3)HMM合成法 74
    4.5.3 韻律情報の制御 75
   4.6 マルチメディアサービスヘの音声合成技術の応用 77
   参考文献 79
   COLUMN 世界で最初の音声合成器 80
5章 音声認識 81
   5.1 音声認識の原理 82
    5.1.1 音声認識の基本的構成 82
    5.1.2 音声認識の分類と課題 83
    (1)認識対象音声による分類 83
    (2)対象話者による分類 84
   5.2 音響処理 84
    5.2.1 音声区間の検出 84
    5.2.2 音響モデル(標準パターン)の基本単位 85
    5.2.3 特徴抽出 86
    5.2.4 帯域フィルタ群による方法 87
    5.2.5 ケプストラムによる方法 87
    5.2.6 動的ケプストラム 88
    5.2.7 スペクトル距離尺度 89
    5.2.8 LPC分析に基づく距離尺度 89
   5.3 DPマッチング(DTW) 91
   5.4 HMM法 94
    5.4.1 HMM法の基本 94
    5.4.2 認識アルゴリズム 95
    5.4.3 パラメータ推定アルゴリズム 99
    5.4.4 連結学習による音素HMMの作成 100
    5.4.5 HMM法の種々のバリエーション 101
   5.5 ニューラルネットワークによる方法 102
   5.6 連続音声認 103
    5.6.1 連続音声認識の基本的構成 103
    5.6.2 2段DP法とその改良 104
    (1)2段DP法 104
    (2)レベル・ビルディング(LB)法 105
    (3)ワンパスDP法またはワンステージDP法 105
    5.6.3 仮説探索の方向とアルゴリズム 106
    5.6.4 統計的言語モデル 107
    5.6.5 連続音声認識系の評価法 109
   5.7 連続音声認識の応用 111
    5.7.1 音声文字変換と音声対話システム 111
    5.7.2 音声文字変換の研究例 112
    5.7.3 音声対話システムの研究例 114
    5.7.4 話し言葉認識の難しさと言語モデルの構築 115
    5.7.5 話題語抽出と音声要約 115
    5.7.6 VoiceXML 117
   5.8 ロバスト(頑健)な音声認識のために 120
    5.8.1 音声の変動 120
    5.8.2 変動への自動適応機能 122
    5.8.3 主な適応化技術 123
    5.8.4 HMM合成法 124
    5.8.5 尤度最大化基準に基づく適応化 126
   5.9 マルチメディアサービスへの音声認識技術の応用 127
   参考文献 128
6章 話者認識 133
   6.1 話者認識の原理 134
    6.1.1 話者認識の基本的方法と分類 134
    6,1.2 話者認識の性能評価 136
    6.1.3 話者認識に用いる音声の物理特徴 138
    6.1.4 特徴量と類似度の正規化 138
    (1)特徴量の正規化 138
    (2)距離あるいは尤度の正規化 139
    (3)標準パターンあるいはモデルの更新 139
    (4)話者照合の判定しきい値の事前設定法 140
   6.2 テキスト依存型話者認識 140
   6.3 テキスト独方型話者認識 141
    6.3.1 長時間統計量による方法 141
    6.3.2 ベクトル量子化歪みによる方法 142
    6.3.3 HMMおよびGMMによる方法 143
   6.4 テキスト指示型話者認識 144
   6.5 マルチメディアサービスヘの話者認識技術の応用 145
   参考文献 145
   COLUMN 日本語と英語のどちらの音声が難しいか 148
7章 静止画像の符号化とJPEG 149
   7.1 静止画像の性質 150
    7.1.1 静止画像の画素構成 150
    7.1.2 色の表現と三原色 150
    7.1.3 色空間 151
   7.2 静止画像圧縮の原理 152
    7.2.1 情報圧縮の原理 152
    7.2.2 離散コサイン変換 152
    (1)変換符号化の有効性 153
    (2)離散コサイン変換 155
    7.2.3 ウェーブレット変換 156
    7.2.4 エントロピー符号化 157
    (1)ハフマン符号化 157
    (2)算術符号化 158
    7.2.5 予測符号化 161
   7.3 JPEGの概要 162
   7.4 基本方式 162
    7.4.1 構成 102
    7.4.2 DCT係数と量子化テーブル 163
    7.4.3 DC係数(直流成分)の符号化 164
    7.4.4 AC係数の符号化 165
    7.4.5 色情報の符号化 167
    (1)カラー画像の色情報 167
    (2)色成分の解像度 167
    7.4.6 基本方式のデータ形式 168
   7.5 DPCM方式 168
   7.6 ブログレッシブ符号化方式 169
    (1)近似精度向上方式 169
    (2)周波数選択方式 169
   7.7 ハイアラーキカル符号化 170
   7.8 JPEG2000 171
    7.8.1 JPEG2000の概要 171
    7.8.2 Motion JPEG2000 172
   参考文献 174
8章 2値画像の圧縮方式 175
   8.1 2値画像 176
   8.2 ファクシミリの発展 176
   8.3 ファクシミリの符号化 177
    8.3.1 修正ハフマン符号化 : (MH符号化) 177
    8.3.2 MR符号化 178
   8.4 2値画像符号化の国際標準JBIG 180
   8.5 線画像の符号化 181
   参考文献 182
9章 マルチメディア情報符号化の国際標準MPEG 183
   9.1 MPEGの概要 184
   9.2 動画像符号化特有の技術 184
    9.2.1 動画像の構成 184
    9.2.2 MPEGの基本技術 185
    (1)動き補償予測符号化 185
    (2)ピクチャ構成 188
    (3)MPEG符号器の基本構成 188
   9.3 MPEG-1 189
    9.3.1 入力画像形式 189
    9.3.2 動き補償予測符号化方式 191
    (1)動き予測の範囲 191
    (2)動きベクトルの符号化 191
    (3)動き補償の課題 192
    9.3.3 DCT 192
    (1)DCTの単位 192
    (2)IフレームDC係数の量子化 193
    (3)その他の係数の量子化 193
    (4)DCTミスマッチ 193
    9.3.4 DCT係数の符号化 194
    (1)IフレームDC係数の符号化 194
    (2)DC係数以外の係数の符号化 195
    9.3.5 MPEG情報の伝送 196
    (1)一定速度伝送 196
    (2)可変速度伝送 197
    (3)統計多重 197
    (4)MPEG over IP 198
   9.4 MPEG-2 198
    9.4.1 MPEG-2の要求機能 198
    9.4.2 入力画像形式 198
    9.4.3 動き補償予測符号化方式 199
    (1)フレーム構造に対するフレーム予測 199
    (2)フィールド構造に対するフィールド予測 200
    (3)フレーム構造に対するフィールド予測 200
    9.4.4 DCT 201
    9.4.5 DCT係数の符号化 202
    9.4.6 スケーラビリテイ 202
    9.4.7.MPEG信号のデータ構造 203
   9.5 MPEG-4 203
    9.5.1 MPEG-4の概要 203
    9.5.2 MPEG-4のアプリケーション 205
    9.5.3 システム要件 205
    9.5.4 機能と構造 206
    (1)メディアオブジェクトの定義 206
    (2)メディアオブジェクトの合成 206
    9.5.5 MPEG-4システム 207
    9.5.6 MPEG-4のビジュアル符号化 208
    (1)用意されているビジュアルオブジェクト符号化 208
    (2)アニメーションの符号化 208
    (3)誤り耐性 212
   9.6 含後の動画像符号化 213
   参考文献 214
10章 コンピュータグラフィックス技術
   10.1 コンピュータグラフィックスとマルチメディア 216
   10.2 画像モデルの作成 217
    10.2.1 曲線の発生 217
    10.2.2 ソリッドモデル 217
    (1)ソリッドモデルの編集 217
    (2)ソリッドモデルの表現 218
    10.2.3 表面モデル 218
    10.2.4 ワイヤーフレームモデル 219
   10.3 画像の編集 220
    10.3.1 幾何学的変換 220
    10.3.2 透視変換 221
   10.4 画像の表示 222
    10.4.1 陰線・陰面消去 222
    (1)Zバッファ法 222
    (2)スキャンライン法 222
    10.4.2 陰影処理 223
    (1)陰影モデル 223
    (2)スムーズシェーディング 224
    (3)影の付与 224
    10.4.3 レイトレーシング 225
   10.5 テクスチャマッピング 225
   10.6 コンピュータグラフィックスの動向 227
   参考文献 228
11章 画像情報の認識 229
   11.1 画像認識の概要 230
    11.1.1 前処理 230
    11.1.2 特徴抽出 221
    (1)2値化 231
    (2)エッジ抽出 232
    (3)細線化 232
    (4)領域分割 233
   11.2 統計的パターン認識 233
   11.3 構造的パターン認識 235
    11.3.1 トリーによる識別 235
    11.3.2 文法解析による識別 235
    11.3.3 ネットワーク構造を利用した識別 236
   11.4 不変量によるマッチング 237
   11.5 文字認識の例 239
    11.5.1 文字入力制限 239
    11.5.2 輪郭構造解析による文字認識 240
    11.5.3 線構造による文字認識 240
    11.5.4 背景構造解析による文字認識 241
   参考文献 242
12章 画像情報の検索技術と伝送技術 243
   12.1 画像情報の検索システム 244
    12.1.1 画像データベースと検索 244
    12.1.2 点画像データベースと検索 245
    (1)点画像情報の特徴 245
    (2)ブロック法 245
    (3)k-d木 246
    12.1.3 静止画像データベースと検索 248
    (1)静止画像情報の検索とデータ構造 248
    (2)静止画像の内容検索 249
    (3)色ヒストグラムによる検索 250
    (4)テクスチャによる検索 251
    (5)形状による検索 252
    (6)静止画像検索の具体例 253
    12.1.4 動画像データベースと検索 255
    (1)動画像の特徴とデータ構造 255
    (2)動画像の検索 255
    12.1.5 画像検索とMPEG-7 257
   12.2 マルチメディア期258
    12.2.1 メディア同期の概要 258
    12.2.2 メディアオブジェクト単位の同期 250
    12.2.3 ネットワーク内におけるストリームメディア同期 262
    12.2.1 ビットストリーム・スケーリング 264
    12.2.5 ストリームメディア同期システム例 265
    (1)システム構成 265
    (2)符号化タイプの変更によるスケーリング 267
    (3)符号化タイプ変更の優先度 267
    (4)スケーリングアルゴリズム 268
   参考文献 269
■ 英字略語一覧 270
■ 重要基礎用語 273
■ 索引 280
エピローグ 287
まえがき ⅲ
1章 マルチメディアの仕組み 1
   1.1 マルチメディアの特徴 2
19.

図書

東工大
目次DB

図書
東工大
目次DB
荒木雅弘著
出版情報: 東京 : 森北出版, 2007.10  ix, 232p ; 22cm
所蔵情報: loading…
目次情報: 続きを見る
第1部 パターン認識の基礎 1
第1章 パターン認識って何? 2
   1.1 パターン認識システムの構成 3
   1.2 パターンの前処理 5
   1.3 特徴抽出とは 5
   1.4 識別部の役割 7
   1.4.1 識別部の構成 7
   1.4.2 プロトタイプの決め方 8
   演習問題 11
第2章 データをきちんと取り込もう 12
   2.1 アナログ信号のディジタル化 12
   2.1.1 アナログ信号は波である 12
   2.1.2 標本化と量子化 13
   2.2 特徴抽出をしやすくする処理 16
   2.2.1 音の場合 16
   2.2.2 画像の場合 17
   演習問題 18
第3章 パターンの特徴を調べよう 19
   3.1 変動に強い特徴とは 20
   3.1.1 音声の場合 20
   3.1.2 文字の場合 24
   3.2 特徴の正規化 24
   3.3 特徴は多いほどよいか 27
   3.3.1 偶然に見つかってしまってはまずい 27
   3.3.2 特徴を減らそう 30
   演習問題 34
第4章 パターンを識別しよう 35
   4.1 NN法の定式化 35
   4.1.1 距離最小とは 36
   4.1.2 プロトタイプと決定境界の関係 37
   4.2 プロトタイプの決め方 38
   4.3 パーセプトロンの学習規則 40
   4.3.1 識別関数の設定 41
   4.3.2 識別関数とパーセプトロン 41
   4.3.3 2クラスの識別関数の学習 42
   4.3.4 パーセプトロンの学習アルゴリズム 45
   4.4 区分的線形識別関数とk-NN法 48
   4.4.1 平面で区切れない場合 48
   4.4.2 区分的線形識別関数の実現 48
   4.4.3 区分的線形識別関数の識別能力 50
   4.4.4 学習をあきらめるのも一手 50
   4.4.5 k-NN法の実現 51
   演習問題 52
第5章 誤差をできるだけ少なくしよう 53
   5.1 誤差評価にもとづく学習とは 53
   5.2 Widrow-Hoffの学習規則 55
   5.2.1 最急降下法 55
   5.2.2 Widrow-Hoffの学習規則 56
   5.3 パーセプトロンの学習規則との比較 58
   5.3.1 パーセプトロンの学習規則を導く 58
   5.3.2 着目するデータの違い 59
   演習問題 60
第6章 限界は破れるか-SVMとニューラルネットワーク 61
   6.1 サポートベクトルマシン 61
   6.1.1 分離面は見つかったけれど 62
   6.1.2 SVMの学習アルゴリズム 62
   6.1.3 線形分離可能にしてしまう 69
   6.2 ニューラルネットワーク 71
   6.2.1 ニューラルネットワークの構成 72
   6.2.2 誤差逆伝播法による学習 73
   演習問題 80
第7章 未知データを推定しよう-統計的方法 81
   7.1 間違う確率を最小にしたい 81
   7.1.1 誤り確率最小の判定法 82
   7.1.2 事後確率の求め方 82
   7.1.3 事後確率の間接的な求め方 83
   7.1.4 厄介者P(x)を消そう 83
   7.1.5 事前確率 84
   7.1.6 最後の難敵「尤度」 85
   7.2 データの広がりを推定する 85
   7.2.1 未知データの統計的性質を予測する 85
   7.2.2 最尤推定 87
   7.2.3 統計的な識別 88
   演習問題 91
第8章 本当にすごいシステムができたの? 92
   8.1 未知データに対する認識率の評価 92
   8.1.1 分割学習法 92
   8.1.2 交差確認法 93
   8.2 システムを調整する方法 95
   8.2.1 悪いところを探す 96
   8.2.2 前処理の確認 96
   8.2.3 特徴空間の評価 96
   8.2.4 ハイパーパラメータの調整 100
   演習問題 102
第2部 実践編-音声認識システムをつくる 103
第9章 連続音声を認識してみよう 104
   9.1 統計的音声認識手法 105
   9.2 音響モデルの難しさ 106
   9.3 言語モデルの難しさ 107
   9.3.1 文法による記述 107
   9.3.2 統計的言語モデル 108
   9.4 探索の難しさ 109
   演習問題 111
第10章 声をモデル化してみよう-音響モデルの作り方・使い方・鍛え方 112
   10.1 なぜ音響「モデル」か 112
   10.2 音響モデルの作り方 113
   10.3 音響モデルの使い方 118
   10.3.1 HMMにおける確率計算 118
   10.3.2 トレリスによる効率のよい計算 119
   10.3.3 ビタビアルゴリズムによる近似計算 120
   10.4 音響モデルの鍛え方 122
   10.4.1 状態遷移系列がわかっている場合 123
   10.4.2 状態遷移系列の確率がわかっている場合 123
   10.4.3 Baum-Welchアルゴリズム 124
   10.5 実際の音響モデル 127
   10.5.1 離散値から連続値へ 127
   10.5.2 モノフォンとトライフォン 128
   演習問題 129
第11章 HTKを使って単語を認識してみよう 130
   11.1 HTKの構成 130
   11.2 音声の録音とラベル付け 132
   11.2.1 音声の録音(HSLabの場合) 132
   11.2.2 音声の録音(wavesurferの場合) 132
   11.2.3 正解ラベル付け 134
   11.3 特徴抽出 136
   11.4 初期モデルの作成 137
   11.5 初期値の設定 140
   11.6 HMMの学習 141
   11.7 単語認識 143
   11.8 認識率の評価 145
   演習問題 147
第12章 文法を使って音声を認識してみよう 148
   12.1 文法とは 148
   12.2 正規文法と文脈自由文法 150
   12.2.1 文脈自由文法 151
   12.2.2 正規文法 152
   12.3 具体的な文法の記述法 152
   12.3.1 Julianでの文法の記述方法 152
   12.3.2 標準化された文法記述 158
   演習問題 162
第13章 統計的言語モデルを作ろう 163
   13.1 N-グラムで確率計算 164
   13.2 N-グラム言語モデルを作る 165
   13.2.1 N-グラムの推定 165
   13.2.2 語彙の制限 165
   13.2.3 バックオフスムージング 166
   13.2.4 ディスカウント値の決め方 168
   13.2.5 線形補間法 169
   13.3 言語モデルの評価 170
   13.4 Palmkit入門 170
   演習問題 177
第14章 連続音声認識に挑戦しよう 178
   14.1 音声認識における探索 178
   14.1.1 順番に探してゆこう 179
   14.1.2 ヒューリスティック探索 180
   14.1.3 調べる候補を絞り込む 186
   14.2 ゴールまでの近さの情報 187
   14.3 Juliusを動かす 189
   14.4 Julianを動かす 192
   14.5 認識結果の評価 193
   14.5.1 評価用データの準備 193
   14.5.2 認識実験 194
   14.5.3 認識率の算出 195
   演習問題 197
第15章 会話のできるコンピュータを目指して 198
   15.1 会話のできるコンピュータの要素技術 198
   15.2 音声合成のツール 200
   15.2.1 音声合成の手順 200
   15.2.2 日本語音声合成ツール Galatea talk 201
   15.3 顔画像合成のツール 203
   15.4 対話制御 203
   15.4.1 対話記述言語VoiceXML 203
   15.4.2 VoiceXMLによる擬人化エージェントの制御 204
   15.5 より自然な会話のために 207
   15.5.1 話し出すタイミング 208
   15.5.2 わかるということ 208
   15.5.3 本当の意味は 209
   演習問題 210
演習問題の解答 211
付録A 数学的な補足 220
   A.1 平均と分散 220
   A.2 共分散行列 220
   A.3 固有ベクトル 221
   A.4 正規分布 222
付録B インストールガイド 223
   B.1 cygwln 223
   B.2 savesurfer 223
   B.3 WEKA 223
   B.4 HTK 224
   B.5 Palmkit 224
   B.6 Julius/Julian 225
   B.7 Galatea 225
付録C 「楽して学べるパターン認識」と「その後」 226
参考文献 228
あとがき 229
索引 230
第1部 パターン認識の基礎 1
第1章 パターン認識って何? 2
   1.1 パターン認識システムの構成 3
20.

図書

図書
末永康仁編著
出版情報: 東京 : オーム社, 2008.11  v, 168p ; 21cm
シリーズ名: 新インターユニバーシティ
所蔵情報: loading…
21.

図書

図書
青木直史著
出版情報: 東京 : オーム社, 2008.12  vi, 168p ; 21cm
所蔵情報: loading…
22.

図書

図書
北山洋幸著
出版情報: 東京 : カットシステム, 2008.7  viii, 300p ; 24cm
シリーズ名: WAVプログラミング
所蔵情報: loading…
23.

図書

図書
八木伸行監修
出版情報: 東京 : オーム社, 2008.7  xiii, 284p ; 21cm
所蔵情報: loading…
24.

図書

東工大
目次DB

図書
東工大
目次DB
白井克彦編著
出版情報: 東京 : コロナ社, 2010.3  viii, 306p, 図版 [4] p ; 22cm
所蔵情報: loading…
目次情報: 続きを見る
1. 音声生成
   1.1 音声生成過程の観測 2
    1.1.1 調音観測技術 2
    1.1.2 音声生成にかかわる脳機能 10
   1.2 声道音響モデル 13
    1.2.1 声道音響理論 13
    1.2.2 子音生成モデル 17
    1.2.3 3次元声道音響モデル 18
   1.3 調音モデル 20
    1.3.1 幾何学的調音モデル 21
    1.3.2 主成分調音モデル 21
    1.3.3 生理的調音モデル 23
    1.3.4 機械的調音モデル 25
   1.4 調音運動軌道生成モデル 28
    1.4.1 ターゲットモデル 29
    1.4.2 タスクダイナミックモデル 30
    1.4.3 音響タスクモデル 32
   1.5 音声からの調音運動の推定 32
    1.5.1 調音パラメータ推定における解の非一意性 33
    1.5.2 声道断面積関数の推定 34
    1.5.3 調音パラメータの推定 36
   1.6 まとめ 39
2. 音声符号化
   2.1 音声符号化の流れ 41
    2.1.1 アナログからディジタルへ 41
    2.1.2 音声符号化で考慮すべき項目 42
   2.2 波形符号化技術 45
    2.2.1 波形符号化の流れ 45
    2.2.2 波形符号化の例 47
   2.3 ボコーダ技術 48
    2.3.1 ボコーダの始まり 48
    2.3.2 音声の線形予測符号化とスペクトル推定 48
    2.3.3 ボコーダの展開 49
    2.3.4 極低ビットレート符号化 51
   2.4 ハイブリッド符号化 52
    2.4.1 CELP音声符号化技術 52
    2.4.2 CELPの雑音符号帳の構成 55
    2.4.3 CELP系符号化の標準化技術 58
   2.5 MPEGのオーディオ符号化 61
   2.6 これからの音声符号化の流れ 61
    2.6.1 高品質化 61
    2.6.2 高機能化 63
   2.7 まとめ 64
3. 音声合成
   3.1 音声合成の始まりからテキストからの音声合成まで 65
    3.1.1 音声合成の始まり 65
    3.1.2 分析合成 68
    3.1.3 規則合成 69
    3.1.4 テキストからの音声合成 73
   3.2 高品質化に向けた展開 79
    3.2.1 学習による音声合成単位生成 79
    3.2.2 統計的手法による韻律制御 85
    3.2.3 コーパスベース音声合成 89
   3.3 多様化に向けた展開 94
    3.3.1 発話様式の分析と変換 94
    3.3.2 対話音声の合成 96
    3.3.3 声質変換 98
    3.3.4 音声多様表現のツール 101
   3.4 音声合成のアプリケーション 104
    3.4.1 文章校正・入力確認 105
    3.4.2 電話予約 105
    3.4.3 音声対話 106
    3.4.4 福祉 106
    3.4.5 CAI 107
   3.5 まとめ 109
4. 音声認識
    4.1 統計的音響モデル 113
    4.1.1 DTWからHMMへ 113
    4.1.2 HMMの利点 115
   4.2 HMMのモデル構造の進展 117
    4.2.1 出力確率分布表現の向上 117
    4.2.2 時間構造の表現方法の向上 118
    4.2.3 モデル構造の共有化 120
   4.3 HMMパラメータ推定の進展 124
    4.3.1 最尤学習 124
    4.3.2 識別学習 126
    4.3.3 ベイズ学習 130
    4.3.4 適応学習 132
   4.4 ハイブリッドアプローチ 135
    4.4.1 初期のアプローチ 136
    4.4.2 タンデムアプローチ 137
    4.4.3 動的特徴量・長時間特徴量 141
   4.5 実環境における音声認識 143
    4.5.1 雑音に強い特徴量・距離尺度 143
    4.5.2 スペクトルサブトラクション 144
    4.5.3 HMMの合成・分解 145
    4.5.4 マルチストリームアプローチ 146
    4.5.5 音声強調 149
    4.5.6 雑音下音声認識のための共通コーパス 150
   4.6 大語彙連続音声認識 151
    4.6.1 連続音声認識アルゴリズム 151
    4.6.2 統計的言語モデル 155
    4.6.3 DARPAにおける音声認識の歴史 159
    4.6.4 日本語大語彙連続音声認識 163
   4.7 字幕放送への応用 166
    4.7.1 字幕制作のための音声認識 166
    4.7.2 認識方式とモデルの学習 169
    4.7.3 発話検出と男女並列音声認識 170
    4.7.4 逐次早期確定 172
   4.8 まとめ 173
5. 音声対話システム
   5.1 対話の意味理解と応答・進行の自然性 175
    5.1.1 状態遷移に応じた音声理解と対話進行 176
    5.1.2 深層的な意図を理解した対話進行 177
    5.1.3 ユーザの自由な発話を許す対話進行 180
    5.1.4 リスク最小化に基づく効率的な対話進行 181
    5.1.5 確率モデルによる対話進行 182
   5.2 会話のリズム 183
    5.2.1 会話のリズムとターンテーキングの数理モデル 184
    5.2.2 発話内容の動的制御 186
    5.2.3 韻律情報の分析方法 190
   5.3 ロボットによるマルチモーダル会話 191
    5.3.1 初期の会話ロボット 193
    5.3.2 パラ言語を表出する会話ロボット 195
    5.3.3 パラ言語を理解する会話ロボット 198
    5.3.4 グループ会話 200
   5.4 まとめ 204
6. 言語処理・機械翻訳
   6.1 言語処理へのアプローチ 206
   6.2 言語処理システムと言語処理技術・言語知識 207
    6.2.1 言語処理システムの構成(機械翻訳を例に) 207
    6.2.2 言語解析技術 210
    6.2.3 機械翻訳技術 220
    6.2.4 言語知識の獲得・構築の方法論 224
   6.3 音声翻訳 229
    6.3.1 音声翻訳研究のためのコーパス 229
    6.3.2 機械翻訳の評価指標と音声翻訳への適用 231
    6.3.3 音声翻訳の現状 234
    6.3.4 音声翻訳の今後 235
   6.4 まとめ 236
7. 情報アクセス
   7.1 情報探索行動と情報アクセス技術 240
   7.2 テキスト情報アクセス 244
    7.2.1 テキスト情報検索 244
    7.2.2 Web検索 249
    7.2.3 質問応答 252
    7.2.4 評価・評判情報へのアクセス 255
   7.3 マルチメディア情報アクセス 256
    7.3.1 マルチメディア情報アクセスの課題 256
    7.3.2 音声認識を利用した映像インデクシング 259
    7.3.3 視覚的特徴を利用した映像インデクシング 262
    7.3.4 メタデータ制作・活用システム 264
    7.3.5 今後の展開 265
   7.4 まとめ 266
8. 展望
   8.1 統計的アプローチと音声基礎科学 267
   8.2 総合的音声応用システム開発技術 268
   8.3 音声言語処理の部品化とアーキテクチャ 269
   8.4 ユーザエクスペリエンス 271
   8.5 まとめ 272
引用・参考文献 273
索引 302
1. 音声生成
   1.1 音声生成過程の観測 2
    1.1.1 調音観測技術 2
25.

図書

図書
平坂文男著
出版情報: 横浜 : 関東学院大学出版会 , 東京 : 丸善 (発売), 2009.3  viii, 192p ; 21cm
所蔵情報: loading…
26.

図書

図書
藤原洋編
出版情報: 東京 : 共立出版, 2000.3  vii, 146p ; 21cm
シリーズ名: インターネット時代の数学シリーズ / 戸川隼人 [ほか] 編 ; 5
所蔵情報: loading…
27.

図書

図書
岩野公司編著 ; 河原達也 [ほか] 共著
出版情報: 東京 : コロナ社, 2023.1  ix, 192p ; 21cm
シリーズ名: 音響学講座 / 日本音響学会編 ; 7
所蔵情報: loading…
目次情報: 続きを見る
1章 音声認識 : 音声認識の概要
音声認識の原理 ほか
2章 音響モデルとその高度化 : 音響モデル
頑健性の向上 ほか
3章 言語モデルとその高度化 : 言語モデル
N‐gramモデル ほか
4章 話者認識 : 話者認識の概要
話者認識技術の進展と位置づけ ほか
5章 音声対話システム : 対話システムのバリエーション
対話の主導権 ほか
1章 音声認識 : 音声認識の概要
音声認識の原理 ほか
2章 音響モデルとその高度化 : 音響モデル
28.

図書

図書
春日正男 [ほか] 共著
出版情報: 東京 : コロナ社, 2001.7  vi, 246p ; 22cm
シリーズ名: 映像情報メディア基幹技術シリーズ / 映像情報メディア学会編 ; 1
所蔵情報: loading…
29.

図書

図書
中川聖一編著 ; 小林聡 [ほか] 共著
出版情報: 東京 : コロナ社, 2013.3  viii, 252p ; 21cm
所蔵情報: loading…
目次情報: 続きを見る
1 : 音声と言語の諸相
2 : 音声言語処理のモデル
3 : 自然言語処理のモデル
4 : 検索・質問応答システム
5 : 対話システム
6 : 翻訳システム
7 : テキスト、音声入力インタフェース
8 : フリーソフトウェアによる演習
1 : 音声と言語の諸相
2 : 音声言語処理のモデル
3 : 自然言語処理のモデル
30.

図書

図書
出版情報: 東京 : NTS, 2015.9  ii, vi, 340, 9p, 図版xp ; 27cm
所蔵情報: loading…
31.

図書

図書
中川聖一編著 ; 小林聡 [ほか] 共著
出版情報: 東京 : コロナ社, 2018.9  x, 288p ; 21cm
所蔵情報: loading…
目次情報: 続きを見る
1 : 音声と言語の諸相
2 : 音声言語処理のモデル
3 : 自然言語処理のモデル
4 : 検索・質問応答システム
5 : 対話システム
6 : 翻訳システム
7 : テキスト、音声入力インタフェース
8 : フリーソフトウェアによる演習
1 : 音声と言語の諸相
2 : 音声言語処理のモデル
3 : 自然言語処理のモデル
32.

図書

図書
石井直樹著
出版情報: 東京 : コロナ社, 2018.12  ix, 195p ; 26cm
所蔵情報: loading…
目次情報: 続きを見る
1 : パソコンのサウンド機能
2 : パソコン用音響機器
3 : Windowsにおけるサウンドの扱い
4 : サウンド用フリーソフト
5 : 音と音声
6 : サウンド波形の編集
7 : 言語音声の特徴と音声分析
8 : 言語音声の波形と特徴量の観測
9 : 特殊な発声音声の分析
1 : パソコンのサウンド機能
2 : パソコン用音響機器
3 : Windowsにおけるサウンドの扱い
概要: 無償で入手できるフリーソフトを使って、サウンド処理の実際を伝授。読者が実施したい処理に適するフリーソフトを選択する指針をも与えている。
33.

図書

図書
鵜木祐史 [ほか] 共著
出版情報: 東京 : コロナ社, 2018.3  viii, 160p ; 22cm
シリーズ名: 音響テクノロジーシリーズ / 日本音響学会編 ; 20
所蔵情報: loading…
目次情報: 続きを見る
1 : 音響情報ハイディング技術の概要
2 : 量子化における音響情報ハイディング技術
3 : 符号化技術における音響情報ハイディング技術
4 : 聴覚特性に基づいた音響情報ハイディング技術
5 : 音響情報ハイディング技術の評価
6 : 音響情報ハイディング技術の拡張応用
1 : 音響情報ハイディング技術の概要
2 : 量子化における音響情報ハイディング技術
3 : 符号化技術における音響情報ハイディング技術
34.

図書

図書
伊藤克亘, 花泉弘, 小泉悠馬共著
出版情報: 東京 : コロナ社, 2018.4  viii, 177p ; 21cm
所蔵情報: loading…
目次情報: 続きを見る
簡単な音声処理
簡単な画像処理
音声のフーリエ変換
フィルタ / 音声
画像の周波数領域処理
画像の空間領域処理
音声データの相関
画像データの類似度
複素信号
画像の幾何学的処理
分類
音声・画像処理の応用
簡単な音声処理
簡単な画像処理
音声のフーリエ変換
35.

図書

図書
中村哲編著 ; Sakriani Sakti [ほか] 共著
出版情報: 東京 : コロナ社, 2018.7  vii, 179p ; 21cm
シリーズ名: 音響サイエンスシリーズ / 日本音響学会編 ; 18
所蔵情報: loading…
目次情報: 続きを見る
第1章 : 音声翻訳の概要
第2章 : 話し言葉の異言語コミュニケーション
第3章 : 自動音声翻訳の構成要素
第4章 : 音声翻訳の研究プロジェクトとシステム
第5章 : 音声同時通訳
第6章 : 究極の音声翻訳
第1章 : 音声翻訳の概要
第2章 : 話し言葉の異言語コミュニケーション
第3章 : 自動音声翻訳の構成要素
概要: 近年ようやく実用化の緒に就いたコンピュータによる通訳について、話し言葉の本質や通訳に関する科学的知見に基づき解説した1冊。さらに、今後いかにコンピュータが人間の通訳者に迫るかについて議論している。
36.

図書

図書
森勢将雅著
出版情報: 東京 : コロナ社, 2018.8  xi, 256p ; 22cm
シリーズ名: 音響テクノロジーシリーズ / 日本音響学会編 ; 22
所蔵情報: loading…
目次情報: 続きを見る
1 : 基礎知識
2 : 音声のパラメータ表現
3 : 基本周波数の推定
4 : スペクトル包絡の推定
5 : 非周期性指標の推定
6 : 高精度に計算するコツ
7 : 音声の加工技術
8 : 音声品質の主観評価方法
1 : 基礎知識
2 : 音声のパラメータ表現
3 : 基本周波数の推定
37.

図書

図書
滝口哲也編著 ; 有木康雄 [ほか] 共著
出版情報: 東京 : コロナ社, 2021.9  ix, 309p ; 21cm
シリーズ名: 音響学講座 / 日本音響学会編 ; 6
所蔵情報: loading…
目次情報: 続きを見る
1章 : 音声と音声研究の歴史
2章 : 音声波形の特性
3章 : 音声の生成機構とそのモデル
4章 : 音声の分析
5章 : 音声合成
6章 : 音声処理の雑音対策
1章 : 音声と音声研究の歴史
2章 : 音声波形の特性
3章 : 音声の生成機構とそのモデル
38.

図書

図書
川崎洋 [ほか] 共著
出版情報: 東京 : 数理工学社 , 東京 : サイエンス社 (発売), 2022.4  x, 217p, 図版4p ; 22cm
シリーズ名: 情報工学レクチャーテキスト ; QKC-11
所蔵情報: loading…
目次情報: 続きを見る
第1章 : 人間の知覚
第2章 : 音の信号処理
第3章 : 画像・映像の信号処理
第4章 : 音声の認識・合成処理
第5章 : 画像認識の基礎
第6章 : 深層学習による画像認識
第7章 : 画像認識応用と映像認識
第8章 : 画像の3次元計測処理
第9章 : 3次元データ処理
第10章 画像生成・合成・表現 / CG
第1章 : 人間の知覚
第2章 : 音の信号処理
第3章 : 画像・映像の信号処理
39.

電子ブック

EB
篠田浩一著
出版情報: [東京] : Maruzen eBook Library , 東京 : 講談社, 2018.9  1 オンラインリソース
シリーズ名: MLP機械学習プロフェッショナルシリーズ
所蔵情報: loading…
目次情報: 続きを見る
第1章 : 音声とは
第2章 : 音声分析
第3章 : 音声認識とは
第4章 : 隠れマルコフモデル
第5章 : 言語モデル
第6章 : 大語彙連続音声認識
第7章 : 耐雑音音声認識
第8章 : 話者適応と話者認識
第9章 : 深層学習
第1章 : 音声とは
第2章 : 音声分析
第3章 : 音声認識とは
概要: 機械学習をいかに応用するか。最適な手法を見極める。音声の基礎から、耐雑音、話者認識、深層学習までこれからの実用に必須のトピックスを網羅。
40.

電子ブック

EB
川村新著
出版情報: KinoDen  1オンラインリソース (x, 207p)
シリーズ名: 次世代信号情報処理シリーズ ; 2
所蔵情報: loading…
目次情報: 続きを見る
1 : 音で復習する信号処理の基礎
2 : 発声モデル
3 : スペクトログラム
4 : 周波数分析に基づくノイズ除去
5 : 適応フィルタ
6 : 音響エフェクト
1 : 音で復習する信号処理の基礎
2 : 発声モデル
3 : スペクトログラム
41.

図書

図書
長尾真 [ほか] 著
出版情報: 東京 : 岩波書店, 2000.1  xviii, 241p ; 23cm
シリーズ名: 岩波講座マルチメディア情報学 ; 4
所蔵情報: loading…
42.

図書

図書
前川守著
出版情報: 東京 : 岩波書店, 1999.1  ix, 152p ; 25cm
シリーズ名: 1000万人のコンピュータ科学 / 前川守著 ; 4 芸術編
所蔵情報: loading…
43.

図書

図書
板橋秀一編著 ; 赤羽誠 [ほか] 共著
出版情報: 東京 : 森北出版, 2005.2  vii, 244p ; 22cm
所蔵情報: loading…
44.

図書

図書
米村俊一著
出版情報: 東京 : コロナ社, 2021.2  x, 239p ; 21cm
所蔵情報: loading…
目次情報: 続きを見る
人間はどうやって音を獲得したのか?
音が聴こえないとどのように困るのか?
そもそも「音」とはなにか?
われわれは音をどのように聴いているのか?
耳から受け取った音を脳はどう処理するのか?
人間はどうやって言葉を発するのか?
人間は音楽をどうやって認知しているのか?
音はどうすれば記録・再生できるのか?
コンピュータで音を扱うディジタルオーディオとは?
遠隔地に音声をどうやって伝送するのか?
音声合成/認識はどんな仕組みで動くのか?
音響・音声処理技術はどう活用されているのか?
人間はどうやって音を獲得したのか?
音が聴こえないとどのように困るのか?
そもそも「音」とはなにか?
45.

図書

図書
篠田浩一著
出版情報: 東京 : 講談社, 2017.12  x, 165p ; 21cm
シリーズ名: MLP機械学習プロフェッショナルシリーズ
所蔵情報: loading…
目次情報: 続きを見る
第1章 : 音声とは
第2章 : 音声分析
第3章 : 音声認識とは
第4章 : 隠れマルコフモデル
第5章 : 言語モデル
第6章 : 大語彙連続音声認識
第7章 : 耐雑音音声認識
第8章 : 話者適応と話者認識
第9章 : 深層学習
第1章 : 音声とは
第2章 : 音声分析
第3章 : 音声認識とは
概要: 機械学習をいかに応用するか。最適な手法を見極める。音声の基礎から、耐雑音、話者認識、深層学習までこれからの実用に必須のトピックスを網羅。
46.

図書

図書
鹿野清宏, 中村哲, 伊勢史郎共著
出版情報: 東京 : 昭晃堂, 1997.11  ii, ii, 4, 196p ; 22cm
シリーズ名: ディジタル信号処理シリーズ / 辻井重男企画・編集 ; 第5巻
所蔵情報: loading…
47.

図書

図書
青木直史著
出版情報: 東京 : 技術評論社, 2013.3  viii, 279p ; 21cm
シリーズ名: Software design plusシリーズ
所蔵情報: loading…
目次情報: 続きを見る
サウンドプログラミングの基礎知識
サイン波を鳴らしてみよう
サイン波を重ね合わせてみよう
周波数特性を分析してみよう
加算合成—足し算で音を作ってみよう
周波数特性を加工してみよう
減算合成—引き算で音を作ってみよう
PSG音源—電子音を鳴らしてみよう
アナログシンセサイザ—楽器音を鳴らしてみよう
FM音源—金属音を鳴らしてみよう〔ほか〕
サウンドプログラミングの基礎知識
サイン波を鳴らしてみよう
サイン波を重ね合わせてみよう
概要: サンプリング、サイン波、フーリエ変換、ディジタルフィルタ、PSG音源、アナログシンセサイザ、FM音源、PCM音源。音を作る原理をC言語のプログラムで体験学習。
48.

図書

図書
川村新著
出版情報: 東京 : CQ出版, 2021.1  335p ; 24cm
所蔵情報: loading…
目次情報: 続きを見る
第1章 : 音声信号処理の実験方法
第2章 : 音声データの基本操作
第3章 : 基本フィルタ処理
第4章 : スペクトル解析
第5章 : ボイス・チェンジャ
第6章 : エフェクト
第7章 : 適応フィルタ
第8章 : スペクトル・ノイズ除去
第9章 : 分析音
第10章 : 音の視覚化
第1章 : 音声信号処理の実験方法
第2章 : 音声データの基本操作
第3章 : 基本フィルタ処理
概要: 自分の声をリアルタイム加工!PCとヘッドホンで始める。wavファイルを扱い、入力wavファイルを処理して、出力wavファイルを生成。一方で、同じ音声処理をリアルタイムで実現するプログラムも提供している。
49.

図書

図書
川村新著
出版情報: 東京 : コロナ社, 2021.4  x, 207p ; 21cm
シリーズ名: 次世代信号情報処理シリーズ ; 2
所蔵情報: loading…
目次情報: 続きを見る
1 : 音で復習する信号処理の基礎
2 : 発声モデル
3 : スペクトログラム
4 : 周波数分析に基づくノイズ除去
5 : 適応フィルタ
6 : 音響エフェクト
1 : 音で復習する信号処理の基礎
2 : 発声モデル
3 : スペクトログラム
50.

図書

図書
伊藤克亘, 花泉弘, 小泉悠馬共著
出版情報: 東京 : コロナ社, 2019.9  viii, 188p ; 21cm
所蔵情報: loading…
目次情報: 続きを見る
簡単な音声処理
簡単な画像処理
音声のフーリエ変換
フィルタ / 音声
画像の周波数領域処理
画像の空間領域処理
音声データの相関
画像データの類似度
複素信号
画像の幾何学的処理
分類
音声・画像処理の応用
簡単な音声処理
簡単な画像処理
音声のフーリエ変換
文献の複写および貸借の依頼を行う
 文献複写・貸借依頼