close
1.

図書

図書
平野廣美著
出版情報: 東京 : パーソナルメディア, 2000.2  382p ; 21cm
シリーズ名: 遺伝的アルゴリズムと遺伝的プログラミング / 平野廣美著 ; [正]
所蔵情報: loading…
2.

図書

図書
平野廣美著
出版情報: 東京 : パーソナルメディア, 2000.2-2006.6  2冊 ; 21cm
所蔵情報: loading…
3.

図書

図書
高橋治久, 堀田一弘共著
出版情報: 東京 : コロナ社, 2009.11  vi, 215p ; 21cm
所蔵情報: loading…
4.

図書

東工大
目次DB

図書
東工大
目次DB
八谷大岳, 杉山将著
出版情報: 東京 : 毎日コミュニケーションズ, 2008.8  vi, 219p ; 24cm
所蔵情報: loading…
目次情報: 続きを見る
1章 “強くなる”ロボティック・ゲームプレイヤーを作るには 001
   1.1 “学習機能”の必要性 001
   1.2 NPC(Non-PlayerCharacter)の行動戦略の学習 002
   1.3 ロボットの動作の学習004
2章 学習とは? 007
   2.1 学習の定義 007
    2.1.1 心理学における学習 007
    2.1.2 認知心理学における学習 010
    2.1.3 脳科学における学習 010
   2.2 コンピュータの学習 011
    教師付き学習問題(Supervised Learning) 012
    教師なし学習問題(Unsupervised Learning) 012
    強化学習問題(Reinforcement Learning) 012
   2.3 答えを知らないロボット 013
3章 強化学習 015
   3.1 強化学習の背景 015
    3.1.1 最適制御理論(Optimal Control Theory) 015
    3.1.2 動的計画法(Dynamyc Programming) 016
   3.2 強化学習の構成 017
   3.3 マルコフ決定過程(Markov Decision Process) 019
   3.4 最適政策関数(Optimal Policy Function) 021
   3.5 状態価値関数(State Value Function) 022
   3.6 状態・行動価値関数(State-Action Value Function) 023
   3.7 動的計画法の問題点 024
4章 離散的な空間での学習 027
   4.1 はじめに 027
   4.2 ルックアップテーブルで表される価値関数の例 028
   4.3 標本を抽出する 030
   4.4 モンテカルロ法(Monte-CarIo Method) 031
    4.4.1 モンテカルロ法の基礎 051
    4.4.2 標本の独立性 032
    4.4.3 政策改善(Policy Improvement) 033
    4.4.4 政策反復(PClicy Iteration) 034
    4.4.5 モンテカルロ法を用いた政策反復法のアルゴリズム 036
    4.4.6 モンテカルロ法の問題点 039
   4.5 価値関数近似における教師付き学習 039
   4.6 TD法(Temporal Difference Method) 041
    4.6.1 TD法の基礎 041
    4.6.2 SARSA法を用いた政策反復アルゴリズム 044
    4.6.3 TD(λ)法 045
    4.6.4 TD(λ)法を用いた政策反復アルゴリズム 048
   4.7 Q学習(Q-Iearning) 049
    4.7.1 Q学習の基礎 049
    4.7.2 Q学習のアルゴリズム 050
   4.8 三目並べ(Ti-Tac-Toe)の例 051
    4.8.1 三目並べとは 051
    4.8.2 状態空間と行動空間の設計 052
    4.8.3 プログラム 055
    4.8.4 モンテカルロ法の実装 055
    4.8.5 SARSA法の実装 060
    4.8.6 TD(λ)法の実装 063
    4.8.7 Q学習の実装 065
   4.9 実行例 068
    4.9.1 設定 068
    4.9.2 学習用プログラムの実行例 069
    4.9.3 結果 071
    4.9.4 対戦用プログラムの実行例 073
5章 連続的な空間での学習 075
   5.1 はじめに 075
   5.2 台車の山登りゲーム 075
   5.3 価値関数の近似誤差 079
    5.3.1 TD二乗誤差 079
    5.3.2 ベルマ二乗残差(Square of Bellman Residual) 080
    5.3.3 TD(λ)二乗誤差 081
   5.4 価値関数のモデル 081
    5.4.1 線形モデル 081
   5.5 カーネルモデル 082
   5.6 線形モデルの最小二乗推定 083
    5.6.1 最良線形不偏推定量(Best Linear Unbiased Estimator) 084
    5.6.2 線形モデル最小二乗法による政策反復アルゴリズム 086
    5.6.3 価値関数近似の例 086
   5.7 カーネルモデルの最小二乗推定 088
    5.7.1 カーネルモデル最小二乗法による政策反復アルゴリズム 089
    5.7.2 価値関数近似の例 089
   5.8 アクロボットの例 090
    5.8.1 状態空間と行動空間の設計 091
    5.8.2 報酬関数の設計 091
    5.8.3 プログラム 092
    5.8.4 線形モデル用最小二乗法による政策反復アルゴリズムの実装 093
    5.8.5 カーネルモデル最小二乗法による政策反復アルゴリズムの実装 098
    5.8.6 実行例 102
    5.8.7 結果 104
6章 政策を直接近似する 107
   6.1 はじめに 107
   6.2 政策勾配法(PoIicy Gradient Method) 107
   6.3 最小分散ベースライン 110
   6.4 ガウスモデル政策モデル 110
   6.5 自然政策勾配法 112
   6.6 政策勾配の例 116
   6.7 4足歩行ロボットへの実装 118
    6.7.1 実装するロボットの定義 118
    6.7.2 状態空間と行動空間の設計 119
    6.7.3 報酬関数の設計 119
    6.7.4 プログラム 119
    6.7.5 政策勾配アルゴリズムの実装 120
    6.7.6 自然政策勾配法アルゴリズムの実装 125
    6.7.7 実行例 128
    6.7.8 結果 129
7章 強化学習最前線 133
   7.1 政策オフ型強化学習 133
   7.2 半教師あり学習(Semi-supervised Learning) 134
   指導学習(ApprenticeshIp Learning) 134
   見真似学習(Imitation Learning) 135
   7.3 転移学習(Transfer Learning) 135
   7.4 表現政策反復(Representation Policy Iteration) 135
   7.5 リスクを考慮した強化学習(Risk-sensitive Learning) 135
   7.6 階層的強化学習(Hierarchical Reinforcement Learning) 136
   7.7 能動学習(Active Learning) 136
   7.8 次元削減(Dimensionality Reduction) 137
   7.9 モデル選択(Model Selection) 137
   7.10 部分観測マルコフ過程(Partiall Observable Markov Decision Process) 137
Appendix A ソフトウェアのインストール 139
    A.1 Octaveのインストール方法 139
    A.2 ODEのインストール方法 142
    A.3 OpenGLのインストール方法 145
    A.4 FLTKのインストール方法 146
    A.5 三目並べゲームプログラムのインストール方法 148
    A.6 アクロボット用プログラムのインストール方法 150
    A.7 4足ロボット用プログラムのインストール方法 155
Appendix B プログラムリスト 159
    B.1 三目並べ 159
    B.2 アクロボット 171
    B.3 4足ロボット 192
索引 213
1章 “強くなる”ロボティック・ゲームプレイヤーを作るには 001
   1.1 “学習機能”の必要性 001
   1.2 NPC(Non-PlayerCharacter)の行動戦略の学習 002
5.

図書

図書
小高知宏著
出版情報: 東京 : オーム社, 2013.8  vii, 254p ; 21cm
所蔵情報: loading…
目次情報: 続きを見る
第1章 AIにおける「知識表現」と「知識処理アルゴリズム」 : 大規模データを活用した知的応用システム
AI技術と大規模データの処理
本書で扱うプログラム環境
第2章 探索 : 力ずくの探索手法
発見的な探索
相手がある場合の探索
第3章 知識表現 : 知識のネットワーク
論理的表現
第4章 進化的手法・群知能 : 遺伝的アルゴリズム・遺伝的プログラミング
群知能アルゴリズム
第5章 言語処理アルゴリズム : テキスト処理アルゴリズム
言語処理と統計的手法との融合
付録
第1章 AIにおける「知識表現」と「知識処理アルゴリズム」 : 大規模データを活用した知的応用システム
AI技術と大規模データの処理
本書で扱うプログラム環境
概要: 必要な情報を効果的に探し出す探索、利用可能な形式にまとめる知識表現、データ処理に有効な進化的手法・群知能、インターネットに大量に蓄積された自然言語を扱う言語処理アルゴリズムを取り上げ、大規模データ処理を支えるAI技術の基礎を固めます。
6.

図書

図書
アビームコンサルティングP&T DigitalビジネスユニットAdvanced Intelligenceセクター著 ; 日経SYSTEMS編集
出版情報: [東京] : 日経BP , 東京 : 日経BPマーケティング (発売), 2019.6  151p ; 24cm
所蔵情報: loading…
目次情報: 続きを見る
第1章 AIの基本 : AIとは何か
モデル作成の基本
アルゴリズムの概要と使い分け
代表的なアルゴリズム
非構造化データを扱うアルゴリズム
AI導入プロジェクトのプロセス
第2章 AIシステムの構築法 : 要件定義
PoC
設計
実装・テスト
運用
プロジェクトの立ち上げ
第1章 AIの基本 : AIとは何か
モデル作成の基本
アルゴリズムの概要と使い分け
概要: AIを使いこなすプロの方法論。AIシステムの開発プロセス徹底解説!
7.

図書

図書
藤澤公也, 寺澤卓也, 羽田久一共著
出版情報: 東京 : コロナ社, 2023.9  xii, 235p, 図版 [2] p ; 22cm
シリーズ名: メディア学大系 / メディア学大系編集委員会 [編] ; 18
所蔵情報: loading…
目次情報: 続きを見る
1章 : アルゴリズムの基本
2章 : 並べ替え
3章 : データ探索
4章 : 経路探索
5章 : データの圧縮と展開
6章 : 誤り検出と訂正
7章 : データの暗号化
8章 : 人工知能と機械学習
9章 : ニューラルネットワークによる機械学習
10章 : 畳み込みニューラルネットワーク
11章 : ニューラルネットワークの学習効率化
12章 : 深層学習とその応用
13章 : 人工知能のさまざまな技術と応用
1章 : アルゴリズムの基本
2章 : 並べ替え
3章 : データ探索
8.

図書

東工大
目次DB

図書
東工大
目次DB
渡辺澄夫著
出版情報: 東京 : 共立出版, 2001.7  x, 187p ; 22cm
シリーズ名: データサイエンス・シリーズ / 柴田里程 [ほか] 編集委員 ; 6
所蔵情報: loading…
目次情報: 続きを見る
第1章 学習と確率
   1.1 学習とは 1
   1.2 確率変数と情報科学 3
   1.2.1 離散値をとる確率変数 3
   1.2.2 連続値をとる確率変数 5
   1.2.3 確率変数の変換 8
   1.2.4 平均と分散 10
   1.3 確率と推論 13
   1.3.1 同時確率密度関数と関係 13
   1.3.2 推論と条件つき確率 14
   1.3.3 回帰関数 17
   1.3.4 独立性 18
   1.4 確率変数の距離 20
第2章 学習と統計的推測
   2.1 データと学習 23
   2.1.1 学習とは 23
   2.1.2 同時確率密度関数の学習 24
   2.1.3 学習法の意味 27
   2.1.4 学習の尺度 28
   2.1.5 条件つき確率密度関数の推定法 29
   2.1.6 回帰関数の推定 32
   2.1.7 パターン識別関数の推定 33
   2.1.8 関数近似誤差と統計誤差 36
   2.2 最適化法 36
   2.2.1 最急降下法 36
   2.2.2 確率項をもつ最急降下法 42
第3章 複雑な学習モデル
   3.1 関数近似モデル 47
   3.1.1 関数近似モデルの定義 47
   3.1.2 関数近似モデルの学習 49
   3.1.3 3層パーセプトロン 50
   3.1.4 球形基底関数,RBF 66
   3.2 競合学習 69
   3.2.1 確率競合モデル 69
   3.2.2 混合正規モデルの推論 71
   3.2.3 混合分布の最急降下法 72
   3.2.4 確率競合モデルとEMアルゴリズム 74
   3.2.5 EMアルゴリズム 74
   3.2.6 ノンパラメトリック学習 78
   3.2.7 自己組織化写像 81
   3.3 ボルツマンマシン 84
   3.3.1 ボルツマンマシンの定義 84
   3.3.2 ボルツマンマシンの推論 86
   3.3.3 平衡状態の実現 87
   3.3.4 ボルツマンマシンの学習 89
   3.3.5 平均場近似 91
   3.3.6 確定的ボルツマンマシン 93
   3.4 サポートベクトルマシン 94
   3.4.1 サポートベクトルマシンの定義 94
   3.4.2 マージン最大化 96
   3.4.3 高次元埋込みと核関数 99
第4章 学習の基礎理論
   4.1 隠れ層とパラメータの特定可能性 101
   4.2 統計的正則モデル 104
   4.2.1 最尤法の学習誤差と予測誤差 104
   4.2.2 最尤法におけるモデル選択 108
   4.2.3 ベイズ法の汎化誤差と確率的複雑さ 110
   4.2.4 ベイズ法におけるモデル選択 113
   4.3 特異計量をもつモデルの学習理論 116
   4.3.1 超完全基底と特定不能性 116
   4.3.2 学習モデルのゼータ関数 118
   4.3.3 特異点解消定理と学習曲線 125
   4.3.4 最尤法と経験確率過程 134
   4.4 統計物理学の方法 139
   4.4.1 レブリカ法 140
   4.4.2 熱力学的極限 145
   4.5 学習理論の関連する分野 150
   4.5.1 データサイエンスとの関係 151
   4.5.2 計算論的知能との関係 153
第5章 確率・統計の基礎知識
   5.1 確率論における概念と方法 155
   5.1.1 不等式 155
   5.1.2 特性関数 156
   5.1.3 確率変数の収束 158
   5.1.4 大数の法則と中心極限定理 159
   5.1.5 ウィッシャート分布 163
   5.1.6 順序統計量 164
   5.1.7 経験確率過程 165
   5.2 学習と関数空間論 169
   5.2.1 関数空間,距離,稠密性 169
   5.2.2 稠密性と多項式 170
   5.2.3 3層パーセプトロンによる関数近似 173
   5.2.4 次元の呪いと適応基底 174
   参考文献 177
   索引 185
第1章 学習と確率
   1.1 学習とは 1
   1.2 確率変数と情報科学 3
9.

図書

東工大
目次DB

図書
東工大
目次DB
渡辺澄夫 [ほか] 共著
出版情報: 東京 : 森北出版, 2005.7  vii, 195p ; 22cm
所蔵情報: loading…
目次情報: 続きを見る
第1章 例からの学習
   1.1 学習システムとは 1
   1.2 学習システムの現状 3
   1.3 学習理論の枠組み 6
   1.4 新しい学習システムと学習理論 9
   1.4.1 構造をもつ学習モデル 9
   1.4.2 超高次元空間 10
   1.4.3 確率変数の関係 11
   1.4.4 学習例の最適化 12
   1.4.5 学習と統計力学 13
   1.4.6 学習と現代数学 14
   1.5 学習の未来形 16
   1.5.1 学習システムの未来へ 16
   1.5.2 学習理論の未来へ 17
   参考文献 19
第2章 多層パーセプトロン
   2.1 はじめに 20
   2.2 多層パーセプトロンの関数近似能力 21
   2.2.1 多層パーセプトロン 21
   2.2.2 連続関数の一様近似 22
   2.2.3 次元の呪いの回避 23
   2.2.4 べき多項式の近似 24
   2.3 多層パーセプトロンの学習 25
   2.31 学習 25
   2.3.2 学習の加速化 26
   2.3.3 最急降下法の停滞 28
   2.3.4 多層パーセプトロンの応用 29
   2.4 多層パーセプトロンの汎化性 30
   2.4.1 汎化誤差 30
   2.4.2 BiasとVariance 31
   2.4.3 統計的モデル選択 33
   2.4.4 Early stopping と正則化 34
   2.4.5 特異モデルとしての多層パーセプトロン 36
   2.5 おわりに 38
   参考文献 38
第3章 カーネルマシン
   3.1 識別問題と線形識別器 46
   3.2 カーネルトリック 47
   3.3 サポートベクタマシン(SVM) 49
   3.4 正則化とソフトマージン 52
   3.4.1 正則化 53
   3.4.2 ソフトマージン 54
   3.5 SVMの汎化能力 55
   3.5.1 PAC学習の枠組み 56
   3.5.2 SVMの汎化誤差 58
   3.5.3 SVMのパラメータの決定法 58
   3.6 カーネルマシンの一般性 59
   3.6.1 再生核ヒルペルト空間 59
   3.6.2 レプリゼンタ定理 60
   3.7 いろいろなカーネル 61
   3.7.1 カーネルの変換と組み合わせ 62
   3.7.2 文字列に対するカーネル
   3.7.3 グラフのノードに対するカーネル 64
   3.7.4 分布に対するカーネル 65
   3.7.5 カーネルの修復 66
   3.8 いろいろなカーネルマシン 66
   3.8.1 SVMの拡張 66
   3.8.2 カーネル密度推定,動径基底関数 70
   3.8.3 正規過程 70
   3.8.4 その他のカーネルマシン 71
   3.9 おわりに 72
   参考文献 73
第4章 ベイジアンネットワーク
   4.1 はじめに 75
   4.2 ベイジアンネットワーク 76
   4.3 ベイジアンネットワークの確率推論 80
   4.3.1 確率推論アルゴリズム 81
   4.4 ベイジアンネットワークの統計的学習 86
   4.4.1 条件つき確率の学習 86
   4.4.2 グラフ構造の学習 87
   4.5 ベイジアンネットワークの応用 88
   4.5.1 障害診断への応用 88
   4.5.2 ユーザーモデリングヘの応用 89
   4.5.3 ベイジアンネットワークソフトウェア 91
   4.6 おわりに 95
   参考文献 95
第5章 能動学習の理論
   5.1 能動的な学習とは何か 98
   5.2 確率的なデータからの入出力関係の学習 99
   5.2.1 確率的な動作をするシステム 100
   5.2.2 入出力関係の学習 101
   5.2.3 学習機械の汎化能力 104
   5.3 能動学習の方法一汎化誤差を最小にするデータ採取点 105
   5.3.1 漸近理論による汎化誤差の期待値の推定 105
   5.3.2 汎化誤差を小さくする能動学習 -線形の場合- 108
   5.3.3 汎化誤差を小さくする能動学習 -一般の場合- 110
   5.3.4 確率的な能動学習 112
   5.3.5 その他の規準による最適データ採取点探索 114
   5.4 能動学習とモデル選択 117
   5.4.1 不適合なモデルのもとでの能動学習の悪影響 118
   5.4.2 モデル選択を組み合わせた能動学習 119
   5.5 ニューラルネットの能動学習 121
   5.6 能動学習の応用例 124
   5.7 おわりに 126
   付録1 Caxatheodory の定理 128
   付録2 行列式に関する関係式 129
   参考文献 129
第6章 アンサンブル学習の統計力学
   6.1 はじめに 132
   6.2 パーセプトロンのオンライン学習の理論 135
   6.2.1 パーセプトロン 135
   6.2.2 教師-生徒の定式化 137
   6.2.3 オーバーラップと汎化誤差 139
   6.2.4 学習アルゴリズム 142
   6.2.5 オーダーパラメータのダイナミクス 144
   6.3 アンサンブル学習のオンライン学習の理論 148
   6.3.1 アンサンブル学習 148
   6.3.2 学習アルゴリズム 150
   6.3.3 汎化誤差 151
   6.3.4 オーダーパラメータのダイナミクス 152
   6.4 線形パーセプトロンのアンサンブル学習 153
   6.4.1 汎化誤差とオーダーパラメータダイナミクス 153
   6.4.2 生徒の結合荷重が統計的に一様である場合 154
   6.4.3 生徒の結合荷重が統計的に一様でない場合 155
   6.5 非線形パーセプトロンのアンサンブル学習 157
   6.6 まとめ 158
   参考文献 159
第7章 特異点解消と学習システムヘの応用
   7.1 定義および特異点解消定理 162
   7.2 プローアップ 165
   7.3 ニュートン図形を用いた特異点解消 172
   7.4 ベイズ学習理論および特異点解消定理の応用 185
   参考文献 191
   索 引 193
第1章 例からの学習
   1.1 学習システムとは 1
   1.2 学習システムの現状 3
10.

図書

図書
金森敬文, 畑埜晃平, 渡辺治共著
出版情報: 東京 : 森北出版, 2006.9  viii, 207p ; 22cm
シリーズ名: 知能情報科学シリーズ : intellectual information science series
所蔵情報: loading…
文献の複写および貸借の依頼を行う
 文献複写・貸借依頼