人工智能学习-AI入试相关题目练习-第十一次

1-前言
3-问题题目训练
【模擬問題①】（基礎・頻出）
- 問題1（最適探索・挖空）
【模擬問題②】（基礎・定番）
- 問題2（Q学習・挖空）
【予測問題①】（やや難・論理構造）
- 問題3（ベイズフィルタ・挖空）
【予測問題②】
- 問題4（教師あり・教師なし・強化学習・挖空）
4-练习（日语版本）解析
【模擬問題①】問題1（強化学習・基本）
- - 题目回顾要点
  - ✅ アンサー
【模擬問題②】問題2（教師あり学習）
- - 题目回顾要点
  - ✅ アンサー
【予測問題①】問題3（確率的推論）
- - 题目回顾要点
  - ✅ アンサー
【予測問題②】問題4（汎化性能・限界）
- - 题目回顾要点
  - ✅ アンサー
- ✅ 一页速查总结（考前用）
５-単語练习（日语版本）
5-总结

1-前言

为了应对大学院考试，我们来学习相关人工智能相关知识，并做各种练习。

在这里插入图片描述

通过学习，也算是做笔记，让自己更理解些。

3-问题题目训练

【模擬問題①】（基礎・頻出）

問題1（最適探索・挖空）

以下の文章を読み、空欄 (a) ～ (f) に適切な語句を記入せよ。

最適優先探索は、ヒューリスティック関数としての (a) を用いて探索を進める手法である。
探索では、候補ノードを保持する (b) と、すでに展開済みのノードを保持する © を用いる。

アルゴリズムでは、(b) から評価値が最も (d) ノードを取り出し、© に追加する。
各ノードの評価値は、実コスト g(s) と (e) に基づいて計算され、一般に
f(s) = g(s) + (f)
として定義される。

【模擬問題②】（基礎・定番）

問題2（Q学習・挖空）

以下の文章を読み、空欄 (a) ～ (g) に適切な語句を記入せよ。

Q学習では、状態 s において行動 a を選択したときの価値を表す (a) を学習する。
この値は、即時報酬 r と (b) における最大の Q 値を用いて更新される。

Q 値の更新式では、学習率を ©、割引率を (d) とし、
将来報酬の影響を (e) で調整する。

また、探索と活用のバランスをとるため、確率 (f) でランダム行動を選択し、
確率 (g) で greedy 行動を選択する手法が用いられる。

【予測問題①】（やや難・論理構造）

問題3（ベイズフィルタ・挖空）

以下の文章を読み、空欄 (a) ～ (h) に適切な語句を記入せよ。

ベイズフィルタは、時刻 t における状態 (a) を、
過去の観測 (b) と行動 © に基づいて推定する確率的手法である。

予測ステップでは、遷移モデル (d) を用いて状態分布を更新し、
観測更新では、観測モデル (e) に基づいて尤度を計算する。

正規化後の状態分布は (f) と呼ばれ、
全状態に対する確率の (g) が 1 となるように (h) が行われる。

【予測問題②】

問題4（教師あり・教師なし・強化学習・挖空）

以下の文章を読み、空欄 (a) ～ (i) に適切な語句を記入せよ。

教師あり学習では、入力データとそれに対応する (a) が与えられ、
誤差関数を最小化するようにモデルの (b) を更新する。

一方、教師なし学習では、(a) が与えられず、
データの © や (d) を抽出することを目的とする。

強化学習では、エージェントが環境と (e) を繰り返し、
報酬 (f) を最大化する方策 (g) を学習する。

このとき、状態遷移は (h) としてモデル化され、
最適方策は (i) に基づいて定義される。

4-练习（日语版本）解析

【模擬問題①】問題1（強化学習・基本）

题目回顾要点

状态・行动・报酬的数理框架
将来报酬折算到现在

✅ アンサー

(a) マルコフ決定過程（MDP）
???? 马尔可夫决策过程
(b) 割引率
???? 折扣率（γ）

???? 中文理解：

强化学习通常用 MDP 来描述环境，
将来奖励用 折扣率 折算成当前价值。

【模擬問題②】問題2（教師あり学習）

题目回顾要点

学习的目标
参数更新方向

✅ アンサー

(a) 損失関数（誤差関数）
???? 损失函数（误差函数）
(b) 勾配
???? 梯度

???? 中文理解：

教师学习就是最小化损失函数，
用梯度来决定参数往哪个方向更新。

【予測問題①】問題3（確率的推論）

题目回顾要点

状态用概率分布表示
每次观测后更新
概率和为 1

✅ アンサー

(a) 観測更新
???? 观测更新（修正步骤）
(b) 正規化
???? 归一化

???? 中文理解：

新观测到来时，要更新概率分布，
最后通过 正規化 保证总概率为 1。

【予測問題②】問題4（汎化性能・限界）

题目回顾要点

学习效果在未知数据上变差
学习数据“贴太死”

✅ アンサー

(a) 過学習（オーバーフィッティング）
???? 过拟合
(b) 正則化
???? 正则化

???? 中文理解：

过拟合是模型只会做训练题，
正则化用于抑制模型过度复杂。

✅ 一页速查总结（考前用）

MDP（马尔可夫决策过程）
割引率（折扣率）
損失関数（损失函数）
勾配（梯度）
観測更新（观测修正）
正規化（归一化）
過学習（过拟合）
正則化（正则化）

５-単語练习（日语版本）

5-总结

知识一点点记录吧，最后应对考试，打下基础

人工智能学习-AI入试相关题目练习-第十一次

人工智能学习-AI入试相关题目练习-第十一次

1-前言

3-问题题目训练

【模擬問題①】（基礎・頻出）

問題1（最適探索・挖空）

【模擬問題②】（基礎・定番）

問題2（Q学習・挖空）

【予測問題①】（やや難・論理構造）

問題3（ベイズフィルタ・挖空）

【予測問題②】

問題4（教師あり・教師なし・強化学習・挖空）

4-练习（日语版本）解析

【模擬問題①】問題1（強化学習・基本）

题目回顾要点

✅ アンサー

【模擬問題②】問題2（教師あり学習）

题目回顾要点

✅ アンサー

【予測問題①】問題3（確率的推論）

题目回顾要点

✅ アンサー

【予測問題②】問題4（汎化性能・限界）

题目回顾要点

✅ アンサー

✅ 一页速查总结（考前用）

５-単語练习（日语版本）

5-总结

相关阅读

本类排行

相关标签

本类推荐

栏目热点

猜你喜欢