网站首页 全球最实用的IT互联网站!

人工智能P2P分享Wind搜索发布信息网站地图标签大全

当前位置:诺佳网 > 人工智能 > 大模型 >

人工智能学习-AI入试相关题目练习-第十一次

时间:2026-01-27 23:16

人气:

作者:admin

标签:

导读:为了应对大学院考试,我们来学习相关人工智能相关知识,并做各种练习。通过学习,也算是做笔记,让自己更理解些。MDP(马尔可夫决策过程)割引率(折扣率)損失関数(损失函数...

1-前言

为了应对大学院考试,我们来学习相关人工智能相关知识,并做各种练习。

在这里插入图片描述

通过学习,也算是做笔记,让自己更理解些。

3-问题题目训练

【模擬問題①】(基礎・頻出)

問題1(最適探索・挖空)

以下の文章を読み、空欄 (a) ~ (f) に適切な語句を記入せよ。


最適優先探索は、ヒューリスティック関数としての (a) を用いて探索を進める手法である。
探索では、候補ノードを保持する (b) と、すでに展開済みのノードを保持する © を用いる。

アルゴリズムでは、(b) から評価値が最も (d) ノードを取り出し、© に追加する。
各ノードの評価値は、実コスト g(s) と (e) に基づいて計算され、一般に
f(s) = g(s) + (f)
として定義される。



【模擬問題②】(基礎・定番)

問題2(Q学習・挖空)

以下の文章を読み、空欄 (a) ~ (g) に適切な語句を記入せよ。


Q学習では、状態 s において行動 a を選択したときの価値を表す (a) を学習する。
この値は、即時報酬 r と (b) における最大の Q 値を用いて更新される。

Q 値の更新式では、学習率を ©、割引率を (d) とし、
将来報酬の影響を (e) で調整する。

また、探索と活用のバランスをとるため、確率 (f) でランダム行動を選択し、
確率 (g) で greedy 行動を選択する手法が用いられる。



【予測問題①】(やや難・論理構造)

問題3(ベイズフィルタ・挖空)

以下の文章を読み、空欄 (a) ~ (h) に適切な語句を記入せよ。


ベイズフィルタは、時刻 t における状態 (a) を、
過去の観測 (b) と行動 © に基づいて推定する確率的手法である。

予測ステップでは、遷移モデル (d) を用いて状態分布を更新し、
観測更新では、観測モデル (e) に基づいて尤度を計算する。

正規化後の状態分布は (f) と呼ばれ、
全状態に対する確率の (g) が 1 となるように (h) が行われる。



【予測問題②】

問題4(教師あり・教師なし・強化学習・挖空)

以下の文章を読み、空欄 (a) ~ (i) に適切な語句を記入せよ。


教師あり学習では、入力データとそれに対応する (a) が与えられ、
誤差関数を最小化するようにモデルの (b) を更新する。

一方、教師なし学習では、(a) が与えられず、
データの © や (d) を抽出することを目的とする。

強化学習では、エージェントが環境と (e) を繰り返し、
報酬 (f) を最大化する方策 (g) を学習する。

このとき、状態遷移は (h) としてモデル化され、
最適方策は (i) に基づいて定義される。


4-练习(日语版本)解析

【模擬問題①】問題1(強化学習・基本)

题目回顾要点

  • 状态・行动・报酬的数理框架
  • 将来报酬折算到现在

✅ アンサー

  • (a) マルコフ決定過程(MDP)
    ???? 马尔可夫决策过程

  • (b) 割引率
    ???? 折扣率(γ)

???? 中文理解:

强化学习通常用 MDP 来描述环境,
将来奖励用 折扣率 折算成当前价值。


【模擬問題②】問題2(教師あり学習)

题目回顾要点

  • 学习的目标
  • 参数更新方向

✅ アンサー

  • (a) 損失関数(誤差関数)
    ???? 损失函数(误差函数)

  • (b) 勾配
    ???? 梯度

???? 中文理解:

教师学习就是最小化损失函数
梯度 来决定参数往哪个方向更新。


【予測問題①】問題3(確率的推論)

题目回顾要点

  • 状态用概率分布表示
  • 每次观测后更新
  • 概率和为 1

✅ アンサー

  • (a) 観測更新
    ???? 观测更新(修正步骤)

  • (b) 正規化
    ???? 归一化

???? 中文理解:

新观测到来时,要更新概率分布
最后通过 正規化 保证总概率为 1。


【予測問題②】問題4(汎化性能・限界)

题目回顾要点

  • 学习效果在未知数据上变差
  • 学习数据“贴太死”

✅ アンサー

  • (a) 過学習(オーバーフィッティング)
    ???? 过拟合

  • (b) 正則化
    ???? 正则化

???? 中文理解:

过拟合是模型只会做训练题
正则化用于抑制模型过度复杂


✅ 一页速查总结(考前用)

MDP(马尔可夫决策过程)
割引率(折扣率)
損失関数(损失函数)
勾配(梯度)
観測更新(观测修正)
正規化(归一化)
過学習(过拟合)
正則化(正则化)

5-単語练习(日语版本)

5-总结

知识一点点记录吧,最后应对考试,打下基础

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信