石渕 久生, 宮本 博充, 新居 学, 中島 智晴
日本経営工学会論文誌 49(2) 108-117 1998年 査読有り
本研究では.多数の生産者が市場で競合しているような状況での市場選択問題に対して, 強化学習の代表的手法であるQ学習を用いた解析手法を提案する.市場選択問題では, 市場価格は需要と供給(出荷量)との関係で決定されると仮定する.そのため, 市場選択に関する意思決定の結果として市場から得られる利得は.他の生産者による市場選択の結果に依存する.そこで本研究では, まず, このような市場選択問題を, 一種のn人非協力ゲームとして定式化する.次に, Q学習を市場選択問題へ適用する方法を提案する.Q学習は, 市場価格を決定する需要関数が未知の場合でも有効な手法である.最後に, 数値実験により, Q学習の有効性を明らかにする.数値実験では, 他の生産者が前回と全く同じ行動を取ると仮定した場合での最適な市場選択と, Q学習に基づく市場選択との比較を行う.