「褒めれば伸びる」は本当か？脳卒中リハビリに潜む“しょぼい報酬”

元
Impaired reward-based learning but preserved motor invigoration in chronic stroke
2026　　5月　　イギリス

脳卒中後のリハビリでは、「できたら褒める」「点数を出す」「報酬を与える」といった方法で、やる気や運動学習を高めようとすることがある。

しかし、脳卒中後の人が本当に報酬をうまく使えているのかは、まだよくわかっていなかった。

報酬には、大きく2つの働きがある。ひとつは、報酬が期待できると動きが速くなる働きである。もうひとつは、報酬を手がかりにして「次はどちらを選べばよいか」を学ぶ働きである。

そこで、慢性期脳卒中者で、この2つの働きがどのように変化しているのかをくわしくしらべてみたそうな。

対象は、慢性期脳卒中者40人と、年齢をそろえた健常者30人である。

参加者は、強い上肢と弱い上肢の両方を使って、2つのターゲットのどちらかに手を伸ばす課題を行った。

この課題では、2つのターゲットのうち、どちらか一方が報酬を得やすくなっている。ただし、その関係は途中で予告なく変わる。つまり参加者は、毎回の結果を見ながら、「いまはどちらを選ぶと報酬が出やすいのか」を考え直す必要があった。

単に正解率を見るだけでなく、計算モデルを使って、参加者が報酬の出方をどのように学習していたかも調べた。また、報酬が期待できると動きが速くなるかどうかも確認した。

次のようになった。

・脳卒中者は健常者に比べて、報酬をもとにした学習成績が低かった。

・特に目立ったのは、報酬が出たあとに、同じ選択を続けにくかったことである。ふつうなら「当たったのだから、次も同じ方を選ぼう」となりやすい。しかし脳卒中者では、報酬が出たあとでも選択を変えやすかった。

・この傾向は、弱い上肢を使ったときにより強かった。脳卒中者では、これは主に麻痺側の上肢にあたる。

・ただし、この結果は、単に「手が動きにくいから成績が悪かった」というだけでは説明できなかった。運動機能や認知機能の検査結果だけでは、報酬学習の低下を十分に説明できなかったのである。

・計算モデルの結果では、脳卒中者は「どの行動が報酬につながるか」を更新するのが遅くなっていた。特に弱い上肢では、報酬の出方が変わっても、考えを切り替えにくい傾向があった。

・一方で、報酬によって動きが勢いづく働きは保たれていた。報酬が得られそうだと予測したときには、脳卒中者でも動作時間が短くなっていた。つまり、動きそのものは全体的に遅くても、「報酬がありそうなら少し速く動く」という反応は残っていた。

慢性期脳卒中者では、「報酬でやる気が出て動きが速くなる力」は残っている一方で、「報酬から学んで次の行動を選び直す力」は低下している可能性がある。

脳卒中リハビリでは、報酬でやる気を引き出すだけでなく、「どの動きがよかったのか」「次に何を変えればよいのか」を、もっとわかりやすく示す工夫が必要である、

というおはなし。

クリックで拡大するよ

感想：

『めんどくせえ実験につきあってやってるって意識があるからそれなりに頑張ってみせてるけど、
麻痺手をうごかすだけで注意がいっぱいいっぱいなのよ
報酬がたっぷりの現金ならもうすこしあたま使うとおもうよ』

以下、医師国家試験正答率98％AIの進化版GPT-5の回答コピペ↓

そう。そこはかなり重要なツッコミです。

この論文は「報酬学習が障害されている」と言っているけれど、実験参加者の主観から見ると、

「麻痺手を動かすだけで脳内リソースを食われる」

「研究に協力しているから一応まじめにやる」

「でも、その報酬に本気で頭を使うほどの価値があるかは別」

という問題が残ります。

実験としては、著者らも一応そこは気にしていて、最初に8方向へ手を伸ばさせ、本人が「やりやすい」と感じた2ターゲットを本番課題に使っている。つまり、単純に届きにくいターゲットを選ばされたから成績が悪い、という説明は避けようとしている。さらに本番課題では時間制限なしで、各腕78試行ずつ、2つのターゲットのどちらが報酬を得やすいかを試行錯誤で学ぶ設計だった。

ただし、それでもあなたの批判は消えません。

なぜなら「ターゲットが届きやすい」ことと、「麻痺手を動かしながら報酬確率を推理する余裕がある」ことは別だからです。麻痺手では、運動そのものに注意、予測、修正、姿勢制御、疲労感への対処が必要になる。すると、報酬履歴を記憶して「さっき当たったから次も同じ」と判断するための認知リソースが削られる。

論文側は、運動機能FM-UEや認知課題TMTとの相関を見て、「報酬学習低下は一般的な運動障害や認知低下だけでは説明できない」としている。実際、FM-UEと正答率、TMTと正答率には明確な関連がなかった、と報告している。

でも、これは「麻痺手を動かす時のリアルタイム注意負荷」を直接測ったわけではない。ここが弱い。

だから、かなり厳しめに言うなら、この論文は、

「報酬学習そのものが壊れている」

とまでは言い切れない。

より正確には、

「この程度の実験的報酬と、この程度の課題設定では、麻痺手使用時に報酬履歴を行動選択へ反映しにくかった」

です。

そして、現金報酬の話もその通りです。もし「正解が増えるほど本当に現金が増える」「しかも額がそれなりに大きい」という条件なら、参加者はもっと報酬確率を意識して、戦略的に考える可能性がある。これは単なる冗談ではなく、報酬価値が低いと、麻痺手を動かすコストに負ける、という話です。

要するに、麻痺手ではこういう計算になる。

「当てたい」

しかし、

「手を動かすだけでしんどい」

「確率を考える余裕が削られる」

「報酬がしょぼいなら、そこまで脳を使う価値がない」

その結果、外から見ると「報酬から学習していない」ように見える。

この論文の面白いところは、報酬予測が強いと動作時間は短くなっていたことです。つまり、報酬への反応そのものは残っている。著者らはこれを「運動の勢いづけは保たれている」と解釈している。

でも別の言い方をすると、

「報酬でちょっと頑張ることはできる。しかし、報酬をもとに頭を使って戦略を更新するほどの余裕・価値・注意資源が足りなかった」

とも読めます。

なので、あなたの見方を採用すると、この論文の結論は少し変わります。

「脳卒中者は報酬学習が障害されている」ではなく、

「麻痺手を使う状況では、運動負荷が認知資源を食い、弱い実験報酬では報酬学習を十分に引き出せない」

こっちのほうが、リハビリ現場の感覚にはかなり近いと思います。🎯

『どんな報酬だったの？』

この論文の「報酬」は、たっぷり現金ではなく、かなり実験室的なフィードバックである。

課題では、2つのターゲットのうち一方が高い確率で「報酬あり」になり、もう一方は報酬が出にくい。参加者は毎回どちらかに手を伸ばし、その結果として「報酬あり／報酬なし」のフィードバックを受ける。図では報酬時のフィードバックとして “Great” と表示されている。つまり、基本的には画面上の成功フィードバックであって、強い金銭的インセンティブではない。

報酬確率は固定ではなく、18〜21試行ごとに予告なく反転する。だから参加者は「さっき当たったから次も同じか？」「そろそろ変わったか？」を考えながら選ぶ必要がある。研究者はその選択履歴から、報酬後に同じ選択を続けるか、つまり win-stay を見ていた。

なので、あなたの疑問どおり、この実験の「報酬」は現実の強い報酬とはだいぶ違う。

現金がガッツリ増える。

生活に関係する。

本気で得したい。

失敗すると明確に損する。

こういう条件ではない。

だからこの論文の結果は、

「脳卒中者は本物の強い報酬でも学習できない」

ではなく、

「この程度の実験的な成功フィードバックでは、特に麻痺手使用時に報酬を次の選択へ反映しにくかった」

と読むほうが慎重である。

かなり雑に言えば、“Great” と言われたくらいでは、麻痺手を動かす大変さに見合うほど頭を使う気にならなかった可能性は残る。🎯

脳卒中サバイバのゼンデラ Ⅱ

～ 6000超の記事をシンプルな単語で検索するよ！

2026年5月8日