「車を洗いたい。洗車場は50m先。歩くか、運転か」。人なら迷わないこの設問で、主要AIモデルの多くが誤答し、回答の揺らぎも露呈した。53モデルの検証結果は、性能競争の陰で見落とされがちな“判断の安定性”という課題を浮き彫りにしている。