全4360文字
お掃除ロボットにも「アメとムチ」が必要!?

 逆に、「やってはいけないこと」の違反度に応じて「罰点」を設定することもある。たとえば、無人運転車に搭載されるソフトには、「信号を無視したらマイナス100点」、「ネコをひいたらマイナス200点」、「通行人をひいたらマイナス5億点」みたいなペナルティーを設定しておくわけだ。

目的関数 = 「やってはいけないこと」に応じたペナルティー → 「これを最小化せよ」と命令

 ところがロボットは、私たちが期待するような振る舞いを、実際にしてくれるとは限らない。

ドジっ子ロボットには、お仕置きが必要だ

 たとえばお掃除ロボット。部屋の床掃除を勝手にやってくれる掃除機は、すでにかなり普及している。筆者も1台持っている。ただしこのロボット、あまり融通が利かない。同じところをグルグル回ったり、段差にハマったり、電源コードを巻き込んでしまったりする。

 また、「電池が切れるまでの間に掃除する床面積」を最大化するようプログラムされたロボットは、最短距離で移動しようとするときに、その動線上にあった家具を壊してしまうかもしれない。こういう問題が発生するのは、(人間が暗黙のうちに期待している)さまざまな「目的関数」や「制約条件」の全てを、(明示的に)インプットできるとは限らないからだ。与えられたタスクそのもの以外のファクター、つまり作業をとりまく環境や文脈というものが、お掃除ロボットにはのみ込めていない。

 これが人間の「お掃除担当メイドさん」であれば、家具を壊したりしたら、ご主人様から叱られるかクビ。最悪の場合、損害賠償請求の訴訟を起こされてしまうかもしれない。そしてそれが分かっているからこそ、家具の扱い(などの、直接命じられてはいない事柄)にも注意を向けてくれる。

 何か、うまい方法はないものだろうか?。

ご主人様 VS 代理人 (プリンシパル・エージェント問題)

 カナダ・トロント大学のギリアン・ハットフィールド氏が発表した「不完備契約とAIアラインメント」(原題は「Incomplete Contracting and AI Alignment」)という研究は、「ドジっ子ロボット」のような問題を、いちど抽象的なレベルで理論化してみよう、と提案している。

 ミクロ経済学には、人間同士の利害の対立を整理するための知見がたくさんある。とりわけ契約理論と呼ばれる分野では、「ご主人様と代理人という異なる2者のあいだで利害をすり合わせて、望ましい結果を導くための契約方法を考える」という課題が研究されてきた。こういう場合の「主人」のことを英語でプリンシパル、「代理人」をエージェントと言うので、この課題は「プリンシパル・エージェント問題」と呼ばれている。