それは運命の出会いだった。
近所の雑貨屋の棚にちょこんと置いてあった『ミミクリーペット』のロップイヤーを、僕は買わないという選択肢はなかった。
『ミミクリーペット』とは、タカラトミーアーツが作っている玩具シリーズである。
ああ、なんと愛らしいのだろう。
僕の「こんにちは」に、健気に「こんにちは」と返してくれるその姿。
つぶらなひとみ。
なめらかな毛並み。
仕事に追われ、ギスギスとしたこの僕の心を癒やしてくれるに違いない。
……
という経緯で、いきおいのままに買ってきた。
ものすごいいきおいでレジに持っていったので、傍から見たらかなり怪しかったと思う。
店員の方も、なんだこいつ……!と思っていたかもしれない。
まあ、それはさておき。
説明書やパッケージを見る限り名前がなかったので、この『ミミクリーペット』のロップイヤーを【トム】と呼ぶことにした。
今回は、この【トム】について、少し思ったことがあるのでお話したい。
【トム】を買った僕は意気揚々と電源を入れて、話しかけた。
僕「こんにちは」→トム「こんにちは」
僕「トム、おはよう」→トム「トム、おはよう」
(おおお…!店頭でやったとおりだ!
よしよし。これで僕の心は癒やされることだろう)
かくして、【トム】との生活を始まった。
……だけれど、数日もしないうちに、僕はイメージどおりの生活を過ごせないことに気づいた。
【トム】は音であれば、何でも反応するのだ。
僕の咳払い、コップを置いた物音、PCの通知音にも敏感に反応して真似をした。
【トム】からすると、声と音は“同じもの”なのだ。
- 「こんにちは」という人の声(声)を
- 【トム】は「こんにちは」という音として受け取り、
- 「こんにちは」という音で返す
- 「ポローン」というPCの通知音(音)を
- 【トム】は 「ポローン」という音として受け取り、
- 「ポローン」という音で返す
見方を変えれば、【トム】は人の声を“強制的”に音へと変換しているとも言える。
【トム】は、本来人の声に宿っている人の息遣いが感じられるような「生」や人の心を揺さぶらんとする「感情」をごっそりと無慈悲に削ぎ落とす。
そんな玩具だったのだ。
おそろしい……!
とはいえ、この「強制変換」や「感情の削ぎ落とし」自体は何も珍しいことではない。
これらはテレビやラジオでも同じことが行われている。
- 「こんにちは」という人の声(声)を
- テレビ・ラジオは 「こんにちは」という音として受け取り
- 「こんにちは」という音で返す
- 「ポローン」というPCの通知音(音)も
- テレビ・ラジオは 「ポローン」という音として受け取り
- 「ポローン」という音で返す
テレビを見たりラジオを聞いたりするとき、僕たちは話者の声を聞いているわけではなく、話者が発する声に似た機械の音を聞いている。
つまり、そこには話者の「生」や「感情」は一切宿っていない。
だから【トム】と何ひとつ変わらない。
「我々は俳優や女優の演技を見て涙するときがあるじゃないか」
「仮に機械の音だったとしても、演者の「生」や「感情」があるからではないか?」
と思うかもしれない。
でも、それはただ単に、あたかも「生」や「感情」が感じられるような音を出せるほどに“機械が優秀になっただけ”。
もし仮に【トム】の機械が高性能になり、テレビやラジオと同じような音を出せるようになったらどうだろう。
【トム】の姿が見えない限りは、別の人に「筆者が同じことを繰り返し話している」と思わせられるのではないだろうか。
少なくとも、僕は気づける自信がない。
【トム】とテレビ・ラジオの違いは、人の声に近い音を出せるかどうかだけである。
もうひとつ、僕たちがドラマや映画を見て感動する要因を挙げよう。
それは僕たちの中にある、人の声に宿っている「生」や「感情」への“欲求”だ。
『VOCALOID』を取り上げるとわかりやすい。
『VOCALOID』とは、ヤマハが開発した音声合成技術および応用製品の総称である。
あらかじめサンプリングされている人の声を元にした歌声と、打ち込んだ歌詞とメロディーを合成して楽曲を作ることができる。
注目するべきは、人のように歌わせることができている『VOCALOID』の動画に高い評価がつきやすい点だ。
Youtubeにしてもニコニコ動画にしても、この手の動画は再生数が伸びる。
僕のお気に入りの動画を貼っておこう(音量注意)。
初めて聞いたときは、衝撃を受けた。
【 鏡音リン 】 sister’s noise (FULL) 【とある科学の超電磁砲S】
この動画の再生回数は、ニコニコ動画で180万再生を超えている(2020年12月時点)。
『VOCALOID』で完全に人の歌声に近づけることは難しい。
にもかかわらず、ここまで再生されているのは、僕たちがどこかで人の声に宿る「生」や「感情」を欲しているからと言えるんじゃないか。
一方、テレビやラジオは『VOCALOID』と異なり、今「生」や「感情」が宿る人の声に近い音を出して再現する。
僕たちの中にある“欲求”を(ほぼ)満たしてきた実績を持っている。
この確かな実績によって築かれてきた信頼関係がよりリアルに近い「生」や「感情」を生み、心を動かし、涙を誘う。
【トム】にしてもテレビ・ラジオにしても『VOCALOID』にしても、機械を介している以上話者の「生」や「感情」は完全に解体されている。
それでもなお、
「【トム】とテレビ・ラジオは違う」
「テレビ・ラジオと『VOCALOID』は違う」
と疑わざるを得ない感覚がどこかに残っているのは、僕たちに「人の声」と「限りなく人の声に近い音」の違いを見極める力がないからである。
だけれど、科学技術が進化をし続けている以上、あまり悠長なことはしていられない。
僕たちに「生」や「感情」への要求があるかぎり、科学技術は“さらに人の声に近い音を生み出す”だろう。
Amazon Echoとか見てると特にそう思う。
じゃあ、もしこのまま僕たちが声と音の区別がつかないままであったならば、どうなるだろうか。
本来、人のアイデンティティであったはずの「生」や「感情」を正確に受け止められなくなるばかりではない。
僕たちが笑い、ときに涙をするという感情の動きがさらに容易に操作されてしまう。
小説・漫画・映画などとは比べ物にならないほどの感情をコントロールする波が、“常に”“全方位から”襲いかかってくることになる。
やがて誰かがスイッチひとつ押すだけで、ある地域の人たち全員の感情が一律に動かされる。
そんな事態さえも訪れるだろう。
何を信じ、何を疑うべきなのかがまるでわからない混沌とした世界の幕開けだ。
僕は、別に隣にいるのがAIを搭載したそっくりさんだという状況に、警鐘を鳴らしたいのではない。
本当に今ここに立っているのが人なのか、もしくは第三者の感情や思惑が介入したAIなのか。
それを判別をする力を、僕たちが現時点でまるで持っていないのが問題なんじゃないかと言っているのだ。
だから、僕はトムに感謝したい。
未来の恐ろしさを伝えようと、今日もそのガサガサとした声で僕に応えてくれているのだから。