Game of Thrones の結末に不満を感じたことはありませんか? それなら自分たちのやり方で作り直してみましょう。
私は、数十年前に読んでいた「自分で選ぶ冒険」形式の本——自分が主人公になる物語——にインスパイアされ、超シンプルなビデオゲームを作る実験をしてみました。ここでの大きな違いは、各ステップですべてが動的に生成される点です:
- ストーリー
- 選択肢
- ナレーション(ボイスオーバー)
- イラスト
- そして音楽(後述する理由で削除しました)
YouTube や LinkedIn などで、複雑なソフトウェアをとても簡単に作れると主張する動画をいくつも見かけました。ビデオゲームは、まさに芸術とエンジニアリングが融合した最高の例であり(しかも市場は厳しい競争状態で、毎日のように数千もの新作ゲームがリリースされています)、この現象の一端を担っているのは間違いありません。
今回私が示したかったのは、いまや終わりのないストーリーを作り出せるということです。
もしシンプルなゲームをこんなにも簡単に作れるなら、本当の価値はどこにあるのか? 私にとって重要なのは、イーロン・マスクが言った「学習はビデオゲームにできるだけ近い形であるべきだ」という考えです。AI の能力と優れた頭脳を組み合わせれば、多くのことをゲームのように教えられる可能性があるのです。
もちろん、実際の学習には行動や練習が欠かせませんし、ボタンを(ときには適当に)クリックするだけでは教育的価値は限られます。いかに「ゲーム感覚」を維持しながら画面の外へ「実践する力」を拡張するかが課題になるでしょう。
実験に戻ると、興味深いことを学びました。私は OpenAI のツールだけを使いました。ある「オーケストレーター」が状況を設定し、それぞれのアセット(素材)を生成するために別々の呼び出しを行います。ところが、一つだけ完全に失敗したコンポーネントがありました。それが音楽生成です。ChatGPT / OpenAI の API を使えば、少なくとも有名な曲を MIDI ファイル(操作が簡単で何十年も標準的に使われてきたフォーマット)に書き起こすくらいできると思っていたのですが、結果は散々。簡単なメロディすら正しく再現されず、オリジナル曲の生成はあきらめました。
もう一つの問題は、一貫性のあるキャラクターを作ることが非常に難しい点です。ネットで見つかったヒントはどれも複雑すぎるか古くなっていて、これも断念しました。さらに、全体をまとめるにはエンジニアリングの知識がある程度必要です。各シーンの切り替えは、その都度動的に生成しているため非常に遅いのです。「あらかじめ生成」しておくバッファを追加する方法もありますが、実装コストが増え、API の費用もかさみます。
では、次に何をするのでしょう? ビデオゲームは、どんなソフトウェアでもそうであるように、完成というものがなく常に改良の余地があります。最終的な方向性は、使う人の目的に大きく左右されるでしょう。GenAI の力を存分に借りられるとはいえ、全要素を生成させるアプローチが本当に意味を持つかは、コストなどとの兼ね合いで考えなければなりません。
これは、ChatBots や Retrieval-Augmented Generation(RAG)などと同様に、コンテンツとのやりとり全体におけるパラダイムシフトの一例です。人々は、文章を最初から最後まで読むよりも、必要な部分だけを直接問い合わせるようになるでしょう。これによって物語の語り方が劇的に変わるだけでなく、コンテンツ消費や学習の形態もまったく新しいものへと変革される可能性があります。肝心なのは、AI による生成と人間が精査する部分とのバランスを取り、品質を担保しつつコストが膨れ上がらないようにすることです。
皆さんは、この実験が今後どのように発展していくと思いますか? ゲーミング要素を洗練させていくのか、教育への応用を模索するのか、それともコラボレーション型のストーリーテリング・プラットフォームに進化させるのか?