ChatGPTの未来は誇大広告か、それとも希望か?

録音

作者

バイスプレジデント兼グループディレクター

オープンAIが昨年11月にChatGPTを発表して以来、ChatGPTは大流行している。世界有数の思想家を含め、メディアでも大きな注目を集めている。関係者はあらゆる種類の新しいユースケース(まだ言語、画像、動画指向のユースケースがほとんどですが)を試しており、魅了されると同時に恐怖を感じています。この記事では、ChatGPTとは何か、どのように機能するのか、なぜゲームチェンジャーなのか、そして物理的な製品を製造する伝統的な業界のクライアントにとってどのような意味があるのかについて深く掘り下げます。

ChatGPT 101: その仕組み

ChatGPT(GPT-3とも呼ばれる)は、巨大なニューラルネットワークモデルで、より具体的には、入力層、出力層、および約100の内部層に分割された約1,750億ニューラルネットワークの重みで構成される大規模言語モデル(LLM)です。このモデルは、何十億ものウェブページや書籍のテキストを使って訓練されている。ChatGPTがこれほどもてはやされているのは、このプログラムが会話全体の文脈を念頭に置きながら、人間のような自然な会話ができるからだ。何十億もの事実(事実であろうとなかろうと)を使って訓練されたプログラムは、"太陽系について教えてください"、"マレーシアの政治について簡単に教えてください"、"さまざまな芸術の形式を挙げてください "といった多様な質問に答えることができ、"最も人気のある形式はどれですか?"といった後続の質問にも、文脈を "念頭に置きながら "答えることができる。プログラムからの返答は、人間がどのように返答するかとほとんど区別がつかない。状況によっては、プログラムは辞書にはない新しい単語やフレーズを作り出すことさえある。ChatGPTに新しい単語を作るように頼んだら、"Nuventive - Describing someone or something that is both innovative and intuitive "と出てきた。今のところ、ChatGPTの創造性は主に言語分野に限られている。Dall-Eのような他のプログラムは画像で似たようなことをしている。このすべてが製造業にどのように関係するかを見る前に、古代インド、神経科学、創造性、AIにまたがる旅に皆さんをお連れしたい。

悪魔は細部を無視することにある

なぜChatGPTはこれほどまでに創造的になったのか?その問いに答えるには、人間の創造性の基本を理解する必要がある。そのために、古代インドの "6人の盲人と象 "のたとえ話を使おう。象が何であるかを知らない盲目の男たちが、森の中で偶然象に出会う。彼らはそれぞれ、象の幹、脚、耳、尾、胴体、牙といった異なる部分に触れ、象をそれぞれ蛇、柱、扇、縄、壁、槍であると表現する。そこに創造性の核となる考えがある。

研究によれば、人間の脳の記憶容量には限りがある。125兆個のシナプスがあり、それぞれが約4.7ビットの情報を記憶できるため、平均的な人間の脳は1テラバイト程度のデータしか記憶できない。インターネット上の推定データ量である64ゼタバイトと比較すると、人間の脳が保存できる量より9桁も多い。さらに、書籍、報告書、企業、政府など、他の情報源からのデータも考慮していない。明らかに、人間の脳は世の中にあるすべてのデータを保存し、処理する能力を持っていない。しかし、このアキレス腱は、人間の創造性を支える重要な原動力のひとつでもある。つまり、何百万もの次元のデータを、ニュートンの運動法則やアインシュタインの特殊相対性理論のような少数の重要な概念に集約するのである。ゾウの例に戻ると、人間の脳はゾウの細かい輪郭をすべて記憶するのではなく、ゾウを脚、大きな扇状の耳、長い幹、牙といったいくつかの重要な特徴の集合体に抽象化する。言い換えれば、還元主義を適用することで、我々は自動的に6人の盲人のようになる。

これがChatGPTの秘密だ。伝統的に、ほとんどのAIプログラムは、最終的な結果(この例の場合、これは象を細部まで描写することを意味する)を予測することを最終目標として、膨大な量のデータで訓練されてきた。一方、ChatGPTやGPT-3は、出力レイヤーの直前の内部レイヤーの一つで停止する。これらの内部層は問題の特徴(象の例では、扇状の耳、体幹、牙などの特徴)を捉える傾向があります。情報が少なくなった今、ChatGPTは人間の脳のように外挿し、創造的になることを余儀なくされる1, 2

製造業におけるChatGPTの応用

前述したように、ChatGPTはLLMであり、予想されるように、最初に解き放たれるアプリケーションのいくつかは、マイクロソフトオフィスアプリケーション(Copilot)、社内ナレッジデータベースからの関連情報の検索、レポートの生成など、言語の分野になるでしょう。しかし、我々はChatGPTの他の用途を推定するために還元主義の概念を使用することができます。一般的にChatGPTは、小さなコンポーネントの組み合わせが無限に近い、大規模なシステムレベルの状況に取り組むのに適しています。言語もそうしたシステムレベルの状況の一つです。言語とは、単語、フレーズ、文法、句読点を組み合わせて意味を伝える複雑なコミュニケーションです。このようなシステムレベルの状況は、製造業、エネルギー、化学、公共事業などの伝統的な産業では非常に一般的であり、ChatGPTがこの分野で重要な役割を果たす可能性が高いことを示唆しています。ジェネレーティブAIの創造性が価値を発揮する、製造業におけるこのような大規模なシステムレベルの状況には、以下のようなものがある:

  • ジェネレーティブ・デザインやインフォマティクスによる複雑なシステム型製品の設計。一部はすでに行われているが、それらはまだ部品レベルか単純なシステムに適用されている。ChatGPTタイプのアルゴリズムは、システムレベルでのイノベーション(自動車全体や交通システムの再設計など)を支援することができる。
  • シックス・シグマを応用し、複雑な製造工程におけるボトルネックを解消する革新的な機会を特定する。
  • オペレーショナル・アナリティクスを用いて、複雑な製造オペレーションにおける斬新な効率改善機会を特定する。
  • マクロ経済、競争、供給圧力、消費者行動などの多次元を考慮しながら、戦略的なビジネス上の意思決定を行う。

ジェネレーティブAIの技術はまだいくぶん不安定であるため、これらのアプリケーションのほとんどにおいて人間の監視が必要であることに留意すべきである。 さらに、顧客はジェネレーティブAIのアルゴリズムがパラダイムシフトを起こすようなアイデアをすぐに思いつくとは期待すべきではない。

推薦の言葉

  • ChatGPTをそのまま使えるのは、先に述べた言語タイプのアプリケーションに限られる。それ以外の用途では、クライアントが独自に生成AIプラットフォームを構築し、トレーニングする必要があるだろう。
  • ChatGPTの一般公開されているバージョンは、数十億のウェブページとオンラインブックのテキストを使用して学習されました。製造、エネルギー、化学分野のクライアントは、同様のアルゴリズムを学習するために、これほど多くのデータを見つけることはできないだろう。より小規模で生成的なニューラルネット・アルゴリズムを待ち、これらのアルゴリズムを訓練するために転移学習などの他のテクニックを活用しなければならないだろう。
  • 注目すべきは、ChatGPTは1750億のパラメータを使用し、現在クラウド上での実行に制限されていることだ(GPT-4は100兆のパラメータを持つ)。言い換えれば、アルゴリズムはリアルタイムの洞察を提供する可能性はない。クライアントは、遅延を許容できるアプリケーションを優先すべきである。
  • ChatGPTは唯一無二のアルゴリズムではありません:その強みは創造性です。私たちの日常生活や製造現場におけるタスクのほとんどは平凡なもので、創造性はほとんどない。これが意味するのは、従来のAIアルゴリズムがChatGPTタイプのアルゴリズムと並存する可能性が高いということだ。

こうした課題にもかかわらず、ChatGPTがAIの領域におけるゲームチェンジャーであることは間違いない。クライアントはその動向を注意深く見守る必要がある。

1他にも、前のレイヤーの平均をとり、その平均を次のレイヤーのニューロンに送り込むことで履歴を保持したり、敵対的ネットワークを使うことでChatGPTが創造的であり続け、かつ境界の範囲内にとどまるようにしたりといったトリックがある。しかし、今はその詳細は省略する。

2最近、ノーベル賞受賞者のノーム・チョムスキーがニューヨーク・タイムズ紙で、ChatGPTは人間ほど創造的ではないと主張した。私はこの記事には精神的には同意するが、その理由はここでは述べない。

ご参加ください!

ラックス・フォーラムは、イノベーションの意思決定者が、人間中心のイノベーションを実現するために必要な消費者インサイト、科学、テクノロジーについてより深く学ぶための最高の機会です。

今日は何を研究したい?