OpenAI共同創業者の最新インタビュー：Sora終了後のChatGPTの次なる展開とは？

By: blockbeats|2026/04/02 18:00:23

動画タイトル：OpenAI社長 Greg Brockman：AI戦略、AGI、そしてスーパーアプリ
動画作成者：Alex Kantrowitz
翻訳：Peggy, BlockBeats

編集者注：本記事は、Big Technology PodcastにおけるOpenAI社長兼共同創業者Greg Brockman氏との対談を翻訳したものです。同番組は長年、AI、テクノロジー業界、ビジネス構造の変化に焦点を当てており、シリコンバレーの最前線を観察する重要な窓口となっています。

今回の対談で、Brockman氏はモデル自体の能力にとどまらず、さらに踏み込んだ議論を展開しました。AIの能力が広く実証された今、業界はどのような道を選び、製品形態を再構築し、それがもたらすシステム的な影響をどのように吸収していくのか。対談は、OpenAIの製品戦略、今後登場する「スーパーアプリ」、そしてAIが「離陸段階」に入ったという同社の判断を中心に展開されます。

この対談は、3つの側面から理解することができます。

第一に、経路の収束。
動画生成から推論モデルへ、多角的な進歩から能動的な選択へ。OpenAIの選択は、単なる技術的な優劣の判断ではなく、計算資源が核心的なボトルネックとなるという現実的な制約への対応です。限られたリソースの中で、技術ロードマップは「パーソナルアシスタント」と「複雑な問題解決」という、レバレッジの効く2つの方向に収束し始めています。これは、AIの競争論理が「何ができるか」から「何を優先すべきか」へとシフトしていることを意味します。

第二に、形態の再構築。
「スーパーアプリ」の提案は、本質的に製品形態の飛躍です。AIはもはや断片的なツールの集合体ではなく、文脈を理解し、ツールを呼び出し、タスクを実行し、異なるシナリオで記憶を蓄積し続ける統合的な入り口となります。ChatGPTからCodexに至るまで、AIは徐々にワークフロー全体を担うようになり、人間の役割も「実行者」から「スケジューラー（目標設定、タスク割り当て、監督）」へと変化しています。

第三に、リズムの転換。
過去2年間が能力を積み上げる段階だったとすれば、今は「離陸」の段階です。一方では、モデルの能力が「仕事の約20％を支援」から「タスクの約80％を処理」へと向上し、ワークフローの再構築を直接的に引き起こしています。他方では、AIが自らの進化（AIによるAIの最適化）に関与し、チップ、アプリケーション、企業側の連携を重ね合わせ、加速し続ける閉ループを形成しています。AIはもはや単一の技術ではなく、経済成長を牽引する重要なエンジンになりつつあります。

しかし同時に、世間の不信感、雇用の不確実性、データセンターを巡る論争、セキュリティとガバナンスの境界線といった一連の問題も浮上しています。これに対し、Brockman氏の回答は技術内部に閉じたものではありません。彼は2点を強調します。第一に、リスクは「中央集権的な管理」では解決できず、電力システムのようなAIを取り巻く社会インフラの構築が必要であること。第二に、個人の能力が変革期にあること。重要な問いは「ツールを使えるか」ではなく、「AIを使って目標を達成できるか」であるということです。

かつての問いが「AIに何ができるか」だったとすれば、現在の問いは、AIがほとんどの作業を代行するようになったとき、人間は何をすべきかという点にシフトしています。

以下は原文（読みやすさのために一部編集）です。

要約（TL;DR）

AGIは「明確な道筋」の段階へ： Greg Brockman氏（OpenAI共同創業者）は、GPTの推論モデルに基づき、数年以内にAGIに到達する明確な道筋が見えているが、その形態は依然として「凹凸（jagged）」なものになると考えています。

注：AGI（人工汎用知能）とは、ほとんどの認知タスクにおいて人間と同等以上の能力を持つAIシステムを指します。現在の「特化型AI」（画像認識や推奨アルゴリズムなど）とは対照的に、AGIはタスク横断的な汎用性と転移可能性を重視します。

戦略的収束：多角的な探索から2つの核心的アプリケーションへ： 計算資源の制約下で、OpenAIはすべての方向（動画生成など）を同時に進めるのではなく、「パーソナルアシスタント」と「複雑な問題解決」にリソースを集中させています。

「スーパーアプリ」がAIの入り口に： チャット、プログラミング、ブラウジング、ナレッジワークが統合システムに組み込まれ、AIはツールから「実行レイヤー」へと移行し、ユーザーは「ディスパッチャー（司令官）」となります。

決定的なシフト：AIは支援からワークフローの代行へ： モデルの能力が「タスクの20％完了」から「80％処理」へと急上昇し、個人や企業は仕事のやり方の再構築を迫られています。

計算資源が核心的なボトルネックと競争の焦点に： AIの需要は供給をはるかに上回っており、将来の制約はモデルの能力ではなく計算資源にあり、データセンターとインフラが重要な変数となっています。

AIの「離陸」が進行中： 自己加速する技術（AIによるAIの最適化）と業界の相乗効果（チップ、アプリケーション、企業）が、AIをツールから経済成長のエンジンへと押し上げています。

最大のリスクは技術ではなくガバナンスと利用にあり： セキュリティ問題は単一の組織では解決できず、オープンなエコシステムと社会インフラが共同で責任を負う必要があります。

個人の核心的能力が変革中： 将来の競争力は「実行」ではなく「目標設定＋AIシステムの管理」にあり、AIを能動的に活用することが基礎スキルとなります。

インタビュー概要：

Alex（ホスト）：
本日はOpenAI共同創業者兼社長のGreg Brockman氏をお迎えし、AIにおける最も有望な機会、OpenAIがこれらの機会をどのように捉えるか、そして「スーパーアプリ」という概念について議論します。Gregは本日、私たちのレコーディングスタジオに来てくれています。

Greg Brockman（OpenAI共同創業者兼社長）：
お会いできて光栄です。呼んでいただきありがとうございます。

なぜSoraを終了したのか？計算資源の不足

Alex：
現在、OpenAIは動画生成の進歩を一時停止し、ビジネスやプログラミングのシナリオを統合する「スーパーアプリ」にリソースを集中させています。外部（私を含む）からは、OpenAIは消費者向けで既にリードを奪っていたにもかかわらず、リソースを再配分しているように見えます。何が起きているのでしょうか？

注：2026年3月、OpenAIは動画生成製品Sora（アプリおよびAPIを含む）の終了を発表し、関連する商業活動を停止しました。

Greg Brockman：
この間、私たちはこのディープラーニング技術を開発し、私たちが常に思い描いてきたポジティブな影響を本当にもたらすことができるか、つまり、人々を真に助け、生活を向上させるアプリケーションを構築できるかを検証してきました。

同時に、私たちは別の道も追求してきました。それは技術の展開です。一方でビジネス運営をサポートし、他方で早期に現実世界の経験を蓄積し、技術が真に成熟した瞬間に備えるためです。

そして今、私たちは新しい段階に達しました。この技術が確かに実行可能であることを確認しました。「ベンチマーク」や抽象的な能力のデモンストレーションから新しいフェーズへ移行しています。私たちはそれを現実世界に投入し、実際の業務に従事させ、ユーザーのフィードバックを通じて進化し続ける必要があります。

ですから、私はこの変化を、技術的なフェーズの変化によって推進される戦略的なシフトとして理解しています。

これは、私たちが「消費者向け」から「企業向け」にシフトしているという意味ではありません。より正確には、リソースが限られた状況で、どのアプリケーションを最も優先すべきかという問いを立てているのです。すべてを行うことはできないからです。

どのアプリケーションが真に実装可能で、相互に連携し、現実世界に影響をもたらせるか？すべての方向性を並べると、消費者向けには多くのタイプがあります。例えば、パーソナルアシスタント、あなたを真に理解し、目標に沿って人生の目標達成を助けるシステム、あるいは創造やエンターテインメントなどです。企業向けには、より高いレベルから見れば、一つのことに抽象化できます。複雑なタスクがあるとき、AIはそれを完了する手助けができるか、ということです。

私たちにとって、現在の優先順位は非常に明確で、最前線にあるのは2つだけです。第一にパーソナルアシスタント、第二に複雑な問題を解決する手助けをするAIです。

問題は、現在の計算資源では、これら2つさえ完全にサポートできないということです。アプリケーションのシナリオを増やせば、すべてをカバーすることは不可能です。ですから、これは現実的な確認なのです。技術は急速に成熟しており、影響は爆発しようとしています。私たちは選択し、それを真に実現するために最も重要な方向を選ばなければなりません。

Alex：
以前、OpenAIはディズニーに少し似ているという比喩を挙げられましたね。核となる能力があり、それを異なるシナリオに展開できる。ディズニーにはミッキーマウスがいて、映画、テーマパーク、Disney+に使えます。OpenAIの「核」はモデルであり、動画生成、アシスタント、企業向けアプリケーションに使えます。

しかし今、あなたは「包括的な拡大」の道ではなく、選択を迫られているように見えます。そうですよね？

Greg Brockman：
実際、その比喩は今の方がより当てはまると思います。しかし重要なポイントは、技術的にSora（動画モデル）とGPT（推論モデル）は、実際には2つの異なる技術的分岐に属しているということです。構築方法が全く異なります。

問題は、現在の段階でこれら両方の技術的分岐を同時に進めることは、特にリソースが限られている中で非常に困難だということです。ですから、私たちが下した選択は、現段階でGPTの道に主要なリソースを集中させることです。

もちろん、これは他の方向性を諦めるという意味ではありません。例えば、ロボティクスの分野では、依然として関連研究を続けています。しかし、ロボティクス自体はまだ初期段階にあり、真に爆発的な成熟段階には入っていません。

その一方で、来年にはAIがナレッジワークの領域で真に離陸するのを目にすることになるでしょう。

そして強調すべきは、GPTの道は単なる「テキスト」ではないということです。例えば、双方向の音声対話（音声対音声）もこの技術的経路の一部であり、AIをよりアクセスしやすく実用的なものにしています。これらの能力は本質的に同じモデルフレームワーク内にあり、異なる方法で調整されています。

しかし、全く異なる2つの技術的分岐を進めれば、限られた計算資源の下で長期的に維持することは困難です。需要が高すぎるため、計算資源は限られています。モデルをリリースするたびに、人々はそれを使ってより多くのことをしたいと望むからです。

Alex：
では、なぜ「ワールドモデル」の道に集中しなかったのですか？例えば、物体の関係を理解する必要がある動画モデルは、ロボティクスにとっても重要です。さらに、Soraの進歩は非常に急速でした。なぜ最終的にGPTに賭けることを選んだのですか？

注：「ワールドモデル」は知覚と物理的直感に焦点を当てており、AIが「データの表面的なパターン」を学習するだけでなく、「世界がどのように機能するか」を理解できるようにすることを核心的なアイデアとしています。このようなモデルはSoraのようなシステムを説明するためによく使われます。画像や動画を生成するだけでなく、物体（人間、車、光など）間の関係、時間的な連続変化（フレーム間の進化）、基本的な物理法則（運動、遮蔽、衝突など）をモデル化します。対照的に、GPTは言語と推論のモデルに属し、抽象的な認知とタスク実行能力により焦点を当てています。

Greg Brockman：
この分野の最大の問題は、実際には機会が多すぎることです。

私たちはOpenAIの初期に、アイデアが数学的に健全である限り、通常は機能し、良い結果を出せることを発見しました。これはディープラーニングの根底にある力を示しており、データから生成ルールを抽象化し、新しいシナリオに転移させることができます。これはワールドモデル、科学的発見、プログラミングなど、さまざまな分野に応用できます。

しかし重要なのは、選択する必要があるということです。

テキストモデルがどこまで行けるかについては、常に議論がありました。世界を真に理解できるのか？私は今、その問いに対する答えが出たと思います。テキストモデルはAGIに到達できます。

私たちは明確な道筋を見ており、今年はさらに強力なモデルが登場するでしょう。OpenAIの内部では、最大の悩みの種の一つは計算資源をどう割り当てるかであり、この問題は改善するどころか悪化する一方です。ですから根本的には、「どちらの道がより重要か」ではなく、タイミングと順序の問題なのです。

今、かつては遠いと思っていたアプリケーションが手の届く範囲になり始めています。例えば、未解決の物理学の問題を解くことです。最近、ある物理学者が長い間研究していた問題をモデルに渡したところ、12時間後に解決策が得られたという事例がありました。彼は、モデルが「考えている」と感じたのは初めてだと言いました。この問題は、人間には決して解けないものかもしれませんが、AIは解いたのです。

このようなものを見ると、選択肢は倍増、三倍増させることしかありません。なぜなら、私たちが真に巨大な可能性を解き放てることを意味するからです。

ですから私にとって、これは異なる方向性の間の競争ではなく、OpenAIの使命は何かという問題です。どうすればAGIを世界にもたらせるか？どうすればすべての人にとって真に有益なものにできるか？そして私たちはその道筋を見ており、どう進めればよいかを知っています。

--価格

ワールドモデルではなくGPTに賭ける：AGIへの道

Alex：
ええ、先ほどおっしゃった次世代モデルの話に戻りたいのですが、まずはこの質問をフォローアップさせてください。

今年初め、Google DeepMindのDemis Hassabis氏と話をしました。興味深いことに、彼にとってAGIに最も近いものは、Nano Bananaという画像生成AIだったそうです。

注：Demis Hassabis氏は、AIを研究から画期的なアプリケーションへと推進する主要人物の一人です。彼はDeepMindを共同設立し、AlphaGoを開発しました。2016年に世界チャンピオンを破ったことは、AI開発の歴史における画期的な出来事でした。

彼の論理はこうです。画像生成AIであれ動画生成AIであれ、そのような画像や動画を生成するには、根本的に物体の相互作用を理解しなければならず、少なくとも世界がどのように機能するかについてある程度の理解が必要である、と。

では、これは潜在的なリスクを暗示しているのでしょうか？これは大きな賭けであり、もしそうなら、OpenAIは別の技術的分岐に倍賭けし続け、機会を逃すことになるのでしょうか？

Greg Brockman：
もし本当にそうなら？ 2つの答えがあります。

第一に、もちろんその可能性はあります。この分野とはそういうものです。最終的には選択しなければならず、賭けなければなりません。そしてOpenAIは最初からそうしてきました。私たちはAGIへの道を評価し、信じ、その道に沿って非常に集中して突き進まなければなりません。ランダムなベクトルを足し合わせると結果は最終的にゼロに近くなるかもしれませんが、すべてのベクトルを揃えれば、明確に一つの方向に進むことができます。

しかし、第二の点は、画像生成は実際にはChatGPTにおいても非常に人気のある能力であり、私たちは依然としてこの分野の進歩に継続的に投資し、優先順位を置いています。私たちがそうできる理由は、それが実際には「ワールドモデル」や「拡散モデル」の技術的分岐に属しているわけではなく、実際にはGPTアーキテクチャの上に構築されているからです。ですから、異なるデータ分布に直面しているとはいえ、より根本的なコア技術レベルでは、依然として同じものなのです。

そしてこれこそが、AGIの最も素晴らしい点の一つです。時として、音声対音声、画像生成、テキスト処理、そして科学研究、プログラミング、個人の健康情報など、さまざまなシナリオでのテキスト自体の応用といった、全く異なるように見えるアプリケーションが、実際にはすべて同じ技術的フレームワーク内に収まることができるのです。

ですから、技術的な観点から、私と会社が常に考えてきたことの一つは、いかにして私たちの努力を可能な限り統一するかということです。なぜなら、私たちはこの技術が全体的な改善をもたらし、経済システム全体を向上させる可能性さえあると真に信じているからです。

そしてこのものの規模はあまりに広大です。私たちは確かにすべてを行うことはできませんが、私たちの役割を完了することはできます。

Alex：
これこそが、人工汎用知能（AGI）の「汎用（General）」が意味することですね。

Greg Brockman：
その通りです。それが「G」であり、それが本当に意味することです。

Alex：
「統一」についてですが、このスーパーアプリは最終的にどのようなものになるのでしょうか？

Greg Brockman：
私が見るスーパーアプリは――

Alex：
チャット、プログラミング、ブラウジング、ChatGPTのようなものをすべて統合するのですよね？

Greg Brockman：
はい。私たちが作りたいのは、AGIの力、つまりその「汎用性」を真に体験できる、エンドユーザー向けのアプリケーションです。

今日のチャット製品を考えると、それらは徐々にあなたのパーソナルアシスタント、パーソナルAPI、真にあなたを考慮するAIへと進化すると思います。それはあなたについて多くのことを知り、あなたの目標に沿い、信頼でき、ある程度このデジタル世界であなたを「代理」することができます。

Codexについては、こう考えてください。現在は主にソフトウェアエンジニア向けに構築されたツールですが、「みんなのためのCodex」へと進化しています。

何かを作りたい、構築したい人は誰でもCodexを使って、コンピュータにやりたいことをさせることができます。もはや単に「ソフトウェアを書く」ことではなく、「コンピュータを使う」ことそのものです。例えば、ラップトップの設定を調整するのを手伝ってもらいます。時々ホットコーナーの設定方法を忘れるので、Codexにやらせると、実際にやってくれます。

これこそがコンピュータのあるべき自然な姿です。コンピュータが人に適応すべきであり、私がコンピュータに適応させられるべきではありません。

ですから、このようなアプリを想像してみてください。コンピュータにさせたいことは何でも直接伝えることができます。「コンピュータを使う」能力と「ウェブをブラウズする」能力が含まれ、AIが真にウェブページを操作できるようになり、AIが何をしているかを監督することもできます。さらに、対話がチャットであれ、コーディングであれ、一般的なナレッジワークであれ、これらすべての会話が一つのシステムに統一されます。AIは記憶を持ち、あなたを理解します。

これこそが私たちが構築しているものです。

しかし正直に言って、これは氷山の一角、水面の上に見えている部分に過ぎません。私にとって、真に重要なのは基盤技術の統一です。

基盤モデルレベルでの統一については触れましたが、過去数年で本当に変わったのはこれです。もはや「モデル」自体だけの問題ではなく、より重要なのは「展開システム」です。言い換えれば、モデルはどうやって文脈を得るのか？どうやって現実世界とつながるのか？どんなアクションを取れるのか？新しい文脈が絶えず現れる中で、ユーザーとのフィードバックループはどう機能するのか？

内部的には、以前はこれらに対して複数の実装、あるいは少なくとも少し異なる実装がいくつかありました。今、私たちはそれらを一つに統合しています。最終的には、統一されたAIレイヤーを持ち、非常に軽量な方法で、異なる特定のユースケースにそれを向けることになります。

もちろん、金融や法律のために、小さなプラグインや小さなインターフェースを作成することはできますが、ほとんどの場合、このスーパーアプリ自体が十分に広範で汎用的であるため、それさえ必要ないかもしれません。

Alex：
このアプリは企業向けと個人向けの両方のユースケースを対象としていますか？

Greg Brockman：
はい、それが実際、核心です。ラップトップのようなコンピュータと同じで、個人用ですか、それとも仕事用ですか？答えは両方です。それは主にあなたのデバイスであり、デジタル世界へのインターフェースです。そしてそれこそが、私たちが達成したいことなのです。

Alex：
では、ビジネス以外の観点から、もし私がこのスーパーアプリを私生活で使うなら、何に使いますか？私の生活はどう変わりますか？

Greg Brockman：
私の理解ではこうです。私生活では、現在のChatGPTの使い方を拡張することから始まります。

現在、どのようにChatGPTを使っていますか？人々はすでにそれを使って、多種多様な素晴らしいタスクを達成しています。時には「結婚式のスピーチの草稿を手伝ってほしい」とか、「このアイデアを見てフィードバックをくれないか？」といった単純なものです。あるいは、「小さなビジネスを運営しているんだけど、いくつかアイデアをくれないか？」といったことさえあります。

これらのシナリオの中にはより個人的なものもあれば、個人と仕事の境界が曖昧になり始めているものもあります。そして私の見解では、これらすべての種類のクエリは、スーパーアプリが処理できるものであるべきです。

Greg Brockman：
しかし、ChatGPTの進化を振り返ると、それ自体が進化しています。

以前はステートレスでしたよね？誰にとっても同じAIで、毎回ゼロから始まり、まるで知らない人と話しているようでした。しかし、過去の対話を記憶できれば、はるかに強力になります。より多くの文脈を利用できれば、それもはるかに強力になります。

例えば、メールやカレンダーと連携させ、あなたの好みを真に理解し、過去の経験に関するより深い背景情報セットを持ち、それを使って目標達成を助ける。例えば、ChatGPTにはすでにPulseという機能があり、あなたへの理解に基づいて毎日コンテンツを配信しています。

ですから、個人の利用レベルでは、スーパーアプリはこれらすべてを包含し、より深く、より豊かに行うことになります。

Alex：
いつローンチする予定ですか？

Greg Brockman：
より正確な考え方は、今後数ヶ月かけて、徐々にこの方向に進んでいくということです。私たちが話している完全なビジョンは、一度にすべてではなく、段階的に提供されます。

例えば、今日のCodexアプリには実際、2つのレイヤーが含まれています。一つはツールを使える汎用エージェントハーネス、もう一つはコードを書くのが得意なエージェントです。

そしてこの汎用ハーネスは、実際には他の多くのシナリオにも使えます。スプレッドシートに接続し、Wordドキュメントに接続すれば、ナレッジワークを手伝うことができます。

ですから私たちの最初のステップは、Codexアプリを一般的なナレッジワークにとってより使いやすくすることです。なぜなら、OpenAI内ですでに人々が自発的にこのような使い方を始めているのを見ているからです。

これが最初のステップであり、今後さらに多くのステップが続くでしょう。

Alex：
昨日、あなたの同僚の一人とCodexについて話していたとき、誰かが動画編集にCodexを使っていると言っていました。Codexに動画処理を手伝わせ、CodexがAdobe Premiereのプラグインまで作成して動画をセグメント化し、編集を始めたそうです。これがあなたが目指している方向ですか？

Greg Brockman：
そのようなユースケースを聞くのは特に大好きです。これこそ、私たちがこのシステムを使ってほしいと願っている方法です。本当に興味深いのは、Codexアプリはもともとソフトウェアエンジニア向けに設計されていたため、現在のユーザビリティはプログラマー以外にとっては実際にはあまり高くないということです。セットアッププロセス中に、多くの小さな問題が発生する可能性があるからです。

開発者はそれが何を意味し、どう修正するかを即座に理解できます。私たちはすでに慣れています。しかし、開発者でなければ、これらを見たとき、「これは何？今まで見たことがない」と思うかもしれません。

しかし、それでも、これまでコードを書いたことがない多くの人々が、それを使ってウェブサイトを構築したり、先ほど言ったようなこと、つまり異なるソフトウェア間の相互作用を自動化し、そこから大きなレバレッジを得たりし始めています。例えば、私たちのコミュニケーションチームの誰かが、それをSlackやメールと統合して大量のフィードバックを処理させ、非常に優れた要約と分析を生み出しています。

ですから現在の状況は、非常に意欲的な人々はすでにこれらの障壁を乗り越え、そこから高い報酬を得ることを望んでいるということです。

ある意味で、最も難しい部分はすでに完了しています。私たちは真にスマートで有能なAIを作成し、実際にタスクを完了できるようにしました。

次に私たちがすべきことは、比較的「簡単な」部分です。それを一般の人々にとって真に有用なものにし、これらの参入障壁を徐々に打ち破ることです。

Alex：
競争環境を見ると、AnthropicもClaudeアプリを持っており、チャットボットとClaude Codeの両方が含まれています。ある程度、彼らはすでに独自の「スーパーアプリ」のプロトタイプを持っています。

なぜAnthropicがこの動きを早く行ったのか、どう見ていますか？そしてOpenAIが追いつく可能性はどれくらいあると思いますか？

Greg Brockman：
時計の針を12〜18ヶ月戻すと、私たちは実際、常に「プログラミング」を重要な領域として重視し、さまざまなプログラミングコンテストやその他の非常に「純粋なスキル」テストで一貫して優れていました。しかし、当時私たちが十分に投資していなかったことの一つは、ユーザビリティのラストワンマイルです。

つまり、私たちはこの問題に十分な注意を払っていませんでした。AIはすでに非常にスマートで、さまざまな難しいプログラミング問題を解決できますが、現実世界のコードベースを見たことがありませんでした。そして現実世界のコードベースは多くの場合、乱雑で、それが慣れ親しんでいる「クリーンな」環境とはかけ離れています。

その時点で、私たちは確かに遅れをとっていました。しかし、昨年の半ば頃から、私たちはこれを非常に真剣に受け止め始めました。私たちはこれらのすべてのギャップ、現実世界の乱雑さ、そして私たちが真に遭遇したことのない複雑さを調査するために、専門のチームを結成しました。

例えば、トレーニングデータをどう構築するか？トレーニング環境をどう設定するか？ AIが「ソフトウェアエンジニアリングを行う」とは実際どのような感じか――中断されること、奇妙な問題に遭遇すること、さまざまな理想的ではない状況などです。

今では、追いついたと思います。ユーザーが実際に競合他社と並べて比較すると、多くの人は私たちを選ぶ傾向があります。

もちろん、フロントエンドの経験にギャップがあることも知っており、この部分に対処するつもりです。しかし全体として、これがこの期間中の私たちの焦点でした。モデルを構築して製品の殻を被せるだけでなく、最初から完全な製品として考えることです。研究を行う間、私たちは考えています。最終的にどう使われるのか？これは、この期間中にOpenAIの内部で起こっているシフトです。

ですから、私の見解では、次は非常に強力なモデルアップグレードの波が来るでしょう。今年のロードマップを見るだけで、非常に興奮しています。達成できることは本当にたくさんあります。

同時に、私たちはユーザビリティのラストワンマイルを埋めることにも非常に集中しています。

Alex：
2022年以来、OpenAIはこの分野で議論の余地のないリーダーでした。明らかに、今の競争はもはやテストスコアだけの問題ではありません。あなた自身が「追いついた」というフレーズを使いましたね。

会社の内部の雰囲気も変わりましたか？言い換えれば、ChatGPTのような製品で過去のように遠く先を行っているという感覚ではなく、実際に本当の競争に入っているという感覚ですか。

一部の外部レポートは、実際にこの変化を示しています――内部会議でOpenAIにはもはや「サイドタスク」はなく、全員がこの核心的な方向に集中すべきだと強調されているなど。では、現在、内部環境と雰囲気にはどのような変化が起こっていますか？

Greg Brockman：
私個人の意見としては、OpenAIで最も不安だった瞬間は、実際にはChatGPTをリリースした後でした。

会社のホリデーパーティーにいたことを覚えていますが、空気中に「私たちは成し遂げた」という感覚がありました。それまでそんなことは感じたことがありませんでした。当時の私の反応はこうでした。いいえ、私たちは成し遂げた人々ではなく、アンダードッグ（負け犬）だ。

そして私たちは常にそうでした。この空間の競合他社は、ほとんどが資金、人材、データが豊富で、ほぼすべてのリソースがより豊富な、定着した大企業です。

では、なぜOpenAIは競争できるのでしょうか？ある程度、答えは私たちが決して快適さを感じなかったからです。私たちは常に自分たちをチャレンジャーと見なしていました。

実際、私にとって、市場が本当にこの競争的なダイナミクスを取り始め、他の競合他社が現れてうまくやっているのを見ることは、非常に健全なことでした。

なぜなら、私の見解では、競合他社がどこにいるかに固執することは決してできないからです。もし彼らが今どこにいるかを見ているだけなら、あなたがそこに到達する頃には、彼らはすでに先に進んでいます。

そして最近は、実際にはその逆だと感じています。多くの人々が私たちがどこにいるかに集中しており、私たちは先に進み続けることができています。これは内部にアライメントと統一感を与えてくれました。

先ほど、以前は「研究」と「展開」を2つの別々のものとして扱っていたと言いましたが、今、私たちはそれらを本当に統合したいと考えています。私にとって、これは素晴らしいことです。

ですから、私たちが今いる段階は、「確実に勝っている」とか、突然危機に瀕しているというフェーズではありません。ご存知のように、外部からの認識は、彼らが言うほど良くも悪くもありません。

全体として、実際にはかなり安定していると感じています。そしてコアモデル開発に関しては、私たちのロードマップと私たちが投入した研究作業に非常に自信を持っています。製品側に関しては、今、本当に良いエネルギーがあり、全員が団結してこれらのものを世界に届けていると感じています。

Alex：
先ほど、非常に強力な新しいモデルが登場すると何度も言及しましたね。では、それらは具体的に何ですか？

The Informationは、あなたが「Spud」の事前学習を完了したと報じました。また、Sam AltmanもOpenAIのスタッフに、数週間以内に非常に強力なモデルを見るはずだと内部で伝えました。それは数週間前のことです。チーム内部では、それが真に経済的加速を推進し、多くの人が予想していたよりも速く物事が進んでいると信じられています。

では、「Spud」とは具体的に何ですか？

Greg Brockman：
素晴らしいモデルです。しかし、焦点は単一のモデルにあるわけではないと思います。

私たちの研究プロセスは概ねこうです。最初は事前学習であり、新しいベースモデルを作成することです。そしてすべてのさらなる改善は、このベースモデルの上に構築されます。そしてこのステップは多くの場合、会社内の多くの内部チームが膨大な努力を投入することを必要とします。実際、過去18ヶ月間、私の時間のほとんどはここで費やされました。主にGPUインフラストラクチャ、トレーニングフレームワークを担当するチームのサポート、そして実際にこれらの大規模なトレーニングタスクを実行することです。

次に強化学習の段階が来ます。ここでは、すでに多くの世界知識を学習したAIが、その知識を真に応用し始めます。

次は微調整（ファインチューニング）プロセスです。この段階で、あなたは実際にそれに伝えます――さて、問題の解決方法を知ったので、さまざまな異なるシナリオで練習してください。

最後に、行動とユーザビリティに関する「ラストワンマイル」の段階があります。

ですから、私はSpudを新しい基盤、新しい事前学習モデルと見なしています。そしてその上で、過去2年間の私たちの研究が真に結果を示し始めていると言えます。非常にエキサイティングなものになるでしょう。

最終的に外部の世界が感じるのは、能力の全体的な向上だと思います。しかし私にとって、これは決して一度限りのリリース問題ではありません。なぜなら、このバージョンが出るとすぐに、実際にはこれから来る多くの進歩の初期バージョンに過ぎないからです。私たちはこの改善プロセスのあらゆる段階で、さらに多くのことを行い続けます。

ですから、私たちは今、加速し続ける進歩のエンジンを持っているようなものであり、Spudはその道の一つのマイルストーンに過ぎないと思います。

Alex：
では、今日のモデルにはできないことで、何ができるようになると思いますか？

Greg Brockman：
より難しい問題を解決し、より微妙なニュアンスを理解できるようになると思います。指示と文脈をよりよく理解するでしょう。

時々人々は「ビッグモデルの匂い（big model smell）」という感覚について話します。つまり、モデルが本当に賢く、より有能であるとき、それを明確に感じることができるということです。それはあなたの意図により密接に従い、あなたのニーズによりよく適合します。

質問をしたときにAIがあなたの意味を本当に理解していないとき、その感覚は依然として非常に失望させられます。自分自身で明確に理解できるはずのことなのに、と思わずにはいられません。

ですからある意味で、これは多くの「量的変化」が「質的変化」につながる結果になるでしょう。一方では、さまざまな指標で大幅な改善が見られるでしょう。他方では、まったく新しいシナリオが現れるでしょう。以前はAIが信頼できなかったために使うのが面倒だったかもしれませんが、今では躊躇なく使うでしょう。

これは包括的な変化になると思います。それがどのように能力の限界を引き上げ続けるかを見るのを特に楽しみにしています。物理学研究のようなシナリオでのパフォーマンスはすでに見ましたが、次はよりオープンエンドな問題に対処し、より長い期間にわたる問題に対処できるようになると思います。

同時に、能力の底上げを見ることも楽しみにしています。つまり、何をしたいとしても、今日よりもはるかに有用になるということです。

Alex：
しかし、平均的なユーザーにとって、このような変化を感じることは時として容易ではありません。例えば、GPT-5のリリース前には、実際には多くの誇大宣伝と期待がありました。しかし、実際に出たとき、最初の世間の反応はある程度失望させるものでした。その後、誰もがゆっくりと、それが実際には特定のタスクで非常に強力であることに気づきました。

では、次世代のモデルについては、特定の専門的なシナリオで主に感じられると思いますか、それとも誰もがより直感的かつ普遍的に感じるような改善になると思いますか？

Greg Brockman：
ストーリーは似ているかもしれません。モデルがリリースされた後、一部の人々は、これまで見てきたものと比較して完全に変革的であると即座に感じるでしょう。しかし、ボトルネックが「知能」にないユースケースもいくつかあるでしょう。ですから、モデルをより賢くしたとしても、これらの領域では、ユーザーは違いをすぐには感じないかもしれません。

しかし、時間が経つにつれて、誰もが最終的に変化を感じると思います。なぜなら、本当に変わるのは、あなたがこのシステムにどの程度依存し始めるかだからです。

もし私たちが今AIとどう対話しているかを考えると、誰もが実際には「何ができるか」というメンタルモデルを持っています。そしてこのメンタルモデルはすぐには変わりません。それは経験を積むにつれて進化し、そして時々それがあなたのために魔法のようなことをしてくれて、あなたは突然気づくのです。わあ、実際にこれができるんだ、今まで考えたこともなかった、と。

例えば、医療情報にアクセスするようなシナリオでは、すでに同様の事例を見ています。友人がChatGPTを使って、癌のさまざまな治療オプションを探索しました。医師は以前、末期であり、これ以上できることは何もないと言っていました。しかし、彼はChatGPTを使って多くの異なるアイデアを研究し、実際にそれによって治療法を見つけました。

このようなシナリオでは、前提は実際にはこうです。システムから価値を引き出すために多くの努力を投資する前に、この文脈でAIが助けてくれる能力に一定レベルの信頼を置かなければなりません。

ですから、次に目にするのはこうだと思います。同様のアプリケーションシナリオでは、AIがあなたを助けてくれることは、誰にとってもより明白になるでしょう。

したがって、これは技術自体が強くなることだけでなく、技術に対する私たちの理解が変わり、それに追いつくことでもあります。

Alex：
では、ますますそれに依存するようになるのですね。OpenAI内でも、自動AI研究者を開発しており、この秋にローンチされると言われています。では、それは具体的に何ですか？

AIは「離陸」フェーズへ

Greg Brockman：
全体的な傾向の観点から、私たちは今、この技術の離陸の初期段階にあると思います。

Alex：
「離陸」とはどういう意味ですか？

Greg Brockman：
離陸とは、AIが指数関数的な曲線に沿って継続的に強くなることを指します。そしてその理由の一部は、私たちがすでにAIを使ってAI自体の改善を助けることができるため、研究プロセス全体も加速しているからです。

しかし、「離陸」は単なる技術的な問題ではないと思います。それは現実世界への影響の解放も意味します。多くの技術の発展はS字曲線に従います。そして複数のS曲線をより長い期間で見れば、それらは最終的にほぼ指数関数的な成長の形に収束します。

私たちは現在、そのような段階にあると思います。つまり、技術自体がますます速いペースで進歩しており、この進歩のエンジンは継続的に勢いを増しています。

同時に、外部の世界では、多くの追い風が形成されています。チップ開発者はより多くのリソースを受け取っており、多くの人々がさまざまなアプリケーションに取り組み、AIを異なるシナリオに埋め込もうとし、それとさまざまな特定のニーズとの収束点を探しています。

すべてのエネルギーが絶えず蓄積されており、集団的にAIを「離陸フェーズ」へと押し上げ、周辺的な存在から経済成長を牽引する主要エンジンへと変貌させています。

そしてこれは私たちの組織の壁の中でだけ起こっていることではありません。世界全体、経済システム全体に関わることであり、どのように集団的にこの技術を進歩させ、その実用性がどのように進歩し続けるかということです。

Alex：
では、この「研究者」は何を具体的にするのですか？

Greg Brockman：
いわゆる「研究者」は本質的にこうです。AIが引き継げるタスクの割合が増えるにつれて、より自律的に操作させるべきだということです。

もちろん、これには慎重な検討が必要な多くの側面があります。リリースして、しばらく勝手に走らせて、後で戻ってきて良い結果が出たか確認する、という意味ではありません。

私たちは依然としてその管理に非常に深く関与すると思います。今と同じで、もしジュニア研究者がいて、あまりに長く放置すれば、価値を提供しない道に進む可能性が高いです。しかし、シニア研究者、あるいは真の方向感覚を持つ誰かが彼らを導けば、すべての特定の運用スキルを個人的に習得する必要さえなく、その人が生み出しているものに対して継続的なフィードバックを提供し、レビューし、方向性についてガイダンスを提供できます。具体的に何を達成してほしいか、ということです。

ですから、私が理解しているシステムは、モデルの出力を大幅に加速し、新しい研究のブレイクスルーを推進し、これらのモデルを現実世界でより有用で使いやすくするためのメカニズムのセットです。そしてこれらすべてが、ますます速いペースで起こるでしょう。

Alex：
それは具体的に何をするのですか？直接「AGIを見つけろ」と伝えると、自分で試すのですか？

Greg Brockman：
ある程度、少なくとも最初の意味ではそう見ています。しかし、より実用的な観点から見れば、こう理解します。私たちの研究科学者の一人のワークフロー全体を最初から最後まで取り、シリコンベースのシステムで可能な限り実行しようとすることです。

Alex：
「離陸」を理解する別の方法は、AIの進歩が漸進的な改善から勢いの蓄積へとシフトし、最終的には人間よりも知的な知性へと向かう、ほぼ止められない推進プロセスへと進化することです。

物事がポジティブな方向に発展する可能性がある一方で、この進歩自体が手に負えなくなり、逸脱するのではないかと心配していますか？

Greg Brockman：
もちろん、間違いなくあるでしょう。この技術の恩恵を享受するには、そのリスクについても真剣に検討しなければならないと信じています。

私たちの技術開発へのアプローチを見れば、セキュリティと保護に多くの努力を払っていることがわかるでしょう。プロンプトインジェクション攻撃が良い例です。もし多くのツールにアクセスできる非常にスマートで強力なAIを作成するなら、奇妙なコマンドを与える誰かによって誤った方向に導かれたり、操作されたりしないようにしたいと思うのは当然です。

これは私たちが多くの努力を払ってきたことであり、非常に良い結果を達成したと思います。この作業を担当する非常に強力なチームもあります。

興味深いことに、これらの問題の一部は実際には人間に例えることができます。人間もフィッシング攻撃を受けやすく、誤解される可能性があり、完全な文脈なしに行動する可能性があります。

私たちはこれらの例えを私たち自身のR&Dプロセスに取り入れています。モデルをリリースしたり、モデルを開発したりするときは常に考えます。どうすれば人間の目的に真に合わせられるか、どうすれば本当に助けになるか？これは私たちが非常に大切にしていることです。

もちろん、世界全体、経済全体に関わるより大きな問題もあります。すべてはどう変わるのか？どうすれば誰もがこの技術から恩恵を受けられるのか？これらは単なる技術的な問題ではなく、OpenAIだけで解決できるものでもありません。しかし、はい、私は技術を進歩させるだけでなく、その可能性に見合ったポジティブな影響を真にもたらすことができるようにすることについて、よく考えます。

Alex：
問題は、これが競争のように見えることです。OpenAI本社の壁の中で起こっていることは、多くのオープンソースプレイヤーによってもすぐに複製されます。そしてこれらのプレイヤーは、セキュリティの境界や保護措置の面で、多くの場合、はるかに弱いです。

以前あなたが言ったことを覚えています。要旨は、創造的な成果には多くの人が多くのことを正しく行う必要があるが、破壊的な結果には一人の悪意のあるアクターだけで十分かもしれない、というものでした。これは少なくとも、私が最も懸念している場所です。なぜなら、これは明らかに競争であり、進歩は速いからです。あなたの仲間の多くは、全員が停止することに同意すれば、自分たちも停止する用意があると言っています。しかし今、この競争が減速する兆しは全くないようです。

では、報酬は本当にそのようなリスクを負う価値があるのでしょうか？

Greg Brockman：

報酬は価値があると思います。しかし、そのような答えは依然として広すぎて、単純すぎるとも感じています。

OpenAIの設立以来、私たちは問い続けてきました。どのような未来が良き未来を構成するのか？どうすればこの技術は真に全員の状況を向上させられるのか？

この問いを2つの視点に分けることができます。一つは「中央集権的」な見方です。この技術を安全にするには、一つの組織だけが開発するのが最善の方法だと考えることです。そうすれば競争圧力はなく、慎重に物事を正しく行うことができ、準備ができたときに、すべての人にどう届けるかを決定できます。このアイデアは理解できますが、ある程度、受け入れるのが非常に難しい解決策でもあります。

そしてもう一つの道は、私たちが傾倒している道でもありますが、「レジリエンス（回復力）」の観点から考えることです。言い換えれば、それをオープンシステムとして見ることです。多くの参加者がこの技術の開発を推進していますが、焦点は技術自体だけでなく、この技術を取り巻く社会インフラを構築し、より安全に受け入れられるようにすることにあります。

電気の発展について考えてみてください。電気も多くの異なる人々や機関によって生産されており、それ自体がリスクや危険を伴います。しかし同時に、私たちはその周りに複数のセキュリティインフラを構築しました。電気安全基準があり、さまざまな使用仕様があり、規模に応じて規制アプローチがあります。非常に大規模な規模では、専門的な規制要件さえあります。多くの人々が民主化された方法で電気を使うことができ、検査官や、この技術の特性に基づいて徐々に確立された一連のサポートシステムもあります。

そしてAIも同じだと思います。私たちが真に見ているのは、AIを取り巻く広範な社会的な議論が必要だということです。もしこの技術が本当に到来し、全員の生活を変えるのであれば、人々が関与しなければなりません。秘密裏に中央集権的な小グループによってのみ推進され、決定されるべきではありません。

ですから私にとって、これは常に非常に核心的な問題でした。この技術はどのような方法で展開されるべきか？そして私たちが真に信じているのは、技術開発の周りに徐々に形成される「レジリエントなエコシステム」です。

Alex：
では、私たちは現在「離陸」のプロセスにあり、全員が実際にはすでにその中にいると言っているのですか？ NVIDIAのCEO Jensen Huang氏は最近、AGIは達成されたと信じていると言いました。同意しますか？

Greg Brockman：
AGIには人によって異なる定義があると思います。そして確かに、多くの人は今日私たちが持っている技術はすでにAGIと見なされると主張するでしょう。

これは議論の余地があります。しかし、本当に興味深い部分は、今日私たちが持っている技術は依然として非常に「荒削り」であり、断片化の感覚が明確にあることだと思います。

多くのタスク、例えばコードを書くことにおいて、それはすでに超人的です。AIはそれを実行でき、創造の摩擦を大幅に減らしました。しかし同時に、人間が簡単にできるのにAIが依然として苦労している非常に基本的なこともいくつかあります。

では、どこで線を引くのでしょうか？ある程度、それは現時点で厳密に科学的に定義できる問いというよりは、「感覚」や「雰囲気の判断」のようなものです。

ですから私自身としては、私たちは明らかにその瞬間を通過していると思います。もし5年前に今日これらのシステムを見せたら、私は言うでしょう。はい、これこそが当時話していたことです。ただ、現実は私たちが当初想像していたものとは大きく異なって成長しました。私たちがかつて思い描いたどんな形とも異なります。

ですから、それに応じてメンタルモデルを調整する必要があると思います。

Alex：
では、まだそこには到達していないということですか？

Greg Brockman：
おそらくすでに70％から80％は到達していると言えるでしょう。ですから、実際には非常に近いと思います。

そして一つのことは非常に明確だと信じています。今後数年間で、私たちは間違いなくAGIを目撃するでしょう。そのパフォーマンスは依然として多少「凹凸」があるかもしれませんが、完全に滑らかで完璧というわけではありません。しかし、それが達成できるタスクの下限は非常に高く引き上げられるでしょう――コンピュータ上で実行する必要がある知的タスクであれば、AIはほとんど何でも実行できます。

ですから今、多少不確実な答えをしなければなりません。なぜなら、これには確かに少し「不確定性原理」があるからです――異なる定義から議論できます。しかし、私の個人的な定義によれば、私たちはほとんどそこに到達していると思います。もう一歩前に進めば、間違いなくそこに到達します。

重要な変曲点：仕事の引き渡しが20％から80％へ

Alex：

2025年12月に具体的に何が起こったのですか？それは転換点のように見えました。「機械に数時間連続で中断なくコードを書かせる」というアイデアが、理論的なアイデアから、誰もが「自分でしばらく走らせておいても大丈夫だと信頼できると思う」と言い始めるようになった突然のシフトでした。

では、当時何が本当に起こったのですか？

Greg Brockman：
新しいモデルのリリース後、AIが実行できるタスクの割合が、一度に仕事の約20％から80％へと跳ね上がりました。これは非常に重要なシフトでした。なぜなら、それはもはや単なる「かなり良い小さなツール」ではなく、これらのAIを中心にワークフローを再編成しなければならなくなったからです。

私個人としても、非常に典型的な内臓的な瞬間がありました。長年にわたり、私にはテストキューがありました。AIにウェブサイトを構築させることです。このウェブサイトは、実際には私がコーディングを学んでいたときに手作りしたもので、数ヶ月かかりました。

そして2025年まで、まともなものを得るには、おそらくまだ4時間と数回のプロンプトの往復が必要でした。しかし12月までには、一度頼めばAIは一度でやり遂げ、非常にうまくやってのけました。

Alex：
では、これらのモデルはどうやってその飛躍を遂げたのですか？

Greg Brockman：
大きな理由は、ベースモデル自体が強くなったことです。OpenAIは事前学習技術を継続的に改善してきました。そしてその時点で、残りの一年がどのようなものになるかのヒントを見ました。しかし同時に、単一のブレイクスルーポイントだけではありませんでした。より正確には、私たちは革新のすべての次元で前進し続けてきました。

これらのモデルについての興味深いことの一つは、ある意味で、何度も何度も「不連続」の瞬間があったと感じるかもしれませんが、別の観点からは、すべてが継続的な進化でした。突然0％から80％に跳ね上がったのではなく、20％から80％へでした。ですからある意味で、単に良くなったとも言えます。

そしてこの進歩は、その後のすべてのマイナーバージョンアップデートで実際に続いていると思います。例えば、5.2から5.3へ。私には密接に協力しているエンジニアがいますが、最初はモデルに彼が担当する低レベルのハードコアなシステム作業をさせることができませんでした。しかし新しいバージョンまでには、モデルは彼の設計ドキュメントを引き継ぎ、真に実装し、メトリック監視と可観測性を追加し、パフォーマンス分析のためにプロファイラーを実行し、最適化を続け、最終的に彼が本来自分の手で提供したいと望んでいた結果を達成できました。

ですから、それは「漸進的な進歩、そして突然すべてが変わった」というプロセスのようなものだと言えます。しかしこれらすべては、実際に現在プレイ中の能力によって予兆されていました。遅くとも一年以内に、多くのこと、中にははるかに速いものも、非常に信頼できるものになるでしょう。

Alex：
これにはあなたも驚きませんか？なぜなら、少し前までインタビューで、自動プログラミングツールであるCodexのようなツールは、もともとソフトウェア開発者専用だったと言っていたのを覚えています。しかし今日の会話の冒頭で、実際には誰もがこれらのタイプのツールを使えると言いましたね。

何があなたの考えを変えさせたのですか？

Greg Brockman：
私は実際、常にCodexを「コードを書く」という文脈で組み立てていました。結局のところ、その名前にはコードが含まれているので、プログラマーのためのツールと見なすのは自然なことです。そしてOpenAI内では、私たちの多くがソフトウェアエンジニアであり、自分たちのためにツールを構築しているので、このように考えるのは非常に自然でした。

しかしこの技術が進歩するにつれて、私たちは何かに気づき始めました。私たちが実際に構築した基盤技術は、ほとんど「コード」に関するものではなく、根本的には「問題を解決する」ことに関するものだということです。

その核心は、文脈を管理し、実行フレームワークを構築し、AIが現実の仕事にどうプラグインすべきか、どうやって実際に物事を成し遂げるかを考えることです。そしてこれが確立されると、プログラミングの文脈においてさえ、突然、誰でもこの能力を持てることを意味します。なぜなら、あなたが真に持っているのは、あなたの代わりに仕事をしてくれるシステムだからです。ビジョン、達成したい目標があり、意図を明確に説明できる限り、AIは実行し、物事を成し遂げることができます。

しかし、これはあなたに問いかけさせるでしょう。なぜ私は「プログラミングではない」か「プログラミング」の分割にのみ集中しているのか？実際、Excelスプレッドシートやプレゼンテーション作成のように、本質的に何らかの機械的なスキルに過ぎない仕事はたくさんあります。もしAIが十分な文脈と十分な生の知性を持っていれば、実際に今、これらのことを非常にうまく実行できます。

ですから、もし私たちがそれをよりアクセスしやすく、よりユーザーフレンドリーにすれば、「Codexはプログラマー向け」から突然「Codexはみんな向け」にシフトするでしょう。

Alex：
そしてこの明確に見える進歩を見た後、シリコンバレーはすぐに別のほぼ静かな現象が現れるのを見ました。Open Clawですよね？あるいはより広く、技術コミュニティ全体が、先ほど言ったような方法でAIを信頼し始めています――AIロボットにデスクトップ制御を渡したり、Mac miniをセットアップして、メール、カレンダー、ファイルへの権限を与え、ある程度、「人生を引き継がせる」ようなことです。

その後、OpenAIはOpen Clawの創業者を会社に連れてきました。では、「あなたの人生を管理するのを助ける」この種のAIについてもう少し話せますか？ Open Clawチームを連れてきたのは、根底にあるビジョンがそのようなものだからですか？

Greg Brockman：
この技術の最も核心的な側面は、それがどう有用であり得るか、人々が実際にどう使いたいか、インテリジェントエージェントのビジョンは何か、どう人々の生活に入るか――これらはすべて非常に難しい問いです。

この技術の進化の中で私が繰り返し見てきたのは、真に深く関与しようとする意欲があり、好奇心に満ち、強い想像力を持っている人々です。これ自体が非常に現実的な能力であり、新しい経済においてますます価値のある能力になるでしょう。

Open Clawの創業者Peterは、私の意見ではそのような人物です。彼は非常に強い想像力と強い創造的な衝動を持っています。ですからある意味で、これは特定の技術に関連していますが、別の意味では、単なる技術的な問題では全くありません。それは真に関連しています。どうすればこれらの能力を人々の生活に埋め込み、それらが真に属する場所を見つけるか、ということです。

ですから、技術者として、これは確かにエキサイティングです。しかし、ユーザーに実用的な価値を届けることを真に気にかけている者として、私たちは今、これに多額の投資をしています。

Alex：
最近、これについて興味深いコメントをしましたね。自律的なAIエージェントがあなたのために働き始めると、あなたは「数千のインテリジェントエージェントの艦隊のCEO」になり、彼らがあなたの目標、ビジョン、タスクを達成するために働いており、あなたはさまざまな問題がどう解決されているかの詳細には深く関与しなくなる、と言いました。

しかし、ある意味で、この新しい働き方は、人々が問題自体の「脈動（pulse）」を失っているように感じさせる可能性があるとも言及しましたね。

Greg Brockman：
これは本当に良いことでしょうか？諸刃の剣だと思います。

ですから、私たちがすべきことは、一方ではこれらのツールがもたらす真の力を認識し、他方ではそれらがもたらす弱点を可能な限り軽減しようとすることだと思います。例えば、人々に大きなレバレッジを与え、大きなエージェンシー（主体性）を与える――もしビジョンがあり、達成したいことがあるなら、エージェントの艦隊全体を動員してあなたのためにそれを行わせることができます。これはもちろん非常に強力です。

しかし、世界がどう機能するかを考えると、最終的には誰かが責任を負わなければなりません。あなたがウェブサイトを構築していて、エージェントが物事を台無しにし、最終的にユーザーに影響を与えたとします。厳密に言えば、それはエージェントのせいではなく、あなたのせいです。ですから、あなたはそれを気にしなければなりません。

これらのツールを本当に使いたいと思う人は誰でも認識しなければならないと思います。人間のエージェンシー、人間の責任は、システム全体の核心部分です。人間がAIをどう使うかは根本的に重要です。

ですから、最も重要なポイントは、これらのエージェントのユーザーとして――私たちはOpenAI内でも同じですが――責任を放棄してはいけないということです。単に「AIがすべてを自分で処理するだろう」とは言えません。

Alex：
もちろん。しかし、先ほど言った「問題の脈動を失っているように感じる」ことは、「責任」とは違うようですね。

Greg Brockman：
私にとって、これら2つは実際にはつながっています。なぜなら、鍵はこうだからです。もしあなたがCEOなのに、詳細からあまりに遠ざかっているなら――例えば、チームを率い、会社を運営しているのに、最前線との接触を失っているなら、それは通常良い結果にはつながりません。ですから、先ほど表現したかったのは、「人間がついに何も知らなくていい」ということが追求する価値があるということではありません。

もちろん、一部の詳細は自信を持って引き渡すことができます。家を建てるためにゼネコンを雇うときのように、相手がうまく処理してくれると信頼しているので、個人的に監督する必要がない詳細はたくさんあります。しかし最終的に、いくつかの重要な詳細がうまくいかなかった場合、あなたは依然として気にするべきであり、依然として知っているべきです。

ですから、ここに非常に重要な微妙な違いがあります。単に盲目的に「問題の把握という感覚を失っても構わない」とは言えません。代わりに、私たちは能動的に言うべきです。システムの強みと弱みを真に理解するために、依然としてその認識を維持する必要がある、と。

そして、より低レベルで、より機械的な取引から自分を引き抜き始めるとき、そうできる理由は、このシステムが実際に物事を正しく行うことを確認し、このシステムへの信頼をすでに確立しているからであるべきです。

Alex：
モデルに関して、最後の質問が一つあります。事前学習から微調整、強化学習へと至るモデル進化の道筋について触れましたね。問題を段階的に解決するのが上手くなり、インターネット上でタスクを実行できるようになる、と。

そして今、モデルがこのプロセスを通じてツールを使うことを学んだ段階に達しました。正しく理解していれば、この進化の道の次のステップは何でしょうか？

Greg Brockman：
私たちが今いる世界は、マシンの能力が継続的に深まり、拡大している世界だと思います。その一部は確かにツール使用に関するものですが、同時に、「ツール」自体を十分に良いものにする必要もあります。例えば、AIがすでに「コンピュータ操作」を行い、人間のようにデスクトップシステムを使えるなら、原則として、あなたができることは何でもできます。

しかし同時に、マシンに対して多くのインフラレベルのものを提供する必要もあります。例えば、企業環境において、どうやってアイデンティティ認証と認可管理を行うか？どうやって監査証跡と可観測性を行うか？モデルの基盤能力の発展に追いつくために、多くのサポート技術を構築する必要があります。

そして全体的な方向性から、それは「非常に自然な音声インターフェース」のようなものを含むと思います。つまり、今と同じようにコンピュータと自然な会話ができ、本当にあなたを理解し、あなたが必要とすることを実行し、価値のある提案を提供できるということです。

例えば、それは能動的にあなたに思い出させます。あなたが進めていた何かが今行き詰まっており、問題はここにある、と。あるいは朝起きたとき、それはあなたに言います。これが今日のブリーフィングです。昨夜、あなたのエージェントはどれくらい仕事を進めましたか、と。

おそらくそれはあなたのためにビジネスを運営しているかもしれません――これがこの技術の巨大な応用になると思います。起業家精神の民主化は間違いなく起こります。それはあなたに言います。これらの領域は問題があります。顧客が今非常に不満を持っており、本物の人間と話したがっています。あなたが自分で処理したほうがいいです、と。これらのことは起こるでしょう。

次に、次の段階にはこれも含まれると思います。人間にとっての挑戦の上限は、この技術によって引き上げられ続けるでしょう。私たちは実際にすでにこの傾向の最前線にいます。私を最も興奮させるのは、AlphaGoの「第37手」にほぼ例えられます――あの手は人間なら決して打たなかったであろう手であり、創造的であり、ゲームに対する多くの人々の理解を変えました。

このようなことは、あらゆる分野で起こるでしょう。科学、数学、物理学、化学で起こるでしょう。材料科学、生物学、ヘルスケア、創薬で起こるでしょう。文学、詩、その他多くの分野でさえ起こるかもしれません。それは今日私たちが想像できない方法で、人間の創造性と理解の新しい空間を解き放つでしょう。

Alex：
しかし、モデルがあなたが言うほど強力なら、なぜ今までこれが現実のものとなっていないのですか？

Greg Brockman：
ここには「能力のラグ（capability lag）」が働いていると思います。つまり、モデルの実際の能力と、人々が現在それを使っている方法との間には、依然として大きなギャップがあるということです。ある程度、モデルの「中」にあるものに対する私たちの理解は、依然として進化しています。

ですから、たとえ技術的な進歩がこの時点から止まったとしても、世界は依然として大規模な変化を遂げるだろうと信じています――計算主導、AI主導の経済は依然として到来するでしょう。

しかし同時に、別の層もあります。私たちが今最も得意としているのは、「測定可能」なタスクでモデルをトレーニングすることです。ですから最初は、数学の問題、プログラミングのタスクから始めました。なぜなら、これらのタスクには非常に明確なバリデーターがあるからです。答えが正しいかそうでないかのどちらかであり、判断が容易です。そして時間が経つにつれて、モデルをよりオープンエンドな質問へと徐々に押し進めることができた理由は、「検証可能、評価可能であるもの」の範囲を拡大したからです。

AI自体もこれを助けることができます。AIが十分にスマートで、タスクを理解し、評価基準が与えられれば、徐々に学習できます。しかし、創造的なライティングのようなタスク、例えば「この詩はどれくらい良いか」といったものは、スコアを付けるのが難しいです。

ですから、過去のこのような種類のシナリオでは、AIに継続的な試行とフィードバックを通じて真に学習させることは確かに困難でした。しかし、これらすべては変化しており、私たちはすでに前方の道筋をかなり明確に見ています。

Alex：
それは非常に興味深いです。Peter Thielはかつて、数学が得意なら、これらのモデルの前で経験する影響は「言葉が得意」な人よりもさらに大きいかもしれない、といったことを言いました。そしてあなたも昔は数学クラブのメンバーでしたね。これについて心配ではありませんか？

Greg Brockman：
人々は、得たものよりも失ったものを多く見る傾向があると思います。私たちが「どうやって以前これをやっていたか」という深い経験を持っているからです。例えば、私は数学コンテストに参加していましたが、今ではAIも数学コンテストを実行できます。しかし重要なのは、これは決して「数学コンテスト」そのものについてではなかったですよね？それは人間の進歩を牽引する核心的なことではありません。

私たちが今どう働いているかを見ると――一つの箱の前に座り、別の箱でタイピングしている――100年前はこんな風には生きていませんでした。これは自然な状態ではなく、私たちが掃き込まれたこのデジタル世界に私たちがどう存在するべきかという真の姿でもありません。

それは「人間であること」の本質ではありません。真に重要なのは、現在に存在し、今を生き、他者とつながることです。

そして私は、私たちがこれから目にするのはこうだと信じています。AIはかなりの時間を解放し、人間に他者とのつながりを強化し、人々の間に絆を築く機会を増やすでしょう。

これは私を大いに興奮させます。

Alex：
そうですね。では、これらのエージェントのようなアプリケーションに向かってさらに進むにつれて、将来、大規模なトレーニングタスクが依然として必要になるかどうかについての議論が浮上していますね？

特にモデルがすでに十分に優れている場合、それを現実世界に展開し、事前学習に依存しない多くの段階を通じて大幅な改善を得ることができるように見えます。そして真に大規模なデータセンターのサポートを必要とするものは、実際には主に事前学習のためです。

あなたは常にスケーリングを担当し、この努力を推進してきました。この議論をどう見ていますか？

Greg Brockman：
この議論は、技術的進歩における非常に重要なポイントを見落としていると思います。確かに、モデル生産パイプラインのすべてのステップは、互いの効果を増幅します。ですから、すべてのステップが強くなることを望むでしょう。

私たちは見ています。一度事前学習が強くなれば、その後のすべてのステップははるかに簡単になります。これは実際に理にかなっています。なぜなら、モデルは最初からより有能であり、より速く学習するからです。また、異なるアプローチを試すにつれてより速く進歩し、間違いから学習し、より強力な基盤のおかげでエラーを減らしてより速く進歩します。

したがって、真の大きな変化は、私たちが「純粋に閉じた、自己派生的な合理的システムをトレーニングする」ことから「単に現実世界で間違いを犯させる」ことにシフトしていることではありません。代わりに、モデル自体をより大きく、より強くするだけでなく、試行させ、人々が現実世界でどう使うかを理解し、その使用フィードバックをトレーニングプロセスにフィードバックする必要があることに気づいています。これは、その研究を進め続ける価値を減らすものでも、その重要性を減らすものでもありません。

また、別の変化もあると思います。過去には、事前学習フェーズ中に生の能力を強化することに主に焦点を当てていましたが、推論や推論段階中の能力はそれほど強調していませんでした。そして過去24ヶ月間、重要なシフトは、両者の間のバランスの必要性に気づき始めていることです。

言い換えれば、非常に強力な能力を持つモデルを持つことができますが、推論や実際の展開中にも十分に効率的である必要があります。なぜなら、強化学習を行い、現実世界で真に展開するつもりなら、これらすべてが非常に強力な推論効率を必要とするからです。

これはまた、後続の大規模な使用シナリオも考慮しなければならないため、トレーニングスケールを理論的に可能な限り最大に押し上げる必要はないかもしれないということも意味します。

あなたが真に望むのは、一つの次元を最適化するだけでなく、知能レベルとコストの積の最適点です。

Alex：
将来が主に推論に向かうなら、NvidiaのGPUはそれほど必要なくなりますか？

Greg Brockman：
私たちは依然として絶対的にそれらを必要としています。

Alex：
なぜですか？

Greg Brockman：
多くの理由があります。

その一つは、トレーニングと推論の比率がどう変わろうとも、超大規模なトレーニングは依然として膨大な計算資源を一つの問題に集中させることによってのみ行えるものであり、現在これを行う代替方法はないということです。

ですから、将来起こる可能性が高いのは、展開側の計算資源の割合が大幅に増加することだと思います。しかし同時に、特に大規模な事前学習タスクを実行しなければならない瞬間は依然としてあり、そのときには依然として大量の計算資源を集中させる必要があります。

そして私は、Nvidiaのチームは本当に傑出しており、彼らが行う仕事は素晴らしいとも思います。ですから、はい、私たちは彼らと非常に密接に協力しています。

Alex：
人々が「私たちは十分に事前学習した、モデルはすでに十分にスマートだ」と言い始める日は来るでしょうか？

Greg Brockman：
これは、人間が目の前のすべての問題を解決したとき、たぶん私たちはそう言えるだろう、と言うのに少し似ていると思います。しかし、私たちが達成したいことの限界は実際にははるかに高いと思います。

過去50年間、ある程度、多くの目標に対する私たちの野心は実際には減少しました。例えば、いくつかの問題は非常に明確に見えます――全員が健康保険に加入していることを保証できるか？そして単に「問題があるときに治療する」だけでなく、真に予防的なヘルスケアを達成し、ライフスタイルに焦点を当て、人々を早期に助け、病気が発生する前に潜在的なリスクを検出する。私たちは実際に、これらの種類の問題を真に解決するために、よりインテリジェントなモデルを使えると思います。

もちろん、たぶんこの問題が徹底的に対処されたレベルがあり、その時点であなたは問うかもしれません。2倍スマートなモデルがまだ必要か？しかし同時に、より高いレベルの知性を要求する他の問題が間違いなくあるでしょう。

計算資源はコストではなく、収益エンジンである

Alex：
これらのデータセンターを構築する背後にある数字について話しましょう。今年初め、1100億ドルを調達しましたね。その計算はどううまくいったのですか？このお金は直接データセンターに行くのですか？将来的に投資家にこのお金をどう返すかについてどう考えていますか？計算におけるこの論理について話してください。

Greg Brockman：
根本的に、これは非常に単純だと思います。私たちの現在の最大の支出は計算資源です。しかし、計算資源を単なるコストセンターとして見ることはできません。それは収益センターのようなものです。

営業チームを雇うことと考えてください。何人の営業担当者を雇うつもりですか？あなたの製品が売れる限り、この製品の販売をスケーリングするメカニズムがある限り、営業担当者を雇えば雇うほど、収益は高くなります。

そして私たちが今いる世界は、需要に追いつくために計算資源を十分に速く構築できないと気づき続けている世界です。これは、今、非常に具体的に感じることができます。私たちは非常に痛みを伴う決定をしなければなりません。どの機能をライブにできるか、どれが今のところできないか。計算資源がどこに先に行き、どこに行かないか。

そして私は、経済全体がAI主導の経済へとシフトするにつれて、この状況ははるかに広く感じられるようになると思います。

真の将来の問題はこうなるでしょう。どのような問題がその種の巨大な計算資源を得られるか？全員が自分のパーソナルAIを持つようにどうスケーリングするか？全員にCodexのようなシステムを使わせるにはどうするか？

現在、世界にはこれらをサポートするのに十分な計算資源がありません。ですから私たちはこの問題に事前に備えています。

Alex：
しかし、これは最終的に全く新しいカテゴリーですよね？そしてあなたは非常に強い決定論を使って賭けています――世界でほとんど見られないほどの大きな金額です。新しいカテゴリーを作るとき、どうしてそれが最終的に立つと確信できるのですか？

Greg Brockman：
これにはいくつかの構成要素があると思います。

第一に、実際には歴史的な先例があります。ChatGPTがリリースされた瞬間から、私自身とチームと非常に明確な会話をしたことを覚えています。誰かが私に尋ねました。どれくらいの計算資源を買うべきか？私は言いました。すべてだ。すると誰かがまた尋ねました。いや、真面目な話、どれくらい買うべきか？私は言いました。どう構築しようとも、需要に追いつけないことはわかっている。

そしてそれ以来の毎年がその点を証明してきました。課題は、そのようなハッシュパワーの調達は通常、18ヶ月前、時には24ヶ月前、あるいはそれ以上前にロックインする必要があるということです。ですから、マシンが実際に納品されるずっと前に決定を下さなければなりません。これは、信じられないほど先見の明が必要であることを意味します。

そして私たちが向かっている世界は、今日まで、私たちの収益の大部分は依然として消費者サブスクリプションから来ており、それは将来も非常に重要であり続けるでしょう。もちろん、他の収益源も作成しています。

しかし、現在現れている、より大きな機会はナレッジワークです。

そしてこれについては、すでに非常に具体的に見ています。ほぼすべての企業が、この技術が実際に有用であり、競争力を維持したいのであれば、それを採用しなければならないことに気づき始めています。非常に自然な勢いが見えます。多くのソフトウェアエンジニアがすでにそれを使っています。そして今、より広範な拡散が見られ始めており、社内の人々がそれをさまざまなナレッジワークのシナリオに組み込んでいます。そしてこの業界で現れた支払いの意思、そしてあなたが見ている収益成長は非常に明確です。

これは今起こっています。外挿するだけです。そして私たちが他よりも明確に見ているかもしれないことの一つは、これらのモデルが次にどう進歩するかをよりよく見ることができるということです。

これらすべてをまとめると、気づくでしょう。この経済自体が非常に巨大なものであり、ほとんど想像を絶するほどです。そしてこれからは、この経済の成長の主要な推進力はAIになるでしょう――どれだけうまくAIを活用できるか、そしてそれを推進するためにどれだけのハッシュパワーを持っているか。

Alex：
消費者サブスクリプションが現在最大の収益源だと言いましたね。では、将来はこれが逆転し、企業が最大の収益源になると判断していますか？

Greg Brockman：
今、「企業側」が急速に成長していることは非常に明確だと思います。もちろん、「企業側」という言葉自体も進化しています。なぜなら、それが真に指し示しているのは、人々が生産的なナレッジワークでAIを使っていることだからです。

そして価格設定に関しては、カテゴリーが以前のように明確に分かれるとは思いません。例えば、現在のCodexの利用モデルは、ChatGPTの消費者サブスクリプションを持っていれば、すでにCodexにアクセスできるというものです。

ですから、将来がB2BとB2Cの間にそのような明確な分割になるとは思いません。より可能性が高いシナリオは、ユーザーとして、デジタル世界へのゲートウェイであるラップトップのように、統一された入り口を持つことです。

そして真の収益は、根本的に、ここから来るでしょう。

Alex：
Darioが何かを言いましたが、彼はあなたについて話していたのかもしれません。一部のプレイヤーはリスクダイヤルを上げすぎている、と彼は非常に懸念しています。彼はあなたの巨大なインフラへの賭けを指していたと思います。この発言についてどう思いますか？

Greg Brockman：
同意しません。私たちは常に非常に慎重であり、実際に次に何が来るかを見てきました。今年を見るだけでも、真に参加したすべての人は「計算資源の制約」を感じるだろうと信じています。

そして、私たちは他の人よりも早くこれに気づき、技術がどう展開するかについてより早く準備していただけだと思います。

その代わりに私が見たのは、他の多くの参加者は昨年末にようやくこれに気づき、計算資源を探しに急いだものの、買うものはほとんど残っていなかったということです。

ですから、そのようなことを言うのは簡単だと思います。しかし現実は、誰もが今気づいています。この技術は実行可能であり、ここにあり、本物である、と。ソフトウェアエンジニアリングは、その最初の明確な例に過ぎません。

そして私たちを真に制約しているのは、利用可能な計算資源です。

Alex：
彼はまた、自分の予測がわずかでも外れれば、会社が倒産する可能性があるとも言いました。あなたも同じリスクに直面していますか？

Greg Brockman：
ここには実際には「トラップドア（落とし穴）」の方が多いと思います。もしダウンサイドについて真剣に考え始めれば――そしてそれは完全に公平な問いだと思います――この賭けは実際にはどの会社に対するものでもなかったことに気づくでしょう。

それは実際には業界全体に対するものでした。それは賭けです。この技術は作れると信じますか？そして今日私たちが目にする莫大な価値を届けられますか？

私はそれらの最も直接的な証拠に戻り続けます。ソフトウェアエンジニアリングのように――もしあなたがソフトウェアエンジニアでなければ、もしCodexを真に使ったことがなければ、読書を通じて経験の違いを理解するのは困難です。その違いは実際には説明するのが難しいです。しかし、人々はすぐに真にそれを感じるだろうと思います。

6ヶ月前、この種の明白な経験は私たちの内部にほとんど限定されていました。その後、明確な外部の証拠もありました。そしてあと6ヶ月で、誰もがそれを感じるだろうと思います。そしてその時までに、私たち全員が別の種類の痛みを感じるでしょう。素晴らしいモデルは存在しますが、世界には十分な計算資源がないため、それらを使えません。

Alex：
ええ、しかし私たちが番組で2026年の予測をしていたとき、昨年末に議論がありました。Ranjan Royもそこにいましたが、彼は2026年は「誰もがスマートエージェントを使う年」になると言いました。当時の私の反応はこうでした。自分の目で見て、実際にスマートエージェントを使い始めたら信じる、と。

Greg Brockman：
では今、私たちはその瞬間に到達していませんか？今、何に使っていますか？

Alex：
動画がオンラインになるときに、一緒に働く人々がよりよく同期できるように内部ツールを構築したり、サムネイルをどうすべきか、といったことに使っています。また、YouTubeからいくつかのデータを引っ張ってきて、サムネイルなどの要素に基づいて動画のパフォーマンスを分析できるようにしています。ある程度、これは自分でカスタマイズしたソフトウェアのセットであり、伝統的な方法で行うなら、おそらくそれを買うためにお金を使わないでしょう。

これが今、興味深いことだと思います。ソフトウェアはもともと一般大衆向けに大量生産されていましたが、まさにこのため、常にあなたに合わせて調整されていない場所がたくさんあります。そしておそらくAIによってもたらされる変化は、ついに私たちがより自然な方法でソフトウェアと対話できるようになることでしょう。

Greg Brockman：
それが鍵だと思います。そして私が絶えず考えていることの一つは、今日私たちがコンピュータを構築する方法は、実際には私たちをデジタル世界に引き込んでいるということです。

あなたが電話でコンテンツをスクロールし続けるのにどれくらいの時間を費やすか考えてみてください。次に、このシステムをあのシステムに接続しようとして、さまざまなボタンをクリックし続けるのにどれくらいの時間を費やすか考えてみてください――なぜこれらのことをあなた自身がやらなければならないのですか？ AIが真に行うべきは、マシンをあなたに近づけ、あなたに合わせて調整し、あなたが達成したいことをより理解することです。

このアイデアは常に私たちのポップカルチャーの一部でした。コンピュータと直接話すことができ、そうすれば物事を成し遂げてくれる、と。そして今、このものは現実になり始めており、実際にできることになりつつあります。この変化の範囲は本当に素晴らしく、何度も自分で試してみないと本当に理解できません。ですから、私たちは非常に特別な瞬間にいると本当に感じています。

Alex：
では、なぜAIに対する世間の認識はこれほどネガティブなのですか？例えば、YouGovのデータは、米国では、AIが社会にポジティブな影響を与えると信じている人々に比べて、ネガティブな影響を与えると信じている人が3倍多いことを示しています。

その背後にある理由は何だと思いますか？ AIのパブリックイメージについて心配していますか？

Greg Brockman：
私たちが本当にしなければならないことの一つは、この国の人々に、なぜAIが彼らにとって有益なのかを示すことだと思います。そして単にマクロ経済の観点からだけでなく、GDP成長を牽引するとか、そのような大きな言葉を言うだけでなく、実際に彼らの生活を具体的にどう向上させるか、ということです。

実際、毎日非常に具体的なストーリーを聞きます。例えば、ある家族の子供が絶えず頭痛やその他の健康上の問題を抱えていましたが、MRIスキャンが承認されていませんでした。その後、彼らはChatGPTを使って症状を研究し、実際にこれを使って保険会社に対してより強力なケースを作れることに気づきました。彼らはそうしました。そして子供は実際に脳に腫瘍を抱えていたことが判明しました。そしてChatGPTを通じて正しい情報を得たおかげで、子供の命が救われたのです。

それはほんの一つのストーリーです。同様のストーリーはたくさんあります。人々の生活はこの技術によって深く向上しており、中にはそれによって救われた人もいます。鍵は、彼らが現実生活でこの技術と真に関わったということです。

しかし、これらの種類のストーリーは実際には広く共有されていないように感じます。これは多くの人々の生活で起こっていることだと思いますが、何らかの理由で、まだ主流の物語にはなっていません。

また、ポップカルチャー、特に1990年代から続いている想像力は、AIについて非常にネガティブであり、常に何がうまくいかないかを強調していることにも気づきました。しかし、人々が実際にAIを使い始めると、実用的な価値があり、役立つことに気づきます。

ですから、私はこれについて非常に気にしています。私たちは、この技術の波がなぜ彼らの生活を向上させるのか、なぜ人間同士のより近い関係を促進するのかを理解してもらうことに、真に成功していません。

これは私にとって非常に重要な焦点です。そして、なぜAIがこれほど重要なのかという視点を少し広げれば、将来、経済力と国家安全保障の重要な源になると思います。それは国の競争力に影響を与えるでしょう。そして中国のような他の国々は、AIにおいてほぼ完全に反対の方向を示しています。

ですから、はい、これは非常に重要だと思います。私たちは直面しなければならず、誰もがこの技術の利点から恩恵を受けられるようにする方法を真に考え出さなければなりません。

Alex：
しかし、私たちは今、非常に不安定な瞬間にいます。人々は仕事について非常に心配しています。誰かとAIについて話すたびに、彼らはほぼいつも尋ねます。あとどれくらい仕事を続けられますか？

そしてデータセンターに関しては、それらに対する世間の認識は、AI自体よりもさらに悪いです。これらの世論調査を見ると、データセンターが環境、家庭のエネルギーコスト、周辺住民の生活の質にポジティブな影響を与えるよりも、ネガティブな影響を与えると考えている人の方が多いことがわかります。

ですから私たちは、良い仕事がますます見つけにくくなっている瞬間にあり、人々はデータセンターがコミュニティに入ってくるのを見て考えます。「これは環境に優しくもなく、エネルギーの面で費用対効果も高くなく、私たちの生活の質を下げるだろう」と。

彼らは間違っていますか？

Greg Brockman：
データセンターを取り巻く多くの誤情報が実際にあると思います。

非常に典型的な例は、水の使用の問題です。もし実際に世界最大、あるいは少なくとも最大級のスーパーコンピューティング施設であるアビリーンの施設を見に行けば、その総年間水消費量は実際には平均的な世帯の1年分に相当します。言い換えれば、水の使用量は実際には最小限です。

しかし、これらのデータセンターが大量の水資源を消費すると人々に信じ込ませる多くの誤情報がそこにはあります。

電気も同様の状況です。私たちはコストを自分たちで負担し、上昇する電気料金の圧力を住民に転嫁しないことを約束しました。これは重要であり、今、業界全体が同様のコミットメントをし始めています。なぜなら、地域コミュニティを改善することは実際に非常に重要だからです。そして私たちがデータセンターを構築するとき、私たちは実際にこれらの地域コミュニティと関わり、現地で何が起こっているか、私たちが助けるために何ができるかを理解します。データセンターは税収をもたらし、雇用を創出します。多くの利益をもたらします。

ですから、鍵は依然として私たちがどう現れるかであり、これは私たちが非常に真剣に受け止めている責任です。

Alex：
わかりました。しかし、住民の電気料金が上がらなくても、電気を持ち込まなければならず、それはより多くの汚染を意味するかもしれません。それは問題ではありませんか？

Greg Brockman：
これには実際には多くのより細かい層があると思います。

今日の電力網がどう機能しているかを見れば、実際には多くの「アイドル電力」があることがわかるでしょう――つまり、多くの電力はすでに存在しますが、完全には活用されていません。同時に、送電システム自体がアップグレードを必要としています。そして鍵は、これらのアップグレードコストは私たちによって負担されるべきであり、通常の料金支払者によってではないということです。これは非常に重要です。クリーンエネルギーが利用可能な場所はたくさんありますが、この電力は実際には完全には活用されておらず、ある程度無駄にさえなっています。

ですから、データセンターからの需要が入ってくると、それは実際にそれらの老朽化した、時代遅れのグリッドをアップグレードする真の推進力をもたらします。そしてこのアップグレードは、実際にはコミュニティに真の利益をもたらします。例えば、ノースダコタ州では、地元のデータセンターの建設が実際にユーティリティインフラの改善を助け、結果として住宅の電気料金が低下したのを見ました。

Alex：
わかりました。最後の政治的な質問です。あなたはトランプを支持する政治活動委員会であるMAGA Inc.に2500万ドルを寄付しましたね。

Greg Brockman：
これについては以前Karaとも議論しましたね。

注：Kara Swisherは、鋭い質問と直接的なスタイルで知られる著名なアメリカの技術ジャーナリストであり、長年シリコンバレーとインターネット企業をカバーしてきました。

Alex：
そうですね。当時あなたは言いました。「この技術が真に全員に利益をもたらすのを助けることなら、何でもする」。もしこれがあなたを「単一争点有権者」や「単一争点寄付者」にするなら、そうさせておけ、と。しかし私が常に不思議に思っていたのは、この種の「単一争点キャンプ」にとって、政治的行動の究極の北極星は「この国をより強くする」ことそのものであるべきではないでしょうか？

言い換えれば、候補者があなたのしていることを完全には支持していなくても、もし彼らがこの国をより強くできるなら、それも政治的支持の重要な基準であるべきではないでしょうか？もしそうなら、これはあなたの寄付の検討の一部でもありますか？

Greg Brockman：
私はこう見ています。あの寄付は、妻と私が一緒に下した決定でした。私たちは両側のスーパーPACにも寄付してきました。

私はこの技術が非常に速く来ていると感じています。今後数年間で、それは真にすべてを変え、経済全体の基盤になるでしょう。しかし、まだ人気はありません。ですから私たちは、この技術を真に受け入れる意志があり、この技術を真に理解している政治家を非常に支持したいのです。

もちろん、より広いレベルで、この技術自体が実際に私たちの国の能力を強化しています。ある意味で、私は確かに「単一争点有権者」です。なぜなら、これが私が独自の貢献をできる領域だと信じているからです。しかし最終的に、これは依然として支持を表明することです。国として、私たちは積極的にこの技術を受け入れるべきです。

将来の核心的能力：AIを使うことではなく、「AIを管理すること」

Alex：
今、あなたの前に座っていて、AIを非常に恐れており、AIが自分の仕事を奪い、コミュニティを台無しにし、世界をあまりに速く変えると考えている人がいるなら、彼らに何と言いますか？

Greg Brockman：
私が最も言いたいことは、これらのツールを自分で試してみてください、ということです。なぜなら、今日すでに存在するAIを真に体験したときだけ、それがあなたのために何ができるかを真に理解できるからです。

そして今日、私たちはすでにこの技術からのあまりに多くの機会、可能性、エンパワーメントを見てきました。あなたは先ほど、今それを使って何ができるかを言いましたよね？今までウェブサイトを作ったことがない人々が今それを作れます。もし小さなビジネスを始めたいなら、以前はさまざまなバックエンドプロセスや運用の詳細に圧倒されていたかもしれませんが、今、AIはこれらのことの多くを手伝ってくれます。

ですから、あなた自身の人生のために、考えるべきだと思います。健康を管理するのを助けてくれるか？愛する人の世話をするのを助けてくれるか？お金を稼ぐのを助けてくれるか？お金を節約するのを助けてくれるか？これらすべてが現実の選択肢になるでしょう。

人々は常に「何が変わるか」を見るのは簡単ですが、「何を得るか」を見るのはそれほど簡単ではないと思います。しかし、公平なチャンスを与え、スケールの各側が真に何を表しているかを真に理解する価値はあると信じています。

Alex：
ちなみに、これは調査ではめったに議論されないポイントでもあります。「AIについて聞いたことがある」だけで、自分では一度も使ったことがない、あるいはほとんど使ったことがない人々は、よりネガティブになる傾向があります。ヘビーユーザー、あるいは単なるレギュラーユーザーになれば、この技術に対する見方は通常、はるかにポジティブです。

Greg Brockman：
私個人としては、私たちは何年もこの技術について考えてきました。そして今、現実が展開するのを見る方法は、私たちが想像していたよりもさらに素晴らしく、有益であり、私たちが予想していたよりもはるかにポジティブな影響を与えるでしょう。

Alex：
最後の質問です。もし誰かがあなたに「将来のためにどう準備すればいいですか？」と尋ねたら、どう答えますか？

そしてこの答えは単に「ツールを使いに行け」ではいけません。なぜなら、私の仕事に何が起こるかわからない、この世界に何が起こるかわからない、ただ今何をすべきかを知りたい、と私に尋ねてくる友人が本当にいるからです。

Greg Brockman：
依然として、最初のことはこの技術を理解することだと思います。この技術から真に恩恵を受ける人々は、好奇心を持ってアプローチする人々であることがわかっています。彼らは真にそれをワークフローに統合し、初期の閾値を乗り越える努力をするでしょう――空白の入力ボックスと「それを使って何をすればいいのか」という感覚に直面して。

あなたは徐々にエージェンシーの感覚を養う必要があります。私はマネージャーになれる。方向性を設定できる。タスクを委任できる。監督できる。そして、あなたは真にこの能力を開発する必要があります。なぜなら、それは非常に基礎的なスキルになるからです。

私たちは人類を助け、人間同士のつながりを促進し、人々が本当にやりたいことをするための時間を与えるために、この技術を構築しています。ですから、問いは最終的にこうなるでしょう。あなたは何を本当に望みますか？そして真に重要なことは、これを明確にし、これを達成するためにこの技術を使うことです。

Alex：
そうですね。番組に来てくれて本当にありがとうございました。

Greg Brockman：

招待してくれてありがとう。

Alex：
また、聞いて見てくれた皆さん、ありがとうございました。また次回、Big Technology Podcastでお会いしましょう。

[動画リンク]