OpenAI・GoogleのAIが東大理3で首席超え
本日はAIの"知的能力の上限"と"日常業務への浸透"が同時に動くニュースをお届けします。日経の検証ではOpenAIとGoogleのAIが東大理3の合格者最高点を50点近く上回る得点を達成。一方でAnthropicは、ビジネスパーソンが毎日触れる Excel・Word・PowerPoint への正式統合を発表しました。"最難関入試"と"明日の業務"の両端で、AIの実力ラインが一気に上がった一日です。
①OpenAIとGoogleのAIが東大理3で"首席超え"、数学は満点続出
日経新聞は河合塾の採点協力のもと、OpenAIとGoogleの最新モデルに2026年度東大理科三類の入試問題を解かせた検証結果を公開した。理3の合格者最高点が453.60点(550点満点)だったのに対し、ChatGPTは503.59点、Geminiは496.54点と、いずれも首席を50点近く上回る得点を記録。OpenAIモデルは東大・京大すべての科類で「首席」相当の得点に達した。数学では満点が続出する一方、画像中の視覚的意図の読み取り、日本語論述の流れの構築、解答用紙という物理制約への適応など"読解と表現"の領域に課題が残ったと報告されている。
「AIは難関試験で人間最高点を超える」という事実は、中小企業の現場でも"高度判断を要する業務"――契約書チェック、複雑な見積精査、提案書の論点整理――が現実的にAIで補えることを意味します。同時に「読解・論述・物理制約」への弱さは、人間の確認・編集・最終判断の価値が当面残ることも示しており、"AIに任せる工程"と"人が仕上げる工程"の設計こそが投資対効果を分けるポイントになります。
②AnthropicがClaudeをExcel/Word/PowerPointに正式統合、Outlookもベータ開始
Anthropicは、Claudeを Microsoft 365 のExcel・Word・PowerPointへ正式機能(GA)として組み込むアドインの提供を開始した。Outlook向けは公開ベータとして同時ロールアウト。Windows・Mac・Webで動作し、Pro/Team/Enterprise の有料Claudeプランに追加料金なしで含まれる。最大の特徴は、4つのアプリ間で会話コンテキストを保持したまま動く"単一エージェント"設計だ。Outlookで受信メールを要約し、そのままExcelに切り替えて関連データを集計、続けてPowerPointで提案資料を組み立てる──といった横断作業を、ユーザーが状況を毎回説明し直す必要なく実行できる。Excelではセル参照付きで根拠を示し、PowerPointではマスタースライドの書式を保ったままレイアウト生成、Wordでは選択箇所の周囲書式を壊さずに編集できる。
中小企業のホワイトカラー業務は、結局のところ Excel・Word・PowerPoint・Outlook の4本柱でほぼ完結します。"ChatGPTの画面を別に開いて貼り付ける"運用から、"使い慣れたOfficeの中でAIが横断的に動く"運用への移行は、現場の心理的ハードルを大きく下げる転換です。導入時は、①どの4アプリ横断シナリオから試すか、②セル根拠表示や書式保持といった"検証可能性"をどこで担保するか、③Pro/Team/Enterpriseのどのプラン階層が自社規模に適切か──の3点を先に整理すると、PoCで終わらずに本番運用へ進められます。
AIは最難関入試の頂で人間最高点を凌駕する一方、足元では誰もが毎日触れる Office アプリの中で当たり前に動き始めました。"AIに任せられる範囲"は今、想像より早いペースで広がっています。重要なのは「自社のどの業務から、どの粒度で任せるか」を経営として決めること。コプラスでは、御社のオフィス業務に最適なAI導入シナリオの設計と、補助金活用を含めた段階導入を伴走支援しています。
無料相談はこちら →

