AppleのSiri AI導線、WWDC26の本丸はApp IntentsとFoundation Modelsだった
WWDC26のPlatforms State of the UnionをAppleの同日公開資料とあわせて読むと、Siri AIの主題は会話UIの派手さではありません。Appleは、アプリのコンテンツと行動をApp Intentsでシステムへ渡し、Foundation Modelsでアプリ内に知能を持ち込み、ShortcutsやVisual Intelligenceで露出面を広げる設計をかなり明確に打ち出しました。PSOTUはその全体像を見せる看板で、実際の本丸は新しく並んだ一次資料のほうにあります。
Siri AIの入口は会話画面よりApp Intentsにある
Platforms State of the Unionの動画ページ自体は『Appleプラットフォームの最新進化を深掘りする』という広い案内に留まっていますが、同時に更新されたApple Intelligence概要ページはかなり具体的です。Appleはここで、Apple Intelligenceを『personal context understanding』『app actions』『on-screen awareness』をまたぐ仕組みとして説明し、iPhone、iPad、Mac、Apple Watch、Apple Vision Proに広げると整理しています。
そのうえでAppleは、アプリのコンテンツと行動をSiri AIとシステム全体へ統合する入口をApp Intentsだと明記しています。つまり今回の焦点は、Siri AIの画面がどう変わるかより、サードパーティアプリがどの schema で見つかり、呼ばれ、文脈に参加するかです。PSOTUの本質は、Apple Intelligenceを単独機能ではなくアプリ接続面として再定義したことにあります。
アプリ内の知能はFoundation Modelsへ寄せ始めた
もうひとつ重要なのは、AppleがSiri AIの外側にも明確な受け皿を置いたことです。Apple Intelligence概要ページでは、Foundation Models frameworkをネイティブSwift APIとして紹介し、Apple Foundation Modelsへのアクセスをデバイス上とPrivate Cloud Compute経由の両方で提供すると説明しています。加えて、multimodal prompts、Vision framework tools、Dynamic Profiles、Evaluations frameworkまで並べ、アプリ側が推論の作法を持つ前提を打ち出しました。
Foundation Modelsのドキュメントも、これは単なる文章生成APIではなく、language understanding、structured output、tool callingに向くオンデバイスモデルだと整理しています。Appleの狙いは、AI体験をSiri AIの会話面だけに集約することではなく、アプリ自身がローカル文脈や独自ツールを抱えたまま知能を実装できるようにすることだと読めます。
ShortcutsとVisual Intelligenceがアプリの露出面を押し広げる
Apple Intelligence概要ページは、その接続先もかなり露骨です。Shortcutsは自然言語の説明から自動化を組み立てられるようになり、App Intentsを採用したアプリのactionsとentitiesは、そのままマルチステップのワークフロー部品になります。Visual Intelligenceも、iPhoneのカメラ、MacとiPadの画面上コンテンツ、Apple Vision Proの現実空間にある対象から情報検索や行動につなげる面として説明されています。
| 層 | 主な役割 | 今回見えた意味 |
|---|---|---|
| App Intents | アプリの行動とコンテンツをSiri AI、Spotlight、Shortcutsへ渡す | Apple Intelligence時代の発見性と実行面の共通レールになる |
| Foundation Models | アプリ内でオンデバイス推論、structured output、tool callingを扱う | Siri AIの外でも各アプリが独自の知能を持てる |
| Shortcuts | 自然言語から自動化を組み立て、アプリのactionを多段フローに入れる | 単機能の呼び出しではなく、ワークフロー部品としての価値が増す |
| Visual Intelligence | カメラ、画面、空間内の対象から検索やアクションへつなぐ | アプリ露出が会話画面の外へ広がる |
ここで効いてくるのが、App Intentsの別ドキュメントにある注意書きです。Appleは、Siriのpersonal context understanding、onscreen awareness、in-app actionsはまだ開発中で、将来のソフトウェアアップデートで利用可能になると書いています。つまりWWDC26で見えたのは完成済みの一枚絵ではなく、アプリ側に今から載せておくべき共通レールです。今のうちにApp Intentsで内容と行動を表現しておけば、Shortcuts、Spotlight、Siri AI、Visual Intelligenceの露出面があとから順に開いていく構図になっています。
WWDC26のPlatforms State of the Unionを見て本当に押さえるべきなのは、Siri AIの見た目ではなく、Appleがアプリ接続の土台をかなり整理したことです。外向きの入口はApp Intents、内向きの推論基盤はFoundation Models、露出面の拡張はShortcutsとVisual Intelligence。この3層を先に理解すると、今回のApple Intelligenceは『会話機能の追加』ではなく『アプリが文脈の中で呼ばれる設計変更』として見えてきます。