AppleのSiri AI、今年の鍵は「会話」よりアプリの索引化だった
WWDC26のApp Schemasセッションを追うと、Appleが今年のSiri AIで本当に急いでいるのは会話UIの演出より、アプリの中身を見つけられる形へ揃えることだと分かります。App Entitiesで内容を定義し、App Schemasで行動を標準化し、IndexedEntityとonscreen awarenessで今見えている対象まで渡す。Siri AIの入口は派手な返答文より、アプリのデータと行動をどこまで索引化できるかにあります。
Siri AIはまず『話す』前に、アプリの中身を見つけられなければならない
Appleのセッション要約はかなり明快です。Siriが今年得る3つの能力として、アプリのentitiesへアクセスすること、intents経由で行動すること、onscreen contextを理解することを並べています。つまりAppleがSiri AIを強く見せたい場所は、自然な受け答えそのものより、アプリの内容と行動へどれだけ確実につながるかです。
この整理は、関連ドキュメントの説明とも一致します。『Making actions and content discoverable by Apple Intelligence』は、Siriがアプリと連携できるよう、関連するschemaを追加してシステムへ装備すると説明しています。Appleにとって今年のSiri AIは、巨大な会話モデルの上に全部を任せる設計ではなく、アプリ側が標準化した内容と行動を先に差し出す設計です。
App SchemasとIndexedEntityで、アプリの内容と行動が横断面に出てくる
セッション中盤で効いてくるのがApp EntitiesとApp Schemasです。Appleは、何がそのアプリの『もの』なのか、どう識別し、どのプロパティが重要かをApp Entitiesで定義し、そのうえでschema domainへ当てはめるとSiriがそのカテゴリとして理解できると説明しています。行動面でも、intentをschema domainへ載せると、Shortcuts、Spotlight、WidgetsだけでなくSiriの自然言語実行にも乗せやすくなります。
さらにAppleは、Entity resolution and IndexedEntityの章で、semantic searchとcontent Q&Aの土台まで整理しました。searchableなプロパティをindexingKeyで示して事前索引できるなら、Siri AIの体験は『何を言うか』以上に『何が索引されているか』で決まります。会話面の賢さより、データの整理と公開面の整備が先に来る理由がここで見えます。
onscreen awarenessと段階的テストが、Appleの実装順をよく表している
後半のonscreen awarenessも、同じ思想の延長です。Appleは、単一の主対象ならNSUserActivity、多数の表示対象ならview annotationsでApp Entityと結びつけ、『これ』『あれ』のような参照をSiriが解決できるようにすると説明しています。関連ドキュメントも、onscreen contentへ文脈情報を与えるためにinterfaceへapp entitiesを注釈すると書いています。ここでも主役は会話表現ではなく、いま見えている内容の構造化です。
| 層 | 主な道具 | 役割 |
|---|---|---|
| 内容 | App Entities、IndexedEntity | SiriやSpotlightがアプリの中身を見つけられるようにする |
| 行動 | App Schemas、App Intents | 自然言語の依頼を標準化した操作へ落とす |
| 文脈 | NSUserActivity、view annotations、onscreen awareness | 『これ』『あれ』の参照先を画面上から解決する |
テスト手順の順番も象徴的です。Appleは、App Intents Testingでロジックを確認し、次にShortcutsでintent形状、Spotlightでcontent indexing、最後にSiriでend-to-endを確かめるよう勧めています。Siri AIは今年、会話面が最初ではなく最後の確認点です。Appleは、まずデータ、行動、索引、画面文脈を整えてから、その上にSiriの自然言語面を載せる順番をかなり徹底しています。
このセッションが示しているのは、AppleのSiri AIが『話せるアシスタント』になる前に、『アプリの内容と行動を迷わず辿れるシステム面』になろうとしていることです。App Schemas、IndexedEntity、onscreen awareness、段階的テストという流れを見ると、今年の鍵は会話の演出ではなく、アプリ側の索引化と標準化にあります。