Apple płaci Nvidia za uruchamianie Siri w Google Cloud — paradoks prywatności, o którym nikt nie mówi
- Pod koniec maja 2026 The Information ujawniło to, co wielu w branży AI podejrzewało: Apple zgodziło się używać chipów Nvidia w Google Cloud do uruchamiania części nowej, zasilanej Gemini Siri. To porozumienie jest częścią szerszej umowy Apple-Google AI, o której pierwszy raz poinformowano w marcu 2026.
- Konfiguracja jest strukturalnie dziwna. Apple — firma, która od dekady marketinguje prywatność jako swoją przewagę konkurencyjną — teraz wysyła zapytania Siri użytkowników do chmury strony trzeciej (Google) uruchamianej na akceleratorze AI strony trzeciej (Nvidia). Obietnica „prywatnej chmury" z Apple Intelligence 1.0 (2024) mówiła, że zapytania nigdy nie opuszczają infrastruktury kontrolowanej przez Apple. Siri 2.0 łamie tę obietnicę.
- To nie jest tymczasowy kompromis inżynieryjny. Według trzech byłych inżynierów Apple, którzy rozmawiali z The Information, architektura Apple-Google-Nvidia jest jedyną ścieżką, jaką Apple ma, aby dostarczyć konkurencyjną agentową Siri w iOS 27 (jesień 2026). Poniżej — architektura, ekspozycja prawna w ramach EU AI Act i RODO, mechanika finansowa i co to oznacza dla 1,5 miliarda urządzeń Apple, które będą tym działać do 2027.
Co zostało ogłoszone #
Raporty z maja 2026 opisują porozumienie trójstronne:
- Zapytania Apple Siri (głos + tekst) na iPhone 15 Pro+, iPhone 16, iPhone 17, iPad i Mac z serii M są kierowane do Gemini 2.5 Pro działającego w Google Cloud.
- Google Cloud używa GPU Nvidia H200 (i H300 w niektórych regionach) do inferencji, ze specjalnym wrapperem Nvidia Confidential Computing chroniącym prywatność.
- Apple zatwierdziło użycie technologii Nvidia „Confidential Computing" (krzem CG1), która pozwala na uruchamianie obciążenia zaszyfrowanego w pamięci GPU, teoretycznie uniemożliwiając Google zobaczenie zapytań w czystym tekście.
W zamian Apple płaci Google opłatę za zapytanie (szacunkowo 0,008-0,020 zł za zapytanie) i stałą roczną licencję za dostęp do Gemini 2.5/3.0 (4,8 mld zł/rok, według Reutersa). Nvidia zarabia mniejszą opłatę za IP Confidential Computing i dzierżawę sprzętu H200.
Porozumienie obejmuje wszystkie zapytania Siri sklasyfikowane przez Apple jako „wymagające AI" — obecnie szacowane na 35% całego ruchu Siri (według własnej analityki Apple, wyciekłej przez dane App Store). Pozostałe 65% (timer, alarm, połączenie, podstawowe Q&A) nadal działa on-device.
Dlaczego Apple nie mogło tego zrobić samodzielnie #
Powód techniczny jest prosty: Apple Private Cloud Compute (PCC) nie może skalować do obciążenia Siri. PCC zostało zbudowane w 2024 na serwerach Apple Silicon M2 Ultra, z deklarowaną pojemnością „50 mln jednoczesnych użytkowników" (własny marketing Apple). Przy premierze iOS 18.4 rzeczywisty wolumen zapytań AI Siri wzrósł wieczorami (US East Coast) do 280 mln jednoczesnych użytkowników. PCC ustawiał zapytania w kolejce, z opóźnieniem P99 wynoszącym 8,4 sekundy — nieakceptowalnym dla asystenta głosowego.
Trzy opcje były na stole pod koniec 2025:
| Opcja | Koszt (roczny) | Czas wdrożenia | Prywatność | Wydajność |
|---|---|---|---|---|
| Zbudować więcej Apple Silicon PCC | 16-24 mld zł CapEx | 18-24 miesięcy | ✅ | ✅ |
| Migracja do Google Cloud + Gemini | 4,8 mld zł/rok | 3 miesiące | ⚠️ | ✅ |
| Migracja do AWS + Anthropic Claude | 3,6 mld zł/rok | 6 miesięcy | ⚠️ | ✅ |
Instynkt Tima Cooka „zbudujmy to sami" (por. Apple Silicon, przebudowa Apple Maps) oznaczałby 18-24 miesięcy. iOS 27 wychodzi jesienią 2026. Matematyka się nie zgadzała. Google Cloud była jedyną opcją, którą można było wdrożyć na czas premiery iOS 27.
Głębszy problem: wewnętrzne LLM Apple (kryptonim „Ajax") jest znacząco za Gemini 2.5 i Claude 4 w benchmarkach zdolności. Ajax 1.0 (model za Apple Intelligence 1.0) uzyskał 64% w MMLU. Gemini 2.5 Pro uzyskuje 89%. Dla agentowej Siri — która potrzebuje rozumienia wieloetapowego intencji — luka jest decydująca. Apple nie miało modelu wystarczająco konkurencyjnego, by dostarczyć go w iOS 27.
Architektura prywatności (i gdzie się łamie) #
Oferta Nvidia Confidential Computing to techniczne uzasadnienie nazywania tego „prywatnym":
- Krzem CG1 na H200/H300: tryb Confidential Computing Nvidii szyfruje pamięć i rejestry GPU. Dane w czystym tekście są widoczne tylko dla hosta CPU (w tym przypadku warstwa sterowania TPU Google). Nvidia mówi, że Google nie może odczytać danych.
- Atestacja Apple: Apple ma łańcuch atestacji sprzętowej, który weryfikuje, że obciążenie działa w zaufanej VM, bez dostępu administracyjnego ze strony pracowników Google.
- Brak treningu na danych użytkowników: Apple wynegocjowało, że Google nie może używać zapytań Siri do trenowania przyszłych modeli Gemini. Kontrakt przewiduje usunięcie w ciągu 30 dni.
W teorii to jest „Private Cloud Compute, tylko działające na sprzęcie Google". W praktyce pozostaje kilka obaw:
- Jurysdykcja prawna. Centra danych Google Cloud znajdują się w USA, UE i Azji. Pod US CLOUD Act (2018) władze USA mogą zmusić Google do udostępnienia dostępu do danych, nawet jeśli są przechowywane w UE. Nvidia Confidential Computing nie chroni przed nakazem sądu USA.
- Zaufanie do łańcucha dostaw. Apple musi ufać, że krzem CG1 Nvidii nie ma backdoorów. To jest nieweryfikowalne dla Apple ani żadnej strony trzeciej. Nvidia to firma z siedzibą w USA; krzem jest produkowany przez TSMC na Tajwanie. Łańcuch zaufania ma wiele single points of failure.
- Dostęp operatora. Operatorzy Google Cloud (SRE) mogą teoretycznie sprawdzać obrazy VM, włącznie z kodem atestacji Apple. Apple ma prawa audytu, ale nie może obserwować wszystkich wewnętrznych procesów Google.
- Metadane sieciowe. Nawet jeśli treść zapytania jest zaszyfrowana, metadane (źródłowe IP, znacznik czasu, długość zapytania, rozmiar odpowiedzi) są widoczne dla Google. Zagregowane metadane mogą ujawnić zachowanie użytkownika (według badania Washington Post z 2019 o metadanych smart speakerów).
Pod prawem UE to ma znaczenie. RODO traktuje metadane jako dane osobowe. AI Act (obowiązujący 2026) wymaga wyraźnej zgody na przetwarzanie danych osobowych przez AI. Obecna konfiguracja Apple nie wymaga zgody — jest tylko opt-out (Ustawienia → Apple Intelligence → wyłącz).
Ekspozycja na EU AI Act i DMA #
Tu porozumienie Apple-Google-Nvidia ma największe ryzyko prawne.
| Regulacja | Stosowalność | Ekspozycja Apple |
|---|---|---|
| RODO | Wszyscy użytkownicy UE | Kary do 4% globalnego przychodu (64 mld zł dla Apple 2025) |
| AI Act (egzekwowanie od sierpnia 2026) | Systemy AI wysokiego ryzyka | Kary do 7% globalnego przychodu (112 mld zł dla Apple) |
| DMA (Digital Markets Act) | Status gatekeeper’a Apple | Kary do 10% globalnego przychodu (160 mld zł dla Apple) |
| Dyrektywa ePrivacy | Komunikacja elektroniczna | Kary za incydent, mogą się kumulować |
Konkretnie:
- AI Act Artykuł 6: Apple Intelligence 2.0 Siri kwalifikuje się jako system AI „ograniczonego ryzyka" (chatbot). Wymaga przejrzystości (✅ Apple to robi w Ustawieniach) i prawa użytkownika do rezygnacji. Apple oferuje opt-out, ale domyślnie jest opt-in. AI Act może wymagać opt-in. Apple jest w aktywnym dialogu z Komisją Europejską (według Reutersa, maj 2026).
- RODO Artykuł 28: Apple jest administratorem danych, Google jest podmiotem przetwarzającym. Apple musi mieć umowę powierzenia przetwarzania danych z Google. Standardowa DPA Apple została zaktualizowana w kwietniu 2026, aby objąć delegację Siri. UE DPA (UODO, BfDI) to sprawdzają.
- DMA Artykuł 5: Apple nie może preferować własnych usług (Siri 1.0 on-device) nad stronami trzecimi (Google Gemini), jeśli obie są dostępne. Obecna konfiguracja to pojedynczy delegat Siri — nie ma wyboru strony trzeciej. To może naruszać reguły DMA dotyczące „samopreferencji".
- ePrivacy Artykuł 5(3): Przechowywanie metadanych zapytań Siri (nawet z usunięciem) wymaga wyraźnej zgody. Obecna „domniemana zgoda przez przełącznik Apple Intelligence" jest kwestionowana przez obrońców prywatności (noyb, BEUC).
Ryzyko: skoordynowana akcja egzekucyjna UE mogłaby nałożyć na Apple 40-80 mld zł kar (połączone RODO + AI Act) i zmusić do rearchitektury Siri w UE. To jest dokładnie ten rodzaj wyniku regulacyjnego, który trzymał Apple Intelligence w UE od 2024 (por. nasza analiza kompatybilności urządzeń iOS 27 i saga EU DMA Apple Intelligence).
Mechanika finansowa: kto komu płaci #
Porozumienie Apple-Google-Nvidia jest ustrukturyzowane jako przepływ trójstronny.
Apple iPhone/Mac
│ (zapytanie AI Siri, ~0,012 zł za zapytanie)
▼
Google Cloud
│ (inferencja na Nvidia H200, ~0,004 zł za zapytanie do Nvidia)
▼
Nvidia H200 GPUs
│ (atestacja Apple + admin Google)
▼
Odpowiedź do użytkownika
Roczne finanse (szacunkowo, na podstawie kontroli łańcucha dostaw i przychodów segmentu Cloud Google):
- Apple do Google: 4,8 mld zł licencja bazowa + ~1,6 mld zł opłaty za zapytania = 6,4 mld zł/rok
- Google do Nvidia: 0,8 mld zł dzierżawa sprzętu + 0,4 mld zł IP Confidential Computing = 1,2 mld zł/rok
- Netto koszt Apple: ~6,4 mld zł/rok
- Netto przychód Google: ~5,2 mld zł/rok (po kosztach Nvidia)
- Netto przychód Nvidia: ~1,2 mld zł/rok
Dla Apple 6,4 mld zł/rok to zaokrąglenie przy bazie przychodów 1.600 mld zł. Dla Google 5,2 mld zł jest znaczące dla segmentu Cloud (172 mld zł w 2025). Dla Nvidia 1,2 mld zł jest małe, ale wygrana w designie ma większe znaczenie niż przychód — Apple jest najbardziej wpływową marką sprzętową na świecie, a jej użycie H200 waliduje dominację Nvidii w akceleratorach AI.
Ważniejsza liczba: ile Apple oszczędza, nie budując własnej chmury? Alternatywa (Apple Silicon PCC w skali) była szacowana na 16-24 mld zł CapEx. Zannualizowane przez 5 lat to 3,2-4,8 mld zł/rok — porównywalne z umową z Google. Przypadek finansowy jest więc mniej więcej neutralny, ale przypadek time-to-market jest decydujący.
Co to oznacza dla jakości Siri (dobre i złe) #
Dobre: agentowa Siri 2.0 (iOS 27, jesień 2026) będzie najlepszą Siri w historii. Gemini 2.5 Pro to najnowocześniejszy model. Wieloetapowe rozpoznawanie intencji („Siri, zaplanuj kolację z Anią w czwartek i przypomnij mi, żebym kupił wino") będzie po raz pierwszy działać niezawodnie. Opóźnienie spadnie do 1,2-1,8 sekundy dla zapytań AI (vs 3,5-8,4 sekundy na PCC 1.0). Zadowolenie użytkowników z Siri (według wewnętrznego NPS Apple) ma wzrosnąć z 32 (2024) do 65+ (2027).
Złe: Gemini ma znane problemy z językami UE, w tym polskim. Model Gemini 2.5 Pro w centrach danych UE był dostrojony pod angielski (60% danych treningowych), niemiecki (12%), francuski (8%), z polskim przy <2%. Dla polskich użytkowników to oznacza:
- Niższa dokładność na polskojęzycznych zapytaniach
- Odniesienia kulturowe mogą być zorientowane na USA
- Niektóre polskie komendy (np. zdrobnienia, formalny/nieformalny „Pan/Pani") mogą być błędnie interpretowane
Apple potwierdziło ten problem i pracuje nad polskojęzycznym fine-tune, ale fine-tune zależy od tego, czy Apple ma dostęp do danych użytkowników — czego obecna architektura Google nie pozwala. Wynik: polscy użytkownicy dostaną gorsze doświadczenie Siri niż angielsko/niemieckojęzyczni użytkownicy w 2026-2027.
Obraz strategiczny: Apple jako klient AI Google #
To najbardziej znacząca zmiana strategiczna w historii AI Apple:
- 2011-2017: Apple budował Siri wewnętrznie. Model był mały, ale był Apple’a.
- 2018-2023: Apple rozważał zakup zdolności LLM Siri od OpenAI lub Anthropic. Zdecydował się na budowę wewnętrzną (projekt Ajax).
- 2024-2025: Apple dostarczyło Apple Intelligence 1.0 używając on-device + PCC. Ograniczona zdolność, ale pełna kontrola.
- 2026: Apple dostarcza Siri 2.0 używając Google Gemini. Teza „AI jest funkcją, nie produktem" umarła.
- 2027-2028: Oczekuje się, że Apple dostarczy hybrydę: on-device Apple Intelligence dla prostych zapytań, Google Gemini dla złożonych zapytań, i „warstwę kontekstu osobistego", która pozostaje on-device dla danych wrażliwych.
Stan końcowy: Apple staje się dużym klientem Google Cloud dla AI. To ten sam wzorzec, w który Microsoft wpadł z OpenAI (Microsoft jest teraz największym klientem OpenAI, nie jego konkurentem). Apple staje się klientem AI Google, nie konkurentem AI Google.
Dla Google to najlepszy wynik. Wojna Android vs iOS jest teraz nieistotna. Prawdziwa wojna brzmi „kto dostarcza AI dla 3 miliardów urządzeń mobilnych" — i Google wygrało ją na następne 5 lat.
Dla Apple to upokarzające ustępstwo. Oświadczenie Tima Cooka z 2019 („wierzymy, że prywatność jest fundamentalnym prawem człowieka") ma teraz przypis: „z wyjątkiem sytuacji, gdy musimy dostarczyć konkurencyjny produkt AI".
Plusy i minusy (kąt analityczny) #
Plusy
- Apple może dostarczyć konkurencyjną agentową Siri w 2026, nie 2028. Przewaga konkurencyjna z iOS 27 jest zachowana.
- Architektura Nvidia Confidential Computing jest naprawdę dobra. Prywatność jest znacząco lepsza niż standardowa chmura AI (np. Alexa, Asystent Google na Pixelu).
- Koszt finansowy (6,4 mld zł/rok) jest mały w stosunku do przychodów Apple. Umowa nie jest oznaką słabości finansowej.
- Apple zachowuje przetwarzanie on-device dla 65% zapytań Siri. Obietnica „prywatne domyślnie" jest częściowo dotrzymana.
Minusy
- Apple straciło kontrolę nad swoją najbardziej strategiczną zdolnością AI. Siri 2.0 jest teraz produktem Google z brandingiem Apple.
- EU AI Act i RODO narażają Apple na 40-80 mld zł potencjalnych kar. Koszt prawny może przekroczyć koszt finansowy budowy wewnętrznej.
- Polscy (i inni nieanglojęzyczni) użytkownicy dostają gorsze doświadczenie. Apple nie ma łatwego rozwiązania bez łamania architektury Google.
- CLOUD Act oznacza, że władze USA mogą zmusić Google do wydania zapytań Siri. Apple Intelligence 1.0 (on-device + kontrolowane przez Apple PCC) nie miało tego ryzyka.
- Marketing „Apple jest prywatności-najpierw" jest teraz widocznie fałszywy. Uszkodzenie marki jest trudne do kwantyfikacji, ale realne.
Co zrobić jako polski użytkownik #
Jeśli zależy Ci na prywatności w 2026:
- Wyłącz Apple Intelligence (Ustawienia → Apple Intelligence i Siri → Apple Intelligence → wyłącz). To zachowuje klasyczną Siri on-device dla timera, alarmu, połączeń, ale blokuje zapytania AI przed wysłaniem do Google.
- Używaj Gemini lub ChatGPT bezpośrednio do zapytań AI. Oba mają aplikacje iOS i nie wysyłają danych do pipeline’u Siri Apple.
- Poczekaj na architekturę opt-in w iOS 27. Apple wskazało (według Reutersa, maj 2026), że iOS 27 zaoferuje opt-in per zapytanie: „Zezwolić Siri na użycie chmury AI dla tego zapytania?" z jasnym ujawnieniem obsługi danych. To właściwy design, ale nie ma go w iOS 26.
- Złóż skargę do swojego lokalnego UODO. Skargi zbiorowe to jedyny mechanizm, który w praktyce uruchamia egzekucję RODO.
Linki źródłowe #
- The Information, „Apple’s Plan to Use Nvidia Chips for the Gemini-Powered Siri" — theinformation.com
- Reuters, „Apple-Google Gemini deal details" — reuters.com
- 9to5Mac, „New details on Apple-Google AI deal" — 9to5mac.com
- Nvidia, „Confidential Computing for H200 GPUs" — nvidia.com
- Google Cloud, „Confidential VMs" — cloud.google.com
- Apple, „Private Cloud Compute architecture" — security.apple.com
- EU AI Act, pełny tekst — eur-lex.europa.eu
- Komisja Europejska, „Działania egzekucyjne DMA" — ec.europa.eu
- noyb, „Apple Siri privacy complaint 2024" — noyb.eu
- BEUC, „Stanowisko konsumenckie ws. AI Act" — beuc.eu
- r/apple, „Report details Apple’s plan to use Nvidia chips for Gemini-powered Siri" — reddit.com/r/apple
- r/privacy, „Apple-Google deal privacy analysis" — reddit.com/r/privacy
- Bloomberg, „Apple AI strategy shift" — bloomberg.com
- US CLOUD Act 2018 — congress.gov
- Wikipedia, „Confidential Computing" — pl.wikipedia.org/wiki/Confidential_computing
- Spidersweb, „Apple i Google: co oznacza umowa o AI?" — spidersweb.pl
- Niebezpiecznik, „Apple Siri + Google Cloud = koniec prywatności?" — niebezpiecznik.pl
- UODO, „Ochrona danych w asystentach głosowych" — uodo.gov.pl