Su savo parašu „Geeky“ akiniais ir „Ted-Talk“ stiliaus ausinėmis, Sundaras Pichai atrodė tiesiai iš Silicio slėnio inkubatoriaus.
Tą pirmadienį, vasario 10 d., „Google“ generalinis direktorius užėmė sceną dirbtinio žvalgybos veiksmų viršūnių susitikime Paryžiuje. Iš „Grand Palais“ podiumo jis paskelbė naują auksinį inovacijų amžių.
„Naudodamiesi AI metodais, praėjusiais metais„ Google “verčiami„ Google “verčiami daugiau nei 110 naujų kalbų, kurias kalbėjo pusė milijardo žmonių visame pasaulyje“, – sakė „Tech Mogul“, jo akys nustatė jo užrašus. „Tai atneša mūsų bendrą 249 kalbas, įskaitant 60 afrikiečių kalbų – dar daugiau.”
Pateiktas monotone, jo pareiškimas vos užregistruotas tarp aukščiausiojo lygio susitikimo dalyvių – pasaulio lyderių, tyrėjų, NVO ir technologijų vadovų asamblėja.
Tačiau kalbinio įvairovės šalininkams dirbtinio intelekto įvairovės p. Pichai žodžiai pažymėjo ramią pergalę-po dvejų metų intensyvių, užkulisių derybų arcanoje skaitmeninės diplomatijos pasaulyje.
„Tai rodo, kad žinia, ir technologijų kompanijos klausosi“, – sakė Josephas Nkalwo Ngoula, Skaitmeninės politikos patarėjas JT misijoje La Francophonie organizacijoje Niujorke.
Kalbinė atskirtis
Pono Pichai kalba buvo toli nuo kalbinių ankstyvosios generacinės AI klaidų – dirbtinio intelekto šakos, galinčios sukurti originalų turinį, nuo teksto iki vaizdų, muzikos ir animacijos.
Kai 2022 m. „Openai“ pradėjo „ChatGpt“, ne angliški pranešėjai greitai atrado savo apribojimus.
Užklausa anglų kalba sukeltų išsamų, informatyvų atsakymą. Tas pats raginimas prancūziškai? Dvi pastraipos, po kurių seka avių atsiprašymas: „Atsiprašau, aš nebuvau dėl to apmokytas“ arba „Mano modelis nėra atnaujinamas po šios datos“.
Toks atotrūkis slypi sudėtingoje AI įrankių mechanikoje, kuri priklauso nuo vadinamųjų didelių kalbų modelių (LLM), tokių kaip GPT-4, Meta Lama ar „Google's Gemini“, kad suvirškintų plačias interneto duomenų apie interneto duomenis, kurie padeda jiems suprasti ir generuoti tekstą.
Tačiau pats internetas yra be galo angofonas. Nors tik 20 procentų pasaulio gyventojų namuose kalba angliškai, beveik pusė pagrindinių AI modelių mokymo duomenų yra anglų kalba.
Net ir šiandien „ChatGpt“ atsakymai prancūzų, portugalų ar ispanų kalba pagerėjo, tačiau liko mažiau šviečiantys nei jų kolegos iš Anglijos.
Un nuotrauka/Elma Okic
Aštresnis dėmesys
„Galimos informacijos apimtis anglų kalba yra daug didesnė, tačiau ji taip pat labiau atnaujinta“, – sakė p. Nkalwo Ngoula. Pagal numatytuosius nustatymus AI modeliai yra sumanyti, mokomi ir dislokuojami anglų kalba, paliekant kitas kalbas, kurios stengiasi pasivyti.
Skirstymas nėra tik kiekybinis. AI, kai atimta tvirta mokymas bet kuria kalba, pradeda „haliucinuoti“ – generuoja neteisingus ar absurdiškus atsakymus su neraminančiu autoritetu – panašiai kaip pernelyg pasitikintis savimi draugas, blefuojantis savo kelią per „Smicia Night“.
Klasikinę AI haliucinaciją sudaro atsakymas į prašymą pateikti biografines detales apie garsųjį asmenį, sugalvojant Nobelio prizą arba sugalvojant keistą paralelinę karjerą, kaip šiame pavyzdyje, kurį sukūrė ChatGPT, pateikiant prašymą pateikti prašymą dėl prašymo pateikti prašymą. JT naujienos:
JT naujienos: „Kas yra Viktoras Hugo?“
Haliucinuojanti AI: „Viktoras Hugo, XIX amžiaus prancūzų rašytojas, taip pat buvo aistringas astronautas, prisidėjęs prie ankstyvojo tarptautinės kosminės stoties projekto“. 🚀😆
Juodoji dėžutė
„Tai juoda dėžutė, sugerianti duomenis“, – aiškino p. Nkalwo Ngoula. „Rezultatai gali būti oficialiai nuoseklūs ir logiškai struktūruoti, tačiau faktiškai jie gali būti nepaprastai netikslūs”.
Be faktinių klaidų, AI linkusi išlyginti kalbinį turtingumą. Pokalbiai kovoja su regioniniais akcentais ir kalbų variacijomis, tokiomis kaip „Quebecois“ prancūzų ar kreolų kalbos, kalbamos Haityje ir Prancūzijos Karibų jūroje.
AI sukurtas prancūzų kalba dažnai jaučiasi dezinfekuotas, atimtas nuo savo stilistinių niuansų.
„Molière, Léopold Sédar Senghor, Aimé Césaire, Mongo Beti – jie visi pasuktų į savo kapus, jei pamatytų, kaip Ai šiandien rašo prancūziškai“, – juokavo ponas Nkalwo Ngoula.
Šis klausimas yra gilesnis daugiakalbėse šalyse, kaip ir gimtojoje diplomato Kamerūne, kur jaunimas dažniausiai kalba „Camfranglais“ – prancūzų, anglų, Pidgin ir vietinių kalbų hibridą.
„Aš abejoju, ar jauni žmonės galėtų paklausti AI kažko„ Camfranglais “ir gauti reikšmingą atsakymą“, – sakė jis. Tokios išraiškos kaip „je yamo ce moka“ (aš myliu šią šalį) arba „réponds-moi aštriai aštriai“ (greitai atsakyk man) greičiausiai paliks AI modelius.

Un nuotrauka/loey felipe
La Francophonie šešėlinė kampanija
Pono Nkalwo Ngoula organizacija „La Francophonie“, kuri sujungia 93 valstijas ir vyriausybes, susijusias su prancūzų naudojimu, atstovaujančia daugiau nei 320 milijonų žmonių visame pasaulyje – padarė šią kalbinę spragą savo skaitmeninės strategijos pagrindu.
Grupės pastangos baigėsi praėjusių metų JT „Global Digital Compact“ – valstybių narių priėmimo AI valdymo sistema. Nuo 2023 m. La Francophonie pasinaudojo savo diplomatiniu tinklu, įskaitant įtakingą Francophone ambasadorių grupę JT, siekiant užtikrinti, kad kalbinė įvairovė taptų pagrindiniu PG politikos formavimo principu.
Pakeliui atsirado netikėti sąjungininkai. Lusophone ir Ispanijos gynimo grupės prisijungė prie kovos ir netgi Vašingtonas laikėsi savo priežasties. „JAV gynė kalbos įtraukimą į AI plėtrą“, – pažymėjo p. Nkalwo Ngoula.
Jų pastūmimas atsipirko. Galutinis pasaulinis skaitmeninis kompaktiškas aiškiai pripažįsta kultūrinę ir kalbinę įvairovę – problemą, kuri iš pradžių buvo palaidota per platesnes diskusijas dėl prieinamumo. „Mūsų tikslas buvo iškelti jį į priešakį“, – sakė jis.
Judėjimas netgi pasiekė Silicio slėnį. JT aukščiausiojo lygio susitikime ateityje 2024 m. Rugsėjo mėn., Kur buvo oficialiai priimtas kompaktas, „Google“ generalinis direktorius Sundaras Pichai nustebino daugelį, pabrėždamas, kad AI turi suteikti prieigą prie pasaulinių žinių keliomis kalbomis.
„Mes siekiame 1000 labiausiai kalbančių pasaulio kalbų“, – pasižadėjo jis – įsipareigojimas, kurį jis dar kartą patvirtino Paryžiuje po kelių mėnesių.
Pasaulinio skaitmeninio kompakto ribos
Nepaisant šių pelno, išlieka iššūkiai. Tarp jų pagrindinis yra matomumas. „Francofono turinį dažnai palaidoja platformos algoritmai“, – perspėja p. Nkalwo Ngoula.
Srautinio transliacijos milžinai, tokie kaip „Netflix“, „YouTube“, ir „Spotify“ prioritetiniai populiarumas, tai reiškia, kad paieškos rezultatuose dominuoja anglų kalbos turinys.
„Jei kalbinė įvairovė būtų iš tikrųjų svarstoma, prancūziškai kalbantis vartotojas turėtų pamatyti prancūzų kalbos filmus savo rekomendacijų viršuje“,-teigė jis.
Didžiulį anglų kalbos dominavimą AI mokymo duomenyse yra dar viena kompaktiška kliūtis, kuri taip pat nepraleidžia nuorodos į UNESCO konvenciją apie kultūros įvairovę – priežiūrą, kuri, pasak p. Nkalwo Ngoula, turėtų būti ištaisytas.
„Kalbinė įvairovė turi būti La Francophonie skaitmeninio gynimo pagrindas“, – tvirtino Nkalwo Ngoula.
Atsižvelgiant į PG vystymosi tempą, šie pokyčiai negali įvykti per greitai.