AI-avatarien murroksellinen ratkaisu – digitaaliset ihmiset käyttövalmiina

Thomas Nørmark on kehittänyt avatarien ominaisuuksia jo useiden vuosien ajan. Digitaalisten ihmisten seuraava sukupolvi on nyt tulossa markkinoille: ne toimivat aiempaa paremmin, näyttävät entistä inhimillisemmiltä ja luovat vakuuttavamman vaikutelman persoonallisuudesta kuin ennen. Kehitystä vauhdittavat kaksi teknistä murrosta käyttöliittymässä ja taustajärjestelmissä: metahumans ja AI-agentit. Molempien odotetaan uudistavan tekoälysegmenttiä merkittävästi tulevina vuosina.

NTT DATA Business Solutions | 31 lokakuun, 2024 | 5 min
Metahumans are the highest level of digital avatar development.
The digital avatar 'Pearl' at the 2023 FIBA Basketball World Cup.

Avatarimme ”Pearl” vuoden 2023 FIBA Basketball World Cup -turnauksessa.

GenAI-läpimurto Pearl-AI-avatarin taustalla

Kun vuoden 2023 alussa kävi vähitellen ilmi, että OpenAI:n generatiivinen tekoäly (GenAI) oli saavuttanut merkittävän läpimurron, reaktiot olivat hämmästyneitä: järjestelmät pystyivät yhtäkkiä kommunikoimaan ihmisten kanssa luonnollisella kielellä. Samalla hahmottui, kuinka laajoja muutoksia oli edessä niin taloudessa, yhteiskunnassa kuin yksilöiden arjessa. Vastaava murros koettiin aikanaan World Wide Webin myötä: syksyllä 1993 maailmassa oli vain 500 verkkopalvelinta, ja nyt, 30 vuotta myöhemmin, GenAI on seuraava merkittävä kehitysaskel. Thomas Nørmarkille tämä seuraava kehitysaskel on nimeltään Pearl – nuori naispuolinen avatar, joka tarjosi runsaasti hyödyllistä tietoa FIBA Basketball World Cup -turnauksen kävijöille. Tieto koski turnausta Filippiineillä, joukkueita ja tilastoja, tapahtumapaikkoja sekä lähialueen ravintoloita ja nähtävyyksiä. Etsitkö japanilaista ravintolaa urheilukeskuksen läheltä? Pearl rajaa vaihtoehtoja keskustelussa, esittelee vaihtoehtoja ja tuottaa viivakoodin, joka ohjaa esimerkiksi Ninyo Fusion Cuisine -ravintolaan Quezon Cityssä Manilassa (Google-arvosana 4,7).

Avatarista metahumaniksi

Pearl on metahuman, joka edustaa kehityksen nykyistä huippua vuosia sitten alkaneessa etenemisessä, joka käynnistyi varsin yksinkertaisista sovelluksista. ”Tuolloin hyödynsimme muun muassa droonia ja tekoälytukea myrkyllisen jättiputken saastuttamien alueiden kartoittamiseen Tanskassa”, muistelee Nørmark, joka toimii nykyisin NTT DATA Business Solutionsin Global Head of Innovation -roolissa. Tämän jälkeen kehitettiin useita ratkaisuja, kuten FarmBot-robottipuutarhajärjestelmä, viestintätekoälyjä lastensuojelujärjestölle ja muistisairaille, etäkoulun tukiratkaisu koronapandemian aikana sekä teollisuuden AI-nenä.

“Tervetuloa, kuinka voin auttaa?”

Näiden ratkaisujen rinnalla Thomas Nørmarkin tiimi jatkoi innovaatioyksikön lippulaivakonseptin, digitaalisen ihmisen, kehittämistä. Tätä avataria on käytetty lukuisissa versioissa aina tanskalaisen autoliikkeen vastaanotosta (”Kia Mia”) viranomaisiin ja työpaikkaruokaloihin (”Aiko”) sekä Tour de Francen etappien digitaalisena oppaana (”Marianne”). Tavoitteena on aina ollut toivottaa ihmiset henkilökohtaisesti tervetulleiksi ja tarjota heille heidän tarvitsemansa tiedot. Usean vuoden ajan avatarit on varustettu myös GPT-kielimallilla. ”Tällä hetkellä yli 20 tällaista avataria on käytössä maailmanlaajuisesti”, Nørmark kertoo. Pearl, joka toimi Basketball World Cup -turnauksessa, kuuluu digitaalisten ihmisten seuraavaan sukupolveen, jonka ulkonäkö poikkeaa merkittävästi aiemmista versioista. ”Olemme jo yli vuoden ajan pystyneet kehittämään korkean tarkkuuden avatareja huomattavasti nopeammin ja selvästi pienemmillä kustannuksilla”, Nørmark sanoo. Aiemmin tarvittiin käynti valokuvastudiossa, mutta nykyään älypuhelinta voidaan käyttää 3D-skannerina. ”Näin loimme muun muassa avatarin konsernimme toimitusjohtajasta Kaz Nishihatasta.” Skannaus asetetaan eräänlaisena verkkorakenteena valmiiden hahmopohjien päälle, ja digitaalinen ihminen on valmis.

Metahumaneille suunnattu alusta

Mahdollistajana toimi 3D-työkalu Unreal Engine, yksi johtavista videopelialustoista. Sen kehittäjä loi MetaHuman-kehyksen, jonka avulla yksityishenkilöt ja yritykset voivat luoda omia avatarejaan. ”Se oli todellinen murros”, Nørmark muistelee, ”ja meille optimaalinen ratkaisu, koska voimme hyödyntää kaiken yhdellä alustalla käyttövalmiina.” Visuaalisesti lähes kaikki on mahdollista: tarvitaan vain käsitys halutusta ulkonäöstä, sopivat kuvat ja hienosäätöä, jotta Pearl voidaan muuntaa sisarekseen Edoksi – myös metahumaniksi, mutta hyvin erilaiseksi kuin Pearl. Edo työskentelee työllisyyspalvelussa ja hänen ilmeensä on ammattimainen, ei urheilullinen. Nørmark toteaa: ”Hiustyyli, ihonväri, kasvonpiirteet tai pisamat – ulkoista olemusta voidaan muokata nopeasti ja tehokkaasti käyttötarkoituksen mukaan.”

Olemme nyt erittäin hyvässä asemassa ohjaamaan tekoälyn kehitystä ja kilpailua etulinjassa.

Thomas Nørmark Global Head of Innovation

Älykkäät AI-agentit

Avatarien älykkyys perustuu AI-agenttien konseptiin, jota Nørmark pitää parhaana strategiana optimaalisen lopputuloksen saavuttamiseksi. AI-agentit voivat suorittaa tehtäviä itsenäisesti, käsitellä dataa, tehdä päätöksiä, oppia tuloksista, mukautua ja olla vuorovaikutuksessa ympäristönsä kanssa ilman ennalta ohjelmoituja sääntöjä. Agentti valitsee tarvittavat resurssit kontekstin ja käyttäjän vaatimusten perusteella, Nørmark kertoo. ”Se tietää, mitkä työkalut soveltuvat parhaiten tehtävän ratkaisemiseen.” Esimerkiksi hotellin ja rautatieaseman välisen etäisyyden laskemiseen tarvitaan sijaintityökalu, kuten Google API. Tulos esitetään suuren kielimallin (LLM), kuten ChatGPT-4o:n, avulla. Jos tarvitaan lisätietoja esimerkiksi vastuullisuudesta tai lemmikkejä koskevista ohjeista, AI-agentti muodostaa SQL-komennon hotellin tietokannan hakemiseen. ”Myös näillä osa-alueilla koettiin murros vuonna 2023.”

Tutkimuksesta toteutukseen

Kehityksen edetessä myös NTT DATA Business Solutionsin innovaatioyksikkö on muuttunut merkittävästi, Nørmark kertoo. ”Siirrymme teknisesti painottuneesta tutkimus- ja kehitystyöstä skaalaukseen ja avatarien laajamittaiseen käyttöönottoon.” Tämä edellyttää laajaa ja ammattimaista tuotetiimiä sekä globaalia toimituskykyä – Euroopassa, Filippiineillä ja Japanissa sekä tulevaisuudessa myös Yhdysvalloissa. Yksi syy on Nørmarkin mukaan se, että GenAI-vallankumous on tehnyt asiakkaista huomattavasti avoimempia avatareille ja teknologialle yleisesti. Kysyntä niiden integroimiseksi verkkosivustoille kasvaa, ”sillä AI-avatarit ovat huomattavasti parempia kuin häiritsevät chat-botit”.

Tekoälymarkkina kehittyy nopeasti

Pearl on sittemmin siirtynyt uuteen tehtäväänsä New Zealand Campus of Innovation and Sport -organisaatioon. ”Olemme nyt erittäin hyvässä asemassa vaikuttamaan tekoälyn kehitykseen ja kilpailuun etulinjassa”, Nørmark sanoo. Hänen mukaansa NTT DATA Business Solutionsilla on yhdistynyt neljä keskeistä tekijää: varhainen liikkeellelähtö, taloudelliset resurssit, tekninen osaaminen ja globaali kyvykkyys toteuttaa projekteja nopeasti ja tehokkaasti. Metahuman-ydintiimin lisäksi Tanskassa toimii laajennettu toimitustiimi sekä osaamiskeskukset Manilassa ja Tokiossa, ja lisäksi useita asiantuntijoita tukemassa maailmanlaajuisesti – yhteensä noin 50 tekoälyasiantuntijaa. Tavoitetta ei ole vielä saavutettu, sillä jokainen uusi teknologia tuo mukanaan uusia haasteita. Nørmark ei kuitenkaan epäile, etteivätkö metahumanit olisi tulevaisuuden ihmisen ja koneen vuorovaikutuksen keskiössä. Hän työskentelee jo seuraavan sukupolven ominaisuuksien parissa: ”Kuvittele, että ihminen heijastuu avatarin silmiin reaaliaikaisesti – näin voidaan luoda syvä emotionaalinen yhteys.” Se on vaativa haaste, joka edellyttää merkittävää laskentatehoa, Nørmark myöntää. ”Teknologisen kehityksen myötä meidän pitäisi kuitenkin pystyä toteuttamaan se muutaman vuoden kuluessa.”

Tutustu digitaalisten ihmisten PARSONII-alustaan

Background image Annual Report ePaper

Vuosikertomus 2023/2024

Tutustu taloudelliseen tulokseemme ja keskeisiin kehityssuuntiin, jotka muovaavat NTT DATA Business Solutionsin toimintaa. Saat kokonaiskuvan menestyksestämme ja tulevaisuuden strategioistamme.

Tutustu raporttiin

Lisää innovaatioon liittyviä blogiartikkeleita