Key takeaways
- Nye teknologier kan føre til computere, der bedre forstår menneskelig tale.
- Microsoft og NVIDIA annoncerede for nylig en ny AI-drevet metode til at fortolke sprog.
- Quantum computing kan være en anden måde at fremme sprogbehandlingsområdet på.
Der er masser af smarte gadgets at give kommandoer til i disse dage, men vi er stadig langt væk fra computere, der forstår samtaletale.
Microsoft og NVIDIA annoncerede for nylig en ny AI-drevet metode til at fortolke tale, der kan ændre den måde, vi chatter med vores elektronik. Det er en del af en voksende bevægelse, der ændrer, hvordan computere forstår tale, også kaldet Natural Language Processing (NLP).
"Modellerne, der driver NLP, bliver større og mere avancerede og kommer tættere på menneskelig forståelse," sagde AI-ekspert Hamish Ogilvy til Lifewire i et e-mailinterview.
"Et af de store fremskridt er, at NLP går ud over simple søgeord. Du er måske i dag vant til at skrive eller tale et eller to søgeord for at få søgeresultater, men nyere modeller til behandling af naturligt sprog bruger kontekst til at give rigere resultater."
Chatbots
NVIDIA og Microsoft er gået sammen om at skabe Megatron-Turing Natural Language Generation-modellen (MTNLG), som duoen hævder er den "mest kraftfulde monolitiske transformatorsprogmodel, der er trænet til dato." AI-modellen kører på supercomputere.
Men forskere fandt ud af, at MTNLG-modellen opfangede menneskelige skævheder, da den finkæmmede bjerge af menneskelige taleprøver.
"Mens gigantiske sprogmodeller fremmer det nyeste inden for sproggenerering, lider de også af problemer som bias og toksicitet," skrev forskerne i et blogindlæg. "Vores observationer med MT-NLG er, at modellen opfanger stereotyper og skævheder fra de data, den er trænet på."
Computere, der bedre forstår tale, vil ikke bare forbedre smarte højttalere som Alexa, hævder Ogilvy. Tekstbaserede søgewebsteder som Amazon vil også bedre forstå forespørgsler, der er indtastet.
"Google har haft det åbenlyse forspring her, men NLP-teknologien vil være over alt," sagde Ogilvy. "Til tekst- og stemmebaserede søgninger kan brugere være mere beskrivende, fordi NLP forstår mere end blot teksten; den forstår konteksten af det, du leder efter, for at give bedre resultater."
Quantum Chats?
Quantum computing kan være en måde at fremme NLP-området på. Onsdag annoncerede virksomheden Cambridge Quantum lambeq, som den hævder er det første kvanteværktøjssæt til NLP.
…NLP forstår mere end blot teksten; den forstår konteksten af det, du leder efter for at give bedre resultater.
Virksomheden siger, at værktøjet tillader oversættelse af sætninger til naturlige sprog ved hjælp af kvantekredsløb, der køres på kvantecomputere. Kvanteberegning er en form for beregning, der bruger de usædvanlige egenskaber ved kvantetilstande, såsom superposition, interferens og sammenfiltring, til at udføre beregninger.
"Måden kvantecomputere håndterer NLP på er meget forskellig fra klassiske maskiner. Faktisk er NLP 'kvante-native'," fort alte Bob Coecke, chefforsker ved Cambridge Quantum, til Lifewire i et e-mailinterview. "Dette skyldes en opdagelse, vi gjorde for nogle år siden, at grammatikken, der styrer sætninger og betydning, har en meget lignende struktur som den matematik, der bruges til at programmere kvantecomputere."
Coecke sagde, at kvante-NLP kunne føre til bedre stemmeassistenter og oversættelsesværktøjer.
En anden lovende tilgang til at forbedre talegenkendelse, kaldet Zac Liu, en dataforsker hos virksomheden Hypergiant, fort alte Lifewire i et e-mailinterview. "Kort sagt, når dataforskere forbedrer NLP-dataene, garanterer det næsten, at de vil have en bedre NLP-model og bedre NLP-kapacitet."
Det næste trin er at integrere computervisionsmodeller med NLP, såsom at træne en AI-model til at se videoer og producere et tekstresumé af den video, sagde Liu.
"Anvendelsen af dette fremskridt kan være ubegrænset, lige fra sundhedspleje, læsning af radiologiske film og tilvejebringelse af foreløbig diagnose, til design af hjem, tøj, smykker eller lignende ting," tilføjede han. "Kunden kunne forklare kravene mundtligt eller skriftligt, og denne beskrivelse kan automatisk konverteres til billeder eller videoer for bedre visualisering."