Hvordan AI hjælper med at tyde gamle inskriptioner

Indholdsfortegnelse:

Hvordan AI hjælper med at tyde gamle inskriptioner
Hvordan AI hjælper med at tyde gamle inskriptioner
Anonim

Key takeaways

  • Et nyt AI-drevet værktøj kunne hjælpe historikere med at tyde gamle tekster.
  • Ithaca er det første dybe neurale netværk, der kan gendanne den manglende tekst af beskadigede inskriptioner, identificere deres oprindelige placering og hjælpe med at fastslå datoen, de blev oprettet.
  • AI er nyttig til at udfylde manglende data såsom placering og dato for tekst, fordi den er god til at lære meget komplekse mønstre ved at analysere data.
Image
Image

Seneste fremskridt inden for kunstig intelligens (AI) styrker bestræbelserne på at forstå fortiden.

Ithaca, en maskinlæringsmodel bygget af AI-forskere ved DeepMind, kan gætte manglende ord og placeringen og datoen for skriftsproget, ifølge en ny artikel. Indsatsen kunne hjælpe historikere med at tyde gamle manuskripter.

"Ithaca er et dybt neur alt netværk, og som sådan er det utroligt i stand til at finde skjulte mønstre i enorme mængder data," sagde historiker Thea Sommerschield, medforfatter af det nylige papir, til Lifewire i en e-mail. interview. Sådanne mønstre kunne være tekstuelle (grammatiske, syntaktiske eller knyttet til en gentagen 'formel' på tværs af mange tekster) eller kontekstuelle (visse ord optræder konsekvent i visse genrer af tekster: f.eks. et politisk dekret fra det klassiske Athen, der nævner ordene 'alliance,' råd, forsamling…')."

Revealing the Past

Ithaca er det første dybe neurale netværk, der kan gendanne den manglende tekst af beskadigede inskriptioner, identificere deres oprindelige placering og hjælpe med at fastslå datoen, de blev oprettet, sagde Sommerschield.

Ithaca er opkaldt efter den græske ø i Homers Odyssey. Forskerne fandt ud af, at Ithaca opnår 62 % nøjagtighed ved gendannelse af beskadigede tekster, 71 % nøjagtighed ved identifikation af deres oprindelige placering og kan datere tekster til inden for 30 år efter deres oprindelsesdato.

Ithacas visualiseringshjælpemidler er beregnet til at gøre det lettere for forskere at fortolke resultater. Avisens forfattere skrev, at historikere opnåede 25% nøjagtighed, når de arbejdede alene med at gendanne gamle tekster. Men historikerens ydeevne stiger til 72 % ved brug af Ithaca, hvilket overgår modellens ydeevne og viser potentialet for menneske-maskine-samarbejde.

“Ithaca tilbyder fortolkbare output, der viser den stigende betydning af samarbejde mellem menneskelige eksperter og maskinlæring og viser, hvordan matchning af menneskelige eksperter med deep learning-arkitekturer for at tackle opgaver i samarbejde kan overgå den individuelle (uhjulpet) præstation for både mennesker og model på de samme opgaver,” fort alte Sommerschild til Lifewire.

For eksempel er historikere i øjeblikket uenige om datoen for en række vigtige athenske dekreter, der blev udstedt på et tidspunkt, hvor bemærkelsesværdige personer som Sokrates og Perikles levede, skrev Sommerschield i et blogindlæg. Dekreterne har længe været antaget at være skrevet før 446/445 f.v.t., selvom nye beviser tyder på en dato fra 420'erne fvt. "Selvom det kan virke som en lille forskel, er disse dekreter fundamentale for vores forståelse af det klassiske Athens politiske historie," skrev hun

Det nærmeste arbejde på Ithaca er et tidligere maskinlæringsværktøj kaldet Pythia, som Sommerschield og hendes samarbejdspartnere udgav i 2019. Pythia var den første antikke tekstgendannelsesmodel, der brugte dybe neurale netværk.

"I dag er Ithaca den første model til at tackle de tre centrale opgaver i epigrafens arbejdsgang holistisk," sagde Sommerschield i en e-mail. "Ikke kun fremmer det det tidligere state-of-the-art-sæt af Pythia, men det bruger også deep learning til geografisk og kronologisk tilskrivning for allerførste gang og i et hidtil uset omfang."

AI til at hjælpe historikere

Image
Image

AI er nyttig til at udfylde manglende data som placering og dato for tekst, fordi den er god til at lære meget komplekse mønstre ved at analysere data, fort alte Brad Quinton, administrerende direktør for AI-virksomheden Singulos Research, til Lifewire via e-mail.

"Ved at bruge maskinlæringsteknikker kan AI se gennem et stort antal "kendte gode" eksempler for at finde mønstre mellem for eksempel en given tekst og dens oprettelsesdato og -sted," tilføjede Quinton. "Ofte er disse mønstre så komplekse, at de ikke ville være indlysende for en menneskelig ekspert."

Forudsigelse af manglende data er en almindelig opgave for maskinlæringsbaseret AI. For eksempel kan GPT-3 fra OpenAI forudsige manglende ord i en sætning eller endda manglende sætninger i et afsnit. Og mange AI-baserede billedbehandlingssystemer er blevet brugt til at gendanne video og billeder ved intelligent at forudsige, hvad der er gået tabt fra originalen.

“Begrebsmæssigt kunne forskere bruge lignende teknikker til at bestemme datoen og oprindelsen af kunst eller værktøjer eller andre historiske menneskeskabte artefakter, hvor der er en forventning om ændring i den underliggende stil og teknik over tid og efter placering af oprindelse, sagde Quinton.

Anbefalede: