Sådan fungerer Googles Hum to Search-funktion

Indholdsfortegnelse:

Sådan fungerer Googles Hum to Search-funktion
Sådan fungerer Googles Hum to Search-funktion
Anonim

Key takeaways

  • Google har lanceret et nyt værktøj, der giver brugerne mulighed for at søge efter sange ved at nynne, synge eller fløjte.
  • Det nye værktøj bruger maskinlæring til at matche et nynnet nummer med en database med mere end en halv million sange, der løbende opdateres.
  • Google-brugere spørger, hvilken sang der afspilles næsten 100 gange hver måned.
Image
Image

Google har lanceret en ny funktion kaldet "Hum to Search" for at løse et frustrerende problem: at have en sang fast i dit hoved og ikke være i stand til at finde ud af, hvad den hedder.

Idéen med at nynne for at finde en sang virker utrolig enkel, så hvorfor lancerer Google først denne funktion i 2020? Nå, det viser sig, at det faktisk er ret kompliceret at identificere sange på denne måde, til dels fordi vores nynnede versioner plejer at være ret forskellige fra det originale nummer. I et nyligt indlæg på sin AI-blog forklarer Google, hvordan det brugte maskinlæring til at løse dette problem og i sidste ende hjælpe folk med at finde en sang ved at nynne, fløjte eller synge melodien, selv når deres gengivelse er mindre end nøjagtig.

"Vores fokus for Hum to Search er på at hjælpe folk med at identificere og finde musik, der sidder fast i deres hoved," fort alte en Google-talsmand til Lifewire i en e-mail.

Begynd bare at nynne

Google-brugere spørger, hvilken sang der afspilles næsten 100 millioner gange hver måned, sagde Aparna Chennapragada, Googles vicepræsident og general manager for forbrugershopping, en video, der introducerer flere nye søgefunktioner. Nu er der en måde at finde ud af det.

Funktionen "Hum to Search" er indbygget i Googles mobilapp, Google Search-widget og Google Assistant. For at få adgang til den via appen skal du trykke på mikrofonikonet og sige "Hvad er denne sang?" At vælge knappen "Søg en sang" fungerer også.

For at fungere korrekt kræver funktionen, at du nynner i mindst 10-15 sekunder. Android-brugere kan nynne for at finde sange på mere end 20 sprog, mens kun engelske sange fungerer på iPhones. Værktøjet er ikke altid i stand til at identificere en sang med det samme, men når det først gør det, er resultaterne ret gode.

"Mere end halvdelen af sangene med et bredt sæt variabler (tone, tonehøjde, lydstyrke osv.) genkendes af vores algoritmer, men nøjagtigheden afhænger selvfølgelig af kvaliteten af brummen, typen sangen og mere," fort alte Google-talsmanden til Lifewire i en e-mail. "Men når først det er genkendt, er cirka fire ud af fem svar rigtige."

Det er dog ikke første gang, at nynning er blevet brugt i en musikidentifikationsapp. SoundHound tilbyder en lignende funktion, som bemærket af CNN Business, og er også tilgængelig på Android og iOS. Ifølge Googles talsmand rejser den nye funktion ingen bekymringer om privatlivets fred, og den "ændrer heller ikke den måde, Google håndterer lydbaserede interaktioner på", fort alte de Lifewire i en e-mail.

Machine Learning

På trods af konceptets enkelhed er det teknisk set ret svært at nynne en melodi for at finde studieoptagelsen. Det er der flere grunde til, forklarer Google Researchs Christian Frank i et blogindlæg den 12. november. Først og fremmest kan en nynnet version af sangen adskille sig meget fra selve indspilningen, hvilket gør det svært at matche de to. Så selvom Shazam og et væld af andre apps allerede findes til at identificere den sang, du hører på en restaurant eller et andet offentligt sted, kan det være vanskeligere at bruge en nynnet melodi som grundlag for den søgning.

"Med tekster, baggrundsvokal og instrumenter kan lyden af en musical- eller studieoptagelse være helt anderledes end en nynnet melodi," skriver Frank."Ved fejltagelse eller design, når nogen nynner deres fortolkning af en sang, kan tonehøjden, tonearten, tempoet eller rytmen ofte variere lidt eller endda betydeligt."

Image
Image

Fordi de nynnede versioner af sange kan være så forskellige fra originalerne, bemærker Frank, at mange tidligere metoder har krævet at matche en persons nynnen med en version af sangen, der kun har en melodi, eller et nummer, der inkluderer nynnen. Dette har gjort brugssager i den virkelige verden udfordrende, da databaserne med disse sange kan begrænses og skal opdateres manuelt.

Google forklarer, at til funktionen Hum to Search bruger den maskinlæringsmodeller til at omdanne lyd til en "talbaseret sekvens", der repræsenterer melodien i sangen - det, der står, kan opfattes som et "fingeraftryk".."

Mere brugervenlig

Brugen af maskinlæring i Googles Hum to Search-funktion gør i sidste ende værktøjet meget nemmere at bruge i den virkelige verden. Fordi Hum to Search matcher søgerens nynnede melodi med den faktiske sang, er værktøjet i stand til at arbejde med de nye sange, efterhånden som de udgives i stedet for en database, der konstant skal opdateres med nynnede versioner af hvert nummer. Derudover behøver du ikke perfekt tonehøjde for at bruge det.

"Det nuværende system når et højt niveau af nøjagtighed på en sangdatabase, der indeholder over en halv million sange, som vi løbende opdaterer," sagde Google i sin Hum to Search-meddelelse. "Dette sangkorpus har stadig plads til at vokse til at omfatte flere af verdens mange melodier."

Anbefalede: