Annonse
Nylig jobbet jeg med en historie som involverte en person som ringte en telefon, som ble spilt inn. Vedkommende nektet senere å innrømme at han noen gang hadde ringt samtalen.
Med den innspilte stemmen fra telefonsamtalen og et klipp av personen som nekter anklagen, satte jeg meg for å prøve å finne en måte å bevise at stemmene var de samme.
Jeg innrømmer at jeg er litt besatt av stemmeteknologier. Dette er grunnen til at jeg har ventet på Google stemme Slik bruker du Google Voice til å blogge over telefonen Les mer for å bli mer avanserte med stemmegjenkjenningsteknologien, og det er derfor jeg elsker PC-stemme-kontrollapper som Tazti Aktiver tale-til-tekst- og talekontroll ved å sette opp talegjenkjenning i WindowsTalegjenkjenning er fortsatt kraftigere enn Cortana. Det driver tale til tekst og stemmekontroll. Denne artikkelen vil vise deg hva talegjenkjenning kan gjøre, hvordan du setter den opp, trener den og bruker den. Les mer . Når det gjelder å sammenligne stemmer digitalt, var jeg imidlertid tap. Du har sikkert sett de spionfilmene der datamaskinen automatisk kan identifisere stemmen til en kjent kriminell med stemmeavtrykket alene.
For å være ærlig, når jeg oppdaget Sonogram Synlig tale, innså jeg at spektrogrammet stemmeteknologi faktisk er for tiden en levedyktig måte å solid identifisere en person med stemmen alene.
Forstå spektrogram
Hvis du vet om kjemiske isotoper, vet du at med isotoper kan kjemikere identifisere den kjemiske sammensetningen av forbindelser ved å isolere basiselementene og bruke sammenbruddet for å identifisere de individuelle komponentene til noen blanding. På omtrent samme måte bryter et lydspektrogram lydlyd ned i grunnleggende frekvenser. Det interessante med den menneskelige stemmen er at ingen snakker i en frekvens. Munnen, nesegangene og strukturen til stemmeboksen bestemmer blandingen av frekvenser som utgjør din noe unike stemme.
Sonogram Visible Speech er et gratis spektrogram-programvare som tar video- eller lydfiler og går i stykker ned lydsporet inn i hele spekteret - alle dets frekvenser gjennom hele tidsrammen til spor. Et ferdig spektrogram ser ut som bildet nedenfor.
Som du kan se, ser det nederste sporet ut den grunnleggende lydbølgen du ville sett i et program som Audacity 3 Audacity-tips for å forbedre dine innspilte intervjuerTydelig lyd er viktig for enhver podcast eller innspilling du vil publisere. Øk lydkvaliteten din med Audacity i tre enkle trinn. Les mer men midtre rute viser hvert segment av lydfilen i hele frekvensoppsettet. Det fantastiske med denne programvaren er at det er mange andre bølgeformer du kan bruke til å undersøke lydfilen din. Disse er spesielt for avanserte brukere.
Du kan konfigurere hvordan hver av disse bølgeformene vises ved å gå til “Alternativer” -menyen og velge “Generelt Justering." Her kan du definere hvordan de logaritmiske grafene beregner output og det generelle skjermoppsettet for alle tilgjengelige diagrammer.
Hvis lyden er ganske stille, eller stemmen du analyserer er en hvisking, kan det være lurt å vurdere å bruke den logaritmiske frekvensvisningen. Du aktiverer den fra "Alternativer" -menyen og velger "Logaritmisk frekvens." Dette vil noe "forstørre" de betydelige frekvensområdene i spektrogrammet.
Dette kan virkelig bidra til å identifisere klare frekvensmønstre som identifiserer noen fra lyden av stemmen deres. Hvis du er helt tapt, og du ikke vet hvor du skal begynne, vil du klikke på "Hjelp" og gå til "Online Hjelp" for å åpne den veldig godt skrevne Sonogram Online-hjelphåndboken. Dette er et flott sted å starte hvis du er ny på spektrogram lydanalyse.
Et eksperiment med spektrogrammer ved hjelp av spøkelsesjakt
Det fine med denne programvaren er at den er bra for mange forskjellige bruksområder. En av gjenstandene som ofte dukker opp i spøkelsesjakt, en personlig interesse for meg, er “Elektronisk stemmefenomen” - der en angivelses eller et spøkelses angivelig visning dukker opp på lyd innspillinger. Disse opptakene er spredt over hele nettet, så jeg bestemte meg for å trekke noen få av ghost hunter nettsteder og gjøre en spektrogram analyse.
Spektrogrammet viser at frekvensene til stemmen generelt er lave, men for å få et bedre bilde av stemmene i innspillingen, må du åpne de ekstra bølgeformene. Autokorrelasjonsvisningen beregner “tonehøyde” i tidsrammen der du holder musen.
"Spøkelset" har en gjennomsnittlig stigningsfrekvens på omtrent 129,0 hz. Rulle til slutten av innspillingen der du hører etterforskerens stemme, den beregnede toneleien frekvensen er omtrent 208,0 hz (noe som er fornuftig fordi det er en kvinnelig stemme og spøkelsesopptaket lyder hann).
Åpning av Fast Fourier-skjermen avslører enda mer detaljert om stemmene. Dette diagrammet bryter raskt ned de primære frekvensene og viser dem i en fargekode.
I dette tilfellet er fordelingen av frekvenser spredt fra hverandre, med noen høye, men et godt antall lave frekvenser i blandingen også. Imidlertid snakker etterforskeren i rommet tydelig i en stemme som er gruppert i frekvens mer mot den høye enden av området, som vist her.
Denne raske analysen beviste at de to stemmene er ganske forskjellige, men dette er bare et grunnleggende eksempel på funksjonene til denne kraftige programvaren. I utgangspunktet kan enhver situasjon der en fordeling av frekvensene til en lydbølge hjelpe - dette er programvaren for deg. Det er enkelt å lære, raskt å sette opp og konfigurere, og det fungerer like bra eller bedre enn noen betalt spektrogramvare på markedet.
Har du noen prosjekter som kan bruke et spektrogram? Har du noen gang prøvd Sonogram Synlig tale? Del din innsikt i kommentarfeltet nedenfor.
Ryan har en BSc-grad i elektroteknikk. Han har jobbet 13 år innen automatisering, 5 år innen IT, og er nå en applikasjonsingeniør. Han var tidligere administrerende redaktør for MakeUseOf, han snakket på nasjonale konferanser om datavisualisering og har blitt omtalt på nasjonal TV og radio.