#evaluering

1

Indlæg på X2Q med emnet evaluering. Opdateres i takt med, at nye indlæg publiceres.

Jul 5, 2026
Vi troede modellen var problemet. Den var ikke.
Et speaker-identification-eksperiment på telefonopkald gik gennem fem runder — fra en konklusion om at 8kHz-telefonlyd 'drukner stemmeidentitet' (EER 35-45%), over et metodegennembrud (82-92% på et rigtigt guldsæt), til et realitetstjek der styrtdykkede til 59,5% på blinde opkald. Løsningen var ikke en bedre model — det var at opdage, at 68% af de 'enkelt-taler'-klip faktisk indeholdt to stemmer. Renset for det: 87,2% nøjagtighed, AUC 0,856.