Microsoft Azure review: geavanceerde spraakverwerking

Microsoft Azure Speech to Text is een van de meest geavanceerde spraakherkenningsplatforms die er zijn. Als onderdeel van het productassortiment van Cognitive Speech Services van Microsoft, maakt het gebruik van deep learning-algoritmen om slechte geluidskwaliteit te overwinnen en kan het zich aanpassen aan verschillende spreekstijlen voor nauwkeurige audiotranscripties. In deze Microsoft Azure Speech to Text-recensie zullen we deze service onder de loep nemen.

Het is vermeldenswaard dat Microsoft Azure Speech to Text geen traditioneel stuk gebruiksvriendelijke dicteersoftware is. In plaats daarvan is dit een op ontwikkelaars gericht platform dat is ontworpen om bedrijven te helpen bij het maken, testen en beheren van hun eigen producten. Als u alleen een batch audiobestanden wilt transcriberen, zijn alternatieve spraak-naar-tekst-apps wellicht een betere optie. Bekijk onze Beste spraak-naar-tekst-softwaregids voor de beste alternatieven.

Microsoft Azure Speech to Text: plannen en prijzen

Met Microsoft Azure Speech to Text kunt u gratis tot vijf uur audio transcriberen en één aangepast spraakmodel per maand maken. Met het gratis abonnement is er echter slechts één gelijktijdig audioverzoek tegelijk beschikbaar, wat betekent dat deze optie voor de meeste bedrijven niet haalbaar is.

De facturering van Azure-spraakservices is opgesplitst in stappen van één seconde.

Als u meer dan één spraakclip tegelijk wilt transcriberen, moet u upgraden naar het standaard Azure-prijssysteem. Dit kost $ 1 per uur audio en ondersteunt maximaal 20 gelijktijdige verzoeken. Er zijn extra kosten aan verbonden als u een aangepast audiomodel moet gebruiken of meerkanaals geluidsbestanden moet transcriberen. Deze extra services kosten respectievelijk $ 1,40 en $ 2,10 per audio-uur.

Hoewel Microsoft de prijzen in een "per audio-uur" -formaat vermeldt, zoals de industriestandaard is, wordt de facturering feitelijk opgesplitst in stappen van één seconde, zodat u niet voor meer verwerkingstijd betaalt dan nodig is.

Microsoft Azure Speech to Text: functies

De belangrijkste functie van Azure Speech to Text is de toegang die het verleent tot het krachtige verwerkingssysteem van natuurlijke taal van Microsoft. In de afgelopen jaren heeft de spraak-AI van Microsoft verschillende belangrijke mijlpalen bereikt. Dit betekent dat het nu taken kan uitvoeren die voorheen onmogelijk waren voor een spraakherkenningsservice, zoals het nauwkeurig transcriberen van overspraak tijdens gesprekken in kleine groepen.

Microsoft Azure Speech to Text-service kan worden geïntegreerd met Office 365 voor optimale nauwkeurigheid.

Azure werkt met tientallen talen en dialecten en kan worden getraind - met behulp van aangepaste spraakherkenningsmodellen - om zich beter aan te passen aan de spreekstijl, achtergrondgeluiden en woordenschat van een gebruiker. Als uw organisatie al toegewijd is aan het Microsoft-productecosysteem, kunt u Office 365-gegevens van gebruikers gebruiken om de nauwkeurigheid van spraakherkenning voor organisatiespecifieke termen te verbeteren. En, belangrijker nog, dit kan worden gedaan zonder uw gegevensbeveiliging in gevaar te brengen, omdat Speech to Text on-premise kan worden uitgevoerd.

Microsoft Azure Speech to Text: Setup

Microsoft Azure is ontworpen voor ontwikkelaars in plaats van voor consumenten. Dit betekent dat het opzetten ervan een ingewikkelde en ietwat uitdagende procedure is die u het beste kunt overlaten aan iemand met veel technische kennis.

Het instellen van Azure is niet bepaald eenvoudig, tenzij u ervaring heeft met programmeren.

De snelste manier om Azure te configureren, is door de Azure Speech SDK te gebruiken in een programmeertaal zoals Java of C ++. Hiervoor moet u zich registreren voor een gratis Azure-account en een leeg project aanmaken in uw ontwikkelomgeving. U moet dan Microsoft Visual Studio gebruiken en een kort programma schrijven om het SpeechRecognizer-object van Microsoft te initialiseren.

Microsoft Azure spraak-naar-tekst: interface

Net als andere bulktranscriptieplatforms is Microsoft Azure Speech to Text bedoeld om te worden uitgevoerd als een API (Application Programming Interface), toegevoegd aan Office 365-programma's of geïntegreerd in nieuwe platforms en services. Daarom is er geen enkele Azure Speech to Text-interface. Wat de eindgebruiker te zien krijgt, hangt af van hoe Azure Speech to Text is geïntegreerd.

De online portal van Azure is intuïtief en gebruiksvriendelijk.

Ondertussen zal de ontwikkelaar die Azure beheert, dit doen via de online Azure Portal van Microsoft, die modern aanvoelt en gemakkelijk te navigeren is. Het kost slechts een paar minuten om de bronpagina voor spraakservices te vinden en zodra een exemplaar aan uw account is toegevoegd, kunnen de bewakingswaarschuwingen en het gebruik in een enkel venster worden bekeken.

Microsoft Azure Speech to Text: prestaties

Als onderdeel van onze Microsoft Azure Speech to Text-beoordeling, wilden we graag zien hoe dit platform de uitdaging van het verwerken van onbewerkte spraakopnamen aankon, dus zodra ons Azure-account klaar was, hebben we een reeks clips geüpload met verschillende niveaus van achtergrondgeluid. . Over de hele linie heeft Azure onze monsters goed verwerkt, aangezien we tijdens onze evaluatie niet meer dan een handvol fouten hebben gezien.

Door het aangepaste spraakmodel van Azure in te schakelen, is onze transcriptienauwkeurigheid verbeterd.

Azure had aanvankelijk wat moeite met het verwerken van ongebruikelijke of speciale zinnen, zoals namen van sportteams en wetenschappelijke termen, maar dit werd snel opgelost door de uitvoeroptie voor een aangepast model in te schakelen. Nadat we deze optie hadden geactiveerd, kon Azure zich aanpassen aan de unieke woordenschat en spreekstijl die we gebruikten.

Microsoft Azure Speech to Text: ondersteuning

Om te leren hoe u met de Azure Speech Services SDK kunt communiceren via verschillende programmeertalen en de Azure Speech to Text-functies in uw eigen platform wilt integreren, heeft u zeker wat hulp nodig. Gelukkig heeft Microsoft een uitgebreide catalogus met trainingsmateriaal voor het Azure-platform gemaakt, waarin je codevoorbeelden en handige tips vindt.

Het trainingsgedeelte van de Azure-site bevat veel nuttige bronnen.

Bovendien krijgen alle Azure-klanten gratis ondersteuning voor facturering en abonnementsbeheer, die toegankelijk is via een ticketsysteem. Meer diepgaande ondersteuning kan aan uw account worden toegevoegd tegen een terugkerende vergoeding, beginnend bij $ 29 per maand.

Microsoft Azure Speech to Text: eindoordeel

Het Azure Speech to Text-platform maakt gebruik van geavanceerde technologie om een ​​bijna perfecte transcriptieservice te bieden. Het is het meest geschikt voor bedrijven die al in het Microsoft Office 365-ecosysteem hebben geïnvesteerd, omdat aangepaste spraak- en woordenschatmodellen veilig kunnen worden gegenereerd vanuit uw bestaande documentarchief. Sommige kleine bedrijven kunnen moeite hebben met Azure, omdat het correct instellen van Azure de aandacht vereist van een gekwalificeerde Microsoft-cloudontwikkelaar.

De competitie

Amazon Transcribe, Google Cloud Speech-to-Text en Watson Speech to Text zijn directe concurrenten van Microsoft Azure. Deze drie platforms zijn ook allemaal in staat om batch-transcripties van grote volumes nauwkeurig uit te voeren. Google Cloud is de enige naaste concurrent die in staat is om met meer talen te werken dan Azure, maar het is duurder, met een starttarief van slechts $ 0,006 per 15 seconden, vergeleken met Azure van $ 0,017 per minuut ($ 0,00425 per 15 seconden).

Om andere alternatieven voor Microsoft Azure Speech to Text te vinden, raadpleegt u onze Best speech-to-text softwaregids.

Interessante artikelen...