Watson Speech to Text review: de beste transcriptieservice voor grote volumes?

Watson is IBM's computersysteem voor het verwerken van natuurlijke taal. Het drijft de beroemde vraag-antwoord-supercomputer aan, evenals een reeks op AI-gebaseerde zakelijke producten, waaronder Watson Speech to Text. In onze Watson Speech to Text-recensie bekijken we een van de beste spraak-naar-tekst-apps die er zijn, ideaal voor iedereen die audio op schaal naar tekst wil converteren.

Het spraakverwerkingsplatform van Watson is beschikbaar op IBM Cloud. Het is een veelzijdige tool en kan in veel contexten worden gebruikt, waaronder dicteren en transcriptie van telefonische vergaderingen. Bovendien is het, in tegenstelling tot de meeste andere spraak-naar-tekst-apps, beschikbaar als een API, waardoor ontwikkelaars het onder andere kunnen insluiten in spraakbesturingssystemen.

Watson Speech to Text: plannen en prijzen

U kunt Watson Speech to Text gebruiken om tot 500 minuten gratis audio per maand te verwerken. Als u meer wilt converteren, moet u voor elke audiominuut betalen, en het tarief verandert op basis van de duur van de verwerkte audio. De kosten variëren van $ 0,01 tot $ 0,02 per minuut, en er is een toeslag van $ 0,03 per minuut als u IBM's Custom Language Model nodig heeft. Premium-offerte-only Watson-abonnementen zijn ook beschikbaar, en deze bieden toegang tot verbeterde functies voor gegevensprivacy en uptime-garanties.

De spraak-naar-tekstservice van Watson wordt geprijsd op basis van het volume aan inhoud dat u moet transcriberen.

U hebt ook toegang tot het Watson Speech to Text-systeem via een algemeen IBM Cloud-abonnement. Natuurlijke taalverwerking is slechts één app in een breed scala aan AI-services die u via IBM Cloud kunt krijgen, dus dit is een goede optie voor elke organisatie die toegang nodig heeft tot snelle gegevensoverdracht, chatbots of tekst-naar-spraak-tools.

Watson Speech to Text: functies

Dankzij flexibele API-integratie en andere vooraf gebouwde IBM-tools, gaat de spraakherkenningsservice van Watson veel verder dan de basistranscriptie. Als u het bijvoorbeeld in een klantenservicecontext wilt gebruiken, kan de Watson Assistant worden ingesteld om vragen in natuurlijke taal rechtstreeks te verwerken of vragen via de telefoon te beantwoorden.

In Watson heeft IBM een feature-rijk platform voor natuurlijke taalverwerking samengesteld.

Watson werkt met live audio in 11 talen en kan geluiden importeren in verschillende vooraf opgenomen formaten. Tijdens het streamen betekent realtime diagnostische ondersteuning dat Watson gebruikers kan vragen dichter bij hun microfoon te gaan staan ​​of hun omgeving te veranderen. Indrukwekkend is ook dat Watson onderscheid kan maken tussen verschillende sprekers in een gedeeld gesprek dankzij Speaker Diarization, een functie die nog steeds bètatests ondergaat.

Watson Speech to Text: Setup

Om Watson te gebruiken, moet u eerst een IBM Bluemix-account aanmaken. Registratie is gratis en pijnloos en vereist alleen een e-mailadres en wachtwoord. Nadat u bent ingelogd, moet u een voorziening aan uw account toevoegen voor de Speech to Text-service. U krijgt in dit stadium een ​​aantal inloggegevens die u in uw eigen administratie moet opslaan.

Registreren voor een IBM Bluemix-account is noodzakelijk om toegang te krijgen tot de volledige functieset van Watson.

Nadat u dat heeft gedaan, worden de zaken aanzienlijk ingewikkelder. Om toegang te krijgen tot Watson, moet u die inloggegevens toevoegen aan een batch client Uniform Resource Locator-code (cURL) en deze vervolgens op uw computer uitvoeren. Raadpleeg deze handige gids om erachter te komen welk commando u precies moet aanroepen. Als alternatief, als u gewoon wilt zien hoe goed het Watson-systeem werkt zonder door al die hoepels te hoeven springen, kunt u het in plaats daarvan uitproberen op de demosite van IBM.

Watson Speech to Text: interface

In tegenstelling tot spraak-naar-tekst-apps voor consumenten, zijn de services van Watson ontworpen om toegankelijk te zijn via API's en code die is ingesloten in andere systemen. Om deze reden is er geen echte Watson-interface. In plaats daarvan is Watson toegankelijk via drie verschillende internetprotocollen. Dit zijn WebSockets, REST API en Watson Developer Cloud.

Watson Speech to Text kan worden beheerd via het Watson Developer Cloud-systeem.

Om Watson te besturen, heb je een opdrachtregeltool nodig die via een van deze drie routes verbinding maakt met de cloud van IBM. De interface die de eindgebruiker die met Watson communiceert, ziet, moet door iemand in uw ontwikkelingsteam afzonderlijk worden gebouwd.

Watson Speech to Text: Performance

Over het algemeen waren we onder de indruk van de manier waarop dit natuurlijke taalverwerkingsplatform echte spraak behandelde. We gebruikten Watson om clips te transcriberen die we in een reeks uitdagende omgevingen hadden opgenomen, evenals soundbites van beroemde toespraken in verschillende van de 11 ondersteunde talen van Watson.

We ontdekten dat Watson goed presteerde met vooraf opgenomen spraak.

Hoewel fouten vaker voorkwamen bij clips met veel achtergrondruis, produceerde Watson over het algemeen ongelooflijk nauwkeurige resultaten. We schatten op basis van onze tests dat ongevraagde fouten gemiddeld maar eens in de 150 woorden voorkwamen. Het werd echter wel duidelijk waarom de functie Speaker Diarization van Watson in BETA-tests blijft, aangezien tijdens onze evaluatie meerdere keren één stem verkeerd werd gelabeld als afzonderlijke luidsprekers.

Watson Speech to Text: ondersteuning

Het IBM-resourcecentrum biedt veel documentatie om beter te begrijpen hoe u Watson op uw specifieke gebruikscasus kunt toepassen. Het is ook de moeite waard om gebruik te maken van de API-integraties en SDK's die door de ontwikkelaarsgemeenschap van Watson zijn gemaakt en op GitHub zijn geplaatst.

De Watson API GitHub-pagina is een goede bron van ondersteuning voor de Watson Speech to Text-service.

Als u daar de oplossing voor uw probleem niet vindt, kunt u rechtstreeks contact opnemen met IBM door een supportticket te openen of telefonisch contact met hen op te nemen. Zolang u heeft gekozen voor een van de premium Watson-pakketten, wordt uw Watson-gebruik beschermd door een Service Level Uptime-overeenkomst.

Watson Speech to Text: eindoordeel

Als uw organisatie over de knowhow en middelen beschikt om het IBM Watson Speech to Text-platform correct in uw systeem te integreren, profiteert u van geavanceerde functies zoals realtime diagnose van geluidsomgeving en tussentijdse transcriptieresultaten. Kleine bedrijven en organisaties zullen echter worstelen met de technische uitdaging om Watson goed op te zetten.

De competitie

De IBM Watson Speech to Text-service is een directe concurrent van de bulktranscriptieservices Google Cloud Speech-to-Text en Amazon Transcribe. Beide zijn aanzienlijk goedkoper dan Watson, met Google Cloud-transcriptie vanaf bijvoorbeeld $ 0,006 per minuut. Alle drie de services delen vergelijkbare functies, zoals aangepaste woordenschat, maar een functie die erg ontbreekt in IBM Watson, maar beschikbaar is bij beide concurrenten, is automatische interpunctieherkenning.

Op zoek naar een andere spoeech-to-text-oplossing? Bekijk onze Beste spraak-naar-tekst-softwaregids.

Interessante artikelen...