Het wordt steeds gewoner om spraak te gebruiken om onze huizen en computers te besturen. Waar tien jaar geleden Alexa of Google Home vragen om de lichten te bedienen of een product via internet te bestellen, leek het misschien ongebruikelijk, maar het is nu de norm.
Een van de bedrijven die het meest in dit soort technologie heeft geïnvesteerd, is Google, waarmee hun Google Home-apparaten en Android-systemen verbale commando's kunnen accepteren en zelfs de spreker kunnen herkennen.
Vandaag gaan we bekijken hoe ze deze technologie hebben gekoppeld aan hun Google Documenten-platform en bekijken of dit een haalbaar alternatief is voor andere commerciële spraak-naar-tekstoplossingen.
Prijsstelling
De software is opgenomen in Google Documenten en is dus inherent gratis. Het enige dat u nodig heeft om het te gebruiken, is een Google-account en een mobiel apparaat of een computer met een microfoon. Het is een andere bron van gegevens die Google kan oogsten, maar dat is tegenwoordig een deel van de prijs van ‘gratis’.
Ontwerp
Het is mogelijk om spraak te gebruiken voor invoer op Google Documenten, de functie heet ‘Spraakgestuurd typen’ en is te vinden in het menu Extra op een Google-document of in Google Presentaties. Het kan ook op beide locaties worden geactiveerd met de sneltoets Ctrl-Shift-S.
Toen u het voor de eerste keer activeerde, wordt u gevraagd om toegang tot de microfoon voor docs.google.com te sanctioneren.
Zodra u heeft geaccepteerd dat er een klein vakje verschijnt met een microfoonlogo erop, kunt u erop klikken om spraakinvoer te activeren. Dit wordt dan vervangen door een rood microfoonsymbool naast het document om aan te geven dat het systeem in luistermodus is.
Voordat u spraakgestuurd typen in het configuratiescherm activeert, kunt u een taal uit een menu kiezen, en aangezien dit Google is, zijn er tal van keuzes. En u kunt ook op een vraagteken klikken en hulp krijgen over het gebruik van het systeem.
Zoals deze systemen gaan, is dit een sterk gecondenseerde oplossing.
Google verwerkt wat u zegt zo goed mogelijk en als het systeem niet precies weet wat een woord is, wordt het grijs onderstreept. Deze ‘verdachte’ woorden kunnen vervolgens worden aangeklikt en het systeem biedt enkele alternatieven.
Maar u kunt snel door een document navigeren en problemen handmatig oplossen of de cursor plaatsen en Voice Typing nog een keer proberen.
Als u tijdens het werk met iemand anders moet praten, kunt u Google vragen om te stoppen met luisteren en daarna verder te gaan.
Maar om de volledige mogelijkheden van deze oplossing te benutten, is er een lange lijst met opdrachten die moeten worden onthouden die kunnen worden gekopieerd, geplakt, door het document kunnen worden verplaatst, tabellen kunnen worden ingevoegd en een groot aantal andere functies.
En u kunt interpunctie invoegen, het document opmaken en zelfs hyperlinks invoegen.
Maar om er het meeste uit te halen, wordt ervan uitgegaan dat u de opdrachten kunt onthouden of dat u de hulp kunt openen om uw geheugen op te frissen.
Een lijst is snel beschikbaar door gemakkelijk ‘Lijst met spraakopdrachten’ te zeggen.
Talen
Waar veel spraak-naar-tekst-oplossingen slechts een klein aantal talen dekken, heeft Google een aanzienlijk aantal. De huidige definitieve lijst is:
Afrikaans, Amhaars, Arabisch, Arabisch (Algerije), Arabisch (Bahrein), Arabisch (Egypte), Arabisch (Israël), Arabisch (Jordanië), Arabisch (Koeweit), Arabisch (Libanon), Arabisch (Marokko), Arabisch (Oman) , Arabisch (Palestina), Arabisch (Qatar), Arabisch (Saoedi-Arabië), Arabisch (Tunesië), Arabisch (Verenigde Arabische Emiraten), Armeens, Azerbeidzjaans, Bahasa Indonesia, Baskisch, Bengaals (Bangladesh), Bengaals (India), Bulgaars, Catalaans, Chinees (vereenvoudigd), Chinees (traditioneel), Chinees (Hong Kong), Kroatisch, Tsjechisch, Deens, Nederlands, Engels (Australië), Engels (Canada), Engels (Ghana), Engels (India), Engels (Ierland) , Engels (Kenia), Engels (Nieuw-Zeeland), Engels (Nigeria), Engels (Filipijnen), Engels (Zuid-Afrika), Engels (Tanzania), Engels (VK), Engels (VS), Farsi, Filipijns, Fins, Frans , Galicisch, Georgisch, Duits, Grieks, Gujarati, Hebreeuws, Hindi, Hongaars, IJslands, Italiaans, Italiaans (Italië), Italiaans (Zwitserland), Japans, Javaans, Kannada, Khmer, Koreaans, Laotiaans, Lets, Litouws, Maleis, Maleisië n, Marathi, Nepalees, Noors, Pools, Portugees (Brazilië), Portugees (Portugal), Roemeens, Russisch, Slowaaks, Sloveens, Servisch, Singalees, Spaans, Spaans (Argentinië), Spaans (Bolivia), Spaans (Chili), Spaans (Colombia), Spaans (Costa Rica), Spaans (Ecuador), Spaans (El Salvador), Spaans (Spanje), Spaans (VS), Spaans (Guatemala), Spaans (Honduras), Spaans (Latijns-Amerika), Spaans (Mexico) ), Spaans (Nicaragua), Spaans (Panama), Spaans (Paraguay), Spaans (Peru), Spaans (Puerto Rico), Spaans (Uruguay), Spaans (Venezuela), Sundanees, Swahili (Kenia), Swahili (Tanzania), Zweeds, Tamil (India), Tamil (Maleisië), Tamil (Singapore), Tamil (Sri Lanka), Thais, Turks, Oekraïens, Urdu (India), Urdu (Pakistan), Vietnamees en Zoeloe.
Dat zijn 119 talen, waaronder 13 Arabische vormen, 19 Spaanse variaties, 13 Engelse dialecten en zelfs vier smaken Tamil.
Er zijn talen opgenomen die zelden worden ondersteund door dicteersoftware, zoals Zoeloe en IJslands, vanwege het relatief kleine aantal sprekers.
Taaldekking is waarschijnlijk de grootste kracht van Google Voice Typing.
Opnames
Als deze oplossing een zwak punt heeft, is het dat het niet gemakkelijk opnames kan verwerken.
Hoewel het niet onmogelijk is om dit te doen, moet het audiosysteem van de computer worden gepatcht, zodat de uitvoer bestemd voor de luidsprekers wordt aangestuurd alsof deze uit de microfoon komt. Maar als je dit doet, kun je geen onderscheid maken tussen verschillende mensen op de opnames, en het zou de AI kunnen verstoren die Google gebruikt om verbale nauwkeurigheid te verbeteren door te leren hoe je spreekt.
Als je podcasts of opgenomen interviews wilt transcriberen, raden we je aan iets anders te gebruiken, aangezien deze tool niet voor dat doel is gemaakt.
Nauwkeurigheid
Het is moeilijk om de nauwkeurigheid van een spraakverwerkingssysteem te beoordelen als u niet dezelfde opnamen kunt verzenden die andere producten hebben geconverteerd. En iedereen die regelmatig Alexa of Google Home gebruikt, weet dat het ons af en toe niet begrijpt, meestal vanwege vreemde geluiden of inconsistent spreken.
Dat gezegd hebbende, tijdens de actieve tests die we deden, kreeg deze tool over het algemeen de meeste woorden correct, of was het juiste woord snel beschikbaar in het menu met verdachte woorden.
Om de beste resultaten te krijgen, moet enige controle worden getoond in de snelheid, het volume en de toon van het spreken, iets dat ongetwijfeld met oefenen gepaard gaat. Door alle speciale commando's te kunnen onthouden, kan het aantal bewerkingen na de opname die nodig zijn, kritisch worden verminderd.
Afhankelijk van uw verwachtingen is de nauwkeurigheid hier acceptabel. Er is een consistentie in de interpretaties die het tijdens onze tests heeft gehandhaafd. Hoe goed het voor u werkt, kunnen we niet voorspellen. Maar aangezien het gratis is, kost het niets anders dan uw tijd om dat vast te stellen.
Veiligheid
Aangezien dit Google is, is het beveiligingsmodel hetzelfde dat de toegang tot alle Google-accounts regelt. Dat varieert van eenvoudige wachtwoordbeveiliging tot een redelijkere methode tot tweefactorauthenticatie (TFA).
Gezien het aantal identiteitsdieven dat er is, lopen degenen die Google gebruiken zonder TFA een aanzienlijk risico dat hun accounts gecompromitteerd worden.
Zelfs deze beveiligingsoptie heeft zijn beperkingen, maar het is beter dan alleen een wachtwoord.
Voor degenen die niet voldoende paranoïde zijn, raden we u ten zeerste aan om naar https://myactivity.google.com/myactivity te gaan
En u zult zien wat Google dagelijks over u verzamelt, en dat kunnen ook opnames van uw spraakopdrachten zijn.
Eindoordeel
Dit kan een langere recensie zijn als deze software meer functionaliteit bood, maar dat is niet het geval.
Aangezien spraak-naar-tekstoplossingen gaan, is deze niet ingewikkeld, maar hij heeft voldoende functionaliteit om echt nuttig te zijn.
Andere oplossingen zijn gebouwd om het transcriberen van gesprekken tussen meerdere mensen af te handelen, terwijl dit is ontworpen om één persoon te behandelen die op een gecontroleerde en nauwkeurige manier spreekt.
Bij het gebruik ervan wordt ervan uitgegaan dat u Google en Google Documenten graag gebruikt, zelfs als dat niet de uiteindelijke bestemming is van de tekst die u invoert.
Het is geen hele klus om een geplakt dictaat van Google Documenten naar een andere applicatie te kopiëren, en u heeft een kopie in de cloud om naar te verwijzen, mocht u er uiteindelijk een nodig hebben.
Sommige gebruikers hebben begrijpelijkerwijs problemen met het voeden van de onverzadigbare honger van Google naar gebruikersgegevens, en dit mechanisme is nog een andere bron van gegevens om te snacken.
Als je daar zin in hebt, gebruik je Google Voice Typing of iets van Google niet.
Voor degenen die bereid zijn te accepteren hoeveel Google er misschien van weet, is de spraakdicteeroplossing in Google Documenten capabel genoeg voor algemeen gebruik, vooral als je deze functionaliteit maar af en toe nodig hebt.