Intydse onderskrifte en vertalings kan die toekoms van videoklets wees

INHOUDSOPGAWE:

Intydse onderskrifte en vertalings kan die toekoms van videoklets wees
Intydse onderskrifte en vertalings kan die toekoms van videoklets wees
Anonim

Sleutel wegneemetes

  • Navi gebruik SharePlay, en Apple se ingeboude spraak-na-teks, om onderskrifte en vertalings in FaceTime aan te bied.
  • Dis ver van perfek, maar reeds goed genoeg.
  • Onderskrifte is wonderlik vir toeganklikheid.
Image
Image

Navi is 'n toepassing wat regstreekse onderskrifte en intydse vertalings by jou FaceTime-oproepe voeg.

Die toepassing gebruik SharePlay en ingeboude spraakherkenning om onderskrifte en vertalings in 20 tale by jou FaceTime-oproepe te voeg. Dit is 'n ongelooflike gebruik van SharePlay, wat die meeste van ons beskou as 'n foefie manier om gesinkroniseerde flieks met mense op ander plekke te kyk. Jy hoef dalk nog nie jou vertaler te ontslaan nie, maar 'n toepassing wat dit goed doen, kan baie nuttig wees.

"Ek kry nie die klank van die FaceTime-oproep nie," skryf Navi-ontwikkelaar Jordi Bruin op Twitter, "maar gebruik SharePlay om dit onder die deelnemers aan die oproep te deel."

DeelSpeel

SharePlay is 'n nuwe kenmerk in iOS 15 en macOS 12.1 waarmee jy dinge in FaceTime-oproepe kan deel en sinchroniseer. Met die fliekkykvoorbeeld hierbo kan enige deelnemer byvoorbeeld die fliek onderbreek of speel terwyl julle almal in die FaceTime-oproep gesels. Die FaceTime-video bly oop in 'n klein, drywende, prentjie-in-prent-paneel, en elke deelnemer bestuur die toepassing plaaslik op hul toestel. SharePlay se truuk is om alles wat in hierdie plaaslike toepassings gebeur te sinkroniseer, sodat almal die ervaring deel, of dit nou 'n fliek, 'n Fitness+-oefensessie of 'n sigblad is.

Navi gebruik dieselfde tegnologie, net die in-oproep-toepassing is nie 'n fliek nie - dit is 'n intydse vertaalenjin. Om dit te gebruik, begin jy die toepassing terwyl jy in 'n FaceTime-oproep is en tik op die 'Skakel onderskrifte aan'-knoppie. Dan kan ander deelnemers ook by die aksie aansluit en regstreekse onderskrifte vir die huidige spreker sien. As iemand monoloog voer, groei hul spraakborrel en sit 'n bietjie langer rond.

Image
Image

Vir die dowes kan dit die verskil beteken tussen mense bel of nie. En vir enigiemand beteken dit jy kan nuttige gesprekke voer tussen mense wat nie 'n taal deel nie.

Universele teks

Die internet is gebou op teks, en dit is wonderlik. Dit is klein en maklik om te skep, te lees en te vertaal. Dit is ook maklik om in gesintetiseerde spraak te verander. Die gevolg is dat enige iemand van enige plek aan enige gesprek kan deelneem. Taal is geen hindernis nie, en ook nie doofheid of enige soort blindheid nie - solank jy 'n toestel met goeie toeganklikheidshulpmiddels vir gestremde sig of gehoor gebruik.

Maar die gesproke woord is baie moeiliker om te verwerk. Spraak-na-teks-dikteer is indrukwekkend, maar dit is eers relatief onlangs dat algemene spraakherkenning goed genoeg geword het vir algemene gebruik - Apple se Translate-toepassing is 'n goeie voorbeeld. Dit is in iOS 15 bekendgestel en bied intydse klankvertalings. As ons steeds op buitelandse vakansies gaan, sal dit perfek wees.

Nou gebruik ons video meer en meer vir werk en om in kontak te bly met vriende en familie. Maak nie saak hoe ons in die toekoms werk nie, die hindernis vir video-oproepe is deeglik verpletter. Dit is nou 'n algemene instrument, maar dit kort baie van die fynheid van geskrewe kommunikasie-instrumente.

Iets soos Navi, wat intydse onderskrifte en vertaling bied, kan betekenisvol wees. Toeganklikheid is een aspek, maar die vermoë om met mense te gesels wie se taal jy nie praat nie, maak internasionale besigheid tot 'n verrassende mate oop.

Image
Image

In Aksie

Ek het Navi getoets met toepassingontwikkelaar, skrywer en gehoorapparaatgebruiker Graham Bower. Dit is redelik goed, maar nog nie gereed vir kritieke take nie. Sommige van die transkripsies was komies sleg en te vulgêr om te vertel. Soos ons gesprek aangegaan het, het dit egter baie beter geword om sy toespraak akkuraat te herken. Dit maak sin omdat die iOS-dikteer-enjin mettertyd by jou stem aanpas.

Die vertaling het ook gewerk, hoewel die kwaliteit van sy vertalings afhang van die akkuraatheid van die invoer.

Dit is maklik om hierdie soort tegnologie in toekomstige Apple-bril te projekteer of watter gerugte AR/VR-produk ook al hierdie week aan werk.

"Ek kan sien dit werk in AR-bril," het Bower tydens ons gesprek gesê. "Sommige mense, selfs met normale gehoor, verkies onderskrifte in flieks. Dit sal soos onderskrifte vir die regte lewe wees."

Terwyl 'n indrukwekkende tegnologie-demo is, is Navi nog nie daar nie. Vir betroubare besigheidsgebruik sal Apple se aanvanklike spraakherkenning baie meer akkuraat moet word. Maar spoedgewys is dit goed, en die vertalings is so goed soos enige ander.

Maar ons is nou op die pad, en hierdie soort ding sal net beter word.

Aanbeveel: