Sleutel wegneemetes
- 'n Nuwe masjienleermodel hallusineer 'n beeld van 'n sin se voorkoms in 'n taal om vertaling te help.
- Die KI-stelsel, genaamd VALHALLA, is ontwerp om die manier waarop mense taal waarneem na te boots.
- Die nuwe stelsel is deel van 'n groeiende beweging om KI te gebruik om taal te verstaan.
Die menslike metode om prente te visualiseer terwyl woorde vertaal kan help om kunsmatige intelligensie (KI) jou beter te verstaan.
'n Nuwe masjienleermodel hallusineer 'n beeld van hoe 'n sin in 'n taal lyk. Volgens 'n onlangse navorsingsartikel gebruik die tegniek dan visualisering en ander leidrade om te help met vertaling. Dit is deel van 'n groeiende beweging om KI te gebruik om taal te verstaan.
"Hoe mense praat en skryf is uniek omdat ons almal effens verskillende toonsoorte en style het," het Beth Cudney, 'n professor in data-analise aan die Maryville Universiteit, wat nie by die navorsing betrokke was nie, in 'n e-posonderhoud aan Lifewire gesê.. "Om konteks te verstaan is moeilik, want dit is soos om met ongestruktureerde data om te gaan. Dit is waar natuurlike taalverwerking (NLP) nuttig is. NLP is 'n tak van KI wat die verskille aanspreek in hoe ons kommunikeer deur masjienleesbegrip te gebruik. Die sleutelverskil in NLP, as 'n tak van KI, fokus nie bloot op die letterlike betekenisse van die woorde wat ons praat of skryf nie. Dit kyk na die betekenis."
Gaan vra vir Alice
Die nuwe KI-stelsel, genaamd VALHALLA, geskep deur navorsers van MIT, IBM en die Universiteit van Kalifornië in San Diego, is ontwerp om die manier waarop mense taal waarneem, na te boots. Volgens wetenskaplikes verbeter die gebruik van sensoriese inligting, soos multimedia, saam met nuwe en onbekende woorde, soos flitskaarte met beelde, taalverwerwing en behoud.
Hierdie stelsels verhoog die krag van kletsbotte wat tans net opgelei is en in staat is tot spesifieke gesprekke…
Die span beweer hul metode verbeter die akkuraatheid van masjienvertaling bo slegs teksvertaling. Die wetenskaplikes het 'n enkodeerder-dekodeerder-argitektuur met twee transformators gebruik, 'n tipe neurale netwerkmodel wat geskik is vir volgorde-afhanklike data, soos taal, wat aandag kan gee aan sleutelwoorde en semantiek van 'n sin. Een transformator genereer 'n visuele hallusinasie, en die ander voer multimodale vertaling uit deur uitsette van die eerste transformator te gebruik.
"In werklike scenario's het jy dalk nie 'n beeld met betrekking tot die bronsin nie," het Rameswar Panda, een van die navorsingspanlede, in 'n nuusverklaring gesê. "So, ons motivering was basies: In plaas daarvan om 'n eksterne beeld tydens afleiding as insette te gebruik, kan ons visuele hallusinasie gebruik - die vermoë om visuele tonele voor te stel - om masjienvertalingstelsels te verbeter?"
AI Begrip
Aansienlike navorsing is gefokus op die bevordering van NLP, het Cudney uitgewys. Elon Musk was byvoorbeeld medestigter van Open AI, wat werk aan GPT-3, 'n model wat met 'n mens kan gesels en vaardig genoeg is om sagtewarekode in Python en Java te genereer.
Google en Meta werk ook daaraan om gesprekke-KI te ontwikkel met hul stelsel genaamd LAMDA. "Hierdie stelsels verhoog die krag van kletsbotte wat tans net opgelei is en in staat is om spesifieke gesprekke te voer, wat waarskynlik die gesig van kliëntediens en hulptoonbanke sal verander," het Cudney gesê.
Aaron Sloman, die medestigter CLIPr, 'n KI-tegnologiemaatskappy, het in 'n e-pos gesê dat groot taalmodelle soos GPT-3 uit baie min opleidingsvoorbeelde kan leer om opsommings van teks te verbeter wat gebaseer is op menslike terugvoer. Byvoorbeeld, het hy gesê, jy kan 'n groot taalmodel 'n wiskundeprobleem gee en die KI vra om stap-vir-stap te dink.
"Ons kan verwag dat groter insigte en redenasies uit groot taalmodelle onttrek sal word namate ons meer leer oor hul vermoëns en beperkings," het Sloman bygevoeg. "Ek verwag ook dat hierdie taalmodelle meer mensagtige prosesse sal skep, aangesien modelbouers beter maniere ontwikkel om die modelle te verfyn vir spesifieke take van belang."
Georgia Tech-rekenaarprofessor Diyi Yang het in 'n e-posonderhoud voorspel dat ons meer gebruik van natuurlike taalverwerking (NLP)-stelsels in ons daaglikse lewens sal sien, wat wissel van NLP-gebaseerde gepersonaliseerde assistente om te help met e-posse en telefoonoproepe, tot kundige dialoogstelsels vir inligtingsoek in reis of gesondheidsorg."Sowel as billike KI-stelsels wat take kan verrig en mense op 'n verantwoordelike en vooroordeelvrye manier kan bystaan," het Yang bygevoeg.
Enorme KI-modelle wat triljoene parameters soos GPT-3 en DeepText gebruik, sal voortgaan om te werk aan 'n enkele model vir alle ta altoepassings, het Stephen Hage, 'n masjienleer-ingenieur by Dialexa, in 'n e-posonderhoud voorspel. Hy het gesê dat daar ook nuwe soorte modelle sal wees wat vir spesifieke gebruike geskep sal word, soos stemopdrag aanlyn inkopies.
"'n Voorbeeld kan 'n koper wees wat sê 'Wys vir my hierdie oogskadu in middernagblou met meer stralekrans,' om daardie skakering op die persoon se oë te wys met 'n mate van beheer oor hoe dit aangewend word," het Hage bygevoeg.